图像去噪是一个重要的问题。数字图像在获取和传输过程中会受到噪声干扰。噪声降低图像质量。噪声影响后续的图像处理。图像去噪的目标是消除噪声。同时需要保留图像的细节和结构。图像去噪研究已经发展了很多年。研究人员提出了许多方法。这些方法各有特点。我们回顾这些方法的基本思路。
早期方法基于空间滤波。均值滤波是一种简单方法。它对像素邻域内的灰度值进行平均。这种方法计算速度快。但会导致图像模糊。中值滤波也是常用方法。它取邻域灰度值的中位数。中值滤波对脉冲噪声效果好。它比均值滤波更能保护边缘。但中值滤波在噪声严重时效果下降。这些传统滤波器原理简单。它们不考虑图像的结构信息。去噪后图像细节损失较大。
后来出现了基于变换域的方法。小波变换被广泛应用。图像可以分解为不同频率的子带。噪声通常在高频部分。通过阈值处理小波系数可以去除噪声。软阈值和硬阈值是两种基本方式。小波方法比空间滤波有进步。它更好地分离信号和噪声。但小波变换缺乏方向性。它对图像边缘和纹理表示能力有限。随后发展出多种多尺度几何分析工具。曲波变换和轮廓波变换被提出。它们能更好地表示图像的线状和面状特征。这些方法在去噪性能上有所提升。但计算复杂度较高。
基于偏微分方程的方法受到关注。各向异性扩散模型是一个代表。它根据图像梯度调整扩散强度。在平坦区域进行强扩散以平滑噪声。在边缘区域进行弱扩散以保护边界。这种方法能较好地保持边缘。但扩散方程的设定需要经验。参数选择对结果影响大。总变分模型是另一类重要方法。它最小化图像的全变分。总变分模型假设图像是分片光滑的。它能产生平滑区域并保持锐利边缘。但有时会产生阶梯效应。即平滑区域中出现虚假的轮廓。
近年来基于学习的方法成为主流。特别是深度学习方法。这些方法利用大量数据训练神经网络。神经网络学习从噪声图像到干净图像的映射。早期有基于多层感知机的去噪网络。卷积神经网络很快成为主流。它的局部连接和权重共享特性适合图像处理。残差学习的思想被引入。网络学习噪声残差而不是直接输出干净图像。这降低了学习难度。批归一化和残差连接加速了训练过程。提高了网络性能。
生成对抗网络也被用于图像去噪。生成器网络试图产生去噪后的图像。判别器网络判断图像是真实的还是去噪输出的。两者相互对抗共同进步。生成对抗网络能生成视觉质量更高的图像。但训练过程不稳定。容易出现模式崩溃问题。
注意力机制在去噪中得到应用。自注意力模块让网络关注重要特征。通道注意力强调重要的特征通道。空间注意力关注重要的空间位置。注意力机制提高了网络的特征选择能力。Transformer结构开始应用于图像去噪。它建立图像块之间的全局依赖关系。这对大范围噪声和复杂纹理有帮助。
去噪网络的结构不断演进。编解码结构是常见设计。编码器逐步降低特征图尺寸并提取抽象特征。解码器逐步恢复空间尺寸并重建图像。跳跃连接将编码器特征传递到解码器。这帮助保留细节信息。密集连接让每一层接收前面所有层的特征。这促进了特征复用。多尺度金字塔结构处理不同尺度的特征。这提高了对大小不同结构的适应能力。
真实噪声去除更受关注。早期研究多使用加性高斯白噪声。真实图像噪声更复杂。它通常与信号相关。并且随相机设置和光照条件变化。研究人员构建真实噪声数据集。它们通过拍摄多张相同场景图像获得。基于真实数据训练的网络在实际应用中表现更好。智能手机的低光摄影大量使用去噪技术。这对算法效率和效果提出高要求。
图像去噪与其他任务的结合增多。去噪与超分辨率结合。去噪与去模糊结合。去噪与压缩伪影去除结合。联合处理比单独处理每个问题更有效。这符合实际应用的需求。因为图像退化通常是多种因素同时造成的。
轻量化去噪网络是重要方向。移动设备需要快速高效的算法。研究人员设计紧凑的网络结构。深度可分离卷积减少计算量。知识蒸馏让小网络学习大网络的能力。模型剪枝去除不重要的连接。量化降低模型数值精度。这些技术让深度去噪模型能在手机等设备上运行。
无监督和自监督学习减少对干净图像的需求。获取成对的噪声和干净图像困难且成本高。自监督方法利用噪声图像自身进行训练。例如将噪声图像分为两部分。一部分作为输入,另一部分作为训练目标。或者对噪声图像施加多种变换。让网络学习不变的特征表示。这些方法在缺乏配对数据时很有用。
图像去噪仍然面临挑战。噪声和细节的区分依然困难。特别是在纹理复杂和噪声强度大的区域。算法对不同类型噪声的泛化能力需要提高。去噪结果的客观评价指标仍需完善。峰值信噪比和结构相似性指数是常用指标。但它们与人类视觉感知不完全一致。开发更符合主观感受的评价标准是必要的。
未来研究可能继续深入。探索更高效的网络架构。利用物理模型与深度学习结合。发展更强大的无监督学习方法。处理视频去噪中的时序信息。将去噪技术集成到图像处理的完整流程中。图像去噪是一个活跃的研究领域。新技术和新应用不断涌现。