本文来源公众号“OpenCV学堂”,仅用于学术分享,侵权删,干货满满。
原文链接:汇总 | 深度学习图像去模糊技术与模型
引言
深度学习在图像去模糊领域展现出了强大的能力,通过构建复杂的神经网络模型,可以自动学习和预测模糊图像中的清晰细节,从而恢复出更加清晰的图像。常见的图像模糊分类如下:
深度学习去模糊概述
图像模糊通常是由于图像在采集或传输过程中发生的振动、抖动、光线不足或运动模糊等原因导致的。图像去模糊的目标是通过恢复原始图像的清晰细节和轮廓,使图像更加清晰可见。在图像去模糊方面取得了显著成效。图像去模糊技术分类如下:
从深度学习模型与架构技术路径分为以下五类不同的去模糊CNN模型算法,分别是:
- 深度自编码器
- 对抗生成网络
- 级联网络
- 多尺度网络
- 重模糊网络
去模糊CNN模型算法
DAE网络
一个深度自编码器(Deep Auto-encoder)首先会提取图像的特征,然后一个解码器(Decoder)利用这些特征来重建图像。对于单图像去模糊(Single Image Deblurring),基本都会采用U-Net架构模式。
级联网络
级联网络包含多个模块,这些模块按顺序连接以构建更深的结构。级联网络可以分为两组。第一组在每个级联中使用不同的架构。例如,Schuler等人[109]提出了一个两阶段级联网络,如图9所示。第一阶段的输入是模糊图像,去模糊后的输出被送入第二阶段以预测模糊核。第二组在每个级联中重新训练相同的架构以生成去模糊图像。来自前一阶段的去模糊图像被送入相同类型的网络以生成更精细的去模糊结果。这种级联方案几乎可以用于所有去模糊网络。虽然这种策略实现了更好的性能,但CNN参数的数量显著增加。为了减少这些参数,最近的方法在每个级联中共享参数。
多尺度网络
不同尺度的输入图像描述了互补的信息。多尺度去模糊网络的策略是首先恢复低分辨率的去模糊图像,然后逐步生成高分辨率的清晰结果。Nah等人提出了一种多尺度去模糊网络,该网络通过逐步增加图像分辨率的方式,从粗到细地恢复图像的清晰细节。
这种多尺度的方法有几个优点。首先,它利用了不同尺度图像之间的互补信息。低分辨率的图像可能更容易去模糊,因为它们包含的细节较少,而高分辨率的图像则能够提供更丰富的细节信息。通过先处理低分辨率图像,网络可以学习到图像的基本结构和轮廓,然后再利用这些信息来恢复高分辨率图像中的细节。
生成对抗网络(GAN)
原理:GAN由生成器和判别器两部分组成,生成器负责生成尽可能真实的清晰图像,而判别器则负责区分生成的图像和真实的清晰图像。两者通过相互对抗的方式不断优化,最终使生成器能够生成高质量的清晰图像。优势:能够生成高质量的清晰图像,且对于复杂模糊情况具有较好的适应性。
重模糊网络(Reblurring Networks)
能够合成额外的模糊训练图像一种框架,该框架包括一个学习模糊化的生成对抗网络(Blurring GAN, BGAN)和一个学习去模糊化的生成对抗网络(Deblurring GAN, DBGAN)。这种方法分别学习了如何将清晰图像转换为模糊版本,以及如何从模糊版本中恢复出清晰图像。具体来说,BGAN的作用是模拟图像模糊的过程,它接受一个清晰图像作为输入,并生成一个与之对应的模糊图像。这个模糊图像可以被视为一种数据增强手段,用于增加训练数据集中模糊图像的多样性,从而提高去模糊网络的泛化能力。
损失类型
图像去模糊模型常用得五种种不同类别得损失分别为:
- 像素损失
- 感知损失
- 对抗损失
- 相对损失
- 光流损失
THE END !
文章结束,感谢阅读。您的点赞,收藏,评论是我继续更新的动力。大家有推荐的公众号可以评论区留言,共同学习,一起进步。