AODNet

【20231117】读研期间没有对阅读的文章进行总结,没想到毕业反而有了机会。即日起会对阅读过的文章要点进行梳理记录,希望这一习惯能够坚持下去。
学术的角度:看论文要学习作者如何逻辑严谨的自证
落地的角度:只用看以下六点,创新点是什么、设计思路是什么、用了什么数据、达成什么效果(比前人好多少)、有没有代码、能否复现

ICCV2017、微软亚研院、有代码

Li B, Peng X, Wang Z, et al. Aod-net: All-in-one dehazing network[C]//Proceedings of the IEEE international conference on computer vision. 2017: 4770-4778.
GitHub - weberwcwei/AODnet-by-pytorch: Image Dehaze, Pytorch, An All-in-One Network for Dehazing, AOD-Net

GitHub - walsvid/AOD-Net-PyTorch: Pytorch implementation of AOD-Net : All-in-One Network for Dehazing - ICCV2017

1、Abstract

BR:摘要真的提炼了文章最最最核心的要点,看懂它等于看懂文章 90% 的内容。

  1. reformulate atmospheric scattering model
  2. directly generates the clean image through a light-weight CNN

2、Introduction

BR:以往方式的不足是什么,作者最大的创新是什么。

  1. However, the estimation is not always accurate, and some common pre-processing such as guildfiltering or softmatting will further distort the hazy image generation process [8], causing sub-optimal restoration performance. Moreover, the non-joint estimation of two critical parameters, transmission matrix and atmospheric light,may further amplify the error when applied together.
  2. the major novelty of AOD-Net as the first to optimize the end-to-end pipeline from hazy images to clean images, rather than an intermediate parameter estimation step.

2.1 It is trained on synthesized hazy images, and tested on both synthetic and real natural images.——用的合成有雾图像做训练,论文实验数据和项目落地能一样吗、差距到底会有多大?

2.2 用的评价指标:PSNR、SSIM、视觉效果

2.3 As a lightweight model, AOD-Net has achieved a fast processing speed, costing as low as 0.026 second to process one 480 × 640 image with a single GPU——什么 GPU,26ms 是落地可以接受的速度吗?落地时延的要求是多少?TBD

3、Related Work

BR:通常不需要看这部分内容,记录是因为要做传统方法和深度学习方法的梳理总结。

3.1 传统方法去雾

  1. [23] 通过最大化局部对比度来消除雾霾。
  2. [6] 提出了一种通过估算景物反照率的物理真值方法。
  3. DCP [8],[24] 发现了有效暗信道先验(DCP) 来更可靠地计算传输矩阵。
  4. BCCR [12] 进一步加强了边界约束和上下文正则化,以获得更清晰的恢复图像。
  5. ATM [22] 提出一种自动恢复大气光的加速方法。
  6. CAP [32] 开发了一种颜色衰减先验,并对朦胧图像建立了场景深度的线性模型,然后以监督的方式学习模型参数。

3.2 深度学习方法去雾

  1. [17] MSCNN 多尺度CNN,首先生成一个粗尺度的传输矩阵,然后对其进行细化
  2. [3] 提出了一种可训练的端到端介质传输估计模型,称为DehazeNet。它以模糊图像为输入,输出其传输矩阵结合经验规则估计的全球大气光,通过大气散射模型恢复无雾图像。

上述方案的特点
基于一个认知:要想从有雾图中恢复干净的图片,准确估计介质传输图是关键。(环境光单独计算)
不足:尽管思路是直观且有物理基础的,该方法不直接测量或最小化重建畸变产生次优的图像恢复质量可能性增大,因为每个单独估计步骤中的误差将累积并可能相互放大。

3.3 AODNet

  1. 本文的 AOD-Net 直接输出去雾干净的图像,没有任何中间步骤估计参数。与 [3] 从模糊图像到传输矩阵的端到端学习不同,AOD-Net的完全端到端构建弥合了有雾图像和干净图像之间的最终目标差距

上述方案的特点
基于一个认知:物理模型可以用一种“端到端”的方式来表述,所有的参数都可以用一个统一的模型来估计。

4、Method

BR:放几组公式说明作者的设计思路。坦白说,从我的思维逻辑这些公式包括思路说明更像是实验验证可行后找的解释。实验确实在证明方法的有效性,但写文章更像是一种“自圆其说”,逻辑严谨的自证。

在这里插入图片描述

在这里插入图片描述
BR:作者将求解过程转变为求 K(x) 的过程

在这里插入图片描述

  1. Since K (x) is dependent on I (x), we then aim to build an input-adaptive deep model, and train the model by minimizing the reconstruction errors between its output J (x) and the ground truth clean image I(x).
  2. To justify why jointly learning t(x) and A in one is important, we compare the two solutions in experiments (see Section 4 for the synthetic settings). As observed in Figure 3, the baseline tends to overestimate A and cause overexposure visual effects.
  3. AOD-Net clearly produces more realistic lighting conditions and structural details, since the joint estimation of 1/t(x) and A enables them to mutually refine each other. In addition, the inaccurate estimate of other hyperparameters (e.g., the gamma correction), can also be compromised and compensated in the all-in-one formulation.

Results

客观数据对比

the subjective visual quality??

dataset

the indoor NYU2 Depth Database [21]

the Middlebury stereo database [19, 18, 9]

Thinking

  1. 作者在related work中,段落前黑体标注重点,这非常友好!
  2. 不用看他说的天花乱坠的概念。你就看它提不提供代码,不提供的话不用深入看它怎么实现的,留个印象即可。
  3. 看用的数据集和评价指标!!
  4. 我无法用图二主观判断得出本文方法好的依据。

1、传统的去雾方法+实现原理+优缺点+性能指标

读图环节

看图说话,描述每幅图作者试图在论证什么。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/157430.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

东南亚电商平台,如何有效防范欺诈商户入驻?

目录 柬埔寨居民频遭电商欺诈 平台如何防范欺诈商家入驻 柬埔寨电信监管机构最新公布的数据显示,截至2022年1月,柬埔寨移动电话用户数量已达到19,458,849人,互联网用户数量达到1,7591,396人。这一数据表明,柬埔寨的数字化趋势日…

解锁OpenAI潜力:OpenAI 全面解析与最佳实践

该项目是由OpenAI公司提供的一个大型代码库,其中包含了各类与OpenAI API相关的代码示例和最佳实践。 此项目名为OpenAI Cookbook,目的是为了帮助使用者更有效地利用OpenAI API,将其应用于自己的工作和生活中。具体来说,可以解决一…

【MySQL】表的约束——主键、外键、唯一键,三键区别知否?

表的约束 前言正式开始空属性默认值comment列描述zerofill主键增删主键复合主键 自增长唯一键外键主键作为外键约束唯一键作为外键约束 总结 前言 我在上一篇讲完了所有的数据类型,数据类型本身也是MySQL中的一种约束,如果你对于MySQL中的数据类型不太了…

Android并发编程与多线程

一、Android线程基础 1.线程和进程 一个进程最少一个线程,进程可以包含多个线程进程在执行过程中拥有独立的内存空间,而线程运行在进程内 2.线程的创建方式 new Thread: 缺点:缺乏统一管理,可能无限制创建线程&…

多维度梳理 MySQL 锁

多维度梳理 MySQL 锁 1、并发问题的解决方案2、MySQL的各类型锁2.1、从数据操作的类型划分 (读锁、写锁)2.2、从数据操作的粒度划分2.2.1、表锁2.2.1.1、表级别的S 锁、X 锁2.2.1.2、意向锁(IS、IX)2.2.1.3、自增锁2.2.1.4、元数据锁 2.2.2、行锁2.2.2.1…

JavaScript编程基础 – 函数进阶

JavaScript编程基础 – 函数进阶 JavaScript Programming Essentials – Perfect Functions “函数的第一条原则是要小,函数的第二条原则是要更小。“ – 罗伯特.C.马丁 前文讲述过函数多取决于数学的函数概念,以此来定义JavaScript编程语言的函数&…

致远OA wpsAssistServlet 任意文件上传漏洞

声明 本文仅用于技术交流,请勿用于非法用途 由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,文章作者不为此承担任何责任。 一、产品简介 致远OA互联新一代智慧型协同运营平台以中台的架构和技术…

保护信息,守护隐私|传音第三届信息及隐私安全文化宣传月顺利开展

2023 年10月16日到11月10日,传音成功举办第三届信息及隐私安全文化宣传月活动,开展了系列知识竞赛、安全专题论坛等线上线下活动,宣传普及网络安全风险防护知识和技能,提升员工信息安全意识,构筑全方位防线。活动反响热…

docker笔记14--docker-nerdctl-crictl-ctr使用对比

docker笔记14--docker-nerdctl-crictl-ctr使用对比 介绍工具对比dockernerdctlcrictlctr 注意事项说明 介绍 随着容器云技术的成熟,越来越多的从业者开始接触、熟悉 docker和containerd 了,很多时候需要同时在 docker 和 containerd之间切换&#xff0c…

珠宝饰品展示预约小程序的效果如何

金银珠宝翡翠行业几乎每个人都会接触,比如黄金小手饰,翡翠小挂件等,当然除了购买外,还有附加服务,如珠宝鉴定、定制等,同时这个行业具有较强的到店属性,除了价值较小的配件外,真金白…

运动耳机哪个牌子好?最适合运动健身的五款运动耳机分享

​随着人们生活水平的提高和健康意识的增强,越来越多的人开始关注运动和健身。而在运动的时候,佩戴耳机听音乐已经成为了很多人的选择。那么,什么样的运动耳机最适合我们呢?今天,我就来帮助大家挑选出最适合运动健身的…

echarts 折线图内容区域渐变、曲线平滑

实现echarts折线图内容区域渐变,需要在series中进行配置。areaStyle:区域填充样式。设置后显示成区域面积图。 示例代码: series: [{type: "line",name: this.legendData[0],color: "#E3FF34",symbolSize: 14,symbol: …

整理MLAI学习路径图

干货分享: 下面给出一个笔者自己整理的GitHub仓库:https://github.com/isLinXu/awesome-road-map,里面包含了一些可供参考的学习路径和思维导图,并整理微软、meta、谷歌、Kaggle以及华为、百度、阿里、腾讯、讯飞等相关的学习资源…

Unity减少发布打包文件的体积(二)——设置WebGL发布时每张图片的压缩方式

一个项目在发布成WebGL后,其体积至关重要,体积太大,用户加载会经历一个漫长的等待…轻则骂娘,重则用脚把电脑踢烂(扣质保金)… 那么如何减少发布后的体积呢,本文从图片的压缩开始入手。 前传回顾: Unity减…

会议动态 | 浙江省水泥行业高质量发展暨碳达峰推进会成功召开

2023年11月9日,由浙江省水泥协会和百年建筑网主办的“2023年浙江省水泥行业高质量发展暨碳达峰推进会”在浙江杭州成功召开。 水泥生产企业、环保企业、智能装备企业、研究机构等水泥产业上下游重点企业和行业知名专家领导近400人出席了本次会议。 参会代表围绕《浙…

【Unity】XML文件的解析和生成

目录 使用XPath路径语法解析 使用xml语法解析 XML文件的生成 XML文件是一种常用的数据交换格式,它以文本形式存储数据,并使用标签来描述数据。解析和生成XML文件是软件开发中常见的任务。 解析XML文件是指从XML文件中读取数据的过程。在.NET中&#…

【前端】vue3+typescript+vite+Element-Plus搭建配置初始化项目结构

给自己一个目标,然后坚持一段时间,总会有收获和感悟! 对于我们开发人员,了解和熟悉新知识,对于vue3,博主是通过TA的基本结构开始,vue2和vue3都有javascript前端编程语言,到了vue3新增…

Find My数据线|苹果Find My技术与数据线结合,智能防丢,全球定位

数据线是用来连接移动设备和电脑的,来达到数据传递或通信目的。通俗点说,就是连接电脑与移动设备用来传送视频、铃声、图片等文件的通路工具。现在,随着电子行业日新月异的发展,数据线已经成为了我们生活中不可或缺的部分&#xf…

SpringBoot+Vue3+MySQL集群 开发健康体检双系统

第1章 课程介绍 试看4 节 | 38分钟 观看项目演示,熟悉大健康体检项目主要功能。掌握学习本课程的最佳方法,以及如何利用在线手册学习和答疑。 收起列表 视频: 1-1 导学 (22:46) 试看 视频: 1-2 学习方法注意事项 (07:46) 视频&am…

HTTP HTTPS 独特的魅力

目录 HTTP协议 HTTP协议的工作过程 首行 请求头(header) HOST Content-Length​编辑 User-Agent(简称UA) Referer Cookie 空行 正文(body) HTTP响应详解 状态码 报文格式 HTTP响应格式 如何…