【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf

【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf

文章目录

  • 【论文阅读】DeepLab:语义图像分割与深度卷积网络,自然卷积,和完全连接的crf
    • 一、介绍
    • 二、联系工作
    • 三、方法
      • 3.1 整体结构
      • 3.2 使用空间金字塔池的多尺度图像表示
      • 3.3 基于完全连通条件随机场(CRF)的结构预测精确边界恢复
    • 四、实验结果

DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs

深度学习解决了语义图像分割的任务

做出了三个主要贡献,这些贡献在实验中被证明具有实质性的实际价值

  • 强调卷积与上采样滤波器,或“空洞卷积”,作为一个强大的工具在密集预测任务

    作用:卷积实现不增加参数数量或计算量的情况下有效地扩大过滤器的视野,以纳入更大的上下文**

  • 空间金字塔池(ASPP)的多尺度目标鲁棒分割方法

    作用:在多个尺度上捕获对象和图像上下文

  • 结合DCNNs和概率图模型的方法,改进了目标边界的定位

    作用:条件随机场(CRF)相定性和定量地展示了定位性能

提出的DeepLab系统在PASCAL VOC -2012语义图像分割任务

一、介绍

以端到端方式训练的DCNNs比依赖手工制作特征的系统提供了明显更好的结果

DCNNs对局部图像变换的内置不变性,这使得它们能够学习越来越抽象的数据表示

可能会妨碍语义分割等密集的预测任务,因为在这些任务中不需要对空间信息进行抽象

DCNN应用于语义图像分割的三个挑战:

  • 特征分辨率降低
  • 多个尺度上存在目标
  • 由于DCNN的不变性而降低了定位精度


当DCNN以完全卷积的方式使用时,这将导致显著降低空间分辨率的特征图

DCNNs的最后几个最大池化层中去除下采样算子,并在随后的卷积层中对滤波器进行上采样

采用空洞卷积作为上采样滤波器卷积

空洞卷积允许我们在不增加参数数量或计算量的情况下有效地扩大滤波器的视场

相当于用具有互补有效视场的多个滤波器探测原始图像,从而在多个尺度上捕获物体以及有用的图像上下文

我们的工作探索了一种我们认为非常有效的替代方法。

采用完全连接的条件随机场(CRF)来提高模型捕获精细细节的能力

crf已广泛用于语义分割,将多路分类器计算的类分数与像素和边缘的局部相互作用捕获的低级信息相结合

越来越复杂的工作来模拟层次依赖关系

使用了完全连接的成对CRF,它具有高效的计算能力,并且能够捕捉精细的边缘细节,同时还能满足长距离依赖关系

DeepLab模型的高级说明如图

重新用于语义分割任务:

  • 将所有全连接层转换为卷积层(即全卷积网络[14])
  • 通过亚卷积层增加特征分辨率
  • 双线性插值将分数图上采样8倍,以达到原始图像分辨率
  • 输入输出到一个完全连接的CRF

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

双线性插值阶段将特征映射扩大到原始图像分辨率。然后应用全连接的CRF来细化分割

二、联系工作

大多数成功的语义分割系统依赖于手工制作的特征与平面分类器相结合

但这些系统的性能一直受到特征表达能力有限的影响

  • 第一类基于dcnn的语义分割系统通常采用自下而上的级联图像分割
  • 第二类工作依赖于使用卷积计算的DCNN特征进行密集图像标记
  • 第三类作品使用DCNNs直接提供密集的类别级像素标签


本文工作建立在这些工作的基础上,,通过控制特征分辨率、引入多尺度池化技术和在DCNN之上集成密集连接的CRF[22]来扩展它们

DCNN与CRF的结合当然并不新鲜,但之前的研究都是尝试局部连接的CRF模型


我们采用的全连接CRF模型[22]中的高斯CRF电位可以捕获远程依赖关系

大部分方法成功地对DCNN和CRF进行了联合学习

对整个训练集都可以使用像素级语义注释的假设


空洞卷积还允许我们扩大过滤器的视野,以纳入更大的环境

三、方法

3.1 整体结构

DCNNs进行语义分割或其他密集预测任务

被证明可以通过以全卷积方式部署DCNNs来简单而成功地解决

最近的DCNNs中,每个方向的分辨率通常是32倍。部分补救措施是使用“反卷积”层

在这里插入图片描述

图中的公式表明卷积的速度和扩展的快慢

速率参数r对应于我们对输入信号进行采样的步幅

在这里插入图片描述

在低分辨率输入特征映射上进行标准卷积稀疏特征

在高分辨率的输入特征映射上,使用率为r¼2的亚历斯卷积进行密集特征提取。
在这里插入图片描述

操作:

  • 分辨率降低2倍
  • 使用核进行卷积-这里是垂直高斯导数
  • 特征映射植入到原始图像坐标


将全分辨率图像与“带孔”滤波器进行卷积,我们可以计算所有图像位置的响应

因此过滤器参数的数量和每个位置的操作次数都保持不变


相反,我们采用了一种混合方法,在效率和精度之间取得了良好的平衡,使用空洞卷积将计算特征图的密度增加了4倍,然后使用8倍的快速双线性插值来恢复原始图像分辨率的特征图

3.2 使用空间金字塔池的多尺度图像表示

cnn已经显示出一种非凡的隐式表示规模的能力

第一种方法相当于标准的多尺度处理。我们使用共享相同参数的并行DCNN分支

多尺度处理显著提高了性能,但代价是计算多尺度输入的所有DCNN层的特征响应

该方案使用多个具有不同采样率的并行空洞卷积层。每个采样率提取的特征在单独的分支中进一步处理并融合以产生最终结果。

在这里插入图片描述

3.3 基于完全连通条件随机场(CRF)的结构预测精确边界恢复

在定位精度和分类性能之间的权衡似乎是DCNNs固有的

具有多个最大池化层的更深模型在分类任务中被证明是最成功的

DCNN得分图可以预测物体的存在和大致位置,但不能真正描绘出它们的边界


在这里插入图片描述

工作追求两个方向来解决这个挑战

  • 利用卷积网络中的多层信息,以便更好地估计目标边界
  • 采用超像素表示

基于耦合DCNNs的识别能力和全连接crf的细粒度定位精度来追求另一个方向,并表明它在解决定位挑战方面非常成功

并在远远超出现有方法范围的细节水平上恢复对象边界

作用:

  • CRFs被用于平滑噪声分割映射
  • 模型对相邻节点进行耦合,倾向于对空间近端像素进行相同标签分配
  • 短期crf的主要功能是清除建立在局部手工设计特征之上的弱分类器的虚假预测

为了克服短程CRF的这些局限性,我们将的全连接CRF模型集成到我们的系统中

在这里插入图片描述

表达式在不同的特征空间中使用两个高斯核

  • 第一个内核强制具有相似颜色和位置的像素具有相似的标签
  • 第二个内核在强制平滑时仅考虑空间接近性

四、实验结果

我们对Imagenet-pretrained VGG-16或ResNet-101网络的模型权值进行微调,使其以一种简单的方式适应语义分割任务

SGD过程

解耦了DCNN和CRF的训练阶段

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/436816.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Stable Diffusion 提示词语法(Prompt)

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里。 大家好,我是水滴~~ 本篇文章主要讲述 Stable Diffusion 提示词语法,主要包括:提示词的概念、提示词的长度、权重、分步绘制、交替绘制、组合绘制等&#x…

ORA/GSA -- 学习记录

brief over-representation analysis(ORA),过表“达”分析,就是我们做多分组的RNAseq数据解析后会得到一些差异表达的gene,有些时候是单独拿出一个差异gene去解释表型,缺点是欠缺证据力度。有些人就把一些相关的差异gene放在一块儿解释&…

leetcode 热题 100_最大子数组和

题解一: 动态规划:这是一道经典的动态规划题。维护一个dp数组,dp[i]表示0~i组成的数组的最大子数组和。当数组长度为1时,最大和连续子数组是它本身,也就是dp[i]nums[i]。当数组长度每增加1时,最大和连续子数…

精准获客、优化体验,Xinstall数据自动分析全搞定

在移动互联网时代,App已经成为了我们生活中不可或缺的一部分。然而,对于App开发者来说,如何有效地评估渠道效果、精准获客以及优化用户体验,一直是一个令人头疼的问题。幸运的是,Xinstall作为一款一站式App全渠道统计服…

YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information

paper: https://arxiv.org/abs/2402.13616 code YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information 一、引言部分二、问题分析2.1 信息瓶颈原理2.2 可逆函数 三、本文方法3.1 可编程梯度信息 四、实验4.1消融实验部分 今天的深度学习方法关注的…

Ajax、Axios、Vue、Element与其案例

目录 一.Ajax 二.Axios 三.Vue 四.Element 五.增删改查案例 一.依赖:数据库,mybatis,servlet,json-对象转换器 二.资源:elementvueaxios 三.pojo 四.mapper.xml与mapper接口 五.service 六.servlet 七.html页…

产品展示型wordpress外贸网站模板

孕婴产品wordpress外贸网站模板 吸奶器、待产包、孕妇枕头、护理垫、纸尿裤、孕妇装、孕婴产品wordpress外贸网站模板。 https://www.jianzhanpress.com/?p4112 床品毛巾wordpress独立站模板 床单、被套、毛巾、抱枕、靠垫、围巾、布艺、枕头、乳胶枕、四件套、浴巾wordpre…

请说明Vue中的异步组件加载

Vue中的异步组件加载是指当页面需要渲染某个组件时,可以在需要时再去加载这个组件,而不是在页面初始化的时候就将所有组件一次性加载进来。这种方式能够有效降低页面的初始加载时间,提升用户体验。 在Vue中,我们可以使用import函…

Dgraph 入门教程三(linux本地部署)

上一章中,我们用的官方的Clound操作的,怎么在本地部署一套Dgraph呢。这一章将做详细介绍。安装有好几种方式,最简单的就是联网部署。因为项目需要,这里先不介绍和测试线上部署了,只介绍离线部署。 1、下载安装包 Rel…

flask 数据库迁移报错 Error: No such command ‘db‘.

初学FLASK,使用pycharm的terminal 启动,实现数据库迁移 文件结构 项目启动文件不在一级目录pycharm>terminal启动 由于自己初入 python flask 很多东西并不懂,只能依葫芦画瓢,使用如下命令,输入完第一行命令执行没有任何错误…

Android Termux系统安装openssh实现公网使用SFTP远程访问

文章目录 1. 安装openSSH2. 安装cpolar3. 远程SFTP连接配置4. 远程SFTP访问4. 配置固定远程连接地址 SFTP(SSH File Transfer Protocol)是一种基于SSH(Secure Shell)安全协议的文件传输协议。与FTP协议相比,SFTP使用了…

力扣写法题:最后一个单词的长度

如果最后一个单词后有空格可以采用以下的写 int lengthOfLastWord(char* s) {int count0,flag0;int i(strlen(s)-1);while(i>0){if(s[i]! ) flag1;if(flag1) {if(s[i] ) break;else count;}i--;}return count; }

IAR全面支持小华全系芯片,强化工控及汽车MCU生态圈

IAR Embedded Workbench for Arm已全面支持小华半导体系列芯片,加速高端工控MCU和车用MCU应用的安全开发 嵌入式开发软件和服务的全球领导者IAR与小华半导体有限公司(以下简称“小华半导体”)联合宣布,IAR Embedded Workbench fo…

STM32CubeMX学习笔记14 ---SPI总线

1. 简介 1.1 SPI总线介绍 SPI 是英语Serial Peripheral interface的缩写,顾名思义就是串行外围设备接口。是Motorola(摩托罗拉)首先在其MC68HCXX系列处理器上定义的。 SPI,是一种高速的,全双工,同步的通信总线,并且在…

如何把网页调用变为代码调用

1.背景 最近有一个需求,猜测一段十六进制流的校验方式,挨个尝试非常耗时,需要写代码,调用网页上的功能。 2.解决方案 可以使用Python的 requests 库来发起HTTP请求,并通过POST请求将数据发送给服务器进行计算CRC校验和…

类和对象周边知识

再谈构造函数 前几期我们把六个默认成员函数一一说明后,构造函数还有一些周边知识。 初始化列表 我们在没有了解初始化列表的时候一般都是使用构造函数初始化或者在声明哪里给予缺省值,那么为什么好药存在初始化列表呢?是因为①.有些值必须…

Java后台面试相关知识点解析

文章目录 JavaJava中四种引用类型及使用场景集合HashMap源码及扩容策略HashMap死循环问题ConcurrentHashMap与HashtableConCurrentHashMap 1.8 相比 1.7 判断单链表是否有环,并且找出环的入口IO线程池线程池的几种创建方式判断线程是否可以回收线程池的7大核心参数线…

【实战】K8S集群部署nacos并接入Springcloud项目容器化运维

文章目录 前言Nacos集群搭建Spring cloud配置nacos将Springcloud项目部署在k8s写在最后 前言 相信很多同学都开发过以微服务为架构的系统,开发微服务必不可少要使用注册中心,比如nacos\consul等等。当然在自动化运维流行的今天,我们也会将注…

Qt6.6搭建WebAssembly

1.首先安装python , 链接:https://www.python.org/ 2.下载并安装qt6. 3.克隆emsdk工程 3.1 进入emsdk目录,然后更新emsdk代码 3.2 下载并安装最新的SDK工具。(C:\Qt\emsdk>emsdk install --global latest) 3.3…

一周学会Django5 Python Web开发-Django5修改视图UpdateView

锋哥原创的Python Web开发 Django5视频教程: 2024版 Django5 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili2024版 Django5 Python web开发 视频教程(无废话版) 玩命更新中~共计31条视频,包括:2024版 Django5 Python we…