深度学习语义分割开山鼻祖——FCN网络

FCN网络内容简介

FCN网络是第一个将深度学习应用于语义分割的网络,具有开创新和划时代的意义

FCN网络在2015年效果是非常惊艳的,准确率提高了10%左右,并且推理时间非常快 。下面是网络结构示意图和实验数据。

最后进行放大的预测图有21个通道(20个类+背景),每个通道的值代表对于一个类的预测概率,取概率预测最大的类别作为该像素的预测类别  

FCN网络卷积化过程详解

首先FCN中有一个很重要的创新点Convolutionalization结构

 对于上图有以下几点:

为什么要将全连接层替换成卷积层:

1. 保留空间信息:全连接层将输入数据展平为向量,丢失了输入数据的空间信息。对于图像分割等任务,空间信息对于准确的像素级预测非常重要。通过使用卷积层替代全连接层,可以保留输入数据的空间结构,使得网络能够对每个像素进行预测。
2. 处理任意大小输入:全连接层要求固定大小的输入,而卷积层可以处理任意大小的输入。对于图像分割任务,输入图像的大小可能不同,使用全连接层需要将输入图像调整为固定大小,这可能导致图像的形状信息丢失。而卷积层可以处理不同大小的输入,使得网络可以适应不同尺寸的图像。

那么为什么目标检测任务可以将图片调整到相同尺寸然后输入进入模型,但是语义分割任务不能够这么干,反而需要通过调整网络结构,使得模型能够接受不同尺寸大小的输入?

在目标识别任务中,我们通常将输入的图片固定到相同的尺寸是因为目标识别任务的目标是对整个图像进行分类,而不需要对每个像素进行预测。因此,将输入图像调整为相同的尺寸可以方便地将其输入到全连接层或其他分类器中进行分类。

然而,在语义分割任务中,我们的目标是对每个像素进行分类,即为每个像素分配一个语义标签。每个像素都有其重要性,因此保留图像的空间信息对于准确的像素级预测非常重要。不同的图像可能具有不同的尺寸,例如自然图像数据集中的图像可以具有各种大小和长宽比。如果将输入的图像固定到相同的尺寸,可能会导致图像的形状信息丢失或扭曲,从而影响语义分割的准确性。

将全连接层转换为卷积层之后,对于网络输入大小就没有太严格的限制了

convolutionalization过程  

 

简而言之就是通过7*7的卷积核进行卷积替换Flatten操作  

FCN三个版本的模型结构

首先FCN网络的主干网络使用了-VGG结构

FCN有三个版本结构:

 

 

 

 

 到这类,FCN的基础知识就介绍完毕了,觉得对您有帮助,麻烦给我点个关注,感谢感谢

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/479847.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

IO网络通信

IO Bio: 同步阻塞,一个线程一次连接,基于字符流/字节流 Nio:同步非阻塞 一个线程多个连接,多个请求注册到多路复用selector上,多路复用器轮训连接 面向缓冲区, 从某通道读取数据到缓存区&…

文献速递:基于SAM的医学图像分割---nnSAM:即插即用的分割任何东西模型 模型提升了nnUNet性能

Title 题目 nnSAM: Plug-and-play Segment Anything Model Improves nnUNet Performance nnSAM:即插即用的分割任何东西模型 模型提升了nnUNet性能 01 文献速递介绍 在现代临床工作流中,医学图像的高效准确分割对于疾病诊断和预后、治疗计划和监控以…

InnoDB 缓存

本文主要聊InnoDB内存结构, 先来看下官网Mysql 8.0 InnoDB架构图 MySQL :: MySQL 8.0 Reference Manual :: 17.4 InnoDB Architecture 如上图所示,InnoDB内存主要包含Buffer Pool, Change Buffer, Log Buffer, Adaptive Hash Index Buffer Pool 其实 buffer pool 就是内存中的…

网络安全协议基本问题

Http和Https协议的端口号: Http:80 Https:443 网络监听: 网络监听是一种监视网络状态、数据流程以及网络上信息传输的工具,它可以将网络界面设定成监听模式,并且可以截获网络上所传输的信息。但是网络监…

Linux:权限的概念与理解

目录 1. Linux权限的概念 2. Linux权限管理 01.文件访问者的分类 02.文件类型和访问权限 03.文件权限值的表示方法 04. 文件访问权限的相关设置方法 3. 使用 sudo分配权限 4. 目录的权限 ---------- 权限 用户角色(具体的人) 文件权限属性 ---------- 1. Linux权限的…

大英赛-选择题 (持续更新中)

解题策略: 十五分钟内写完,单选: ABCD全部单项选择题 考的语法点弄清不懂得话 看《张道真语法》 不会的单词建议下载墨墨背单词 直接把不会的加入到要背的里面 知识点 2019年初赛: 2019年决赛:

QT信号和槽机制connect用法

信号与槽机制是绝对不可或缺且常用的&#xff0c;其中的参数一般都会比较简单&#xff0c;bool、int、QString之类的&#xff0c;但当我们想要传递相对比较复杂的参数&#xff0c;例如QVector<int>、QList<QString>&#xff0c;以及一些我们自定义的结构体时&#…

白酒:蒸馏过程中香味成分的生成机制与调控技术

在豪迈白酒的酿造过程中&#xff0c;蒸馏是关键的步骤之一&#xff0c;它决定了白酒的香味成分和品质。云仓酒庄对蒸馏过程中香味成分的生成机制与调控技术进行了深入研究&#xff0c;以提高产品的风味和品质。 首先&#xff0c;蒸馏过程中香味成分的生成机制是一个复杂的过程。…

第四百一十八回

文章目录 1. 概念介绍2. 思路与方法2.1 实现思路2.2 实现方法 3. 示例代码4. 内容总结 我们在上一章回中介绍了"自定义标题栏"相关的内容&#xff0c;本章回中将介绍自定义Action菜单.闲话休提&#xff0c;让我们一起Talk Flutter吧。 1. 概念介绍 我们在这里提到的…

图和树的路径问题

图 一&#xff1a;用vector存储无向图 数据结构 const int N 100; vector<int> G[N]; void addEdge(int u, int v){// 无向图G[u].push_back(v);G[v].push_back(u); } int m; // 点的个数创建图 void printList(){for (int i 0; i < m;i){cout << i<<…

NFT Insider #124:Aavegotchi 开启新一季稀有度挖矿,德克萨斯州奥斯汀市登陆 The Sandbox

引言&#xff1a;NFT Insider由NFT收藏组织WHALE Members&#xff08;https://twitter.com/WHALEMembers&#xff09;、BeepCrypto &#xff08;https://twitter.com/beep_crypto&#xff09;联合出品&#xff0c;浓缩每周NFT新闻&#xff0c;为大家带来关于NFT最全面、最新鲜、…

基于Gabor滤波器的指纹图像识别,Matlab实现

博主简介&#xff1a; 专注、专一于Matlab图像处理学习、交流&#xff0c;matlab图像代码代做/项目合作可以联系&#xff08;QQ:3249726188&#xff09; 个人主页&#xff1a;Matlab_ImagePro-CSDN博客 原则&#xff1a;代码均由本人编写完成&#xff0c;非中介&#xff0c;提供…

Windows系统部署hMailServer邮件服务结合内网穿透实现公网收发邮件

文章目录 前言1. 安装hMailServer2. 设置hMailServer3. 客户端安装添加账号4. 测试发送邮件5. 安装cpolar6. 创建公网地址7. 测试远程发送邮件8. 固定连接公网地址9. 测试固定远程地址发送邮件 前言 hMailServer 是一个邮件服务器,通过它我们可以搭建自己的邮件服务,通过cpola…

外包干了6天,技术退步明显。。。。

说一下自己的情况&#xff0c;本科生&#xff0c;19年通过校招进入上海某软件公司&#xff0c;干了接近4年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&a…

【FFT实战篇】C++实现:利用快速傅里叶变换快速计算(多项式)乘法

本文使用C语言实现了快速傅里叶变换FFT并运用其进行多项式乘法计算&#xff0c;适合供学习过《数字信号处理》的读者学习使用FFT快速计算乘法。当然也可供对快速乘法感兴趣的没有系统学习过数字信号处理&#xff08;从CFT到DTFT到DFT&#xff09;的读者参考&#xff0c;提供一种…

如何真正改变自己? 《掌控习惯》

维持改变 1.心态 目标与体系&#xff0c;谁是真正通往成功的钥匙&#xff1f; 2.行动 习惯转变的3个层次 身份 你要成为谁&#xff1f; 你为成为他而幸福吗&#xff1f;过程结果 习惯的基本原理&#xff1a;要重视微小的改变 维持改变成两个方面入手 一、心态&#xff1a;忽略…

面向对象编程三大特征

基本介绍 面向对象编程有三大特征&#xff1a;封装、继承和多态。 1、封装介绍 2、继承介绍 3、多态介绍 向上转型与向下转型 多态常用案例 数值比较。

Oracle 写丢失保护/影子表空间(Lost Write Protection with Shadow Tablespace)

写丢失是Oracle数据库与独立I/O子系统交互时一种错误场景。假如Oracle发出的写磁盘命令&#xff0c;I/O子系统也返回成功写磁盘的消息&#xff08;但数据此时可能依然在I/O系统缓存中&#xff09;&#xff0c;如果在I/O系统实际写盘之前Oracle再次读取该数据&#xff0c;则I/O系…

机器人路径规划:基于红尾鹰算法(Red‑tailed hawk algorithm ,RTH)的机器人路径规划(提供MATLAB代码)

一、机器人路径规划介绍 移动机器人&#xff08;Mobile robot&#xff0c;MR&#xff09;的路径规划是 移动机器人研究的重要分支之&#xff0c;是对其进行控制的基础。根据环境信息的已知程度不同&#xff0c;路径规划分为基于环境信息已知的全局路径规划和基于环境信息未知或…

软考中级 --网络工程师真题试卷 2023下半年

在EIGRP协议中&#xff0c;某个路由器收到了两条路径到达目标网络&#xff0c;路径1的带宽为100Mbps&#xff0c;延迟2ms&#xff0c;路径2的带宽为50Mbps&#xff0c;迟为4ms&#xff0c;如果EIGRP使用带宽和延迟的综合度量标准&#xff0c;那么该路由器选择的最佳路径是(D)。…