基于FCN网络实现的多类别图像分割任务

1、前言

FCN 作为图像分割的开山之作,将分割任务作为逐个像素点的分类任务

之前完成了基于unet、resnet+unet、deeplab等等网络的分割任务,具体的可以参考本专栏:

图像分割_听风吹等浪起的博客-CSDN博客

因为FCN网络的实现较为复杂,当然有很多现成的代码实现FCN分割网络。不过torchvision中其实已经封装好了,这里我们直接利用这个torchvision完成即可

2、具体实现的思路

这里介绍代码实现的逻辑,具体的参考之前文章

2.1 数据处理

首先是对数据的处理,因为要完成的分割是属于有监督学习,并且label是和数据同样size的灰度图像,所以两者间的对应特别重要

有的label标签是全黑的,或者是那种白色区域很明显的,其实都是一样的。

因为图像分割是逐个像素点的分类任务,而你把分类的值设为1(全黑)或者255(白色区域)其实是一样的,只不过加载数据的时候需要处理下

这里还是使用之前博文unet处理的方式,通过便利mask图像,找到灰度值有几类,这样其实就是分割网络的输出有几类。

如下,可以看到总共有5个灰度值,也就代表了这个数据集是五分割的任务,0代表背景,也算作分割之一

需要注意的是,网络的输出是需要呈0 1 2 这种自然数,因为5分割的输出是5个特征图,而特征图的索引就是0 1 2 3 4,含义是每个特征图负责预测某个灰度值。

例如猫、狗、猪,三个分类任务,最后输出的张量必须是3,在3中找出最大概率的那个索引就是对应猫、狗、猪的某一类。

而网络是不知道猫、狗、猪是什么玩意,只知道0 1 2 ,我们人为规定0是猫、2是猪。

这里dataset的实现如下:

2.2 FCN网络的实现

torchvision给了我们两个backbone,resnet50和resnet101,这里我们全部实现。

其中weights参数是是否导入官方的预训练权重

2.3 数据预处理

 预处理是黑匣子,对于分割这种任务,知道预处理后的图像是什么样子很有必要,这里也实现一下

其中控制台会输出这样,这样是正常的,可以看到mask的灰度值被映射到了0 1 2 3 4中

需要注意的是,如果出现了255是正常的,因为这里使用了多尺度的随机缩放,255负责填充,在train的时候,代码会自动忽略255的部分

不过有的时候出现255,上面的图像可能会出现异常。

个人猜测,plt会自动将灰度图像调色,这样哪怕mask灰度靠的很近也会很明显的展示。要是出现255的话,调色可能会冲突?

3、对比实验

这里利用FCN对腹部多脏器的五分割进行实验,效果如下:

这里仅仅测试了20个epoch,网络并未收敛

resnet50:

 

resnet101:

 

4、代码使用

训练脚本的超参数如下:

  • backbone 选择resnet50 or resnet101作为FCN的特征提取网络
  • pretrained 是否载入官方预训练权重
  • base_size 在这个值的基础上对图像进行随机缩放0.8倍-1.2倍之间
  • crop_size 中心裁剪,这个值可以设置为数据的大小
  • img_f、mask_f :用于加载数据,因为有的数据和mask图像的文件名不一致,导致找不到对应的标签。在这里填入相应的后缀即可
  • vis 是否保存预处理数据的结果

 

数据的摆放还是和以前一样

 

输出的文件:

依次为:权重、mask灰度值信息、loss和iou分别在train和test数据集上的曲线、学习率衰减曲线、训练日志、可视化数据图像

训练控制台打印如下:

 

代码位置: 基于FCN网络对腹部多脏器数据集的5分割实战资源-CSDN文库

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/585164.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【阿里笔试题汇总】[全网首发] 2024-04-29-阿里国际春招笔试题-三语言题解(CPP/Python/Java)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新阿里国际近期的春秋招笔试题汇总~ 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢&#x…

访学/博后/联培博士关注|不同国家的英语口音辨识度训练

在访问学者、博士后及联合培养的申请过程中,接收方多数都要求英文面试。如果导师的母语为非英语国家,将会带有口音,这样更增加了英语面试难度。如何提升不同国家的英语口音辨识度,使自己的英语表达更加流利,知识人网小…

01数学建模 -线性规划

1.1线性规划–介绍 翻译翻译什么叫惊喜 1.2线性规划–原理 拉格朗日乘数法手算 最值化 f ( x , y ) , s . t . g ( x , y ) c , 引入参数 λ ,有: F ( x , y , λ ) f ( x , y ) λ ( g ( x , y ) − c ) 再将其分别对 x , y , λ 求导&#xff0c…

第十五届蓝桥杯省赛第二场C/C++B组H题【质数变革】题解

解题思路 首先,我们考虑一下整个数组都是由质数构成的情况。 当我们要将质数 x x x 向后移 k k k 个时,如果我们可以知道质数 x x x 在质数数组的下标 j j j,那么就可以通过 p r i m e s [ j k ] primes[j k] primes[jk] 来获取向后…

远程桌面的端口配置与优化

在现代企业环境中,远程桌面连接已成为日常工作中不可或缺的一部分。然而,随着网络攻击的增加,确保远程桌面连接的安全性变得尤为重要。其中一个关键的安全因素是端口配置。 一、远程桌面默认端口 远程桌面协议(RDP)默…

vue2迁移到vue3,v-model的调整

项目从vue2迁移到vue3,v-model不能再使用了,需要如何调整? 下面只提示变化最小的迁移,不赘述vue2和vue3中的常规写法。 vue2迁移到vue3,往往不想去调整之前的代码,以下就使用改动较小的方案进行调整。 I…

无人机反制:雷达探测+信号干扰器技术详解

固定翼无人机、旋翼无人机等,可折叠式无机、DIY无人机等。黑飞,监管困难给航空业带来了诸多隐患;给恐怖袭击及间谍侦察带来新的方式、引发了各国地区政府的忧虑,在中国存在的问题更加严峻。 反无人飞行器防御系统(AUDS)&#xff0…

positivessl通配符证书签发13个月仅400元

PositiveSSL是Sectigo旗下的数字证书品牌,旗下的数字证书产品不仅具有签发速度快、性价比高以及兼容性高等特点,还可以为网站提供传输信息加密服务,保护客户隐私安全,提升客户对网站的信任度。今天就随SSL盾小编了解PositiveSSL旗…

【好书推荐8】《智能供应链:预测算法理论与实战》

【好书推荐8】《智能供应链:预测算法理论与实战》 写在最前面编辑推荐内容简介作者简介目录精彩书摘前言/序言我为什么要写这本书这本书能带给你什么 致谢 🌈你好呀!我是 是Yu欸 🌌 2024每日百字篆刻时光,感谢你的陪伴…

C#基础|对象初始化器与构造方法对比总结

哈喽,你好啊,我是雷工! 01 对象初始化器的作用 为了更加灵活的初始化对象的“属性”,是对构造化方法的补充。 02 构造方法总结 2.1、存在的必要性:一个类中,至少要有一个构造方法(有无参数均…

公网ip申请ssl仅260

现在很多网站都已经绑定域名,因此使用的都是域名SSL证书保护网站传输信息安全,而没有绑定域名只有公网IP地址的网站想要保护传输信息安全就要申请IP SSL证书。IP SSL证书也是由正规CA认证机构颁发的数字证书,用来保护用户的隐私以及数据安全&…

本地运行测试 YOLOv8(20240423)

一、环境搭建请参考:Win10 搭建 YOLOv8 运行环境(20240423)-CSDN博客 二、安装 PyCham 1.1、下载安装 官网地址:Download PyCharm: The Python IDE for data science and web development by JetBrains 阿里云盘(社区…

免费的单片机物联网MQTT平台选择

目的是多设备接入中控,平台只做转发。 选择巴法云:巴法科技&巴法云-巴法设备云-巴法物联网云平台 clientId是私钥uid: 多设备 clientId 填同一个 uid 都是可以的。平台应该是加了后缀区分。 支持自定义topic,操作简单&#x…

Stable Diffusion使用ControlNet:IP-Adapter实现图片风格迁移

IP-Adapter 全称是 Text Compatible Image Prompt Adapter for Text-to-Image Diffusion Models(文本到图像扩散模型的文本兼容图像提示适配器),是腾讯研究院出品的一个新的ControlNet模型,旨在使预训练的文本到图像扩散模型能够生…

【Qt之·控件·样式表】

系列文章目录 文章目录 前言一、Qt样式表的基础知识1.1 Qt样式表的定义和语法规则1.2 Qt样式表中的选择器和属性1.2.1 盒子模型1.2.2 border 1.3 Qt样式表中的伪类和伪元素 二、编写基本的Qt样式表2.1 在Qt应用程序中引入样式表文件的方式2.2 设置基本的背景色、字体样式等 三、…

Anomalib:用于异常检测的深度学习库!

大家好,今天给大家介绍了一个用于无监督异常检测和定位的新型库:anomalib,Github链接:https://github.com/openvinotoolkit/anomalib 简介 考虑到可重复性和模块化,这个开源库提供了文献中的算法和一组工具,以通过即插即用的方法设计自定义异常检测算法。 Anomalib 包…

VUE+TS使用elementUI的el-checkbox双重v-for循环做勾选

html部分 <template><div class"hello"><el-form :model"elForm"> <!-- cities对象数组形式 --><el-form-item v-for"(item, topIndex) in cities" :key"topIndex"> <!--item.checked 是每一个item…

深度解析 Spring 源码:从BeanDefinition源码探索Bean的本质

文章目录 一、BeanDefinition 的概述1.1 BeanDefinition 的定位1.2 BeanDefition 的作用 二、BeanDefinition 源码解读2.1 BeanDefinition 接口的主要方法2.2 BeanDefinition 的实现类2.2.1 实现类的区别2.2.2 setBeanClassName()2.2.3 getDependsOn()2.2.4 setScope() 2.3 Bea…

用Python Turtle画一个中国结

中国结&#xff0c;作为中华民族传统文化的象征之一&#xff0c;以其独特的编织技艺和深厚的文化内涵&#xff0c;深受人们喜爱。今天&#xff0c;我们就来用Python的turtle模块&#xff0c;尝试绘制一个充满韵味的中国结。 我们先来看看整个中国结生成的过程&#xff1a; 中国…

ros2 node 之间的通信方式之 —— Topic通信案例

文章目录 ros2 node 之间的通信方式之 Topic通信Topic 通信案例1、创建工作空间2、创建功能包3、编写发布者和订阅者代码3.1 topic_helloworld_pub.cpp3.2 topic_helloworld_sub.cpp 4、编写CMakeLists.txt5、编译工作空间下的功能包6、运行结果 ros2 node 之间的通信方式之 To…