图像分割系列(一)

图像分割分类

语义分割

把每个像素都打上标签(这个像素点是人,树,背景等)
(语义分割只区分类别,不区分类别中具体单位)
在这里插入图片描述

实例分割

实例分割不光要区别类别,还要区分类别中每一个个体。
在这里插入图片描述

怎么做

损失函数

逐像素做二分类或者多分类,这就涉及到逐像素的交叉熵(神经网络的分类任务其实就是一个交叉熵的问题)。还经常需要考虑样本均衡问题。
交叉熵损失函数公式如下:
l o s s = − p o s _ w e i g h ∗ y t r u e l o g ( y p r e d ) − ( 1 − y t r u e ) l o g ( 1 − y p r e d ) loss = -pos\_weigh * y_{true}log(y_{pred})- (1 - y_{true})log(1 - y_{pred}) loss=pos_weighytruelog(ypred(1ytrue)log(1ypred)

其中:
p o s _ w e i g h t = n u m _ n e g n u m _ p o s pos\_weight= \frac{num\_neg}{num\_pos} pos_weight=num_posnum_neg

根据前景和背景的比例,设置的一个权重值。

公式改进

在这个公式的基础上。稍微做一些改进,这部分改进并不是针对语义分割来做的,很多地方都能看到。

样本也由难易之分,就跟玩游戏一样,难度越高的BOSS奖励越高。
什么是难易之分,每个像素点都要做交叉熵,都会有一个预测结果,都会带来一个损失值,那么要不要把每一个点都相同对待呢?
不能,因为有的像素点好做,一看就是大背景,一看就是大前景,哪些点难做,轮廓比较难做,例如一个人,边里面好做,边外边好做,就边上难做。所以这些像素点也是有难易之分的,那么这里就类似于加上一个注意力机制一样,加上一个权值,将这些比较难做的像素点在损失函数中体现出来。

l o s s = − ( 1 − y t r u e ) γ ∗ y t r u e l o g ( y p r e d ) − y t r u e γ ( 1 − y t r u e ) l o g ( 1 − y p r e d ) loss = - (1 - y_{true})^{γ} * y_{true}log(y_{pred})- y_{true}^{γ} (1 - y_{true})log(1 - y_{pred}) loss=(1ytrue)γytruelog(ypredytrueγ(1ytrue)log(1ypred)

通俗理解

Gamma通常设置为2,例如预测正样本概率0.95,也就是说预测正样本这件事情比较简单。 ( 1 − 0.95 ) 2 = 0.0025 (1 - 0.95)^2 = 0.0025 (10.95)2=0.0025
如果预测正样本概率0.5, ( 1 − 0.5 ) 2 = 0.25 (1 - 0.5)^2 = 0.25 (10.5)2=0.25 (相当于样本的难易权值,也可以理解为哪一个像素点对损失的贡献大,哪一个像素点对损失的贡献小)

整合上述内容
− α ( 1 − y t r u e ) γ ∗ y t r u e l o g ( y p r e d ) − ( 1 − α ) y t r u e γ ( 1 − y t r u e ) l o g ( 1 − y p r e d ) -α (1 - y_{true})^{γ} * y_{true}log(y_{pred})- (1-α) y_{true}^{γ} (1 - y_{true})log(1 - y_{pred}) α(1ytrue)γytruelog(ypred(1α)ytrueγ(1ytrue)log(1ypred)
(再结合样本数量的权值就是Focal Loss)
α正负样本(即前景和背景)的比例,γ难易程度设置的权重

评价指标

IOU

(Intersection over Union),又称重叠度/交并比。
在这里插入图片描述

IoU = gt bbox、pred bbox交集的面积 / 二者并集的面积
在这里插入图片描述

MIOU

MIOU就是计算所有类别的平均值,一般当作分割任务评估指标。
Mean Intersection over Union(MIoU, 均交并比),为语义分割的标准度量。其计算两个几个的交集和并集之比,在语义分割问题中,这两个集合为真实值(ground truth)和预测值(predicted segmentation)。这个比例可以变形为TP(交集)比上TP、FP、FN之和(交集)。在每个类上计算IoU,然后取平均。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/1611.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

面向切面编程AOP

1.Spring的AOP简介 1.1什么是AOP AOP为Aspect Oriented Programming的缩写,意思是面向切面编程,是通过预编译和运行期动态代理实现程序功能维护的一种技术 AOP是OOP(面向对象)的延续,利用AOP可以对业务逻辑的各部分…

5个代码技巧,加速你的Python

5个代码技巧,加速你的Python 人生苦短,快学Python! Python作为一种功能强大的编程语言,因其简单易学而受到很多初学者的青睐。它的应用领域又非常广泛:科学计算、游戏开发、爬虫、人工智能、自动化办公、Web应用开发…

蓝桥杯C++组怒刷50道真题(填空题)

🌼深夜伤感网抑云 - 南辰Music/御小兮 - 单曲 - 网易云音乐 🌼多年后再见你 - 乔洋/周林枫 - 单曲 - 网易云音乐 18~22年真题,50题才停更,课业繁忙,有空就更,2023/3/18/23:01写下 目录 👊填…

【C++】智能指针

文章目录📖 前言1. 智能指针的引入1.1 内存泄露的危害:1.2 异常安全中的内存泄露:1.3 RAII思想:1.3 拦截异常解决不了的内存泄漏:1.4 智能指针解决:2. 智能指针的拷贝2.1 直接拷贝的问题:2.2 au…

STM32实战项目-触摸按键

前言: 通过触摸按键控制LED灯以及继电器,具体实现功能如下: 1、触摸按键1单击与长按,控制LED1; 2、触摸按键2单击与长按,控制LED2; 3、触摸按键3单击与长按,控制LED3; 4、触摸按键4单击与长…

详解Spring、SpringBoot、SpringCloud三者的联系与区别

一、Spring Spring 是一个轻量级的Java 开发框架,主要依存于SSM 框架,即Spring MVC Spring Mybatis,定位很明确,Spring MVC主要负责view 层的显示,Spring 利用IOC 和AOP 来处理业务,Mybatis则是数据的持…

跨域解决方案

跨域解决方案 1.跨域基本介绍 文档:https://developer.mozilla.org/zh-CN/docs/Web/HTTP/CORS 跨域问题是什么? 一句话:跨域指的是浏览器不能执行其他网站的脚本,它是由浏览器的同源策略造成的,是浏览器对 javascr…

数据结构 | 栈的中缀表达式求值

目录 什么是栈? 栈的基本操作 入栈操作 出栈操作 取栈顶元素 中缀表达式求值 实现思路 具体代码 什么是栈? 栈是一种线性数据结构,具有“先进后出”(Last In First Out, LIFO)的特点。它可以看作是一种受限的…

“国产版ChatGPT”文心一言发布会现场Demo硬核复现

文章目录前言实验结果一、文学创作问题1 :《三体》的作者是哪里人?问题2:可以总结下三体的核心内容吗?如果要续写的话,可以从哪些角度出发?问题3:如何从哲学角度来进行续写?问题4:电…

学习28个案例总结

学习前 对于之前遇到的问题没有及时总结,导致做什么事情都是新的一样。没有把之前学习到接触到的内容应用上。通过这次对28个案例的学习。把之前遇到的问题总结成自己的经验,在以后的开发过程中避免踩重复性的坑。多看帮助少走弯路。 学习中 对28个案例…

2023年安徽省中职网络安全跨站脚本攻击

B-4:跨站脚本攻击 任务环境说明: √ 服务器场景:Server2125(关闭链接) √ 服务器场景操作系统:未知 √ 用户名:未知 密码:未知 1.访问服务器网站目录1,根据页面信息完成条件&am…

Shader基础

参考文章:Unity着色器介绍 Shader基础 Properties 声明格式 [optional: attribute] name(“display text in Inspector”, type name) default value 属性类型 Color:颜色属性,表示 RGBA 颜色值。Range:范围属性,表示一个在…

基于微信小程序的校园二手交易平台小程序

文末联系获取源码 开发语言:Java 框架:ssm JDK版本:JDK1.8 服务器:tomcat7 数据库:mysql 5.7/8.0 数据库工具:Navicat11 开发软件:eclipse/myeclipse/idea Maven包:Maven3.3.9 浏览器…

22讲MySQL有哪些“饮鸩止渴”提高性能的方法

短连接风暴 是指数据库有很多链接之后只执行了几个语句就断开的客户端,然后我们知道数据库客户端和数据库每次连接不仅需要tcp的三次握手,而且还有mysql的鉴权操作都要占用很多服务器的资源。话虽如此但是如果连接的不多的话其实这点资源无所谓的。 但是…

Web自动化——前端基础知识(二)

1. Web前端开发三要素 web前端开发三要素 什么是HTMl? Html是超文本标记语言,是用来描述网页的一种标记语言HTML是一种标签规则的形式将内容呈现在浏览器中可以以任意编辑器创建,其文件扩展名为.html或.htm保存即可 什么是CSS?…

ElasticSearch-第五天

目录 es中脑裂问题 脑裂定义 脑裂过程分析 解决方案 数据建模 前言 nested object 父子关系数据建模 父子关系 设置 Mapping 索引父文档 索引子文档 Parent / Child 所支持的查询 使用 has_child 查询 使用 has_parent 查询 使用 parent_id 查询 访问子文档 …

学习 Python 之 Pygame 开发魂斗罗(一)

学习 Python 之 Pygame 开发魂斗罗(一)Pygame回忆Pygame1. 使用pygame创建窗口2. 设置窗口背景颜色3. 获取窗口中的事件4. 在窗口中展示图片(1). pygame中的直角坐标系(2). 展示图片(3). 给部分区域设置颜色5. 在窗口中显示文字6. 播放音乐7. 图片翻转与…

人脸活体检测系统(Python+YOLOv5深度学习模型+清新界面)

摘要:人脸活体检测系统利用视觉方法检测人脸活体对象,区分常见虚假人脸,以便后续人脸识别,提供系统界面记录活体与虚假人脸检测结果。本文详细介绍基于YOLOv5深度学习技术的人脸活体检测系统,在介绍算法原理的同时&…

【C++】用手搓的红黑树手搓set和map

目录 一、set/map的底层结构 1、set/map的源码 2、利用模板区分set/map 3、利用仿函数控制比较大小 二、set/map的迭代器(红黑树的迭代器) 1、红黑树的begin、end迭代器 2、红黑树迭代器的operator 3、红黑树迭代器的operator-- 三、set的const…

人工智能大模型之ChatGPT原理解析

前言 近几个月ChatGPT爆火出圈,一路狂飙;它功能十分强大,不仅能回答各种各样的问题,还可以信写作,给程序找bug…我经过一段时间的深度使用后,十分汗颜,"智障对话"体验相比&#xff0c…