【深度学习 | 核心概念】那些深度学习路上必经的核心概念,确定不来看看?(二)

在这里插入图片描述

🤵‍♂️ 个人主页: @AI_magician
📡主页地址: 作者简介:CSDN内容合伙人,全栈领域优质创作者。
👨‍💻景愿:旨在于能和更多的热爱计算机的伙伴一起成长!!🐱‍🏍
🙋‍♂️声明:本人目前大学就读于大二,研究兴趣方向人工智能&硬件(虽然硬件还没开始玩,但一直很感兴趣!希望大佬带带)

在这里插入图片描述

【深度学习 | 核心概念】那些深度学习路上必经的核心概念,确定不来看看? (二)
作者: 计算机魔术师
版本: 1.0 ( 2023.8.30 )

摘要: 本系列旨在普及那些深度学习路上必经的核心概念,文章内容都是博主用心学习收集所写,欢迎大家三联支持!本系列会一直更新,核心概念系列会一直更新!欢迎大家订阅

该文章收录专栏
[✨— 《深入解析机器学习:从原理到应用的全面指南》 —✨]

One-vs-One & One-vs-Rest

实际上,一对一(One-vs-One)策略和一对多(One-vs-Rest)策略在解释性方面没有明显的差异。这两种策略都是将多分类问题转化为多个二分类子问题,只是转化的方式不同。

在一对一策略中,每个子问题都是将一个类别与另一个类别进行区分。例如,对于一个有5个类别的问题,一对一策略将生成10个二分类子问题,每个子问题都是将一个类别与另一个类别进行区分。最后,通过投票或其他集成方法来确定最终的类别。

当使用一对一策略解决一个有5个类别的多分类问题时,我们可以通过以下步骤来确定最终的类别:

  1. 数据准备:假设我们有一个数据集,其中包含多个样本和它们对应的类别标签。每个样本都有一组特征,用于描述该样本。
  2. 子问题生成:使用一对一策略,我们将生成10个二分类子问题。对于每个子问题,我们选择一个类别作为正例,另一个类别作为负例。例如,我们可以选择将类别1与类别2进行区分,然后将类别1与类别3进行区分,以此类推,直到将类别4与类别5进行区分。
  3. 训练分类器:对于每个子问题,我们使用训练数据集来训练一个二分类器。这可以是任何二分类算法,如逻辑回归、支持向量机或决策树。训练过程中,我们使用与当前子问题相关的正例和负例样本。
  4. 预测:对于每个子问题,我们使用训练好的分类器来对测试样本进行预测。预测结果可以是二分类标签(正例或负例)或概率值。
  5. 投票或集成:在所有子问题的预测结果中,我们可以使用投票或其他集成方法来确定最终的类别。例如,我们可以对每个类别进行计数,然后选择得票最多的类别作为最终的类别。如果有多个类别得票数相同,可以使用其他规则来解决冲突,如选择概率值最高的类别

通过这个过程,我们可以将多分类问题转化为多个二分类子问题,并通过投票或集成方法来确定最终的类别。这种方法可以提供一种简单而有效的方式来解决多分类问题。

在一对多策略中,每个子问题都是将一个类别与其他所有类别进行区分。例如,对于一个有5个类别的问题,一对多策略将生成5个二分类子问题,每个子问题都是将一个类别与其他所有类别进行区分。最后,选择具有最高概率的类别作为最终的类别

从解释性的角度来看,一对一策略可能稍微更容易理解,因为每个子问题都是将一个类别与另一个类别进行区分。然而,一对多策略也可以提供类似的解释性,因为它仍然可以解释为将一个类别与其他所有类别进行区分。

总的来说,一对一策略和一对多策略在解释性方面没有明显的差异,选择哪种策略取决于具体的问题和数据集。

容忍度(tolerance)

在机器学习中,容忍度(tolerance)是指模型对于训练数据中的噪声和不完美标记的容忍程度。它可以用来衡量模型对训练数据中的错误或异常值的敏感性

当我们使用算法来构建一个机器学习模型时,我们通常会给定一组输入特征(features)和相应的目标变量(target variable),并通过优化算法去拟合这些数据。然而,在实际应用中,训练数据可能会包含一些错误、异常值或者标签不准确的样本。

容忍度参数允许我们控制模型对这些噪声和不完美标记的反应程度。较高的容忍度意味着模型更加灵活,并能够适应更多种类的噪声;而较低的容忍度则表示模型更加严格地遵循原始数据,并试图尽可能准确地拟合每个样本。(这种情况需要每个样本都有着高质量)

例如,在支持向量机(Support Vector Machine)算法中,我们可以使用容忍度参数C来平衡正确分类样本数量与允许错误分类样本数量之间的权衡。较小的C值将导致更多错误分类被接受,使得决策边界具有更大弯曲性;而较大的C值将强制模型更加严格地进行分类,可能导致过拟合。(泛化效果

容忍度的选择需要根据具体问题和数据集来决定。如果训练数据中存在较多噪声或标记不准确的样本,可以使用较高的容忍度;如果希望模型尽量正确地拟合每个样本,则可以选择较低的容忍度

多输出分类 & 多输出多分类

多输出分类

多输出多分类问题在实际应用中非常常见。下面是一些具体的应用场景(一个样本分为多个小类别):

  1. 图像标注:给定一张图片,需要对其中的对象进行多个标签的分类,例如识别图像中的人、车辆和建筑等。

  2. 自然语言处理(NLP):在文本分类任务中,可能需要同时预测文档的主题、情感倾向和情绪状态等多个方面。

  3. 音频分析:音频信号可以被分为不同类别,比如音乐类型、说话者性别和语言等

  4. 多模态任务:当涉及到结合不同类型数据时,如图像与文本或视频与声音之间,在每个模态上都有一个或多个输出变量来完成任务。

  5. 医学影像诊断:医学领域中经常使用机器学习技术进行疾病诊断。在这种情况下,可能需要根据医学影像数据同时预测患者是否患有某种疾病以及该疾病所属的具体类型。

以上只是一些例子,并且实际应用场景非常广泛。对于这类问题,MLP等神经网络架构通常能够提供强大而灵活的建模能力,并且适合处理复杂关系和多个输出变量之间的相关性。

希望这些具体的应用场景能够帮助你理解多输出多分类问题在实际中的应用!

多输出多分类

多分类多输出问题在现实生活中有很多应用场景。以下是一些常见的例子(就是在大分类后的情况下再次通过多输出小分类):

  1. 图像识别:在图像识别任务中,我们可能需要将输入图像分为多个类别,并同时预测每个类别的相关属性。例如,在人脸识别中,我们可能需要将人脸进行分类(男性/女性、年龄等),并预测额外的属性(眼镜、帽子等)

  2. 自然语言处理:在自然语言处理任务中,我们经常面临着将文本分类到不同的类别,并根据需求生成相应的输出。例如,在情感分析中,我们可以使用模型对文本进行情感分类(积极/消极),并进一步生成对特定方面或主题的评论。

  3. 多标签文本分类:某些情况下,一个样本可能属于多个标签类别。比如新闻文章可以被归入多个主题(政治、体育、娱乐等)。这种情况下就需要使用多标签分类算法来解决此问题。

  4. 推荐系统:推荐系统通常会针对用户提供与其兴趣和偏好相关联的项目或商品。这涉及到将项目划分到不同的类别,并根据用户历史数据进行个性化推荐。

总之,当涉及到同时对多个输出进行分类或预测时,多分类多输出问题就变得非常有用。这种类型的问题可以帮助我们更好地理解和处理复杂的现实世界数据。在这里插入图片描述

						  🤞到这里,如果还有什么疑问🤞
					🎩欢迎私信博主问题哦,博主会尽自己能力为你解答疑惑的!🎩
					 	 🥳如果对你有帮助,你的赞是对博主最大的支持!!🥳

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/96578.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[JDK8下的HashMap类应用及源码分析] 数据结构、哈希碰撞、链表变红黑树

系列文章目录 [Java基础] StringBuffer 和 StringBuilder 类应用及源码分析 [Java基础] 数组应用及源码分析 [Java基础] String,分析内存地址,源码 [JDK8环境下的HashMap类应用及源码分析] 第一篇 空构造函数初始化 [JDK8环境下的HashMap类应用及源码分…

LeetCode-160. 相交链表

这是一道真的非常巧妙的题,题解思路如下: 如果让他们尾端队齐,那么从后面遍历就会很快找到第一个相交的点。但是逆序很麻烦。 于是有一个巧妙的思路诞生了,如果让短的先走完自己的再走长的,长的走完走短的,…

关于商品活动的H5页面技术总结

背景 在单个html文件里面使用vue3、jquery等其他第三方js库,实现规定的页面效果,其中主要功能是从商品json数据中读取数据,然后可以通过搜索框、下拉框、左侧菜单来筛选商户信息。 页面布局 技术要点: 1、通过路由来进行页面布…

Visual Studio 2022的MFC框架——AfxWinMain全局对象和InitInstance函数

我是荔园微风,作为一名在IT界整整25年的老兵,今天我们来重新审视一下Visual Studio 2022下开发工具的MFC框架知识。 在看这篇帖子前,请先看我的另一篇帖子《Visual Studio 2022的MFC框架——应用程序向导》。 当程序调用了CWinApp类的构造…

goroutine的一点东西

前面的两篇,从相对比较简单的锁的内容入手(也是干货满满),开始了go的系列。这篇开始,进入更核心的内容。我们知道,go应该是第一门在语言层面支持协程的编程语言(可能是我孤陋寡闻),goroutine也完全算的上是go的门面。g…

VBA技术资料MF50:VBA_在Excel中突出显示前3个值

【分享成果,随喜正能量】人受到尊重,不是因为权钱,而是他骨子里透出的,正直与善良。。 我给VBA的定义:VBA是个人小型自动化处理的有效工具。利用好了,可以大大提高自己的工作效率,而且可以提高…

记录--怎么实现一个3d翻书效果

这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助 本篇主要讨论以下两种翻书动画的实现: 第一种是整页翻转的效果: 这种整页翻转的效果主要是做rotateY的动画,并结合一些CSS的3d属性实现。 第二种折线翻转的效果&…

ACM模式数组构建二叉树Go语言实现

目的 想输入一个数组,然后构造二叉树 例如数组为[6, 2, 8, 0, 4, 7, 9, -1, -1, 3, 5] 对应的二叉树为: 参考资料 ACM模式数组构建二叉树 重点:如果父节点的数组下标是i,那么它的左孩子下标就是i*21,右孩子下标就是…

生产环境部署与协同开发 Git

目录 一、前言——Git概述 1.1 Git是什么 1.2 为什么要使用Git 什么是版本控制系统 1.3 Git和SVN对比 SVN集中式 Git分布式 1.4 Git工作流程 四个工作区域 工作流程 1.5 Git下载安装 1.6 环境配置 设置用户信息 查看配置信息 二、git基础 2.1 本地初始化仓库 ​编辑…

opencv 进阶20-随机森林示例

OpenCV中的随机森林是一种强大的机器学习算法,旨在解决分类和回归问题。随机森林使用多个决策树来进行预测,每个决策树都是由随机选择的样本和特征组成的。在分类问题中,随机森林通过投票来确定最终的类别;在回归问题中&#xff0…

AE2018 安装过程

双击打开安装包,大概等五分钟后。 出现下边安装界面。 安装成功。 可以将图标发送到桌面快捷方式。

MySQL内容及原理记录

原理篇 架构、索引、事务、锁、日志、性能调优 高可用 读写分离、分库分表、分布式ID、高可用、分布式数据库、分布式事务、分布式锁 架构 1 执行一条 SQL 查询语句,期间发生了什么? (1)连接器:客户端通过连接器…

sql server 备份到网络共享

场景:sql server服务器A将数据库备份文件备份到服务器B 1)服务器B创建共享目录 这里我将 D:\ProDbBak 共享,并且Everyone完全控制 2)sql server服务器A能够访问服务器B共享目录,并且能完全控制 3)修改服务…

Kotlin学习之密封类

Kotlin中的密封类: kotlin中的密封类,用关键词Sealed修饰,且还有一个规定:Sealed类的子类应该是Sealed类的嵌套类,或者应该在与Sealed类相同的文件中声明。 当我们想定义一个有相同父类,但是有不同子类的时候&#xf…

C语言每日一练------Day(10)

本专栏为c语言练习专栏,适合刚刚学完c语言的初学者。本专栏每天会不定时更新,通过每天练习,进一步对c语言的重难点知识进行更深入的学习。 今日练习题关键字:自除数 除自身以外数组的乘积 💓博主csdn个人主页&#xff…

K8s简介之什么是K8s

目录 1.概述 2.什么是容器引擎? 3.什么是容器 4.什么是容器编排? 5.容器编排工具 6.到底什么是K8s? 7.为什么市场推荐K8s 8.K8s架构 9.K8s组件 Pods API 服务器 调度器 控制器管理器 Etcd 节点 Kubelet Kube代理 Kubectl 1.概述 Kub…

Mac“其他文件”存放着什么?“其他文件”的清理方法

很多Mac用户在清理磁盘空间时发现,内存占用比例比较大的除了有iCloud云盘、应用程序、影片、音频、照片等项目之外,还有一个“其他文件”的项目磁盘占用比也非常大,想要清理却无从下手。那么Mac“其他文件”里存放的是什么文件?我…

【HSPCIE仿真】输入网表文件(5)基本仿真输出

仿真输出 1. 概述1.1 输出变量1.2 输出分析类型 2. 显示仿真结果2.1 .print语句基本语法示例 2.2 .probe 语句基本语法示例 2.3 子电路的输出2.4 打印控制选项.option probe.option post.option list.option ingold 2.5 .model_info打印模型参数 3. 仿真输出参数的选择3.1 直流…

SQL语法与DDL语句的使用

文章目录 前言一、SQL通用语法二、DDL语句1、DDL功能介绍2、DDL语句对数据库操作(1)查询所有数据库(2)查询当前数据库(3)创建数据库(4)删除数据库(5)切换数据…