机器学习常用术语

目录

概要

机器学习常用术语

1、模型

2、数据集

3、样本与特征

4、向量

5、矩阵

6、假设函数与损失函数

7、拟合、过拟合与欠拟合

8、激活函数(Activation Function)

9、反向传播(Backpropagation)

10、基线(Baseline)

11、批量(Batch)

12、批量大小(Batch Size)

13、二元分类器(Binary Classification)

14、标定层(Calibration Layer)

15、候选采样(Candidate Sampling)

16、检查点(Checkpoint)

17、类别(Class)

18、类别不平衡数据集(Class-Imbalanced Data Set)

19、分类模型(Classification)

20、分类阈值(Classification Threshold)

21、混淆矩阵(Confusion Matrix)

22、连续特征(Continuous Feature)

23、收敛(Convergence)

24、凸函数(Convex Function)

25、交叉熵(Cross-Entropy)

26、数据集(Data Set)

27、决策边界(Decision Boundary)

28、深度模型(Deep Model)

29、密集特征(Dense Feature)

30、Dropout正则化(Dropout Regularization)

31、动态模型(Dynamic Model)

32、早期停止法(Early Stopping)

33、嵌入(Embeddings)

34、集成(Ensemble)

35、评估器(Estimator)

36、样本(Example)

37、假负类(False Negative,FN)

38、假正类(False Positive,FP)

39、假正类率(False Positive Rate,FP率)

40、特征列(Feature Columns)

41、特征集(Feature Set)

42、特征定义(Feature Spec)

43、泛化(Generalization)

44、广义线性模型(Generalized Linear Model)

45、梯度(Gradient)

46、梯度截断(Gradient Clipping)

47、梯度下降(Gradient Descent)

48、图(Graph)


概要

机器学习有很多陌生的词汇,有必要对这些常用术语词汇进行一定的了解。

资料来源:《机器学习实战(视频教学版)》迟殿委 王培进 王兴平著 2024-04出版

机器学习常用术语

1、模型

模型可以把它看作一个“魔法盒”​,我们向它许愿(输入数据)​,它就会帮我们实现愿望(输出预测结果)​。整个机器学习的过程都将围绕模型展开,训练出一个最优质的“魔法盒”​,它可以尽量精准地实现我们许的“愿望”​,这就是机器学习的目标。

2、数据集

数据集,表示一个承载数据的集合。如果说“模型”是“魔法盒”​,那么数据集就是负责给它充电的“能量电池”​。简单地说,如果缺少了数据集,那么模型就没有存在的意义了。数据集可划分为“训练集”和“测试集”​,它们分别在机器学习的“训练阶段”和“预测输出阶段”起着重要的作用。

3、样本与特征

样本指的是数据集中的数据,一条数据被称为“一个样本”​。通常情况下,样本会包含多个特征值,用来描述数据,特征值也可以理解为数据的相关性,每一列的数据都与这一列的特征值相关。

4、向量

向量也称欧几里得向量、几何向量、矢量,指具有大小和方向的量。可以形象地把它理解为带箭头的线段,箭头代表向量的方向,线段长度代表向量的大小。与向量对应的量叫作数量(物理学中称标量)​,数量只有大小,没有方向。

在机器学习中,模型算法的运算均基于线性代数运算法则,例如行列式、矩阵运算、线性方程等。

数据集中的每一个样本都是一条具有向量形式的数据

5、矩阵

矩阵可以把它看作由向量组成的二维数组。数据集就是以二维矩阵的形式存储数据的,可以把它形象地理解为电子表格,​“一行一样本,一列一特征”​。

6、假设函数与损失函数

假设函数(Hypothesis Function)和损失函数(Loss Function)

假设函数可表述为y=f(x),其中x表示输入数据,y表示输出的预测结果,而这个结果需要不断地优化才会达到预期的结果,否则会与实际值偏差较大。

损失函数又叫目标函数,简写为L(x)。这个L(x)的值是假设函数得出的预测结果y,如果L(x)的返回值越大,就表示预测结果与实际偏差越大;如果L(x)的返回值越小,则证明预测值越来越“逼近”真实值,这才是机器学习最终的目的。损失函数就像一个度量尺,让我们知道“假设函数”预测结果的优劣,从而做出相应的优化策略。

“优化方法”可以理解为假设函数和损失函数之间的沟通桥梁。通过L(x)可以得知假设函数输出的预测结果与实际值的偏差值,当该值较大时,就需要做出相应的调整,这个调整的过程叫作“参数优化”​。而如何实现优化呢?有梯度下降、牛顿法与拟牛顿法、共轭梯度法等。

7、拟合、过拟合与欠拟合

拟合”就是把平面坐标系中一系列散落的点,用一条光滑的曲线连接起来,因此拟合也被称为“曲线拟合”​。拟合的曲线一般用函数来表示,但是由于拟合曲线会存在许多种连接方式,因此就会出现多种拟合函数。

过拟合,就是模型的泛化能力较差,也就是过拟合的模型在训练样本中表现优越,但是在验证数据以及测试数据集中表现不佳。过拟合问题主要是因为训练时样本过少、特征值过多导致的。

欠拟合(Underfitting)恰好与过拟合相反,它指的是“曲线”不能很好地“拟合“数据。在训练和测试阶段,欠拟合模型表现均较差,无法输出理想的预测结果。造成欠拟合的主要原因是没有选择好合适的特征值。

欠拟合和过拟合是机器学习中会遇到的问题,这两种情况都不是我们期望看到的,因此要避免。

8、激活函数(Activation Function)

激活函数(例如ReLU或Sigmoid)将前一层所有神经元激活值的加权和输入一个非线性函数中,然后向下一层传递该函数的输出值(典型的非线性)​。

9、反向传播(Backpropagation)

反向传播算法是神经网络中完成梯度下降的重要算法。首先,在前向传播的过程中计算每个节点的输出值;然后,在反向传播的过程中计算与每个参数对应的误差的偏导数

10、基线(Baseline)

基线是指用作比较参考的简单模型,它帮助模型开发者量化模型在特定问题上的预期表现

11、批量(Batch)

批量是指模型训练中一个迭代(指一次梯度更新)所使用的样本集。

12、批量大小(Batch Size)

批量大小指一个批量中样本的数量。批量大小通常在训练与推理的过程中确定,但是TensorFlow框架不允许动态更改批量大小。

13、二元分类器(Binary Classification)

二元分类器输出两个互斥(不相交)类别中的一个。

14、标定层(Calibration Layer)

标定层是一种调整后期预测的结构,通常用于解释预测偏差。调整后的预期和概率必须匹配一个观察标签集的分布。

15、候选采样(Candidate Sampling)

候选采样是一种在训练时进行的优化方法,使用Softmax等算法计算所有正标签的概率,同时只计算一些随机取样的负标签的概率

16、检查点(Checkpoint)

检查点指在特定时刻标记模型变量的状态的数据。检查点允许输出模型的权重,也允许通过多个阶段训练模型。检查点还允许跳过错误继续进行(例如,抢占作业)​。注意,模型自身的图式并不包含于检查点内。

17、类别(Class)

所有同类属性的目标值作为一个标签

18、类别不平衡数据集(Class-Imbalanced Data Set)

数据集样本类别极不平衡,一般针对二元分类问题,表示两个类别的标签的分布频率有很大的差异。

19、分类模型(Classification)

机器学习模型的一种,将数据分离为两个或多个离散类别。分类模型与回归模型(Regression Model)成对比。

20、分类阈值(Classification Threshold)

分类阈值指应用于模型的预测分数以分离正类别和负类别的一种标量值标准。当需要将逻辑回归的结果映射到二元分类模型中时,就需要使用分类阈值。

21、混淆矩阵(Confusion Matrix)

混淆矩阵指总结分类模型的预测结果的表现水平(即标签和模型分类的匹配程度)的NN×维表格。混淆矩阵的一个轴列出模型预测的标签,另一个轴列出实际的标签。N表示类别的数量。

22、连续特征(Continuous Feature)

连续特征拥有无限个取值点的浮点特征。和离散特征(Discrete Feature)相反

23、收敛(Convergence)

训练过程达到的某种状态,其中训练损失和验证损失在经过确定的迭代次数后,在每一次迭代中改变很小或完全不变。换句话说,当对当前数据继续训练而无法再提升模型的表现水平的时候,就称模型已经收敛。在深度学习中,损失值在下降之前,有时候经过多次迭代仍保持常量或者接近常量,就会造成模型已经收敛的错觉。

24、凸函数(Convex Function)

一种形状大致呈字母U形或碗形的函数。但是,在退化情形中,凸函数的形状就像一条线

25、交叉熵(Cross-Entropy)

多类别分类问题中对Log损失函数的推广。交叉熵量化两个概率分布之间的区别

26、数据集(Data Set)

样本的集合。

27、决策边界(Decision Boundary)

在一个二元分类或多类别分类问题中,模型学习的类别之间的分离器

28、深度模型(Deep Model)

一种包含多个隐藏层的神经网络。深度模型依赖于其可训练的非线性性质。和宽度模型(Wide Model)对照

29、密集特征(Dense Feature)

大多数取值为非零的一种特征,通常用取浮点值的张量(Tensor)表示。和稀疏特征(Sparse Feature)相反。

30、Dropout正则化(Dropout Regularization)

训练神经网络时一种有用的正则化方法。Dropout正则化的过程是在单次梯度计算中删去一层网络中随机选取的固定数量的单元。删去的单元越多,正则化越强

31、动态模型(Dynamic Model)

动态模型是一种以连续更新的方式在线训练的模型,即数据连续不断地输入模型

32、早期停止法(Early Stopping)

一种正则化方法,在训练损失完成下降之前停止模型训练过程。当验证数据集(Validation Data Set)的损失开始上升的时候,即泛化表现变差的时候,就应该使用早期停止法。

33、嵌入(Embeddings)

一类表示为连续值特征的明确的特征。嵌入通常指将高维向量转换到低维空间中

34、集成(Ensemble)

多个模型预测的综合考虑

35、评估器(Estimator)

评估器是一种封装了各种机器学习模型的工具,是拟合和训练数据的机器学习算法或者其他算法的抽象。

36、样本(Example)

一个数据集的一行内容。一个样本包含了一个或多个特征,也可能是一个标签。标注样本(Labeled Example)和无标注样本(Unlabeled Example)

37、假负类(False Negative,FN)

被模型错误预测为负类的样本。例如,模型推断一封邮件为非垃圾邮件(负类)​,但实际上这封邮件是垃圾邮件。

38、假正类(False Positive,FP)

被模型错误预测为正类的样本。例如,模型推断一封邮件为垃圾邮件(正类)​,但实际上这封邮件是非垃圾邮件

39、假正类率(False Positive Rate,FP率)

ROC曲线中的x轴。FP率的计算公式是:假正率=假正类数/(假正类数+真负类数)​。

40、特征列(Feature Columns)

具有相关性的特征的集合,例如用户可能居住的所有国家的集合。一个样本的一个特征列中可能会有一个或者多个特征。

41、特征集(Feature Set)

特征集指机器学习模型训练的时候使用的特征群。例如,邮政编码、面积要求和物业状况等,可以组成一个简单的特征集,使模型能预测房价。

42、特征定义(Feature Spec)

特征指的是描述一个实例的属性或特征,也可以称为自变量(independentvariable)或输入变量(input variable)

43、泛化(Generalization)

泛化是指模型利用新的没见过的数据而不是训练数据做出正确预测的能力

44、广义线性模型(Generalized Linear Model)

广义线性模型是线性模型的扩展,通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系

45、梯度(Gradient)

梯度是模型函数的偏导数向量。梯度指向最陡峭的上升路线

46、梯度截断(Gradient Clipping)

 在应用梯度之前先修饰数值,梯度截断有助于确保数值稳定性,防止梯度爆炸出现。

47、梯度下降(Gradient Descent)

梯度下降通过计算模型的相关参数和损失函数的梯度来最小化损失,值取决于训练数据。梯度下降迭代地调整参量,逐渐靠近权重和偏置的最佳组合,从而最小化损失函数

48、图(Graph)

图是由节点(Node)和边(Edge)组成的一种数据结构,用于描述事物之间的关系。图近来正逐渐变成机器学习的一大核心领域,例如,可以通过图来预测潜在的连接,从而理解社交网络的结构、检测欺诈、理解汽车租赁服务的消费者行为,或者进行实时推荐。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/942295.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

nest 学习3

学习小册(nest通关秘籍) 邮箱验证码登陆 流程图: 邮箱作为key,生成随机验证码,然后放到redis中。调用邮箱api发送邮箱。 前端获取到code后,将验证码输入传给后端,后端根据邮箱取出redis数据,比对验证码&…

原点安全再次入选信通院 2024 大数据“星河”案例

近日,中国信息通信研究院和中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同组织开展的 2024 大数据“星河(Galaxy)”案例征集活动结果正式公布。由工银瑞信基金管理有限公司、北京原点数安科技有限公司联…

RabbitMQ 的7种工作模式

RabbitMQ 共提供了7种⼯作模式,进⾏消息传递,. 官⽅⽂档:RabbitMQ Tutorials | RabbitMQ 1.Simple(简单模式) P:⽣产者,也就是要发送消息的程序 C:消费者,消息的接收者 Queue:消息队列,图中⻩⾊背景部分.类似⼀个邮箱,可以缓存消息;⽣产者向其中投递消息,消费者从其中取出消息…

Restaurants WebAPI(四)——Identity

文章目录 项目地址一、Authentication(身份认证)1.1 配置环境(解决类库包无法引用)1.2 使用Authentication控制Controller的访问1.3 获取User的Context1.3.1 在Application下创建User文件夹1. 创建User.cs record类封装角色信息2. 创建UserContext.cs提供…

010 Qt_输入类控件(LineEdit、TextEdit、ComboBox、SpinBox、DateTimeEdit、Dial、Slider)

文章目录 前言一、QLineEdit1.简介2.常见属性及说明3.重要信号及说明4.示例一:用户登录界面5.示例二:验证两次输入的密码是否一致显示密码 二、TextEdit1.简介2.常见属性及说明3.重要信号及说明4.示例一:获取多行输入框的内容5.示例二&#x…

Vue3:uv-upload图片上传

效果图&#xff1a; 参考文档&#xff1a; Upload 上传 | 我的资料管理-uv-ui 是全面兼容vue32、nvue、app、h5、小程序等多端的uni-app生态框架 (uvui.cn) 代码&#xff1a; <view class"greenBtn_zw2" click"handleAddGroup">添加班级群</vie…

通过Docker Compose来实现项目可以指定读取不同环境的yml包

通过Docker Compose来实现项目可以指定读取不同环境的yml包 1. 配置文件2. 启动命令 切换不同环境注意挂载的文件权限要777 1. 配置文件 version: 3.8 services:docker-test:image: openjdk:8-jdk-alpineports:- "${APP_PORT}:${CONTAINER_PORT}"volumes:- "${J…

华为实训课笔记 2024 1223-1224

华为实训 12/2312/24 12/23 [Huawei]stp enable --开启STP display stp brief --查询STP MSTID Port Role STP State Protection 实例ID 端口 端口角色 端口状态 是否开启保护[Huawei]display stp vlan xxxx --查询制定vlan的生成树计算结…

GitCode 光引计划投稿 | GoIoT:开源分布式物联网开发平台

GoIoT 是基于Gin 的开源分布式物联网&#xff08;IoT&#xff09;开发平台&#xff0c;用于快速开发&#xff0c;部署物联设备接入项目&#xff0c;是一套涵盖数据生产、数据使用和数据展示的解决方案。 GoIoT 开发平台&#xff0c;它是一个企业级物联网平台解决方案&#xff…

EasyGBS国标GB28181公网平台P2P远程访问故障诊断:云端服务端排查指南

随着信息技术的飞速发展&#xff0c;视频监控领域正经历从传统安防向智能化、网络化安防的深刻转变。EasyGBS平台&#xff0c;作为基于国标GB28181协议的视频流媒体平台&#xff0c;为用户提供了强大的视频监控直播功能。然而&#xff0c;在实际应用中&#xff0c;P2P远程访问可…

Vnlhun靶场Log4j2漏洞

相关概念 log4j2是Apache的⼀个java日志框架&#xff0c;我们借助它进行日志相关操作管理&#xff0c;然而在2021年末log4j2爆出了远程代码执行漏洞&#xff0c;属于严重等级的漏洞 漏洞原理 简单说就是当你使⽤log4j2中提供的⽅法去输出⽇志信息时&#xff0c;⽐如说最常⻅…

千兆网中的gmii与rgmii

物理链路上是千兆网。1 Gbps1000 Mb/s1000/8 MB/s125 MB/s&#xff0c;这是和你的测试设备相连的1 Gbps物理带宽下的极速。关键点是1 B&#xff08;byte&#xff09;8 b&#xff08;bit&#xff09;。实际下载速度还取决于下载源的限制、出口的物理链路和运营商的限制。

2024-12-24 NO1. XR Interaction ToolKit 环境配置

文章目录 1 软件配置2 安装 XRToolKit3 配置 OpenXR4 安装示例场景5 运行测试 1 软件配置 Unity 版本&#xff1a;Unity6000.0.26 ​ 2 安装 XRToolKit 创建新项目&#xff08;URP 3D&#xff09;&#xff0c;点击进入 Asset Store。 进入“Unity Registry”页签&#xff0…

重温设计模式--外观模式

文章目录 外观模式&#xff08;Facade Pattern&#xff09;概述定义 外观模式UML图作用 外观模式的结构C 代码示例1C代码示例2总结 外观模式&#xff08;Facade Pattern&#xff09;概述 定义 外观模式是一种结构型设计模式&#xff0c;它为子系统中的一组接口提供了一个统一…

【恶意软件检测】一种基于API语义提取的Android恶意软件检测方法(期刊等级:CCF-B、Q2)

一种基于API语义提取的Android恶意软件检测方法 A novel Android malware detection method with API semantics extraction 摘要 由于Android框架和恶意软件的持续演变&#xff0c;使用过时应用程序训练的传统恶意软件检测方法在有效识别复杂演化的恶意软件方面已显不足。为…

【微信小程序】2|轮播图 | 我的咖啡店-综合实训

轮播图 引言 在微信小程序中&#xff0c;轮播图是一种常见的用户界面元素&#xff0c;用于展示广告、产品图片等。本文将通过“我的咖啡店”小程序的轮播图实现&#xff0c;详细介绍如何在微信小程序中创建和管理轮播图。 轮播图数据准备 首先&#xff0c;在home.js文件中&a…

RT-DETR学习笔记(2)

七、IOU-aware query selection 下图是原始DETR。content query 是初始化为0的label embedding, position query 是通过nn.Embedding初始化的一个嵌入矩阵&#xff0c;这两部分没有任何的先验信息&#xff0c;导致DETR的收敛慢。 RT-DETR则提出要给这两部分&#xff08;conten…

fpgafor循环语句使用

genvar i;//循环变量名称 generate for(i0;i<4;ii1)begin:tx//自己定义名称 //循环内容 end endgenerate12位的16进制乘以4就是48位位宽的2进制 因为 222*2(2^4)16

62.基于SpringBoot + Vue实现的前后端分离-驾校预约学习系统(项目+论文)

项目介绍 伴随着信息技术与互联网技术的不断发展&#xff0c;人们进到了一个新的信息化时代&#xff0c;传统管理技术性没法高效率、容易地管理信息内容。为了实现时代的发展必须&#xff0c;提升管理高效率&#xff0c;各种各样管理管理体系应时而生&#xff0c;各个领域陆续进…

网站灰度发布?Tomcat的8005、8009、8080三个端口的作用什么是CDNLVS、Nginx和Haproxy的优缺点服务器无法开机时

前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c; 忍不住分享一下给大家。点击跳转到网站 学习总结 1、掌握 JAVA入门到进阶知识(持续写作中……&#xff09; 2、学会Oracle数据库入门到入土用法(创作中……&#xff09; 3、手把…