【小白学机器学习5】MSE, RMSE,MAE, MAPE, WMAPE

目录

1 评价误差的各种度量指标

2 从误差的评价开始捋这个问题

2.1 误差问题的由来:回归模型预测值和真实值的差距

2.2 如何评价某函数的预测值是否足够好? 如何比较不同的预测函数的预测值的好坏呢?

2.3 最小二乘法:应该叫最小乘方法

2.3.1 最小二乘法

2.3.2 插播知识: 什么是范式和L1,L2范式

3 评价误差的各种标准

3.1 MSE 均方差损失( Mean Squared Error Loss)

3.1.1 计算公式

3.1.2 图形推导

3.13  MSE的特点

3.2 RMSE

3.3 MAE

3.3.1 L1 loss

3.3.2 计算公式

3.4.3 图形推导

3.4.4 MAE的特点

3.4 MAPE

3.4 WMAPE

3.6 R^2

参考文档


1 评价误差的各种度量指标

     评价误差有各种指标,那么什么时候应该用什么指标合适?要搞清楚这个,必须先了解每个指标的具体公式,意义,使用的差别。

     这些评价指标里最经典方法就是,最小二乘法。从最小二乘这个评价标准开端,又衍生了各种各有优劣的评价方法和指标。

  • 最小二乘法:Σ(Y-f(xi))**2
  • MSE
  • RMSE
  • MAE
  • MAPE
  • WMAPE
  • R**2
  • 等等

2 从误差的评价开始捋这个问题

误差的由来,我们评价的是什么误差

2.1 误差问题的由来:回归模型预测值和真实值的差距

  • step1: 假设我们有自变量X,因变量Y。
    • 这个自变量是x是,我们观测Y的依据,也是客观可记录的
    • 而因变量Y是我们从自然界进行观测而记录下来的客观的值。
    • 比如我们记录从1号到30号(日期是x)每天的温度(问题是Y)
  • step2: 我们经过计算和模拟得到模拟函数/预测函数 f(X)
  • step3: 然后我们用预测函数 f(X) 去模拟Y
    • 因为试图根据折30天的温度数据,去预测第31天的温度
    • 因此我们会模拟一个直线/曲线出来,但是这条线和前30天温度的散点图肯定是不完全匹配的,因此会产生误差。
  • step4: 但是预测函数和真实值之间一定是有误差的,Y=f(X)+ ε
  • step5: 那么如何评价不同的曲线Y=f(X)+ ε

2.2 如何评价某函数的预测值是否足够好? 如何比较不同的预测函数的预测值的好坏呢?

  • 真实值:只存在理想中,主观的
  • 观测值 :Y,客观存在的
  • 预测值: Y^=f(x) ,对应每一个观测值,理论上只存在一个预测值。
  • 但是,因为我们可能做多个模拟模型,有多个模拟函数/曲线,我们因此会有多个预测值,我们还需要比较不同模型的预测值Y^,哪个更好。
  • 预测值:Y^=f(x) ,对应每一个真实值,对应的预测值根据预测函数可做出多个
  • 然后现在怎么判断,预测值是否准确呢?
  • 就到了最小二乘法了。

2.3 最小二乘法:应该叫最小乘方法

2.3.1 最小二乘法

最小二乘法:应该叫最小乘方法,二乘就是指平方!这个名字不直观,很容易误导我这样的新手。

最小二乘法误差=Σ(Y-f(xi))**2

2.3.2 插播知识: 什么是范式和L1,L2范式

  • 简单的理解,范式就是距离
  • L1 范式距离,就是 |y1-y2|
  • L2 范式距离,就是 (y1-y2)**2
  • 以下类推
  • 像我现在的水平,暂时了解到这么多即可。

3 评价误差的各种标准

从最小二乘这个评价标准开端,又衍生了各种各有优劣的评价方法和指标

  • 最小二乘法误差=Σ(Y-f(xi))**2
  • MSE
  • RMSE
  • MAE
  • MAPE
  • WMAPE

3.1 MSE 均方差损失( Mean Squared Error Loss)

  • MSE 均方差损失( Mean Squared Error Loss)
  • L2范式误差
  • L2 loss

3.1.1 计算公式

  • MSE,均方误差
  • MSE=Σ(Y-f(Xi))**2/i ,i=1~n
  • MSE=最小二乘误差/n

3.1.2 图形推导

推导

  • MSE=Σ(y^-y)^2/n
  • 这个函数的抽象化
  • MSE=y=f(x)
  • MSE=y=f(x)=f(x^2)

  • 这个图形是个二次曲线,有最小值
  • 范围[0,+∞),当预测值与真实值完全相同时为0,误差越大,该值越大
  • MSE 曲线的特点是光滑连续、可导,便于使用梯度下降算法,是比较常用的一种损失函数。
  • 而且,MSE 随着误差的减小,梯度也在减小,这有利于函数的收敛

3.13  MSE的特点

  • 不同商品真实值量纲上的差别带来的MSE结果波动大
  • 极端值的影响,可以平衡
  • [0,1] 误差越小,平方值的MSE会越小
  • [1,∞] 误差越大,平方值的MSE会越大,惩罚性的把误差越大
  • 不够直观(平方之后含义不好解释)

  • 其中,y^为预测值,y为真实值。
  • 对每期预测值和实际值的差值进行平方,然后再对多期差值的平方取平均值,得到平均均方误差。
  • 平方的好处是放大极端误差:对误差进行平方,就是加倍“惩罚”那些极端误差,凸显那些极端虚高或虚低的预测值,也是我们应该重点避免的对象。
  • 选择预测方法时,要尽量避免产生大错特错、极端误差的预测模型,用均方误差来量化预测准确度,能较好地排除这样的模型。

  • 平方误差有个特性,就是当 yi 与 f(xi) 的差值大于 1 时,会增大其误差;
  • 当 yi 与 f(xi) 的差值小于 1 时,会减小其误差。这是由平方的特性决定的。
  • 也就是说, MSE 会对误差较大(>1)的情况给予更大的惩罚,对误差较小(<1)的情况给予更小的惩罚。
  • 从训练的角度来看,模型会更加偏向于惩罚较大的点,赋予其更大的权重。
  • 如果样本中存在离群点,MSE 会给离群点赋予更高的权重,但是却是以牺牲其他正常数据点的预测效果为代价,这最终会降低模型的整体性能。

3.2 RMSE

RMSE,开方均方误差    RMSE=sqrt(MSE)

Root Mean Square Error

3.3 MAE

3.3.1 L1 loss

  • MAE
  • L1 loss

3.3.2 计算公式

MAE=Σ|Y-f(Xi)|/n ,i=1~n

3.4.3 图形推导

3.4.4 MAE的特点

  • 不同商品真实值量纲上的差别带来的MAE结果波动大

 举例子

  • 比如同样是 |yi^-yi|=5
  • 有可能是6-1=5,但是百分比percent=(6-1)/1=5=500%,误差很大
  • 也可能是105-100=5,但是百分比percent=(105-100)/100=5/100=5%,误差较小
  • 也可能是1005-1000=5,但是百分比percent=(1005-1000)//1000=5/1000=0.5%,误差极小
  • 可见,ABS都是5,但是百分比差别巨大!!
  • MAE 的曲线呈 V 字型,连续但在 y-f(x)=0 处不可导,计算机求解导数比较困难。
  • 而且 MAE 大部分情况下梯度都是相等的,这意味着即使对于小的损失值,其梯度也是大的。
  • 这不利于函数的收敛和模型的学习。
  • 值得一提的是,MAE 相比 MSE 有个优点就是 MAE 对离群点不那么敏感,更有包容性。
  • 因为 MAE 计算的是误差 y-f(x) 的绝对值,无论是 y-f(x)>1 还是 y-f(x)<1,没有平方项的作用,惩罚力度都是一样的,所占权重一样。

3.4 MAPE

Mean Absolute Percentage Error

  

  • 当真实值y_{i}​非常小,特别是接近0时,MAPE可能很大
  • 这个值很直观,但也容易误导:当实际值非常小,特别是接近0时,这一百分比可能很大;
  • 如果实际值是0的话,分母就是0,计算没有意义。解决方案是设定上限,比如平均绝对百分比误差不超过100%。
  • MAPE 指平均绝对百分比误差,是一种相对度量,实际上将 MAD 尺度确定为百分比单位而不是变量的单位。平均绝对百分比误差是相对误差度量值,它使用绝对值来避免正误差和负误差相互抵消
  • MAPE 对相对误差敏感,不会因目标变量的全局缩放而改变,适合目标变量量纲差距较大的问题

3.4 WMAPE

  

  • 极端值带来的误差波动小


3.6 R^2

参考文档

http://www.360doc.com/content/17/1217/10/40769523_713767996.shtml

https://zhuanlan.zhihu.com/p/26061758?from_voters_page=true

https://www.jianshu.com/p/301766de458d

机器学习中的方差和偏差理解-CSDN博客

机器学习中的方差和偏差理解_low-variance-CSDN博客

如何在 EXCEL 中使用函数进行线性回归分析? - 知乎

使用Excel进行线性回归、计算R2、RMSE、MAE等精度方法_rmse怎么用excel-CSDN博客

MAE, MSE, RMSE, R方 — 哪个指标更好? - 知乎

回归预测模型的常见评估指标(MAE,MSE,MAPE等) - 知乎

深度学习常用损失MSE、RMSE、MAE和MAPE-CSDN博客

https://www.cnblogs.com/hider/p/17095700.html

机器学习——需求预测——准确性(误差)统计——MAE、MSE、MAPE、WMAPE-CSDN博客

Excel统计分析——多元线性回归分析 - 知乎

Excel统计分析——一元线性回归分析(二) - 知乎

数据分析必备五大思维(二)——统计思维

Excel统计分析——一元线性回归分析 - 知乎

https://blog.csdn.net/htuhxf/article/details/84585022

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/427160.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Vue——携带参数跳转路由

Vue学习之——跳转路由 前情回顾 当我们进行点击修改时&#xff0c;会进行跳转到修改页面&#xff0c;为了完成回显数据&#xff08;根据对应id查找&#xff09;&#xff0c;我们需要携带对应选择中的id跳转到修改页面&#xff0c;让其进行查找回显 学习useRoute和useRoute…

企业要想构建 AI 竞争力,就必须“私藏”大模型

3 月 3 日&#xff0c;由深圳市产学研合作促进会举办的海峡两岸暨港澳人工智能与机器人发展论坛在深圳市福田区会展中心开幕。极狐GitLab CEO 柳钢受邀出席此次活动&#xff0c;并做了题为 《创新与安全并重&#xff1a;大模型私藏之道》 的主题分享。 人工智能之新曦 自 Chat…

链表理论:基础概念与实战技巧!

推荐阅读 算法day01_ 27. 移除元素、977.有序数组的平方 算法day02_209.长度最小的子数组 算法day03_ 59.螺旋矩阵II 目录 推荐阅读链表理论知识单向链表&#xff08;单链表&#xff09;定义单链表单链表添加下一个节点单链表中插入一个节点单链表中删除下一节点遍历单链表 双…

《GitHub新手入门指南:从零开始掌握基本用法》

在现代软件开发和技术社区中,GitHub已经成为了一个不可或缺的平台。它不仅是一个代码托管平台,更是一个技术交流、学习分享的社交平台。但对于初学者来说,GitHub可能会有些令人望而却步。本文将详细介绍GitHub的基本用法,帮助新手快速入门并融入这个充满活力的技术社区。 …

Linux 实现打印彩色进度条

文章目录 预备知识一、理解回车换行二、认识行缓冲1、代码一、二&#xff08;回车换行理解&#xff09;2、代码三、四&#xff08;sleep函数和ffush函数理解&#xff09; 三、简单倒计时1. 倒计时代码2、效果展示 四、进度条1、效果展示2、进度条代码makefileProcessBar.hProce…

从零开始搭建web组态

成果展示&#xff1a;by组态[web组态插件] 一、技术选择 目前只有两种选择&#xff0c;canvas和svg Canvas: 是一个基于像素的渲染引擎&#xff0c;使用JavaScript API在画布上绘制图像&#xff0c;它的优点包括&#xff1a; Canvas渲染速度快&#xff0c;适合处理大量图像和…

【STM32】STM32学习笔记-FLASH闪存(48)

00. 目录 文章目录 00. 目录01. FLASH简介02. 闪存模块组织03. FLASH基本结构04. FLASH解锁05. 使用指针访问存储器06. 程序存储器编程07. 选项字节08. 选项字节编程09. 选项字节擦除10. 器件电子签名11. 附录 01. FLASH简介 STM32F1系列的FLASH包含程序存储器、系统存储器和选…

【.NET Core】.NET中的流(Stream)

【.NET Core】.NET中的流&#xff08;Stream&#xff09; 文章目录 【.NET Core】.NET中的流&#xff08;Stream&#xff09;一、流&#xff08;Stream&#xff09;1.1 FileStream类1.2 IsolatedStorageFileStream类1.3 MemoryStream类1.4 BufferedStream类1.5 NetworkStream类…

STM32 (2)

1.stm32编程模型 将C语言程序烧录到芯片中会存储在单片机的flsah存储器中&#xff0c;给芯片上电后&#xff0c;Flash中的程序会逐条进入到CPU中去执行&#xff0c;进而CPU去控制各种模块&#xff08;即外设&#xff09;去实现各种功能。 2.寄存器和寄存器编程 CPU通过控制其…

公司电脑文件防泄密软件——| 中科数安

公司电脑文件防泄密软件是一种专门设计用于保护企业敏感信息和数据安全的软件。这些软件通过采用各种技术手段&#xff0c;如数据加密、访问控制、行为监控等&#xff0c;来防止公司的机密文件、客户资料、财务数据等被非法获取、复制或传播。 www.weaem.com 以下是公司电脑文件…

选项 打光 试题总结

试题1 被测物体100100mm&#xff0c;精度要求被测物体 &#xff0c;精度要求0.1mm&#xff0c;相机距被测物体在200&#xff5e;320mm之间&#xff0c;要求选择合适的相机和镜头&#xff1f; 分析如下&#xff1a; 通常我们用的相机靶面是4:3 的所以我们要用短边来计算视场&am…

Vue导出json数据到Excel表格

一、安装依赖 npm install file-saver --save npm install xlsx --save npm install script-loader --save-dev二、下载两个所需要的js文件Blob.js和 Export2Excel.js。 这里下载&#xff1a;下载地址 三、src目录下新建vendor文件夹&#xff0c;将Blob.js和 Export2Excel.j…

STM32学习和实践笔记(1): 装好了的keil μVision 5

2019年3月在淘宝上买了这块STM32的开发板&#xff0c;学了一段时间后就丢下了&#xff0c;今天重新捡起来&#xff0c;决定好好学习、天天向上。 对照教程&#xff0c;今天先把keil5装上了。 装的过程有以下几点值得记录下&#xff1a; 1&#xff09;用注册机时&#xff0c;…

x86中的TSS与任务切换

前言 今天在学习《深入理解Linux内核》的时候&#xff0c;发现出现了一个新的名词TSS&#xff08;Task-State Segment&#xff09;&#xff0c;这还是我第一次了解到原来x86提供了硬件级别的任务切换功能&#xff0c;之前以为任务切换都是操作系统实现的来着&#xff0c;这里也…

计算机电源的功率不足150W的几种主要原因?

180 至 250 伏 180-250伏 一般计算机电源的工作电压范围为 180 至 250 伏。 电脑电源是安装在电脑内部的电脑部件&#xff0c;负责将普通市电电源转换成电脑可以使用的电压。 电脑电源是一个开关电路&#xff0c;将普通交流电转换为直流电&#xff0c;然后通过斩波控制电压&a…

JavaScript 中的类型转换机制(详细讲解)

文章目录 一、概述二、显示转换Number()parseInt()String()Boolean() 三、隐式转换自动转换为布尔值自动转换成字符串自动转换成数值 一、概述 前面我们讲到&#xff0c;JS中有六种简单数据类型&#xff1a;undefined、null、boolean、string、number、symbol&#xff0c;以及…

你知道为什么输电线路除冰采用的是直流电而不是交流电呢?

2月22日以来&#xff0c;受新一轮寒潮影响&#xff0c;四川地区气温骤降&#xff0c;多地出现了零摄氏度以下的低温和冰冻天气&#xff0c;泥巴山、蓑衣岭等微气象区域20条500千伏线路出现不同程度覆冰&#xff0c;其中500千伏石雅四回线路覆冰最为严重&#xff0c;导线和铁塔上…

程序员在面试过程中需要重点关注的问题

在金三银四这个关键的求职季节&#xff0c;程序员面试的成功与否往往决定了他们能否获得心仪的工作机会。在这篇文章中&#xff0c;我将详细介绍程序员在面试过程中需要重点关注的问题&#xff0c;并提供一些实用的建议和技巧。 一、了解自己和职位要求 在面试之前&…

在线绘图利器:支持在线使用的电脑画图软件推荐!

计算机绘图软件是现代设计师和创作者必不可少的工具之一。伴随着技术的不断发展&#xff0c;越来越多的在线计算机绘图软件应运而生&#xff0c;为用户提供了更加便捷、高效的创作方法。对初学者而言&#xff0c;选择一款易于使用、功能强大的计算机绘图软件至关重要。本文将介…

39. 【Linux教程】修改文件所属关系

上一节介绍了如何修改文件的读、写、执行权限&#xff0c;包括属主用户权限、所属用户组权限、其他用户组用户权限&#xff0c;本小节介绍如何修改文件的所属关系&#xff0c;所属关系又包括文件的属主和所属组。 1.chown 命令 若想要修改文件的属主&#xff0c;可以使用 chow…