机器学习--2.多元线性回归

多元线性回归

1、基本概念

1.1、连续值

1.2、离散值

1.3、简单线性回归

1.4、最优解

1.5、多元线性回归

2、正规方程

2.1、最小二乘法

2.2、多元一次方程举例

2.3、矩阵转置公式与求导公式

2.4、推导正规方程0的解

2.5、凸函数判定

成年人最大的自律就是:克制自己去纠正别人的欲望。俗话说人教人教不会,事儿教人一次就会。希望呢,你赶紧进入社会,经历经历一些困难和挫折,然后这样的话你才能够快速的成长,是吧?事教人一次就会。

好,那么我们继续看咱们的正规方程。咱们说咱们通过最小的乘法求解出了正规方程,这个特别有用,对不对。看正规方程现在是不是就可以帮助我们去求解?这个多元一次方程呀。好,那么。咱们的最小的乘法之所以能够求解。

发现啊,这个最小二乘法它的公式呢,是HC塔Xi-Y,是不是带了一个平方,对不对啊,它带了一个平方,那么像这样的方程,如果咱们画图画出来。

是不是,你看它是不是一个抛物线形式啊,画图画出来的话,咱们给一个红色啊,啊就是这个方程,它大概是这样。

啊,画图画出来,那么它大概呢,就是一个这样的形式。它是抛物线形式的。

那现在呢,咱们就能够看到,但凡是这样的方程,那你想一定忽悠。

最小值对不对是吧,因为你看这个抛物线是吧,下面肯定有一个最小值对吧,那这个时候呢,咱们。咱们就要这个介绍一下这个凸函数这个概念啊。那什么样的函数是凸函数呢?咱们先看。那你看左边这个是凸函数还是右边这个是凸函数呀,那么很多根据直观是吧,你自己的这个知识,你肯定会判定左边这个是猪还是猪,在这里我要告诉你,右边这个是主函数。啊,因为凸函数这个概念,它来自欧美,来自美国。我们就把它翻译成了凸函数,其实人家美国是吧。呃,在进行文件说明的时候,人家还有一个词叫下凸,然后中国人翻译就把这个下给去掉了。所以说这个。咱看到的这个图函数,机器学习的图函数和咱们实际生活当中的这个汉字的这个概念是吧,稍微有点偏差,所以你加一个下图你就能够知道了。你看你一旦将下空,那很显然就是你的抛物线向上,那很显然它是不是就有最小值呀。

好,那么咱们先来基本概念,知道了是不是啊,这个函数是吧,我们把它叫做损失函数,那这个损失函数如果要是通函数的话。

还有一个好处就是我们,嗯,可以就是可以确定它呢,一定是这个它的极值呢,就是咱们的自由基。

他呢,一定是全局最优解。因为你这个方程是二次开口,它的开口向上,这个时候呢,你看咱们求导,0,导数等于0,是不是就可以求解最优值啊,对不对,所以说呢,这就是为什么我们要了解图函数概念。

另外一个问题就出来了,这个函数咱画出来图,简单的咱能够知道说他是下图,那如果给你一个函数,咱们怎么去判定呀。

对不对,如果他要不是图函数,它有没有这个最小值,有没有最优解呢?

对不对,那你看一下这个图形,看一下这个图片是不是你像这个它就是一个非突函数,看到了这个就是一个非凸函数,那就像连绵不绝的山脉一样,那这个时候呢。你看他们求解的是吧,比如说这个值是吧,它可能就会得到一个局部最优肌,而不是全局的,因为一旦你落到山谷,这个时候呢,你优化你就走不出来了,很可能就走不出来了,你就不能够走到全局的这个最小值。所以如果不是非同函数是吧,可能咱们有一个求解大解出来,它不是最最优的。那么上面呢,是我们平面的,接下来你看咱们也可以看一个立体的,你看立体左边的这个是吧,它就属于是图函数下凸函数是吧,右边这个就属于是非凸的是吧,立体的。来去,那我们如何判定呢?真正的问题了是吧?判断口函数的方式呢?哎,有很多,那么其中一个非常直观的有效的就是一个方法,就是看黑色矩阵是否是半正定。啊,这一个判定当中有两个非常关键的概念,首先是黑色矩阵,还有就是半程定,咱们看一下黑色矩阵啊。是什么?黑色矩阵是由目标函数点在X处的二阶偏导组成的对称矩阵啊,哎,这就是黑色矩阵,那我们先看黑色矩阵,因为我们上面推导咱们用的是最小的乘法推导正规方程是吧?那我们最后呢,已经求得了它的一界偏导数,看是不是就是它。那我们对一阶偏导数继续求导,咱们是不是就可以得到二阶电的500越位,继续对它求导啊,咱们就可以得到下面这个,一旦我们得到了下面这个是吧,它呢就叫做。啊,这个就叫做黑色矩阵,现在你明白什么是黑色矩阵了吧,这个是不是也很简单对吧,有个概念就行了,好,那么得到了这个黑色矩阵之后呢,大家看啊。

这个对咱们的式子来说,就是在导入的基础上,再次对C塔求导,其结果就是XTX,所谓正定。那接下来咱们看后半部分的概念,什么是正定呢?就是XTX,它的特征值全为正数,这个就是正明。

他这是正定的概念,半正定呢,就是XTX这个矩阵相乘是吧,咱们的特征值大于0就可以啊,特征值大于0就可以,这个就是半等性。

啊对,就是半个点,那我们上面的判断依据是黑色矩阵是否为半证点,如果要示范正定,那么它就属于是图函数,如果要不是半生点,比如说你的课程只有负的,对不对,对不对,那这个时候呢,你就不是那个函数。

啊,那么我们所求解的这个XT和X,它是半证定吗?对不对,你看他是半正病吗?显而易见它是半正经,为什么呢,你看。

咱们的黑色矩阵是XT和X相乘对不对?那这里咱们对C塔损失函数求二阶导数的黑色矩阵是XT和X,得到的一定是半正定的,是自己和自己做点儿成。

那么他呢,是自己和自己做顶称,那具体我们再说一下啊,为什么自己和自己做第二成,咱们得到的就是一定是半正定的。

对不对?那为什么一定犯成0,当X为任意大小的视矩阵时啊,再给一个任意的。

XT.

和X矩阵乘法一定是半正定,为什么呢?想要证明它是半正经,咱们可以考虑对于任意非零向要。

证明

和XT相乘,然后在后面再乘以V负就行。

这个呢,就涉及到咱们先行代数当中半正定的概念。

好,那么咱们呢,就让它相乘是吧,乘完之后呢,你看要注意这是一个这个四个矩阵相乘,咱们矩阵虽然不满足交换率,但是它可以结合对不对,那我们怎么结合呢。

前两个集合就是VT和XT进行结合,结合之后啊,这个时候环节。

就是这两个。

然后后面这两个集合。

因为前面是VTXT,那这个时候咱就可以把T提出来啊,提出来之后X提到前面,那就是XV啊,XV×XV就是XV的转置乘以XV的转置,这个时候它们俩进行相乘,咱们得到一个结果啊,那就是因为你是两个相乘嘛,那就是数2÷2X的平方,它一定是大于等于0的。

其中这个数杠数杠XV表示向量XV的范数,什么是范数呢?什么是范数,这个是一个概念是吧,就是你这两个区面相乘,然后来个开始放啊香肠乘完之后呢,来一个。

因此呢,一定是伴正定的,那到这里我相信各位小伙伴接受起来是吧,那就有一定的难度了。

OK, 咱们先来简化一下,你记住就行了,面试的时候你只要能够说出来主函数是什么,你就跟他强调一下,这就是下图。

把咱们机器学习当中的这个最小的乘法啊。那么它呢,就是一个凸函数。因为呢,我们对于它的最小值乘法二次求导,咱们能够得到这儿啊,能够得到这儿。

XT和X相乘,你知道它是半正定的就够了。

啊,当然我们知道数学它的证明和证明和验证是无止境的,是不是啊,我们学习这个是吧,咱们是为了应用啊,站到巨人的肩膀上,这就很好,所以说我们直接拿来用是吧,就可以了啊。

那这里呢,咱们就不再做数学推导证明了,哎,我也证明不了,太难了。

是吧,更高级的是吧,咱也证明不了,一体学习当中往往损失函数都是图函数物一样进行学习呢,就是咱们所说的常规的算法,就是咱们s learn当中的这些算法,那么到深度学习当中呢,算式函数往往是非度函数。

既然找到了姐妹,必是全局最优,那他不是?

最优解也可以,只要咱们的模型开用就行是吧?

机器学习的特点就是不强调模型百分之百正确,只要有价值开用就行,明白吗?那只要有价值开用就行。咱们从北京到深圳,你开奔驰宝马也能到,是不是啊,你开这个普通的汽车是不是也能到,你骑自行车、走路也能到。明白吗?所以说这个机器学习的特点是吧,他不强调模型百分之百正确,只要有价值开用就行。那你得有一个成本的这个考虑是吧,能够就可以。

好,最后呢,我们一起来看一下数据的配,就是这你看这个函数方程能画出来就是一个心角,好,那么呃,我把这个对这个美丽的数学图形呢,送给各位坚持学习的路飞小伙伴们,好,这一小节的内容我们就提录到这儿,那么到此为止呢,咱们正规方程的介绍我们就告一段落了,好,那么下面的课程当中呢,我们会使用正规方程,咱们呢,哎。实战一下是吧,我们使用正规方程来解决一个咱们的线性回归问题啊,使用正规方程来去解决咱们的线性规则问题,也就是说这个时候我们要算法建模了。好,那么呃,大家呢,梳理一下我的第二个大部分正规方程,咱们所讲的知识点,最小的乘法。最小二乘法当中的正规方程,我们使用正规方程对多元一次发生的求解矩阵的转置。求导公式,还有咱们推导正规方程,咱们。如何一步步进行推导的,还有咱们图函数的判定是吧?我们之所以能够对最小2乘法进行求最小值,求导数,定导数等于0去求最小值,原因就是因为咱们的这个最小儿乘法啊,注意啊,咱们的最小的乘法它也叫损失函数,就是那个GC塔。它呢是一个凸函数,所以咱们才可以对它进行求解。

3、线性回归实战

3.1、使用正规方程进行求解

3.1.1、简单线性回归
3.1.2、多元线性回归

3.2、机器学习库scikit-learn

3.2.1、scikit-learn简介
3.2.2、scikit-learn实现简单线性回归
3.2.3、scikit-learn实现多元线性回归

4、线性回归算法推导

4.1、深入理解回归

4.2、误差分析

4.3、最大似然估计

4.4、高斯分布-概率密度函数

4.5、误差总似然

4.6、最小二乘法MSE

4.7、归纳总结升华

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/964575.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

(done) MIT6.S081 2023 学习笔记 (Day7: LAB6 Multithreading)

网页:https://pdos.csail.mit.edu/6.S081/2023/labs/thread.html (任务1教会了你如何用 C 语言调用汇编,编译后链接即可) 任务1:Uthread: switching between threads (完成) 在这个练习中,你将设计一个用户级线程系统中的上下文切…

AWS配置邮件服务器给其他邮箱发邮件的方法

一、前言 公司系统用AWS平台的邮件服务器,如果想给新收件人发邮件,就需要特殊配置下才行;不然发不出去。 二、步骤 1.登录AWS平台,登录地址(藏的很深,不太好搜到,参数也不能删) …

kaggle视频行为分析1st and Future - Player Contact Detection

这次比赛的目标是检测美式橄榄球NFL比赛中球员经历的外部接触。您将使用视频和球员追踪数据来识别发生接触的时刻,以帮助提高球员的安全。两种接触,一种是人与人的,另一种是人与地面,不包括脚底和地面的,跟我之前做的这…

42【文件名的编码规则】

我们在学习的过程中,写出数据或读取数据时需要考虑编码类型 火山采用:UTF-16 易语言采用:GBK php采用:UTF-8 那么我们写出的文件名应该是何种编码的?比如火山程序向本地写出一个“测试.txt”,理论上这个“测…

全栈开发:使用.NET Core WebAPI构建前后端分离的核心技巧(一)

目录 cors解决跨域 依赖注入使用 分层服务注册 缓存方法使用 内存缓存使用 缓存过期清理 缓存存在问题 分布式的缓存 cors解决跨域 前后端分离已经成为一种越来越流行的架构模式,由于跨域资源共享(cors)是浏览器的一种安全机制,它会阻止前端应用…

JVM执行流程与架构(对应不同版本JDK)

直接上图(对应JDK8以及以后的HotSpot) 这里主要区分说明一下 方法区于 字符串常量池 的位置更迭: 方法区 JDK7 以及之前的版本将方法区存放在堆区域中的 永久代空间,堆的大小由虚拟机参数来控制。 JDK8 以及之后的版本将方法…

【玩转 Postman 接口测试与开发2_014】第11章:测试现成的 API 接口(下)——自动化接口测试脚本实战演练 + 测试集合共享

《API Testing and Development with Postman》最新第二版封面 文章目录 3 接口自动化测试实战3.1 测试环境的改造3.2 对列表查询接口的测试3.3 对查询单个实例的测试3.4 对新增接口的测试3.5 对修改接口的测试3.6 对删除接口的测试 4 测试集合的共享操作4.1 分享 Postman 集合…

登录认证(5):过滤器:Filter

统一拦截 上文我们提到(登录认证(4):令牌技术),现在大部分项目都使用JWT令牌来进行会话跟踪,来完成登录功能。有了JWT令牌可以标识用户的登录状态,但是完整的登录逻辑如图所示&…

基于Spring Security 6的OAuth2 系列之七 - 授权服务器--自定义数据库客户端信息

之所以想写这一系列,是因为之前工作过程中使用Spring Security OAuth2搭建了网关和授权服务器,但当时基于spring-boot 2.3.x,其默认的Spring Security是5.3.x。之后新项目升级到了spring-boot 3.3.0,结果一看Spring Security也升级…

git基础使用--1--版本控制的基本概念

文章目录 git基础使用--1--版本控制的基本概念1.版本控制的需求背景,即为啥需要版本控制2. 集中式版本控制SVN3. 分布式版本控制 Git4. SVN和Git的比较 git基础使用–1–版本控制的基本概念 1.版本控制的需求背景,即为啥需要版本控制 先说啥叫版本&…

< OS 有关 > Android 手机 SSH 客户端 app: connectBot

connectBot 开源且功能齐全的SSH客户端,界面简洁,支持证书密钥。 下载量超 500万 方便在 Android 手机上,连接 SSH 服务器,去运行命令。 Fail2ban 12小时内抓获的 IP ~ ~ ~ ~ rootjpn:~# sudo fail2ban-client status sshd Status for the jail: sshd …

课题推荐——基于自适应滤波技术的多传感器融合在无人机组合导航中的应用研究

无人机在现代航空、农业和监测等领域的应用日益广泛。为了提高导航精度,通常采用多传感器融合技术,将来自GPS、惯性测量单元(IMU)、磁力计等不同传感器的数据整合。然而,传感器的量测偏差、环境干扰以及非线性特性使得…

【MySQL】常用语句

目录 1. 数据库操作2. 表操作3. 数据操作(CRUD)4. 高级查询5. 索引管理6. 用户与权限7. 数据导入导出8. 事务控制9. 其他实用语句注意事项 如果这篇文章对你有所帮助,渴望获得你的一个点赞! 1. 数据库操作 创建数据库 CREATE DATA…

基于多智能体强化学习的医疗AI中RAG系统程序架构优化研究

一、引言 1.1 研究背景与意义 在数智化医疗飞速发展的当下,医疗人工智能(AI)已成为提升医疗服务质量、优化医疗流程以及推动医学研究进步的关键力量。医疗 AI 借助机器学习、深度学习等先进技术,能够处理和分析海量的医疗数据,从而辅助医生进行疾病诊断、制定治疗方案以…

使用 Elastic Cloud Hosted 优化长期数据保留:确保政府合规性和效率

作者:来自 Elastic Jennie Davidowitz 在数字时代,州和地方政府越来越多地承担着管理大量数据的任务,同时确保遵守严格的监管要求。这些法规可能因司法管辖区而异,通常要求将数据保留较长时间 —— 有时从一年到七年不等。遵守刑事…

【NLP 20、Encoding编码 和 Embedding嵌入】

目录 一、核心定义与区别 二、常见Encoding编码 (1) 独热编码(One-Hot Encoding) (2) 位置编码(Positional Encoding) (3) 标签编码(Label Encoding) (4) 注意事项 三、常见Embedding词嵌入 (1) 基础词嵌入…

【Envi遥感图像处理】010:归一化植被指数NDVI计算方法

文章目录 一、NDVI简介二、NDVI计算方法1. NDVI工具2. 波段运算三、注意事项1. 计算结果为一片黑2. 计算结果超出范围一、NDVI简介 归一化植被指数,是反映农作物长势和营养信息的重要参数之一,应用于遥感影像。NDVI是通过植被在近红外波段(NIR)和红光波段(R)的反射率差异…

7、怎么定义一个简单的自动化测试框架?

定义一个简单的自动化测试框架可以从需求理解、框架设计、核心模块实现、测试用例编写和集成执行等方面入手,以下为你详细介绍: 1. 明确框架需求和范围 确定测试类型:明确框架要支持的测试类型,如单元测试、接口测试、UI 测试等…

web-XSS-CTFHub

前言 在众多的CTF平台当中,作者认为CTFHub对于初学者来说,是入门平台的不二之选。CTFHub通过自己独特的技能树模块,可以帮助初学者来快速入门。具体请看官方介绍:CTFHub。 作者更新了CTFHub系列,希望小伙伴们多多支持…

Linux中的基本指令(二)

一、移动和重命名指令mv 1.1基本作用及使用规范 基本作用是进行文件的移动和重命名,使用规范如: mv src[目录/文件]dst[路径/文件] 回车 1.2三种不同的作用 通过在src部分和dst部分写入不同的内容,来实现文件的移动和重命名的等不同功能…