机器学习-线性回归(对于f(x;w)=w^Tx+b理解)

一、𝑓(𝒙;𝒘) = 𝒘T𝒙的推导

学习线性回归,我们那先要对于线性回归的表达公示,有所认识。

我们先假设空间是一组参数化的线性函数:

其中权重向量𝒘 ∈ R𝐷 和偏置𝑏 ∈ R都是可学习的参数,函数𝑓(𝒙;𝒘,𝑏) ∈ R也称为线性模型。

不失一般性, 在本章后面的描述中我们采用简化的表示方法, 直接用 𝒘和 𝒙 分别表示增广权重向量和增广特征向量. 这样, 线性回归的模型简写为 𝑓(𝒙;𝒘) = 𝒘T𝒙.

这就是题目中提到的线性回归模型的推导由来。

这里为了更好的学习线性回归模型,这里我们普及一下大学时线性代数的一些概念。

二、向量、增广向量、增广权重向量、增广特征向量的概念:

1. 向量(Vector)

定义:
向量是一组有序排列的数,表示空间中的点、数据样本或特定属性的集合。

示例:
假设我们有一个人的身体数据,包括身高和体重,我们可以用一个向量表示:

这个向量表示身高 180 cm,体重 75 kg。

常见类型:

  • 列向量(常用): n×1 维,如上例。
  • 行向量: 1×n,例如: x=[180,75]。

应用:

  • 在机器学习中,向量用来表示数据样本(输入特征)、模型参数等。
  • 在物理中,向量用来表示力、速度等有大小和方向的量。

2. 增广向量(Augmented Vector)

定义:
增广向量是在普通向量的基础上,增加一个额外的常数(通常是 1),以便于在数学计算中引入偏置项(Intercept/Bias)。

示例:
假设我们有一个特征向量:

增广后:

为什么要加 1?
在机器学习的线性回归公式中:

y = w_1 x_1 + w_2 x_2 + b

如果将 b 视为 w_3 并将增广向量 x 扩展为:

y = w_1 x_1 + w_2 x_2 + w_3 ⋅1

这时,增广后的矩阵运算更为简洁,公式变为:

应用:

  • 机器学习: 在回归、分类等问题中,引入偏置项。
  • 计算机视觉: 处理图像坐标变换(如平移操作)。
  • 信号处理: 统一矩阵运算,减少额外计算。

3. 增广权重向量(Augmented Weight Vector)

定义:
增广权重向量是在普通权重向量的基础上,增加一个额外的偏置项 b,以与增广输入向量匹配。

示例:
假设我们有普通的权重向量:

增广后:

这样,使用增广权重向量,计算目标值时,可以与增广向量配合使用:

应用:

  • 机器学习: 简化计算,避免单独处理偏置项。
  • 神经网络: 统一偏置与权重的管理,提高计算效率。

4. 增广特征向量(Augmented Eigenvector)

定义:
增广特征向量是在线性代数的特征值分解问题中,在特征向量的基础上,附加额外的约束条件或辅助信息,以便解决某些特定问题。

特征向量的基本公式:

给定矩阵 A,特征向量满足:

Av=λv

如果原始特征向量是:

增广后:

为什么要增广?

  • 在控制系统、信号处理等领域,增广特征向量可以用于增加额外信息,如系统约束或观测量。
  • 在奇异值分解(SVD)、PCA等方法中,增加维度可以提高数值稳定性或处理特殊边界条件。

应用:

  • 控制工程:增广状态向量来处理观测噪声。
  • 计算机视觉:在3D变换中加入齐次坐标(如在2D坐标 (x,y)增广为 (x,y,1))。

5. 总结:区别与联系

名称定义增加的元素作用例子
向量一组数,表示数据或坐标描述特征或数据点[180,75][180, 75]
增广向量在向量后加 1,使计算更方便1统一计算偏置项[180,75,1][180, 75, 1]
增广权重向量在权重后加偏置项 bb 以匹配增广向量1使得矩阵运算统一,减少额外处理[0.5,1.2,20][0.5, 1.2, 20]
增广特征向量在特征向量后加常数或约束1 或更多处理约束问题、增加系统观测能力[2,3,1][2, 3, 1]

它们之间的联系:

  • 增广向量和增广权重向量通常一起使用,用于机器学习中的线性模型。
  • 增广特征向量更偏向于线性代数的特征值分解和矩阵分析,并不直接用于机器学习的建模中。

三、这里思考一个问题:空间可以由线性模型表示吗?

答案是yes,空间可以在一定条件下用线性模型来表示,特别是在欧几里得空间特征空间中,线性模型可以用于描述点、方向、平面和超平面等几何对象。

1. 线性模型的基本形式

线性模型的一般数学形式是:

在向量形式下可以表示为:

其中:

  • x 表示输入向量,描述空间中的点或特征。
  • w 是权重向量,表示空间中的方向或特定超平面的法向量。
  • b 是偏置,表示超平面与原点的距离。

2. 用线性模型表示几何空间的例子

例 1:平面在三维空间中的表示

假设我们在三维空间中有一个平面,其方程可以写成:

2x+3y−z+5=0

将其改写成线性模型的形式:

z=2x+3y+5z

这实际上是一个线性回归模型,其中:

  • x1=x, x2=y,y=z。
  • 权重 w=[2,3]。
  • 偏置 b=5。

解释:

  • 这个线性方程表示三维空间中的一个平面,线性模型可以表示任意方向的平面。
  • 平面的法向量 (2,3,−1)代表其朝向。
例 2:二维平面上的直线

假设我们要表示一个 2D 平面上的直线:

y=4x+2

这里:

  • x 是输入变量,y 是输出。
  • 斜率 w1=4,偏置 b=2。

这条直线可以看作是一个 2D 空间中的线性模型,描述输入 x 和输出 y 之间的线性关系。

解释:

  • 该直线分割了平面空间,表示空间中的一个一维子空间。
  • 例如,在分类问题中,它可以用来将数据点分成两个类别。
例 3:超平面在高维空间中的表示(机器学习中的决策边界)

在机器学习中,支持向量机(SVM)和线性回归模型使用超平面来表示数据分布。例如,假设在 3D 空间中,数据点属于两个类别,我们可以用一个线性模型来区分它们:

w1x1+w2x2+w3x3+b=0

这个方程描述的是三维空间中的一个超平面,它可以将空间划分成两部分。

解释:

  • 在 n 维空间中,线性方程表示的是一个 (n−1)维的超平面。
  • 例如,在二维空间中,线性方程表示一条直线,在三维空间中,表示一个平面。
例 4:主成分分析(PCA)用于空间降维

在高维空间中,主成分分析(PCA)是一种常见的线性方法,用于找到数据的最佳投影方向。例如,给定一组三维点 (x1,x2,x3),PCA 试图找到一个最佳的线性方向来表示这些点,从而将其降维到一个平面或直线。

PCA 线性模型通常可以写作:

其中:

  • W 是投影矩阵,定义了降维后的新坐标轴。
  • 这个模型可以找到数据所在的低维子空间。

3. 线性模型表示空间的局限性

尽管线性模型可以表示许多几何对象,但也存在局限:

  • 无法表示非线性空间结构: 如果数据存在曲面或复杂的非线性关系,线性模型无法准确表示。
  • 只能描述平直的结构: 例如圆、球等非线性空间无法用简单的线性方程来表示。
  • 需要特征变换: 为了处理复杂空间,通常需要使用特征工程(如多项式特征扩展)或非线性映射(如核方法)。

4. 非线性空间如何用线性模型处理?

如果数据或空间具有非线性特征,可以通过以下方式将其转换为线性模型:

  1. 特征变换(Feature Engineering)

    通过增加维度,空间变得线性。

  2. 核方法(Kernel Methods)

    • 在支持向量机(SVM)中,核函数(如高斯核)将数据映射到高维线性可分空间。
  3. 神经网络(Deep Learning)

    • 通过多层非线性激活函数,神经网络可以近似任意复杂的空间映射。

5. 结论

  • 线性模型可以表示许多常见的空间,如直线、平面和高维超平面。
  • 对于更复杂的空间结构,需要进行特征变换或使用非线性方法来补充线性模型的局限性。
  • 在机器学习、数据分析和几何处理中,线性模型是非常重要的基础工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/959846.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Swing使用MVC模型架构

什么是MVC模式? MVC是一组英文的缩写,其全名是Model-View-Controller,也就是“模型-视图-控制器”这三个部分组成。这三个部分任意一个部分发生变化都会引起另外两个发生变化。三者之间的关系示意图如下所示: MVC分为三个部分,所以在MVC模型中将按照此三部分分成三…

Windows 环境下 Docker Desktop + Kubernetes 部署项目指南

Windows 环境下 Docker Desktop Kubernetes 部署项目指南 一、环境准备二、安装与配置 Kubernetes安装 windows 版的 docker启动 kubernetes安装 windows 版的 kubectl 工具下载 k8s-for-docker-desktop启动 Kubernetes Dashboard 二、在 Kubernetes 上部署项目创建一个 demo …

redis实现lamp架构缓存

redis服务器环境下mysql实现lamp架构缓存 ip角色环境192.168.242.49缓存服务器Redis2.2.7192.168.242.50mysql服务器mysql192.168.242.51web端php ***默认已安装好redis,mysql 三台服务器时间同步(非常重要) # 下载ntpdate yum -y install…

【Excel】【VBA】Reaction超限点筛选与散点图可视化

【Excel】【VBA】Reaction超限点筛选与散点图可视化 功能概述 这段代码实现了以下功能: 从SAFE输出的结果worksheet通过datalink获取更新数据从指定工作表中读取数据检测超过阈值的数据点生成结果表格并添加格式化创建可视化散点图显示执行时间 流程图 #mermaid-…

Java导出通过Word模板导出docx文件并通过QQ邮箱发送

一、创建Word模板 {{company}}{{Date}}服务器运行情况报告一、服务器:总告警次数:{{ServerTotal}} 服务器IP:{{IPA}},总共告警次数:{{ServerATotal}} 服务器IP:{{IPB}},总共告警次数:{{ServerBTotal}} 服务器IP:{{IPC}}&#x…

智能化加速标准和协议的更新并推动验证IP(VIP)在芯片设计中的更广泛应用

作者:Karthik Gopal, SmartDV Technologies亚洲区总经理 智权半导体科技(厦门)有限公司总经理 随着AI技术向边缘和端侧设备广泛渗透,芯片设计师不仅需要考虑在其设计中引入加速器,也在考虑采用速度更快和带宽更高的总…

RabbitMQ5-死信队列

目录 死信的概念 死信的来源 死信实战 死信之TTl 死信之最大长度 死信之消息被拒 死信的概念 死信,顾名思义就是无法被消费的消息,一般来说,producer 将消息投递到 broker 或直接到queue 里了,consumer 从 queue 取出消息进…

git常用命令学习

目录 文章目录 目录第一章 git简介1.Git 与SVN2.Git 工作区、暂存区和版本库 第二章 git常用命令学习1.ssh设置2.设置用户信息3.常用命令设置1.初始化本地仓库init2.克隆clone3.查看状态 git status4.添加add命令5.添加评论6.分支操作1.创建分支2.查看分支3.切换分支4.删除分支…

私有包上传maven私有仓库nexus-2.9.2

一、上传 二、获取相应文件 三、最后修改自己的pom文件

汽车定速巡航

配备定速巡航功能的车型,一般在方向盘附近设有4~6个按键(可能共用键位)。 要设置定速巡航,不仅需要方向盘上的按键,还要油门配合。 设置的一般流程: 开关:类似步枪上的“保险”,按…

安宝特方案 | AR在供应链管理中的应用:提升效率与透明度

随着全球化的不断深入和市场需求的快速变化,企业对供应链管理的要求也日益提高。如何在复杂的供应链环境中提升效率、降低成本,并确保信息的透明度,成为了各大行业亟待解决的问题。而增强现实(AR)技术,特别…

JavaScript(8)-函数

一.什么是函数:执行特定任务的代码块 讲js中需要的公共部分抽取并封装,谁用谁调用,代码复用。 先声明,后调用 使用function函数名需要调用的内容 使用:函数名() 二.使用方式 声明&a…

HTML<label>标签

例子 三个带标签的单选按钮&#xff1a; <form action"/action_page.php"> <input type"radio" id"html" name"fav_language" value"HTML"> <label for"html">HTML</label><br&…

4.flask-SQLAlchemy,表Model定义、增删查改操作

介绍 SQLAlchemy是对数据库的一个抽象 开发者不用直接与SQL语句打交道 Python对象来操作数据库 SQLAlchemy是一个关系型数据库 安装 flask中SQLAlchemy的配置 from flask import Flask from demo.user_oper import userdef create_app():app Flask(__name__)# 使用sessi…

【C++初阶】第11课—vector

文章目录 1. 认识vector2. vector的遍历3. vector的构造4. vector常用的接口5. vector的容量6. vector的元素访问7. vector的修改8. vector<vector\<int\>>的使用9. vector的使用10. 模拟实现vector11. 迭代器失效11.1 insert插入数据内部迭代器失效11.2 insert插入…

GPT 结束语设计 以nanogpt为例

GPT 结束语设计 以nanogpt为例 目录 GPT 结束语设计 以nanogpt为例 1、简述 2、分词设计 3、结束语断点 1、简述 在手搓gpt的时候&#xff0c;可能会遇到一些性能问题&#xff0c;即关于是否需要全部输出或者怎么节约资源。 在输出语句被max_new_tokens 限制&#xff0c…

PTMD2.0-疾病相关的翻译后修饰数据库

翻译后修饰&#xff08;PTMs&#xff0c;post-translational modifications&#xff09;通过调节蛋白质功能参与了几乎所有的生物学过程&#xff0c;而 PTMs 的异常状态常常与人类疾病相关。在此&#xff0c;PTMD 2.0展示与疾病相关的 PTMs 综合数据库&#xff0c;其中包含 93 …

ArcGIS10.2 许可License点击始终启动无响应的解决办法及正常启动的前提

1、问题描述 在ArcGIS License Administrator中&#xff0c;手动点击“启动”无响应&#xff1b;且在计算机管理-服务中&#xff0c;无ArcGIS License 或者License的启动、停止、禁止等均为灰色&#xff0c;无法操作。 2、解决方法 ①通过cmd对service.txt进行手动服务的启动…

spring框架之IoC学习与梳理(1)

目录 一、spring-IoC的基本解释。 二、spring-IoC的简单demo&#xff08;案例&#xff09;。 &#xff08;1&#xff09;maven-repository官网中找依赖坐标。 &#xff08;2&#xff09;.pom文件中通过标签引入。 &#xff08;3&#xff09;使用lombok帮助快速开发。 &#xff…

系统架构设计师教材:信息系统及信息安全

信息系统 信息系统的5个基本功能&#xff1a;输入、存储、处理、输出和控制。信息系统的生命周期分为4个阶段&#xff0c;即产生阶段、开发阶段、运行阶段和消亡阶段。 信息系统建设原则 1. 高层管理人员介入原则&#xff1a;只有高层管理人员才能知道企业究竟需要什么样的信…