线性代数空间理解

学习线性代数已经很久,但是在使用过程中仍然还是不明所以,比如不知道特征向量和特征值的含义、矩阵的相乘是什么意思、如何理解矩阵的秩……。随着遇到的次数越来越多,因此我决定需要对线性代数的本质做一次深刻的探讨了。

本次主要是参考了3Blue1Brown和其他若干博客来对此展开笔记的记录。

需要说明的是,这里的是记录线性代数的本质,因此关于如何计算的方法或者内容则相对较少。

向量是什么

先抛出一个问题,什么是向量。这里存在着三个观点。虽然不同,但是存在着一定的联系。

主要由物理专业、计算机专业和数学专业三种角度来看待这个问题。

image-20240416171346410

  • 物理学家认为,向量是空间中的箭头,决定一个向量的是它的长度和它所指的方向。因此只要在空间中,能够保证以上两个特征,那么就可以自由移动一个向量而保持不变。
  • 计算机专业的则认为,向量是有序数字列表

这两种观点的存在就导致在使用或者讨论过程中存在两种观点,即向量到底是空间中的箭头,还是一组有序的序列?

  • 因此,数学家则尝试概括这两种情况,其认为,向量只要保证两个向量相加数字与向量相乘有具体的含义,则向量可以是任何的东西。也正因如此,向量在使用过程中,可以将空间中的箭头转为对应的有序数列;而有序的序列也可以转为空间中的一个箭头(具有几何意义)。

    这里之所以被数学家认为只需要考虑加法和乘法,我认为是因为对于一个空间来说,根据一个坐标空间中的基向量,只用加法和乘法就是可以完全表示基向量所在的空间。因此不需要考虑其他的运算了。

    这个过程可以参考视频来理解。

因此,线性代数的意义有:

1. **为数据分析提供了一条将大量数据列表概念化和可视化的渠道,了解特定运算的含义。** 
1. **给物理学家和计算机程序员提供了一种语言,这样就可以通过计算机能处理数字,进一步而操纵空间。**

线性变换和矩阵

先说线性变换。线性变换其实就是函数,只不过输入就是向量,输出还是向量而已。但是为什么从功能上来看是一样的操作,但是却要用两个概念来定义呢?

这是因为,线性变换体现在变换这个词上。The word “transformation” suggests that you think using movement. 也就是,线性变换就是一种向量的变动/运动

image-20240416194256676

原则上,变换可以是多种多样的,但是线性代数将变换进行了约束,即限制在线性的特殊变换上。

这里说一下线性的两个特点,只要满足皆为线性变换:1)直线变换之后仍然保持为直线;2)原点必须保持固定。

如果要是从图形的角度上来看,那么借助带有网格线的坐标系来看,所谓的能够符合线性变换的定义的变换,就是变换之后的网格线仍然保持平行且等距的特点。此时就可以认为是线性变换。

下面只有第一个图才是线性变换,其他的都不是。

image-20240416195045888

那么接下来就引出“如何用数值来描述这些线性变换呢?”这就要引出接下来要说的矩阵了。

先说一个列向量 V ^ = [ 1 , 2 ] T \hat V = [1,2]^T V^=[1,2]T,用基向量 i , j i, j i,j可以在坐标系中表示如下:

image-20240416200309725

那么我们进行坐标系的整体旋转。如下图所示,原坐标系为浅色细线构成,剪切后(视频中定义为Shear,它是一种拉伸。而旋转被定义为Rotation,它是常见的旋转操作)的坐标系为蓝色粗线构成。

此时基向量在原来的坐标系中表示为 [ 1 , − 2 ] T [1, -2]^T [1,2]T [ 3 , 0 ] T [3, 0]^T [3,0]T。转变后的向量 V ^ \hat V V^等于 [ 5 , 2 ] T [5, 2]^T [5,2]T

image-20240416201121970


至此,便可以总结几点信息:

  1. 在原直角坐标系中,基坐标 i = [ 1 , 0 ] T , j = [ 0 , 1 ] T i=[1, 0]^T, j=[0, 1]^T i=[1,0]T,j=[0,1]T
  2. 向量的线性转化在公示上表现为左乘一个矩阵,该矩阵就是一个新坐标系的基(当然该矩阵的列向量可以线性相关,也可以线性无关。比如在二维平面中,线性相关就表示为两个重叠的基向量,那么就体现为一条直线了);
  3. 线性变换的本质其实就是向量的空间变换
  4. 其实这个过程也可以侧面说明,为什么数学家把向量的定义为向量只要保证两个向量相加和数字与向量相乘有具体的含义。在线性变换的过程中,也就只使用了加法和乘法两种运算就实现了线性变换。
  5. 同时这也可以看出,只需要记录基向量,那么就可以表示出任意向量的落脚点。

线性变换的复合和矩阵乘法

先说结论:两矩阵相乘的几何意义,也就是两个线性变化的相继作用(multiplying two matrices like this has the geometric meaning of applying one transformation then another)

如下图所示,基向量经过两次复合变换。但是如何记录这两次复合变换的过程。这就需要用到矩阵的相乘。

image-20240416210514739

其实这就很简单,只需要按照变换的顺序,写出对应的变换矩阵就可以了,剩下的就是交给矩阵相乘。

image-20240416210749221

行列式

“The purpose of computation is insight, not numbers”—Richard Hamming

在线性变换的时候,网格图的单位坐标会发生缩放,那么对于单位长度围成的图形来说,就可以计算出对应的面积。那么在缩放单位坐标时,所围成的图形的面积也跟着对应缩放。

在下图中,图形由原来的面积A变为6A,面积增长了6倍。此时就引出了行列式在几何中的定义:线性变换改变面积的比例被称为线性变换的行列式

image-20240417163028569

这里还有一个特殊情况,就是当行列式为0时,那么对应的几何效果如下。这时候说明它将整个平面压缩到一条线上,甚至是在一个点上。

image-20240417163424881

正是因为有这个特性,那么可以得出一个结论:只需要检验一个矩阵的行列式是否为0,我们就能了解这个矩阵所代表的变换是否将空间压缩到更小的维度上

换句话说,只有矩阵代表的变换将空间压缩到更低的维度时(空间压缩对应的就是矩阵的行列式为零),才会存在一个非零向量,使得矩阵和它的乘积向量为零向量。


实际上,特征值是存在为负数的情况的,那么该如何理解缩放为负数倍的情况呢?

动画说明

这里以二维平面为例,从几何上来说,其实是空间上的一次翻转,就类似一枚硬币,从正面翻转到反面的效果。

那么如果从基向量的角度上来看,那么就可以认为是两个基向量的相对位置发生了变换。具体如下面两张图所示.

扩展了解:

  1. 如何理解为什么负的面积与定向(orientation)的改变有关?
  2. d e t ( M ) < 0 det(M) \lt 0 det(M)<0意味着什么? 在三维空间下是什么意思?
  3. 如何计算行列式?在几何层面行列式的计算证明。

矩阵的逆

矩阵的逆时应用在解方程组的时候使用的。

具体来说,对于一个线性变换 A x ⃗ = v ⃗ A \vec{x} = \vec{v} Ax =v ,其对应的几何变换如下图所示,即需要找到一个向量 x ⃗ \vec{x} x 在变换矩阵 A A A的作用下,使得与向量 v ⃗ \vec{v} v 重合(如粉红色箭头所示)。

image-20240420162328043

而矩阵的逆或者说逆变换则是指与向量 v ⃗ \vec{v} v 重合之后,通过线性变换再变回向量 x ⃗ \vec{x} x 。而此时的计算就变为了 x ⃗ = A − 1 v ⃗ \vec{x} = A^{-1} \vec{v} x =A1v 。这时就需要考虑$ A^{-1} $的情况

在#行列式#一节中说到,变换矩阵的行列式决定了该线性变换是否会产生压缩空间的情况发生。因此$ A^{-1} 有两种情况,即 有两种情况,即 有两种情况,即det(A)=?0$。

d e t ( A ) ≠ 0 det(A) \ne 0 det(A)=0时,就几何变换如下图所示(存在非零向量的变换)

image-20240420164910546 image-20240420165023630

其实这两张图更直观地可以看出 A − 1 A = E A^{-1} A=E A1A=E,表示什么变换都没有。

如果 d e t ( A ) = 0 det(A) = 0 det(A)=0时,那么在几何上就表示为变换空间压缩到更低的维度上。由于不能将一条线反转或者解压缩为一个平面(以2-D为例),因此就不存在这样的逆变换。

image-20240420165750853

基变换

前文一直以来都是以标准的直角坐标系来当作基向量来说明向量。但是事实上,还是存在其他的基向量,比如下图中,两个基向量分别是 b 1 ⃗ , b 2 ⃗ \vec{b_1}, \vec{b_2} b1 ,b2 。那么对应的向量就是单位向量。

image-20240420174354033

但是在标准的直角坐标系中, b 1 ⃗ , b 2 ⃗ \vec{b_1}, \vec{b_2} b1 ,b2 就不是单位向量了(如下图)。

image-20240420174501708

正是因为对基的不同选择,那么就造成了不同向量的表达。那么该如何实现不同基下的向量转换呢?

比如,在新坐标系中,有一向量 [ − 1 2 ] \begin{bmatrix} -1 \\ 2 \end{bmatrix} [12]。那么在标准的直角坐标系中应该是多少呢?

image-20240420183833759

其实很简单,根据#线性变换和矩阵#章节的内容就可以知道,矩阵与向量的乘积就表示了基向量的转换。计算过程如下图所示。新坐标系中,基向量为 b 1 ⃗ = [ 2 1 ] ; b 2 ⃗ = [ − 1 1 ] \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix} b1 =[21];b2 =[11]

image-20240420184419071

r如果仔细想一想,上述的过程是反着的。正常的逻辑不应该是用新坐标系中的 [ − 1 2 ] \begin{bmatrix} -1 \\ 2 \end{bmatrix} [12] b 1 ⃗ , b 2 ⃗ \vec{b_1}, \vec{b_2} b1 ,b2 构成的向量的逆相乘吗?这样才能够变换回去呀。

但是如果再仔细一想,新基向量为 b 1 ⃗ = [ 2 1 ] ; b 2 ⃗ = [ − 1 1 ] \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix} b1 =[21];b2 =[11]是在标准坐标系中表示的。那么假设 A = [ 2 − 1 1 2 ] A=\begin{bmatrix} 2 & -1 \\ 1 & 2 \end{bmatrix} A=[2112],那么对于新坐标系来说,其要转为标准直角坐标系下的向量,那么变换的逆矩阵就是A。


接下来就基变换的问题来引申出以往见过的矩阵表达式 A − 1 M A A^{-1}MA A1MA的含义是什么。

在标准的直角坐标系中,坐标系的逆时针循转可以用如下的矩阵来实现。

image-20240420192411758

那么如果用基向量为 b 1 ⃗ = [ 2 1 ] ; b 2 ⃗ = [ − 1 1 ] \vec{b_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix};\vec{b_2} = \begin{bmatrix} -1 \\ 1\end{bmatrix} b1 =[21];b2 =[11]的新坐标系中实现某一向量 v ⃗ \vec{v} v 在新坐标系中的转换呢?

在下图的公式中(矩阵相乘从右往左看)就给出了计算的转换方法。其中 A = [ 2 − 1 1 2 ] A=\begin{bmatrix} 2 & -1 \\ 1 & 2 \end{bmatrix} A=[2112], M = [ 0 − 1 1 0 ] M=\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix} M=[0110]

image-20240420193824126

所以, A − 1 M A A^{-1}MA A1MA暗示了一种数学上的转移作用,中间矩阵 M M M表示某种变换,而外侧的两个矩阵代表着转移作用,页就是视觉上的转化。

特征值和特征向量

首先考虑这样一个问题,对于一个向量,其张成的空间如下图所示(也就是通过原点和向量尖端的直线)

image-20240417171444302

现在让这个坐标系进行变换,变换矩阵为 [ 3 1 0 2 ] \begin{bmatrix} 3&1\\ 0&2\\ \end{bmatrix} [3012],那么此时大部分的向量离开了其张成的空间,效果如下图:

image-20240417171837542

但是,有一些向量却没有离开其张成的空间,变换矩阵只是对其进行了缩放而已,效果如下图所示:

image-20240417171944636

在经过定性分析之后,我们展开对其的定量分析。在变换的过程中我们发现有两组向量张成的空间是特殊的(即没有离开其张成的空间),我们依次来看。

首先是x轴的变换,如下图所示,在变换之后,单位长度被放大了3倍。

image-20240417173945616 image-20240417174053228

而向量 [ − 1 , 1 ] [-1, 1 ] [1,1]也是同样,但是其单位长度倍放大了2倍。

image-20240417174230763 image-20240417174341088

那么对这两个向量的缩放结果如下图所示:

image-20240417174647624

而这两个向量就是我们所说的特征向量,而缩放的倍数就是特征值。

特征向量的特点:在旋转之后还会留在他张成(形成)的向量空间里。

特征值是衡量特征向量在变换中拉伸或者压缩比例的因子。

image-20240417174856517

从这里可以看出特征值的乘积就是经过线性变换后矩阵行列式的值,如果特征值出现了负数,那么其几何含义与行列式是一样的。

理解线性变换作用的关键往往较少依赖于特定坐标系。(This gives too mush weight to our coordinate system)

更好的方法就是求出它的特征向量和特征值。


扩展了解:

  1. 若想考虑为什么那么重要,那么具有用途并值得研究,那么就来考虑三维空间中的旋转。

  2. 对角矩阵的应用以及如何转化。

    如果一个矩阵可以对角化,那么可以有很多用处,比如幂迭代法求解特征值分解和奇异值分解等


2024/04/17:只对向量的本质作了进一步的了解。只能说数形结合太重要了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/922894.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Jmeter的组件执行顺序

在 Apache JMeter 中&#xff0c;组件的加载和执行顺序遵循一定的规则&#xff0c;但有些组件在同一层级中可能会根据它们在测试计划中的位置来决定具体的执行顺序。以下是这些组件的大致加载和执行顺序&#xff0c;以及哪些组件属于同一层级&#xff1a; 线程组&#xff08;Th…

计算机网络八股整理(一)

计算机网络八股文整理 一&#xff1a;网络模型 1&#xff1a;网络osi模型和tcp/ip模型分别介绍一下 osi模型是国际标准的网络模型&#xff0c;它由七层组成&#xff0c;从上到下分别是&#xff1a;应用层&#xff0c;表示层&#xff0c;会话层&#xff0c;传输层&#xff0c;…

今天你学C++了吗?——C++中的类与对象(第二集)

♥♥♥~~~~~~欢迎光临知星小度博客空间~~~~~~♥♥♥ ♥♥♥零星地变得优秀~也能拼凑出星河~♥♥♥ ♥♥♥我们一起努力成为更好的自己~♥♥♥ ♥♥♥如果这一篇博客对你有帮助~别忘了点赞分享哦~♥♥♥ ♥♥♥如果有什么问题可以评论区留言或者私信我哦~♥♥♥ ✨✨✨✨✨✨ 个…

【C++习题】14.滑动窗口_找到字符串中所有字母异位词

文章目录 题目链接&#xff1a;题目描述&#xff1a;解法C 算法代码&#xff1a;图解 题目链接&#xff1a; 438. 找到字符串中所有字母异位词 题目描述&#xff1a; 解法 暴力解法&#xff1a; 字母排序后运用滑动窗口解题。 滑动窗口哈希表&#xff1a; 我们可以优化一下&am…

Spring Boot集成MyBatis-Plus:自定义拦截器实现动态表名切换

Spring Boot集成MyBatis-Plus&#xff1a;自定义拦截器实现动态表名切换 一、引言 介绍动态表名的场景需求&#xff0c;比如多租户系统、分表分库&#xff0c;或者不同业务模块共用一套代码但操作不同表。说明 MyBatis-Plus 默认绑定固定表名的问题。 二、项目配置 1. 集成 M…

深入探索API爬虫工作的技术难点与高效解决思路

在大数据与信息化高速发展的今天&#xff0c;API&#xff08;应用程序编程接口&#xff09;爬虫成为了数据收集与分析的重要工具。然而&#xff0c;API爬虫工作并非一帆风顺&#xff0c;它面临着诸多技术挑战。本文将深入探讨几个API爬虫工作的技术难点&#xff0c;并提出相应的…

css效果

css炫彩流光圆环效果 <!DOCTYPE html> <html><head><meta charset"utf-8" /><title></title><style>*{margin: 0;padding: 0;}body{width: 100%;height: 100vh;}.container{position: relative;width: 100%;height: 100vh…

arm Rk1126 编译Qt工程报错: Could not find qmake spec

首先修改qmake.conf文件&#xff0c;配置好正确的交叉编译工具&#xff1a; 然后执行编译&#xff1a; /opt/Rv1126/Rv1126-盒子代码/rv1126-qt5-sdk/bin/qmake untitled.pro 报错。 原因&#xff1a;中文路径。修改路径为英文路径即可

zabbix监控进程

使用zabbix监控指定的进程&#xff0c;现在主要使用监控一些用java python写的一些微服务模块&#xff0c;我这边用于演示就直接使用nginx服务来演示了 创建监控项 name - 进程名称&#xff08;默认为 ALL PROCESSES);user - 用户名&#xff08;默认为 all users);state - 可能…

php 导出excel 一个单元格 多张图片

public function dumpData(){error_reporting(0); // 禁止错误信息输出ini_set(display_errors, 0); // 不显示错误$limit $this->request->post(limit, 20, intval);$offset $this->request->post(offset, 0, intval);$page floor($offset / $limit) 1 ;$wh…

【C++11】锋芒毕露

(续) 一、可变参数模板 C11支持可变参数模板&#xff0c;也就是说支持可变数量参数的函数模板和类模板&#xff0c;可变数目的参数被称 为参数包&#xff0c;存在两种参数包&#xff1a;模板参数包&#xff0c;表示零或多个模板参数&#xff1b;函数参数包&#xff1a;表示零…

用户管理(MySQL)

目录 1用户管理&#xff08;MySQL&#xff09; 1.1 用户 1.1.1 用户信息 1.1.2 创建用户(后%是可以任意远端登录) 1.1.3 刷新一下 1.1.4 删除用户 1.1.5 修改用户密码 1.2 数据库的权限 1.2.1 登录创建用户 1.2.2给权限 1.2.2.1 把jj数据库中uu表的权限给woaini这个…

Hive离线数仓结构分析

Hive离线数仓结构 首先&#xff0c;在数据源部分&#xff0c;包括源业务库、用户日志、爬虫数据和系统日志&#xff0c;这些都是数据的源头。这些数据通过Sqoop、DataX或 Flume 工具进行提取和导入操作。这些工具负责将不同来源的数据传输到基于 Hive 的离线数据仓库中。 在离线…

Linux——Uboot命令使用

什么是Uboot&#xff1f; 1&#xff09;Uboot是一个裸机程序&#xff0c;比较复杂。类似我们PC机的BIOS程序。 2&#xff09;Uboot就是一个bootloader&#xff0c;作用就是用于启动Linux或者其他系统&#xff0c;Uboot最主要的工作是初始化DDR&#xff0c;因为Linux的运行是运行…

Cannal实现MySQL主从同步环境搭建

大家好&#xff0c;我是袁庭新。 在多数情况下&#xff0c;客户端往往会优先获取缓存中的数据。然而&#xff0c;当缓存数据与数据库中的实际数据存在显著不一致时&#xff0c;可能会导致严重的后果。因此&#xff0c;确保数据库与缓存数据之间的一致性变得至关重要&#xff0c…

C++《二叉搜索树》

在初阶数据结构中我学习了树基础的概念以及了解了顺序结构的二叉树——堆和链式结构二叉树该如何实现&#xff0c;那么接下来我们将进一步的学习二叉树&#xff0c;在此会先后学习到二叉搜索树、AVL树、红黑树&#xff1b;通过这些的学习将让我们更易于理解后面set、map、哈希等…

C++ —— 以真我之名 如飞花般绚丽 - 智能指针

目录 1. RAII和智能指针的设计思路 2. C标准库智能指针的使用 2.1 auto_ptr 2.2 unique_ptr 2.3 简单模拟实现auto_ptr和unique_ptr的核心功能 2.4 shared_ptr 2.4.1 make_shared 2.5 weak_ptr 2.6 shared_ptr的缺陷&#xff1a;循环引用问题 3. shared_ptr 和 unique_…

springboot项目使用maven打包,第三方jar问题

springboot项目使用maven package打包为可执行jar后&#xff0c;第三方jar会被打包进去吗&#xff1f; 答案是肯定的。做了实验如下&#xff1a; 第三方jar的项目结构及jar包结构如下&#xff1a;&#xff08;该第三方jar采用的是maven工程&#xff0c;打包为普通jar&#xf…

第六届智能控制、测量与信号处理国际学术会议 (ICMSP 2024)

重要信息 2024年11月29日-12月1日 中国陕西西安石油大学雁塔校区 大会官网&#xff1a;www.icmsp.net 大会简介 第六届智能控制、测量与信号处理国际学术会议&#xff08;ICMSP 2024&#xff09;由西安石油大学、中海油田服务股份有限公司、浙江水利水电学院与中国石油装备…

设计LRU缓存

LRU缓存 LRU缓存的实现思路LRU缓存的操作C11 STL实现LRU缓存自行设计双向链表 哈希表 LRU&#xff08;Least Recently Used&#xff0c;最近最少使用&#xff09;缓存是一种常见的缓存淘汰算法&#xff0c;其基本思想是&#xff1a;当缓存空间已满时&#xff0c;移除最近最少使…