矩阵乘法的直觉

矩阵乘法是什么意思?

一种常见的观点是矩阵乘法缩放/旋转/倾斜几何平面:

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

这在第一次学习向量时很有用:向量输入,新向量输出。不幸的是,这可能导致过度依赖几何可视化。

如果有 20 个家庭来参加你的烧烤,你如何估计你需要的热狗?(嗯……20 个家庭,假设每个家庭 3 人,每人 2 个热狗……大约 20 * 3 * 2 = 120 个热狗。)

你可能不会想“哦,我需要一个邀请-家庭规模-饥饿棱镜的体积!”。对于大型矩阵,我不会考虑 500 维向量,只会考虑要修改的数据。

另一种开发是矩阵乘法组成线性运算。

这是技术上准确的定义:是的,矩阵乘法会产生一个由原始函数组成的新矩阵。但是,有时被操作的矩阵不是线性运算,而是一组向量或数据点。我们需要另一种直觉来了解正在发生的事情。

我将以软件开发人员的观点来看待这个问题:

矩阵乘法与信息流有关,将数据转换为代码并转换回。

我认为线性代数是“数学电子表格”:

  • 我们将信息存储在各种电子表格(“矩阵”)中
  • 一些数据被视为要应用的函数,其他数据被视为要使用的数据点
  • 我们可以根据需要在向量和函数解释之间切换

有时我会将数据视为几何向量,有时我会将矩阵视为组合函数。但我主要考虑的是系统中的信息流动。

1、开发者的直觉:代码就是数据,数据就是代码

拿你最喜欢的食谱来说吧。如果你把这些词解释为指令,你最终会得到馅饼、松饼、蛋糕等。

如果你把这些词解释为数据,那么文本就是可以调整的散文:

  • 将测量单位转换为公制单位
  • 由于过敏而更换配料
  • 根据海拔高度或不同的设备进行调整

结果是一个新的食谱,可以进一步调整,或作为指令执行,制作不同的馅饼、松饼、蛋糕等。编译器将程序视为文本,对其进行修改,并最终输出“指令”——可能是另一层的文本。

这就是线性代数。我们将“3 4 5”等原始信息视为向量或函数,具体取决于它的写法:

按照惯例,垂直列通常是一个向量,水平行通常是一个函数:

  • [3; 4; 5] 表示 x = (3, 4, 5)。这里,x 是一个数据向量(我使用 ; 来分隔每行)。
  • [3 4 5] 表示 f(a, b, c) = 3a + 4b + 5c。这是一个接受三个输入并返回单个结果的函数。

然后就是顿悟时刻:数据就是代码,代码就是数据!

包含水平函数的行实际上可以是三个数据点(每个数据点都有一个元素)。垂直数据列实际上可以是三个不同的函数,每个函数都采用一个参数。

啊。这变得简洁了:根据期望的结果,我们可以以不同的顺序组合数据和代码。

2、矩阵转置

矩阵转置交换行和列。这是它在实践中的含义。

如果 x 是一个有 3 个条目的列向量( [3; 4; 5] ),那么 x' 是:

  • 采用 3 个参数的函数( [3 4 5]
  • x'仍然可以保留为数据向量,但作为三个单独的条目。转置“将其拆分”。

类似地,如果 f = [3 4 5] 是我们的行向量,那么 f' 可以表示:

  • 垂直列中的单个数据向量。
  • f' 分为三个函数(每个函数采用一个输入)。

让我们在实践中使用它。

当我们看到 x' * x 时,我们的意思是:`x'`(作为单个函数)正在对 x(单个向量)进行操作。结果是点积。换句话说,我们将数据应用于自身。

当我们看到 x * x' 时,我们的意思是 x(作为一组函数)正在对 x'(一组单独的数据点)进行操作。结果是一个网格,我们将每个函数应用于每个数据点。在这里,我们以每种可能的排列方式将数据与其自身混合在一起。

我认为 xx 是 x(x)。它是作用于“向量 x”的“函数 x”。这有助于计算协方差矩阵,即数据中自相似性的度量。

3、将直觉付诸实践

这对我们有什么帮助?当我们看到这样的方程式(来自机器学习课程):

我现在立刻感觉到发生了什么。在第一个方程式中,我们将 θ(通常是一组数据参数)视为一个函数,并将 作为一个参数传入。这应该会给我们一个单一的值。

更复杂的推导如下:

可以同样解读。在某些情况下,这会变得很棘手,因为我们将数据存储为矩阵中的行(而不是列),但现在我有更好的工具可以跟进。你可以开始估计何时会得到一个单一的值,或者何时会得到一个“排列网格”。

几何缩放和线性组合都有它们的位置,但在这里我想考虑信息。“x 中的信息正在成为一个函数,我们将它自己作为参数传递。”

长话短说,不要局限于单一的直觉。乘法从重复加法发展而来,到缩放(小数),到旋转(虚数),到“应用”一个数字到另一个数字(积分),等等。为什么矩阵乘法不一样呢?


原文链接:矩阵乘法的直觉 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/716368.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Django REST framework序列化器详解:普通序列化器与模型序列化器的选择与运用

系列文章目录 Django入门全攻略:从零搭建你的第一个Web项目Django ORM入门指南:从概念到实践,掌握模型创建、迁移与视图操作Django ORM实战:模型字段与元选项配置,以及链式过滤与QF查询详解Django ORM深度游&#xff…

实用技巧:跳过TCODE权限检查ALINK_CALL_TRANSACTION

RFC:ALINK_CALL_TRANSACTION 遇到tcode 提示没有权限打开,可以通过这个RFC,debug 修改检查值,打开TCODE。 适用于紧急情况 断点打在20行,SY-SUBRC 的值改成 1

碳化硅陶瓷膜出色的耐腐蚀性能

在科技日新月异的今天,材料科学的发展为各个领域带来了革命性的变革。碳化硅陶瓷膜,作为一种高性能的先进陶瓷材料,凭借其独特的物理和化学特性,正在逐步成为现代工业不可或缺的一部分。 碳化硅陶瓷膜,顾名思义&#x…

TensorRT的循环样例代码

官方文档地址 https://docs.nvidia.com/deeplearning/tensorrt/developer-guide/index.html#define-loops 非顺序结构,其内容确实有点乱,而且没有完整可运行的样例。 可以有多个IIteratorLayer, IRecurrenceLayer, and ILoopOutputLayer 层,最多有2个ITripLimitLayers层。 …

有人说考个PMP证两个星期搞定?

PMP考试的时间并不需要太久,如果高效用心备考的话在对考试需要准备的时间上也只需要2-3个月的业余时间。而一次考试的时间也只需要半天,一门科目,就是《PMBOK》的知识。所以如果想学习项目管理考PMP认证的朋友,大可放心参加考试。…

【递归、搜索与回溯】综合练习三

综合练习三 1.优美的排列3.N 皇后3.有效的数独4.解数独 点赞👍👍收藏🌟🌟关注💖💖 你的支持是对我最大的鼓励,我们一起努力吧!😃😃 1.优美的排列 题目链接:5…

用寄存器读取文件的数据的时候,寄存器怎么读取,寄存器的高位和低位分别是什么

如图所示 寄存器读取数据的时候,数据自身是什么样的,寄存器读的时候就原样存储在寄存器里,高位就是第一个数据,低位就是最后一个数据 寄存器读取数据原理是,将给定的二进制数反转,我理解成调转一下车头&…

驾驭未来:智能网关如何革新车联网体验

车联网(Internet of Vehicles)是一个跨领域的技术综合体,它基于物联网,利用先进的信息通信技术实现车与车、车与路、车与人、车与服务平台等的全方位网络连接。 龙兴物联智能网关是集成了多协议、多接口,具有综合数据采…

Three.js动效(第15辑):让前端手撕UI,拳打后端的效果。

three.js的设计效果非常复杂,后端提供的数据接口问题百出,这很容易让前端手撕UI、拳打后端,这种请详细该如何办呢? 前端 VS UI: 1. 沟通协调:UI和前端应该加强沟通,理解对方的工作难点和需求&…

「GitHub热点速览」7个学编程必看的开源项目!附链接可直达!

前言 今天特推的两个项目都是异常实用的项目,一个是直接将视频替换成另外一个语种;另外一个则是解决日志阅读问题的 tailspin,让你在成千上万条日志中快速定位特定的日志。 另外,还有两大集成者,一个是解决可观测性的…

去哪儿网PMO张璐受邀为第十三届中国PMO大会演讲嘉宾

全国PMO专业人士年度盛会 去哪儿网PMO张璐女士受邀为PMO评论主办的2024第十三届中国PMO大会演讲嘉宾,演讲议题为“数字化助力组织目标落地”。大会将于6月29-30日在北京举办,敬请关注! 议题简要 本次议题将分享去哪儿流程标准化&工具化…

python17 字符串的常用操作

字符串常用方法 代码 字符串常用方法s i am SyLar, I LOVE YOU s1 s.capitalize()# 首字母变成大写 print(s1) s2s.lower() # 全部变成小写 print(s2) s3 s.upper()#全部变成大写 忽略大小写 推荐用这个 print(s3)title abc_def_hi print(标题:,title.title())s4 HelloWor…

2024年第三届数据统计与分析竞赛(A题)数学建模完整思路+完整代码全解全析

本次A题主要涉及正态分布、数据处理、自然语言处理等知识点 问题一题目重述:根据附件中抖音用户的评论数据,对抖音 APP 的“评分”和“点赞数”进行数据统计与分析,并使用假设检验判断这两个指标的分布是否服从正态分布。 接下来对问题一进…

2024南京人工智能展览会:推动南京地区人工智能产业快速发展

南京,作为长三角地区的一颗璀璨明珠,近年来在人工智能产业的发展上取得了举世瞩目的成绩。这座城市以其深厚的科技底蕴和前瞻的战略眼光,正逐步成为国内外人工智能技术研发和应用的重要基地。 近年来,随着人工智能技术的快速发展…

纷享销客PaaS平台基础能力:一文说清 “业务定制能力”

01、业务对象定制能力 一个优秀的PaaS(平台即服务)平台的业务对象定制能力应该具备以下特点: 敏捷的业务模型: 能够根据用户的业务需求,提供可定制的数据模型和数据处理能力,支持各种数据类型和数据操作。 可视化的界面定制能力…

Nature 苏浩团队发表创新人工智能“仿真中学习”框架,实现外骨骼的智能性和通用性

北京时间2024年6月12日23时,美国北卡罗来纳州立大学与北卡罗来纳大学教堂山分校的苏浩团队在《自然》(Nature)上发表了一篇关于机器人和人工智能算法相结合服务人类的突破性研究论文,标题为“Experiment-free Exoskeleton Assista…

股票交易系统

效果展示,如下动图: 首先简述一下股票交易规则: 买卖股票,股民可以自行选择股票的买入或卖出价格和股票的数量,但是用户不一定马上就交易成功,只有当股票价格低于买入价才有机会买入,高于卖出价…

MS1112驱动开发(iio框架)

作者简介: 一个平凡而乐于分享的小比特,中南民族大学通信工程专业研究生在读,研究方向无线联邦学习 擅长领域:驱动开发,嵌入式软件开发,BSP开发 作者主页:一个平凡而乐于分享的小比特的个人主页…

期货交易中的仓位管理

期货市场就像是一个复杂的游戏场所。由于期货高杠杆双向交易机制的影响,期货交易中错误的容忍度很低,所以期货交易系统中最重要的是风险控制。而风险控制体系最核心的是仓位管理,因为仓位的多少直接影响到潜在损失的大小。 仓位管理指的是账户…

做好程序前设计

不要小看任何一道编程题目!一定一定一定要想好之后再动手!!! 带上你的草稿本!!!!!!!!!!!&#xf…