【人工智能里的数学】线性代数基础

系列文章目录

【人工智能学习笔记】人工智能里的数学——概述
【人工智能里的数学】一元函数微分学


文章目录

  • 系列文章目录
  • 前言
  • 一、向量与其运算
    • 1.2 行向量和列向量
    • 1.3 向量的运算
      • 1.3.1 向量的加减
      • 1.3.2 向量的数乘运算
      • 1.3.3 转置
      • 1.3.4 运算法则
      • 1.3.5 向量的内积
    • 1.4 向量的范数
    • 1.5 特殊的向量
      • 1.5.1 零向量
      • 1.5.2 单位向量
  • 二、矩阵与其运算
    • 2.1 方阵,对称矩阵,单位矩阵,对角线
      • 2.1.1 方阵
      • 2.1.2 对称矩阵
      • 2.1.3 单位矩阵
      • 2.1.4 对角阵
    • 2.2 矩阵的运算
      • 2.2.1 矩阵的加减
      • 2.2.2 数乘
      • 2.2.3 转置
      • 2.2.4 矩阵的乘法
    • 2.3 逆矩阵
    • 2.4 行列式
  • 总结


前言

与软件开发相比,人工智能领域需要大量数学知识。主要涉及微积分、线性代数、概率论和最优化。
本文主要介绍线性代数基础。
本文作为我学习人工智能的笔记,主要供自己以后温故知新,在此梳理一遍也算是二次学习。如对您有所帮助,不甚荣幸。若所言有误,十分欢迎指正。如有侵权,请联系作者删除。


一、向量与其运算

向量是线性代数里面最基本的概念,它其实就是一维数组,由 N 个数构成的,
X = (X1 X2 . . Xn)
向量的几何意义就是空间中的点,物理意义速度或者力这样的矢量,
在这里插入图片描述
向量的分量我们称之为维度,n 维向量集合的全体就构成了 n 维欧式空间:
在这里插入图片描述

1.2 行向量和列向量

行向量是按行把向量排开,列向量是按列把向量排开
在这里插入图片描述
在数学中我们更多的把数据写成列向量,在编程语言中更多的把数据存成行向量。

1.3 向量的运算

向量的运算主要包含:加法,数乘,减法,内积,转置。下面我们一一列举:

1.3.1 向量的加减

等于它们的分量分别相加,显然两个向量的长度得是相等的,减法我们在这里不列举,很容易举一反三
在这里插入图片描述

1.3.2 向量的数乘运算

它是一个数和这个向量每个分量相乘
在这里插入图片描述

1.3.3 转置

把列向量变成行向量,把行向量变成列向量
在这里插入图片描述

1.3.4 运算法则

A+B+C=A+(B+C)
K*(X+Y)=KX+KY

1.3.5 向量的内积

两个列向量:
在这里插入图片描述
等于对应位置相乘再相加
两个向量的内积的本质是变成一个标量
在这里插入图片描述

1.4 向量的范数

范数的公式是向量每个分量绝对值P 次方再用幂函数计算P 分之一,这里P 肯定是整数
1,2,3…到正无穷都是可以的
向量的范数就是把向量变成一个标量,范数的表示就是两个竖线来表示,然后右下角写上P
在这里插入图片描述
在这里插入图片描述

  1. 范数是绝对值加和,1 阶范数写成L1
    在这里插入图片描述
  2. 范数是平方加和开根号,其实代表的是向量的长度,高中时候学的向量的模,2 范数写成L2
    在这里插入图片描述
    范数在后面是非常有用的,在后面讲正则项的时候会用到

1.5 特殊的向量

1.5.1 零向量

就是分量全为0 的向量
(0 0 . . 0)

1.5.2 单位向量

就是L2 范数/模/长度为1 的向量

二、矩阵与其运算

在这里插入图片描述
矩阵就是二维数组,上面是一个m 乘n 的矩阵,它有m 行,n 列,每行每列上面都有一个元素,每个元素都有行标i 和列标j,aij

2.1 方阵,对称矩阵,单位矩阵,对角线

2.1.1 方阵

方阵:下面介绍几种特殊的矩阵,如果m 等于n,那就称为方阵
在这里插入图片描述

2.1.2 对称矩阵

对称矩阵:定义是aij等于aji 那么就是对称矩阵,肯定是个方阵
在这里插入图片描述

2.1.3 单位矩阵

单位矩阵:主对角线都是1,其它位置是0,这称之为单位阵,单位矩阵写为I,一定是方阵,等同于数字里面的1
在这里插入图片描述

2.1.4 对角阵

对角阵:就是主对角线非0,其它位置是0
在这里插入图片描述

2.2 矩阵的运算

2.2.1 矩阵的加减

矩阵的加法就是矩阵的对应位置相加,减法也是一样就是对应位置相减
在这里插入图片描述

2.2.2 数乘

在这里插入图片描述
矩阵还有一种非常特殊的操作

2.2.3 转置

转置的操作和向量是一样的,就是把aij 变成aji,把行和列互换一下
在这里插入图片描述
在这里插入图片描述

2.2.4 矩阵的乘法

矩阵的乘法和一般的乘法是不太一样的
它是把第一个矩阵的每一行,和第二个矩阵的每一列拿过来做内积得到结果
在这里插入图片描述
满足分配律,结合律,和交换律
A+B+C=A+(B+C)
加法肯定是满足,重点看乘法
首先乘法是满足结合律的
(AB)C=A(BC)
满足分配律的,这里是左分配律,和右分配律
(A+B)C=AC+BC
A(B+C)=AB+AC
特别强调的是矩阵是不满足交换律的,不一定相等,甚至AB 的尺寸和BA 的尺寸是不同的
AB≠BA
还有一个特殊的转置的公式
在这里插入图片描述

2.3 逆矩阵

矩阵有AB,但是没有A/B 这么一说,只有逆矩阵
逆矩阵怎么定义的?
假设有个矩阵A,注意它一定是方阵,乘以矩阵B 等于I
AB=I
或者
BA=I
I 为单位矩阵,那么我们称这里的B 为A 的右逆矩阵,和左逆矩阵
有个很重要的结论就是,如果这样的B 存在的话,它的左逆和右逆一定相等,统称为A 的-1
矩阵求逆有什么用呢?它可以帮助我们解线性方程组,比如AZ=B
两边同时乘以A 的逆,那么Z=A 的-1 乘以B,它发明的目的也是干这样的事情用的
从这里我们也可以看出来单位矩阵像我们乘法里面的1
下面我们看一下公式:
在这里插入图片描述

2.4 行列式

行列式其实在机器学习中用的并不多,一个矩阵必须是方阵,才能计算它的行列式
行列式是把矩阵变成一个标量
在这里插入图片描述
在这里插入图片描述
前面讲的是行列式的计算方式,下面我们看下行列式的性质,当然这都是方阵而言的
在这里插入图片描述
数乘α,相当于α的n 次方乘以A 的行列式,因为刚才我们看计算方式的时候,相当于每一列都乘上了α所以是n 阶的嘛

在这里插入图片描述


总结

以上就是今天要讲的内容,本文仅仅简单介绍了线性代数的基础知识,属于大学数学中比较基础的知识点,后面会继续讲解线性代数的高级知识。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/5125.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

今年面试好激烈!

金三银四过去一半,市场火热,但是大家就业压力却没有缓解多少。 很多粉丝后台留言,Java程序员面临的竞争太激烈了…… 我自己也有实感,多年身处一线互联网公司,虽没有直面过求职跳槽的残酷,但经常担任技术面…

记一次Git未Commit直接Pull导致本地代码丢失后的挽救过程

第一次遇到这种问题,有点紧张... 好吧,废话不多说,IDEA或者AndroidStudio进入Git Uncommiteed Changes -> Unstash Changes: 在弹出的Unstash Changes对话框点View查看代码,如果代码是本地丢失的代码,那…

MySQL——distinct与group by去重 / 松散索引扫描紧凑索引扫描

本篇介绍MySQL中的 distinct 和 group by的区别,包括用法、效率,涉及松散索引扫描和紧凑索引扫描的概念;distinct用法示例:SELECT DISTINCT columns FROM table_name WHERE where_conditions;DISTINCT关键词修饰查询的列&#xff…

CVE-2023-28708 原理剖析

CVE-2023-28708 原理剖析这应该不是一个严重的漏洞,可能评分只能为低,因为并没有什么卵用。 话不多说,直接进入正题 我的复现环境: tomcat-8.5.50 首先我们得简单写一个servlet,当然不写也没事,因为我们的…

【C语言学习】结构体

结构体(Struct)从本质上讲是一种自定义的数据类型,只不过这种数据类型比较复杂,是由 int、char、float 等基本类型组成的。你可以认为结构体是一种聚合类型。 在实际开发中,我们可以将一组类型不同的、但是用来描述同…

[技术经理]02 什么是技术经理?

目录01什么是技术经理02总结01什么是技术经理 什么是技术经理? 我用一句话概括为:专业技术团队的管理者。 技术经理,是一种管理职位,通常是在软件开发、互联网等科技公司或技术团队中担任。 技术经理的职责,**是管理…

Docker入门

文章目录Docker为什么出现Docker能干嘛学习途径Docker安装Docker的基本组成环境说明安装步骤阿里云镜像加速底层原理Docker为什么出现 一款产品从开发到上线,从操作系统,到运行环境,再到应用配置。作为开发运维之间的协作我们需要 关心很多东…

文献阅读(247)AIpa

题目:Alpa: Automating Inter- and Intra-Operator Parallelism for Distributed Deep Learning时间:2022会议:OSDI研究机构:UCB 传统的DNN并行策略: 现有的分布式训练系统要么需要用户手动创建并行化计划&#xff0c…

测试笔记:接口测试

目录1.接口(1)接口概念(2)接口类型2、接口风格(1)传统风格(2)RESTful风格接口3、接口测试(1)接口测试是什么(2)接口测试原理&#xff…

Node.js学习笔记——fs模块

fs全称为file system,称之为文件系统,是Node.js中的内置模块,可以对计算机中的磁盘进行操作。 本章节会介绍如下操作: 文件写入文件读取文件移动与重命名文件删除文件夹操作查看资源状态 一、文件写入 文件写入就是将数据保存…

利用nginx实现动静分离的负载均衡集群实战

前言 大家好,我是沐风晓月,今天我们利用nginx来作为负载,实现两台apache服务器的动静分离集群实战; 本文收录于沐风晓月的专栏《linux基本功-系统服务实战》,更多内容可以关注我的博客: https://blog.csd…

Visual Studio 2015 + cmake编译QT5程序

概述 由于QT的集成开发环境QTCreate,在代码调试功能上远不及Visual Studio方便,因此,在Windows平台,可以使用Visual Studio来开发调试QT程序,本文章就主要介绍下,如何使用CMAKE编译QT5程序,并使…

【JAVA真的没出路了吗?】

2023年了,转行IT学习Java是不是已经听过看过很多次了。随之而来的类似学Java没出路、Java不行了、对Java感到绝望等等一系列的制造焦虑的话题也在网上层出不穷,席卷了一大片的对行业不了解的吃瓜群众或是正在学习中的人。如果是行外人真的会被这种言论轻…

【教程】使用ChatGPT制作基于Tkinter的桌面时钟

目录 描述 代码 效果 说明 下载 描述 给ChatGPT的描述内容: python在桌面上显示动态的文字,不要显示窗口边框。窗口背景和标签背景都是透明的,但标签内的文字是有颜色。使用tkinter库实现,并以class的形式书写,方…

GPS时间序列分析---剔除跳跃点,拟合时间序列

通常利用GPS时间序列进行数据分析时,会遇到大地震的发生,这个时候会导致GPS的观测结果出现很大的跳跃值,这对后续的数据处理和分析带来了困难。这里分享一个最近了解的,可以用于处理这一问题的工具包---TSAnalyzer。下面主要介绍该…

Adobe:当创意工作遇上生成式AI

放眼全球IT行业,当前最炙手可热的领域是什么?答案显然只有一个:因为ChatGPT而火爆全球的生成式AI(Artificial Intelligence Generated Content,简称AIGC),又称人工智能生成内容。那么当创意设计…

再学一下Feign的原理

简介 Feign是Spring Cloud Netflix组件中的一个轻量级Restful的HTTP服务客户端,它简化了服务间调用的方式。 Feign是一个声明式的web service客户端.它的出现使开发web service客户端变得更简单.使用Feign只需要创建一个接口加上对应的注解, 比如FeignClient注解。…

Go分布式爬虫学习笔记(十四)

文章目录14_context为什么需要Context?级联退出Context 的使用方法。context.ValuecontextContext 最佳实践Context 底层原理14_context Never start a goroutine without knowing how it will stop。 如果你不知道协程如何退出,就不要使用它。 为什么需要Context?…

家政服务系统APP小程序需具备哪些功能?

由于工作忙碌或者是懒人经济作祟,现代人对于家政服务的需求直线上升。而且互联网技术深入生活的方方面面,让上门家政服务系统开发成为很多线下家政公司转型互联网的方式,那么开发一款家政服务系统APP小程序需具备哪些功能呢? …

逻辑回归 算法推导与基于Python的实现详解

文章目录1 逻辑回归概述2 逻辑回归公式推导与求解2.1 公式推导2.2公式求解3 基于Python的实现3.1可接收参数3.2 完整代码示例1 逻辑回归概述 逻辑回归(Logistic Regression)是一种用于分类问题的统计学习方法。它基于线性回归的原理,通过将线…