线性代数
1 行列式
1.1 n n n 阶行列式
定义 1.1.1:称以下的式子为一个
n
n
n 阶行列式:
∣
A
∣
=
∣
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
⋯
a
n
n
∣
\begin{vmatrix}\mathbf A\end{vmatrix}= \begin{vmatrix} a_{11}& a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}
A
=
a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann
其中第
i
i
i 行第
j
j
j 列的元素成为行列式
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
的第
(
i
,
j
)
(i,j)
(i,j) 元素。
元素
a
11
,
a
22
,
⋯
,
a
n
n
a_{11},a_{22},\cdots,a_{nn}
a11,a22,⋯,ann 称为
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
的主对角线。
性质 1:上三角行列式的值等于其对角线元素之和。
性质 2:行列式某行(列)全为零,则行列式的值等于零。
性质 3:用常数
c
c
c 乘以行列式的某一行(列),得到的行列式的值等于原行列式的值的
c
c
c 倍。
性质 4:交换行列式不同的两行(列),行列式的值变号。
性质 5:若行列式两行(列)成比例,则行列式的值为零。
性质 6:若行列式中某行(列)元素均为两项之和,则行列式可表示为两个行列式之和。
性质 7:行列式的某一行(列)乘以某个数加到另一行(列)上,行列式的值不变。
性质 8:行列式和其转置有相同的值。
定义 1.1.2:定义元素
a
i
j
a_{ij}
aij 的余子式
M
i
j
M_{ij}
Mij 为由其行列式
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
中划去第
i
i
i 行第
j
j
j 列后剩下的元素组成的行列式。
定义 1.1.3:在行列式
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
中,
a
i
j
a_{ij}
aij 的代数余子式定义为:
A
i
j
=
(
−
1
)
i
+
j
M
i
j
A_{ij} = (-1)^{i+j}M_{ij}
Aij=(−1)i+jMij,其中
M
i
j
M_{ij}
Mij 为
a
i
j
a_{ij}
aij 的余子式。
1.2 行列式的展开
设
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
是
n
n
n 阶行列式,元素
a
i
j
a_{ij}
aij 的代数余子式记为
A
i
j
A_{ij}
Aij,则对任意
s
,
r
(
=
1
,
2
,
⋯
,
n
)
,
s
≠
r
s,r(=1,2,\cdots,n),s\neq r
s,r(=1,2,⋯,n),s=r 存在:
∣
A
∣
=
∑
i
=
1
n
a
i
r
A
i
r
∑
i
=
1
n
a
i
r
A
i
s
=
0
\begin{vmatrix}\mathbf A\end{vmatrix}=\sum\limits_{i=1}^n a_{ir}A_{ir} \\ \sum\limits_{i=1}^n a_{ir}A_{is}=0
A
=i=1∑nairAiri=1∑nairAis=0
1.3 Cramer 法则
设线性方程组:
{
a
11
x
1
+
a
12
x
2
+
⋯
+
a
1
n
x
n
=
b
1
a
21
x
1
+
a
22
x
2
+
⋯
+
a
2
n
x
n
=
b
2
⋯
a
n
1
x
1
+
a
n
2
x
2
+
⋯
+
a
n
n
x
n
=
b
n
\begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1 \\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2 \\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \cdots \\ a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n \end{cases}
⎩
⎨
⎧a11x1+a12x2+⋯+a1nxn=b1a21x1+a22x2+⋯+a2nxn=b2 ⋯an1x1+an2x2+⋯+annxn=bn
记其系数行列式为
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
,则:
x
1
=
∣
A
1
∣
∣
A
∣
,
x
2
=
∣
A
2
∣
∣
A
∣
,
⋯
,
x
n
=
∣
A
n
∣
∣
A
∣
x_1=\dfrac{\begin{vmatrix}\mathbf A_1\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}},x_2=\dfrac{\begin{vmatrix}\mathbf A_2\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}},\cdots,x_n=\dfrac{\begin{vmatrix}\mathbf A_n\end{vmatrix}}{\begin{vmatrix}\mathbf A\end{vmatrix}}
x1=
A
A1
,x2=
A
A2
,⋯,xn=
A
An
其中 ∣ A j ∣ \begin{vmatrix}\mathbf A_j\end{vmatrix} Aj 为 ∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 去掉第 j j j 列并用 b 1 , b 2 , ⋯ , b n b_1,b_2,\cdots,b_n b1,b2,⋯,bn 将之替换的 n n n 阶行列式。
2 矩阵
2.1 矩阵的概念
定义 2.1.1:由
m
n
mn
mn 个数
a
i
j
(
i
=
1
,
2
,
⋯
,
m
;
j
=
1
,
2
,
⋯
n
)
a_{ij}(i=1,2,\cdots,m;j=1,2,\cdots n)
aij(i=1,2,⋯,m;j=1,2,⋯n) 排成
m
m
m 行
n
n
n 列的矩形阵列:
a
11
a
12
⋯
a
1
n
a
21
a
22
⋯
a
2
n
⋮
⋮
⋱
⋮
a
n
1
a
n
2
⋯
a
n
n
\begin{matrix} a_{11}&a_{12}&\cdots&a_{1n} \\ a_{21}&a_{22}&\cdots&a_{2n} \\ \vdots&\vdots&\ddots&\vdots \\ a_{n1}&a_{n2}&\cdots&a_{nn} \\ \end{matrix}
a11a21⋮an1a12a22⋮an2⋯⋯⋱⋯a1na2n⋮ann
称为
m
m
m 行
n
n
n 列矩阵,简称为
m
×
n
m\times n
m×n 矩阵(或
m
×
n
m\times n
m×n 阵)。
若
A
\mathbf A
A 的元素全是实数则称
A
\mathbf A
A 为实矩阵。
若
A
\mathbf A
A 的元素全是复数则称
A
\mathbf A
A 为复矩阵。
若所有元素均为
0
0
0 则称为零矩阵
O
\mathrm O
O,或
O
m
×
n
\mathrm O_{m\times n}
Om×n。
若
m
=
n
m=n
m=n 则称为方阵,反之为长方阵。
若方阵
A
\mathbf A
A 仅存在对角元
a
11
,
a
22
,
⋯
,
a
n
n
a_{11},a_{22},\cdots,a_{nn}
a11,a22,⋯,ann 则简记为
A
=
d
i
a
g
(
a
11
,
a
22
,
⋯
,
a
n
n
)
\mathbf A=\mathbf{diag}(a_{11},a_{22},\cdots,a_{nn})
A=diag(a11,a22,⋯,ann)。
进一步,若
a
11
=
a
22
=
⋯
=
a
n
n
=
1
a_{11}=a_{22}=\cdots=a_{nn}=1
a11=a22=⋯=ann=1 则称
I
n
=
d
i
a
g
(
1
,
1
,
⋯
,
1
)
\mathbf {I_n}=\mathbf{diag}(1,1,\cdots,1)
In=diag(1,1,⋯,1) 为
n
n
n 阶单位矩阵。
2.2 矩阵的运算
一、矩阵加减法
定义 2.2.1:设有两个
m
×
n
m\times n
m×n 矩阵
A
=
(
a
i
j
)
,
B
=
(
b
i
j
)
\mathbf A=(a_{ij}),\mathbf B=(b_{ij})
A=(aij),B=(bij),定义
A
+
B
\mathbf A+\mathbf B
A+B 是一个
m
×
n
m\times n
m×n 矩阵且
A
+
B
\mathbf A+\mathbf B
A+B 的第
(
i
,
j
)
(i,j)
(i,j) 元素等于
a
i
j
+
b
i
j
a_{ij}+b_{ij}
aij+bij,即
A
+
B
=
(
a
i
j
+
b
i
j
)
\mathbf A+\mathbf B=(a_{ij}+b_{ij})
A+B=(aij+bij)
矩阵的减法可看作矩阵加法的逆运算,即
A
−
B
=
(
a
i
j
−
b
i
j
)
\mathbf A-\mathbf B=(a_{ij}-b_{ij})
A−B=(aij−bij)
定义 2.2.2:定义
A
=
(
a
i
j
)
\mathbf A=(a_{ij})
A=(aij) 的负矩阵为
−
A
=
(
−
a
i
j
)
-\mathbf A=(-a_{ij})
−A=(−aij),则有
A
+
(
−
A
)
=
O
\mathbf A+(-\mathbf A)=\mathbf O
A+(−A)=O。
矩阵加减法运算规则:
- 交换律: A + B = B + A \mathbf A+\mathbf B=\mathbf B+\mathbf A A+B=B+A。
- 结合律: ( A + B ) + C = A + ( B + C ) (\mathbf A+\mathbf B)+\mathbf C=\mathbf A+(\mathbf B+\mathbf C) (A+B)+C=A+(B+C)。
- O + A = A + O = A \mathbf O+\mathbf A=\mathbf A+\mathbf O=\mathbf A O+A=A+O=A。
- A + ( − B ) = A − B \mathbf A+(-\mathbf B)=\mathbf A-\mathbf B A+(−B)=A−B。
二、矩阵的数乘
定义 2.2.3:设 A \mathbf A A 是一个 m × n m\times n m×n 矩阵, A = ( a i j ) m × n \mathbf A=(a_{ij})_{m\times n} A=(aij)m×n, c c c 是一个常数,定义 c A = ( c a i j ) m × n c\mathbf A=(ca_{ij})_{m\times n} cA=(caij)m×n 。 c A c\mathbf A cA 称为数 c A c\mathbf A cA 的数乘。
矩阵的数乘运算规则:
- c ( A + B ) = c A + c B c(\mathbf A+\mathbf B)=c\mathbf A+c\mathbf B c(A+B)=cA+cB。
- ( c + d ) A = c A + d A (c+d)\mathbf A=c\mathbf A+d\mathbf A (c+d)A=cA+dA。
- ( c d ) A = c ( d A ) (cd)\mathbf A=c(d\mathbf A) (cd)A=c(dA)。
- 1 ⋅ A = A 1\cdot\mathbf A=\mathbf A 1⋅A=A。
- 0 ⋅ A = O 0\cdot\mathbf A=\mathbf O 0⋅A=O。
三、矩阵的乘法
定义 2.2.4:设有
m
×
k
m\times k
m×k 矩阵
A
=
(
a
i
j
)
m
×
k
\mathbf A=(a_{ij})_{m\times k}
A=(aij)m×k,以及
k
×
n
k\times n
k×n 矩阵
B
=
(
b
i
j
)
m
×
n
\mathbf B=(b_{ij})_{m\times n}
B=(bij)m×n。定义
A
\mathbf A
A 和
B
\mathbf B
B 的乘积
A
B
\mathbf A\mathbf B
AB 是一个
m
×
n
m\times n
m×n 矩阵且
A
B
\mathbf A\mathbf B
AB 的第
(
i
,
j
)
(i,j)
(i,j) 元素
c
i
j
=
∑
l
=
1
k
a
i
l
b
l
j
c_{ij}=\sum\limits_{l=1}^ka_{il}b_{lj}
cij=l=1∑kailblj
矩阵乘法的运算规则:
- 结合律: ( A B ) C = A ( B C ) (\mathbf A\mathbf B)\mathbf C=\mathbf A(\mathbf B\mathbf C) (AB)C=A(BC)。
- 左右分配律: A ( B + C ) = A B + A C , ( A + B ) C = A B + B C \mathbf A(\mathbf B+\mathbf C)=\mathbf A\mathbf B+\mathbf A\mathbf C,(\mathbf A+\mathbf B)\mathbf C=\mathbf A\mathbf B+\mathbf B\mathbf C A(B+C)=AB+AC,(A+B)C=AB+BC。
- c ( A B ) = ( c A ) B = A ( c B ) c(\mathbf A\mathbf B)=(c\mathbf A)\mathbf B=\mathbf A(c\mathbf B) c(AB)=(cA)B=A(cB)。
- 对任意的 m × n m\times n m×n 矩阵 A \mathbf A A, I m A = A = A I n \mathbf {I_m}\mathbf A=\mathbf A=\mathbf A\mathbf {I_n} ImA=A=AIn。
方阵幂运算规则:
- A r A s = A r + s \mathbf A^r\mathbf A^s=\mathbf A^{r+s} ArAs=Ar+s。
- ( A r ) s = A r s (\mathbf A^r)^s=\mathbf A^{rs} (Ar)s=Ars。
四、矩阵的转置
定义 2.2.5:设 A = ( a i j ) \mathbf A=(a_{ij}) A=(aij) 是 m × n m\times n m×n 矩阵,定义 A \mathbf A A 的转置 A T \mathbf A^{\mathbf T} AT 为一个 n × m n\times m n×m 矩阵,它的第 k k k 行正好是矩阵 A \mathbf A A 的第 k k k 列( k = 1 , 2 , ⋯ , n k=1,2,\cdots,n k=1,2,⋯,n);它的第 r r r 行是 A \mathbf A A 的第 r r r 行( r = 1 , 2 , ⋯ , n r=1,2,\cdots,n r=1,2,⋯,n)。
矩阵转置运算规则:
- ( A T ) T = A (\mathbf A^{\mathbf T})^{\mathbf T}=\mathbf A (AT)T=A。
- ( A + B ) T = A T + B T (\mathbf A+\mathbf B)^{\mathbf T}=\mathbf A^{\mathbf T}+\mathbf B^{\mathbf T} (A+B)T=AT+BT。
- ( c A ) T = c A T (c\mathbf A)^{\mathbf T}=c\mathbf A^{\mathbf T} (cA)T=cAT。
- ( A B ) T = B T A T (\mathbf A\mathbf B)^{\mathbf T}=\mathbf B^{\mathbf T}\mathbf A^{\mathbf T} (AB)T=BTAT。
五、矩阵的共轭
定义 2.2.6:设
A
=
(
a
i
j
)
m
×
n
\mathbf A=(a_{ij})_{m\times n}
A=(aij)m×n 是一个复矩阵,则
A
\mathbf A
A 的共轭矩阵
A
‾
\overline{\mathbf A}
A 是一个
m
×
n
m\times n
m×n 复矩阵,且
A
‾
=
(
a
‾
i
j
)
m
×
n
\overline{\mathbf A}=(\overline a_{ij})_{m\times n}
A=(aij)m×n
矩阵共轭运算规则:
- A + B ‾ = A ‾ + B ‾ \overline{\mathbf A+\mathbf B}=\overline {\mathbf A}+\overline {\mathbf B} A+B=A+B。
- c A ‾ = c ‾ A ‾ \overline{c\mathbf A}=\overline c \overline {\mathbf A} cA=cA。
- A B ‾ = A ‾ B ‾ \overline{\mathbf A \mathbf B}=\overline{\mathbf A}\ \overline {\mathbf B} AB=A B。
- ( A T ) ‾ = ( A ‾ ) T \overline{({\mathbf A}^{\mathbf T})}=(\overline{\mathbf A})^{\mathbf T} (AT)=(A)T。
2.3 方阵的逆阵
定义 2.3.1:设
A
\mathbf A
A 是
n
n
n 阶方阵,若存在一个
n
n
n 阶方阵
B
\mathbf B
B,使得:
A
B
=
B
A
=
I
n
,
\mathbf A\mathbf B=\mathbf B\mathbf A=\mathbf {I_n},
AB=BA=In,
则称
B
\mathbf B
B 是
A
\mathbf A
A 的逆阵,记为
B
=
A
−
1
\mathbf B=\mathbf A^{-1}
B=A−1。凡有逆阵的矩阵称为可逆阵或非奇异阵(简称非异阵),否则称为奇异阵。
矩阵求逆运算规则:
- 若 A \mathbf A A 是非异阵,则 ( A − 1 ) − 1 = A (\mathbf A^{-1})^{-1}=\mathbf A (A−1)−1=A。
- 若 A , B \mathbf A,\mathbf B A,B 都是 n n n 阶非异阵,则 A B \mathbf A\mathbf B AB 也是 n n n 阶非异阵且 ( A B ) − 1 = B − 1 A − 1 (\mathbf A\mathbf B)^{-1}=\mathbf B^{-1}\mathbf A^{-1} (AB)−1=B−1A−1。
- 若 A \mathbf A A 是非异阵, c c c 是非零数,则 c A c\mathbf A cA 也是非异阵且 ( c A ) − 1 = c − 1 A − 1 (c\mathbf A)^{-1}=c^{-1}\mathbf A^{-1} (cA)−1=c−1A−1。
- 若 A \mathbf A A 是非异阵,则 A \mathbf A A 的转置 A T \mathbf A^{\mathbf T} AT 也是非异阵且 ( A T ) − 1 = ( A − 1 ) T (\mathbf A^{\mathbf T})^{-1}=(\mathbf A^{-1})^{\mathbf T} (AT)−1=(A−1)T。
设 A \mathbf A A 是 n n n 阶方阵,这个方阵决定了一个 n n n 阶行列式,记为 ∣ A ∣ \begin{vmatrix}\mathbf A\end{vmatrix} A 或 det A \det\mathbf A detA。
定义 2.3.2 :设
A
A
A 是
n
n
n 阶方阵,
A
i
j
A_{ij}
Aij 是行列式
∣
A
∣
\begin{vmatrix}\mathbf A\end{vmatrix}
A
中第
(
i
,
j
)
(i,j)
(i,j) 元素
a
i
j
a_{ij}
aij 的代数余子式,则称下列方阵为
A
\mathbf A
A 的伴随阵:
(
A
11
A
21
⋯
A
n
1
A
12
A
22
⋯
A
n
2
⋮
⋮
⋱
⋮
A
1
n
A
2
n
⋯
A
n
n
)
\begin{pmatrix} A_{11}&A_{21}&\cdots &A_{n1} \\ A_{12}&A_{22}&\cdots &A_{n2} \\ \vdots&\vdots&\ddots &\vdots \\ A_{1n}&A_{2n}&\cdots &A_{nn} \end{pmatrix}
A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann
A
\mathbf A
A 的伴随矩通常记为
A
∗
\mathbf {A^*}
A∗。
引理 2.3.1:设
A
\mathbf A
A 为
n
n
n 阶方阵,
A
∗
\mathbf A^*
A∗ 为
A
\mathbf A
A 的伴随矩,则
A
A
∗
=
A
∗
A
=
∣
A
∣
⋅
I
n
\mathbf A\mathbf A^*=\mathbf A^*\mathbf A=\begin{vmatrix}\mathbf A\end{vmatrix}\cdot\mathbf{I_{n}}
AA∗=A∗A=
A
⋅In
定理 2.3.1:若
∣
A
∣
≠
0
\begin{vmatrix}\mathbf A\end{vmatrix}\neq0
A
=0,则
A
\mathbf A
A 是一个非异阵,且
A
−
1
=
1
∣
A
∣
A
∗
\mathbf A^{-1}=\dfrac{1}{\begin{vmatrix}\mathbf A\end{vmatrix}} \mathbf A^*
A−1=
A
1A∗
2.4 矩阵的初等变换与初等矩阵
定义 2.4.1:下列三种矩阵变换分别称为矩阵的第一类、第二类、第三类初等行(列)变换:
- 对调矩阵中某两行(列)的位置;
- 用一非零常数 c c c 乘以矩阵的某一行(列);
- 将矩阵的某一行(列)乘以常数 c c c 后加到另一行(列)上去。
上述 3 3 3 种变换统称为矩阵的初等变换。
2.5 初等变换法求逆阵
众所周知,用伴随阵求非异阵的逆阵是相当麻烦的,有没有什么更加强势的做法推荐一下:
有的兄弟有的:
A
−
1
A
=
I
n
A
−
1
=
A
−
1
I
n
\mathbf A^{-1}\mathbf A=\mathbf {I_n} \\ \mathbf A^{-1}=\mathbf A^{-1}\mathbf {I_n}
A−1A=InA−1=A−1In
上述和式子启发我们可以这样求逆阵:
考虑一个 n × 2 n n\times 2n n×2n 的矩阵 ( A I n ) (\mathbf A\mathbf {I_n}) (AIn),这个矩阵的前 n n n 列为 A \mathbf A A,后 n n n 列为 I n \mathbf {I_n} In。对矩阵 ( A I n ) (\mathbf A\mathbf {I_n}) (AIn) 进行初等变换把 A \mathbf A A 变成 I n \mathbf {I_n} In,这时右边的 I n \mathbf {I_n} In 就变成了 A − 1 \mathbf A^{-1} A−1。
2.6 矩阵的秩
定义 2.6.1:在 m × n m\times n m×n 矩阵 A \mathbf A A 中,任取 k k k 行 k k k 列( k ⩽ m , k ⩽ n k\leqslant m,k\leqslant n k⩽m,k⩽n),位于这些行列交叉处的 k 2 k^2 k2 个元素,不改变他们在 A \mathbf A A 中所处的位置次序二得的 k k k 阶行列式,称为矩阵 A \mathbf A A 的 k k k 阶子式。
定义 2.6.2:设在矩阵 A \mathbf A A 中有一个不等于 0 0 0 的 r r r 阶子式 D \mathbf D D,且所有 r + 1 r+1 r+1 阶子式(如果存在的话)全等于 0 0 0,则 D \mathbf D D 称为矩阵 A \mathbf A A 的最高阶非零子式,数 r r r 称为矩阵 A \mathbf A A 的秩,记作 R ( A ) \text R(\mathbf A) R(A)。并规定零矩阵的秩为 0 0 0。
3 向量组的线性相关性
3.1 向量组及其线性组合
定义 3.1.1: n n n 个有次序的数 a 1 , a 2 , ⋯ , a n a_1,a_2,\cdots,a_n a1,a2,⋯,an 所组成的数组称为 n n n 维向量,这 n n n 个数称为该向量的 n n n 个分量,第 i i i 个数 a i a_i ai 称为第 i i i 个分量。
定义3.1.2:给定向量组 A : a 1 , a 2 , ⋯ , a m A:\mathbf a_1,\mathbf a_2,\cdots,\mathbf a_m A:a1,a2,⋯,am,对于任何一组实数 k 1 , k 2 , ⋯ , k m k_1,k_2,\cdots,k_m k1,k2,⋯,km,表达式 ∑ i = 1 m k i A i \sum\limits_{i=1^{m}k_i\mathbf A_i} i=1mkiAi∑称为向量组 A A A 的一个线性组合, k 1 , k 2 , ⋯ , k n k_1,k_2,\cdots,k_n k1,k2,⋯,kn 称为这个线性组合的系数。