矩阵的迹(Trace)
flyfish
矩阵的迹(Trace)是指一个方阵(即行数和列数相同的矩阵)对角线元素之和。就是在一个正方形的数字表格里,沿着从左上角到右下角的对角线,把这条线上所有的数字加起来,得到的和就是这个矩阵的迹。
简单例子
假设我们有一个3x3的矩阵:
(
1
2
3
4
5
6
7
8
9
)
\begin{pmatrix}1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix}
147258369
矩阵的迹就是对角线上的元素之和,也就是1、5和9的和:
Tr
(
A
)
=
1
+
5
+
9
=
15
\text{Tr}(A) = 1 + 5 + 9 = 15
Tr(A)=1+5+9=15
矩阵的迹等于其特征值之和
计算矩阵的迹
假设我们有一个2x2的矩阵:
(
4
1
2
3
)
\begin{pmatrix}4 & 1 \\ 2 & 3 \end{pmatrix}
(4213)
import numpy as np
# 定义矩阵
A = np.array([[4, 1], [2, 3]])
# 计算矩阵的迹
trace_A = np.trace(A)
# 计算矩阵的特征值
eigenvalues_A = np.linalg.eigvals(A)
# 计算特征值之和
sum_eigenvalues = np.sum(eigenvalues_A)
print(trace_A, eigenvalues_A, sum_eigenvalues)
7 [5. 2.] 7.0
矩阵 A A A 的特征值通过解矩阵的特征多项式得到。具体步骤如下:
步骤:
- 特征多项式:定义特征值
λ
\lambda
λ 为矩阵
A
A
A 的特征值,如果存在非零向量
v
\mathbf{v}
v 使得
A
v
=
λ
v
A \mathbf{v} = \lambda \mathbf{v}
Av=λv。这可以转换为以下方程:
( A − λ I ) v = 0 (A - \lambda I) \mathbf{v} = 0 (A−λI)v=0
其中, I I I 是单位矩阵。 - 行列式:为了有非零解,矩阵
(
A
−
λ
I
)
(A - \lambda I)
(A−λI) 的行列式必须为零,即:
det ( A − λ I ) = 0 \det(A - \lambda I) = 0 det(A−λI)=0 - 解多项式:上面的行列式是一个关于 λ \lambda λ 的多项式方程,称为特征多项式。解这个多项式方程可以得到矩阵的特征值。
具体例子
对矩阵 A = ( 4 1 2 3 ) A = \begin{pmatrix} 4 & 1 \\ 2 & 3 \end{pmatrix} A=(4213),我们来计算特征值:
- 特征多项式:
A − λ I = ( 4 1 2 3 ) − λ ( 1 0 0 1 ) = ( 4 − λ 1 2 3 − λ ) A - \lambda I = \begin{pmatrix} 4 & 1 \\ 2 & 3 \end{pmatrix} - \lambda \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} = \begin{pmatrix} 4 - \lambda & 1 \\ 2 & 3 - \lambda \end{pmatrix} A−λI=(4213)−λ(1001)=(4−λ213−λ) - 行列式:
det ( A − λ I ) = det ( 4 − λ 1 2 3 − λ ) = ( 4 − λ ) ( 3 − λ ) − 2 ⋅ 1 \det(A - \lambda I) = \det \begin{pmatrix} 4 - \lambda & 1 \\ 2 & 3 - \lambda \end{pmatrix} = (4 - \lambda)(3 - \lambda) - 2 \cdot 1 det(A−λI)=det(4−λ213−λ)=(4−λ)(3−λ)−2⋅1 - 展开多项式:
( 4 − λ ) ( 3 − λ ) − 2 = 12 − 4 λ − 3 λ + λ 2 − 2 = λ 2 − 7 λ + 10 (4 - \lambda)(3 - \lambda) - 2 = 12 - 4\lambda - 3\lambda + \lambda^2 - 2 = \lambda^2 - 7\lambda + 10 (4−λ)(3−λ)−2=12−4λ−3λ+λ2−2=λ2−7λ+10 - 求根:
λ 2 − 7 λ + 10 = 0 \lambda^2 - 7\lambda + 10 = 0 λ2−7λ+10=0
求解这个二次方程可以得到特征值:
λ = 7 ± 49 − 40 2 = 7 ± 9 2 = 7 ± 3 2 \lambda = \frac{7 \pm \sqrt{49 - 40}}{2} = \frac{7 \pm \sqrt{9}}{2} = \frac{7 \pm 3}{2} λ=27±49−40=27±9=27±3
所以特征值是:
λ
1
=
5
,
λ
2
=
2
\lambda_1 = 5, \lambda_2 = 2
λ1=5,λ2=2
- 线性变换的固有尺度:特征值描述了线性变换在某些方向上的缩放因子。如果 λ \lambda λ 是矩阵 A A A 的特征值,意味着存在一个向量 v \mathbf{v} v 使得 A v = λ v A \mathbf{v} = \lambda \mathbf{v} Av=λv。向量 v \mathbf{v} v 在变换 A A A 下只会被拉伸或压缩,而不会改变方向。
- 对角化:特征值可以用来对矩阵进行对角化。如果矩阵 A A A 可以对角化,那么 A = P D P − 1 A = PDP^{-1} A=PDP−1,其中 D D D 是对角矩阵,对角线上的元素是 A A A 的特征值。对角化在简化矩阵的高次幂和指数矩阵计算中非常有用。
特征值提供了缩放因子的信息,而特征向量提供了变换方向的信息。也可以从特征向量的角度看特征值。
使用特征值和特征向量对矩阵进行对角化
假设我们有以下矩阵
A
A
A:
(
4
1
2
3
)
\begin{pmatrix}4 & 1 \\ 2 & 3 \end{pmatrix}
(4213)
步骤:
- 计算矩阵 ( A ) 的特征值。
- 计算与特征值对应的特征向量。
- 组成矩阵 ( P ) 和对角矩阵 ( D )。
- 验证 A = P D P − 1 A = PDP^{-1} A=PDP−1。
1. 计算特征值
特征值 (\lambda) 满足:
det
(
A
−
λ
I
)
=
0
\det(A - \lambda I) = 0
det(A−λI)=0
其中 ( I ) 是单位矩阵:
det
(
4
−
λ
1
2
3
−
λ
)
=
(
4
−
λ
)
(
3
−
λ
)
−
2
⋅
1
=
λ
2
−
7
λ
+
10
\det \begin{pmatrix} 4 - \lambda & 1 \\ 2 & 3 - \lambda \end{pmatrix} = (4 - \lambda)(3 - \lambda) - 2 \cdot 1 = \lambda^2 - 7\lambda + 10
det(4−λ213−λ)=(4−λ)(3−λ)−2⋅1=λ2−7λ+10
解得特征值
λ
1
=
5
\lambda_1 = 5
λ1=5 和
λ
2
=
2
\lambda_2 = 2
λ2=2。
2. 计算特征向量
对于
λ
1
=
5
\lambda_1 = 5
λ1=5:
(
A
−
5
I
)
v
=
0
(A - 5I)\mathbf{v} = 0
(A−5I)v=0
(
4
−
5
1
2
3
−
5
)
(
v
1
v
2
)
=
(
−
1
1
2
−
2
)
(
v
1
v
2
)
=
0
\begin{pmatrix} 4 - 5 & 1 \\ 2 & 3 - 5 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = \begin{pmatrix} -1 & 1 \\ 2 & -2 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 0
(4−5213−5)(v1v2)=(−121−2)(v1v2)=0
解得特征向量:
v
1
=
(
1
1
)
\mathbf{v}_1 = \begin{pmatrix} 1 \\ 1 \end{pmatrix}
v1=(11)
对于
λ
2
=
2
\lambda_2 = 2
λ2=2:
(
A
−
2
I
)
v
=
0
(A - 2I)\mathbf{v} = 0
(A−2I)v=0
(
4
−
2
1
2
3
−
2
)
(
v
1
v
2
)
=
(
2
1
2
1
)
(
v
1
v
2
)
=
0
\begin{pmatrix} 4 - 2 & 1 \\ 2 & 3 - 2 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = \begin{pmatrix} 2 & 1 \\ 2 & 1 \end{pmatrix} \begin{pmatrix} v_1 \\ v_2 \end{pmatrix} = 0
(4−2213−2)(v1v2)=(2211)(v1v2)=0
解得特征向量:
v
2
=
(
−
1
2
)
\mathbf{v}_2 = \begin{pmatrix} -1 \\ 2 \end{pmatrix}
v2=(−12)
3. 组成矩阵 ( P ) 和对角矩阵 ( D )
特征向量组成矩阵 ( P ):
P
=
(
1
−
1
1
2
)
P = \begin{pmatrix} 1 & -1 \\ 1 & 2 \end{pmatrix}
P=(11−12)
特征值组成对角矩阵 ( D ):
D
=
(
5
0
0
2
)
D = \begin{pmatrix} 5 & 0 \\ 0 & 2 \end{pmatrix}
D=(5002)
4. 验证 A = P D P − 1 A = PDP^{-1} A=PDP−1
我们计算 ( P^{-1} ):
P
−
1
=
1
det
(
P
)
(
2
1
−
1
1
)
=
1
(
1
⋅
2
−
(
−
1
)
⋅
1
)
(
2
1
−
1
1
)
=
(
2
/
3
1
/
3
−
1
/
3
1
/
3
)
P^{-1} = \frac{1}{\det(P)} \begin{pmatrix} 2 & 1 \\ -1 & 1 \end{pmatrix} = \frac{1}{(1 \cdot 2 - (-1) \cdot 1)} \begin{pmatrix} 2 & 1 \\ -1 & 1 \end{pmatrix} = \begin{pmatrix} 2/3 & 1/3 \\ -1/3 & 1/3 \end{pmatrix}
P−1=det(P)1(2−111)=(1⋅2−(−1)⋅1)1(2−111)=(2/3−1/31/31/3)
现在我们验证
A
=
P
D
P
−
1
A = PDP^{-1}
A=PDP−1:
P
D
P
−
1
=
(
1
−
1
1
2
)
(
5
0
0
2
)
(
2
/
3
1
/
3
−
1
/
3
1
/
3
)
PDP^{-1} = \begin{pmatrix} 1 & -1 \\ 1 & 2 \end{pmatrix} \begin{pmatrix} 5 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} 2/3 & 1/3 \\ -1/3 & 1/3 \end{pmatrix}
PDP−1=(11−12)(5002)(2/3−1/31/31/3)
首先计算 ( PD ):
P
D
=
(
1
−
1
1
2
)
(
5
0
0
2
)
=
(
5
−
2
5
4
)
PD = \begin{pmatrix} 1 & -1 \\ 1 & 2 \end{pmatrix} \begin{pmatrix} 5 & 0 \\ 0 & 2 \end{pmatrix} = \begin{pmatrix} 5 & -2 \\ 5 & 4 \end{pmatrix}
PD=(11−12)(5002)=(55−24)
然后计算
P
D
⋅
P
−
1
PD \cdot P^{-1}
PD⋅P−1:
P
D
⋅
P
−
1
=
(
5
−
2
5
4
)
(
2
/
3
1
/
3
−
1
/
3
1
/
3
)
=
(
(
5
⋅
2
/
3
+
(
−
2
)
⋅
(
−
1
/
3
)
)
(
5
⋅
1
/
3
+
(
−
2
)
⋅
1
/
3
)
(
5
⋅
2
/
3
+
4
⋅
(
−
1
/
3
)
)
(
5
⋅
1
/
3
+
4
⋅
1
/
3
)
)
=
(
4
1
2
3
)
PD \cdot P^{-1} = \begin{pmatrix} 5 & -2 \\ 5 & 4 \end{pmatrix} \begin{pmatrix} 2/3 & 1/3 \\ -1/3 & 1/3 \end{pmatrix} = \begin{pmatrix} (5 \cdot 2/3 + (-2) \cdot (-1/3)) & (5 \cdot 1/3 + (-2) \cdot 1/3) \\ (5 \cdot 2/3 + 4 \cdot (-1/3)) & (5 \cdot 1/3 + 4 \cdot 1/3) \end{pmatrix} = \begin{pmatrix} 4 & 1 \\ 2 & 3 \end{pmatrix}
PD⋅P−1=(55−24)(2/3−1/31/31/3)=((5⋅2/3+(−2)⋅(−1/3))(5⋅2/3+4⋅(−1/3))(5⋅1/3+(−2)⋅1/3)(5⋅1/3+4⋅1/3))=(4213)
验证得
P
D
P
−
1
=
A
PDP^{-1} = A
PDP−1=A。