一、Ax = b
在求解
A
x
=
0
A\boldsymbol x=\boldsymbol 0
Ax=0 时,我们将其转化成
R
x
=
0
R\boldsymbol x=\boldsymbol 0
Rx=0,将自由变量赋予特殊值(1 或 0),主元变量即可通过回代求出。这个过程中我们没有关注右侧的
b
\boldsymbol b
b,这是因为它一直为零,解
x
\boldsymbol x
x 在
A
A
A 的零空间。
如果
b
\boldsymbol b
b 不再是零时,右侧与左侧需要进行同样的行操作,
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 可以简化成
R
x
=
d
R\boldsymbol x=\boldsymbol d
Rx=d 的形式,它们的解是相同的。将
b
\boldsymbol b
b 作为额外的一列加在初始矩阵后,即增广矩阵。例如在
A
A
A 后加入右侧向量
(
b
1
,
b
2
,
b
3
)
=
(
1
,
6
,
7
)
(b_1,b_2,b_3)=(1,6,7)
(b1,b2,b3)=(1,6,7) 可以得到一个增广矩阵
[
A
b
]
\begin{bmatrix}A&b\end{bmatrix}
[Ab]:
[
1
3
0
2
0
0
1
4
1
3
1
6
]
[
x
1
x
2
x
3
x
4
]
=
[
1
6
7
]
增广矩阵
[
1
3
0
2
1
0
0
1
4
6
1
3
1
6
7
]
=
[
A
b
]
\begin{bmatrix}1&3&0&2\\0&0&1&4\\1&3&1&6\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}\pmb1\\\pmb6\\\pmb7\end{bmatrix}\kern 5pt增广矩阵\kern 5pt\begin{bmatrix}1&3&0&2&\pmb1\\0&0&1&4&\pmb6\\1&3&1&6&\pmb7\end{bmatrix}=\begin{bmatrix}A&\pmb b\end{bmatrix}
101303011246
x1x2x3x4
=
167
增广矩阵
101303011246167
=[Ab]当我们对
A
A
A 使用消元法得到
R
R
R 时,也要对
b
\boldsymbol b
b 进行同样的操作。
上例是行
3
3
3 减去行
1
1
1,然后行
3
3
3 再减去行
2
2
2,此时得到
R
R
R 一行全为零,
b
\boldsymbol b
b 也成了新的右侧向量
d
=
(
1
,
6
,
0
)
\boldsymbol d=(1,6,0)
d=(1,6,0):
[
1
3
0
2
0
0
1
4
0
0
0
0
]
[
x
1
x
2
x
3
x
4
]
=
[
1
6
0
]
增广矩阵
[
1
3
0
2
1
0
0
1
4
6
0
0
0
0
0
]
=
[
R
d
]
\begin{bmatrix}1&3&0&2\\0&0&1&4\\0&0&0&0\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}\pmb1\\\pmb6\\\pmb0\end{bmatrix}\kern 5pt增广矩阵\kern 5pt\begin{bmatrix}1&3&0&2&\pmb1\\0&0&1&4&\pmb6\\0&0&0&0&\pmb0\end{bmatrix}=\begin{bmatrix}R&\pmb d\end{bmatrix}
100300010240
x1x2x3x4
=
160
增广矩阵
100300010240160
=[Rd]最后一零
0
0
0 非常重要,第三个方程变为了
0
=
0
0=0
0=0,所以方程有解。在初始矩阵
A
A
A 中,第一行加上第二行等于第三行,如果方程一致,那么右侧也要一致。右侧向量
b
\boldsymbol b
b 最重要的性质是
1
+
6
=
7
1+6=7
1+6=7,这样就会得到
0
=
0
0=0
0=0。
对于一般的
b
=
(
b
1
,
b
2
,
b
3
)
\boldsymbol b=(b_1,b_2,b_3)
b=(b1,b2,b3) 的增广矩阵:
[
A
b
]
=
[
1
3
0
2
b
1
0
0
1
4
b
2
1
3
1
6
b
3
]
→
[
1
3
0
2
b
1
0
0
1
4
b
2
0
0
0
0
b
3
−
b
1
−
b
2
]
=
[
R
d
]
\begin{bmatrix}A&b\end{bmatrix}=\begin{bmatrix}1&3&0&2&\pmb{b_1}\\0&0&1&4&\pmb{b_2}\\1&3&1&6&\pmb{b_3}\end{bmatrix}\rightarrow\begin{bmatrix}1&3&0&2&\pmb{b_1}\kern 43pt\\0&0&1&4&\pmb{b_2}\kern 43pt\\0&0&0&0&\pmb{b_3-b_1-b_2}\end{bmatrix}=\begin{bmatrix}R&\pmb d\end{bmatrix}
[Ab]=
101303011246b1b2b3
→
100300010240b1b2b3−b1−b2
=[Rd]只有当
b
3
−
b
1
−
b
2
=
0
b_3-b_1-b_2=0
b3−b1−b2=0 时,第三个方程才是
0
=
0
0=0
0=0,即
b
1
+
b
2
=
b
3
b_1+b_2=b_3
b1+b2=b3。
二、一个特解 A x p x_p xp = b
将自由变量全部设为 0 0 0: x 2 = x 4 = 0 x_2=x_4=0 x2=x4=0,则两个非零方程会得到两个主元变量 x 1 = 1 , x 3 = 6 x_1=1,x_3=6 x1=1,x3=6,这样就很简单求得了一个特解(particular solution)。对于 A x = b A\boldsymbol x=\boldsymbol b Ax=b(也是 R x = d R\boldsymbol x=\boldsymbol d Rx=d )的一个特解就是 x p = ( 1 , 0 , 6 , 0 ) \boldsymbol x_p=(1,0,6,0) xp=(1,0,6,0)。求特解的方法:自由变量 = 0,主元变量来自 d \boldsymbol d d。 如果解存在, R 的零行对应的 d 也必须为零。因为 I 在 R 的主元行和主元列,所以 x p a r t i c u l a r 来自于 d R x p = [ 1 3 0 2 0 0 1 4 0 0 0 0 ] [ 1 0 6 0 ] = [ 1 6 0 ] 主元变量 1 , 6 自由变量 0 , 0 解 x p = ( 1 , 0 , 6 , 0 ) 如果解存在,R\,的零行对应的\,\boldsymbol d\,也必须为零。因为\,I\,在\,R\,的主元行和主元列,所以\, \boldsymbol x_{particular} \,来自于\,\boldsymbol d\\R\boldsymbol x_p=\begin{bmatrix}\pmb1&3&\pmb0&2\\\pmb0&0&\pmb1&4\\0&0&0&0\end{bmatrix}\begin{bmatrix}\pmb1\\0\\\pmb6\\0\end{bmatrix}=\begin{bmatrix}\pmb1\\\pmb6\\0\end{bmatrix}\kern 10pt\begin{matrix}\pmb{主元变量1,6}\\\pmb{自由变量0,0}\\\kern 24pt\pmb{解\,\boldsymbol x_p=(1,0,6,0)}\end{matrix} 如果解存在,R的零行对应的d也必须为零。因为I在R的主元行和主元列,所以xparticular来自于dRxp= 100300010240 1060 = 160 主元变量1,6自由变量0,0解xp=(1,0,6,0)因为我们将自由变量全部设为零,所以当简化至 R R R 后,这些步骤很快就能完成。将自由变量设为零后,主元变量就可以在右侧的向量 d \boldsymbol d d 中看到。
x p a r t i c u l a r 特解是求解 A x p = b x n u l l s p a c e n − r 个特殊解是求解 A x n = 0 \boldsymbol x_{particular}\kern 10pt特解是求解\kern 50ptA\boldsymbol x_p=\boldsymbol b\\\boldsymbol x_{nullspace}\kern 10pt\kern 5ptn-r个特殊解是求解\kern 5ptA\boldsymbol x_n=\boldsymbol 0 xparticular特解是求解Axp=bxnullspacen−r个特殊解是求解Axn=0
特解是
(
1
,
0
,
6
,
0
)
(1,0,6,0)
(1,0,6,0),
R
x
=
0
R\boldsymbol x=\boldsymbol 0
Rx=0 的两个特殊解(special solution)(零空间)来自
R
R
R 的两个自由列,通过反转
3
,
2
,
4
3,2,4
3,2,4 的符号来得到。
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 的完全解写成
x
p
+
x
n
\boldsymbol x_p+\boldsymbol x_n
xp+xn:
完全解 一个 x p 很多 x n x = x p + x n = [ 1 0 6 0 ] + x 2 [ − 3 1 0 0 ] + x 4 [ − 2 0 − 4 1 ] \begin{matrix}\pmb{完全解}\\\pmb{一个x_p}\\\pmb{很多x_n}\end{matrix}\kern 10pt\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\begin{bmatrix}1\\0\\6\\0\end{bmatrix}+x_2\begin{bmatrix}-3\\\kern 7pt1\\\kern 7pt0\\\kern 7pt0\end{bmatrix}+x_4\begin{bmatrix}-2\\\kern 7pt0\\-4\\\kern 7pt1\end{bmatrix} 完全解一个xp很多xnx=xp+xn= 1060 +x2 −3100 +x4 −20−41
问题: 假设
A
A
A 是可逆的方阵,
m
=
n
=
r
m=n=r
m=n=r,则
x
p
\boldsymbol x_p
xp 和
x
n
x_n
xn 是什么?
答: 特解
x
p
=
A
−
1
b
\boldsymbol x_p=A^{-1}\boldsymbol b
xp=A−1b 有且只有一个唯一解。不存在特殊解或自由变量。
R
=
I
R=I
R=I 没有零行,零空间只有一个向量
x
n
=
0
\boldsymbol x_n=\boldsymbol 0
xn=0,完全解是
x
=
x
p
+
x
n
=
A
−
1
b
+
0
\boldsymbol x = \boldsymbol x_p+\boldsymbol x_n=A^{-1}\boldsymbol b+\boldsymbol 0
x=xp+xn=A−1b+0。
若
A
A
A 是可逆的方阵,
N
(
A
)
\pmb N(A)
N(A) 只含有零向量,
[
A
b
]
\begin{bmatrix}A&\boldsymbol b\end{bmatrix}
[Ab] 可以简化成
[
I
A
−
1
b
]
\begin{bmatrix}I&A^{-1}\boldsymbol b\end{bmatrix}
[IA−1b],
A
A
A 最终会变成
I
I
I,
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 会变成
x
=
A
−
1
b
\boldsymbol x=A^{-1}\boldsymbol b
x=A−1b 就是
d
\boldsymbol d
d。这个虽说是特殊情况,但是实际上方形可逆矩阵是最常见的。
对于小型矩阵,我们可以将
[
A
b
]
\begin{bmatrix}A&\boldsymbol b\end{bmatrix}
[Ab] 简化成
[
R
d
]
\begin{bmatrix}R&\boldsymbol d\end{bmatrix}
[Rd]。对于大型矩阵,我们可以使用 MATLAB,一个特解可以使用
x
=
A
\
b
\boldsymbol x=A\backslash \boldsymbol b
x=A\b(表示
A
−
1
A^{-1}
A−1 乘
b
\boldsymbol b
b )得到。
【例1】若要使
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 有解,
(
b
1
,
b
2
,
b
3
)
(b_1,b_2,b_3)
(b1,b2,b3) 需要满足什么条件?
A
=
[
1
1
1
2
−
2
−
3
]
,
b
=
[
b
1
b
2
b
3
]
A=\begin{bmatrix}\kern 7pt1&\kern 7pt1\\\kern 7pt1&\kern 7pt2\\-2&-3\end{bmatrix},\kern 5pt\boldsymbol b=\begin{bmatrix}b_1\\b_2\\b_3\end{bmatrix}
A=
11−212−3
,b=
b1b2b3
条件是
b
\boldsymbol b
b 必须在
A
A
A 的列空间中。求完全解
x
=
x
p
+
x
n
\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n
x=xp+xn。
解: 加入额外的
b
\boldsymbol b
b 得到增广矩阵
[
A
b
]
\begin{bmatrix}A&\boldsymbol b\end{bmatrix}
[Ab],在该矩阵中从行
2
2
2 减去行
1
1
1,然后行
3
3
3 加上
2
2
2 倍的行
1
1
1,得到
[
R
d
]
\begin{bmatrix}R&\boldsymbol d\end{bmatrix}
[Rd]:
[
1
1
b
1
1
2
b
2
−
2
−
3
b
3
]
→
[
1
1
b
1
0
1
b
2
−
b
1
0
−
1
b
3
+
2
b
1
]
→
[
1
0
2
b
1
−
b
2
0
1
b
2
−
b
1
0
0
b
3
+
b
1
+
b
2
]
\begin{bmatrix}\kern 7pt1&\kern 7pt1&b_1\\\kern 7pt1&\kern 7pt2&b_2\\-2&-3&b_3\end{bmatrix}\rightarrow\begin{bmatrix}1&\kern 7pt1&b_1\\0&\kern 7pt1&b_2-b_1\\0&-1&b_3+2b_1\end{bmatrix}\rightarrow\begin{bmatrix}1&0&2b_1-b_2\\0&1&b_2-b_1\\0&0&\pmb{b_3+b_1+b_2}\end{bmatrix}
11−212−3b1b2b3
→
10011−1b1b2−b1b3+2b1
→
1000102b1−b2b2−b1b3+b1+b2
当
b
1
+
b
2
+
b
3
=
0
b_1+b_2+b_3=0
b1+b2+b3=0 时,可以使得最后一个方程是
0
=
0
0=0
0=0,这个是
b
\boldsymbol b
b 在
A
A
A 列空间中的条件,此时
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 有解。
A
A
A 的三个行相加产生零行,因为方程两边的一致性,所以
b
\boldsymbol b
b 的分量相加也必须为零。
上例中由于
n
−
r
=
2
−
2
=
0
n-r=2-2=0
n−r=2−2=0,所以没有自由变量,也就没有特殊解。零空间的解是
x
n
=
0
\boldsymbol x_n=\boldsymbol 0
xn=0。
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 和
R
x
=
d
R\boldsymbol x=\boldsymbol d
Rx=d 的特解在最后一列
d
\boldsymbol d
d 的顶端:
A
x
=
b
的唯一解
x
=
x
p
+
x
n
=
[
2
b
1
−
b
2
b
2
−
b
1
]
+
[
0
0
]
A\boldsymbol x=\boldsymbol b\,的唯一解\kern 10pt\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\begin{bmatrix}2b_1-b_2\\b_2-b_1\end{bmatrix}+\begin{bmatrix}0\\0\end{bmatrix}
Ax=b的唯一解x=xp+xn=[2b1−b2b2−b1]+[00]如果
b
1
+
b
2
+
b
3
b_1+b_2+b_3
b1+b2+b3 不为零,则
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 无解(
x
p
\boldsymbol x_p
xp 和
x
\boldsymbol x
x 不存在)。
例1是一个典型的重要例子:
A
A
A 是列满秩的。每一列都有主元,秩
r
=
n
r=n
r=n。这个矩阵又高又细(
m
≥
n
m\geq n
m≥n),当
A
A
A 简化到
R
R
R 时,
I
I
I 会在
R
R
R 的最顶端:
列满秩
R
=
[
I
0
]
=
[
n
×
n
的
I
m
−
n
个零行
]
(
3.3.1
)
\pmb{列满秩}\kern 10ptR=\begin{bmatrix}I\\0\end{bmatrix}=\begin{bmatrix}n\times n\,的\,I\\m-n\,个零行\end{bmatrix}\kern 15pt(3.3.1)
列满秩R=[I0]=[n×n的Im−n个零行](3.3.1)这种情况没有自由列或自由变量,零空间是
Z
=
零向量
\pmb {\textrm Z}={零向量}
Z=零向量。
列满秩(r=n)的矩阵 A A A 有下列性质:
- A 的每一列都是主元列。
- 没有自由变量或特殊解。
- 零空间 N ( A ) \pmb N(A) N(A) 仅包含零向量 x = 0 \boldsymbol x=\boldsymbol 0 x=0。
- 若 A x = b A\boldsymbol x=\boldsymbol b Ax=b 有一个解(也可能没有),则这个解是唯一解。
这种情况下,
A
A
A 或
R
R
R 的零空间收缩至零向量,
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 的解是唯一的(如果存在的话),
R
R
R 中会有
m
−
n
m-n
m−n 个零行,而为了保证这些行最终会得到
0
=
0
0=0
0=0,在
b
\boldsymbol b
b 中会有
m
−
n
m-n
m−n 个条件,此时
b
\boldsymbol b
b 在列空间中。
列满秩
r
=
n
r=n
r=n 时,
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 有一个解或无解。
三、完全解
另外一个极端的情况就是行满秩,此时 A x = b A\boldsymbol x=\boldsymbol b Ax=b 有一个或无穷多个解, A A A 是又矮又宽( m ≤ n m\leq n m≤n)。如果 r = m \pmb{r=m} r=m,矩阵 A A A 有行满秩。这些行是无关的,每一行都有一个主元。
【例2】系统
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 有
n
=
3
n=3
n=3 个未知数,但是只有
m
=
2
m=2
m=2 个方程:
行满秩
x
+
y
+
z
=
3
x
+
2
y
−
z
=
4
(
秩
r
=
m
=
2
)
\pmb{行满秩}\kern 10pt\begin{matrix}x+y+z=3\\x+2y-z=4\kern 5pt\end{matrix}\kern 10pt(秩\,r=m=2)
行满秩x+y+z=3x+2y−z=4(秩r=m=2)这是
x
y
z
xyz
xyz 空间中的两个平面,它们不平行,所以会相交于一条直线,这条直线就是该系统的解,我们通过消元法可以得到这条直线。特解就是这条直线上的一点,再加上零空间向量
x
n
\pmb{x_n}
xn,可以使得该点在Figure 3.3 上的直线上移动。
x
=
x
p
+
x
n
\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n
x=xp+xn 就可以得到整条直线上的解。
对
[
A
b
]
\begin{bmatrix}A&\boldsymbol b\end{bmatrix}
[Ab] 进行消元可以得到
x
p
\boldsymbol x_p
xp 和
x
n
\boldsymbol x_n
xn。行
2
2
2 减去行
1
1
1,然后行
1
1
1 再减去行
2
2
2 可得:
[
1
1
1
3
1
2
−
1
4
]
→
[
1
1
1
3
0
1
−
2
1
]
→
[
1
0
3
2
0
1
−
2
1
]
=
[
R
d
]
\begin{bmatrix}1&1&\kern 7pt1&\pmb3\\1&2&-1&\pmb4\end{bmatrix}\rightarrow\begin{bmatrix}1&1&\kern 7pt1&\pmb3\\0&1&-2&\pmb1\end{bmatrix}\rightarrow\begin{bmatrix}1&0&\kern 7pt3&\pmb2\\0&1&-2&\pmb1\end{bmatrix}=\begin{bmatrix}R&\boldsymbol d\end{bmatrix}
[11121−134]→[10111−231]→[10013−221]=[Rd]特解有自由变量
x
3
=
0
x_3=0
x3=0,特殊解有自由变量
x
3
=
1
x_3=1
x3=1:
x
particular
直接来自有右侧的
d
:
x
p
=
(
2
,
1
,
0
)
x
special
来自于
R
第三列(自由列)
:
s
=
(
−
3
,
2
,
1
)
\boldsymbol x_{\textrm{particular}}直接来自有右侧的\,\boldsymbol d:\boldsymbol x_p=(2,1,0)\kern 22pt\\\boldsymbol x_{\textrm{special}}来自于 R\,第三列(自由列):\boldsymbol s=(-3,2,1)
xparticular直接来自有右侧的d:xp=(2,1,0)xspecial来自于R第三列(自由列):s=(−3,2,1)下面检验一下
x
p
\boldsymbol x_p
xp 和
s
\boldsymbol s
s 是否满足原始方程
A
x
p
=
b
A\boldsymbol x_p=\boldsymbol b
Axp=b 和
A
s
=
0
A\boldsymbol s=\boldsymbol 0
As=0:
2
+
1
=
3
2
+
2
=
4
−
3
+
2
+
1
=
0
−
3
+
4
−
1
=
0
\begin{matrix}2+1=3\\2+2=4\end{matrix}\kern 25pt\begin{matrix}-3+2+1=0\\-3+4-1=0\end{matrix}
2+1=32+2=4−3+2+1=0−3+4−1=0零空间解
x
n
\boldsymbol x_n
xn 是
s
\boldsymbol s
s 的任意倍数。系统的解沿着直线移动,起点是
x
paticular
\boldsymbol x_{\textrm{paticular}}
xpaticular。注意完全解的写法:
完全解 x = x p + x n = [ 2 1 0 ] + x 3 [ − 3 2 1 ] \pmb{完全解}\kern 20pt\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\begin{bmatrix}2\\1\\0\end{bmatrix}+x_3\begin{bmatrix}-3\\\kern 7pt2\\\kern 7pt1\end{bmatrix} 完全解x=xp+xn= 210 +x3 −321
这条解的直线就是 Figure3.3 画出来的,直线的任意一点都可以选成特解,我们一般选择
x
3
=
0
x_3=0
x3=0 这一点。
特解不能乘任意常数!特殊解才需要这个常数,因为要得所有零空间的
x
n
\boldsymbol x_n
xn。
下面总结一些这种又矮又宽的行满秩的情况。如果
m
<
n
m<n
m<n,则方程
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 是欠定的(undetermined),即有很多解。
行满秩 (r=m)的矩阵有以下性质:
- 所有的行都有主元, R \pmb R R 没有零行。
- 对于任意的右侧向量 b \boldsymbol b b, A x = b A\boldsymbol x=\boldsymbol b Ax=b 都有解。
- 列空间是整个 R m \pmb {\textrm R}^m Rm 空间。
- A A A 的零空间中有 n − r = n − m n-r=n-m n−r=n−m 个特殊解。
这种
m
m
m 个主元的情况,这些行都线性无关。因此
A
T
A^T
AT 的列也是线性无关,
A
T
A^T
AT 的零空间是零向量。
总结共有
4
4
4 种与秩相关的可能性:
线性方程组与秩
r
相关的
4
种可能性
r
=
m
且
r
=
n
方形可逆
A
x
=
b
有
1
个解
r
=
m
且
r
<
n
矮且宽
A
x
=
b
有
∞
多解
r
<
m
且
r
=
n
高且细
A
x
=
b
有
0
或
1
个解
r
<
m
且
r
<
n
非满秩
A
x
=
b
有
0
或
∞
多解
\pmb{线性方程组与秩\,r\,相关的\,4\,种可能性}\kern 90pt\\\begin{matrix}r=m\,且\,r=n&方形可逆&A\boldsymbol x=\boldsymbol b\,有\,1\,个解\\r=m\,且\,r<n&矮且宽&\kern 5ptA\boldsymbol x=\boldsymbol b\,有\,\infty\,多解\\r<m\,且\,r=n&高且细&\kern 17ptA\boldsymbol x=\boldsymbol b\,有\,0\,或\,1\,个解\\r<m\,且\,r<n&非满秩&\kern 22ptA\boldsymbol x=\boldsymbol b\,有\,0\,或\,\infty\,多解\end{matrix}
线性方程组与秩r相关的4种可能性r=m且r=nr=m且r<nr<m且r=nr<m且r<n方形可逆矮且宽高且细非满秩Ax=b有1个解Ax=b有∞多解Ax=b有0或1个解Ax=b有0或∞多解行简化矩阵
R
R
R 和矩阵
A
A
A 是相同种类的,如果主元列正好第一个出现,则可以列出
R
R
R 的
4
4
4 种可能性。
R
x
=
d
R\boldsymbol x=\boldsymbol d
Rx=d(和原始的
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b )有解,
d
\boldsymbol d
d 的后面一定有
m
−
r
m-r
m−r 个零行,
F
F
F 是
R
R
R 的自由部分。
R
的四种形式
它们的秩
[
I
]
[
I
F
]
[
I
0
]
[
I
F
0
0
]
r
=
m
=
n
r
=
m
<
n
r
=
n
<
m
r
<
m
,
r
<
n
\begin{matrix}R\,的四种形式\\\\它们的秩\end{matrix}\begin{matrix}\begin{bmatrix}I\end{bmatrix}&\begin{bmatrix}I&F\end{bmatrix}&\begin{bmatrix}I\\0\end{bmatrix}&\begin{bmatrix}I&F\\0&0\end{bmatrix}\\\\r=m=n&r=m<n&r=n<m&r<m,r<n\end{matrix}
R的四种形式它们的秩[I]r=m=n[IF]r=m<n[I0]r=n<m[I0F0]r<m,r<n形式
1
1
1 和
2
2
2 有行满秩
r
=
m
r=m
r=m,形式
1
1
1 和
3
3
3 有列满秩
r
=
n
r=n
r=n,形式
4
4
4 理论上是最常见的,但是实际上很少见。
如果主元列并不是都在前面出现,这
I
I
I 和
F
F
F 会有交叉的现象。
四、主要内容总结
- 秩 r r r 是主元的个数,行简化矩阵 R R R 有 m − r m-r m−r 个零行。
- A x = b A\boldsymbol x=\boldsymbol b Ax=b 有解,当且仅当最后 m − r m-r m−r 个方程可以简化为 0 = 0 0=0 0=0。
- 一个特解 x p \boldsymbol x_p xp 的所有自由变量都为 0 0 0。
- 主元变量是在自由变量选定后被确定的。
- 列满秩矩阵 r = n r=n r=n 没有自由变量:一个或无解。
- 行满秩矩阵 r = m r=m r=m,如果 m = n m=n m=n 则有一个解;如果 m < n m<n m<n 则有无穷多解。
五、例题
【例3】该问题将消元法(主元列和回代)与列空间 - 零空间 - 秩 - 可解性联系起来。 A A A 的秩是 2 2 2: A x = b 是 x 1 + 2 x 2 + 3 x 3 + 5 x 4 = b 1 2 x 1 + 4 x 2 + 8 x 3 + 12 x 4 = b 2 3 x 1 + 6 x 2 + 7 x 3 + 13 x 4 = b 3 A\boldsymbol x=\boldsymbol b\kern 10pt是\kern 10pt\begin{matrix}x_1+2x_2+3x_3+5x_4=b_1\\2x_1+4x_2+8x_3+12x_4=b_2\\3x_1+6x_2+7x_3+13x_4=b_3\end{matrix} Ax=b是x1+2x2+3x3+5x4=b12x1+4x2+8x3+12x4=b23x1+6x2+7x3+13x4=b3
- 简化 [ A b ] \begin{bmatrix}A&\boldsymbol b\end{bmatrix} [Ab] 到 [ U c ] \begin{bmatrix}U&\boldsymbol c\end{bmatrix} [Uc],使 A x = b A\boldsymbol x=\boldsymbol b Ax=b 变成三角系统 U x = c U\boldsymbol x=\boldsymbol c Ux=c。
- 若要 A x = b A\boldsymbol x=\boldsymbol b Ax=b 有解,则 b 1 , b 2 , b 3 b_1,b_2,b_3 b1,b2,b3 需要满足什么条件?
- 描述 A A A 的列空间,是 R 3 \pmb{\textrm R}^3 R3 的哪个平面?
- 描述 A A A 的零空间, R 4 \textrm{\pmb R}^4 R4 中的特殊解是什么?
- 设 b = ( 0 , 6 , − 6 ) \boldsymbol b=(0,6,-6) b=(0,6,−6),简化 [ U c ] \begin{bmatrix}U&\boldsymbol c\end{bmatrix} [Uc] 到 [ R d ] \begin{bmatrix}R&\boldsymbol d\end{bmatrix} [Rd]:特殊解来自 R R R,特解来自于 d \boldsymbol d d。
- 找到一个 A x = ( 0 , 6 , − 6 ) A\boldsymbol x=(0,6,-6) Ax=(0,6,−6) 的特解,然后写出完全解。
解:
- 消元法的乘数是 2 , 3 , − 1 2,3,-1 2,3,−1,消元后 [ A b ] \begin{bmatrix}A&\boldsymbol b\end{bmatrix} [Ab] 会变成 [ U c ] \begin{bmatrix}U&\boldsymbol c\end{bmatrix} [Uc]: [ 1 2 3 5 b 1 2 4 8 12 b 2 3 6 7 13 b 3 ] → [ 1 2 3 5 b 1 0 0 2 2 b 2 − 2 b 1 0 0 − 2 − 2 b 3 − 3 b 1 ] → [ 1 2 3 5 b 1 0 0 2 2 b 2 − 2 b 1 0 0 0 0 b 3 + b 2 − 5 b 1 ] \begin{bmatrix}1&2&3&5&\pmb{b_1}\\2&4&8&12&\pmb{b_2}\\3&6&7&13&\pmb{b_3}\end{bmatrix}\rightarrow\left[\begin{array}{ccrr|l}1&2&3&5&\pmb{b_1}\\0&0&2&2&\pmb{b_2-2b_1}\\0&0&-2&-2&\pmb{b_3-3b_1}\end{array}\right]\rightarrow\left[\begin{array}{cccc|l}1&2&3&5&\pmb{b_1}\\0&0&2&2&\pmb{b_2-2b_1}\\0&0&0&0&\pmb{b_3+b_2-5b_1}\end{array}\right] 12324638751213b1b2b3 → 10020032−252−2b1b2−2b1b3−3b1 → 100200320520b1b2−2b1b3+b2−5b1
- b 3 + b 2 − 5 b 1 = 0 b_3+b_2-5b_1=0 b3+b2−5b1=0 是方程解的条件,此时最后一个方程可以简化为 0 = 0 0=0 0=0。
- 第一种描述: 列空间是包含主元列
(
1
,
2
,
3
)
(1,2,3)
(1,2,3) 和
(
3
,
8
,
7
)
(3,8,7)
(3,8,7) 所有线性组合的平面,主元列是第
1
1
1 列和第
3
3
3 列;
第二种描述: 列空间包含满足 b 3 + b 2 − 5 b 1 = 0 b_3+b_2-5b_1=0 b3+b2−5b1=0 的所有向量;该条件使得方程 A x = b A\boldsymbol x=\boldsymbol b Ax=b 有解,所以 b \boldsymbol b b 就在列空间中。 A A A 中的所有列都满足 b 3 + b 2 − 5 b 1 = 0 b_3+b_2-5b_1=0 b3+b2−5b1=0,这也是第一种描述中的平面方程。 - 特殊解有自由变量 x 2 = 1 , x 4 = 0 x_2=1,x_4=0 x2=1,x4=0 和 x 2 = 0 , x 4 = 1 x_2=0,x_4=1 x2=0,x4=1: A x = 0 的特殊解 回代进 U x = c 或改变 R 中 2 , 2 , 1 的符号 s 1 = [ − 2 1 0 0 ] s 2 = [ − 2 0 − 1 1 ] \begin{array}{lc}A\boldsymbol x=\boldsymbol 0\,的特殊解\\回代进\,U\boldsymbol x=\boldsymbol c\\或改变\,R\,中\,2,2,1\,的符号\end{array}\kern 10pt\boldsymbol s_1=\begin{bmatrix}-2\\\kern 7pt1\\\kern 7pt0\\\kern 7pt0\end{bmatrix}\kern 15pt\boldsymbol s_2=\begin{bmatrix}-2\\\kern 7pt0\\-1\\\kern 7pt1\end{bmatrix} Ax=0的特殊解回代进Ux=c或改变R中2,2,1的符号s1= −2100 s2= −20−11 R 4 \pmb{\textrm R}^4 R4 中的零空间 N ( A ) \pmb N(A) N(A) 包含所有的 x n = c 1 s 1 + c 2 s 2 \boldsymbol x_n=c_1\boldsymbol s_1+c_2\boldsymbol s_2 xn=c1s1+c2s2。
- 简化后的矩阵 R R R,第三列从 U U U 的 ( 3 , 2 , 0 ) (3,2,0) (3,2,0) 变成了 ( 0 , 1 , 0 ) (0,1,0) (0,1,0),右边的从 c = ( 0 , 6 , 0 ) \boldsymbol c=(0,6,0) c=(0,6,0) 变成了 d = ( − 9 , 3 , 0 ) \boldsymbol d=(-9,3,0) d=(−9,3,0), x p \boldsymbol x_p xp 中的 − 9 -9 −9 和 3 3 3 都来自于 d \boldsymbol d d: [ U c ] = [ 1 2 3 5 0 0 0 2 2 6 0 0 0 0 0 ] → [ R d ] = [ 1 2 0 2 − 9 0 0 1 1 3 0 0 0 0 0 ] \begin{bmatrix}U&\boldsymbol c\end{bmatrix}=\begin{bmatrix}1&2&3&5&\pmb0\\0&0&2&2&\pmb6\\0&0&0&0&\pmb0\end{bmatrix}\rightarrow\begin{bmatrix}R&\boldsymbol d\end{bmatrix}=\begin{bmatrix}1&2&0&2&\pmb{-9}\\0&0&1&1&\kern 7pt\pmb3\\0&0&0&0&\kern 7pt\pmb0\end{bmatrix} [Uc]= 100200320520060 →[Rd]= 100200010210−930
- 将所有自由变量都设为 0 0 0,然后在 U x = c U\boldsymbol x=\boldsymbol c Ux=c 中回代,或者直接取自 d \boldsymbol d d: A x p = b 的特解 从向量 d 中得到 − 9 和 3 自由变量 x 2 和 x 4 都为 0 x p = [ − 9 0 3 0 ] \begin{array}{l}A\boldsymbol x_p=\boldsymbol b\,的特解\\从向量\,\boldsymbol d\,中得到-9\,和\,3\\自由变量\,x_2\,和\,x_4\,都为\,0\end{array}\kern 10pt\boldsymbol x_p=\begin{bmatrix}-9\\\kern 7pt0\\\kern 7pt3\\\kern 7pt0\end{bmatrix} Axp=b的特解从向量d中得到−9和3自由变量x2和x4都为0xp= −9030 A x = ( 0 , 6 , − 6 ) A\boldsymbol x=(0,6,-6) Ax=(0,6,−6) 的完全解是 x = x p + x n = x p + c 1 s 1 + c 2 s 2 \boldsymbol x=\boldsymbol x_p+\boldsymbol x_n=\boldsymbol x_p+c_1\boldsymbol s_1+c_2\boldsymbol s_2 x=xp+xn=xp+c1s1+c2s2。
【例4】假设已知 A x = b A\boldsymbol x=\boldsymbol b Ax=b 的一些信息,其中 b \boldsymbol b b 是一个特定值。下面描述可以得到 m , n , r m,n,r m,n,r(和 A A A)的什么信息?还有 b \boldsymbol b b 的可能信息?
- 只有一个解。
- A x = b A\boldsymbol x=\boldsymbol b Ax=b 所有的解有 x = [ 2 1 ] + c [ 1 1 ] \boldsymbol x=\begin{bmatrix}2\\1\end{bmatrix}+c\begin{bmatrix}1\\1\end{bmatrix} x=[21]+c[11] 的形式。
- 无解。
- A x = b A\boldsymbol x=\boldsymbol b Ax=b 所有的解有 x = [ 1 1 0 ] + c [ 1 0 1 ] \boldsymbol x=\begin{bmatrix}1\\1\\0\end{bmatrix}+c\begin{bmatrix}1\\0\\1\end{bmatrix} x= 110 +c 101 的形式。
- 有无穷多解。
解: 1、只有一个解的情况:
A
A
A 是列满秩
r
=
n
r=n
r=n,
A
A
A 的零空间仅含有零向量,一定有
m
≥
n
m\geq n
m≥n。
2、
A
A
A 肯定有
n
=
2
n=2
n=2 个列(
m
m
m 是任意的),其中
[
1
1
]
\begin{bmatrix}1\\1\end{bmatrix}
[11] 在
A
A
A 的零空间,列
2
2
2 是列
1
1
1 的负号,且
A
≠
0
A\neq0
A=0,秩
r
=
1
r=1
r=1。因为
[
2
1
]
\begin{bmatrix}2\\1\end{bmatrix}
[21] 是一个解,所以
b
=
2
(
column
2
)
+
(
column
1
)
\boldsymbol b=2(\textrm{column} \,2)+(\textrm{column}\,1)
b=2(column2)+(column1),
x
p
\boldsymbol x_p
xp 也可以选择
[
1
0
]
\begin{bmatrix}1\\0\end{bmatrix}
[10]。
3、无解时,仅能得到
b
\boldsymbol b
b 不在
A
A
A 的列空间中,
A
A
A 的秩
r
<
m
r<m
r<m。而且
b
≠
0
\boldsymbol b\neq\boldsymbol 0
b=0,否则
x
=
0
\boldsymbol x=\boldsymbol 0
x=0 就是一个解。
4、
A
A
A 肯定有
n
=
3
n=3
n=3 个列,其中
[
1
0
1
]
\begin{bmatrix}1\\0\\1\end{bmatrix}
101
在
A
A
A 的零空间中,列
3
3
3 是列
1
1
1 的负号,且列
2
2
2 肯定不是列
1
1
1 的倍数,否则零空间将会有另外一个特殊解,因此
A
A
A 的秩
r
=
3
−
1
=
2
r=3-1=2
r=3−1=2。
A
A
A 肯定有
m
≥
2
m\geq2
m≥2 行,右侧向量
b
=
column
1
+
column
2
\boldsymbol b=\textrm{column\,1}+\textrm{column\,2}
b=column1+column2。
5、有无穷多解的情况:零空间肯定包含非零向量,秩
r
<
n
r<n
r<n(非列满秩),
b
\boldsymbol b
b 肯定是在
A
A
A 的列空间中。但是我们不清楚是不是每个
b
\boldsymbol b
b 都在列空间中(列满秩任意的右侧向量
b
\boldsymbol b
b 只能在列空间中),所以无法确定
r
r
r 与
m
m
m 是否相等。
【例5】利用前向消元求完全解
x
=
x
p
+
x
n
\boldsymbol x=\boldsymbol x_p+\boldsymbol x_n
x=xp+xn:
[
1
2
1
0
2
4
4
8
4
8
6
8
]
[
x
1
x
2
x
3
x
4
]
=
[
4
2
10
]
\begin{bmatrix}1&2&1&0\\2&4&4&8\\4&8&6&8\end{bmatrix}\begin{bmatrix}x_1\\x_2\\x_3\\x_4\end{bmatrix}=\begin{bmatrix}4\\2\\10\end{bmatrix}
124248146088
x1x2x3x4
=
4210
找到
y
1
,
y
2
,
y
3
y_1,y_2,y_3
y1,y2,y3,使得
y
1
(
row
1
)
+
y
2
(
row
2
)
+
y
3
(
row
3
)
=
零行
y_1(\textrm{row}\,1)+y_2(\textrm{row\,2})+y_3(\textrm{row\,3})=零行
y1(row1)+y2(row2)+y3(row3)=零行。验证
b
=
(
4
,
2
,
10
)
\boldsymbol b=(4,2,10)
b=(4,2,10) 满足
y
1
b
1
+
y
2
b
2
+
y
3
b
3
=
0
y_1b_1+y_2b_2+y_3b_3=0
y1b1+y2b2+y3b3=0,为什么该条件是方程有解和
b
\boldsymbol b
b 在列空间的条件?
解: 对
[
A
b
]
\begin{bmatrix}A&\boldsymbol b\end{bmatrix}
[Ab] 进行前向消元会在
[
U
c
]
\begin{bmatrix}U&\boldsymbol c\end{bmatrix}
[Uc] 中产生一个零行,第三个方程会变成
0
=
0
0=0
0=0,方程有一致性(有解):
[
1
2
1
0
4
2
4
4
8
2
4
8
6
8
10
]
→
[
1
2
1
0
4
0
0
2
8
−
6
0
0
2
8
−
6
]
→
[
1
2
1
0
4
0
0
2
8
−
6
0
0
0
0
0
]
\begin{bmatrix}1&2&1&0&\pmb 4\\2&4&4&8&\pmb2\\4&8&6&8&\pmb{10}\end{bmatrix}\rightarrow\begin{bmatrix}1&2&1&0&\pmb4\\0&0&2&8&\pmb{-6}\\0&0&2&8&\pmb{-6}\end{bmatrix}\rightarrow\begin{bmatrix}1&2&1&0&\pmb4\\0&0&2&8&\pmb{-6}\\0&0&0&0&\pmb0\end{bmatrix}
1242481460884210
→
1002001220884−6−6
→
1002001200804−60
列
1
1
1 和列
3
3
3 是主元列,
x
2
x_2
x2 和
x
4
x_4
x4 是自由变量,如果将自由变量设为
0
0
0,那么通过回代就可以求出特解,还可以继续化简得到
R
R
R。
设自由变量为
0
0
0,则由
R
x
=
d
R\boldsymbol x=\boldsymbol d
Rx=d 可得到特解
x
p
=
(
7
,
0
,
−
3
,
0
)
\boldsymbol x_p=(7,0,-3,0)
xp=(7,0,−3,0):
[
1
2
1
0
4
0
0
2
8
−
6
0
0
0
0
0
]
→
[
1
2
1
0
4
0
0
1
4
−
3
0
0
0
0
0
]
→
[
1
2
0
−
4
7
0
0
1
4
−
3
0
0
0
0
0
]
\begin{bmatrix}1&2&1&0&\pmb4\\0&0&2&8&\pmb{-6}\\0&0&0&0&\pmb0\end{bmatrix}\rightarrow\begin{bmatrix}1&2&1&0&\pmb4\\0&0&1&4&\pmb{-3}\\0&0&0&0&\pmb0\end{bmatrix}\rightarrow\begin{bmatrix}1&2&0&-4&\pmb7\\0&0&1&4&\pmb{-3}\\0&0&0&0&\pmb0\end{bmatrix}
1002001200804−60
→
1002001100404−30
→
100200010−4407−30
设自由变量
x
2
,
x
4
x_2,x_4
x2,x4 分别为
1
,
0
1,0
1,0 和
0
,
1
0,1
0,1,则可求出当
b
=
0
\boldsymbol b=\boldsymbol 0
b=0 时零空间部分
x
n
\boldsymbol x_n
xn:
特殊解
s
1
=
(
−
2
,
1
,
0
,
0
)
s
2
=
(
4
,
0
,
−
4
,
1
)
\pmb{特殊解}\kern 10pt\boldsymbol s_1=(-2,1,0,0)\kern 10pt\boldsymbol s_2=(4,0,-4,1)
特殊解s1=(−2,1,0,0)s2=(4,0,−4,1)则
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b(和
R
x
=
d
R\boldsymbol x=\boldsymbol d
Rx=d)的完全解
x
=
x
p
+
c
1
s
1
+
c
2
s
2
\boldsymbol x=\boldsymbol x_p+c_1\boldsymbol s_1+c_2\boldsymbol s_2
x=xp+c1s1+c2s2。
对于矩阵
A
A
A,有
2
(
row
1
)
+
(
row
2
)
−
(
row
3
)
=
(
0
,
0
,
0
,
0
)
2(\textrm{row\,1})+(\textrm{row\,2})-(\textrm{row\,3})=(0,0,0,0)
2(row1)+(row2)−(row3)=(0,0,0,0),因此
y
=
(
2
,
1
,
−
1
)
\boldsymbol y=(2,1,-1)
y=(2,1,−1),对于
b
\boldsymbol b
b 来说同样的组合是
2
⋅
(
4
)
+
1
⋅
(
2
)
−
1
⋅
(
10
)
=
0
2\cdot(4)+1\cdot(2)-1\cdot(10)=0
2⋅(4)+1⋅(2)−1⋅(10)=0。
如果行的组合(左侧)得到零行,则右侧同样的组合也会得到
0
0
0,若没有得到
0
0
0 则方程无解。
换一种表述方法:若
A
A
A 的每一列都垂直于
(
2
,
1
,
−
1
)
(2,1,-1)
(2,1,−1),则这些列的任意组合
b
\boldsymbol b
b 也与
y
\boldsymbol y
y 垂直,否则
b
\boldsymbol b
b 就不再
A
A
A 的列空间中,
A
x
=
b
A\boldsymbol x=\boldsymbol b
Ax=b 就无解。
如果
y
\boldsymbol y
y 在
A
T
A^T
AT 的零空间中,则
y
\boldsymbol y
y 肯定垂直于所有
A
A
A 列空间中的
b
\boldsymbol b
b。