MIT线性代数笔记-第23讲-微分方程，exp(At)

23.微分方程， $e x p (A t)$

用矩阵求解微分方程

例： $\left \{ \begin{matrix} \dfrac{du_1}{dt} = -u_1 + 2u_2 \\ \dfrac{du_2}{dt} = u_1 - 2u_2 \end{matrix} \right.$ ，其中 $u_1 , u_2$ 是 $t$ 的两个不同函数且 $u_1(0) = 1 , u_2(0) = 0$

令 $\begin{bmatrix} -1 & 2 \\ 1 &-2 \end{bmatrix} , \vec{u} = \begin{bmatrix} u_1 \\ u_2 \end{bmatrix}$ ，则有 $\dfrac{d \vec{u}}{dt} = A \vec{u} , \vec{u}(0) = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$

先求 $A$ 的特征向量和特征值，因为 $A$ 已经是一个奇异矩阵，所以 $A$ 有一个特征值为 $\lambda_1 = 0$ ，又主对角线元素和为 $- 3$ ，所以另一个特征值为 $\lambda_2 = -3$ ，两个特征值分别对应特征向量 $\vec{x_1} = \begin{bmatrix} 2 \\ 1 \end{bmatrix} , \vec{x_2} = \begin{bmatrix} 1 \\ -1 \end{bmatrix}$

求出特征值和特征向量后便可以得到方程的两个特解 $e^{\lambda_1 t} \vec{x_1} , e^{\lambda_2 t} \vec{x_2}$ ，可以验证一下

将 $\vec{u} = e^{\lambda_1 t} \vec{x_1}$ 代入得： $\dfrac{d \vec{u}}{dt} = \dfrac{de^{\lambda_1 t} \vec{x_1}}{dt} = \lambda_1 e^{\lambda_1 t} \vec{x_1} = e^{\lambda_1 t} \lambda_1 \vec{x_1} = e^{\lambda_1 t} A \vec{x_1} = A e^{\lambda_1 t} \vec{x_1}$ ， $e^{\lambda_2 t} \vec{x_2}$ 同理

但是这两个特解仅仅满足了方程成立，并不一定满足 $\vec{u}(0) = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ ，不过容易证得这两个特解的任意线性组合也是方程的解，而且这两个特解线性无关，无论给出的 $\vec{u}(t_0)$ 是什么均可以表示

所以设 $\vec{u} = c_1 e^{\lambda_1 t} \vec{x_1} + c_2 e^{\lambda_2 t} \vec{x_2}$ ，将 $\vec{u}(0) = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ 代入得： $\begin{bmatrix} 1 \\ 0 \end{bmatrix} = c_1 e^{0} \begin{bmatrix} 2 \\ 1 \end{bmatrix} + c_2 e^{0} \begin{bmatrix} 1 \\ -1 \end{bmatrix}$ ，解得： $c_1 = c_2 = \dfrac{1}{3}$

因而 $\vec{u} = \dfrac{1}{3} \begin{bmatrix} 2 \\ 1 \end{bmatrix} + \dfrac{1}{3} e^{-3t} \begin{bmatrix} 1 \\ -1 \end{bmatrix}$

将 $u_1 , u_2$ 视作两个容器，将 $t$ 视作时间，由 $\vec{u}(0) = \begin{bmatrix} 1 \\ 0 \end{bmatrix}$ 可知刚开始 $u_1$ 中有 $1$ 的货物， $u_2$ 中没有货物，但是随着 $t$ 的增大，即时间的流逝，由于 $u_1^{'} < 0 , u_2^{'} > 0$ ， $u_1$ 中的货物渐渐流向了 $u_2$

可以发现当 $\to +\infty$ 时， $e^{-3t} \to 0$ ，所以 $\vec{u} \to \dfrac{1}{3} \begin{bmatrix} 2 \\ 1 \end{bmatrix}$ ，即 $\vec{u}$ 收敛于 $\dfrac{1}{3} \begin{bmatrix} 2 \\ 1 \end{bmatrix}$ ，此时称 $\dfrac{1}{3} \begin{bmatrix} 2 \\ 1 \end{bmatrix}$ 为 $\vec{u}$ 的稳态

证明稳态存在的条件为所有特征值的实部均为非负数：

若特征值为实数， $\lim_{t \to +\infty} e^{at} = \left \{ \begin{matrix} 1 , a = 0 \\ 0 , a < 0 \end{matrix} \right.$

若特征值为复数， $e^{(a + bi)t} = e^{at} \cdot e^{bti} = e^{at} (cos\ bt + i\ sin\ bt)$ ，想要当 $\to +\infty$ 时该项对 $\vec{u}$ 的影响不会无限增大，就要让 $e^{at} (cos\ bt + i\ sin\ bt)|$ 趋于稳定，而 $|cos\ bt + i\ sin\ bt| = 1$ ，所以只要让 $e^{at}$ 趋于稳定，那么又回到了特征值为实数的情况，所以 $\le 0$ 即可

综上， $Re\ \lambda \le 0$ 即可

容易证得所有特征值的实部均为负数时，稳态为 $\vec{0}$
考虑 $A$ 为二阶方阵时，满足什么 $\vec{u}$ 才能有稳态，设 $\begin{bmatrix} a & b \\ c & d \end{bmatrix}$ ，其实不用求出特征值就可以判断

若特征值均为复数，因为 $\lambda_1 + \lambda_2$ 且 $\lambda_1 , \lambda_2$ 为共轭复数，所以只需满足 $\le 0$ 即可

若特征值均为实数，此时 $\left \{ \begin{matrix} \lambda_1 + \lambda_2 \le 0 \\ \lambda_1 \cdot \lambda_2 \ge 0 \end{matrix} \right.$ 与稳态存在的条件等价，而 $\lambda_1 + \lambda_2 , |A| = \lambda_1 \cdot \lambda_2$ ，所以只要满足 $\left \{ \begin{matrix} a + d \le 0 \\ |A| \ge 0 \end{matrix} \right.$ 即可

当特征值均为复数时，因为两个特征值为共轭复数，所以 $\lambda_1 \cdot \lambda_2 \ge 0$ 恒成立

综上只需满足 $\left \{ \begin{matrix} a + d \le 0 \\ |A| \ge 0 \end{matrix} \right.$ 即可

矩阵指数

$A$ 表示了 $\vec{u}$ 各个元素之间的耦合方式，求 $A$ 的特征值和特征向量即为解耦，接下来换一种解耦思路

设 $\vec{u} = S \vec{v}$ ，代入得： $\dfrac{d \vec{v}}{dt} = AS \vec{v}$ ，左右同时乘 $S^{-1}$ 得： $\dfrac{d \vec{v}}{dt} = S^{-1} AS \vec{v} = \Lambda \vec{v}$

这样就转化为了关于 $\vec{v}$ 的方程，又因为 $\Lambda$ 为对角阵，所以 $\vec{v}$ 各个元素之间不存在耦合，因而 $v_n = c_n \cdot e^{\lambda_n t}$ ，将 $v_n(0)$ 代入得： $v_n = v_n(0) \cdot e^{\lambda_n t}$ ，所以 $\vec{v} = e^{\Lambda t} \vec{v}(0)$ ，所以 $\vec{u} = S \vec{v} = S e^{\Lambda t} \vec{v}(0) = S e^{\Lambda t} S^{-1} \vec{u}(0) = e^{At} \vec{u}(0)$ ，是不是看不懂？没关系，现在就来解释

引入矩阵指数，即底数为 $e$ ，指数为矩阵

$e^x$ 的麦克劳林公式为 $e^x = 1 + x + \dfrac{x^2}{2!} + \dfrac{x^3}{3!} + \cdots + \dfrac{x^n}{n!} + \cdots$

指数为矩阵时也一样，即 $e^x = I + A + \dfrac{A^2}{2!} + \dfrac{A^3}{3!} + \cdots + \dfrac{A^n}{n!} + \cdots$

拓展： 这用到了一个经典的麦克劳林级数 $e^x = \sum_{0}^{+\infty} \dfrac{x^n}{n!}$ ，其实另一个经典的麦克劳林级数 $\dfrac{1}{1 - x} = \sum_{0}^{+\infty} x^n$ 也对矩阵适用，即 $A)^{-1} = I + A + A^2 + \cdots + A^n + \cdots$ ，当 $A$ 的所有特征值的绝对值都小于 $1$ （如果特征值为复数，则模小于 $1$ ）时，这可以很方便的用来求矩阵的逆的近似值

证明当 $A$ 为对角阵时 $e^A_{i , i} = e^{a_{i , i}}：$

对于对角阵有 $A^k_{i , i} = a_{i , i}^k$ ，所以在用 $A$ 代入麦克劳林公式时， $A$ 的主对角线上的元素都分别代入了一次麦克劳林公式，那么自然会变为 $e$ 的幂

所以 $\vec{v} = \begin{bmatrix} e^{\lambda_1 t} & 0 & \cdots & 0 \\ 0 & e^{\lambda_2 t} & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & e^{\lambda_n t} \end{bmatrix} \vec{v}(0)= e^{\Lambda t} \vec{v}(0)$

证明 $e^{At} = S e^{\Lambda t} S^{-1}$ ：

$\begin{aligned} e^{At} & = I + At + \dfrac{(At)^2}{2!} + \dfrac{(At)^3}{3!} + \cdots + \dfrac{(At)^n}{n!} + \cdots \\ & = I + S \Lambda S^{-1} t + \dfrac{S \Lambda^2 S^{-1} t^2}{2!} + \cdots + \dfrac{S \Lambda^n S^{-1} t^n}{n!} + \cdots \\ & = S [I + \Lambda t + \dfrac{(\Lambda t)^2}{2!} + \cdots + \dfrac{(\Lambda t)^n}{n!} + \cdots] S^{-1} \\ & = S e^{\Lambda t} S^{-1} \end{aligned}$

想要让 $e^{At} \to O$ ，那么就需要 $e^{\Lambda t} \to O$ ，即 $e^{\lambda t} \to 0$ ，即 $Re\ \lambda < 0$

二阶常微分方程

对于一个二阶常微分方程 $y^{''} + b y^{'} + ky = 0$ ，令 $\vec{u} = \begin{bmatrix} y^{'} \\ y \end{bmatrix}$ ，则 $\vec{u}^{'} = \begin{bmatrix} y^{''} \\ y^{'} \end{bmatrix}$

所以 $\vec{u}^{'} = \begin{bmatrix} -b & -k \\ 1 & 0 \end{bmatrix} \vec{u}$ ，设 $\begin{bmatrix} -b & -k \\ 1 & 0 \end{bmatrix}$ ，这样又可以利用矩阵求解

对于更高阶的微分方程也可以使用类似的方法

那样 $\vec{u} , \vec{u}^{'}$ 为 $n$ 阶向量， $A$ 为 $n$ 阶方阵且 $\begin{bmatrix} \_ & \_ & \cdots & \_ & \_ \\ 1 & 0 & \cdots & 0 & 0\\ 0 & 1 & \cdots & 0 & 0\\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & 0\end{bmatrix}$ ，所以 $0$ 一定不是 $A$ 的特征值