工程数学速记手册(下)
第六部分:概率与统计
概率基础
概率空间与事件
概率空间是概率论中的基本概念,用于描述随机试验的所有可能结果及其概率。一个概率空间可以表示为三元组 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P),其中:
- Ω \Omega Ω 是样本空间,表示所有可能的实验结果。
- F \mathcal{F} F 是事件的集合,满足σ-代数的性质,即包含空集、对补集运算封闭、对可数并运算封闭。
- P P P 是概率测度,将事件集合映射到 [ 0 , 1 ] [0,1] [0,1] 之间的数,满足概率公理。
事件是样本空间 Ω \Omega Ω 的子集,表示随机试验可能出现的结果组合。事件可以是简单事件(单个结果),也可以是复合事件(多个结果的集合)。事件运算包括并、交、补等,满足德摩根定律。
概率公理
概率公理是建立概率理论的基础,通常包括以下三个基本公理:
-
非负性公理:
对于任意事件 A A A,有:
P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0 -
规范化公理:
整个样本空间的概率为 1,即:
P ( Ω ) = 1 P(\Omega) = 1 P(Ω)=1 -
可列可加公理:
对于一列两两互斥的事件 A 1 , A 2 , … A_1, A_2, \ldots A1,A2,…,有:
P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i) P(i=1⋃∞Ai)=i=1∑∞P(Ai)
推论:
- P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0
- P ( A c ) = 1 − P ( A ) P(A^c) = 1 - P(A) P(Ac)=1−P(A)
- 若 A ⊆ B A \subseteq B A⊆B,则 P ( A ) ≤ P ( B ) P(A) \leq P(B) P(A)≤P(B)
- P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B)
- 容斥原理:对于任意n个事件,有:
P ( ⋃ i = 1 n A i ) = ∑ i = 1 n P ( A i ) − ∑ 1 ≤ i < j ≤ n P ( A i ∩ A j ) + ⋯ + ( − 1 ) n + 1 P ( ⋂ i = 1 n A i ) P\left(\bigcup_{i=1}^{n} A_i\right) = \sum_{i=1}^{n} P(A_i) - \sum_{1\leq i<j\leq n} P(A_i \cap A_j) + \cdots + (-1)^{n+1} P\left(\bigcap_{i=1}^{n} A_i\right) P(i=1⋃nAi)=i=1∑nP(Ai)−1≤i<j≤n∑P(Ai∩Aj)+⋯+(−1)n+1P(i=1⋂nAi)
随机变量
随机变量是将样本空间 Ω \Omega Ω 映射到实数集的函数,用于量化随机试验的结果。根据随机变量取值的性质,随机变量可分为:
离散随机变量
如果随机变量
X
X
X 只能取有限或可数无限多个离散值,则称为离散随机变量。其概率质量函数(PMF)定义为:
P
(
X
=
x
i
)
=
p
i
P(X = x_i) = p_i
P(X=xi)=pi
其中,
x
i
x_i
xi 是
X
X
X 的可能取值,
p
i
p_i
pi 满足
p
i
≥
0
p_i \geq 0
pi≥0 且
∑
p
i
=
1
\sum p_i = 1
∑pi=1。
常见分布:
-
伯努利分布:
P ( X = 1 ) = p , P ( X = 0 ) = 1 − p P(X = 1) = p, \quad P(X = 0) = 1 - p P(X=1)=p,P(X=0)=1−p -
二项分布( n n n 次独立试验的成功次数):
P ( X = k ) = ( n k ) p k ( 1 − p ) n − k , k = 0 , 1 , … , n P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}, \quad k = 0,1,\ldots,n P(X=k)=(kn)pk(1−p)n−k,k=0,1,…,n -
泊松分布(单位时间内事件发生的次数):
P ( X = k ) = λ k e − λ k ! , k = 0 , 1 , 2 , … P(X = k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k = 0,1,2,\ldots P(X=k)=k!λke−λ,k=0,1,2,… -
几何分布(首次成功所需的试验次数):
P ( X = k ) = ( 1 − p ) k − 1 p , k = 1 , 2 , 3 , … P(X = k) = (1 - p)^{k-1} p, \quad k = 1,2,3,\ldots P(X=k)=(1−p)k−1p,k=1,2,3,…
连续随机变量
如果随机变量
X
X
X 的取值为连续区间内的任意实数,则称为连续随机变量。其概率密度函数(PDF)定义为:
f
X
(
x
)
=
d
d
x
P
(
X
≤
x
)
f_X(x) = \frac{d}{dx} P(X \leq x)
fX(x)=dxdP(X≤x)
满足:
∫
−
∞
∞
f
X
(
x
)
d
x
=
1
\int_{-\infty}^{\infty} f_X(x) dx = 1
∫−∞∞fX(x)dx=1
常见分布:
-
正态分布:
f X ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , x ∈ R f_X(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{ -\frac{(x - \mu)^2}{2\sigma^2} }, \quad x \in \mathbb{R} fX(x)=2πσ1e−2σ2(x−μ)2,x∈R
其中, μ \mu μ 为均值, σ \sigma σ 为标准差。 -
指数分布:
f X ( x ) = λ e − λ x , x ≥ 0 f_X(x) = \lambda e^{ -\lambda x }, \quad x \geq 0 fX(x)=λe−λx,x≥0
其中, λ > 0 \lambda > 0 λ>0 是参数。 -
均匀分布:
f X ( x ) = { 1 b − a a ≤ x ≤ b 0 其他 f_X(x) = \begin{cases} \frac{1}{b-a} & a \leq x \leq b \\ 0 & \text{其他} \end{cases} fX(x)={b−a10a≤x≤b其他 -
伽马分布:
f X ( x ) = β α Γ ( α ) x α − 1 e − β x , x > 0 f_X(x) = \frac{\beta^\alpha}{\Gamma(\alpha)} x^{\alpha-1} e^{-\beta x}, \quad x > 0 fX(x)=Γ(α)βαxα−1e−βx,x>0
其中, α > 0 \alpha > 0 α>0 为形状参数, β > 0 \beta > 0 β>0 为尺度参数。
统计分析
统计分析主要分为描述统计和推断统计两大类,用于数据的整理与分析、参数估计与假设检验等。
描述统计
描述统计用于对收集到的数据进行总结和描述,主要通过计算各种统计量来体现数据的特征。
期望与方差
-
期望(均值):
表示随机变量取值的平均水平。对于离散随机变量 X X X,期望为:
E ( X ) = ∑ i x i P ( X = x i ) E(X) = \sum_{i} x_i P(X = x_i) E(X)=i∑xiP(X=xi)
对于连续随机变量 X X X,期望为:
E ( X ) = ∫ − ∞ ∞ x f X ( x ) d x E(X) = \int_{-\infty}^{\infty} x f_X(x) dx E(X)=∫−∞∞xfX(x)dx -
方差:
描述随机变量围绕期望的离散程度。定义为:
Var ( X ) = E [ ( X − E ( X ) ) 2 ] = E ( X 2 ) − [ E ( X ) ] 2 \text{Var}(X) = E[(X - E(X))^2] = E(X^2) - [E(X)]^2 Var(X)=E[(X−E(X))2]=E(X2)−[E(X)]2
性质:
- Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2\text{Var}(X) Var(aX+b)=a2Var(X)
- 若 X X X 和 Y Y Y 独立,则 Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)
- 切比雪夫不等式:对于任意
k
>
0
k > 0
k>0,
P ( ∣ X − μ ∣ ≥ k σ ) ≤ 1 k 2 P(|X - \mu| \geq k\sigma) \leq \frac{1}{k^2} P(∣X−μ∣≥kσ)≤k21
常用统计量
- 中位数:将数据分为上下两部分的数值。
- 众数:数据中出现次数最多的值。
- 标准差:方差的平方根,表示数据的离散程度。
- 偏度:描述数据分布的不对称性。
- 峰度:描述数据分布的尖峭程度。
- 分位数:将数据按比例划分的数值点,如四分位数、百分位数等。
推断统计
推断统计通过样本数据对总体参数进行估计和假设检验,主要包括参数估计和假设检验两部分。
参数估计
估计总体参数的常用方法包括点估计和区间估计。
-
点估计:用样本统计量直接估计总体参数。例如,样本均值 x ˉ = 1 n ∑ i = 1 n x i \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i xˉ=n1∑i=1nxi 是总体均值 μ \mu μ 的点估计。
-
区间估计:在一定置信度下,建立参数的估计区间。例如,95%置信区间为:
x ˉ ± z α 2 σ n \bar{x} \pm z_{\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} xˉ±z2αnσ
其中, z α 2 z_{\frac{\alpha}{2}} z2α 是标准正态分布的临界值, σ \sigma σ 是总体标准差, n n n 是样本容量。
估计量的评价标准:
- 无偏性: E ( θ ^ ) = θ E(\hat{\theta}) = \theta E(θ^)=θ
- 有效性:方差最小
- 一致性:当 n → ∞ n \to \infty n→∞ 时, θ ^ → θ \hat{\theta} \to \theta θ^→θ
- 充分性:估计量包含样本中关于参数的所有信息
假设检验
假设检验用于根据样本数据对关于总体参数的假设进行判定。
基本步骤:
- 提出假设:包括原假设 H 0 H_0 H0 和备择假设 H 1 H_1 H1。
- 选择显著性水平:通常选用 α = 0.05 \alpha = 0.05 α=0.05。
- 计算检验统计量:根据样本数据计算统计量,例如 t t t 统计量。
- 做出决策:比较统计量与临界值,决定是否拒绝原假设。
实例:
假设要检验某工厂生产的零件直径是否符合设计要求( μ = 10 \mu = 10 μ=10 mm),采样 n = 30 n = 30 n=30 个零件,计算样本均值 x ˉ = 10.2 \bar{x} = 10.2 xˉ=10.2 mm,样本标准差 s = 0.3 s = 0.3 s=0.3 mm,显著性水平 α = 0.05 \alpha = 0.05 α=0.05。
- 原假设 H 0 : μ = 10 H_0: \mu = 10 H0:μ=10,备择假设 H 1 : μ ≠ 10 H_1: \mu \neq 10 H1:μ=10。
- 计算
t
t
t 统计量:
t = x ˉ − μ s / n = 10.2 − 10 0.3 / 30 ≈ 3.65 t = \frac{\bar{x} - \mu}{s / \sqrt{n}} = \frac{10.2 - 10}{0.3 / \sqrt{30}} \approx 3.65 t=s/nxˉ−μ=0.3/3010.2−10≈3.65 - 查找临界值 t α / 2 = 2.045 t_{\alpha/2} = 2.045 tα/2=2.045(自由度为29)。
- 由于 ∣ t ∣ = 3.65 > 2.045 |t| = 3.65 > 2.045 ∣t∣=3.65>2.045,拒绝原假设,认为生产过程中存在偏差。
注意事项:
- 第一类错误:拒绝正确的原假设
- 第二类错误:接受错误的原假设
- 检验功效:1 - 第二类错误概率
第七部分:傅里叶分析
傅里叶级数
级数展开
周期函数的傅里叶展开
傅里叶级数是法国数学家傅里叶提出的重要数学工具,它将周期函数表示为正弦和余弦函数的无穷级数之和。设
f
(
x
)
f(x)
f(x) 是一个周期为
2
π
2\pi
2π 的函数,其傅里叶级数展开式为:
f
(
x
)
=
a
0
2
+
∑
n
=
1
∞
(
a
n
cos
(
n
x
)
+
b
n
sin
(
n
x
)
)
f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(nx) + b_n \sin(nx) \right)
f(x)=2a0+n=1∑∞(ancos(nx)+bnsin(nx))
其中,
a
0
a_0
a0 表示直流分量,
a
n
a_n
an 和
b
n
b_n
bn 分别表示各次谐波的余弦和正弦分量幅度。
对于一般周期
T
T
T 的函数,傅里叶级数可表示为:
f
(
x
)
=
a
0
2
+
∑
n
=
1
∞
(
a
n
cos
(
2
n
π
x
T
)
+
b
n
sin
(
2
n
π
x
T
)
)
f(x) = \frac{a_0}{2} + \sum_{n=1}^{\infty} \left( a_n \cos(\frac{2n\pi x}{T}) + b_n \sin(\frac{2n\pi x}{T}) \right)
f(x)=2a0+n=1∑∞(ancos(T2nπx)+bnsin(T2nπx))
傅里叶级数的存在条件
傅里叶级数的收敛性由戴利克雷条件保证,要求函数 f ( x ) f(x) f(x) 满足:
- 在一个周期内有有限个极值
- 在一个周期内有有限个第一类间断点
- 在一个周期内绝对可积
当这些条件满足时,傅里叶级数在连续点收敛于函数值,在间断点收敛于左右极限的平均值。
傅里叶系数计算
正交性与系数求解
傅里叶系数的计算基于三角函数系的正交性。对于周期为
2
π
2\pi
2π 的函数
f
(
x
)
f(x)
f(x),其傅里叶系数计算公式为:
a
n
=
1
π
∫
−
π
π
f
(
x
)
cos
(
n
x
)
d
x
(
n
=
0
,
1
,
2
,
⋯
)
a_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \cos(nx) dx \quad (n = 0,1,2,\cdots)
an=π1∫−ππf(x)cos(nx)dx(n=0,1,2,⋯)
b
n
=
1
π
∫
−
π
π
f
(
x
)
sin
(
n
x
)
d
x
(
n
=
1
,
2
,
3
,
⋯
)
b_n = \frac{1}{\pi} \int_{-\pi}^{\pi} f(x) \sin(nx) dx \quad (n = 1,2,3,\cdots)
bn=π1∫−ππf(x)sin(nx)dx(n=1,2,3,⋯)
对于奇函数和偶函数,傅里叶级数可以简化:
- 奇函数: a n = 0 a_n = 0 an=0,只有正弦项
- 偶函数: b n = 0 b_n = 0 bn=0,只有余弦项
正交性原理
三角函数系的正交性体现在:
∫
−
π
π
cos
(
n
x
)
cos
(
m
x
)
d
x
=
{
0
n
≠
m
π
n
=
m
≠
0
2
π
n
=
m
=
0
\int_{-\pi}^{\pi} \cos(nx) \cos(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \neq 0 \\ 2\pi & n = m = 0 \end{cases}
∫−ππcos(nx)cos(mx)dx=⎩
⎨
⎧0π2πn=mn=m=0n=m=0
∫
−
π
π
sin
(
n
x
)
sin
(
m
x
)
d
x
=
{
0
n
≠
m
π
n
=
m
\int_{-\pi}^{\pi} \sin(nx) \sin(mx) dx = \begin{cases} 0 & n \neq m \\ \pi & n = m \end{cases}
∫−ππsin(nx)sin(mx)dx={0πn=mn=m
∫
−
π
π
sin
(
n
x
)
cos
(
m
x
)
d
x
=
0
∀
n
,
m
\int_{-\pi}^{\pi} \sin(nx) \cos(mx) dx = 0 \quad \forall n, m
∫−ππsin(nx)cos(mx)dx=0∀n,m
这种正交性保证了傅里叶系数的唯一性,并简化了计算过程。
傅里叶变换
连续傅里叶变换
傅里叶变换将时域信号转换为频域表示,定义为:
F
(
ω
)
=
∫
−
∞
∞
f
(
t
)
e
−
i
ω
t
d
t
F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i\omega t} dt
F(ω)=∫−∞∞f(t)e−iωtdt
其逆变换为:
f
(
t
)
=
1
2
π
∫
−
∞
∞
F
(
ω
)
e
i
ω
t
d
ω
f(t) = \frac{1}{2\pi} \int_{-\infty}^{\infty} F(\omega) e^{i\omega t} d\omega
f(t)=2π1∫−∞∞F(ω)eiωtdω
基本性质
- 线性性: F [ a f ( t ) + b g ( t ) ] = a F ( ω ) + b G ( ω ) \mathcal{F}[af(t)+bg(t)] = aF(\omega)+bG(\omega) F[af(t)+bg(t)]=aF(ω)+bG(ω)
- 时移性: F [ f ( t − t 0 ) ] = F ( ω ) e − i ω t 0 \mathcal{F}[f(t-t_0)] = F(\omega)e^{-i\omega t_0} F[f(t−t0)]=F(ω)e−iωt0
- 频移性: F [ f ( t ) e i ω 0 t ] = F ( ω − ω 0 ) \mathcal{F}[f(t)e^{i\omega_0 t}] = F(\omega-\omega_0) F[f(t)eiω0t]=F(ω−ω0)
- 尺度变换: F [ f ( a t ) ] = 1 ∣ a ∣ F ( ω a ) \mathcal{F}[f(at)] = \frac{1}{|a|}F(\frac{\omega}{a}) F[f(at)]=∣a∣1F(aω)
- 卷积定理:时域卷积对应频域乘积
- Parseval定理:时域和频域能量守恒
应用
信号处理
傅里叶变换在信号处理中用于:
- 频谱分析:识别信号中的频率成分
- 滤波器设计:实现低通、高通、带通等滤波器
- 信号去噪:分离有用信号和噪声
- 调制解调:在通信系统中实现信号的调制与解调
- 图像处理:在频域进行图像增强和压缩
系统分析
在系统分析中,傅里叶变换用于:
- 研究LTI系统的频率响应
- 分析系统的稳定性和性能
- 设计控制系统
- 系统辨识:通过频域分析确定系统模型
- 故障诊断:通过频谱特征识别系统故障
实例应用
实例 1:信号的频谱分析
考虑信号
f
(
t
)
=
2
cos
(
5
t
)
+
3
sin
(
2
t
)
f(t) = 2\cos(5t) + 3\sin(2t)
f(t)=2cos(5t)+3sin(2t),其傅里叶变换为:
F
(
ω
)
=
2
π
[
δ
(
ω
−
5
)
+
δ
(
ω
+
5
)
]
+
3
π
i
[
δ
(
ω
−
2
)
−
δ
(
ω
+
2
)
]
F(\omega) = 2\pi[\delta(\omega-5)+\delta(\omega+5)] + \frac{3\pi}{i}[\delta(\omega-2)-\delta(\omega+2)]
F(ω)=2π[δ(ω−5)+δ(ω+5)]+i3π[δ(ω−2)−δ(ω+2)]
通过傅里叶变换,可以清晰地识别出信号中包含的5 rad/s和2 rad/s两个频率成分。
实例 2:系统的频率响应
对于RC低通滤波器,其传递函数为:
H
(
ω
)
=
1
1
+
i
ω
R
C
H(\omega) = \frac{1}{1+i\omega RC}
H(ω)=1+iωRC1
通过傅里叶变换,可以分析系统对不同频率信号的衰减特性,确定截止频率为
ω
c
=
1
R
C
\omega_c = \frac{1}{RC}
ωc=RC1,为滤波器设计提供理论依据。
实例 3:图像压缩
在JPEG图像压缩中,首先对图像进行分块,然后对每个8×8的块进行离散余弦变换(DCT),将图像从空间域转换到频域。通过量化高频分量,保留主要低频信息,从而实现图像压缩。
实例 4:通信系统
在正交频分复用(OFDM)系统中,利用快速傅里叶变换(FFT)将高速数据流分解为多个低速子载波,提高了频谱利用率和抗干扰能力,广泛应用于4G/5G移动通信系统。
第八部分:矩阵理论
矩阵理论是工程数学的核心内容之一,为线性代数、优化理论等提供了重要的数学工具。本节将深入探讨矩阵分解、线性变换和最优化问题等关键内容,从基本概念到实际应用,由浅入深地展开讨论。
矩阵分解
矩阵分解是将复杂矩阵分解为若干更简单矩阵乘积的过程,这种分解不仅便于计算和分析,还能揭示矩阵的内在结构特征。常见的矩阵分解方法包括LU分解、QR分解和奇异值分解(SVD),每种方法都有其特定的应用场景和优势。
LU分解
LU分解是求解线性方程组的基础方法,它将一个方阵
A
A
A分解为一个下三角矩阵
L
L
L和一个上三角矩阵
U
U
U的乘积:
A
=
L
U
A = LU
A=LU
其中,
L
L
L为单位下三角矩阵(主对角线元素为1),
U
U
U为上三角矩阵。LU分解在求解线性方程组、计算行列式和逆矩阵等方面有广泛应用。
计算方法
LU分解通常通过高斯消元法实现,具体步骤如下:
- 对矩阵 A A A进行高斯消元,得到上三角矩阵 U U U
- 在消元过程中记录下每一步的系数,构造出下三角矩阵 L L L
- 若出现主元为零的情况,需要进行行交换(引入置换矩阵 P P P,即PLU分解)
实例
考虑矩阵
A = ( 2 3 1 4 7 7 6 18 22 ) A = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} A= 24637181722
通过LU分解,可以得到
L = ( 1 0 0 2 1 0 3 3 1 ) , U = ( 2 3 1 0 1 5 0 0 2 ) L = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix}, \quad U = \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} L= 123013001 ,U= 200310152
验证:
L U = ( 1 0 0 2 1 0 3 3 1 ) ( 2 3 1 0 1 5 0 0 2 ) = ( 2 3 1 4 7 7 6 18 22 ) = A LU = \begin{pmatrix} 1 & 0 & 0 \\ 2 & 1 & 0 \\ 3 & 3 & 1 \end{pmatrix} \begin{pmatrix} 2 & 3 & 1 \\ 0 & 1 & 5 \\ 0 & 0 & 2 \end{pmatrix} = \begin{pmatrix} 2 & 3 & 1 \\ 4 & 7 & 7 \\ 6 & 18 & 22 \end{pmatrix} = A LU= 123013001 200310152 = 24637181722 =A
QR分解
QR分解是解决最小二乘问题和计算特征值的重要工具,它将一个矩阵
A
A
A分解为一个正交矩阵
Q
Q
Q和一个上三角矩阵
R
R
R的乘积:
A
=
Q
R
A = QR
A=QR
其中,
Q
Q
Q满足
Q
T
Q
=
I
Q^T Q = I
QTQ=I,
R
R
R为上三角矩阵。QR分解在数值线性代数中具有重要地位。
计算方法
QR分解的实现方法主要有:
- 格拉姆-施密特正交化:逐步构造正交基
- 豪斯霍尔德变换:通过反射变换实现正交化
- 吉文斯旋转:通过平面旋转实现正交化
实例
对于矩阵
A = ( 1 1 1 − 1 1 1 ) A = \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} A= 1111−11
其QR分解为
Q = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) , R = ( 3 1 2 0 2 ) Q = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix}, \quad R = \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix} Q= 31313121−210 ,R=(30212)
验证:
Q R = ( 1 3 1 2 1 3 − 1 2 1 3 0 ) ( 3 1 2 0 2 ) = ( 1 1 1 − 1 1 1 ) = A QR = \begin{pmatrix} \frac{1}{\sqrt{3}} & \frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{3}} & 0 \end{pmatrix} \begin{pmatrix} \sqrt{3} & \frac{1}{\sqrt{2}} \\ 0 & \sqrt{2} \end{pmatrix}= \begin{pmatrix} 1 & 1 \\ 1 & -1 \\ 1 & 1 \end{pmatrix} = A QR= 31313121−210 (30212)= 1111−11 =A
奇异值分解(SVD)
奇异值分解是矩阵分析中最强大的工具之一,它将任意矩阵
A
A
A分解为三个矩阵的乘积:
A
=
U
Σ
V
T
A = U \Sigma V^T
A=UΣVT
其中,
U
U
U和
V
V
V是正交矩阵,
Σ
\Sigma
Σ是一个对角矩阵,其对角线上的元素称为奇异值。SVD在数据压缩、噪声过滤、主成分分析等领域有广泛应用。
计算方法
SVD的计算通常通过:
- 双谱算法:适用于中小规模矩阵
- 雅可比旋转法:适用于对称矩阵
- 分治法:适用于大规模矩阵
实例
对于矩阵
A = ( 3 1 1 3 ) A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} A=(3113)
其奇异值分解为
U = ( 1 2 − 1 2 1 2 1 2 ) , Σ = ( 4 0 0 2 ) , V T = U T U = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}, \quad \Sigma = \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix}, \quad V^T = U^T U=(2121−2121),Σ=(4002),VT=UT
验证:
U Σ V T = ( 1 2 − 1 2 1 2 1 2 ) ( 4 0 0 2 ) ( 1 2 1 2 − 1 2 1 2 ) = ( 3 1 1 3 ) = A U \Sigma V^T = \begin{pmatrix} \frac{1}{\sqrt{2}} & -\frac{1}{\sqrt{2}} \\ \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix} \begin{pmatrix} 4 & 0 \\ 0 & 2 \end{pmatrix} \begin{pmatrix} \frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \\ -\frac{1}{\sqrt{2}} & \frac{1}{\sqrt{2}} \end{pmatrix}= \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix} = A UΣVT=(2121−2121)(4002)(21−212121)=(3113)=A
应用
矩阵理论在工程领域中有广泛的应用,主要包括线性变换和最优化问题等。
线性变换
线性变换是保持向量加法和标量乘法的映射,其可以通过矩阵来表示和分析。
矩阵与线性映射
给定一个线性变换
T
:
R
n
→
R
m
T: \mathbb{R}^n \to \mathbb{R}^m
T:Rn→Rm,存在唯一的矩阵
A
∈
R
m
×
n
A \in \mathbb{R}^{m \times n}
A∈Rm×n,使得
T
(
x
)
=
A
x
T(\mathbf{x}) = A\mathbf{x}
T(x)=Ax
其中,
x
∈
R
n
\mathbf{x} \in \mathbb{R}^n
x∈Rn为输入向量,
A
x
∈
R
m
A\mathbf{x} \in \mathbb{R}^m
Ax∈Rm为输出向量。
基本性质
- 保持加法: T ( x + y ) = T ( x ) + T ( y ) T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) T(x+y)=T(x)+T(y)
- 保持标量乘法: T ( c x ) = c T ( x ) T(c\mathbf{x}) = cT(\mathbf{x}) T(cx)=cT(x)
- 组合性:若 T 1 T_1 T1和 T 2 T_2 T2分别由矩阵 A A A和 B B B表示,则 T 1 ∘ T 2 T_1 \circ T_2 T1∘T2由矩阵 B A BA BA表示
- 核与像空间:核空间 ker ( T ) \ker(T) ker(T)和像空间 im ( T ) \operatorname{im}(T) im(T)是重要的子空间
- 秩-零度定理: dim ( ker ( T ) ) + dim ( im ( T ) ) = n \dim(\ker(T)) + \dim(\operatorname{im}(T)) = n dim(ker(T))+dim(im(T))=n
实例
考虑线性变换
T
:
R
2
→
R
2
T: \mathbb{R}^2 \to \mathbb{R}^2
T:R2→R2,其矩阵表示为
A
=
(
2
0
0
3
)
A = \begin{pmatrix} 2 & 0 \\ 0 & 3 \end{pmatrix}
A=(2003)
则对于向量
x
=
(
x
y
)
\mathbf{x} = \begin{pmatrix} x \\ y \end{pmatrix}
x=(xy),有
T
(
x
)
=
A
x
=
(
2
x
3
y
)
T(\mathbf{x}) = A\mathbf{x} = \begin{pmatrix} 2x \\ 3y \end{pmatrix}
T(x)=Ax=(2x3y)
此变换对应于
x
x
x轴方向的缩放因子为2,
y
y
y轴方向的缩放因子为3。
最优化问题
最优化问题旨在找到一个目标函数的最优值(最小值或最大值),通常在一定约束条件下进行。
二次规划与拉格朗日乘数法
二次规划是一类特殊的最优化问题,其目标函数为二次函数,约束条件为线性不等式或等式。
min
x
1
2
x
T
Q
x
+
c
T
x
\min_{\mathbf{x}} \frac{1}{2}\mathbf{x}^T Q \mathbf{x} + \mathbf{c}^T \mathbf{x}
xmin21xTQx+cTx
受限于
A
x
≤
b
A\mathbf{x} \leq \mathbf{b}
Ax≤b
其中,
Q
Q
Q是对称正定矩阵,确保目标函数的凸性。
拉格朗日乘数法
拉格朗日乘数法是一种用于求解带等式约束的最优化问题的方法。对于目标函数
f
(
x
)
f(\mathbf{x})
f(x),约束条件
g
(
x
)
=
0
g(\mathbf{x}) = 0
g(x)=0,构建拉格朗日函数:
L
(
x
,
λ
)
=
f
(
x
)
+
λ
g
(
x
)
\mathcal{L}(\mathbf{x}, \lambda) = f(\mathbf{x}) + \lambda g(\mathbf{x})
L(x,λ)=f(x)+λg(x)
通过对
L
\mathcal{L}
L分别对
x
\mathbf{x}
x和
λ
\lambda
λ求偏导并令其为零,得到最优解。
实例
求解以下二次规划问题:
min
x
x
1
2
+
x
2
2
\min_{\mathbf{x}} x_1^2 + x_2^2
xminx12+x22
受限于
x
1
+
x
2
≥
1
x_1 + x_2 \geq 1
x1+x2≥1
通过构建拉格朗日函数:
L
(
x
1
,
x
2
,
λ
)
=
x
1
2
+
x
2
2
+
λ
(
1
−
x
1
−
x
2
)
\mathcal{L}(x_1, x_2, \lambda) = x_1^2 + x_2^2 + \lambda (1 - x_1 - x_2)
L(x1,x2,λ)=x12+x22+λ(1−x1−x2)
求解KKT条件:
∂
L
∂
x
1
=
2
x
1
−
λ
=
0
∂
L
∂
x
2
=
2
x
2
−
λ
=
0
∂
L
∂
λ
=
1
−
x
1
−
x
2
=
0
\frac{\partial \mathcal{L}}{\partial x_1} = 2x_1 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial x_2} = 2x_2 - \lambda = 0 \\ \frac{\partial \mathcal{L}}{\partial \lambda} = 1 - x_1 - x_2 = 0
∂x1∂L=2x1−λ=0∂x2∂L=2x2−λ=0∂λ∂L=1−x1−x2=0
解得:
x
1
=
x
2
=
1
2
,
λ
=
1
x_1 = x_2 = \frac{1}{2}, \quad \lambda = 1
x1=x2=21,λ=1
对应的最小值为:
1
2
2
+
1
2
2
=
1
2
\frac{1}{2}^2 + \frac{1}{2}^2 = \frac{1}{2}
212+212=21
第九部分:偏微分方程
基本概念与分类
偏微分方程(Partial Differential Equations, PDEs)是描述多变量函数及其偏导数之间关系的方程,在工程、物理等领域有广泛应用。根据方程中最高阶导数的性质,偏微分方程可分为三类:
椭圆型方程
椭圆型偏微分方程通常用于描述稳态过程,如热传导、电场分布和流体力学中的势流问题。其标准形式为:
A
∂
2
u
∂
x
2
+
B
∂
2
u
∂
x
∂
y
+
C
∂
2
u
∂
y
2
+
D
∂
u
∂
x
+
E
∂
u
∂
y
+
F
u
=
G
A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial^2 u}{\partial x \partial y} + C \frac{\partial^2 u}{\partial y^2} + D \frac{\partial u}{\partial x} + E \frac{\partial u}{\partial y} + Fu = G
A∂x2∂2u+B∂x∂y∂2u+C∂y2∂2u+D∂x∂u+E∂y∂u+Fu=G
其中,系数满足判别式
B
2
−
4
A
C
<
0
B^2 - 4AC < 0
B2−4AC<0。典型的椭圆型方程包括:
- 拉普拉斯方程:
Δ u = ∂ 2 u ∂ x 2 + ∂ 2 u ∂ y 2 = 0 \Delta u = \frac{\partial^2 u}{\partial x^2} + \frac{\partial^2 u}{\partial y^2} = 0 Δu=∂x2∂2u+∂y2∂2u=0 - 泊松方程:
Δ u = f ( x , y ) \Delta u = f(x,y) Δu=f(x,y) - 亥姆霍兹方程:
Δ u + k 2 u = 0 \Delta u + k^2u = 0 Δu+k2u=0
应用实例:
- 稳态热传导问题中的温度分布
- 静电场中的电势分布
- 不可压缩流体的势流问题
- 弹性力学中的平面应力问题
抛物型方程
抛物型偏微分方程常用于描述扩散过程,如热传导、物质扩散和金融数学中的期权定价。其标准形式为:
A
∂
2
u
∂
x
2
+
B
∂
u
∂
t
+
C
∂
u
∂
x
+
D
u
=
E
A \frac{\partial^2 u}{\partial x^2} + B \frac{\partial u}{\partial t} + C \frac{\partial u}{\partial x} + Du = E
A∂x2∂2u+B∂t∂u+C∂x∂u+Du=E
判别式满足
B
2
−
4
A
C
=
0
B^2 - 4AC = 0
B2−4AC=0。典型的抛物型方程包括:
- 热传导方程:
∂ u ∂ t = α ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2} ∂t∂u=α∂x2∂2u - 扩散方程:
∂ u ∂ t = D ∂ 2 u ∂ x 2 \frac{\partial u}{\partial t} = D \frac{\partial^2 u}{\partial x^2} ∂t∂u=D∂x2∂2u - Fokker-Planck方程:
∂ u ∂ t = − ∂ ∂ x ( a ( x ) u ) + 1 2 ∂ 2 ∂ x 2 ( b ( x ) u ) \frac{\partial u}{\partial t} = -\frac{\partial}{\partial x}(a(x)u) + \frac{1}{2}\frac{\partial^2}{\partial x^2}(b(x)u) ∂t∂u=−∂x∂(a(x)u)+21∂x2∂2(b(x)u)
应用实例:
- 物体内部温度随时间的变化
- 污染物在环境中的扩散
- Black-Scholes期权定价模型
- 粒子在势场中的运动
双曲型方程
双曲型偏微分方程主要用于描述波动现象,如声波、电磁波和弹性力学中的振动问题。其标准形式为:
A
∂
2
u
∂
t
2
+
B
∂
2
u
∂
x
2
+
C
∂
u
∂
t
+
D
∂
u
∂
x
+
E
u
=
F
A \frac{\partial^2 u}{\partial t^2} + B \frac{\partial^2 u}{\partial x^2} + C \frac{\partial u}{\partial t} + D \frac{\partial u}{\partial x} + Eu = F
A∂t2∂2u+B∂x2∂2u+C∂t∂u+D∂x∂u+Eu=F
判别式满足
B
2
−
4
A
C
>
0
B^2 - 4AC > 0
B2−4AC>0。典型的双曲型方程包括:
- 波动方程:
∂ 2 u ∂ t 2 = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u=c2∂x2∂2u - 电报方程:
∂ 2 u ∂ t 2 + 2 α ∂ u ∂ t + β 2 u = c 2 ∂ 2 u ∂ x 2 \frac{\partial^2 u}{\partial t^2} + 2\alpha \frac{\partial u}{\partial t} + \beta^2 u = c^2 \frac{\partial^2 u}{\partial x^2} ∂t2∂2u+2α∂t∂u+β2u=c2∂x2∂2u - Klein-Gordon方程:
∂ 2 u ∂ t 2 − Δ u + m 2 u = 0 \frac{\partial^2 u}{\partial t^2} - \Delta u + m^2u = 0 ∂t2∂2u−Δu+m2u=0
应用实例:
- 声波在空气中的传播
- 电磁波在介质中的传播
- 弹性体的振动问题
- 量子场论中的标量场
求解方法
分离变量法
分离变量法是求解线性偏微分方程的经典方法,适用于具有齐次边界条件的问题。基本步骤如下:
- 假设解可以表示为各变量的乘积形式,即 u ( x , y ) = X ( x ) Y ( y ) u(x, y) = X(x)Y(y) u(x,y)=X(x)Y(y)。
- 将假设代入原方程,分离变量,使得两边只含有单一变量的函数。
- 得到两个常微分方程,分别关于 X ( x ) X(x) X(x) 和 Y ( y ) Y(y) Y(y)。
- 求解这两个常微分方程,得到通解。
- 根据边界条件确定常数,得到特定解。
实例:求解一维热传导方程
∂
u
∂
t
=
α
∂
2
u
∂
x
2
\frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2}
∂t∂u=α∂x2∂2u
假设解为
u
(
x
,
t
)
=
X
(
x
)
T
(
t
)
u(x, t) = X(x)T(t)
u(x,t)=X(x)T(t),代入方程后可得到
1
α
T
d
T
d
t
=
1
X
d
2
X
d
x
2
=
−
λ
\frac{1}{\alpha T} \frac{dT}{dt} = \frac{1}{X} \frac{d^2 X}{dx^2} = -\lambda
αT1dtdT=X1dx2d2X=−λ
从而得到两个常微分方程:
d
T
d
t
+
α
λ
T
=
0
\frac{dT}{dt} + \alpha \lambda T = 0
dtdT+αλT=0
d
2
X
d
x
2
+
λ
X
=
0
\frac{d^2 X}{dx^2} + \lambda X = 0
dx2d2X+λX=0
根据边界条件求解,得到温度分布随时间的变化规律。
特征线法
特征线法适用于一阶偏微分方程,通过寻找特征线将偏微分方程转化为常微分方程。基本步骤:
- 将偏微分方程写成标准形式:
a ( x , y ) ∂ u ∂ x + b ( x , y ) ∂ u ∂ y = c ( x , y ) a(x, y) \frac{\partial u}{\partial x} + b(x, y) \frac{\partial u}{\partial y} = c(x, y) a(x,y)∂x∂u+b(x,y)∂y∂u=c(x,y) - 构造特征方程组:
d x d s = a ( x , y ) , d y d s = b ( x , y ) , d u d s = c ( x , y ) \frac{dx}{ds} = a(x, y), \quad \frac{dy}{ds} = b(x, y), \quad \frac{du}{ds} = c(x, y) dsdx=a(x,y),dsdy=b(x,y),dsdu=c(x,y) - 解特征方程组,得到特征曲线。
- 在特征曲线上求解 u u u。
实例:求解一阶线性偏微分方程
∂
u
∂
x
+
∂
u
∂
y
=
0
\frac{\partial u}{\partial x} + \frac{\partial u}{\partial y} = 0
∂x∂u+∂y∂u=0
特征方程为:
d
x
d
s
=
1
,
d
y
d
s
=
1
,
d
u
d
s
=
0
\frac{dx}{ds} = 1, \quad \frac{dy}{ds} = 1, \quad \frac{du}{ds} = 0
dsdx=1,dsdy=1,dsdu=0
解得特征线为
y
−
x
=
const
y - x = \text{const}
y−x=const,因此解为
u
(
x
,
y
)
=
f
(
y
−
x
)
u(x, y) = f(y - x)
u(x,y)=f(y−x)。
数值解法
对于无法通过解析方法求解的复杂偏微分方程,数值解法是重要的求解工具。常见的方法包括:
-
有限差分法:
- 将连续的偏微分方程离散化,转化为代数方程
- 构建差分网格,定义网格点
- 在网格点上应用差分近似,得到离散方程组
- 使用数值方法(如迭代法)求解方程组
- 优点:简单直观,易于实现
- 缺点:对复杂几何形状适应性差
-
有限元法:
- 将求解区域划分为有限个单元
- 在每个单元上构造近似函数
- 通过变分原理或加权残值法建立代数方程组
- 求解方程组得到近似解
- 优点:适应复杂几何形状,精度高
- 缺点:计算量大,实现复杂
-
谱方法:
- 使用全局基函数(如傅里叶级数或切比雪夫多项式)近似解
- 通过Galerkin方法或配点法建立代数方程组
- 求解方程组得到高精度近似解
- 优点:高精度,收敛快
- 缺点:对非光滑解适应性差
实例:使用有限差分法求解热传导方程
∂
u
∂
t
=
α
∂
2
u
∂
x
2
\frac{\partial u}{\partial t} = \alpha \frac{\partial^2 u}{\partial x^2}
∂t∂u=α∂x2∂2u
离散化后得到:
u
i
n
+
1
−
u
i
n
Δ
t
=
α
u
i
+
1
n
−
2
u
i
n
+
u
i
−
1
n
(
Δ
x
)
2
\frac{u_i^{n+1} - u_i^n}{\Delta t} = \alpha \frac{u_{i+1}^n - 2u_i^n + u_{i-1}^n}{(\Delta x)^2}
Δtuin+1−uin=α(Δx)2ui+1n−2uin+ui−1n
通过迭代计算,可以获得
u
u
u 在离散网格上的近似值。
边界条件与适定性
偏微分方程的求解需要考虑边界条件和初始条件,常见边界条件包括:
- 狄利克雷边界条件:指定函数在边界上的值
- 诺伊曼边界条件:指定函数在边界上的法向导数
- 混合边界条件:同时包含函数值及其导数的条件
- 周期边界条件:函数在边界上满足周期性条件
偏微分方程的适定性要求解满足:
- 存在性:至少存在一个解
- 唯一性:解是唯一的
- 稳定性:解对初始条件和边界条件连续依赖
补充说明:
- 对于不同类型的偏微分方程,需要采用不同的边界条件组合
- 适定性是偏微分方程理论研究的核心问题之一
- 在实际应用中,还需要考虑数值稳定性和收敛性等问题
第十部分:非线性系统分析
非线性系统广泛存在于工程实践中,其分析与线性系统有显著不同。本节将系统介绍非线性系统分析的三大核心方法:稳定性理论、相平面分析和混沌理论。
稳定性理论
李雅普诺夫方法
李雅普诺夫方法是分析非线性动态系统稳定性的强大工具,由俄罗斯数学家亚历山大·李雅普诺夫于1892年提出。其核心思想是通过构造一个李雅普诺夫函数 V ( x ) V(x) V(x) 来研究系统的稳定性,而无需求解系统的具体解。
李雅普诺夫函数的定义
对于一个自治非线性系统:
d
x
d
t
=
f
(
x
)
\frac{dx}{dt} = f(x)
dtdx=f(x)
其中,
x
∈
R
n
x \in \mathbb{R}^n
x∈Rn,
f
(
x
)
f(x)
f(x) 是连续可微函数。李雅普诺夫函数
V
(
x
)
V(x)
V(x) 需要满足以下条件:
- 正定性: V ( x ) V(x) V(x) 在平衡点 x = 0 x = 0 x=0 处有极小值,即 V ( 0 ) = 0 V(0) = 0 V(0)=0 且 V ( x ) > 0 V(x) > 0 V(x)>0 对于所有 x ≠ 0 x \neq 0 x=0。
- 导数条件:
V
(
x
)
V(x)
V(x) 关于时间的导数
d
V
d
t
\frac{dV}{dt}
dtdV 满足:
d V d t = ∇ V ( x ) ⋅ f ( x ) ≤ 0 \frac{dV}{dt} = \nabla V(x) \cdot f(x) \leq 0 dtdV=∇V(x)⋅f(x)≤0
稳定性判据
-
稳定性:
如果存在李雅普诺夫函数 V ( x ) V(x) V(x) 使得 d V d t ≤ 0 \frac{dV}{dt} \leq 0 dtdV≤0,则平衡点 x = 0 x = 0 x=0 是稳定的。 -
渐近稳定性:
如果 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 除 x = 0 x = 0 x=0 外,则平衡点是渐近稳定的,即系统状态将随着时间趋向于平衡点。 -
全局渐近稳定性:
如果李雅普诺夫函数 V ( x ) V(x) V(x) 满足 V ( x ) → ∞ V(x) \to \infty V(x)→∞ 当 ∣ ∣ x ∣ ∣ → ∞ ||x|| \to \infty ∣∣x∣∣→∞,且 d V d t < 0 \frac{dV}{dt} < 0 dtdV<0 对所有 x ≠ 0 x \neq 0 x=0 成立,则平衡点是全局渐近稳定的。
应用实例
实例 1:考虑一维线性系统
d
x
d
t
=
−
k
x
\frac{dx}{dt} = -kx
dtdx=−kx
其中
k
>
0
k > 0
k>0。选择李雅普诺夫函数
V
(
x
)
=
1
2
x
2
V(x) = \frac{1}{2}x^2
V(x)=21x2,则
d
V
d
t
=
x
⋅
(
−
k
x
)
=
−
k
x
2
≤
0
\frac{dV}{dt} = x \cdot (-kx) = -kx^2 \leq 0
dtdV=x⋅(−kx)=−kx2≤0
因此,系统在
x
=
0
x = 0
x=0 处是渐近稳定的。
实例 2:考虑非线性系统
d
x
d
t
=
−
x
3
\frac{dx}{dt} = -x^3
dtdx=−x3
选择
V
(
x
)
=
1
2
x
2
V(x) = \frac{1}{2}x^2
V(x)=21x2,则
d
V
d
t
=
x
⋅
(
−
x
3
)
=
−
x
4
<
0
(
x
≠
0
)
\frac{dV}{dt} = x \cdot (-x^3) = -x^4 < 0 \quad (x \neq 0)
dtdV=x⋅(−x3)=−x4<0(x=0)
系统在
x
=
0
x = 0
x=0 处是全局渐近稳定的。
相平面分析
相平面分析是一种直观的方法,用于研究二维非线性动态系统的行为。通过在相平面上绘制系统的轨道,可以直观地观察系统的稳定性和长期行为。
系统方程
考虑二维非线性系统:
{
d
x
d
t
=
f
(
x
,
y
)
d
y
d
t
=
g
(
x
,
y
)
\begin{cases} \frac{dx}{dt} = f(x, y) \\ \frac{dy}{dt} = g(x, y) \end{cases}
{dtdx=f(x,y)dtdy=g(x,y)
平衡点与稳定性
-
平衡点:满足 f ( x , y ) = 0 f(x, y) = 0 f(x,y)=0 和 g ( x , y ) = 0 g(x, y) = 0 g(x,y)=0 的点,表示系统在该点处保持不变。
-
稳定性分析:
通过线性化系统,可以分析平衡点的稳定性。线性化系统的雅可比矩阵为:
J = ( ∂ f ∂ x ∂ f ∂ y ∂ g ∂ x ∂ g ∂ y ) J = \begin{pmatrix} \frac{\partial f}{\partial x} & \frac{\partial f}{\partial y} \\ \frac{\partial g}{\partial x} & \frac{\partial g}{\partial y} \end{pmatrix} J=(∂x∂f∂x∂g∂y∂f∂y∂g)
计算雅可比矩阵的特征值,可以判断平衡点的类型和稳定性。
稳定性分类
- 稳定节点:两个实负特征值,系统状态趋向平衡点。
- 不稳定节点:两个实正特征值,系统状态远离平衡点。
- 鞍点:特征值一正一负,系统在某些方向稳定,某些方向不稳定。
- 稳定焦点:复特征值,实部为负,系统状态呈螺旋趋向平衡点。
- 不稳定焦点:复特征值,实部为正,系统状态呈螺旋远离平衡点。
应用实例
实例 1:分析系统
{
d
x
d
t
=
y
d
y
d
t
=
−
x
−
y
\begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = -x - y \end{cases}
{dtdx=ydtdy=−x−y
平衡点为
(
0
,
0
)
(0, 0)
(0,0)。雅可比矩阵为:
J
=
(
0
1
−
1
−
1
)
J = \begin{pmatrix} 0 & 1 \\ -1 & -1 \end{pmatrix}
J=(0−11−1)
特征方程为:
λ
2
+
λ
+
1
=
0
\lambda^2 + \lambda + 1 = 0
λ2+λ+1=0
解得特征值为
λ
=
−
1
±
−
3
2
\lambda = \frac{-1 \pm \sqrt{-3}}{2}
λ=2−1±−3,实部为负,系统在原点为稳定焦点,系统状态将以螺旋方式趋向于平衡点。
实例 2:Van der Pol 振子
{
d
x
d
t
=
y
d
y
d
t
=
μ
(
1
−
x
2
)
y
−
x
\begin{cases} \frac{dx}{dt} = y \\ \frac{dy}{dt} = \mu(1-x^2)y - x \end{cases}
{dtdx=ydtdy=μ(1−x2)y−x
当
μ
>
0
\mu > 0
μ>0 时,系统存在稳定的极限环,表现出自激振荡行为。
混沌理论
混沌理论研究的是非线性系统中高度敏感的动态行为,即微小的初始条件变化会引起系统状态的巨大差异。混沌系统在许多自然现象和工程应用中普遍存在。
混沌系统的特征
-
敏感依赖初值:
混沌系统对初始条件极为敏感,即使是极小的初始差异也会随着时间的推移迅速放大,导致系统行为的不可预测性。数学上,混沌系统的李雅普诺夫指数 λ \lambda λ 满足 λ > 0 \lambda > 0 λ>0。 -
拓扑混合性:
任意两个区域内的轨道随着时间的推移会相互交织,系统的轨道在相空间中复杂交错。 -
密集不稳定周期轨道:
混沌吸引子中包含无限多个周期轨道,这些周期轨道在相空间中密集分布。
李雅普诺夫指数
李雅普诺夫指数是衡量系统对初始条件敏感性的指标。对于一个 n n n 维系统,存在 n n n 个李雅普诺夫指数,其中最大的一个决定了系统是否具有混沌性。
定义:
λ
=
lim
t
→
∞
1
t
ln
∣
∣
δ
x
(
t
)
∣
∣
∣
∣
δ
x
(
0
)
∣
∣
\lambda = \lim_{t \to \infty} \frac{1}{t} \ln \frac{||\delta x(t)||}{||\delta x(0)||}
λ=t→∞limt1ln∣∣δx(0)∣∣∣∣δx(t)∣∣
如果
λ
>
0
\lambda > 0
λ>0,则系统对初始条件敏感,可能表现出混沌行为。
分岔现象
分岔指的是随着系统参数的变化,系统动力学行为发生质的变化。分岔是混沌生成的前兆,它标志着系统从简单行为向复杂行为的过渡。
常见的分岔类型
-
鞍结分岔:
系统通过参数变化,从稳定状态转变为不稳定状态,通常伴随着周期轨道的出现。 -
Hopf 分岔:
当系统参数达到临界值时,平衡点由稳定变为不稳定,并产生一个或多个极限环。 -
周期倍增分岔:
系统通过一系列的周期倍增过程,最终走向混沌。例如,随着参数的不断增加,系统的周期性行为会变为双周期、四周期,最终演变为不规则的混沌轨道。
应用实例
实例:Lorenz 系统
{
d
x
d
t
=
σ
(
y
−
x
)
d
y
d
t
=
x
(
ρ
−
z
)
−
y
d
z
d
t
=
x
y
−
β
z
\begin{cases} \frac{dx}{dt} = \sigma (y - x) \\ \frac{dy}{dt} = x (\rho - z) - y \\ \frac{dz}{dt} = xy - \beta z \end{cases}
⎩
⎨
⎧dtdx=σ(y−x)dtdy=x(ρ−z)−ydtdz=xy−βz
当参数
ρ
\rho
ρ 增加时,系统经历从稳定点到极限环,再到混沌的分岔过程。例如,当
ρ
>
ρ
c
r
i
t
i
c
a
l
\rho > \rho_{critical}
ρ>ρcritical,系统表现出混沌行为,轨道在相空间中呈现出复杂的吸引子结构,即著名的"蝴蝶效应"。
附录
符号表与术语解释
-
f ′ ( x ) f'(x) f′(x):函数 f ( x ) f(x) f(x) 在点 x x x 处的导数,表示瞬时变化率。在微分方程和优化问题中广泛应用。
-
∫ f ( x ) d x \int f(x) dx ∫f(x)dx:函数 f ( x ) f(x) f(x) 的不定积分,表示所有原函数的集合。在求解微分方程和计算面积、体积等问题中起关键作用。
-
det ( A ) \det(A) det(A):矩阵 A A A 的行列式,用于判断矩阵是否可逆及其他性质。在矩阵分解和线性方程组求解中具有重要意义。
-
S n S_n Sn:全排列的集合,包含所有长度为 n n n 的排列。在组合数学和概率论中经常使用。
-
P ( x ) P(x) P(x), Q ( x ) Q(x) Q(x):一阶线性微分方程中的系数函数,视具体方程而定。在求解微分方程时用于描述方程的结构。
-
C 1 , C 2 C_1, C_2 C1,C2:常数,通常由初始条件或边界条件确定。在求解微分方程时表示通解中的任意常数。
-
李雅普诺夫指数 λ \lambda λ:衡量系统对初始条件敏感性的指标, λ > 0 \lambda > 0 λ>0 表示系统可能具有混沌行为。在非线性系统分析中用于判断系统的稳定性。
-
α , β \alpha, \beta α,β:在解决二阶常系数齐次微分方程时,表示特征方程的复数根的实部和虚部。在振动系统和热传导问题中常见。
-
Λ \Lambda Λ:通常用于表示拉格朗日乘数或其他特定参数,根据上下文定义。在优化问题和约束系统中使用。
-
V ( x ) V(x) V(x):李雅普诺夫函数,用于分析系统的稳定性。在非线性系统稳定性理论中起核心作用。
-
A , B , C A, B, C A,B,C:在不同的数学公式和方程中表示不同的变量或系数,具体含义依上下文而定。在矩阵理论、微分方程和傅里叶分析中广泛使用。
-
γ \gamma γ:通常表示路径或曲线,在复变函数中用于表示积分路径。
-
μ \mu μ:在概率论中表示期望值,在热传导方程中表示热扩散系数。
-
σ \sigma σ:在概率论中表示标准差,在Lorenz系统中表示普朗特数。
-
ρ \rho ρ:在Lorenz系统中表示瑞利数,在矩阵理论中表示谱半径。
-
ω \omega ω:在傅里叶变换中表示角频率,在振动系统中表示固有频率。
-
t t t:通常表示时间变量,在微分方程和动力系统中作为独立变量。
-
x , y , z x, y, z x,y,z:通常表示空间变量或状态变量,在偏微分方程和动力系统中使用。
-
n n n:在级数中表示项数,在矩阵中表示维度,在概率论中表示样本容量。
-
k k k:在微分方程中表示常数,在傅里叶级数中表示波数。
-
i i i:虚数单位, i 2 = − 1 i^2 = -1 i2=−1,在复变函数和傅里叶变换中使用。
-
λ \lambda λ:在特征值问题中表示特征值,在偏微分方程中表示分离变量常数。在矩阵理论和微分方程中广泛使用。
-
ϕ \phi ϕ:在傅里叶分析中表示相位角,在流体力学中表示速度势函数。在信号处理和流体力学中常见。
-
θ \theta θ:在极坐标中表示角度,在旋转矩阵中表示旋转角度。在几何变换和坐标转换中使用。
-
ϵ \epsilon ϵ:在极限理论中表示无穷小量,在优化问题中表示收敛精度。在微积分和数值分析中常见。
-
δ \delta δ:在狄拉克函数中表示脉冲函数,在变分法中表示微小变化。在信号处理和变分法中使用。
-
∇ \nabla ∇:表示梯度算子,用于计算标量场的梯度。在向量分析和场论中广泛使用。
-
∂ \partial ∂:表示偏导数,用于多元函数的微分。在偏微分方程和多变量微积分中使用。
-
∑ \sum ∑:表示求和符号,用于级数和离散求和。在级数理论和概率论中常见。
-
∏ \prod ∏:表示连乘积符号,用于序列的乘积。在组合数学和概率论中使用。
-
∞ \infty ∞:表示无穷大,用于描述极限和积分区间。在微积分和实分析中广泛使用。
-
∈ \in ∈:表示属于关系,用于描述元素与集合的关系。在集合论和数学分析中使用。
-
⊂ \subset ⊂:表示子集关系,用于描述集合之间的包含关系。在集合论和拓扑学中常见。
-
⇒ \Rightarrow ⇒:表示逻辑蕴含,用于描述命题之间的推理关系。在逻辑推理和数学证明中使用。
-
⇔ \Leftrightarrow ⇔:表示逻辑等价,用于描述命题之间的双向关系。在逻辑推理和数学证明中常见。
-
∀ \forall ∀:表示全称量词,用于描述对所有元素都成立的命题。在逻辑推理和数学证明中使用。
-
∃ \exists ∃:表示存在量词,用于描述存在某个元素满足的命题。在逻辑推理和数学证明中常见。
-
A \mathbf{A} A:表示矩阵,在矩阵理论和线性代数中广泛使用。用于表示线性变换、方程组系数等。
-
b \mathbf{b} b:在矩阵方程中表示常数向量,在线性方程组中表示右侧向量。在数值计算和优化问题中常见。
-
c \mathbf{c} c:在优化问题中表示目标函数系数向量,在傅里叶级数中表示余弦系数。在数学建模和信号处理中使用。
-
Q \mathbf{Q} Q:在二次规划中表示二次项系数矩阵,在矩阵分解中表示正交矩阵。在最优化和数值分析中广泛使用。
-
R \mathbf{R} R:在QR分解中表示上三角矩阵,在控制理论中表示状态空间矩阵。在数值计算和系统分析中使用。
-
U , V \mathbf{U}, \mathbf{V} U,V:在奇异值分解中表示正交矩阵,在矩阵理论中表示特征向量矩阵。在数据分析和降维技术中常见。
-
Σ \Sigma Σ:在奇异值分解中表示对角矩阵,在概率论中表示协方差矩阵。在统计分析和机器学习中广泛使用。
-
x \mathbf{x} x:在优化问题中表示决策变量,在微分方程中表示状态变量。在数学建模和系统分析中常见。
-
y \mathbf{y} y:在控制系统中表示输出变量,在回归分析中表示响应变量。在系统识别和数据分析中使用。
-
z \mathbf{z} z:在复变函数中表示复变量,在状态空间模型中表示测量变量。在信号处理和系统控制中常见。
-
f \mathbf{f} f:在微分方程中表示向量场,在优化问题中表示目标函数。在动力系统和数学建模中使用。
-
g \mathbf{g} g:在约束优化中表示约束函数,在微分方程中表示非线性项。在最优化和系统分析中常见。
-
h \mathbf{h} h:在控制系统中表示观测函数,在机器学习中表示假设函数。在系统识别和人工智能中使用。
-
J \mathbf{J} J:在优化问题中表示雅可比矩阵,在控制理论中表示性能指标。在数值计算和系统优化中广泛使用。
-
H \mathbf{H} H:在优化问题中表示海森矩阵,在控制理论中表示哈密顿函数。在数值优化和物理建模中使用。
-
P \mathbf{P} P:在控制理论中表示李雅普诺夫函数矩阵,在概率论中表示转移概率矩阵。在系统稳定性和马尔可夫链分析中常见。
-
K \mathbf{K} K:在控制理论中表示反馈增益矩阵,在优化问题中表示核矩阵。在控制系统设计和机器学习中使用。
-
L \mathbf{L} L:在矩阵分解中表示下三角矩阵,在图论中表示拉普拉斯矩阵。在数值计算和网络分析中常见。
-
M \mathbf{M} M:在力学系统中表示质量矩阵,在数值分析中表示预处理矩阵。在物理建模和数值计算中使用。
-
N \mathbf{N} N:在数值分析中表示迭代矩阵,在概率论中表示正态分布矩阵。在数值计算和统计分析中常见。
-
D \mathbf{D} D:在矩阵理论中表示对角矩阵,在微分方程中表示阻尼矩阵。在数值计算和物理建模中使用。
-
E \mathbf{E} E:在误差分析中表示误差矩阵,在控制理论中表示状态估计矩阵。在系统识别和数值分析中常见。
-
F \mathbf{F} F:在控制理论中表示状态转移矩阵,在数值分析中表示迭代矩阵。在系统分析和数值计算中使用。
-
G \mathbf{G} G:在控制理论中表示控制增益矩阵,在优化问题中表示梯度矩阵。在控制系统设计和数值优化中常见。
-
I \mathbf{I} I:在矩阵理论中表示单位矩阵,在控制理论中表示惯性矩阵。在数值计算和物理建模中使用。
-
O \mathbf{O} O:在矩阵理论中表示零矩阵,在控制理论中表示观测矩阵。在数值计算和系统分析中常见。
-
S \mathbf{S} S:在矩阵理论中表示对称矩阵,在控制理论中表示灵敏度矩阵。在数值优化和系统分析中使用。
-
T \mathbf{T} T:在矩阵理论中表示变换矩阵,在控制理论中表示传递函数矩阵。在数值计算和系统分析中常见。
-
W \mathbf{W} W:在优化问题中表示权重矩阵,在控制理论中表示噪声协方差矩阵。在数值优化和系统识别中使用。
-
X \mathbf{X} X:在状态空间模型中表示状态矩阵,在优化问题中表示决策变量矩阵。在系统分析和数学建模中常见。
-
Y \mathbf{Y} Y:在控制理论中表示输出矩阵,在优化问题中表示对偶变量矩阵。在系统识别和数值优化中使用。
-
Z \mathbf{Z} Z:在控制理论中表示测量矩阵,在优化问题中表示拉格朗日乘子矩阵。在系统分析和数值优化中常见。
-
α \mathbf{\alpha} α:在优化问题中表示步长参数,在控制理论中表示衰减系数。在数值计算和系统分析中使用。
-
β \mathbf{\beta} β:在回归分析中表示回归系数,在控制理论中表示阻尼系数。在统计分析和系统建模中常见。
-
γ \mathbf{\gamma} γ:在优化问题中表示惩罚参数,在控制理论中表示增益系数。在数值优化和系统设计中使用。
-
δ \mathbf{\delta} δ:在数值分析中表示扰动参数,在控制理论中表示偏差系数。在数值计算和系统分析中常见。
-
ϵ \mathbf{\epsilon} ϵ:在数值分析中表示误差项,在优化问题中表示收敛阈值。在数值计算和数学建模中使用。
-
ζ \mathbf{\zeta} ζ:在控制理论中表示阻尼比,在数值分析中表示迭代参数。在系统分析和数值计算中常见。
-
η \mathbf{\eta} η:在优化问题中表示学习率,在控制理论中表示效率系数。在数值优化和系统设计中使用。
-
θ \mathbf{\theta} θ:在控制理论中表示角度变量,在优化问题中表示参数向量。在系统分析和数学建模中常见。