DDP算法线性化和二次近似
- 在DDP算法中,第三步是线性化系统动力学方程和二次近似代价函数。这一步是关键,它使得DDP能够递归地处理非线性最优控制问题。通过线性化和二次近似,我们将复杂的非线性问题转换为一系列简单的线性二次问题,逐步逼近最优解。
- 通过这些线性化和二次近似步骤,我们可以将原始的非线性问题简化为一系列线性二次调节问题,使得递归求解成为可能。这一步是DDP算法的核心,它使得DDP能够在非线性系统中高效地逼近最优解
系统动力学方程的线性化
对于给定的非线性系统动力学方程:
在每个时间步 k,我们对 f 进行泰勒展开,得到系统动力学方程的线性近似:
其中:
这里,A𝑘是状态 𝑥 的偏导数(雅可比矩阵),B𝑘 是控制 u 的偏导数(雅可比矩阵)。
代价函数的二次近似
对于给定的代价函数