一直想更新一下根据cost to go来推导LQR,之前的话可能会直接套问题,但是对于理论有些困惑,正好最近在学习ilqr轨迹生成/优化,因此来推一下公式,以下参考B站Dr_CAN,链接如下:
【最优控制】5_线性二次型调节器(LQR)详细数学推导_哔哩哔哩_bilibili
can博士确实很nb,一般知乎推导是从给出一个cost to go的概念来推出的,而can博士是循序渐进的,确实nb,具体的话下面写的很清楚
这里根据知乎LQR解析解推导:从LQR到迭代Riccati方程 - 知乎
补一下LQR问题为什么不对u进行约束。
iterative LQR (iLQR)推导:从非线性问题到LQR - 知乎