姚蒙. 基于LQR的多智能体系统协同最优控制[D].华南理工大学,2016.
文章目录
- 第四章 线性离散时间多智能体系统协同最优控制
- 4.1 引言
- 4.2 离散时间多智能体系统一致最优控制
- 4.3 离散时间领导者-跟随者系统跟踪最优控制
- 4.4 数值仿真
- Ref
第四章 线性离散时间多智能体系统协同最优控制
4.1 引言
4.2 离散时间多智能体系统一致最优控制
本节考虑包含 N 个智能体的离散时间多智能体系统,智能体动态特性如下
x i [ k + 1 ] = x i [ k ] + u i [ k ] (4-1) \begin{aligned} x_i [k+1] = x_i[k] + u_i[k] \end{aligned} \tag{4-1} xi[k+1]=xi[k]+ui[k](4-1)
本节考虑如下基于邻居信息的离散化分布式控制协议
u i [ k ] = − ∑ j = 1 N a i j [ x i [ k ] − x j [ k ] ] (4-2) \begin{aligned} u_i [k] = - \sum_{j=1}^{N} a_{ij} [ x_i[k] - x_j[k] ] \end{aligned} \tag{4-2} ui[k]=−j=1∑Naij[xi[k]−xj[k]](4-2)
4.3 离散时间领导者-跟随者系统跟踪最优控制
本节考虑由 N + 1 个智能体组成的离散时间领导者-跟随者系统,其中序号 0 表示领导者,序号 1, … , N 表示跟随智能体。跟随者动态特性如下
x i [ k + 1 ] = β x i [ k ] + u i [ k ] (4-20) \begin{aligned} x_i [k+1] = \beta x_i[k] + u_i[k] \end{aligned} \tag{4-20} xi[k+1]=βxi[k]+ui[k](4-20)
领导者动态特性如下
x 0 [ k + 1 ] = β x 0 [ k ] (4-21) \begin{aligned} x_0 [k+1] = \beta x_0[k] \end{aligned} \tag{4-21} x0[k+1]=βx0[k](4-21)
本节考虑基于邻居信息和领导者信息的分布式离散时间控制协议如下
u i [ k ] = − { ∑ j = 1 N a i j [ x i [ k ] − x j [ k ] ] + g i [ x i [ k ] − x 0 [ k ] ] } (4-22) \begin{aligned} u_i [k] = - \{ \sum_{j=1}^{N} a_{ij} [ x_i[k] - x_j[k] ] + g_i [x_i[k] - x_0[k]] \} \end{aligned} \tag{4-22} ui[k]=−{j=1∑Naij[xi[k]−xj[k]]+gi[xi[k]−x0[k]]}(4-22)
4.4 数值仿真
程序名字 main_4_1.m
,效果为
程序名字 main_4_2.m
,效果为