MPC模型预测控制理论与实践

一、基本概念

最有控制的动机是在约束条件下达到最优的系统表现。

模型预测控制(MPC,Model Predictive Control)是通过模型来预测系统在某一未来时间段内的表现来进行优化控制,多用于数位控制,通常用离散型状态空间表达。主要有三个主要部分构成,1模型;2预测;3控制(做决策)。模型,模型可以是机理模型,也可以是一个基于数据的模型。(例如深度学习训练得到的模型)预测,建立一个模型目的主要是用来做预测。控制(做决策),控制就是需要做出动作了,控制就是采取行动执行动作。

MPC主要有三步:

在k时刻:

1、估计/测量读取当前系统状态;

2、基于u_k,u_{k+1},...,u_{k+N}来进行最优化,离散系统代价函数为

J=\sum_k^{N-1}(E_k^TQE_k+u_k^TRu_k)+E_N^TFE_N

3、只取u_k作为控制输入施加在系统上。

在下一时刻重复以上三步,在下一步进行预测时使用的就是下一步的状态值,即滚动优化控制。

二、理论原理

1、二次规划的一般形式:

\begin{aligned}\min_x&&q(x)=z^TQz+C^Tz\\s.t.&&a_i^Tz\geq b_i,\quad i\in\tau\end{aligned}

二次规划问题目前的优化理论提供了较完整的求解方法,可以利用诸多工具进行求解。这里的MPC问题最后能够归结为求解一个二次规划问题,即最小化代价函数。

2、MPC代价函数

对于一个离散系统

x(k+1)=Ax(k)+Bu(k)

在k时刻进行观测,预测从k到N时刻的状态X_k为:

X_k=\begin{pmatrix}x(k|k)\\x(k+1|k)\\x(k+2|k)\\\cdots\\x(k+N|k)\end{pmatrix}

输入U_k为:

U_k=\begin{pmatrix}u(k|k)\\u(k+1|k)\\u(k+2|k)\\\cdots\\u(k+N-1|k)\end{pmatrix}

离散系统的代价函数为:

J=\sum_{i=0}^{N1}\left(x(k+i|k)\right.^TQx(k+i|k)+u(k+i|k)^TRu(k+i|k))\\ +x(k+N)^TFx(k+N)

我们需要求解的是系统的输入u(k+i|k),这就需要我们把状态项x(k+i|k)给消除掉。可以通过传感器或者状态估计得到系统当前的状态值,利用系统初始条件x(k|k)=x_k,以及上述离散状态方程,可以得到所有状态量用输入和初始值表达的形式:

X_k=\begin{pmatrix}I\\A\\A^2\\\cdots\\A^N\end{pmatrix}x(k)+\begin{pmatrix}0&0&\ldots&0\\B&0&\ldots&0\\AB&B&\ldots&0\\\ldots&\ldots&\ldots&\ldots\\A^{N-1}B&A^{N-2}B&\ldots&B\end{pmatrix}U_k

M=\begin{bmatrix} I_{​{n\times n}} \\A_{​{n\times n}} \\A_{​{n\times n}}^2 \\. \\. \\A^N\ \end{bmatrix}$C=\begin{bmatrix}0&0&...&0\\\vdots&\vdots&...&\vdots\\0&0&&0\\B&0&...&0\\AB&B&...&0\\\vdots&\vdots&\ddots&0\\A^{N-1}B&A^{N-2}B&...&B\end{bmatrix}$,则有

{X_k}={Mx_k}+{CU_k}

代价函数可以化简为:

$\begin{aligned} &J=\sum_{i=0}^{N-1}\left(x(k+i|k)^TQx(k+i|k)\right.+u(k+i|k)^TRu(k+i|k)+x(k+N)^TFx(k+N)) \\ &\left.=\left(\begin{array}{c}x(k|k)\\x(k+1|k)\\x(k+2|k)\\\cdots\\x(k+N|k)\end{array}\right.\right)\left(\begin{array}{ccccc}Q&&&\\&Q&&\\&&Q&\\&&\cdots&\cdots&\cdots\\\cdots&\cdots&\cdots&\cdots&\cdots\\&&&&F\end{array}\right)\left(\begin{array}{c}x(k|k)\\x(k+1|k)\\x(k+2|k)\\\cdots\\\cdots\\x(k+N|k)\end{array}\right)^T \\ &\left.+U_k^T\left(\begin{array}{rrrrr}R&&&&\\&R&&&\\&&R&&\\\cdots&\cdots&\cdots&\cdots&\cdots\\&&&&R\end{array}\right.\right)U_k \end{aligned}$

$J=X_k^T\overline{Q}X_k+U_k^T\overline{R}U_k$

进一步可以化简为

J=x{_k}^TGx{_k}+U_k^THU_k+2x{_k}^TEU_k

其中$M^T\overline{Q}M=G,M^T\overline{Q}C=E,C^T\overline{Q}C+\overline{R}=H$

该代价函数可以利用二次规划进行优化。

三、代码实践

问题:

1、MPC_Test.m

%% 清屏

clear ; 

close all; 

clc;

%% 加载 optim package,若使用matlab,则注释掉此行

pkg load optim;

%%%%%%%%%%%%%%%%%%%%%%%%%%

%% 第一步,定义状态空间矩阵

%% 定义状态矩阵 A, n x n 矩阵

A = [1 0.1; -1 2];

n= size (A,1);

%% 定义输入矩阵 B, n x p 矩阵

B = [ 0.2 1; 0.5 2];

p = size(B,2);

%% 定义Q矩阵,n x n 矩阵

Q=[100 0;0 1];

%% 定义F矩阵,n x n 矩阵

F=[100 0;0 1];

%% 定义R矩阵,p x p 矩阵

R=[1 0 ;0 .1];

%% 定义step数量k

k_steps=100; 

%% 定义矩阵 X_K, n x k 矩 阵

X_K = zeros(n,k_steps);

%% 初始状态变量值, n x 1 向量

X_K(:,1) =[20;-20];

%% 定义输入矩阵 U_K, p x k 矩阵

U_K=zeros(p,k_steps);



%% 定义预测区间K

N=5;

%% Call MPC_Matrices 函数 求得 E,H矩阵 

[E,H]=MPC_Matrices(A,B,Q,R,F,N);



%% 计算每一步的状态变量的值

for k = 1 : k_steps 

%% 求得U_K(:,k)

U_K(:,k) = Prediction(X_K(:,k),E,H,N,p);

%% 计算第k+1步时状态变量的值

X_K(:,k+1)=(A*X_K(:,k)+B*U_K(:,k));

end



%% 绘制状态变量和输入的变化

subplot  (2, 1, 1);

hold;

for i =1 :size (X_K,1)

plot (X_K(i,:));

end

legend("x1","x2")

hold off;

subplot (2, 1, 2);

hold;

for i =1 : size (U_K,1)

plot (U_K(i,:));

end

legend("u1","u2")

2、MPC_Matrices.m


function  [E , H]=MPC_Matrices(A,B,Q,R,F,N)



n=size(A,1);   % A 是 n x n 矩阵, 得到 n

p=size(B,2);   % B 是 n x p 矩阵, 得到 p

%%%%%%%%%%%%

M=[eye(n);zeros(N*n,n)]; % 初始化 M 矩阵. M 矩阵是 (N+1)n x n的, 

                         % 它上面是 n x n 个 "I", 这一步先把下半部

                         % 分写成 0 

C=zeros((N+1)*n,N*p); % 初始化 C 矩阵, 这一步令它有 (N+1)n x NP 个 0

% 定义M 和 C 

tmp=eye(n);  %定义一个n x n 的 I 矩阵

% 更新M和C

for i=1:N % 循环,i 从 1到 N

    rows =i*n+(1:n); %定义当前行数,从i x n开始,共n行 

    C(rows,:)=[tmp*B,C(rows-n, 1:end-p)]; %将c矩阵填满

    tmp= A*tmp; %每一次将tmp左乘一次A

    M(rows,:)=tmp; %将M矩阵写满

end 



% 定义Q_bar和R_bar

Q_bar = kron(eye(N),Q);

Q_bar = blkdiag(Q_bar,F);

R_bar = kron(eye(N),R); 



% 计算G, E, H

G=M'*Q_bar*M; % G: n x n

E=C'*Q_bar*M; % E: NP x n

H=C'*Q_bar*C+R_bar; % NP x NP 



end

3、Prediction.m


function u_k= Prediction(x_k,E,H,N,p)

U_k = zeros(N*p,1); % NP x 1

U_k = quadprog(H,E*x_k);

u_k = U_k(1:p,1); % 取第一个结果

end

四、应用总结

模型预测控制(Model Predictive Control, MPC)是一种先进的闭环控制算法,它通过建立系统的数学模型,预测未来一定时间内的系统状态,并基于优化算法计算出最优控制信号。MPC具有以下优缺点:

优点:

  1. 高精度控制:除了考虑当前系统状态外,还能预测未来一段时间的系统状态,因此可以更精确地控制系统;

  2. 鲁棒性强:MPC可以通过修改控制器优化问题的约束来应对外部干扰和不确定性,提高控制系统的鲁棒性;

  3. 可处理复杂系统:MPC可以建立各种复杂系统的数学模型,并通过计算机算法进行优化,适用于多变量、非线性系统等;

  4. 可满足控制要求:MPC可以将多个控制要求统一优化,因此可以满足多个控制目标同时达到。

缺点:

  1. 计算复杂:MPC优化问题通常是一个非凸、非线性的问题,要求大量的计算资源和高效的算法,导致计算复杂度很高;

  2. 运行速度慢:由于计算复杂度高,MPC的运行速度相比其他控制算法要慢很多,因此只能应用于响应速度要求不高的稳态控制系统;

  3. 受模型误差影响:MPC算法是基于系统模型来进行优化的,因此系统模型误差会直接影响算法控制效果。因此,建立准确的系统模型是MPC算法应用的关键。

MPC主要还是应用在控制领域,在自动驾驶、无人机飞行控制、平衡车的控制、四足控制中有着广泛的应用。MPC这种将优化与控制结合的思想也许可以用在更多领域

参考资料:

【【MPC模型预测控制器】1_最优化控制和基本概念】 https://www.bilibili.com/video/BV1cL411n7KV/?share_source=copy_web&vd_source=24db73a73cddacddda48febd1ffc28ef

网络资料等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/220095.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

树_二叉搜索树累加求和

//给出二叉 搜索 树的根节点,该树的节点值各不相同,请你将其转换为累加树(Greater Sum Tree),使每个节点 node 的新值等于原树中大于或等于 // node.val 的值之和。 // // 提醒一下,二叉搜索树满足下列约束…

9.Unity搭建HTTP服务器

搭建HTTP服务器的几种方式 //1.使用别人做好的HTTP服务器软件,一般作为资源服务器时使用该方式(学习阶段建议使用) //2.自己编写HTTP服务器应用程序,一般作为Web服务器 或者 短链接游戏服务器时 使用该方式 使用别人做好的HTTP服…

ROS-ROS通信机制-服务通信

文章目录 一、服务通信基本知识二、自定义srv三、C实现四、Python实现 一、服务通信基本知识 服务通信也是ROS中一种极其常用的通信模式,服务通信是基于请求响应模式的,是一种应答机制。也即: 一个节点A向另一个节点B发送请求,B接收处理请求…

通过断点调试解决node 运行js程序直接退出(没有任何报错提示)的问题

现象: node运行程序直接退出,但是从echo $?的返回值可以知道: 一定出现了错误,但是没有显示出来 解决办法: 1. 使用node --inspect-brk 启动程序 然后在浏览器访问chrome://inspect 然后点击inspect 进行单步调试 …

软件设计之桥接模式

实现茶水间:茶可以分红茶和绿茶,每种茶又可以分大杯和中杯,现在你是服务员需要计算茶水的价格。 package Bridge;public class BlackTea implements TeaKind{private float redTeaPrice 2.0f;Overridepublic float price() {return redTeaPr…

“快慢指针”思想在物理或者逻辑循环中的应用

1 基础概念 1.1 什么是物理循环和逻辑循环? 物理循环是指物理索引访问顺序上相邻,逻辑上也相邻,比如循环链表,逻辑循环则指物理的索引上不一定相邻 1.2 快慢指针本质上可以解决逻辑循环问题,而物理循环也属于逻辑循…

【java】toString() 导致的 StackOverflowError 异常

这是怎么导致的呢? A 类属性包含着 B 类的引用 B 类属性包含着 A 类的引用 代码大概就是这样的: Data public class User{public String name;public Dog dog; }Data public class Dog{public String name;public User user; }User user new User()…

面试前自测题,接口自动化测试过程中怎么处理接口依赖?

面试的时候经常会被问到在接口自动化测试过程中怎么处理接口依赖? 首先我们要搞清楚什么是接口依赖。 01、什么是接口依赖 接口依赖指的是,在接口测试的过程中一个接口的测试经常需要依赖另一个或多个接口成功请求后的返回数据。 那怎么处理呢&#…

机器学习---使用 EM 算法来进行高斯混合模型的聚类

1. 指定k个高斯分布參数 导包 import math import copy import numpy as np import matplotlib.pyplot as pltisdebug False 全局变量 isdebug可以用来控制是否打印调试信息。当 isdebug 为 True 时,代码中的一些调试信 息将被打印出来,方便进行调试…

Kubernetes(k8s)访问不了Pod服务

在k8s集群部署java web应用的服务时,浏览器访问不了pod服务或linux终端curl http://192.168.138.112:30000即curl http://ip地址:端口号失败,如下图: 在网上找了很久的答案,最后还是没解决,后来突然想起来一直是在k8…

7个简单技巧,让你从容应对压力面试!

01-什么是压力面试? 压力面试是指有意制造紧张,以了解求职者将如何面对工作压力的一种面试形式。 事实上,压力面试不是单独存在的一类面试,往往是穿插在面试过程中。 面试人通过提出不礼貌、冒犯的问题,或者用怀疑、…

JavaWeb(五)

一、JDBC概述 JDBC 就是使用Java语言操作关系型数据库的一套API 全称是Java DataBase Connectivity 表示Java数据库连接。 JDBC的本质是官方(sun公司)定义的一套操作所有关系型数据库的规则,即接口,各个数据库厂商去实现这套接口&#xff0…

11、信息打点——红队工具篇FofaQuakeSuize水泽Arl灯塔

网络空间测绘引擎 Fofa Quake shodan Zoomeye 主要搜关联资产、特征资产、资产信息(在测绘引擎上直接搜IP,它会显示所有与该域名有关的信息。) fofa和Quake测绘引擎集成化工具:Finger 自动化信息收集项目 ARL灯塔 Suize水泽 …

编程语言分类

如果要将编程语言分成两大类,可以考虑以下分类方式: 编译型语言(Compiled Languages):这类语言在运行之前需要通过编译器将源代码转换为机器码或类似形式的可执行代码。编译型语言的特点包括: 需要显式的编…

二极管:TVS瞬态抑制二极管

一、什么是TVS二极管 TVS(Transient Voltage Suppressors),即瞬态电压抑制器,又称雪崩击穿二极管。 TVS二极管的符号如下图所示 什么是雪崩击穿 雪崩击穿是有必要了解一下的,不然后面还有齐纳击穿,搞不…

GoWin FPGA--- startup2

clock Click Tools\IP Core Generator\rPLL, and open the configure file 原语 for Clock 双击选项,生产对应的代码,Copy到制定的地点。 右侧有对应的说明文件

【优选算法系列】【专题一双指针】第三节.611. 有效三角形的个数和LCR 179. 查找总价格为目标值的两个商品

文章目录 前言一、有效三角形的个数 1.1 题目描述 1.2 题目解析 1.2.1 算法原理 1.2.2 代码编写 1.2.3 题目总结二、查找总价格为目标值的两个商品 2.1 题目描述 2.2 题目解析 2.2.1 算法原理 …

FastAPI与BaseModel

from typing import Optionalfrom fastapi import FastAPI from pydantic import BaseModel #当一个模型属性具有默认值时,它不是必需的。否则它是一个必需属性。将默认值设为 None 可使其成为可选属性 app FastAPI() class Item(BaseModel):name:str #没有初始值都…

动态类型语言与静态类型语言的对比与比较

编程语言可以根据类型系统和类型检查时机分为动态编程语言和静态编程语言两大类,它们在运行时的代码检查方式、变量类型的使用方式等方面有很大的区别。这一块你知道吗? 本文将为您详细讲解两种编程语言的优缺点,以及它们的应用场景。 动态编…

基于SpringBoot的校园互助网站

简介 本系统分为三个角色,分别是普通用户和管理员、以及超级管理员,主要的功能模块有注册、登录、物品代购、快递代取、话题管理、任务管理、反馈管理、投诉管理、订单管理等功能模块。 项目 数据库 首页 登录 新增反馈 发布话题 发布任务 接单 我要投诉…