MATLAB 模型参考自适应控制 - Model Reference Adaptive Control

系列文章目录


文章目录

  • 系列文章目录
  • 前言
  • 一、参考模型
  • 二、扰动与不确定性模型
  • 三、直接 MRAC
    • 名义模型
    • 参数更新
    • 间接 MRAC
    • 估计器模型和控制器增益
    • 参数更新
    • 学习修正
    • 参考文献


前言

模型参考自适应控制模块计算控制动作,使不确定的受控系统跟踪给定参考被控对象模型的行为。使用该程序块,可以实现以下模型参考自适应控制 (MRAC) 算法。

  • 直接 MRAC - 根据被控对象与参考工厂模型状态之间的实时跟踪误差,估算反馈和前馈控制器增益。

  • 间接 MRAC - 根据参考设备模型与估计系统状态之间的跟踪误差,估计被控对象系统的参数。然后,根据估计系统和参考模型的参数推导出反馈和前馈控制器增益。

直接和间接 MRAC 还能估算被控系统的外部干扰和不确定性模型。然后,控制器在计算控制动作时使用该模型对干扰和不确定性进行补偿。

在这两种情况下,控制器都会根据跟踪误差实时更新估计参数和干扰模型。


一、参考模型

对于直接和间接 MRAC 而言,以下参考被控对象模型是理想的系统,它描述了您在实践中想要实现的理想行为。
x ˙ m ( t ) = A m x m ( t ) + B m r ( t ) {\dot{x}}_{m}(t)=A_{m}x_{m}(t)+B_{m}r(t) x˙m(t)=Amxm(t)+Bmr(t)
此处

  • r(t) 是外部参考信号。

  • xm(t) 是被控对象模型的状态。由于 r(t) 已知,因此可以通过模拟参考模型得到 xm(t)。

  • Am 是恒定状态矩阵。对于一个稳定的参考模型,Am 必须是一个 Hurwitz 矩阵,其每个特征值都必须是严格的负实部。

  • Bm 是控制有效矩阵。

二、扰动与不确定性模型

模型参考自适应控制模块维护着受控系统中干扰和模型不确定性的内部模型 u a d u_{a d} uad
u a d = w T ϕ ( x ) u_{a d}=w^{T}\phi(x) uad=wTϕ(x)
w 是控制器根据跟踪误差实时更新的自适应控制权重向量。

要定义 ϕ(x),可以使用以下特征定义之一。

  • 被控对象的状态向量 - 这种方法可能无法充分反映系统的不确定性。在不了解干扰和模型不确定性的复杂性时,使用状态作为特征可能是一个有用的起点。

  • 高斯径向基函数 - 当扰动和模型的不确定性是非线性的,且扰动模型的结构未知时,请使用此选项。径向基函数要求事先了解模型的运行域,这在某些情况下可能比较困难。

  • 单隐层神经网络 - 当扰动和模型的不确定性是非线性的,扰动模型的结构未知,并且您没有运行域的先验知识时,请使用此选项。神经网络是一种通用函数近似器,可以近似任何连续函数。

  • 提供给控制器模块的外部源 - 使用该选项可自定义特征向量。如果您知道干扰和不确定性模型的结构,则可以使用该选项。例如,您可以使用自定义特征向量来确定特定的未知被控对象参数。

三、直接 MRAC

直接 MRAC 控制器的控制结构如下

在这里插入图片描述

控制器计算控制输入 u(t) 的方法如下
u ( t ) = k x x ( t ) + k r r ( t ) − u a d u a d = w T ϕ ( x ) \begin{array}{c}{{u(t)=k_{x}x(t)+k_{r}r(t)-u_{a d}}}\\ {{u_{a d}=w^{T}\phi(x)}}\end{array} u(t)=kxx(t)+krr(t)uaduad=wTϕ(x)

此处

  • x(t) 是受控系统的状态。

  • r(t) 是外部参考信号。

  • kx 和 kr 分别是反馈和前馈控制器增益。

  • u a d u_{a d} uad 是根据扰动模型得出的自适应控制分量。
    ϕ ( x ) \phi(x) ϕ(x) 包含干扰模型特征。

  • w 是自适应扰动模型权重向量。

  • V 是隐藏层权重向量。

对于单隐层神经网络, u a d u_{a d} uad
u a d = w T σ ( V T x ) u_{a d}=w^{T}\sigma(V^{T}x) uad=wTσ(VTx)
此处

  • V 是隐层权重向量。

  • σ 是 sigmoid 激活函数。

控制器计算受控系统状态与参考模型状态之间的误差 e(t)。然后利用该误差实时调整 kx、kr 和 w 的值。

名义模型

受控系统通常具有建模不确定性和外部干扰,其标称状态方程如下。控制器在更新控制器参数时,会使用这一预期的标称被控对象行为。
x ˙ ( t ) = A x ( t ) + B ( u ( t ) + f ( x ) ) {\dot{x}}(t)=A x(t)+B(u(t)+f(x)) x˙(t)=Ax(t)+B(u(t)+f(x))
这里的

  • x(t) 是要控制系统的状态。

  • u(t) 是控制输入。

  • A 是恒定的状态转换矩阵。

  • B 是恒定的控制有效矩阵。

  • f(x) 是系统中匹配的不确定性。

参数更新

直接 MRAC 控制器使用以下公式更新状态矢量、径向基函数和外部源特征定义的控制器增益和干扰模型权重
k ˙ x = Γ x x ( t ) e T ( t ) P B k ˙ r = Γ r r ( t ) e T ( t ) P B w ˙ = Γ w ϕ ( x ) e T ( t ) P B \begin{array}{l}{{\dot{k}_{x}=\Gamma_{x}x(t)e^{T}(t)P B}}\\ {{\dot{k}_{r}=\Gamma_{r}r(t)e^{T}(t)P B}}\\ {{\dot{w}=\Gamma_{w}\phi(x)e^{T}(t)P B}}\end{array} k˙x=Γxx(t)eT(t)PBk˙r=Γrr(t)eT(t)PBw˙=Γwϕ(x)eT(t)PB
单隐层干扰模型更新方程使用相同的控制器增益更新和以下更新方程。
w ˙ = − ( σ ( V T x ) − σ ′ ( V T x ) V T x ) e T ( t ) P B Γ w V ˙ = − Γ V x e T ( t ) P B w T σ ( V T x ) \begin{array}{l}{{\dot{w}=-(\sigma(V^{T}x)-{{\sigma}}^{\prime}(V^{T}x)V^{T}x){{e}}^{T}(t){{P}}{{B}}\Gamma_{w}}}\\ {{\dot{V}=-\Gamma{{V}}{{x}}{{e}}^{T}(t){{P}}{{B}}w^{T}{{\sigma}}(V^{T}x)}}\end{array} w˙=(σ(VTx)σ(VTx)VTx)eT(t)PBΓwV˙=ΓVxeT(t)PBwTσ(VTx)

Here, P is the solution to the following Lyapunov function based on the reference model state matrix and B is the control effective matrix from the nominal plant model.
A m T P + P A m + Q = 0 A_{m}^{T}P+P A_{m}+Q=0 AmTP+PAm+Q=0
这里,Q 是大小为 N 乘 N 的正定矩阵,其中 N 是状态向量 x(t) 的大小

间接 MRAC

间接 MRAC 控制器的控制结构如下。参考模型为

在这里插入图片描述

控制器计算控制输入 u(t) 的方法如下
u ( t ) = k x x ( t ) + k r r ( t ) − u a d u a d = w T ϕ ( x ) \begin{array}{c}{{u(t)=k_{x}x(t)+k_{r}r(t)-u_{a d}}}\\ {{u_{a d}=w^{T}\phi(x)}}\end{array} u(t)=kxx(t)+krr(t)uaduad=wTϕ(x)

这里:

  • x ^ ( t ) \hat{x}(t) x^(t) 是由估计模型产生的受控系统估计状态。

  • r(t) 是外部参考信号。

  • kx 和 kr 分别是反馈和前馈控制器增益。

  • u a d u_{a d} uad 是根据扰动模型得出的自适应控制分量。

  • ϕ ( x ) \phi(x) ϕ(x) 包含干扰模型特征。

  • w 是自适应扰动模型权重向量。

控制器计算实际系统状态和估计系统状态之间的误差 e(t)。然后利用该误差实时调整 w 的值。控制器还利用 e(t) 实时更新估计模型的参数。增益 kx 和 kr 的值来自估计模型和参考模型的参数。

估计器模型和控制器增益

间接 MRAC 控制器包含以下受控系统的估计模型。
x ^ ˙ ( t ) = A ^ x ( t ) + B ^ u ( t ) \dot{\hat{x}}(t)=\hat{A}x(t)+\hat{B}u(t) x^˙(t)=A^x(t)+B^u(t)
这里:

  • x ^ ˙ ( t ) \dot{\hat{x}}(t) x^˙(t) 是估计的系统状态。

  • u ( t ) u(t) u(t) 是控制输入。

  • A ^ \hat{A} A^ 是估计器的状态转换矩阵。

  • B ^ \hat{B} B^ 是估计器的控制有效矩阵。

在运行过程中,控制器基于估计误差 e(t)更新 A ^ \hat{A} A^ B ^ \hat{B} B^

间接 MRAC 控制器不直接估算控制器增益,而是采用基于动态反演的方法,从参考模型和估算模型的参数中推导出反馈增益 k x k_x kx 和前馈增益 k r k_r kr,具体如下。
k r = B m B ^ k x = 1 B ^ ( A m − A ^ ) \begin{array}{c}{{k_r={\displaystyle\dfrac{B_m}{\hat{B}}}}}\\ {{k_{x}={\displaystyle\frac{1}{\hat{B}}}\left(A_m-\hat{A}\right)}}\end{array} kr=B^Bmkx=B^1(AmA^)
这里, 1 B ^ \displaystyle\frac{1}{\hat{B}} B^1 是矩阵 B ^ \hat{B} B^ 的 Moore-Penrose 摩尔-彭罗斯伪逆。

参数更新

间接 MRAC 控制器使用以下公式更新状态矢量、径向基函数和外部源特征定义的估计模型参数和干扰模型权重
A ^ ˙ = Γ a x ( t ) e T ( t ) P B ^ ˙ = Γ b u ( t ) e T ( t ) P w ˙ = Γ w ϕ ( x ) e T ( t ) P B \begin{array}{l}{{\dot{\hat{A}}=\Gamma_{a}x(t)e^{T}(t)P}}\\ {{\dot{\hat{B}}=\Gamma_{b u(t)}e^T{(t)P}}}\\ {{\dot{w}=\Gamma_{w}\phi(x)e^T{(t)P B}}}\end{array} A^˙=Γax(t)eT(t)PB^˙=Γbu(t)eT(t)Pw˙=Γwϕ(x)eT(t)PB
单隐层干扰模型更新方程使用相同的估计模型参数更新和以下更新方程。
w ˙ = − ( σ ( V T x ) − σ ′ ( V T x ) V T x ) e T ( t ) P B Γ w V ˙ = − Γ V x e T ( t ) P B w T σ ( V T x ) \begin{array}{l}{{\dot{w}=-(\sigma(V^{T}x)-{{\sigma}}^{\prime}(V^{T}x)V^{T}x){{e}}^{T}(t){{P}}{{B}}\Gamma_{w}}}\\ {{\dot{V}=-\Gamma{{V}}{{x}}{{e}}^{T}(t){{P}}{{B}}w^{T}{{\sigma}}(V^{T}x)}}\end{array} w˙=(σ(VTx)σ(VTx)VTx)eT(t)PBΓwV˙=ΓVxeT(t)PBwTσ(VTx)
这里,P 是以下 Lyapunov 函数的解。
k τ T P + P k τ + Q = 0 k_{\tau}^{T}P+P k_{\tau}+Q=0 kτTP+Pkτ+Q=0

kτ 是估计器反馈增益。默认情况下,该值与参考模型状态转换矩阵 Am 相对应。不过,也可以指定不同的估计器反馈增益值。

学习修正

对于直接和间接 MRAC,为了在更高的学习率下增加稳健性,可以修改参数更新,加入一个可选的动量项。您可以从两种可能的学习修改方法中选择一种:sigma 和 e-modification。

对于西格玛修正,每次参数更新的动量项都是动量权重参数 σ 与当前参数值的乘积。例如,以下直接 MRAC 控制器的更新方程就包含了 σ 修正项。
k ˙ x = Γ x x ( t ) e T ( t ) P B + σ k x k ˙ r = Γ r r ( t ) e T ( t ) P B + σ k x w ˙ x = Γ w ϕ ( t ) e T ( t ) P B + σ w \begin{array}{l}{{\dot{k}_{x}=\Gamma_{x}x(t)e^{T}(t)P B+\sigma k_{x}}}\\ {{\dot{k}_{r}=\Gamma_{r}r(t)e^{T}(t)P B+\sigma k_{x}}}\\ {{\dot{w}_{x}=\Gamma_{w}\phi(t)e^{T}(t)P B+\sigma w}}\end{array} k˙x=Γxx(t)eT(t)PB+σkxk˙r=Γrr(t)eT(t)PB+σkxw˙x=Γwϕ(t)eT(t)PB+σw
对于 e-修正,控制器通过误差矢量的规范对 sigma-修正动量项进行缩放。例如,以下间接 MRAC 控制器的更新方程就包含了一个 e 修正项。
A ^ ˙ = Γ a x ( t ) e T ( t ) P + σ ∣ e ( t ) ∣ A ^ B ^ ˙ = Γ b u ( t ) e T ( t ) P + σ ∣ e ( t ) ∣ B ^ w ˙ x = Γ w ϕ ( t ) e T ( t ) P B + σ ∣ e ( t ) ∣ w \begin{array}{l}{{\dot{\hat{A}}=\Gamma_{a}x(t)e^{T}(t)P+\sigma|e(t)|\hat{A}}}\\ {{\dot{\hat{B}}=\Gamma_{b}u(t)e^{T}(t)P+\sigma|e(t)|\hat{B}}}\\ {{\dot{w}_{x}=\Gamma_{w}\phi(t)e^{T}(t)P B+\sigma|e(t)|w}}\end{array} A^˙=Γax(t)eT(t)P+σe(t)A^B^˙=Γbu(t)eT(t)P+σe(t)B^w˙x=Γwϕ(t)eT(t)PB+σe(t)w
要调整这两种方法的学习修正量,可改变动量权重参数 σ 的值。

参考文献

[1] Ioannou, Petros A., and Jing Sun. Robust adaptive control, Courier Corporation, 2012.

[2] Narendra, Kumpati S, and Anuradha M Annaswamy. Stable Adaptive Systems. Courier Corporation, 2012.

[3] Narendra, Kumpati S., and Anuradha M. Annaswamy. “Robust Adaptive Control.” In 1984 American Control Conference, 333–35. San Diego, CA, USA: IEEE, 1984. https://doi.org/10.23919/ACC.1984.4788398

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/209292.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

从0开始学习JavaScript--JavaScript 单元测试

JavaScript单元测试是保障代码质量和可维护性的关键步骤之一。通过编写和运行单元测试,开发者可以确保代码在不断迭代的过程中依然具有正确的行为。本文将深入探讨JavaScript单元测试的核心概念、工具使用和最佳实践,并通过丰富的示例代码演示其实际应用…

PgSQL技术内幕 • statement_timeout做的那些事

PgSQL技术内幕 • statement_timeout做的那些事 statement_timeout是Postgres种的一个配置参数,用于指定SQL语句执行的超时时间,当超时时就取消该SQL的执行,并返回错误信息。这个参数通常用于控制运行时间较长的查询,避免影响数据…

STM32CubeIDE(CUBE-MX hal库)----蓝牙模块HC-05(详细配置)

系列文章目录 STM32CubeIDE(CUBE-MX hal库)----初尝点亮小灯 STM32CubeIDE(CUBE-MX hal库)----按键控制 STM32CubeIDE(CUBE-MX hal库)----串口通信 STM32CubeIDE(CUBE-MX hal库)----定时器 文章目录 系列文章目录前言一、蓝牙配置二、CUBE-MX可视化配置三、蓝牙APP调试助手四、…

微信小程序 地图撒点

1. 微信小程序 地图撒点 1.1 说明 首先使用微信小程序自带标签,并且设置好宽高让地图显示,用longitude和latitude表示中心点。   (1)show-location 显示带有方向的当前定位点,本项目不需要不添加。   (2&#xff…

组合(回溯+剪枝、图解)

77. 组合 - 力扣(LeetCode) 题目描述 给定两个整数 n 和 k,返回范围 [1, n] 中所有可能的 k 个数的组合。 你可以按 任何顺序 返回答案。 样例输入 示例 1: 输入:n 4, k 2 输出: [[2,4],[3,4],[2,3],…

【算法】单调栈题单——字典序最小⭐(一种类型的模板题)

文章目录 题目列表316. 去除重复字母⭐⭐⭐⭐⭐(类型题模板:单调栈,字典序最小)221021天池-03. 整理书架(保留数量为 limit 的字典序最小)402. 移掉 K 位数字(最多删除 k 次 前导零的处理&…

mysql主从复制-redis集群扩容缩容、缓存优化(缓存更新策略、穿透,击穿,雪崩)、mysql主从搭建、django实现读写分离

基于Docker实现读写分离 1 redis集群扩容缩容 1.1 集群扩容 1.2 集群缩容 2 缓存优化 2.1 缓存更新策略 2.2 穿透,击穿,雪崩 3 mysql主从搭建 4 django实现读写分离 1 redis集群扩容缩容 1.1 集群扩容 # 6台机器,3个节点集群# 8台机器&am…

hbase thrift2 jar包冲突导致启动失败问题排查记录

1、启动命令 ${HBASE_HOME}/bin/hbase-daemon.sh start thrift2 2、异常情况 hbase-root-thrift2-hdfs-test07.yingzi.com.out异常日志: Exception in thread "main" java.lang.AbstractMethodError: org.apache.hadoop.metrics2.sink.timeline.Hadoo…

TextToSpeech类学习和简单封装

TextToSpeech类简单学习封装 前言一、TTS是什么?二、TextToSpeech简单使用1.官方介绍2.简单使用 三、TextToSpeech简单封装总结 前言 业务涉及到对接TTS相关,所以简单学习下如何使用。 一、TTS是什么? TextToSpeech简称为TTS,即…

[网鼎杯 2020 青龙组]singal 1

前言 在主函数中找到了一个vm的译码器,译码器主要是解释传入的opcode,然后对我们输入的字符操作,这里我们发现他是单字节比较的,方法很多可以使用单字节映射,也可以是使用符号化执行,当然也可以硬着头皮去…

软件测试计划书

测试计划书 1.测试参考文档和测试提交文档 2.测试进度计划 3.测试资源 4.系统风险、优先级 5.测试策略 6.缺陷管理 7.测试停止标准 软件开发全文档下载进入主页。

Linux部署elasticsearch集群

文章目录 一、集群规划二、安装前准备(所有节点操作)创建数据目录修改系统配置文件/etc/sysctl.conf创建用户组设置limits.conf 三、初始化配置(在节点1上操作)下载安装包解压安装包修改jvm.options文件下配置的所占内存修改集群配置文件elasticsearch.yml将安装包传到另外两个…

JavaFramework JDK Version Test

测试JDK8 JDK17编译包 当前环境JDK8 CASE 1: /*** * author ZengWenFeng* email 117791303QQ.com* mobile 13805029595* date 2023-08-07*/ package zwf;import a.T; import ce.pub.util.GUID;/*** 测试高版本JDK编译JAR,低版本错误** author ZengWenF…

电梯导航的小练习

目录 css代码 html代码 js代码 完整代码 效果图 需求&#xff1a;点击某个模块&#xff0c;显示对应内容 css代码 <style>*{padding: 0;margin: 0;list-style: none;}ul{display: flex;justify-content: center;position: fixed;top: 0;left: 20%;}ul>li{text-…

对换数组的维度numpy.transpose()

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 对换数组的维度 numpy.transpose() 请以下代码执行print(np.transpose(a))后输出的结果是&#xff1f; import numpy as np a np.array([[0, 1], [2, 3]]) b np.array([[0, 1], [2, 3], […

Tomcat 漏洞修复

1、去掉请求响应中Server信息 修复方法&#xff1a; 在Tomcat的配置文件的Connector中增加 server" " &#xff0c;server 的值可以改成你任意想返回的值。

Gee教程5.中间件

鉴权认证、日志记录等这些保障和支持系统业务属于全系统的业务&#xff0c;和具体的系统业务没有关联&#xff0c;对于系统中的很多业务都适用。 因此&#xff0c;在业务开发过程中&#xff0c;为了更好的梳理系统架构&#xff0c;可以将上述描述所涉及的一些通用业务单独抽离…

蓝桥杯第198题 人物相关性分析 C++ 模拟 字符串 双指针

题目 思路和解题方法 程序首先定义了一个函数check&#xff0c;用于判断一个字符是否为字母。接下来&#xff0c;程序读取输入的整数k和一行字符串str。定义了两个空的向量a和b&#xff0c;用于存储满足条件的子串的起始位置。使用for循环遍历字符串str的每个字符&#xff0c;检…

Python--使用布林线设计均值回归策略

在本教程中,我们将探讨均值回归的概念以及如何使用 Python 中的布林线设计交易策略。均值回归是一种流行的交易策略,它基于这样的假设:随着时间的推移,资产价格往往会恢复到历史平均水平。布林线 (Bollinger Bands) 由约翰布林格 (John Bollinger) 开发,是一种技术分析工具…

喜讯 | Circulation(IF:37.8)ChIP-seq+RNA-seq助力解析USP28在糖尿病性心脏病的调控机制

2023年11月23日&#xff0c;国际知名期刊Circulation&#xff08;IF:37.8&&#xff09;在线发表了武汉大学人民医院心内科唐其柱教授团队题为 ” USP28 Serves as a Key Suppressor of Mitochondrial Morphofunctional Defects and Cardiac Dysfunction in the Diabetic He…