【paper】基于分布式采样的多机器人编队导航信念传播模型预测控制

  • Distributed Sampling-Based Model Predictive Control via Belief Propagation for Multi-Robot Formation Navigation
  • RAL 2024.4
  • Chao Jiang 美国 University of Wyoming

预备知识

马尔可夫随机场(Markov Random Field, MRF)

马尔可夫随机场(MRF)是用于建模多个随机变量之间相互依赖关系的概率图模型。具有以下特点:

  1. MRF通过无向图表示,节点代表随机变量,边表示变量之间的相互依赖关系。
  2. 每个节点的条件分布仅依赖于其邻居节点,而不依赖于其他节点。
  3. 其核心思想是通过局部相互作用来捕捉全局行为。

信念传播(Belief Propagation, BP)

信念传播是一种在图模型(如MRF)上进行推断的算法。它可以用于计算边缘概率分布或最大后验概率估计。主要有两种形式:

  • 标准(BP):适用于树结构或无环图。在这些图中,BP可以精确地计算边缘概率分布。
  • 循环(Loopy BP):适用于包含环的图。虽然在有环的图中BP不一定收敛或给出精确解,但在实践中它常常表现良好,能提供近似解。

步骤:

  1. 初始化:将每个节点的初始信念设置为其先验概率。
  2. 节点之间交换消息,包括关于一个节点的信念如何影响另一个节点。
  3. 边缘概率计算:通过聚合消息计算每个节点的边缘概率。

Q1 Background:本文试图解决一个什么样的问题?

  • 具有复杂系统动力学和不确定性模型的随机最优控制问题
  • 多机器人最优轨迹优化问题
    在这里插入图片描述
    👉20x20的带有静态障碍物的方形环境。轮式机器人数量N=7。初始位置均匀随机分布在左下角的5×5m区域,初始航向从[0,2π)采样。
    👉编队目标:使6个机器人将自己定位成正六边形,1个机器人位于编队中心。每个机器人与其最近邻居的距离为1.2m。最大通信范围dmax=1.5 m,最小机器人间距离dmin=0.6 m。最大控制vmax=1.2 m/s。

Q2 What’s Known:之前解决这个问题有哪些方法?

  • 基于优化的方法:动态规划 | SCP | MPC
    • 缺点:依赖梯度,需要计算导数,不太适合非光滑动力学或成本函数。随着函数的复杂性(例如,非凸性、局部极小值)的增加,这些方法可能变得低效,甚至无法找到可行解。使用基于梯度的优化的现有MPC方法在平滑优化问题中大多是成功的。
  • 基于采样的方法:路径积分控制 | 交叉熵 | 信息论MPC | 变分推理MPC
    • 定义:使用由前向预测模拟产生的随机轨迹样本来实现最优控制。
    • 优点:不依赖于模型的精确梯度的计算,接受更通用的动力学。随机前向搜索提供了一种解释不确定性的原则性方法,使算法不太容易出现局部极小值。

Q3 What’s New:本文是用什么样的方法如何解决这个问题的?

👉基于分布式采样的MPC算法:将多机器人最优控制公式化为图形模型上的概率推理(probabilistic inference over graphical model),并利用信念传播(leverages belief propagation通过分布式计算实现推理。可以产生基于采样的随机优化的各种分布式最优控制算法。

👉具体Method如下:

建模

  • Model:经典的轮式机器人 - 两轮驱动非完整Robot
    在这里插入图片描述
    x x x, y y y是2D位置, θ \theta θ是航向角, v l v_l vl v r v_r vr代表左轮输入速度和右轮输入速度, l l l是左右轮距离

  • Proximity Graph
    无向图,如果 i i i j j j 的欧几里得距离 ≤ d m a x d_{max} dmax(通信范围限制),则 i i i, j j j存在边,且它们俩互为邻居。
    所以边集是时变的:在这里插入图片描述

  • 避碰和避障
    在这里插入图片描述
    在这里插入图片描述
    X o \mathcal{X}_o Xo是障碍物占用的位置(膨胀后)

  • 导航和编队保护
    保持编队移动到目标位置,同时避碰
    即跟踪参考轨迹 ∥ x i , t − x r , t ∥ , ∀ t ∈ [ 0 , T ] \|x_{i,t}-x_{r,t}\|,\forall t\in[0,T] xi,txr,t,t[0,T],参考轨迹 x r , t x_{r,t} xr,t 通过全局运动规划器获得(环境图全局给定),编队由相对位置 Δ p i j \Delta p_{ij} Δpij确定,当所需编队保持不变时,以下等式成立:
    在这里插入图片描述

  • MPC轨迹优化问题
    在这里插入图片描述
    τ i ≜ { x i , t + k , u i , t + k } k = 0 M − 1 \tau_i\triangleq\{x_{i,t+k},u_{i,t+k}\}_{k=0}^{M-1} τi{xi,t+k,ui,t+k}k=0M1是状态控制序列, N N N是智能体数量, M M M是控制时域

key:使用什么样的方法求解这个MPC轨迹优化问题

推理问题

  • 目标:找到最优轨迹上的概率分布,从而找到每个机器人的最优控制。
  • 概述:首先将多机器人团队建模为一个马尔可夫随机场(MRF)的概率图形模型,然后通过局部消息传递将信念传播(BP)用于分布式推理。最后,开发了一种基于采样的MPC算法来获得每个机器人的最优控制。
    在这里插入图片描述
    在这里插入图片描述
  1. 采样轨迹
    输入: t t t时刻状态 x x x和当前的置信分布 q ( U ) q(U) q(U)
    根据 q ( U ) q(U) q(U)对轨迹 τ \tau τ进行采样,得到 L L L个样本
    计算每个样本轨迹的观测似然 p ( O ∣ τ ) p(O|\tau) p(Oτ)
  2. 传递样本轨迹和消息
    i i i 发送轨迹样本给邻居 j j j,并接受邻居 j j j的轨迹样本
    i i i 计算并传递消息 m k , i ( τ ) m_{k,i}(\tau) mk,i(τ) i i i除了 j j j外的所有邻居 k k k对轨迹 τ i \tau_i τi的估计
    i i i 接受 j j j 计算的消息( j j j除了 i i i外的所有邻居 k k k对轨迹 τ j \tau_j τj的估计
  3. 更新当前置信分布
    根据收到的所有邻居机器人的消息和当前时刻的观测信息更新当前的置信分布 q ( U ) q(U) q(U)

在这里插入图片描述

Q4 What’s the Contribution:本文还有什么其他的贡献吗?

  • 主要贡献是完全分布式框架,每个机器人只需要局部信息。它将基于采样的优化方法[6]、[7]、[8]、[9]、[10]扩展到多机器人问题。
  • 对比CMPC,计算速度快
  • 对比基于ADMM求解的MPC,计算速度快且成功率高(分别为82%和98%)

Q5 What’s the Inspiration

  • 模型比较常规,文章重点在于怎么求解问题,把基于采用的随机最优控制(变分推理)用到了求解DMPC问题中,核心思想还是每个机器人根据其他机器人的信息和自己的观测不断调整和优化自身的轨迹,达到全局最优的控制目标。
  • 求解都比较数学,MRF和BP的地方没太看懂,这部分对我的工作没太大用处,但如果有人能看懂这个数学部分把他做到无人机再加个真机实验应该能写个好文章

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/654461.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何解决SEO排名上升后遭遇的攻击问题

随着搜索引擎优化(SEO)策略的成功实施,网站排名的提升往往会引来更多的流量与关注,但同时也可能成为恶意攻击的目标,包括DDoS攻击、SQL注入、XSS攻击等。这些攻击不仅影响用户体验,还可能导致网站降权甚至被…

目标检测数据集 - 铁路工人安全检测数据集下载「包含VOC、COCO、YOLO三种格式」

数据集介绍:铁路工人安全检测数据集,真实铁路监控场景高质量图片数据,涉及场景丰富,比如铁路工地工人作业数据、铁路巡检工人作业数据、铁路搬运工人作业数据、铁路场景货车上工人作业数据、铁路旁堆料区工人作业数据等。数据标签…

【图书推荐】《机器学习实战(视频教学版)》

本书用处 快速入门Python机器学习基础算法。 最后3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、中药数据分析项目实战)可以作为研究可以的素材。 内容简介 本书基于Python语言详细讲解机器学习算法及其应用,用于读者快…

利用预测大模型完成办公室饮水机剩余热水量

背景 在每天上班的时候,很多同事都有喝热水的习惯,但是饮水机内的热水量总是比较少的,如何避免等待,高效的接到热水是我接下来要做的事情的动机。 理论基础 在大量真实数据的情况下,可以分析出用水紧张的时间段和用水…

【全开源】场馆预定系统源码(ThinkPHP+FastAdmin+UniApp)

一款基于ThinkPHPFastAdminUniApp开发的多场馆场地预定小程序,提供运动场馆运营解决方案,适用于体育馆、羽毛球馆、兵乒球馆、篮球馆、网球馆等场馆。 场馆预定系统源码:打造高效便捷的预定体验 一、引言:数字化预定时代的来临 …

专业上门预约洗衣洗鞋管理系统一站式解决方案

洗衣洗鞋店管理系统一站式解决方案,不仅运营稳定且功能强大,堪称现代生活中的得力助手。 在这个快节奏的时代,人们对便捷性的渴望愈发强烈。洗衣洗鞋作为日常生活中的一项琐碎事务,也亟需一个高效、省心的解决方案。为此&#xf…

databricks~Unity Catalog

Unity Catalog hierarchy 包含了用户授权管理信息和元数据信息 workspace with unity catalog hierarchy unity metastore Ref: https://www.youtube.com/playlist?listPLY-V_O-O7h4fwcHcXgkR_zTLvddvE_GfC

Java常用工具类、包装类

1、工具类的设计 一般地,把那些完成通用功能的方法分类存放到类中,这些类就叫工具类。 工具类起名:XxxUtil、XxxUtils、XxxTool、XxxTools等,其中Xxx表示一类事物,比如ArrayUtil、StringUtil、JdbcUtil。 工具类存放的…

Windows内核函数 - 创建关闭注册表

在驱动程序的开发中,经常会用到对注册表的操作。与Win32的API不同,DDK提供另外一套对注册表操作的相关函数。首先明确一下注册表里的几个概念,避免在后面混淆。 图1 注册表概念 有5个概念需要重申一下: * 注册表项: 注…

LabVIEW步开发进电机的串口控制程序

LabVIEW步开发进电机的串口控制程序 为了提高电机控制的精确度和自动化程度,开发一种基于LabVIEW的实时、自动化电机串口控制程序。利用LabVIEW软件的图形化编程特性,通过串口实时控制电机的运行参数,实现电机性能的精准控制与评估。 系统组…

实现echarts多图联动效果

实现echarts多图联动效果 文章目录 实现echarts多图联动效果业务场景实现关键api代码示例(vue) 业务场景 提示:主要是记录一下多个echarts联动效果实现方案 这本来就是echarts本身自带的api,并没有多高级,奈何寻找的过…

Excel表格保护密码遗忘怎么办?三秒钟破解密码,轻松解锁!

在我们的日常工作中,Excel表格是一个非常实用的工具,但在某些情况下,我们可能会遇到密码忘记的问题,或者在尝试打开或删除文件时被锁定。别担心,这里有三个简单的解决方法来帮助您解决问题。 一、尝试默认密码或常见密…

RangeNet++ 检测3D点云语义算法的详细配置和常见问题

配置环境: Ubuntu18.04 GPU:GeForce MX150 驱动:Ubuntu推荐的nvidia-driver-470 Cuda10.1 cudnn7.6.2 TensorRT 5.1.5.0GCC 7.5.0 运行代码: RangeNet 目录 目录 一、环境配置 1. Ubuntu 18.04 安装NVIDIA驱动 &…

网络——多区域OSPF配置(OSPF系列第1篇)

简介 路由协议OSPF全称为Open Shortest Path First,也就开放是的最短路径优先协议,使用链路状态路由算法,isis协议也是使用链路状态路由算法。而RIP协议使用距离矢量路由算法。 区域 为了能够降低OSPF计算的复杂程度,OSPF采用分…

Redis解决缓存一致性问题

文章目录 ☃️概述☃️数据库和缓存不一致采用什么方案☃️代码实现☃️其他 ☃️概述 由于我们的 缓存的数据源来自于数据库, 而数据库的 数据是会发生变化的, 因此,如果当数据库中 数据发生变化,而缓存却没有同步, 此时就会有 一致性问题存在, 其后果是: 用户使用缓存中的过…

简爱的思维导图怎么做?从这三个角度

简爱的思维导图怎么做?《简爱》作为夏洛蒂勃朗特的代表作,不仅是一部经典的爱情小说,也是探索女性独立与自我成长的文学巨著。为了深入理解这部作品,制作思维导图是一种高效的学习和分析工具。以下是三种不同的角度来创建《简爱》…

【LeetCode算法】第88题:合并两个有序数组

目录 一、题目描述 二、初次解答 三、官方解法 四、总结 一、题目描述 二、初次解答 1. 思路:首次想到的解法:定义一个mn长度的辅助数组,从头遍历这两个数组,谁小就放进辅助数组中并且对应往后走,最后使用memcpy函…

VSCode开发Python-Django入门

一、安装配置Python环境及配置Python环境变量 1、python安装包安装后,需要注意pip.exe和pip3.exe的安装; 2、环境变量需要配置两个目录; 3、验证python是否安装成功 通过cmd命令执行:python --version 查看python版本&#xff…

解决 DataGrip 2024.1.3 连接 Tdengine 时timestamp字段显示时区不正确问题

设置中找到该设置,将原来的设置 yyyy-MM-dd HH:mm:ss 修改为: yyyy-MM-dd HH:mm:ss.SSS z 即可。 注意:只能修改第一个,修改后提示错误,但是查询数据时能成功格式化时间,修改第二个不生效,可能是 bug 具体格式见: Date…

如何取消公众号的在线客服绑定授权

1,功能设置 2,公众号设置 3,查看详情,取消