AI视野·今日CS.Robotics 机器人学论文速览
Mon, 23 Oct 2023
Totally 26 papers
👉上期速览✈更多精彩请移步主页
Daily Robotics Papers
A Review of Prospects and Opportunities in Disassembly with Human-Robot Collaboration Authors Meng Lun Lee, Xiao Liang, Boyi Hu, Gulcan Onel, Sara Behdad, Minghui Zheng 产品拆卸在 EoU 终端产品的回收、再制造和再利用中发挥着至关重要的作用。然而,由于EoU产品的复杂性和多样性,当前的手动拆卸过程效率低下。虽然考虑到任务的复杂性,完全自动化拆卸在经济上不可行,但使用人类机器人协作 HRC 来增强拆卸操作具有潜力。 HRC 将人类的灵活性和解决问题的能力与机器人精确重复和处理不安全任务的能力结合起来。然而,技术、人力和再制造工作仍然存在众多挑战,需要全面的多学科研究来弥合关键差距。这些挑战促使作者对引入 HRC 进行拆卸相关的机遇和障碍进行了详细讨论。 |
Social Robot Mediator for Multiparty Interaction Authors Manith Adikari, Angelo Cangelosi, Randy Gomez 充当调解人的社交机器人可以增强人类之间的互动,例如在教育和医疗保健等领域。一个特别有前途的研究领域是在多方环境中使用社交机器人调解器,这往往最适用于现实世界的场景。然而,针对多方交互的社交机器人中介的研究仍在不断涌现,并面临着众多挑战。本文通过重点介绍相关文献和一些持续存在的问题,概述了社交机器人和中介研究。还提出了结合相关心理学原理来开发社交机器人调解员的重要性。 |
Correspondence learning between morphologically different robots through task demonstrations Authors Hakan Aktas, Yukie Nagai, Minoru Asada, Erhan Oztop, Emre Ugur 我们观察了各种各样的机器人的身体、传感器和执行器。考虑到技能组的共性,当考虑到机器人领域的多样性时,单独向每个不同的机器人教授每种技能是低效的且不可扩展的。如果我们能够了解不同机器人感觉运动空间之间的对应关系,我们就可以期望在一个机器人中学到的技能可以更直接、更容易地转移到其他机器人上。在本文中,我们提出了一种学习形态具有显着差异的机器人(具有关节控制的固定基机械手机器人和差动驱动移动机器人)之间对应关系的方法。为此,首先对这两种机器人进行了演示,以实现相同的任务。在学习相应策略的同时形成了共同的潜在表示。在这个初始学习阶段之后,对一个机器人执行新任务的观察足以生成与另一个机器人相关的潜在空间表示,以实现相同的任务。我们在一组实验中验证了我们的系统,其中学习了两个模拟机器人之间的对应关系 1 当机器人需要遵循相同的路径来完成相同的任务时, 2 当机器人需要遵循不同的轨迹来完成相同的任务时,以及3 当所考虑的机器人所需的感觉运动轨迹的复杂性不同时。 |
Quadrotor Dead Recooking with Multiple Inertial Sensors Authors Dror Hurwitz, Itzik Klein 四旋翼飞行器广泛用于监视、测绘和交付。在多种情况下,四旋翼飞行器以纯惯性导航模式运行,导致导航解漂移。为了处理这种情况并限制导航漂移,四旋翼飞行器航位推算 QDR 方法需要使四旋翼飞行器沿周期性轨迹飞行。然后,使用基于模型或学习的方法可以估计四旋翼飞行器位置矢量。我们建议使用多个惯性测量单元MIMU来提高QDR方法的定位精度。推导并评估了在深度学习框架中利用 MIMU 数据的几种方法。 |
RL-X: A Deep Reinforcement Learning Library (not only) for RoboCup Authors Nico Bohlinger, Klaus Dorer 本文介绍了新的深度强化学习 DRL 库 RL X 及其在 RoboCup 足球模拟 3D 联赛和经典 DRL 基准测试中的应用。 RL X 通过自包含的单目录算法提供了灵活且易于扩展的代码库。 |
A Human-Robot Mutual Learning System with Affect-Grounded Language Acquisition and Differential Outcomes Training Authors Alva Markelius, Sofia Sj berg, Zakaria Lemhauori, Laura Cohen, Martin Bergstr m, Robert Lowe, Lola Ca amero 本文提出了一种新颖的人机交互设置,用于机器人和人类学习符号语言,以识别机器人稳态需求。机器人和人类学习使用相同的语言符号并分别做出反应,这些语言符号分别传达稳态需求和满足稳态需求的刺激。我们采用了差异结果训练 DOT 协议,机器人根据其内部需求提供特定差异的反馈,例如当正确的刺激满足时,例如饥饿曲奇饼 。我们发现证据表明 DOT 可以提高人类的学习效率,从而使机器人语言习得更加高效。研究中使用的机器人拥有与人类婴儿在牙牙学语阶段相似的词汇。机器人软件架构建立在基于情感的语言习得模型之上,其中机器人通过与人类的互动将词汇与内部需求饥饿、口渴、好奇心联系起来。本文介绍了通过交互设置进行的初步试点研究的结果,结果表明,与非 DOT 控制条件相比,机器人的语言习得在 DOT 条件下实现了更高的收敛率。此外,参与者还报告了积极的情感体验、掌控感以及与机器人的同理心。这种相互学习的师生学习方法为促进 DOT 的认知干预提供了潜在的贡献,例如:对于痴呆症患者来说,通过发挥积极的教学作用,让人们更多地参与培训任务,从而提高治疗依从性。 |
ColAG: A Collaborative Air-Ground Framework for Perception-Limited UGVs' Navigation Authors Zhehan Li, Rui Mao, Nanhe Chen, Chao Xu, Fei Gao, Yanjun Cao 在充满障碍物的未知区域中,感知对于自主导航是必要的。对于机器人来说,在没有任何可以感知环境的传感器的情况下安全导航是一项挑战,导致机器人失明,而对于一群机器人来说,这就变得更加困难。然而,为所有机器人配备昂贵的感知或 SLAM 系统可能成本高昂。在本文中,我们提出了一种名为textbf ColAG的新颖系统,通过引入与一架无人机(这是该组中唯一具有完整感知能力的机器人)的合作来解决一组textit盲人UGV的自主导航问题。无人机使用 SLAM 进行测距和绘图,同时通过有限的相对位姿估计与 UGV 共享此信息。 UGV 在接收到的地图中规划其轨迹,并预测由于车轮里程计的不确定性和未知风险区域而可能导致的故障。无人机动态调度航路点以防止无人车发生碰撞,将其表述为具有时间窗的车辆路径问题,以优化无人机的轨迹并最大限度地减少无人车必须等待的时间以保证安全。 |
Combining Policy Gradient and Safety-Based Control for Autonomous Driving Authors Xi Xiong, Lu Liu 随着数据驱动技术的进步,解决持续控制挑战变得更加有效。然而,这些方法对历史数据的依赖导致了在新场景中做出意外决策的可能性。为了提高自动驾驶和避免碰撞的性能,我们提出了策略梯度与基于安全的控制的共生融合。在本研究中,我们采用深度确定性策略梯度 DDPG 算法来实现在没有周围车辆的情况下的自动驾驶。通过在稳定且熟悉的环境中训练车辆的驾驶策略,实现了稳健且高效的学习过程。随后,考虑到周围车辆的存在,利用人工势场方法来制定防撞算法。此外,还仔细考虑了路径跟踪方法。 |
PathRL: An End-to-End Path Generation Method for Collision Avoidance via Deep Reinforcement Learning Authors Wenhao Yu, Jie Peng, Quecheng Qiu, Hanyu Wang, Lu Zhang, Jianmin Ji 使用深度强化学习 DRL 的机器人导航在提高移动机器人性能方面显示出巨大潜力。然而,大多数现有的基于 DRL 的导航方法主要侧重于训练直接命令具有低级别控制的机器人的策略,如线速度和角速度,这导致机器人在长期执行过程中速度不稳定和轨迹不平滑。另一种方法是训练直接输出导航路径的 DRL 策略。然而,训练输出路径的 DRL 策略会出现两个障碍 1 与低级命令相比,潜在路径的动作空间通常涉及更高的维度,这增加了训练的难度 2 跟踪路径需要多个时间步,而不是单个时间步时间步长,需要路径来预测机器人与时间的交互。多个时间步长的动态环境。这反过来又加剧了与培训相关的挑战。为了应对这些挑战,我们提出了 PathRL,这是一种新颖的 DRL 方法,可以训练策略来生成机器人的导航路径。具体来说,我们采用特定的动作空间离散技术和定制的状态空间表示方法来解决相关的挑战。在我们的实验中,与其他 DRL 导航方法相比,PathRL 实现了更高的成功率并减少了角度旋转变化,从而促进了机器人运动的稳定和平滑。 |
Dynamic Object Detection in Range data using Spatiotemporal Normals Authors Raphael Falque, Cedric Le Gentil, Fouad Sukkar 在使机器人能够与人类、动物和不可预测的元素作为独立代理的现实世界进行交互的过程中,机器人具有检测动态物体的能力至关重要。在本文中,我们认为动态物体的检测可以通过计算点云的时空法线来解决。 |
ManiCast: Collaborative Manipulation with Cost-Aware Human Forecasting Authors Kushal Kedia, Prithwish Dan, Atiksh Bhardwaj, Sanjiban Choudhury 近距离的无缝人类机器人操纵依赖于对人体运动的准确预测。虽然大规模学习预测模型取得了重大进展,但当应用于操纵任务时,这些模型在关键转变点会产生很高的错误,导致下游规划性能下降。我们的主要见解是,与其预测最有可能的人体运动,不如生成预测来捕获未来的人体运动将如何影响机器人计划的成本。我们提出了 ManiCast,这是一个新颖的框架,可以学习成本意识人类预测并将其提供给模型预测控制规划器以执行协作操作任务。我们的框架支持人类和 7 DoF 机器人手臂之间在许多现实世界任务中进行流畅、实时的交互,例如反应搅拌、对象切换和协作桌子设置。我们根据一系列学习和启发式基线评估运动预测和端到端预测规划器系统,同时另外提供新的数据集。 |
Higher or Lower: Challenges in Object based SLAM Authors Zhihe Zhang, Hao Wei, Hongtao Nie 同步定位和建图作为计算机视觉的一项基本任务,近年来随着自动驾驶和无人机的快速发展,对性能提出了更高的要求。传统SLAM算法高度依赖点、线等基本几何特征,易受环境影响。相反,更高级别的对象特征提供更丰富的信息,这对于提高框架的整体性能至关重要。然而,有效利用对象特征需要仔细考虑各种挑战,包括复杂性和处理速度。考虑到高级对象特征和低级几何特征的优点和缺点,在 SLAM 框架内做出明智的选择变得至关重要。 |
Simultaneous Shape Tracking of Multiple Deformable Linear Objects with Global-Local Topology Preservation Authors Jingyi Xiang, Holly Dinkel 这项工作提出了一种算法,用于从 RGB D 图像序列中跟踪多个纠缠可变形线性物体 DLO 的形状。该算法实时运行,并通过支持跟踪多个对象来改进以前的单一 DLO 跟踪方法。这是使用全局局部拓扑保护 GLTP 来实现的。这项工作使用 GLTP 中的测地距离来定义单独对象之间的距离以及同一对象不同部分之间的距离。通过实验证明了跟踪多个纠缠 DLO。 |
RMap: Millimeter-Wave Radar Mapping Through Volumetric Upsampling Authors Ajay Narasimha Mopidevi, Kyle Harlow, Christoffer Heckman 在雾和灰尘等不利的视觉退化条件下,毫米波雷达被用作激光雷达和雷达的可行替代方案。然而,这种传感器模式在标称条件下存在严重的稀疏性和噪声,这使得它难以在测绘等精确应用中使用。这项工作提出了一种从稀疏雷达点云生成精确 3D 地图的新颖解决方案。 RMap 使用自定义生成变压器架构 UpPoinTr,它可以对不完整的雷达地图进行上采样、去噪和填充,以类似于激光雷达地图。 |
Enhancing Multi-Drone Coordination for Filming Group Behaviours in Dynamic Environments Authors Aditya Rauniyar, Jiaoyang Li, Sebastian Scherer 多智能体路径查找 MAPF 是机器人和人工智能中的一个基本问题,在现实世界场景中有大量应用。其中一种场景是拍摄多个演员的场景,其目标是同时从多个角度捕捉场景。在这里,我们提出了一种基于编队的任务分配拍摄指令,然后是基于冲突的 MAPF 算法,用于多个代理的有效路径规划,以实现拍摄目标,同时避免碰撞。我们建议对标准 MAPF 公式进行扩展,以适应参与者的特定要求和约束。我们的方法结合了基于冲突的搜索,这是一种广泛使用的启发式搜索技术,用于解决 MAPF 问题。我们通过在模拟环境中对各种 MAPF 场景进行实验来证明我们方法的有效性。 |
Approximated Modeling and Optimal Design for a Soft Pneumatic Actuator Considering the Force/Torque and System Controllability Authors Wu Te Yang, Burak Kurkcu, Masayoshi Tomizuka 软体气动执行器 SPA 广泛用于驱动软体机器人。然而,它们固有的灵活性既带来了好处,也带来了挑战。这一特性降低了它们的输出力矩并使它们难以控制。本文介绍了一种新的设计方法,可以增强执行器的性能和可控性。通过将软致动器近似为悬臂梁,简化了其复杂结构。这使我们能够推导出输入压力与输出扭矩之间的机械方程。此外,还探索了动态模型来了解 SPA 的固有频率和尺寸参数之间的相关性。然后将设计问题转化为优化问题,使用力学方程作为目标函数,动力学方程作为约束。通过求解该优化问题,确定最佳尺寸参数。在制造之前,使用有限元方法进行初步测试。制造了六个原型来验证所提出的方法。最佳执行器成功地产生所需的力扭矩,同时其固有频率保持在约束范围内。 |
Efficient, Dynamic Locomotion through Step Placement with Straight Legs and Rolling Contacts Authors Stefan Fasano, James Foster, Sylvain Bertrand, Christian DeBuys, Robert Griffin 对于人类来说,在平坦的地面上快速、高效的行走代表了个人每天经历的绝大多数运动,而对于一个有效的、现实世界的人形机器人来说,情况可能也是如此。在这项工作中,我们提出了一种运动控制器,使用相对简单的基于模型的控制器在平坦的地面上高效行走,该控制器利用了几个有趣的设计功能的新颖组合,包括基于 ALIP 的步长调整策略、站立腿长度控制作为替代方案质心高度控制,以及用于站立脚从脚跟到脚趾运动的滚动接触。然后,我们在机器人 Nadia 上展示该控制器的结果,包括模拟和硬件。这些结果包括验证该控制器能够以 0.75 m s 的速度执行快速、可靠的向前行走以及向后行走、侧步、原地转向和推动恢复。我们还对所提出的控制策略和我们的基线行走控制器在三种稳态行走速度下的效率进行了比较。 |
From Propeller Damage Estimation and Adaptation to Fault Tolerant Control: Enhancing Quadrotor Resilience Authors Jeffrey Mao, Jennifer Yeom, Suraj Nair, Giuseppe Loianno 即使在发生系统干扰、损坏或故障的情况下,空中机器人也必须保持运行,以确保任务的弹性和鲁棒性完成和安全性。一种常见的故障案例是螺旋桨损坏,这在量化和赔偿方面都提出了重大挑战。我们提出了一种新颖的自适应控制方案,能够检测和补偿多旋翼螺旋桨损坏,确保安全和稳健的飞行性能。我们的控制方案包括一个 L1 自适应控制器,用于单螺旋桨或双螺旋桨的损坏推断和补偿,能够在损坏严重时无缝过渡到容错解决方案。我们通过实验确定了 L1 自适应解决方案优于容错替代方案的条件。 |
How Can Everyday Users Efficiently Teach Robots by Demonstrations? Authors Maram Sakr, Zhikai Zhang, Benjamin Li, Haomiao Zhang, H.F. Machiel Van der Loos, Dana Kulic, Elizabeth Croft 从演示中学习 LfD 是一个允许非专业用户轻松对机器人进行编程的框架。然而,机器人学习的效率和机器人概括任务变化的能力取决于所提供演示的质量和数量。我们的目标是指导人类教师提供更有效的演示,从而促进高效的机器人学习。为了实现这一目标,我们建议使用不确定性的度量,即任务相关信息熵,作为向人类教师建议信息丰富的演示示例以提高其教学技能的标准。在进行的实验 N 24 中,采用基于增强现实 AR 的引导系统来训练新手用户从工作空间内熵最高的区域进行额外的演示。这些新手用户接受了一些试验的培训,通过有限数量的演示来教机器人执行可推广的任务。随后,首先根据相同的任务保留情况评估训练后的用户表现,然后在没有指导的情况下根据新的任务转移情况评估用户的表现。结果表明,通过教师的演示,机器人的学习效率有了显着提高,在新任务中观察到的提高高达 198。 |
NeuroSMPC: A Neural Network guided Sampling Based MPC for On-Road Autonomous Driving Authors Kaustab Pal, Aditya Sharma, Mohd Omama, Parth N. Shah, K. Madhava Krishna 在本文中,我们展示了一种将数据驱动框架集成到基于采样的最优控制的有效方法,以大大减少计算时间,以便于采用和适应实时应用程序,例如在存在动态参与者的情况下进行道路自动驾驶。通过训练示例,时空 CNN 学会预测有限范围内的最优均值控制,从而排除进一步的重采样,这是一个迭代过程,使得基于采样的最优控制公式难以在实时设置中采用。围绕网络预测的最佳平均值生成控制样本保留了样本多样性的优势,同时实现了轨迹的实时推出,从而避免了道路导航设置中的多个动态障碍物。此外,3D CNN 架构隐式学习场景中动态代理的未来轨迹,从而实现成功的无碰撞导航,尽管没有明确的未来轨迹预测。我们通过 CARLA 中的闭环模拟在许多道路场景中展示了在多个基线上的性能增益。 |
Creative Robot Tool Use with Large Language Models Authors Mengdi Xu, Peide Huang, Wenhao Yu, Shiqi Liu, Xilun Zhang, Yaru Niu, Tingnan Zhang, Fei Xia, Jie Tan, Ding Zhao 工具的使用是高级智能的标志,动物行为和机器人能力都体现了这一点。本文研究了赋予机器人在涉及隐性物理约束和长期规划的任务中创造性地使用工具的能力的可行性。利用大型语言模型法学硕士,我们开发了 RoboTool,这是一个接受自然语言指令并输出可执行代码的系统,用于在模拟和现实环境中控制机器人。 RoboTool 包含四个关键组件:i 一个分析器,用于解释自然语言以辨别关键任务相关概念;ii 一个规划器,用于根据语言输入和关键概念生成综合策略;iii 一个计算器,用于计算每种技能的参数;iv 一个编码器,用于计算每个技能的参数。将这些计划转换为可执行的 Python 代码。我们的结果表明,RoboTool 不仅可以理解显性或隐性的物理约束和环境因素,还可以展示创造性的工具使用。与依赖显式优化的传统任务和运动规划 TAMP 方法不同,我们基于 LLM 的系统为复杂的机器人任务提供了更灵活、高效和用户友好的解决方案。通过大量的实验,我们验证了 RoboTool 能够熟练地处理如果没有创造性地使用工具就无法完成的任务,从而扩展了机器人系统的功能。 |
Studying speed-accuracy trade-offs in best-of-n collective decision-making through heterogeneous mean-field modelling Authors Andreagiovanni Reina, Thierry Njougouo, Elio Tuci, Timoteo Carletti 为了成功实现其目标,个人群体必须能够在不同品质的替代方案中做出快速、准确的集体决策。群居动物一直致力于做到这一点。人们认为植物和真菌也有这种作用。还可以对一群自主机器人进行编程,使其做出最佳决策,从而协作解决任务。最终,人类迫切需要它,而且很多时候他们应该做得更好。尽管它们很简单,但数学上的易处理性使得选民模型 VM 和本地多数规则模型 MR 等模型有助于用简单的术语描述此类集体决策过程。为了达成共识,个人通过在社交网络中与邻居互动来改变他们的观点。至少在动物和机器人中,质量较好的选项交换得更频繁,因此比质量较低的选项传播得更快,从而导致集体选择最佳选项。通过我们的工作,我们研究了个人在汇集他人意见时犯错误所造成的影响,例如,减少认知负荷。我们的分析基于引入一个模型,该模型概括了两个现有的 VM 和 MR 模型,显示了受个人认知努力调节的速度准确性权衡。我们还研究了交互网络拓扑对集体动态的影响。为此,我们扩展了我们的模型,并通过使用异构平均场方法,我们证明了另一种速度精度权衡是由网络连接性调节的。 |
What you see is what you get: Experience ranking with deep neural dataset-to-dataset similarity for topological localisation Authors Matthew Gadd, Benjamin Ramtoula, Daniele De Martini, Paul Newman 回忆用于定位的最相关的视觉记忆或先验地理解针对特定视觉记忆的定位工作的可能结果对于高效且稳健的视觉导航是有用的。此问题的解决方案应与针对真实情况的绩效评估分开,因为这在运行时不可用,并且理想情况下应基于可概括的环境观察。为此,我们建议应用最近开发的 Visual DNA 作为高度可扩展的工具,用于比较本作品中的图像数据集、地图序列和现场体验。在本地化的情况下,影响性能的重要数据集差异是外观变化的模式,包括天气、照明和季节。具体来说,对于通过匹配特定层的特征量来进行位置识别的任何深度架构,我们使用分布测量来比较实时图像和多个先前记录的过去经验之间的神经元激活统计数据,以及潜在的大季节性冬季夏季或时间白天夜班。我们发现,当使用具有相同外观差距的过去经验进行本地化时,这些统计数据的差异与性能相关。 |
ROSS: Radar Off-road Semantic Segmentation Authors Peng Jiang, Srikanth Saripalli 随着越野环境中自主导航需求的增加,需要有效的解决方案来了解这些环境变得至关重要。在本研究中,我们面临越野场景雷达数据语义分割的固有复杂性。我们提出了一种新颖的管道,利用激光雷达数据和现有带注释的越野激光雷达数据集来生成雷达标签,其中雷达数据表示为图像。 |
CylinderTag: An Accurate and Flexible Marker for Cylinder-Shape Objects Pose Estimation Based on Projective Invariants Authors Shaoan Wang, Mingzhu Zhu, Yaoqing Hu, Dongyue Li, Fusong Yuan, Junzhi Yu 基于视觉标记的高精度姿态估计一直是计算机视觉领域的一个热门研究课题。然而,由于曲面形状多样,传统平面标记在曲面物体上的适用性受到限制,这阻碍了曲面物体高精度位姿估计的发展。因此,本文提出了一种新颖的视觉标记,称为CylinderTag,它是为可展开的曲面(例如圆柱面)而设计的。 CylinderTag 是一种循环标记,可以牢固地附着在圆柱形物体上。利用流形假设,利用投影不变性中的交叉比在表面上零曲率方向上进行编码。此外,为了方便 CylinderTag 的使用,我们还提出了一种基于启发式搜索的标记生成器和高性能识别器。此外,通过广泛的实验对 CylinderTag 属性进行了全面的评估,涵盖检测率、检测速度、字典大小、定位抖动和姿态估计精度。与传统视觉标记相比,CylinderTag 从不同视角展现出卓越的检测性能,并具有更高的定位精度。此外,CylinderTag 还拥有实时检测功能和丰富的标记字典,在广泛的应用中提供增强的多功能性和实用性。实验结果表明,CylinderTag 是一种非常有前途的用于圆柱形表面的视觉标记,从而为未来圆柱形物体高精度视觉定位的研究提供了重要指导。 |
Absolute Policy Optimization Authors Weiye Zhao, Feihan Li, Yifan Sun, Rui Chen, Tianhao Wei, Changliu Liu 近年来,策略强化学习的信任区域在解决复杂的控制任务和博弈场景方面取得了令人瞩目的成果。然而,该类别中当代最先进的算法主要强调预期性能的改进,缺乏控制最坏情况性能结果的能力。为了解决这个限制,我们引入了一种新的目标函数,通过优化它,它将保证接近总性能样本绝对性能的下限的单调改进。考虑到这一突破性的理论进步,我们随后通过一系列近似改进了这一理论基础算法,从而产生了称为绝对策略优化 APO 的实用解决方案。我们的实验证明了我们的方法在具有挑战性的连续控制基准任务中的有效性,并将其适用性扩展到掌握 Atari 游戏。 |
Chinese Abs From Machine Translation |
Papers from arxiv.org
更多精彩请移步主页
pic from pexels.com