超越机械抓手:看多指机器人如何灵活运用触觉?

论文标题:

Learning Visuotactile Skills with Two Multifingered Hands

论文作者:

Toru Lin, Yu Zhang, Qiyang Li, Haozhi Qi, Brent Yi, Sergey Levine, and Jitendra Malik

1. 机器人新挑战:多指手指操作

在自动化和智能化日益普及的今天,机器人在工业生产、医疗辅助、家庭服务等多个领域扮演着越来越重要的角色。然而,大多数现有的机器人手臂都仅限于执行一些简单的、重复性高的任务,它们的操作能力远远不能满足复杂任务的需求。特别是在需要精细操作和高度协调性的场合,机器人的表现往往不尽人意。

为了提升机器人的灵巧性,科学家们开始尝试模仿人类的双手操作。人类的双手是自然界中最灵巧的工具之一,它们能够完成从精细的手术缝合到粗重的搬运工作等一系列复杂任务。要让机器人达到类似的灵巧度,关键在于赋予它们多指操作的能力。多指手不仅能够提供更多的自由度,还能够通过不同的手指组合来适应各种形状和大小的物体。

在这一领域,加州大学伯克利分校的研究团队取得了突破性进展。他们开发的系统能够让机器人通过视觉和触觉数据学习完成复杂任务的技能。这项技术的核心在于模拟人类的感知和运动模式,使机器人能够更加精细和灵活地操作物体。

在这里插入图片描述
▲图1 | 系统搭建及视觉触觉学习的四种任务©️【深蓝AI】编译

2. 机器人的“感官世界” :HATO系统低成本的远程操作

视觉和触觉是人类感知世界的两个重要途径。

**而在机器人的世界观中,「视觉」提供了物体的位置、形状和运动信息,「触觉」则提供物体的质地、重量和接触状态等信息。**而将这两种感知方式结合起来,可以极大地提高机器人对环境的理解和操作的精确性。

在这项研究中,科学家们为机器人配备了先进的视觉和触觉传感器。视觉传感器包括多个RGB-D相机,它们能够捕捉物体的彩色图像和深度信息。触觉传感器则安装在机器人的指尖上,能够检测到细微的压力变化。通过这些传感器,机器人能够获得丰富的环境信息,从而更加准确地判断如何抓握和操作物体。

在这里插入图片描述
▲图2 | 指尖触觉传感器布局©️【深蓝AI】编译

此外,研究者们还开发了一种新的数据处理和学习算法,使机器人能够从人类操作员的演示中学习知识:通过分析操作员的动作和相应的感知反馈,机器人能够逐渐学会如何根据物体的特性和任务的要求来调整自己的动作。这种方法不仅提高了学习效率,还使机器人能够更好地适应新的环境和任务。

为了收集用于训练机器人的数据,研究者们设计了一种名为HATO的低成本远程操作系统。该系统利用现成的虚拟现实(VR)硬件,包括VR头显和手柄,来模拟机器人的动作。 HATO系统是一种低成本的双手多指远程操作系统,它利用现成的虚拟现实(VR)硬件,特别是Meta Quest 2平台,来实现对机器人手臂和手部的直观控制。该系统通过VR控制器的姿态映射来控制机器人臂的末端执行器姿态,同时利用控制器的握把按钮和拇指杆来精细操控手部的关节位置。HATO的核心在于其软件套件,它不仅支持多模态数据的收集,包括视觉、触觉和本体感知信息,还负责将控制器的输入转换为机器人系统的精确控制命令。此外,HATO系统还包括一个数据收集管道,用于记录和处理所有传感器数据,以及支持策略学习与部署的算法。

使用HATO系统,操作员可以戴上VR头显,通过手柄来控制机器人的手臂和手。手柄的姿态和按钮状态被实时捕捉并转换为机器人的动作指令。这种设计不仅使数据收集过程更加直观和自然,还大大降低了系统的成本和复杂性。

HATO系统还支持多模态数据的收集,包括视觉、触觉和本体感知数据。这些数据被同步记录并用于训练机器人的决策模型。通过分析操作员的动作和相应的感知反馈,机器人能够学习如何在不同的任务中使用合适的抓握方式和操作策略。

3. 实验:快速平滑的策略部署,机器人的灵巧性显著提升

在人类的学习过程中,观察和模仿是获取新技能的重要途径。同样,在机器人的技能学习中,观察人类操作员的行为并从中学习也是一个有效的策略。加州大学伯克利分校的研究人员开发的系统正是基于这样的理念,通过分析人类操作员的动作和相应的感知反馈,机器人能够逐渐学会如何根据物体的特性和任务的要求来调整自己的动作。

在训练过程中,机器人首先通过多个传感器收集操作数据。这些数据包括视觉信息、触觉信号和本体感知数据,它们共同构成了机器人的“观察”。视觉信息帮助机器人识别物体的位置和形状,触觉信号提供了物体的质地和重量等信息,而本体感知数据则告诉机器人自己身体各部分的状态。接着,机器人使用一种称为“扩散策略”的算法来处理这些观察数据,并预测下一步的动作。这种算法的核心思想是将动作预测视为一个条件生成问题,即在给定当前观察的情况下,预测未来一系列动作的概率分布。通过这种方式,机器人可以生成一系列可能的动作,并选择最优的动作来执行。 此外,为了提高学习效率,研究人员还提出了一种异步推理算法。这种算法允许机器人在执行任务的同时,不断学习和调整自己的动作。

这意味着机器人可以在实际操作中不断试错,并从错误中学习,从而快速提高自己的技能。

在机器人的技能学习中,如何将学习到的策略有效地部署到实际任务中,是一个关键的技术挑战。传统的策略部署方法通常需要机器人在执行任务时停下来进行推理,这不仅降低了任务的执行效率,也使得机器人难以处理需要连续控制的复杂任务。为了解决这个问题,研究人员提出了一种新颖的异步推理算法。该算法的核心思想是将推理过程与任务执行过程分离,让它们并行运行。

具体来说,机器人在执行任务的同时,一个远程推理服务器会不断地处理最新的观察数据,并生成动作序列的预测。接着,预测结果会被发送回机器人,与之前的时间步长上的预测结果进行整合,计算出一个平滑的动作序列。这样,机器人就可以在不中断任务执行的情况下,实时地调整自己的动作,从而实现更加流畅和连续的任务执行。

这种异步推理算法的另一个优势是它可以提高策略的鲁棒性。在实际应用中,机器人可能会遇到一些训练数据中未曾出现的特殊情况。通过实时的推理和调整,机器人可以更好地适应这些新的情况,从而提高任务的成功率。

在这里插入图片描述
▲图3 | 平行手爪遥操作常见故障©️【深蓝AI】编译

在经过一系列的学习和训练后,机器人在执行复杂任务方面取得了显著的进步。研究人员设计了四个具有挑战性的任务来测试机器人的技能,包括递滑溜的物体、堆叠积木、倒酒和上菜。

在这里插入图片描述
▲图4 | 四个不同的任务©️【深蓝AI】编译

在递物体的任务中,机器人需要用一只手拿起一个滑溜的物体,然后递给另一只手。这个任务考验了机器人的抓握能力和双手协调能力。实验结果显示,机器人能够稳定地抓握物体,并准确地将其递给另一只手,成功率达到了100%。

在堆叠积木的任务中,机器人需要将两个大块的积木叠放在另一个积木上。这个任务不仅需要精确的力量控制,还需要良好的空间定位能力。实验结果表明,机器人能够准确地判断积木的位置, 并用适当的力量将其叠放在一起,从而成功完成任务。

在倒酒的任务中,机器人需要用一只手拿起酒瓶,另一只手拿起酒杯,然后将酒从瓶中倒入杯中。这个任务考验了机器人的精细操作能力和动态控制能力。 实验结果显示,机器人能够平稳地执行倒酒动作,成功地将酒倒入杯中,而没有溅出。

在上菜的任务中,机器人需要用一只手拿起平底锅,另一只手拿起铲子,然后将牛排从锅中铲起并放到盘子上。这个任务需要机器人精确地控制力量和动作, 以防止牛排滑落。实验结果表明,机器人能够成功地完成这个任务,将牛排完好无损地放到了盘子上。

在这里插入图片描述
▲图5 | 视觉和处决对于四种任务表现的影响©️【深蓝AI】编译

4. 更智能、更通用的机器人

HATO系统的成功为机器人的未来发展开辟了新的可能性。通过视觉和触觉数据的学习,机器人不仅能够提高自己在特定任务上的表现,还能够更好地理解和适应环境,从而在更广泛的场景中发挥作用。这种基于学习的方法可以大大提高机器人的适应性。传统的机器人系统通常只能在特定的、预先编程的环境中工作。而通过学习,机器人可以快速地适应新的任务和环境,甚至能够处理一些未知的或不确定的情况。

这种方法还可以提高机器人的通用性。在传统的机器人系统中,不同的任务通常需要不同的编程和调整。而通过学习,机器人可以掌握一系列相关的技能,并能够根据任务的具体要求灵活地选择和组合这些技能。此外,这种方法还为机器人的个性化和定制化提供了可能。不同的操作员可能有不同的操作风格和习惯,通过学习,机器人可以适应不同操作员的特点,从而提供更加个性化的服务。

当然,这项技术仍然处于发展的早期阶段,还有很多挑战需要克服。例如,如何提高学习算法的效率,如何处理更加复杂和动态的环境,以及如何确保机器人的安全性和可靠性等。我们期待机器人将变得更加智能、更加灵活、更加通用。

编译|Scarlett

审核|Los

移步公众号【深蓝AI】,第一时间获取自动驾驶、人工智能与机器人行业最新最前沿论文和科技动态。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/610048.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

winform图书管理系统

winform图书管理系统说明文档 运行前附加数据库.mdf(或sql生成数据库) 主要技术: 图书管理员 读者管理 图书管理 添加 修改 删除 查看 入库 书册列表 书册管理用户管理退出 借书 还书 系统管理员 修改图书管理权限 项目获取:…

java对象互换工具类

1:将Object类型转成json字符串 /*** 将对象转为字符串* param obj* return*/public static String toString(Object obj) {if(obj null) {return null;}if ("".equals(obj.toString())) {return null;}if (obj instanceof String) {return obj.toString();}try {Ob…

20232906 2023-2024-2 《网络与系统攻防技术》第九次作业

20232906 2023-2024-2 《网络与系统攻防技术》第九次作业 1.实验内容 本次实践的对象是一个名为pwn1的linux可执行文件。 该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。 该程序同时包含另一个代码片段,getShell&am…

vscode远程免密ssh原理与实操方法

什么是SSH SSH是一种加密协议,全称为Secure Shell,用于安全地远程登录到服务器或其他远程设备上执行命令或传输文件。它提供了一种安全的加密通信机制,使得远程登录和文件传输等操作不会被恶意攻击者窃取或篡改,确保了数据的保密…

全球10KM土地利用程度数据

全球10KM土地利用程度数据 数据介绍 “一带一路”监测区域土地利用程度指数平均值为0.34,不同区域利用程度差异明显,但总体上高值区域与人口分布的稠密区域吻合。中南半岛、南亚、欧洲和小亚细亚半岛等地海拔较低,水热组合条件较好&#xff…

SqlServer数据库导出表结构和数据为脚本文档

需求:把数据库里的数据结构及数据存为脚本,下次一键执行数据库 操作方法: 一、右击该数据库,选择任务 二、下一步 三、如果导出整个数据库就默认,若导出指定的表和视图就选择具体的数据库对象 四、选择另存为脚本文件…

分解质因数-第12届蓝桥杯国赛Python真题解析

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第61讲。 分解质因数&#…

亚信安慧AntDB:解锁数智化的新时代

亚信安慧AntDB的融合实时的特性使得它在数据库领域独树一帜。传统的数据库系统往往只能追求数据的准确性和一致性,但在实际的业务场景中,这些特性并不能满足企业的需求。AntDB的出现打破了传统束缚,为企业带来了全新的数据处理方式&#xff0…

测试用例设计方法-状态迁移图法

一、介绍: 在软件测试领域中,状态迁移图法是一种极为重要且有效的测试方法。状态迁移图法侧重于分析和测试系统中存在的各种状态以及它们之间的迁移关系。所谓状态,就是系统在特定条件下所处的情况或模式,而迁移则是状态之间的转换…

抖音又出王炸级APP,免费的AI写真神器,一键生成不同场景的写真大片(附保姆级教程)

以前想要拍出一组写真大片,是不是还得跑摄像馆,化妆、换装、各种摆 pose、场景布置,少说也要折腾一上午,而且花费还不少。 而现在,有了 AI,在家里,一个人,一部手机,就能…

微同城小程序源码 轻松制作本地生活活动赚钱 带完整的安装代码包以及搭建教程

近年来,本地生活服务市场蓬勃发展,人们对于周边的生活信息、活动资讯等需求日益增长。然而,传统的信息发布方式存在诸多不便,如信息更新不及时、传播范围有限等。微同城小程序源码应运而生。它利用小程序的便捷性和普及性&#xf…

9.为什么有时候会“烫烫烫”——之函数栈桢

目录 1. 什么是函数栈帧 2. 理解函数栈帧能解决什么问题呢? 3. 函数栈帧的创建和销毁解析 3.1 什么是栈? 3.2 认识相关寄存器和汇编指令 3.3 解析函数栈帧的创建和销毁 小知识:烫烫烫~ Q&A 1. 什么是函数栈帧 我们在写C语言代码…

“设置display:block-inline的li或div中添加文字后,导致li或div排版掉落、错位”的原因及解决方法

先说我想实现的效果 然后我就很快的列出来了css .f_wornning{background: url("/assets/images/icon_kaung.png")no-repeat 100% 100%;background-size: 100% 100%;margin: 10px 20px;height: 3rem;line-height: 3rem;color: #d8eebd;.f_wornning_icon{height: 2rem;…

DDoS攻防,本质上是成本博弈!

在互联网里,分布式拒绝服务(DDoS)攻击作为一种常见的网络威胁,持续对网站、在线服务和企业基础设施构成严重挑战。本文旨在探讨实施DDoS攻击的大致成本、以及企业如何采取有效措施来防范此类攻击,确保业务连续性和网络…

【图像增强(空域)】基于直方图增强的图像增强及Matlab仿真

1. 摘要 图像的灰度直方图表示灰度图像中具有每种灰度像素的个数,反映了图像中每种灰度级出现的频率,是图像的基本统计特征之一。直方图均衡方法因为其有效性和简单性已成为图像对比度增强的最常用的方法。其基本思想是根据输入图像的灰度概率分布来确定…

Verilog复习(三)| Verilog语言基础

四种基本的逻辑值 0&#xff1a;逻辑0或“假”1&#xff1a;逻辑1或“真”x&#xff1a;未知z&#xff1a;高阻 三类常量 整型数&#xff1a;简单的十进制格式&#xff0c;基数格式&#xff08;5’O37&#xff0c;4’B1x_01&#xff09; 格式&#xff1a; <size><’b…

微搭低代码入门05文件的上传和下载

目录 1 创建数据源2 创建应用3 创建页面4 设置导航功能5 文件上传6 文件下载总结 小程序中&#xff0c;我们通常会有文件的上传和下载的需&#xff0c;在微搭中&#xff0c;文件是存放在云存储中&#xff0c;每一个文件都会有一个唯一的fileid&#xff0c;我们本篇就介绍如何通…

docker-compose管理jenkins

1.安装docker和compose 1.docker 更新系统&#xff1a;yum update 安装依赖项&#xff1a;yum install -y yum-utils device-mapper-persistent-data lvm2 配置镜像源&#xff1a;yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce…

js api part5

学生信息管理系统 现在着急没看..........5.15后一定看 没css&#xff1f;c <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scal…

桥接模式类图与代码

欲开发一个绘图软件&#xff0c;要求使用不同的绘图程序绘制不同的图形。以绘制直线和圆形为例&#xff0c;对应的绘图程序如表 7.7 所示。 根据绘图软件的扩展性要求&#xff0c;该绘图软件将不断扩充新的图形和新的绘图程序。为了避免出现类爆炸的情况&#xff0c;现采用桥接…