LeRobot——Hugging Face打造的机器人领域的Transformer架构

前言

如友人邓博士所说,“用 Stanford aloha 课题组提供的训练数据,训练他们研发的 Action Chunking Transformer 动作规划模型,训练结果,能用,但是稳定性有待提高

要提高稳定性,看来必须修改 Stanford aloha 的源代码了,Stanford aloha 课题组提供的初代源代码,可读性不太好,改造起来略感吃力,

好消息是,上周 LeRobot 在 Github 上开源了他们的源代码,LeRobot 试图构建机器人的标准化的 APIs,如同 Huggingface 上的 transformers 和 diffusers

目前该项目已经对几个知名的机器人项目的源代码,进行了重构,部分统一了 APIs,其中包括 Stanford aloha 的 ACT 模型,这就大大降低了改造 ACT 模型的工程难度”

第一部分 机器人领域的Transformer架构:LeRobot

5月6日,Hugging Face的机器人项目负责人雷米·卡德内(Remi Cadene)宣布推出LeRobot开源代码库,并形容它对于机器人的意义就如同“Transformer架构之于NLP(自然语言处理)”

Remi Cadene在推文中表示,LeRobot之于机器人就像Transformer架构之于NLP——它提供带有预训练检查点的高级AI模型的简洁实现。他们还复现了来自学术界的 31 个数据集和一些模拟环境,无需实体机器人即可开始使用

图片

Cadene 发布了一些由Github上LeRobot库的代码提供的机器人功能的示例,它们都是在真实数据集上训练的。

比如,在这个数据可视化的例子中,它展示了LeRobot是如何在Return(一个SDK和查看器,用于可视化与多模态数据流交互)上运行的,数据集来自Aloha项目(用于异构架构运行时自适应和安全深度学习的软件框架,主要目标是促进深度学习算法在异构低能耗计算平台上的实现,为最佳算法选择、资源分配和部署提供自动化

图片

LeRobot的另一项可视化是在Mobile Aloha数据集上进行的,旨在完全端到端地学习导航和操作。以下例子展示了LeRobot控制下的两个机器人抓手/手臂之间传递物体:

图片

上述两个数据集都是在机器人公司Trossen Robotics的机械臂上收集的。

当Remi Cadene团队使用ACT策略对LeRobot开源代码库进行测试时,基于LeRobot的机器人在模拟环境下同样表现良好。

ACT策略是一种机器人的动作分块算法,即Action Chunking with Transformers,它使用Transformer编码器合成来自多个视点、联合位置和风格变量的图像,并使用Transformer解码器预测一系列动作,通过预测动作序列来解决高精度领域中的问题。ACT策略可以在新环境干扰下做出反应,并且对一定程度的干扰具有鲁棒性

图片

可以看到,两只机械手分别娴熟地捏起两块不同的积木并堆叠到了一起,证明了ACT策略下LeRobot的有效性

同时,在Diffusion Policy(扩散策略,一种强大的模仿学习算法)和TDMPC Policy(Temporal Difference Learning for Model Predictive Control,一种包含世界模型的强化学习算法)两种策略下,LeRobot同样表现出色,可以不断从与环境的交互中学习

图片

// 待更

参考文献与推荐阅读

  1. https://mp.weixin.qq.com/s/1OICpx-YIj7DJpna9M_aCQ
  2. Hugging Face进军机器人,前特斯拉Optimus科学家带队|甲子光年
  3. 马斯克擎天柱大将跳槽,在Hugging Face开源一套机器人技术:会做家务的大白,复刻低至1800
  4. 如何快速学习 LeRobot
    LeRobot 机器人大脑的输入输出
  5. ..

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/721636.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++初学者指南第一步---6.枚举和枚举类

C初学者指南第一步—6.枚举和枚举类 文章目录 C初学者指南第一步---6.枚举和枚举类1.作用域的枚举(enum class类型)(C11)2.无作用域的枚举(enum类型)3.枚举类的基础类型4.自定义枚举类映射5.和基础类型的互相转换 1.作用域的枚举(enum class类…

深度学习(九)——神经网络:最大池化的作用

一、 torch.nn中Pool layers的介绍 官网链接: https://pytorch.org/docs/stable/nn.html#pooling-layers 1. nn.MaxPool2d介绍 nn.MaxPool2d是在进行图像处理时,Pool layers最常用的函数 官方文档:MaxPool2d — PyTorch 2.0 documentation &…

耗时两天半的java之sql注入代码审计

java之sql注入代码审计 前言 其实找到漏洞原因很简单,主要想学习一下JDBCsql的过程 JDBC 简单介绍 Java通过java.sql.DriverManager来管理所有数据库的驱动注册,所以如果想要建立数据库连接需要先在java.sql.DriverManager中注册对应的驱动类&#x…

2Y0A21 GP2Y0A21YK0F 红外测距传感器 arduino使用教程

三根线 正极负极信号线 确认自己的三根线分别代表什么,我们的颜色可能不一样 附一张我买的传感器他们的说明图 正极 接 开发板5V 负极 接开发板GND 信号线 接A0 代码arduino ide上面写 // Infračerven senzor vzdlenosti Sharp 2Y0A21// připojen potře…

新火种AI|Sora发布半年之后,AI视频生成领域风云再起

作者:一号 编辑:美美 AI视频最近有些疯狂,Sora可能要着急了。 自OpenAI的Sora发布以来,AI视频生成技术便成为了科技界的热门话题。尽管Sora以其卓越的性能赢得了广泛关注,但其迟迟未能面向公众开放,让人…

Study--Oracle-03-数据库常规操作

一路走来,所有遇到的人,帮助过我的、伤害过我的都是朋友,没有一个是敌人。 一、oracle 版本及主要功能 二、数据安装完成后常用操作SQL 1、检查数据库监听状态 监听的常用命令 启动:[oracleoracle u01]$ lsnrctl stop 停止&am…

买家用洗地机需要注意什么?全面评测热门洗地机品牌

对于忙碌的打工族来说,“做家务”是一件非常消费时间精力的事情,但它又是生活中的一部分,为了解决这些矛盾点,越来越多的清洁家电涌向市场,像集扫地、吸尘、洗地为一体的洗地机,在推拉之间便把脏污处理干净…

网络编程4----网络原理(面试及期末必备)

1 应用层 应用层是与程序员关系最密切的一层,在应用层这里了,很多时候,都是使用程序员自定义的协议,当然,也有很多现成的协议供我们使用。 “自定义协议”: 自定义一个协议,也就是自己做一个…

Idea连接GitLab的过程以及创建在gitlab中创建用户和群组

上期讲述了如何部署GitLab以及修复bug,这期我们讲述,如何连接idea。 首先安装gitlab插件 下载安装idea上并重启 配置ssh免密登录 使用管理员打开命令行输入:ssh-keygen -t rsa -C xxxaaa.com 到用户目录下.ssh查看id_rsa.pub文件 打开复制…

新兴互联网银行搭档Apache SeaTunnel构建数据流通管道!

当新兴互联网银行乘着数字化改革的风潮搭档数据集成平台Apache SeaTunnel,成千万上亿的数据就有了快速流通的管道。6月26日14:00,Apache SeaTunnel社区将带上企业最佳实践与观众见面,与大家面对面交流最新的企业实践部署经验。锁定SeaTunnel视…

OpenCV中的圆形标靶检测——findCirclesGrid()(二)

本章我们开始讲解基于层次聚类的标靶检测算法。当我们调用如下API,且flags中包含cv::CALIB_CB_CLUSTERING标志位时,将会执行基于层次聚类的斑点检测算法。算法支持对称标靶和非对称标靶两类,相应的需要将下述flags设为包含CALIB_CB_SYMMETRIC_GRID或CALIB_CB_ASYMMETRIC_GRI…

设计模式(五)创建者模式之工厂模式

工厂模式 工厂模式上面类图代码实现Coffee 抽象类AmericanCoffeeLatterCoffeeCoffeeStoreUser 简单工厂模式增加工厂方法更改CoffeeStore 类优缺点扩展静态工厂 工厂方法模式概念结构具体类图代码实现Coffee类AmericanCoffeeLatterCoffee抽象工厂CoffeeFactoryAmericanCoffeeFa…

OrangePi Kunpeng Pro 安装 ROS2 + Gazebo

文章目录 1. 初识1.1 到手开箱1.2 OrangePi Kunpeng Pro1.2 上电 2. 安装Ubuntu2.1 准备工作2.2 安装 3. 安装ROS23.1 设置支持UTF-8的locale编码3.2 添加证书3.3 安装ROS3.4 设置环境变量3.5 小海龟来啦 4. 运行实例4.1 安装Gazebo4.2 安装turtlebot 总结 1. 初识 1.1 到手开…

通勤必备!重回儿时回忆,完全免费!

哈喽,各位小伙伴们好,我是给大家带来各类黑科技与前沿资讯的小武。 今天给大家安利三个网站,可以完全免费在线玩的小霸王游戏机,重回童年游戏时刻! 最后一款还可以网页在线和朋友联机CS、吃鸡、暗黑破坏神、拳皇、恐龙…

LVS负载均衡集群企业级应用实战-LVS-DR(四)

目录 LVS-DR 一. 环境准备 二. 对虚拟主机操作 三. 对真实服务器操作 四. 打开网页测试 LVS-DR 一. 环境准备 三台虚拟机,都要在同一网段内,统一关闭防火墙和selinux,时间同步,配置好YUM源。系统用centos和roucky都行。 主…

【ai】如何在ollama中随意使用hugging face上的gguf开源模型

【背景】 ollama的pull命令可以直接pull ollama列表中现有的模型,但是ollama可以直接pull的模型大都是英语偏好(llama2有直接可以pull的chinese版本),而hugging face上则有大量多语种训练的模型,如果能直接使用huggin…

隧道代理是什么?怎么运作的?

隧道代理作为网络代理的一种形式,已经在现代互联网世界中扮演着重要的角色。无论是保护隐私、访问受限网站还是实现网络流量的安全传输,隧道代理都发挥着重要作用。在本文中,我们将深入探讨隧道代理的概念、运作方式以及在不同场景中的应用。…

如何秒杀系统架构设计

原文路径:https://learn.lianglianglee.com/%e4%b8%93%e6%a0%8f/%e5%a6%82%e4%bd%95%e8%ae%be%e8%ae%a1%e4%b8%80%e4%b8%aa%e7%a7%92%e6%9d%80%e7%b3%bb%e7%bb%9f/00%20%e5%bc%80%e7%af%87%e8%af%8d%20%e7%a7%92%e6%9d%80%e7%b3%bb%e7%bb%9f%e6%9e%b6%e6%9e%84%e8%ae%be%e8%ae%…

国际现货黄金的交易方式:二次入场机会识别

近期受地缘局势以及通胀因素的影响,国际现货黄金投资又重新受到市场的青睐。虽然近期金价出现大跌,但投资者反而认为这是低价买金的好机会。为了方便投资者做出决策,下面我们就介绍一些国际现货黄金的交易方式——二次入场点进场。 在国际现货…

Java中序列化与反序列化(五)——static字段

static字段 1、概述2、静态字段的特性2.1、与类相关联2.2、唯一副本2.3、通过类名访问2.4、生命周期 3、静态字段不被序列化4、一个疑问4.1、作用4.2、使用4.2、为什么serialVersionUID是静态的4.2、为什么serialVersionUID会被“序列化” 5、总结 大家好,我是欧阳方…