WAIC | 上海人形机器人创新中心 | 最新演讲 | 详细整理

前言

笔者看了7月4号的人形机器人与具身智能发展论坛的直播,并在7月5日到了上海WAIC展会现场参观。这次大会的举办很有意义,听并看了各家的最新成果,拍了很多照片视频,部分演讲也录屏了在重复观看学习

稍后会相继整理创立穹彻智能的上交卢策吾老师、创立银河通用的北大王鹤老师、宇树CEO王兴兴、哥伦比亚博士生胡宇航、卡内基梅隆智能控制实验室的博士生孙逸凡在此次论坛上的最新公开演讲。并会分享这次WAIC展会上的一些新鲜见闻。欢迎持续关注我的专栏

如果想直接观看演讲原视频,也可以联系我发送,但是我边看边录的,可能会有点模糊。这篇整理学习笔记图也截于此,若模糊望见谅


演讲纪要

1. 演讲思路清晰、技术路线介绍详细易懂

2. 从本体平台、具身智能、数据集、训练场进行介绍

3. 今年的青龙以旋转执行器作为主驱动单元,明年会发布用直线执行器的"snack"人形机器人。每年发布一款公版机,以生肖为版本号

4. 代号是"青龙"人形机器人平台,"朱雀"具身大脑,"玄武"具身小脑、"白虎"数据集、"麒麟"训练场

5. 值得一提的是,通过在强化学习行走的过程中,引入传统控制的思想,使迁移成功率达到100%

6. 2024年,会在上海打造100个人形训练场。2027年,在各个城市、各个场景打造1000个训练场,构建1PB数据集(每周生产5TB+)

上海人形创新中心

2024年5月,上海的国家级人形机器人创新中心揭牌。

上海打造人形机器人底座,关键词——开源。软硬件全开源。开源网站

之前的关键技术,包括GitHub、ROS、Hugging Face都是国外学者组织的开源社区,而中国想打造人形机器人的开源社区

机器人参数、开发时间:

类似ROS每年发布一版,中国的人形机器人也会每年发布一个公版机,以十二生肖为版本序号,体现中国特色:

演讲顺序:

本体平台

100人+,150天+,生态企业50+

本体包括:行走与驱动系统、操纵与作业系统、感知与控制系统

总体硬件

总体设计:

构型设计:

行走与驱动系统

电池电源方面,人形机器人与常规设备不同,存在循环交变、稳态爆发、反电动势巨大的特点。青龙人形搭载了具有能量回收系统和输出稳压管理的电源系统,以支持整机3-4h强功耗续航:

关节模组:

操纵与作业系统

系统设计:

感知与控制系统

具身智能

感知、规划、决策、控制。包括“朱雀”具身大脑、“玄武”具身小脑

  • 朱雀大脑:以多模态大模型为核心的机器人指挥调度中心。以文字、图像为输入,输出语音交互、任务决策信息
  • 玄武小脑:具体任务执行模型,包括轨迹规划模块和运动控制器。
    • 轨迹规划器:由端到端的模仿学习驱动的,视觉作为输入,以人类作业作为模仿对象,输出期望路径
    • 运动控制器:以环境信息、机器人状态信息输入,输出关节扭矩,完成控制目标。有两条技术路线。其一是基于强化学习的智能运动控制方法,其二是基于全身动力学模型的预测控制方法
  • 遥操作:在朱雀大脑和轨迹规划系统发育尚不完全的情况下,还会利用遥操作系统作为输入,控制机器人完成任务。也可用来收集数据,去发育朱雀大脑和轨迹规划系统

具身大脑

现场演示demo:
——人:你看桌面有什么?
——机器人:桌面有2个面包、3个水果
——人:桌面有点乱,你能帮我清理一下么?
——机器人:好的,正在为您整理桌面。我将把面包和水果分类摆放(它先将面包都放到桌面右边,水果放到桌面左边,再分别抓到篮子中)

具身小脑

三条路径:传统的控制理论(可解释性强)、模仿学习(训练难度低)、强化学习(智能体有较强的鲁棒性)。结合这三条路径有点,打造小脑模型

首先收集大量人体数据,包括人体运动协调数据和人类作业数据,以此为基础,打造行为策略和行为标准。然后,利用控制理论、强化学习两条路径,打造运动控制器。三条路径相互支撑。三个月内完成算法开发、部署、迭代

数据

创新中心采用2类数据采集方式:

  • 全身运动捕捉系统:对高精度手部数据、全身数据进行采集。可以训练机器人完成走跑跳、抓拿放等多种技能
  • 视觉捕捉系统:针对灵巧专用、精细作业,通过视觉捕捉系统完成毫米级的手部动作采集

通过采集丰富数据训练大小脑:

打通人形机器人数据采集、评估清洗、训练一体的全流程体系。提供解决方案、行业可参考的设计理念:

提供标准数据采集工具和基于数字孪生系统完成的评估/二次标注方法:

3年内100台采集设备,完成1PB数据集采集:

提供预训练模型、微调和测评服务,帮助各个企业加速发展:

人形机器人数据是目前整个行业最大的痛点,只由创新中心来做这件事很艰巨,希望通过生态、联盟单位,一起加速开源数据集的建立

训练场

人形机器人一个难点是获得高质量数据难、场景应用难

训练场:搭建场景模拟产线、工艺流水线的规模化数据,检测评估基地。其实也就是数据生产、收集基地

特斯拉训练场。谷歌RT1的开源数据集,在17个月中只收集到13w条高质量数据

训练场难度分级:

是

 训练场架构:

算-学:用模仿学习、强化学习,做单臂、双臂、全身运动的训练;用:工业产线、服务。模拟应用

训练数据产生步骤:

分为3个阶段

  • 第1阶段:基于aloha,打造单臂单技能学习、作业对象与环境的泛化能力
  • 第2阶段:基于前面的6自由度协作臂,将这套技术路线迁移到青龙人形机器人的上肢上,做多技能的学习和训练,实现多技能的模仿学习
  • 第3阶段:未来会做大规模人类视频,产生低成本、规模化数据集的工作

训练场构建方式:

  • 搭建数据管理的平台系统,打造操作端、机器端云网服务器。
  • 建设实时标定系统、控制系统、数据采集系统、数据反馈系统
  • 通过数字孪生,生成合成式数据
  • 通过异构人形机器人,打造真实、生成式数据

2024年,会在上海打造100家人形机器人训练场。2027年,在各个城市、各个场景打造1000个训练场:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/779998.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[c++] 可变参数模版

前言 可变参数模板是C11及之后才开始使用,学校的老古董编译器不一定能用 相信大家在刚入门c/c时都接触过printf函数 int printf ( const char * format, ... ); printf用于将数据格式化输出到屏幕上,它的参数非常有意思,可以支持任意数量,任意类型的多参数.而如果我们想实现类…

【Java探索之旅】继承概念_语法_父类的成员访问

文章目录 📑前言一、继承1.1 继承的概念1.2 继承语法1.3 继承发生后 二、父类的访问2.1 父类成员变量访问2.2 父类成员方法访问 🌤️全篇总结 📑前言 在面向对象编程中,继承是一种重要的概念,它允许我们创建一个类&…

[go-zero] 简单微服务调用

文章目录 1.注意事项2.服务划分及创建2.1 用户微服务2.2 订单微服务 3.启动服务3.1 etcd 服务启动3.2 微服务启动3.3 测试访问 1.注意事项 go-zero微服务的注册中心默认使用的是Etcd。 本小节将以一个订单服务调用用户服务来简单演示一下,其实订单服务是api服务&a…

VSCode设置好看清晰的字体!中文用鸿蒙,英文用Jetbrains Mono

一、中文字体——HarmonyOS Sans SC 1、下载字体 官网地址:https://developer.huawei.com/consumer/cn/design/resource/ 直接下载:https://communityfile-drcn.op.dbankcloud.cn/FileServer/getFile/cmtyPub/011/111/111/0000000000011111111.20230517…

昇思25天学习打卡营第18天 | K近邻算法实现红酒聚类

1、实验目的 了解KNN的基本概念;了解如何使用MindSpore进行KNN实验。 2、K近邻算法原理介绍 K近邻算法(K-Nearest-Neighbor, KNN)是一种用于分类和回归的非参数统计方法,最初由 Cover和Hart于1968年提出(Cover等人,1967)&#…

Golang | Leetcode Golang题解之第220题存在重复元素III

题目: 题解: func getID(x, w int) int {if x > 0 {return x / w}return (x1)/w - 1 }func containsNearbyAlmostDuplicate(nums []int, k, t int) bool {mp : map[int]int{}for i, x : range nums {id : getID(x, t1)if _, has : mp[id]; has {retu…

ctfshow web sql注入 web242--web249

web242 into outfile 的使用 SELECT ... INTO OUTFILE file_name[CHARACTER SET charset_name][export_options]export_options:[{FIELDS | COLUMNS}[TERMINATED BY string]//分隔符[[OPTIONALLY] ENCLOSED BY char][ESCAPED BY char]][LINES[STARTING BY string][TERMINATED…

【三级等保】等保整体建设方案(Word原件)

建设要点目录: 1、系统定级与安全域 2、实施方案设计 3、安全防护体系建设规划 软件全文档,全方案获取方式:本文末个人名片直接获取。

数据结构——二叉树相关题目

1.寻找二叉树中数值为x的节点 //寻找二叉树中数值为x的节点 BTNode* TreeFind(BTNode* root, BTDataType x)//传过来二叉树的地址和根的地址,以及需要查找的数据 {if (root Null){return Null;}//首先需要先判断这个树是否为空,如果为空直接返回空if (…

基于python的数据分解-趋势-季节性-波动变化

系列文章目录 前言 时间序列数据的分解,一般分为趋势项,季节变化项和随机波动项。可以基于加法或者乘法模型。季节变化呈现出周期变化,因此也叫季节效应(周期)。 一、数据分解步骤 (1)估计时间序列的长期…

拓扑排序,PageRank(markov),实对称矩阵等

拓扑排序 多件事情有先后顺序,如何判断哪个先哪个后 拓扑排序算法: 1.读入图时,需要记录每个顶点的入度,以及相邻的所有顶点 2.将入度为0的顶点入队(先进先出) 3.取出队首元素a,&#xf…

rocketmq-console可视化界面功能说明

rocketmq-console可视化界面功能说明 登录界面OPS(运维)Dashboard(驾驶舱)Cluster(集群)Topic(主题)Consumer(消费者)Producer(生产者)Message(消息)MessageTrace(消息轨迹) rocketmq-console是rocketmq的一款可视化工具,提供了mq的使用详情等功能。 本章针对于rock…

基于springboot+vue+uniapp的高校宿舍信息管理系统小程序

开发语言:Java框架:springbootuniappJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包&#…

springboot + mybatis 多数据源切换

参考的b站博主写的 配置文件: spring:datasource:db1:jdbc-url: jdbc:mysql://localhost:3306/interview_database?useUnicodetrue&characterEncodingutf-8&useSSLfalseusername: rootpassword: 12345driver-class-name: com.mysql.cj.jdbc.Driverdb2:jdbc-url: jdbc…

rancher管理多个集群

一、rancher部署 单独部署到一台机器上,及独立于k8s集群之外: 删除所有yum源,重新建yum源: # 建centos7.9的yum源 # cat CentOS-Base.repo # CentOS-Base.repo # # The mirror system uses the connecting IP address of the …

花所Flower非小号排名20名下载花所Flower

1、Flower花所介绍 Flower花所是一家新兴的数字货币交易平台,致力于为全球用户提供安全、便捷的交易体验。平台以其强大的技术支持和丰富的交易产品闻名,为用户提供多样化的数字资产交易服务,涵盖了主流和新兴数字货币的交易需求。 2. Flowe…

wordpress企业网站模板免费下载

大气上档次的wordpress企业模板,可以直接免费下载,连注册都不需要,网盘就可以直接下载,是不是嘎嘎给力呢 演示 https://www.jianzhanpress.com/?p5857 下载 链接: https://pan.baidu.com/s/1et7uMYd6--NJEWx-srMG1Q 提取码:…

【Python】已解决:nltk.download(‘stopwords‘) 报错问题

文章目录 一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项 已解决:nltk.download(‘stopwords’) 报错问题 一、分析问题背景 在使用Python的自然语言处理库NLTK(Natural Language Toolkit)时&#xff0c…

《向量数据库指南》——Milvus Cloud检索器增强的深度探讨:句子窗口检索与元数据过滤

检索器增强的深度探讨:句子窗口检索与元数据过滤 在信息爆炸的时代,高效的检索系统成为了连接用户与海量数据的关键桥梁。为了进一步提升检索的准确性和用户满意度,检索器增强技术应运而生,其中句子窗口检索与元数据过滤作为两大…

每日一题~oj(贪心)

对于位置 i来说,如果 不选她,那她的贡献是 vali-1 *2,如果选他 ,那么她的贡献是 ai. 每一个数的贡献 是基于前一个数的贡献 来计算的。只要保证这个数的前一个数的贡献是最优的,那么以此类推下去,整体的val…