人形机器人,自动驾驶“老炮”创业第二站

造一台人形机器人,或许正在成为2025年最炙手可热的事情。

从去年第四季度开始,伴随着大模型应用的深入,具身智能概念被点燃,其中最鲜明的一个特点是,大量自动驾驶大佬的转行加入。

随便说几个比较有分量的,智驾芯片上市公司地平线创始成员、副总裁、前软件平台产品线总裁余轶南(博士)联手理想汽车前智能驾驶产品总监赵哲伦成立具身智能领域初创公司维他动力;

百度集团资深副总裁、CEO助理、原百度智能驾驶事业群组(IDG)负责人李震宇加盟具身智能赛道初创公司它石智航;

前小米其次自动驾驶产品技术负责人和量产负责人刘方成立具身智能概念公司阿米奥机器人……

左手造车,右手造人,自动驾驶“老炮”们的创业没有止境。

01车企也来分羹

事实上,除了上文提到了几位近期涉足具身智能行业的前自动驾驶从业者之外,还有不少自动驾驶行业重量级大佬在很早之前就已经入局。

原文远知行COO张力2023年6月离职后不到半年即加入人形机器人公司逐际动力,担任联合创始人兼COO,全面负责公司在全球范围内的战略规划、渠道拓展、项目实施、市场营销以及政府关系事务。

曾在Waymo和Momenta担任重要技术职位的高继扬2023年5月创立了具身智能公司星海图(StarSeer AI),并担任CEO。公司成立后不就即获得了由IDG资本、BV百度风投等在内的顶级投资机构千万级美元的投资。

2023年4月,曾在小鹏汽车和OPPO担任首席科学家的郭彦东创立智平方(Shenzhen AI Square)科技有限公司,担任创始人兼首席执行官,如今公司自研的多模态大模型——AI2R Brain,能够驱动Alpha Bot机器人在多样化的场景中实现高精度感知与自然交互。

此外,还有其他一些转行到具身智能赛道的自动驾驶精英。

孙兆治:珞博智能高管,曾任小鹏机器人产品设计负责人,滴滴出行的造车项目中担任产品负责人。

王凡:原纵目科技CTO,后加入北斗智联科技有限公司,出任CTO。

王荣兴:Momenta负责产品工程研发的副总裁,离职后进行大模型创业,2023年6月创立万仞AI。

陈俊波:菜鸟网络“E.T.物流实验室”无人车算法负责人,离开阿里之后,与前阿里机器人CEO谷祖林等人共同创办了“有鹿机器人”,进军户外清洁机器人领域。

肖军:前京东集团副总裁、京东物流X事业部总裁,选择了仓储机器人领域进行创业,创办天下先智创机器人,并获得了来自零一创投、经纬创投、红点中国的2亿元投资。‍

一个有意思的现象,自动驾驶“老炮”们转入具身智能赛道扎堆创业,车企们也不甘落后,也集体布局具身智能。

去年12月26日,广汽集团发布自主研发的第三代具身智能人形机器人——GoMate是车企布局具身智能赛道的最新动态。

GoMate是一款全尺寸的轮足人形机器人,全身拥有38个自由度。广汽集团机器人研发团队负责人张爱民博士表示,广汽集团计划2025年实现自研零部件批量生产,并率先在广汽传祺、埃安等主机厂车间生产线和产业园区开展整机示范应用;2026年实现整机小批量生产,并逐步扩展至大规模量产。

稍早前的2024理想AI Talk中,理想汽车CEO李想回应是否会做人形机器人时表示,概率上肯定是100%,李想还强调,理想是一家人工智能企业,要做的不是汽车的智能化,而是人工智能的汽车化,并将推动人工智能普惠到每一个家庭。

11月6日的小鹏汽车“AI科技日”上,小鹏汽车也亮相了全新一代人形机器人“Iron艾伦”,该款人形机器人已经进入小鹏汽车广州工厂进行了小鹏P7+车型的生产实训,未来将会聚焦在工厂和线下门店等场景。

除了亲自下场之外,还有车企通过联合合作伙伴或者投资的形式来布局具身智能。

奇瑞汽车就联手AI公司Aimoga共同研发了人形机器人Mornine,进军人形机器人赛道;上汽创投则参与了人形机器人本体企业智元机器人的A3轮战略融资,上汽集团以投资机器人企业的形式切入人形机器人领域。

02相同的技术内核

造车和造人两条赛道之所以能够随意融合,很大程度还是源于技术的同源,即都是基于对环境的感知和交互,对外界信息进行计算后,指导机器进行运动的过程,从本质来看,两者都需要具有智慧的大脑,只是外在表现的物理形体的不同。

原特斯拉自动驾驶部门的负责人Andrej Karpathy近期接受访谈时也表示:汽车也是机器人,在从汽车到人形机器人Optimus的技术转移中,工作量其实不大,而且工具都是现成的,只是从汽车转移到机器人上,系统被重新配置,但本质上还是相同的。

虽然技术同源,然而在实际应用层面,自动驾驶和具身智能还是要面对不同类型、不同等级的数据处理需求和计算能力。

从计算规模来看,自动驾驶的高速场景较多,并且和安全关系紧密,所以需要较高算力的芯片支持实时计算;而智能机器人,在现阶段通常在相对低速环境中工作,相应的计算需求会降低。

地平线联合创始人&CTO黄畅曾对自动驾驶领域行业的基础算力进行过说明,L2级需10 TOPS左右;L2+则需要几十TOPS;L3需要100 TOPS以上;L4需要1000 TOPS,要充分满足L4级要求,甚至需要几千个TOPS。

然而对机器人大模型来说,以能够推理7B大模型的单张NVIDIA A100举例,其TOPS峰值达1248,因而,建立云边端协同的数字算力环境,对保障各类机器人的感知、计算和处理能力至关重要。

在运动控制的维度上,自动驾驶只需要控制2D维度的运动,而人形机器人仅手部的抓取这一项,就需要模仿生物体多达20个以上的关节运动,这对计算和控制提出了更高的挑战。

此外,自动驾驶面对的数据相对“标准化“,大多是车道线、信号灯等在一定规则内运行的内容,机器人不同,它们工作的场景复杂多变,这就导致数据种类也会相应变多且发散,这同样对计算能力提出了一定的要求。

以当前已经有规模应用的酒店服务机器人为例,虽然工程师们通过强化机器人的地图构建能力,应用VSLAM技术进行机器识别并标定禁行线,强化避障算法和传感等方式,已经能够让机器人极可能的避免与行人发生冲突,并能更好、更灵敏地识别地面上障碍物。

现在,酒店场景下至少有三种环境的变化会对机器人的运行产生影响。

物理环境方面,因清洗地毯、会议设备设施、装饰品摆放等地面环境的改变,或造成机器人识别故障,使得机器人路径识别错误;

社会环境方面,在电梯中与人或其他发生优先乘坐电梯的纠纷;

数字环境方面,酒店组网方式让机器人在电梯或角落位置出现的通信失败等等。

马斯克曾表示,特斯拉现有的 FSD 技术,可以在未来和机器人模块进行一定程度的算法复用,但仍然只是在“底层模块”中进行,“更高阶的计算和场景还是需要针对机器人平台进行专项开发。”

李想也说,如果我们连L4级跟自动驾驶的汽车都解决不了,怎么去解决更复杂的?因为车是个无接触机器人,而且道路是标准化的,包括道路上的提示和参与者都是标准化的,而且每个人都受交通规则的 训练,我觉得这已经是最简单的机器人了,如果车没法实现,其实其他人工智能机器人,还是非常有限的。 

03把价格打下来

在具身智能的竞争中,商业化是创业者们面对的共同难题,特斯拉去年的股东大会上,马斯克首次谈到人形机器人初创公司,“原型很容易,批量生产很难,甚至不可能”,其中的原因不光在于软件算法和硬件传感器等,更在于生产和工程能力,说的直白一些,就是生产出来的产品有合适的价格,能够被用户所接受。

我们先来看软件算法。

从底层算法模型来看,具身智能的软件可以分为大脑和小脑。

大脑负责感知并模拟人类的思维决策过程,小脑则是模仿生物进行复杂的运动控制。

大脑算法中的环境感知和理解和自动驾驶一样,都主要基于机器视觉,发展已经比较成熟了,目前很多具身智能创业公司多依托科技大厂的多模态大模型赋能。

比如,Figure AI旗下Figure 02和1X Technologies旗下EVE、NEO均接入OpenAl端到端的大语言-视觉(VLM)模型;

乐聚机器人旗下“夸父”接入华为盘古具身智能大模型;

优必选旗下walker S接入百度文心一言大模型;

星动纪元旗下“小星”系列接入阿里通义千问和智谱清言两家大模型;

智元机器人多模态通用大模型用的是讯飞星火大模型(操作大模型自研)等。

这些大厂的大模型在基础能力上都有不错的表现,也各有自己擅长的长板,在这方面,创业公司们的起点大致相同,差异不大。

可是在运动控制的小脑算法方面,各家就显示出不同的技术路径。

最典型的案例,人形机器人的控制算法发展,已经经历了基于模型的控制算法(LIPM+ZMP)、动态模型控制和最优控制算法(MPC+WBC)、模拟学习+强化学习(IL+RL)等几个阶段。

目前的主流是MPC+WBC方案,但IL+RL路线被行业普遍认为是未来主流的控制方式,但由于该方案经过创业公司们的无数次尝试后,进入到技术瓶颈期,且在短期内难以突破,这也是诸多人形机器人本体公司推出轮式仿生机器人而不是双足人形机器人的主要原因。

硬件方面则主要包括芯片、传感器、执行运动控制操作的“手”“脚”等。

目前算力芯片在人形机器人身上的成本占比大概是几十分之一,地平线分拆出来的芯片及解决方案厂商地瓜机器人开发者生态负责人胡春旭在接受媒体采访时表示,在不同类型的机器人中,芯片成本占比差别不大,大约在7%~10%之间,一台人形机器人均价50万的情况下,芯片这一层的成本不超过1万元。不过,未来在人形机器人电机等部件成本下行的情况下,芯片部分成本占比预计有所增加。

相比之下,运动控制与执行部分的“手”就要贵很多。

由于手需要执行抓取、放置、推拉等动作,对操作精度的要求也很高,上肢操作的自由度自然就相应增加了。

有专业人士表示,人形机器人不算上“手”,全身自由度可能在27个左右,然而去年11月底,特斯拉展示的Optimus人形机器人能用手接住网球并放下,动作灵活,其采用的灵巧手自由度比前一代增加了11个,达到22个。

在行业对高自由度形成共识的大背景下,做灵巧的手相当于再造一个机器人,这也是“手”的价格居高不下的原因之一。

星动纪元联合创始人席悦曾介绍过自家产品,“手占人形机器人全身成本大概1/5到1/4”,其中的主要原因在于现在的触觉传感器还很贵,甚至比整只不带触觉传感器的“手”更贵,“一只手用到的触觉传感器可能要大几千元,一只手上的触觉传感器只有在占手的成本10%左右的时候才可能大规模应用”,有专业人士如是表示。

从上文的分析中不难看出,就像无人车一样,从最开始的几十、上百万一辆,到逐渐下降到20万左右的Robotaxi,甚至10万以下的无人配送车,自动驾驶的普及与渗透这才加快了速度。

对于具身智能创业企业们来说,如何将机器人的价格打下来,将是他们在未来竞争中能够占据主动的关键。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/958383.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《SwinIR:使用Swin-Transformer图像恢复》学习笔记

paper:2108.10257 GitHub:GitHub - JingyunLiang/SwinIR: SwinIR: 使用 Swin Transformer 进行图像修复 (官方仓库) 目录 摘要 1、Introduction 2、Related Work 2.1 图像修复 2.2 视觉Transformer…

力扣hot100-->滑动窗口、贪心

你好呀,欢迎来到 Dong雨 的技术小栈 🌱 在这里,我们一同探索代码的奥秘,感受技术的魅力 ✨。 👉 我的小世界:Dong雨 📌 分享我的学习旅程 🛠️ 提供贴心的实用工具 💡 记…

Top 30的AI应用产品出海经验分享

榜单说明 本文基于对AI图片产品的分类和流量分析,旨在洞察AI图片应用的出海趋势。以下是分类和收录标准: 分类标准 将AI图片产品分为三大类:图片生成、图片编辑和平面设计。 图片生成:以基于大模型生成图片并展示结果&#xff0…

Hive之加载csv格式数据到hive

场景: 今天接了一个需求,将测试环境的hive数据导入到正式环境中。但是不需要整个流程的迁移,只需要迁移ads表 解决方案: 拿到这个需求首先想到两个方案: 1、将数据通过insert into语句导出,然后运行脚本 …

73,【5】BUUCTF WEB [网鼎杯 2020 玄武组]SSRFMe(未解出)

进入靶场 又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码又是代码 <?php // 检查 URL 是否为内部 IP 地址 function check_inner_ip($url) {// 使用正则表达式检查 URL 格式是否以 http、https、gopher 或 d…

如何实现各种类型的进度条

文章目录 1 概念介绍2 使用方法3 示例代码 我们在上一章回中介绍了浮动按钮相关的内容&#xff0c;,本章回中将介绍进度条相关的Widget,闲话休提&#xff0c;让我们一起Talk Flutter吧。 1 概念介绍 进度条是常用的组件之一&#xff0c;它主要用来显示某种动作的完成进度。Flu…

复位信号的同步与释放(同步复位、异步复位、异步复位同步释放)

文章目录 背景前言一、复位信号的同步与释放1.1 同步复位1.1.1 综述1.1.2 优缺点 1.2 recovery time和removal time1.3 异步复位1.3.1 综述1.3.2 优缺点 1.4 同步复位 与 异步复位1.5 异步复位、同步释放1.5.1 总述1.5.2 机理1.5.3 复位网络 二、思考与补充2.1 复…

欢迎来到linux大陆!本次试炼地点——秩序“权限”圣殿

一篇关于权限的学习笔记~ 1、权限的概念2、权限管理2.1 角色的不同分类2.2 文件权限原理剖析2.2.1 熟悉指令2.2.2 普通用户只能更改自己的文件权限&#xff0c;但是sudo提权可以更改其他文件权限2.2.3 没有权限&#xff0c;系统拒绝访问2.2.4 权限匹配2.2.5 root用户不受任何限…

Spring 定时任务:@Scheduled 注解四大参数解析

本文主要介绍了在 Spring 框架中使用Scheduled注解实现定时任务的方法&#xff0c;重点讲解了fixedRate、fixedDelay、cron和initialDelay这四个参数的用法&#xff0c;并通过实例代码进行了详细说明。 1. fixedRate 参数 参数含义 fixedRate指定任务固定时间间隔执行。如设…

使用频谱仪:测量宽带信号的功率

marker默认只测一个频率点的功率&#xff0c;当测试宽带信号&#xff0c;如20MHz&#xff0c;不能直接使用marker来测量功率。 有2种方式&#xff1a; 宽带信号需要使用Measure-> channel power 来测量。 meas setup integ BW&#xff1a;500mhz Freq&#xff1a;中心频…

postman请求参数化

postman界面介绍 一、使用环境变量(Environment Variables)进行参数化 1、在请求中使用环境变量 在请求的url、请求头(Headers)、请求体(Body)等部分都可以使用环境变量。 URL 部分示例 点击 Postman 界面右上角的 “眼睛” 图标(Environment Quick Look)打开环境管理…

优选算法——哈希表

目录 1. 哈希表简介 2. 两数之和 3. 判定是否为字符重排 4. 存在重复元素 5. 字母异位词分组 1. 哈希表简介 2. 两数之和 题目链接&#xff1a;1. 两数之和 - 力扣&#xff08;LeetCode&#xff09; 题目展示&#xff1a; 题目分析&#xff1a; 大家来看上面的图&…

【C语言学习】:C语言补充:转义字符,<<,>>操作符,IDE

&#x1f381;个人主页&#xff1a;我们的五年https://blog.csdn.net/djdjiejsn?typeblog &#x1f50d;系列专栏&#xff1a;C课程学习https://blog.csdn.net/djdjiejsn/category_12617142.html &#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐文章 C语言学…

Cesium特效——城市白模的科技动效的各种效果

最终效果图如下&#xff1a; 实现方法&#xff1a; 步骤一&#xff1a;使用cesiumlib生产白模&#xff0c;格式为3dtiles 注意事项&#xff1a;采用其他方式可能导致白模贴地&#xff0c;从而导致不能实现该效果&#xff0c;例如把步骤二的服务地址改为Cesium Sandcastle 里的…

仿 RabbitMQ 的消息队列3(实战项目)

七. 消息存储设计 上一篇博客已经将消息统计文件的读写代码实现了&#xff0c;下一步我们将实现创建队列文件和目录。 实现创建队列文件和目录 初始化 0\t0 这样的初始值. //创建队列对应的文件和目录&#xff1a;public void createQueueFile(String queueName) throws IO…

无人机 PX4 飞控 | PX4源码添加自定义参数方法并用QGC显示与调整

无人机 PX4 飞控 | PX4源码添加自定义参数方法并用QGC显示与调整 0 前言 之前文章添加了一个自定义的模块&#xff0c;本篇文章在之前的自定义模块中&#xff0c;添加两个自定义参数 使用QGC显示出来&#xff0c;并通过QGC调整参数值&#xff0c;代码实现参数更新 新增的参…

【真机调试】前端开发:移动端特殊手机型号有问题,如何在电脑上进行调试?

目录 前言一、怎么设置成开发者模式&#xff1f;二、真机调试基本步骤&#xff1f; &#x1f680;写在最后 前言 edge浏览器 edge://inspect/#devices 谷歌浏览器&#xff08;开tizi&#xff09; chrome://inspect 一、怎么设置成开发者模式&#xff1f; Android 设备 打开设…

2024年第十五届蓝桥杯青少组国赛(c++)真题—快速分解质因数

快速分解质因数 完整题目和在线测评可点击下方链接前往&#xff1a; 快速分解质因数_C_少儿编程题库学习中心-嗨信奥https://www.hixinao.com/tiku/cpp/show-3781.htmlhttps://www.hixinao.com/tiku/cpp/show-3781.html 若如其他赛事真题可自行前往题库中心查找&#xff0c;题…

Linux系统下速通stm32的clion开发环境配置

陆陆续续搞这个已经很久了。 因为自己新电脑是linux系统无法使用keil&#xff0c;一开始想使用vscode里的eide但感觉不太好用&#xff1b;后面想直接使用cudeide但又不想妥协&#xff0c;想趁着这个机会把linux上的其他单片机开发配置也搞明白&#xff1b;而且非常想搞懂cmake…

【FFmpeg】FLV 格式分析 ③ ( Tag Body 数据块体结构 - Vedio Data 视频数据 )

文章目录 一、Tag Body 数据块体结构 - Video Data 视频数据1、Vedio Data 视频数据 类型标识2、Vedio Data 视频数据 结构分析3、Composition Time Offset 字段涉及的时间计算4、AVC Packet Type 字段说明① AVC Sequence Header 类型② AVC NALU 类型③ AVC End of Sequence …