大模型+人形机器人,用AI唤起钢筋铁骨

3e161cedfa3dba0f9553226ce22b9b26.jpeg 《经济参考报》11月8日刊发文章《多方布局人形机器人赛道,智能应用前景广》。文章称,工信部日前印发的《人形机器人创新发展指导意见》,按照谋划三年、展望五年的时间安排,对人形机器人创新发展作了战略部署。

从开发基于人工智能大模型的人形机器人“大脑”,到打造仿人机械臂、灵巧手和腿足,再到发布自主研发的人形机器人产品.以“大模型”为代表的技术爆发加速了人工智能产业的发展。为了抓住这一轮技术变革的浪潮,促进区域以及产业发展,多个一线城市开启了“追逐赛”。以人工智产业发展高地北京为例,《北京市促进通用人工智能创新发展的若干措施(2023-2025年)》的发布是国内首个地方政府紧贴AI大模型产业化发展提出的专项措施。当下正值ChatGPT引发的“千模大战”打响,大模型可能为各行各业带来新的效率革命和体验升级。随着AI第一城北京行动了,上海、深圳、成都等地区都已陆续采取行动,抢占发展的“窗口期”。

人形机器人技术方案包括软件层和硬件层,后者可分为控制模 块、感知模块、运动模块、动力模块、散热总装模块。我们认为软件能力决定机器人产品 力的上限,硬件能力决定机器人的落地程度。目前 ChatGPT 预训练语言模型、PaLM-E 模型等 AI 技术和大模型的发展助力机器人向具身智能逼近,硬件技术方案实际类似搭积木 的过程,核心在于主机厂对成本和性能的权衡。

在今年特斯拉股东大会上,马斯克说到:“人形机器人Optimus对运动和力量的控制以及环境感知方面有显著加强,技术正在快速迭代。预计未来机器人的需求可能会达到100亿,甚至更多。如果以人类和机器人的比例为2:1推算,那么对人形机器人的需求可能会比电动汽车的还大不少。就凭借此寥寥数语,马斯克的信心、热情和投入很快点燃了人形机器人赛道的火焰,并有愈演愈烈的趋势至今。而从实际应用的角度来看,推动整个产业链走向成熟和完善的可能也是特斯拉。

从实际技术的角度来说,特斯拉这种企业做机器人有先天性优势,因为机器人与AI的很多基本原理都是相同的,而且也可以视为电动车的自然延伸,电动车可以视为第一代的四轮机器人。前两年马斯克提出要做机器人时引来不少说他“不务正业”的嘲讽,然而今年年初,理想汽车确定的愿景是成为最优秀的AI和机器人公司,而非全球最大的电动车企业。由此可见梦想也是会传播的。特斯拉的人形机器人Optimus首次亮相是在去年官方的2022 AI Day活动上,并在现场完成了自主行走、转身、停止、挥手问候等动作。Optimus的技术大部分与特斯拉汽车的一致,如机器视觉,以及处理视觉数据、做出行动决策、支持通信交流的“大脑”,还有最重要的与特斯拉汽车一致的芯片,还搭载与特斯拉车辆同源的FSD电脑以及Autopilot相关神经网络技术,预计最终售价不超2万美元,约合14.4万元人民币。

机器人自由度与量产成本为正相关关系,商业化进展较快机器人的共性在于,面向垂直化 场景且匹配了相应的自由度,成本适中能为市场接受。如 EVE 机器人专门用于安防和夜 间巡逻,其腿部为双轮结构,虽无法跨越障碍,但可满足夜间巡逻的基本需求,售价仅 32 万元。而特斯拉 Optimus 则依托汽车产业链优势平衡了机器人自由度与量产成本的矛盾, 能完成行走、上下落体、拿物体等商业化目标明确的动作,而量产后价格仅 2 万美元(目 标),是能完成行走、搬运物体同类机器人产品价格的 1/10。

人形机器人商业化的核心桎梏在于成本,而特斯拉的 FSD 产业 资源优势大概率会为 Optimus 商业化赋能:人形机器人与 FSD 在数据调度、数据处理、 算法模型等关键能力上具有较高共用性,如 Optimus 的硬件生产可共享特斯拉汽车的供应 链;Optimus 软件架构中可应用 FSD 的感知算法、规划控制模型(机器人的规控场景更复 杂),同时机器人涉及室内环境建模,可借鉴 FSD 的 3D 地图构建经验,综上我们认为 FSD 可迁移的成熟的软硬件能力或加速人形机器人商业化落地,具体表现为以下3点:

(1)车端算法迁移:Optimus 搭载特斯拉自研芯片(单芯片算力可达 362TFLOPs),也共享特斯拉汽车自动驾驶软件平台,我们看好特斯拉自身的自动驾驶技术赋能机器人的机器视觉算法、FSD 和 Dojo的数据积累和训练模型加快机器人功能优化,从而实现降本增效。具体而言,算法上,2022 年 AP 团队在原感知算法模型加入了占用网络 Occupancy Network 和矢量地图 Lane Network,进一步提升了感知模型的精度和对 Corner Case 的 覆盖度,Optimus 将会使用和 FSD 同样的 Occupancy Network 来识别可行动区域,或能 生成效果更好的 3D 地图,以弥补特斯拉未使用高精地图和雷达在长尾问题的感知不足。基础设施上,Dojo 超算中心为 FSD 大数据训练的关键,具有高稳定、高并行算力的特征,可提供更高效的数据标注和算法迭代,有望加强机器人的算法优势。

(2)供应链迁移:人形机器人由于硬件超配且关节数目多,量产成本较高,但机器人供 应链与电车供应链有较大重合度,如人形机器人能共用汽车的芯片、电池等,并能够对电 机电器、热管理等做适应性更改再使用。

我们看好 Optimus 与 FSD 供应链接轨、共享特斯拉国产供应链优势,实现规模化降低成本。站在当前时点,我们认为人形机器人已初步突破了软件领域的部分技术桎梏。

22 年 11 月 Open AI 发布 ChatGPT,并计划赋能机器人的零次任务规划、人机交互、视觉辅助、逻辑 判断功能,实现用语言文字控制机器人;23 年 3 月谷歌 PaLM-E 模型推出,融合了 ViT Vision Transformer 的 220 亿参数和 PaLM 的 5400 亿参数能力,集成了可控制机器人视 觉和语言的能力;23 年 5 月英伟达发布多模态具身智能系统 NVIDIA VIMA,标志 AI 能力 的又一显著进步,有望显著提升机器人的智能化水平、人机交互能力、自编译能力。

2023年或为产业化的当打之年:AI、大模型深度赋能机器人感知层和规划层,助力机器人更贴近具身智能。以微软 ChatGPT 预训练语言模型、谷歌 PaLM-E 模型、英伟达多模态具身智能系统 NVIDIA VIMA 为代表的 AI 技术突破,进一步助力机器人突破产品力上限。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/128087.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

原型制作神器ProtoPie的使用Unity与网页跨端交互

什么是ProtoPie? ProtoPie是一款面向设计师的软件原型设计工具,例如制作App界面交互展示,制作好的原型可以一键发布到Web服务器,就可以浏览器访问。由于其内置了大量常用交互类型,以及"程序化"模块&#xf…

【Mac开发环境搭建】Node.js安装(多版本切换)、Maven安装

文章目录 Node安装安装多个Node Maven安装下载配置环境变量修改配置文件settings.xml配置maven的本地仓库地址配置阿里云镜像仓库 IDEA使用 Node安装 https://nodejs.org/download/release/v16.20.1/ 如果对安装位置有要求,可以更改安装位置,不然直接点…

【开源分享】国内可用的免费安卓GPT语音助手 - 可音量键唤起,可联网

写在前面:这是一个我写的开源GPT语音助手,不收钱,只求Star! 简要介绍 这是一个基于ChatGPT的安卓端语音助手,允许用户通过手机音量键从任意界面唤起并直接进行语音交流,用最快捷的方式询问并获取回复 使用效果 一、基…

【干货】132道最新K8S面试题汇总~

k8s全称kubernetes,这个名字大家应该都不陌生,k8s是为容器服务而生的一个可移植容器的编排管理工具,越来越多的公司正在拥抱k8s,并且当前k8s已经主导了云业务流程,推动了微服务架构等热门技术的普及和落地,…

ChatGPT:如何安装使用插件?超详细的教程!

1.最简单的方法 直接使用油猴,里边能搜索到的插件都可以用 2.官方插件使用 ChatGPT Plus引入插件后,功能暴强许多,比如可以联网、可以生成图表、可以分析视频、可以与PDF交谈等。但有不少小伙伴还不知道怎么安装使用ChatGPT插件,所…

Python比较2个json数据是否相等

大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 如果有什么疑惑/资料需要的可以点击文章末尾名片领取源码 1、json数据转换成字典 dict1 json.load(load_f1) dict2 json.load(load_f2)2、将两个字典按key排好序,然后使用zip()函数将两个字典对应的key打包成元组。 …

MySQL 批量修改表的列名为小写

1、获取脚本 SELECT concat( alter table , TABLE_NAME, change column , COLUMN_NAME, , lower( COLUMN_NAME ), , COLUMN_TYPE, comment \, COLUMN_COMMENT, \; ) AS 脚本 FROM information_schema.COLUMNS WHERE TABLE_SCHEMA 数据库名 and TABLE_NAME表名-- 大写是up…

win10 下 ros + Qt 工程CMakeLists.txt

win10 下 ros Qt 工程CMakeLists.txt 系统:win10 ros: melodic Qt: 5.12.12 源码目录: D:\workspace\catkin_qt 示例代码 https://github.com/ncnynl/ros-qt.git 由于示例代码是Qt4 ,目前我是用QT5,所以CMakeLists.txt 修改如下 CMakeLists.txt #####…

数据跨领域应用实例—车辆通行大数据应用场景(二)

2023年10月25日,国家数据局正式揭牌。标志着我国数据基础制度正在不断完善,数据资源使用水平稳步提升,数据要素市场将进入发展快车道。当前,数字经济已成为我国经济高质量发展的新动能,国家数据局的成立,在…

互联网是如何运作的?以前端角度出发(b站objtube的卢克儿听课笔记)

1、你是如何用你的计算机设备发送数据和接受数据的呢? 例如我们是如何访问到哔哩哔哩的数据的 当你的设备开始连接到互联网时,会被分配一个IP地址。 而哔哩哔哩的服务器也接入到互联网,它也将被分配一个IP地址。 我们常说你访问某个网站&a…

测试老鸟整理,Postman接口测试MD5+RSA加密自动登录(超全总结)

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 使用场景 大多数…

【MySQL】库操作和表操作

文章目录 一、库操作1. 创建数据库2. 数据库的编码问题查看系统默认支持的字符集查看数据库支持的字符集查看数据库支持的字符集校验规则校验规则对数据库的影响 3. 操纵数据库查看数据库显示创建语句修改数据库删除数据库 4. 数据库的备份和恢复数据库的备份数据库的恢复表的删…

外部访问K8S集群内部的kafka集群服务

不许转载 kafka 部署 把 kafka 部署到 k8s 后,我们肯定是通过 service 从 k8s 外部访问 kafaka。这里的 service 要么是 NodePort, 要么是 LoadBalancer 类型。我们使用的方式是 LoadBalancer。 我们先看下面这张图,这是 kafka 在集群中的网…

pytest一些常见的插件

Pytest拥有丰富的插件架构,超过800个以上的外部插件和活跃的社区,在PyPI项目中以“ pytest- *”为标识。 本篇将列举github标星超过两百的一些插件进行实战演示。 插件库地址:http://plugincompat.herokuapp.com/ 1、pytest-html&#xff…

数据集笔记:Telecom Shanghai Dataset

0 数据地址 📱Telecom Shanghai Dataset (kaggle.com) 1 数据描述 该数据集由上海电信提供,包含超过720万条记录,记录了9481部手机通过3233个基站访问互联网的情况,时间跨度为六个月。例如,下图显示了基站的分布情况…

Visual Components应用解决方案 衡祖仿真

Visual Components可为客户量身设计及规划自动化产线系统,作为全方位的数位规划工具,它能够从制程规划、生产到销售皆能够整合在单一平台,有助于内部的技术沟通及外部销售。此外利用Visual Components整合物流及机器人模拟功能,可…

【Python3】【力扣题】242. 有效的字母异位词

【力扣题】题目描述: 【Python3】代码: 1、解题思路:若字符串长度相同,依次遍历元素,比较两个字符串的该元素个数是否相同。【耗时长】 知识点:len(...):获取序列(字符串、列表等&…

新零售时代,传统便利店如何转型?

在零售批发业,如何降低各环节成本、提高业务运转效率、更科学地了解客户服务客户,是每家企业在激烈竞争中需要思考的课题。 对零售批发企业来说,这些问题或许由来已久: (1)如何对各岗位的员工进行科学的考…

若依框架前后端分离版,集成数据库版本控制flyway

在admin模块的pom.xml增加依赖 <!-- 数据库版本控制 --><dependency><groupId>org.flywaydb</groupId><artifactId>flyway-core</artifactId><version>7.15.0</version></dependency>在admin模块下的resources 的配置文…

微信机器人接口开发

E云 是一套完整的的第三方服务平台&#xff0c;包含微信API服务、企微API服务、SCRM系统定制、企微系统定制、服务类软件定制等模块&#xff0c;本文档主要讲述个微API服务相关&#xff0c;以下简称API&#xff0c;它能处理用户微信中的各种事件&#xff0c;提供了开发者与个微…