浅谈,华为切入具身智能赛道

近期,全球具身智能大模型(机器人“通用大脑”)赛道热闹非凡,科技大厂、初创公司接连发布重磅消息。

国外:

10月底,美国科技巨头【Meta】旗下基础人工智能研究 (FAIR)公布公司触摸感应领域的三大进展:通用触摸编码器;具有多模态感应功能的人造指尖,用于触觉交互;集成触觉感应的机械手平台;它们协同工作,使机器人能够感知事物。

图片

详细细节:

  • 触摸感应技术Sparsh:为AI提供了一种无需庞大数据库即可识别压力、纹理和运动等内容的方法;

  • 机器人指尖Digit 360 :将有关机器人正在触摸的内容的信息发送到AI模型,Digit 360 中的传感器非常敏感,因此AI不仅可以确定机器人所接触物体的细节,还可以施加适合涉及物体的任务的压力,例如提升或旋转物体;

  • Plexus 的系统:协同多个触摸传感器,Plexus可以模仿人类的触觉,足以处理易碎或笨拙的物体;

同谷歌、英伟达、Open AI等科技巨头一样,【Meta】也早已布局具身智能领域;2023年,Meta 与 CMU 联手打造「RoboAgent」(注:“RoboAgent”由来自Meta、CMU的研究人员用了2年的时间打造出的通用机器人智能体,突破了缺乏足够庞大的数据集来训练通用智能体和缺乏能够生成此类数据的通用智能体的困境。)

10月31日,拥有全球具身智能领域“最强创始团队”的机器人通用大模型初创公司【Physical Intelligence】(简称 PI或 π 发布成立以来首个机器人通用的机器人基础模型π0( pi-zero),被称为一种用于通用机器人控制的视觉-语言-动作流模型,参数量只有3B,就能控制机器人,帮你搞定各种家务;11月5日,公司宣布完成4亿美元新一轮融资,本轮投资由亚马逊创始人杰夫·贝索斯、风险投资公司Thrive Capital和Lux Capital领投,OpenAI、Redpoint Ventures和Bond等参投(注10月末,外媒报道,公司计划筹集3亿美元),投后估值约为24亿美元,取代另外一家机器人通用大模型初创公司【Skild AI】,成为具身智能大模型赛道初创企业估值最高且最快晋升独角兽企业。

PI和Skild AI两家初创公司有诸多相同点,创始团队、产品后续规划,可称为完全竞对;有关PI和Skild AI两家公司详细介绍,查看往期文章:估值约150亿!具身大模型初创公司最新成果:机器人通用基础模型“π0”

国内:

10月以来,国内多家以机器人通用大模型为卖点以及纯粹具身智能大模型初创企业接连完成大额融资(如:[星海图]完成超2亿元Pre-A轮融资以及[千寻智能]、[穹彻智能]、[自变量机器人]亿级融资,[星云智慧]、[灵初智能]千万级融资)。

10月,字节跳动ByteDance Research部门发布第二代机器人大模型GR-2(GR-2 的训练包括预训练和微调两个过程;在预训练阶段,GR-2 通过观看大量互联网视频学习人类的日常行为模式和世界环境,然后通过微调技术提升动作预测和视频生成能力)。

 

11月15日,华为(深圳)全球具身智能产业创新中心宣布正式运营(9月19日,在华为全联接大会2024在创新中心官宣启动),打造世界级具身智能产业创新中心;在同步举行的合作备忘录签署仪式上,乐聚机器人、兆威机电、深圳市大族机器人、墨影科技、拓斯达、自变量机器人、禾川人形机器人等16家企业共同与华为(深圳)全球具身智能产业创新中心企业完成签约,正式将国内具身智能领域推向高潮。

图片

目前国内TOP科技企业(华为、腾讯、阿里、百度、字节等)也以投资和大模型赋能形式入局具身智能赛道,接下来重点梳理华为入局具身智能赛道。

图片

华为多年前就有涉足机器人领域,2017年,华为就与爱丁堡大学、软银签订协议,围绕AI+机器人开展研发,随后陆续在控制系统、巡检机器人、机器人安全防护等相关领域注册专利;

涉足人形机器人领域,可追溯到2022年:

  • 2022年4月,与达闼机器人签署合作协议,联合开展机器人应用领域技术攻关、行业应用等创新合作,共同推进人工智能和云端机器人产业发展。

  • 2023年6月,华为全资成立了东莞极目机器有限公司,注册资本8.7亿元,但经营范围没有涉及人形机器人相关事项。

  • 23年9月,华为云首席产品官介绍华为云机器人平台:类似华为汽车发力方向是车机,并不直接自己下场做机器人,而是为企业提供华为云机器人平台,助力企业制造开发、集成以及使用机器人。

  • 2023年11月,乐聚机器人宣布,推出首款基于开源鸿蒙的KaihongOS人形机器人KUAVO(中文:夸父)

图片

  • 2024年3月15日,华为云与乐聚机器人签署合作协议,共同探索“华为盘古大模型 + 夸父人形机器人”应用场景,这是华为云合作的首个人形机器人企业。官方表示,华为云推出的盘古大模型具备强大的语义理解、动态规划、多模态信号理解等能力,将为人形机器人大模型的开发提供智能化决策基础。

  • 2024年4月,乐聚机器人在全网发布了一段人形机器人参与家庭劳动的视频,视频中,机器人走进家庭,通过强化自主学习能力,成功完成了洗衣、浇花、插花以及晾衣服等家务任务。

  • 2024年6月21日,华为开发者大会(HDC 2024)上,华为云CEO张平安宣布了华为盘古大模型5.0的正式发布;这一全新升级的AI大模型在全系列、多模态、强思维三个方面实现了重大突破,标志着华为在构建人工智能领域的另一极。

图片

大会现场,搭载华为盘古具身智能大模型的「乐聚」升级版人形机器人“夸父”惊艳亮相,通过盘古具身智能大模型使得“夸父”在智能化、泛化能力上得到了显著提升。

图片

目前,双方正基于华为云的算力和AI能力,赋能人形机器人大脑,同时基于乐聚本体设计和运动控制能力,对机器人小脑和肢体的研发工作展开持续攻关。双方的目标是开发出一系列高效的pipeline,打造出可复制且广泛适用的人形机器人产品及具身智能整体解决方案,并共同构建人形机器人的标准数据集、系统和工具链。

图片

华为常务董事、华为云CEO张平安在大会上表示,除了人形机器人,盘古具身智能大模型还可以赋能多种形态的工业机器人和服务机器人,让它们帮助人类去从事危险和繁重的工作,“正如大家所期望的,让AI机器人帮助我们去洗衣、做饭、扫地,让我们有更多的时间去看书,写诗,作画。”

随着大模型赋能,原有以实现商业化落得的机器人产品,如工业机器人,企业应该获利颇丰,在原有产品基础上,通过大模型赋能,开拓更多应用场景。

本次华为盘古具身智能大模型亮相,对于国内人形机器人市场冲击绝对不亚于当时芯片巨头「英伟达」于GTC大会上,针对人形机器人领域所推出的大模型(GROOT)+开发平台(Isaac Lab)+算力(Jetson Thor)组合套装对国外人形市场冲击,想必后续华为也会推出类似「英伟达」的组合套装。

图片

  • 2024年6月24日,设立首个跨省级创新中心平台一华为(西南)数字机器人创新中心(去年10月开始筹备),该中心自运行至今已在20多家标杆企业中,落地80多个场景化机器人。

图片

  • 2024年11月15日,华为(深圳)全球具身智能产业创新中心宣布正式运营;据介绍,创新中心将整合华为2012先进制造实验室、2012伦敦研究所等各部门具身智能相关能力,聚合华为具身智能产业核心资源,建设具身智能基础实验室;联合龙头企业建设联合创新实验室;依托华为软硬件、应用生态伙伴等,打造全球具身智能产品技术交易旗舰平台。

相较于国外科技大厂早早入局具身智能赛道(如谷歌、英伟达等;谷歌已完成多次技术迭代,从Saycan到RT-H),国内科技大厂目前也逐步切入具身智能赛道,多数以投资和大模型赋能形式入局具身智能赛道,以往企业内部基本都有机器人相关研究部门进行技术积累和产品预研,现如今没有快速扩大团队,大概率原因是如今人形机器人商业化不明朗,先让初创企业去尝试,看到真正可落地商业化情景再加大投入,快速扩张团队。目前来看,自家大模型参与具身智能赛道分量极轻,并没有针对人形机器人推出专门大模型,更多以投资形式入局。

目前,华为是国内科技大厂入局具身智能典范。

阿里巴巴:

切入具身智能赛道以投资为主,今年已投资人形机器人初创企业【逐际动力】、【源洛科技】、【有鹿机器人】、【星动纪元】和【星海图】。

2023年4月,在第六届数字中国建设峰会上,阿里巴巴董事会主席兼CEO张勇透露,阿里云工程师正在实验将千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,可远程指挥机器人工作。

阿里云当天发布的一个演示视频,展现了这一实验成果。

图片

正如阿里云工程师所说,“AI大模型突破了机器人的局限,让人类可以通过自然语言指挥机器完成负责任务,让机器人真有了大脑。”

  • 2023年,有鹿机器人联合阿里云通义千问共同发布了具身智能大模型LPLM-10B。LPLM模型将语言大模型和物理世界进行了创造性的融合,正好形成了完整的左右大脑功能,解决了传统具身模型延迟高、准确率低、泛化能力差等缺陷。

  • 2024年3月,阿里研究院副院长安筱鹏接受采访时表示:“人形机器人作为通用机器人的代表和具身智能的载体,将成为AI与物理世界的接口。进入AI大模型时代,多模态大模型赋能人形机器人,将带来全新的变革。”

  • 2024年6月,阿里通义千问还发布Qwen2大模型,并在Hugging Face和 ModelScope上同步开源,Qwen2系列涵盖5个尺寸的预训练和指令微调模型,这将进一步加快人形机器人的能力。

... ... ...

接下来,小编将详细盘点具身智能大模型领域,全球初创公司(PI、Skild AI、Covariant、有鹿机器人、X Square等)介绍及产品进展、全球科技巨头/大厂(谷歌、英伟达、微软、阿里、腾讯等)现阶段产品进展、人形机机器人本体厂家与科技巨头/大厂合作现状

... ... ...

本文内容仅展示一部分,更多详细解读,加入知识星球“机器人头条”,查看完整版文章[原创]具身智能大模型赛道:科技巨头技术进展、初创公司盘点,第一款“机器人通用大脑”花落谁家(文字5W+)并深度了解“具身智能&人形机器人”赛道

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/921023.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Spring |(二)IOC相关内容 | bean

文章目录 📚bean基础配置🐇bean的id和class🐇bean的name属性🐇bean作用范围scope配置🐇bean基础配置小结 📚bean实例化🐇构造方法实例化(常用)🐇静态工厂实例…

网络安全-企业环境渗透2-wordpress任意文件读FFmpeg任意文件读

一、 实验名称 企业环境渗透2 二、 实验目的 【实验描述】 操作机的操作系统是kali 进入系统后默认是命令行界面 输入startx命令即可打开图形界面。 所有需要用到的信息和工具都放在了/home/Hack 目录下。 本实验的任务是通过外网的两个主机通过代理渗透到内网的两个主机。…

Java 对象头、Mark Word、monitor与synchronized关联关系以及synchronized锁优化

1. 对象在内存中的布局分为三块区域: (1)对象头(Mark Word、元数据指针和数组长度) 对象头:在32位虚拟机中,1个机器码等于4字节,也就是32bit,在64位虚拟机中&#xff0…

Linux 进程概念与进程状态

目录 1. 冯诺依曼体系结构2. 操作系统(Operator System)2.1 概念2.2 设计OS的目的2.3 系统调用和库函数概念 3. 进程概念3.1 描述进程 - PCB3.2 task_struct3.3 查看进程3.4 通过系统调用获取进程标识符PID, PPID3.5 通过系统调用创建fork 4.…

计算机网络(14)ip地址超详解

先看图: 注意看第三列蓝色标注的点不会改变,A类地址第一个比特只会是0,B类是10,C类是110,D类是1110,E类是1111. IPv4地址根据其用途和网络规模的不同,分为五个主要类别(A、B、C、D、…

shell脚本启动springboot项目

nohup java -jar springboot.jar > springboot.log 2>&1 & 表示日志输出重定向到springboot.log日志文件, 而原本的日志继续输出到 项目同级的log文件夹下, 所以这个重定向没必要. 我们没必要要2分日志 #!/bin/bash# 获取springboot项目的进程ID PID$(ps -e…

51c大模型~合集76

我自己的原文哦~ https://blog.51cto.com/whaosoft/12617524 #诺奖得主哈萨比斯新作登Nature,AlphaQubit解码出更可靠量子计算机 谷歌「Alpha」家族又壮大了,这次瞄准了量子计算领域。 今天凌晨,新晋诺贝尔化学奖得主、DeepMind 创始人哈萨…

FileProvider高版本使用,跨进程传输文件

高版本的android对文件权限的管控抓的很严格,理论上两个应用之间的文件传递现在都应该是用FileProvider去实现,这篇博客来一起了解下它的实现原理。 首先我们要明确一点,FileProvider就是一个ContentProvider,所以需要在AndroidManifest.xml里面对它进行声明: <provideran…

【Java】二叉树:数据海洋中灯塔式结构探秘(上)

个人主页 &#x1f339;&#xff1a;喜欢做梦 二叉树中有一个树&#xff0c;我们可以猜到他和树有关&#xff0c;那我们先了解一下什么是树&#xff0c;在来了解一下二叉树 一&#x1f35d;、树型结构 1&#x1f368;.什么是树型结构&#xff1f; 树是一种非线性的数据结构&…

网口输出的加速度传感器

一、功能概述 1.1 设备简介 本模块为了对电机、风机、水泵等旋转设备进行预测性运维而开发&#xff0c;只需一个模块&#xff0c; 就可以采集旋转设备的 3 路振动信号&#xff08;XYZ 轴&#xff09;和一路温度信号&#xff0c;防护等级 IP67 &#xff0c;能够 适应恶劣的工业…

力扣面试经典 150(上)

文章目录 数组/字符串1. 合并两个有序数组2. 移除元素3. 删除有序数组中的重复项4. 删除有序数组的重复项II5. 多数元素6. 轮转数组7. 买卖股票的最佳时机8. 买卖股票的最佳时机II9. 跳跃游戏10. 跳跃游戏II11. H 指数12. O(1)时间插入、删除和获取随机元素13. 除自身以外数组的…

浅谈 proxy

应用场景 Vue2采用的defineProperty去实现数据绑定&#xff0c;Vue3则改为Proxy&#xff0c;遇到了什么问题&#xff1f; - 在Vue2中不能检测数组和对象的变化 1. 无法检测 对象property 的添加或移除 var vm new Vue({data:{a:1} })// vm.a 是响应式的vm.b 2 // vm.b 是…

P4-1【应用数组进行程序设计】第一节——知识要点:一维数组

视频&#xff1a; P4-1【应用数组进行程序设计】第一节——知识要点&#xff1a;一维数组 项目四 应用数组进行程序设计 任务一&#xff1a;冒泡排序 知识要点&#xff1a;一维数组 目录 一、任务分析 二、必备知识与理论 三、任务实施 一、任务分析 用冒泡法对任意输入…

【数据库入门】关系型数据库入门及SQL语句的编写

1.数据库的类型&#xff1a; 数据库分为网状数据库&#xff0c;层次数据库&#xff0c;关系型数据库和非关系型数据库四种。 目前市场上比较主流的是&#xff1a;关系型数据库和非关系型数据库。 关系型数据库使用结构化查询语句&#xff08;SQL&#xff09;对关系型数据库进行…

day07(单片机高级)继电器模块绘制

目录 继电器模块绘制 原理图 布局 添加板框 布线 按tab修改线宽度 布线换层 泪滴 铺铜 铺铜的作用 铺铜的使用规范 添加丝印 步骤总结 继电器模块绘制 到淘宝找一个继电器模块 继电器模块的使用&#xff08;超详细&#xff09;_继电器模块工作原理-CSDN博客文章浏览阅读4.8w次&…

1+X应急响应(网络)病毒与木马的处置:

病毒与木马的处置&#xff1a; 病毒与木马的简介&#xff1a; 病毒和木马的排查与恢复&#xff1a;

【电路笔记 TMS320F28335DSP】时钟+看门狗+相关寄存器(功能模块使能、时钟频率配置、看门狗配置)

时钟源和主时钟&#xff08;SYSCLKOUT&#xff09; 外部晶振&#xff1a;通常使用外部晶振&#xff08;如 20 MHz&#xff09;作为主要时钟源。内部振荡器&#xff1a;还可以选择内部振荡器&#xff08;INTOSC1 和 INTOSC2&#xff09;&#xff0c;适合无需高精度外部时钟的应…

CCE-基础

背景&#xff1a; 虚拟化产生解决物理机资源浪费问题&#xff0c;云计算出现实现虚拟化资源调度和管理&#xff0c;容器出现继续压榨虚拟化技术产生的资源浪费&#xff0c;用命名空间隔离&#xff08;namespace&#xff09; 灰度升级&#xff08;升级中不影响业务&#xff09…

基于LLama_factory的Qwen2.5大模型的微调笔记

Qwen2.5大模型微调记录 LLama-facrotyQwen2.5 模型下载。huggingface 下载方式Modelscope 下载方式 数据集准备模型微调模型训练模型验证及推理模型导出 部署推理vllm 推理Sglang 推理 LLama-facroty 根据git上步骤安装即可&#xff0c;要求的软硬件都装上。 llama-factory运行…

提取图片高频信息

提取图片高频信息 示例-输入&#xff1a; 示例-输出&#xff1a; 代码实现&#xff1a; import cv2 import numpy as npdef edge_calc(image):src cv2.GaussianBlur(image, (3, 3), 0)ddepth cv2.CV_16Sgray cv2.cvtColor(src, cv2.COLOR_BGR2GRAY)grad_x cv2.Scharr(g…