科技云报道:造完“大模型”,“具身智能”将引领AI下一个浪潮?

科技云报道原创。

资深机器人专家Eric Jang不久前曾预言:“ChatGPT 曾在一夜之间出现。我认为,有智慧的机器人技术也将如此。”

3月13日深夜,一段人形机器人的视频开始热传。

在视频中,Figure的人形机器人,可以完全与人类流畅对话,理解人类的意图,同时还能理解人的自然语言指令进行抓取和放置,并解释自己为什么这么做。

而其背后,就是OpenAI为其配置的大型语言模型。由于OpenAI模型还支持多模态输入,因此可为Figure提供高级视觉和语言智能。

而Figure本身,成立于2022年。从OpenAI 宣布介入与之合作,到今天它们共同推出一个能够自主对话和决策的机器人,只有13天。

具身智能的发展,显然正在加速。
在这里插入图片描述
具身智能进化速度超越想象

在去年的ITF World 2023半导体大会上,英伟达创始人兼CEO黄仁勋表示,人工智能下一个浪潮将是“具身智能”(Embodied Intelligence),是能理解、推理、并与物理世界互动的智能系统,AI与机器人的融合,具有很好的想象空间。

他还介绍了英伟达的多模态具身智能系统Nvidia-VIMA,能在视觉文本提示的指导下,执行复杂任务、获取概念、理解边界、甚至模拟物理学,标志着AI能力的显著进步。

此外,在特斯拉召开2023年年度股东大会上,马斯克展示了人形机器人Optimus的全新型号,和具身智能机器人几乎划等。

马斯克表示,人形机器人将是今后特斯拉主要的长期价值来源,他也认为,以具身智能机器人为代表的产品有望成为AI的下一浪潮。

1950年,图灵在他的论文——《Computing Machinery and Intelligence》中首次提出了具身智能的概念。

具身智能(Embodied AI)指的是,有身体并支持物理交互的智能体,如智能服务机器人、自动驾驶汽车等,具身智能机器人指的是,像人一样能够与环境交互感知、自助规划、决策、行动、执行任务的机器人。

它包含人工智能领域几乎所有的技术,包括机器视觉、自然语言理解、认知和推理、机器人学、博弈伦理、机器学习等,横跨多个学科方向,是AI的集大成者。

2023年是生成式AI的爆发之年,也被业内人士称为“机器人觉醒之年”。ChatGPT等生成式AI与人形机器人行业结合,开启了具身智能的时代。

今天,在大语言模型的普及和GPT-4等前沿模型的推动下,我们似乎见证了人工智能领域的一个新时代,人机交流也变得前所未有的流畅和无缝。

据2023年5月GGII发布的报告预测,预计到2026年,人形机器人在全球服务机器人市场中的渗透率预计将达到3.5%,市场规模超过20亿美元。

各大科技公司和学术界的顶尖学者也不断涌入这一领域的研究与产品开发当中。

然而,在繁荣热潮的背后,潜在的困境却也如影随形。尽管ChatGPT等模式革命性地变革了AI领域,但它们在理解力、联想力和交互能力等方面,仍然未能完全满足公众的期望。

这促使我们对看似毫无阻碍的进步进行重新评估,同时希望经过不懈努力,人们能攻克实现真正的具身智能所面临的复杂挑战。

当机器人遇上大模型

近年来,国内多家企业发布了自主研发的人形机器人。人形机器人是所有机器人里最复杂的一类,“具身智能”对机器人来说意味着什么?当大模型和机器人相结合,会发生哪些变化?

在“具身智能”的状态下,机器人具备自主学习和计划能力,遇到障碍和困难可以自主反应、快速解决。

目前国内已有200多个大模型,实际上人形机器人是一个载体,当大模型和人形机器人相结合时,机器人可以帮助AI大模型感知物理世界,操作环境上下文;机器人利用多模态感知控制自己的身体,完成复杂的任务。

2023年上半年,以ChatGPT为代表的大语言模型爆炸式“出圈”,大语言模型以及结合视觉等多种传感器的复杂多模态模型的成熟,是实现机器人完成具身智能的关键先决条件。

最为关键的一点是,成熟的“AI大模型”使机器人可以从程序执行导向转向任务目标导向,向通用机器人的发展迈出坚实步伐。

通俗点来说,“大模型”与机器人的融合,让发展已久的机器人能真正地长出“脑子”。

机器人的“云大脑”通过在云、边、端分布式算法、算力和大数据形成机器人智能,通过 5G等无线安全高速网络连接云端大脑和机器人本体:机器人本体在“端”侧完成各种任务。

云端大脑通过人工增强、多模态融合AI和数字生成等先进技术,实现机器人智能地自我学习、不断进化与成长。

AI真正赋能到各行各业、智能机器人走进千家万户的时代正在到来,伴随着技术的突破带来性价比提高,在未来,具身智能渗透率将有望加速提升。

根据高盛预测,在理想状态下,若机器人软硬件在短期内产生重大技术突破,实现具身智能的同时年均降本达到20%,人形机器人全球市场空间 有望在2035年达到1540亿美元,接近2021年智能汽车的市场空间,2025-2035年复合增长率达到94%。

若是在乐观情况下,人形机器人的出货量有望在2035年达到100万台,市场空间2025-2035年复合增长率有望达到59%。

人形机器人的时代正在到来

2023年11月2日,工信部印发《人形机器人创新发展指导意见》(以下简称《意见》)为人形机器人发展指明方向。《意见》中指出,到2025年,人形机器人创新体系初步建立,“大脑、小脑、肢体”等一批关键技术取得突破,确保核心部组件安全有效供给。整机产品达到国际先进水平,并实现批量生产。

2024年1月17日,AI研究实验室Midjourney创始人大卫·霍尔茨(David Holz)在社交媒体的一篇帖子写道:“我们有理由期待,到2040年,地球上将有10亿个人形机器人。到2060年,世界上将会有1000亿人形机器人。”这预示着人形机器人的新时代正在到来。

近年来,具身智能在学术界的关注度持续升温,在CoRL(机器人学习大会)上,具身智能领域的论文数量呈现出快速增长的趋势。

而在2023年初举行的 IROS(智能机器人及系统国际会议)上,具身智能也被作为一个极为重要的议题进行了深入探讨。

在2023年8月18日的世界机器人大会人形机器人技术与产业发展论坛上,2000年图灵奖获得者、中国科学院院士、清华大学交叉信息研究院院长姚期智指出,通用人工智能(AGI)的未来发展需要具备具身实体,与真实物理世界交互以完成各种任务。

只有这样,才能为产业带来更大的价值。

随着中国社会老龄化程度将逐渐加深,劳动力短缺问题日益凸显,同时中国制造业劳动力总量下降,人工成本上升,因此“机器替代人”成为了重要趋势。

目前,全球工业机器人部署量稳定增长,中国已成为世界最大的机器人市场。人形机器人在结构上与人类相似,未来有望覆盖、替换所有原本需要人类劳动力的作业场景。

根据赛迪顾问的报告,尽管目前各家人形机器人仍处于原型机研发的早期阶段,但是其带来的潜在技术变革以及对某些生产生活场景的改变值得高度关注。

人形机器人在制造业、航天探索、生活服务业、高校科研等领域具有较大的发展潜力,预计到2025年,人形机器人将有望实现在制造业场景应用的突破,小批量应用于电子、汽车等生产制造环境。

在中国,智能制造领域将成为人形机器人首个实现大规模应用的领域。人形机器人将围绕工业制造、商用服务和家庭陪伴三大场景,重新定义人工智能时代的工人,把人类从重复性劳动中解放出来。

商用服务场景是人形机器人最快应用的市场,而家庭落地场景则是人形机器人最具潜力的应用市场。

近日,美国科技公司英伟达宣布成立通用具身智能体研究实验室GEAR。

去年以来,包括中国电科21所、智元机器人、科大讯飞、小鹏汽车、傅利叶智能在内的多家国内企业相继发布了自主研发的具身智能机器人,并有多家企业拟在今年实现具身智能的商业化落地。

业界普遍认为,2024年有望成为具身智能商业落地元年。

虚拟世界,与现实世界形成鲜明对比,提供了一个更为精密和可控的环境,使得智能体能够进行更加大胆和创新的行为。

这不仅是对人类智能的延伸,更是一个通用人工智能诞生和发展的舞台,为超越人类智能水平的AI提供了理想的试验场和成长空间。

或许,这也是各大科技公司对具身智能与虚拟世界寄予厚望的深层次原因。

这预示着,一个更加智能、更加互联的未来正向我们走来。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/477696.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于java+springboot+vue实现的健身房管理系统(文末源码+Lw+ppt)23-523

摘 要 健身房管理的以往工作流程繁杂、多样、管理复杂与设备维护繁琐。而如今计算机已完全能够胜任健身房管理工作,而且更加准确、方便、快捷、高效、清晰、透明,它完全可以克服以上所述的不足之处。这将给查询信息和管理带来很大的方便,从…

从0写一个问卷调查APP的第13天-1

1.今日任务 我也只是一个大学生,有什么思路不对的地方给我指出来哟! 分析:上次我们实现了任务调查的插入。但是我们插入的问卷调查只有它的标题,也就是这个问卷调查是什么我们告诉数据库了,但是现在我们还没有给它添加任何问题&…

图片如何去除水印?试试这三款去水印工具!

在处理图片时,经常会遇到一个棘手的问题:水印。不论是想去除不美观的版权标记,还是希望消除图片上的杂物,一个好用的去水印工具都是必不可少的。今天,我们就为大家介绍三款功能强大、操作简便的图片去水印软件&#xf…

JavaScrpt学习笔记_一

一、Js编写位置 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>Title</title> <!-- 可以将js代码编写到外部js文件中&#xff0c;然后通过script标签引入写到外部文件中可以在不同页面中…

梦百合发布“正确睡眠观”,再次呼吁“别睡硬床”

3月21日“世界睡眠日”当天,MLILY梦百合召开了主题为“别睡硬床”的品牌发布会,梦百合家居董事长倪张根发布了一场线上主题演讲,普及睡硬床可能带来的危害,呼吁国人“别睡硬床!”,并发布“100万张硬床垫改造计划”,期望消费者通过从体验一张薄垫开始,从而逐步认识到睡硬床的危害…

1.C#对接微信Native支付(接入前准备)

在申请微信支付商户和微信公众号成功后&#xff0c;我们需要根据官方文档继续进行下一步操作。 1.申请appid和申请mchid 其实只要申请了支付商户和公众号那么这两个id就已经生成了。 我们在公众号管理端的微信支付中可以看到appid 在微信支付商户管理端中可以看到mchid 2…

20240316-1-向量化搜索

向量化搜索 在高维空间内快速搜索最近邻&#xff08;Approximate Nearest Neighbor&#xff09;。召回中&#xff0c;Embedding向量的搜索。 FAISS、kd-tree、局部敏感哈希、【Amnoy、HNSW】 FAISS faiss是Facebook的AI团队开源的一套用于做聚类或者相似性搜索的软件库&…

图中的边关系和节点关系之间的转换

图中的边关系和节点关系之间的转换 边关系转为图 在relation数组中记录的是从一个节点到一个节点&#xff0c;前面的就叫做from&#xff0c;后面的就叫做to&#xff0c;因此每次添加进节点关系的数组的时候&#xff0c;from就是数组索引&#xff0c;to就是需要加入的值。也就是…

揭秘最热门AI写作软件,看看有哪些值得推荐的AI写作神器

在快节奏的现代生活中&#xff0c;我们常常面临各种压力&#xff0c;例如工作、学习等。因此&#xff0c;一款能够提高写作效率的工具变得尤为重要。那么&#xff0c;有没有什么AI写作软件是比较好用的呢&#xff1f;下面小编给大家推荐几款热门的写作软件。 一.爱制作AI写作 …

打造稳定高效的会员系统:技术架构解析与优化策略

随着互联网时代的发展和用户需求的变化&#xff0c;会员系统成为了各行各业企业实现用户粘性和增长的重要手段。一个稳定高效的会员系统架构能够帮助企业更好地管理会员数据、提供个性化服务和增加用户价值。本文将深入探讨会员系统的技术架构&#xff0c;分析其重要性和挑战&a…

Transformer的前世今生 day02(神经网络语言模型、词向量)

神经网络语言模型 使用神经网络的方法&#xff0c;去完成语言模型的两个问题&#xff0c;下图为两层感知机的神经网络语言模型&#xff1a; 假设词典V内有五个词&#xff1a;“判断”、“这个”、“词”、“的”、“词性”&#xff0c;且要输出P(w_next | “判断”、“这个”、…

Linux东方通下载及使用

把压缩包拖进去 解压文件 mkdir /usr/local/java

新品发布 | Ftrans FIE文件安全导入导出系统

关于飞驰云联 飞驰云联是中国领先的数据安全传输解决方案提供商&#xff0c;长期专注于安全可控、性能卓越的数据传输技术和解决方案&#xff0c;公司产品和方案覆盖了跨网跨区域的数据安全交换、供应链数据安全传输、数据传输过程的防泄漏、FTP的增强和国产化替代、文件传输自…

加速您的 AI 开发:NVIDIA AI Workbench 正式发布

加速您的 AI 开发&#xff1a;NVIDIA AI Workbench 正式发布 NVIDIA AI Workbench 是一款面向 AI 和 ML 开发人员的工具包&#xff0c;现已普遍提供免费下载。 它具有自动化功能&#xff0c;可以消除新手开发人员的障碍并提高专家的工作效率。 无论技能水平如何&#xff0c;开…

使用倒模耳机壳UV树脂胶液制作舞台监听耳返入耳式耳机壳有哪些优点?

使用倒模耳机壳UV树脂胶液制作舞台监听耳返入耳式耳机壳有很多优点&#xff0c;具体如下&#xff1a; 高音质表现&#xff1a;通过倒模工艺制作的耳机壳能够更好地贴合耳朵&#xff0c;减少声音散射和反射&#xff0c;提高声音的清晰度和质感。这对于舞台监听来说非常重要&…

【漏洞复现】福建科立迅通信指挥调度平台down_file.php sql注入漏洞

漏洞描述 福建科立迅通信调度平台 20240318 以及之前版本存在一个严重漏洞,影响了文件 api/client/down_file.php 的一个未知功能。攻击者可以通过操纵参数 uuid 发起 SQL 注入攻击。攻击者可以远程发起攻击。 免责声明 技术文章仅供参考,任何个人和组织使用网络应当遵守…

OpenGL学习笔记【3】—— GLAD配置

一、为什么用GLAD 由于OpenGL驱动版本众多&#xff0c;它大多数函数的位置都无法在编译时确定下来&#xff0c;需要在运行时查询。所以任务就落在了开发者身上&#xff0c;开发者需要在运行时获取函数地址并将其保存在一个函数指针中供以后使用。取得地址的方法因平台而异&…

Redis 大 Key 对持久化有什么影响?

资料来源 : 小林coding 小林官方网站 : 小林coding (xiaolincoding.com) Redis 的持久化方式有两种&#xff1a;AOF 日志和 RDB 快照。 所以接下来&#xff0c;针对这两种持久化方式具体分析分析 大 Key 对 AOF 日志的影响 先说说 AOF 日志三种写回磁盘的策略 Redis 提供了 3…

如何让 string 型的字符串变成 int 型的整数

之前我们讲过了如何裁剪字符串和如何反转字符串&#xff0c;具体情况可以看看我前几期发的博客&#xff0c;今天我们就来讲讲怎么将 string 型的字符串变成 int 型的整数。 我们可以使用在 <bits/stdc.h> 中的 atoi 函数来处理这种形式转变&#xff0c;如下&#xff1a;…

如何使用Android平板公网访问本地Linux code-server

文章目录 1.ubuntu本地安装code-server2. 安装cpolar内网穿透3. 创建隧道映射本地端口4. 安卓平板测试访问5.固定域名公网地址6.结语 1.ubuntu本地安装code-server 准备一台虚拟机,Ubuntu或者centos都可以&#xff0c;这里以VMwhere ubuntu系统为例 下载code server服务,浏览器…