谷歌DeepMind推出SIMA智能体,可以跟人一起玩游戏

谷歌 DeepMind 推出了 SIMA,这是一种通过训练学习游戏技能的人工智能代理,因此它玩起来更像人类,而不是一个只做自己事情的强大人工智能。

从早期与 Atari 游戏合作,到以人类大师级别玩《星际争霸 II》的 AlphaStar 系统,谷歌 DeepMind 在人工智能和游戏领域拥有悠久的历史。

01 游戏是人工智能的重要试验场

视频游戏是人工智能 (AI) 系统的重要试验场。与现实世界一样,游戏是丰富的学习环境,具有响应灵敏、实时的设置和不断变化的目标。

在一份新技术报告中,谷歌 DeepMind 介绍了 SIMA(Scalable Instructable Multiworld Agent),它是一种用于 3D 虚拟设置的通用 AI Agent。这项研究标志着智能体首次证明它可以理解广泛的游戏世界,并像人类一样遵循自然语言指令执行其中的任务。 

SIMA 的存在并不是为了获得游戏高分,对于人工智能系统来说,学会玩一款视频游戏本身就是一项技术壮举。SIMA 的研究向人们展示了如何通过语言界面将高级人工智能模型的功能转化为有用的、现实世界的动作。

谷歌 DeepMind 希望 SIMA 和其他智能体研究能够使用视频游戏作为沙箱,以更好地了解人工智能系统如何变得更有帮助。

02 SIMA 经过九种不同游戏测试

谷歌 DeepMind 与八家游戏工作室合作,在九种不同的视频游戏上训练和测试 SIMA,例如Hello Games 的《No Man's Sky》和 Tuxedo Labs 的《Teardown》。

SIMA 产品组合中的每款游戏都开辟了一个新的互动世界,包括一系列可供学习的技能,从简单的导航和菜单使用,到采矿资源、驾驶宇宙飞船或制作头盔。

此外,谷歌 DeepMind 还使用了四个研究环境 - 包括 Unity 构建的“构建实验室”等,智能体需要用积木构建雕塑,以测试他们的对象操作和对物理世界的直观理解。

通过学习不同的游戏世界,SIMA 可以捕捉到界面语言并与游戏行为联系起来。例如,在游戏中,SIMA 会观察玩家所做的事情并记录导致他们进行游戏操作的指令。 

03 SIMA 可在十秒内完成简单任务

SIMA 是一种人工智能代理,可以感知和理解各种环境,然后采取行动来实现指示的目标。它包括一个专为精确图像语言映射而设计的模型和一个预测屏幕上接下来会发生什么的视频模型。

同时,谷歌 DeepMind 还会根据 SIMA 产品组合中特定于 3D 设置的训练数据对这些模型进行微调。

SIMA 不需要访问游戏的源代码,也不需要定制的 API。它只需要两个输入:屏幕上的图像以及用户提供的简单的自然语言指令,SIMA 使用键盘和鼠标输出来控制游戏的中心角色来执行这些指令。

这意味着 SIMA 可以与任何虚拟环境进行交互。

SIMA 的当前版本通过 600 项基本技能评估测试,涵盖导航(例如“左转”)、对象交互(“爬梯子”)和菜单使用(“打开地图”)等简单任务,SIMA 均可在大约 10 秒内完成。

谷歌 DeepMind 希望未来的 SIMA 能够处理需要高层战略规划和多个子任务才能完成的任务,例如“寻找资源和建立营地”。

04 SIMA 表现优于单游戏训练智能体

SIMA 的成功应用证明受过多种游戏训练的智能体比仅学习如何玩一种游戏的智能体更好。

在谷歌 DeepMind 的测试中,SIMA 智能体在九个 3D 游戏上进行了训练,其表现明显优于仅在每个单独的游戏上进行训练的所有专业智能体。而且,多款游戏训练过的 SIMA 在新游戏中的表现几乎与专门针对该游戏进行过训练的智能体一样好。

这种在全新环境中运行的能力凸显了 SIMA 超越其训练的泛化能力,但是 SIMA 需要进行更多的研究才能在已知和未知的游戏中达到人类的水平。

此外,谷歌 DeepMind 的测试结果还表明 SIMA 的性能依赖于语言。在控制测试中,若智能体没有接受任何语言训练或指令,它的行为是漫无目的的。例如,智能体可能会收集资源(这是一种常见行为),但不是按照指示去收集。

SIMA 的测试结果显示了开发新一代通用语言驱动的智能体的潜力。谷歌 DeepMind 也表示,SIMA 代表可扩展、可指导、多世界的智能体,目前还处于内测阶段,期待在更多训练环境中进一步构建 SIMA,并纳入更强大的模型。

最终,SIMA 可以理解并安全地执行各种任务,从而对网上和现实世界中的人们有所帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/475459.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PyGWalker:Python中的Tableau,数据可视化变得如此简单!

文章目录 1介绍2 安装3 使用4 将数据可视化导出为代码5 总结 1介绍 在数据分析和可视化的领域,Tableau凭借其强大的功能和直观的界面,一直以来都是专业人士的首选工具。然而,对于许多用户而言,Tableau的封闭性和高昂的成本使其难…

leetcode刷题(javaScript)——BFS广度优先遍历相关场景题总结

广度优先搜索(BFS)在JavaScript编程中有许多实际应用场景,特别是在解决图、树等数据结构相关问题时非常常见。在JavaScript中,可以使用队列来实现广度优先搜索算法。通过将起始节点加入队列,然后迭代地将节点的邻居节点…

60 个深度学习教程:包含论文、实现和注释 | 开源日报 No.202

labmlai/annotated_deep_learning_paper_implementations Stars: 44.0k License: MIT annotated_deep_learning_paper_implementations 是一个包含深度学习论文的 60 个实现/教程,附带并排注释;包括 transformers(原始、xl、switch、feedbac…

2023年五级区划省市县乡镇行政村社区边界数据

行政区划数据是重要的基础地理信息数据,根据国家统计局公布的数据,行政区划共分为五级,分别为省级、地级、县级、乡镇/街道级、村/社区级。 该套数据以2020-2023年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区…

Leetcode 19. 删除链表的倒数第 N 个结点

题目描述: 给你一个链表,删除链表的倒数第 n 个结点,并且返回链表的头结点。 示例 1: 输入:head [1,2,3,4,5], n 2 输出:[1,2,3,5] 示例 2: 输入:head [1], n 1 输出&#xf…

图论中的最小生成树:Kruskal与Prim算法深入解析

🎬慕斯主页:修仙—别有洞天 ♈️今日夜电波:アンビバレント—Uru 0:24━━━━━━️💟──────── 4:02 🔄 ◀️ ⏸ ▶️ ☰ …

Linux第79步_使用自旋锁保护某个全局变量来实现“互斥访问”共享资源

自旋锁使用注意事项:自旋锁保护的“临界区”要尽可能的短。 因此,在open()函数中申请“spinlock_t自旋锁结构变量”,然后在release()函数中释放“spinlock_t自旋锁结构变量”,这种方法就行不通了。如果使用一个变量“dev_stats”来表示“共享…

【前端Vue】Vue3+Pinia小兔鲜电商项目第2篇:什么是pinia,1. 创建空Vue项目【附代码文档】

全套笔记资料代码移步: 前往gitee仓库查看 感兴趣的小伙伴可以自取哦,欢迎大家点赞转发~ 全套教程部分目录: 部分文件图片: 什么是pinia Pinia 是 Vue 的专属状态管理库,可以实现跨组件或页面共享状态,是…

javaSwing扫雷

一、介绍 1.1 背景 在1964年 有一个叫“方 块”的游戏,这是扫雷最原始的版本。后来,这个游戏被改成了另一种游戏,叫做“Rlogic”。在这个游戏中,玩家扮演了一名军队的军人,接受了一项艰难的任务:为指挥中…

Linux--gdb调试

一.安装gdb sudo apt install gdb 二.使用gdb 三.gdb的相关操作 gdb 可执行文件名 显示代码: l 加断点: b 行号 启动程序:r(运行之前一定要加断点) 查看断点信息: info break/info b 删除断点信息:delete 断点编号 单步执行:n 打印 :p 显示:display 变量名: 退出:q …

分布式系统的基本特性

一般,分布式系统需要支持以下特性: 资源共享 开放性 并发性 可伸缩性 容错性 透明性 下面分别讨论。 容易理解的 资源共享 一旦授权,可以访问环境中的任何资源。 资源:包括硬件(e.g. printer, scanner, camera)、软件&a…

8.2K star!史上最强Web应用防火墙

🚩 0x01 介绍 长亭雷池SafeLine是长亭科技耗时近 10 年倾情打造的WAF(Web Application Firewall),一款敢打出口号 “不让黑客越雷池一步” 的 WAF,我愿称之为史上最强的一款Web应用防火墙,足够简单、足够好用、足够强的免费且开源…

详解main函数参数argc、argv及如何传参

目录 1、main()函数参数 2、main函数如何传参 2.1 环境准备 2.2 通过 Powershell 窗口传参 2.3 通过vs界面传参 3、int main() 和 int main(int argc, char *argv[]) 特点 1、main()函数参数 在C语言中,main函数可以带参数。main函数的原型通常为以下两种形式…

Linux本地部署TeslaMate结合内网穿透实现公网访问内网车辆信息

文章目录 1. Docker部署TeslaMate2. 本地访问TeslaMate3. Linux安装Cpolar4. 配置TeslaMate公网地址5. 远程访问TeslaMate6. 固定TeslaMate公网地址7. 固定地址访问TeslaMate TeslaMate是一个开源软件,可以通过连接特斯拉账号,记录行驶历史,统…

【网络原理】HTTP 请求 (Request)详解

文章目录 🎍请求格式🎄认识URL🌸query string🌸关于 URL encode 🍀认识 “方法” (method)🌸GET方法🌸POST 方法🌸GET 和 POST 的区别 🌲认识请求 “报头” (header)&…

揭秘3D大屏制作:轻松上手的必备工具清单!

轻轻松松做出3D可视化大屏,你需要知道这几样东西 3D可视化大屏一、3D可视化大屏介绍二、3D可视化应用领域三、3D可视化的技术四、3D可视化的制作平台五、总结 大家好,这里是程序猿代码之路。在如今信息以及数据爆炸的时代,如何有效地展示和解…

【算法】差分算法详解(模板)

类似于数学中的求导和积分之间的关系,差分可以看成前缀和的逆运算。 差分数组: 首先给定一个原数组a:a[1], a[2], a[3],,,,,, a[n]; 然后我们构造一个数组b : b[1] ,b[2] , b[3],,,,,, b[i]; 使得 a[i] b[1] b[2 ] b[3] ,,,…

Protobuf 的介绍与使用(入门级)

背景 在移动互联网时代,手机流量、电量是最为有限的资源,而移动端的即时通讯应用无疑必须得直面这两点。 解决流量过大的基本方法就是使用高度压缩的通信协议,而数据压缩后流量减小带来的自然结果也就是省电:因为大数据量的传输必…

【随笔】Git -- 解决提交时本地与目标分支不一致导致提交失败(三)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

Codeforces Round 935 (Div. 3) (A~G)

1945A - Setting up Camp 题意:三种人安排住宿,a只能跟自己住,b只能三个人住,c能1~3个人,问最终最少房间数 思路:a单独安排,b放一起,不足三个人的用c补,然后c按照3人一房间尽可能分配 void solve() {int a , b , c;cin >> a >>…