But something is slowing that rocket down: lack of access to the types of data used to train robots so they can interact more smoothly with the physical world.It’s far harder to come by than the data used to train the most advanced AI models like GPT—mostly text, images, and videos scraped off the internet. Simulation programs can help robots learn how to interact with places and objects, but the results still tend to fall prey to what’s known as the “sim-to-real gap,” or failures that arise when robots move from the simulation to the real world.
翻译:但是有一些因素正在拖慢速度,缺乏可用于训练机器人的数据,所以他们无法与现实世界更流畅的交流。这种数据的获取要比训练当今最先进的ai模型--gpt要困难得多,而且大多数是文字、图像和视频。模拟程序可以帮助机器人学习如何与地点、物体进行交互,但是结果仍然会陷入到““现实仿真差”,即机器人从模拟环境到真实世界所出现的故障。
「词汇总结」
rocket - n. 火箭
access - n. 访问,接入
data - n. 数据
train - v. 训练
robots - n. 机器人
interact - v. 相互作用
smoothly - adv. 平稳地
physical - adj. 物理的
advanced - adj. 先进的
AI - n. 人工智能
models - n. 模型
GPT - n. 通用预训练(大型语言模型)
text - n. 文本
images - n. 图像
videos - n. 视频
scraped off - 刮取,这里指从互联网获取数据
internet - n. 互联网
Simulation - n. 模拟
programs - n. 程序
learn - v. 学习
places - n. 地方
objects - n. 物体
results - n. 结果
fall prey to - 成为...的牺牲品
sim-to-real gap - 模拟到真实的差距
「文章背景」
自ChatGPT发布以来,我们现在比以往任何时候都更直接、更定期地与人工智能工具进行交互。但相比之下,与机器人的互动对大多数人来说仍然很少。如果你没有经历过复杂的手术或从事物流工作,你在日常生活中遇到的最先进的机器人可能仍然是吸尘器(第一台Roomba扫地机发布于22年前)。机器人专家相信,通过新的人工智能技术,他们将实现该领域几十年来一直渴望的目标:功能更强大的、可以在陌生环境中自由移动并应对前所未见的挑战的机器人。目前,我们仍然需要访问物理的、真实的数据来训练机器人;这些数据相对稀缺,并且往往需要更多的时间、精力和昂贵的设备来收集。这是目前阻碍机器人技术进步的主要因素之一。因此,领先的公司和实验室正在激烈竞争,寻找新的、更好的方法来收集他们所需的数据。这让他们走上了奇怪的道路,比如使用机械臂连续几个小时翻转煎饼,观看从YouTube上提取的数千小时的手术视频。一路走来,他们遇到了各种隐私、道德和版权问题。