谷歌将于今年晚些时候推出一款名为 Astra 的新系统,并承诺它将成为迄今为止推出的最强大、最先进的人工智能助手。
当前一代的人工智能助手,例如 ChatGPT,可以检索信息并提供答案,但仅此而已。但今年,谷歌将其助手重新命名为更先进的“代理”,据称可以显示推理、计划和记忆技能,并能够采取多个步骤来执行任务。
人们将能够通过智能手机甚至台式电脑使用 Astra,但该公司也在探索其他选择,例如将其嵌入智能眼镜或其他设备中。
谷歌称:我们正处于[人工智能代理开发]的早期阶段,我们一直希望构建一个在日常生活中有用的通用智能体。
想象一下代理可以看到和听到我们所做的事情,更好地了解我们所处的环境,并在对话中快速做出反应,从而使交互的速度和质量感觉更加自然。这就是阿斯特拉的未来。
谷歌宣布这一消息的前一天,其竞争对手 OpenAI 推出了自己的超级人工智能助手GPT-4o。 Google DeepMind 的 Astra 对音频和视频输入的响应方式与 GPT-4o 非常相似。
在新闻演示中,一名用户将智能手机摄像头和智能眼镜对准物体,并要求 Astra 解释它们是什么。当那个人将设备指向窗外并询问“你认为我在哪个社区?”人工智能系统能够识别伦敦国王十字车站,即 Google DeepMind 总部所在地。它还可以说该人的眼镜在桌子上,这是在交互早期记录的。
该演示展示了 Google DeepMind 对实时多模式人工智能(可以处理多种类型的输入——语音、视频、文本等)的愿景。
我们非常兴奋,在未来,能够真正贴近用户,为用户提供他们想要的任何帮助,谷歌最近升级了其人工智能模型 Gemini,以处理更大量的数据,这一升级有助于它处理更大的文档和视频,并进行更长时间的对话。
科技公司正处于人工智能霸主地位的激烈竞争之中,而人工智能代理是大型科技公司为表明他们正在推动发展前沿而做出的最新努力。代理也参与了许多科技公司的叙述,包括 OpenAI 和 Google DeepMind,这些公司的目标是构建通用人工智能,这是一种高度假设的超级智能人工智能系统想法。
最终,您将拥有一位真正了解您、可以为您做很多事情、并且可以跨多个任务和领域工作的代理。
这个愿景仍然令人向往。但今天的声明应该被视为谷歌试图跟上竞争对手的脚步。通过推出这些产品,谷歌可以从超过 10 亿用户那里收集更多数据,了解他们如何使用模型以及哪些模型有效。
今天,谷歌将推出除代理之外的更多新人工智能功能。它将通过一项名为人工智能概述的新功能将人工智能更深入地集成到搜索中,该功能从互联网收集信息并将其打包成简短的摘要以响应搜索查询。该功能于今天推出,最初仅在美国提供,稍后将开放更多国家/地区。
这将有助于加快搜索过程,并为用户提供针对更复杂、更小众问题的更具体答案。 这就是搜索一直在苦苦挣扎的地方。
谷歌人工智能搜索产品的另一个新功能是更好的规划。例如,人们很快就可以要求搜索提供餐饮和旅行建议,就像要求旅行社推荐餐馆和酒店一样。双子座将能够帮助他们计划需要做什么或购买烹饪食谱,他们还能够与人工智能系统对话,要求它做任何相对平凡的任务,例如通知他们天气预测,到高度复杂的任务,例如帮助他们准备工作面试或重要演讲。
人们还可以打断双子座的句子并提出澄清问题,就像在真正的对话中一样。
作为向单一竞争对手 OpenAI 迈进的另一项举措,谷歌还推出了 Veo,一种新的视频生成人工智能系统。 Veo 能够生成短视频,并允许用户通过理解“延时”或“风景空中拍摄”等提示来更好地控制电影风格。
谷歌在训练生成视频模型方面具有显着优势,因为它拥有 YouTube。该公司已经宣布与 Donald Glover 和 Wycleaf Jean 等艺术家合作,他们正在使用该公司的技术来创作自己的作品。
今年早些时候,当被问及该公司的模型是否接受过 YouTube 数据的训练时,OpenAi 的首席技术官 Mira Murati 支吾其词。
谷歌 DeepMind 高级研究总监 Douglas Eck 称,对于用于创建 Veo 的训练数据也含糊其辞,但他表示“可能会根据我们与 YouTube 创作者的协议,在某些 YouTube 内容上进行训练” 。
一方面,谷歌将其生成式人工智能作为艺术家可以用来制作东西的工具来展示,但这些工具很可能通过使用现有艺术家的材料来获得创造东西的能力。谷歌和 OpenAI 等人工智能公司面临着一系列作家和艺术家的诉讼,声称他们的知识产权在未经同意或补偿的情况下被使用。
对于艺术家来说,这是一把双刃剑。