前言
大家好,我是翼同学。这里是【每周精选资讯】的第一期内容。
GPT 递给我苹果
Figure展示了与OpenAI合作的最新进展,通过结合先进的神经网络,使机器人能够执行类似人类的快速、灵巧动作。主要功能包括描述周围环境、常识推理、将高层次请求转化为适当行为、以及用简单英语描述执行动作的原因等。
技术深入包括所有行为都是学习得来的,通过多模态模型理解图像和文本,并实现快速、低级别、灵巧的机器人动作。合作旨在推动机器人学习的边界,为人形机器人开发AI模型,已使机器人动作显著加速,接近人类速度。
Follow-Your-Click
腾讯和清华大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Click“,基于输入模型的图片,只需点击对应区域,加上少量提示词,就可以让图片中原本静态的区域动起来,一键转换成视频。
项目地址:Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts
SpaceX星舰第三次试飞
SpaceX的星舰飞船在其第三次测试任务中实现了更长时间的太空飞行,这标志着这款可能将宇航员送往月球和更远地方的火箭取得了重大进展。
在这次试飞中,星舰成功完成了上升段燃烧、有效载荷舱门的打开和关闭、推进剂转移演示、猛禽发动机的重新点火以及在受控条件下返回大气层等任务。虽然在返回大气层过程中失去了信号,但这次试飞仍被视为取得了里程碑式的突破。
Meta宣布推出Llama3,打造超大规模人工智能计算平台
Meta宣布推出Llama3,这是一个超大规模的人工智能计算平台,旨在支持当前和下一代AI模型的研究和开发工作。该平台包括两个集群,每个集群拥有24000个高端NVIDIA H100 GPU,并计划在2024年底将基础设施扩展至包含350,000个NVIDIA H100 GPU,提供近600,000个H100的计算能力。
此外,Meta的GenAI基础设施计划涵盖了GPU集群规模、硬件平台、AI模型开发支持、AI研究加速器、网络解决方案、存储解决方案、性能优化以及开放创新等方面。这一举措体现了Meta对开放计算和开源的承诺,旨在推动整个行业的开放创新。
官网链接:Building Meta’s GenAI Infrastructure
全球首位自主能力 AI 软件工程师:Devin
Cognition 实验室宣布全球首位自主能力 AI 软件工程师 Devin。 Devin 成功通过了顶尖 AI 公司的实际工程面试,并在 Upwork 上完成了真实工作。
Devin 展现了出色的自主能力,能够独立解决工程任务,包括学习使用新技术、端到端构建和部署应用、自主发现并修复代码错误、训练和微调 AI 模型、为成熟的生产仓库做出贡献等。在 SWE-Bench 基准测试中, Devin 表现优异,无需协助即可正确解决高比例的真实世界开源项目中的 GitHub 问题,远超过以往的最佳模型性能。
Devin 具备长期推理和规划能力、积极协作态度、快速学习新技术的能力、构建和部署应用的技能、自主发现和修复错误的能力、以及完成实际工作任务的能力等核心能力。
通义千问:解析超万页长文档
阿里通义千问推出免费的文档解析功能,可解析网页、文档、论文、图书,突破当前大模型长文档处理的天花板。
针对单个文档,通义千问能够处理超万页的极长资料,换算成中文篇幅约1000万字。针对多个文档,可一键速读100份不同格式的资料,还可解析在线网页。
文档解析功能将为考试复习、文献阅读等人群提供极强辅助,现已在通义千问官网和APP同步上线。
官网链接:通义千问