大模型还能让我们望梅止渴多久?

大模型梦碎的时间点似乎越来越近。过去一周,有关人工智能的消息糟糕多于积极。

周初,诺贝尔物理学奖和化学奖接连砸向时下正热的人工智能领域。这些奖项出人意料且鼓舞人心,意味着人工智能的确已经根本性地改变了我们生活和科学体系的方方面面。然而对于眼下基于大模型展开的众多人工智能生意,这些既有研究的帮助有限。

特斯拉在本周花了大价钱布置和渲染了一片颇具未来感的人机风情社区——在这个社区里,机器人负责取悦人类,它们开车、跳舞、招待顾客甚至陪人聊天,而人类负责吃喝玩乐,酒足饭饱后搭乘特斯拉刚刚发布的Robotaxi(自动驾驶出租车)——Cybercab离开。

一切看起来很美好,未来似乎已经在眼前,然而现场一阵狂欢后,特斯拉的股价却下跌了近10%。冰冷现实提示我们,我们没有准备好的东西还有很多,从技术到监管,以及我们的各种组织形态本身。

自动驾驶还没有真的令人放心,大模型同样如此。坚持了2年后,Character AI彻底放弃了自研大模型。它不会是唯一的一家,虽然没有明确说明,但此前已投入硅谷大厂怀抱的Inflection AI、Adept、Covariant等曾经的独角兽放弃这一昂贵又继续突破无望的工作是迟早的事。本周,有消息传出称国内也有两家此前的独角兽可能放弃自研大模型。这一消息尚未获得证实。

连一向引领行业的OpenAI也日益动荡。首席科学家Ilya Sutskever和首席技术官Mira Murati接连离开公司后,OpenAI联创Durk Kingma和Sora负责人之一Tim Brooks也于本周离职,分别加入对手公司Anthropic和DeepMind。10月1日举办的OpenAI开发者大会上,OpenAI没有任何新产品或新技术推出。Sora迄今没有上线,GPT-5也已很久没人提及。曾有传闻称苹果计划入股OpenAI,但在最新一轮融资中,苹果消失得无影无踪。

以下内容由「新皮层」团队制作,欢迎关注。

Key Points

软件篇

Character AI放弃开发大模型;

MiniMax上线图生视频功能;

Kimi推出探索版,效仿OpenAI o1的分步推理;

纯鸿蒙系统开启公测;

硬件篇

特斯拉计划2026年推出4种自研电池,采用干法工艺;

Waymo同现代汽车合作生产Robotaxi,此前曾与极氪合作;

特斯拉发布首款自动驾驶出租车Cybercab

AMD发布新款人工智能芯片MI325X,与英伟达竞争;

字节发布首款AI硬件——一款可以呼唤大模型的耳机;

钱与人才流动

OpenAI联创Durk Kingma加入Anthropic;

Sora负责人之一Tim Brooks加入DeepMind;

OpenAI任命新的后训练主管,又有一名元老离职。

软件篇

Character AI放弃开发大模型

10月2日,Character.ai新任临时首席执行官Dominic Perella表示,该公司已基本放弃与OpenAI、亚马逊和Google等资金更雄厚的AI公司竞争,建立大型语言模型。相反,成立三年的Character.ai将专注于其更受欢迎的消费业务,即模拟各种人物和名人风格对话的聊天机器人,也包括由用户自己设计的聊天机器人。Perella表示,训练前沿模型的成本非常高,「即使是非常大的启动预算,也很难筹集到资金」。今年8月,[Google将Character.ai两位创始人与该公司20%的员工挖走],加入其人工智能部门DeepMind,并支付27亿美元购买该初创公司模型的一次性许可。Perella表示,这笔与Google的交易还为这家初创公司提供了足够运营18个月的资金,并补充说,该公司未来可能会寻求从风险投资中筹集资金,并寻求与其他公司达成类似的许可协议。

MiniMax上线图生视频功能

10月10日,MiniMax视频模型宣布上线图生视频功能,向该视频模型输入一张图片,它可以生成一段长达6秒的视频。今年8月31日,MiniMax发布旗下第一个视频生成模型abab-video-1,支持文生视频。当时,MiniMax创始人闫俊杰在发布会后的采访中称,之后还将陆续推出「图生视频、文+图生成视频、可编辑的可控视频生成」等模型或功能。

Kimi推出探索版,效仿OpenAI o1的分步推理

10月11日,月之暗面发布「Kimi探索版」,通过将复杂问题分解为多步任务、在搜索过程中实现多步搜索,从而提升问题回答质量。月之暗面称,「Kimi探索版」的搜索量是普通版的10倍,1次搜索即可精读超过500个页面。根据月之暗面介绍,「Kimi探索版」与普通版有3个方面的差异。首先,在答题之前,「Kimi探索版」可以预先规划解决问题的整体策略,将复杂问题分解为层次化的子问题、建立任务结构,然后分步执行;其次,「Kimi探索版」可以一次并行搜索几十个不同的关键词,筛选和阅读几百个权威信息源;最后,「Kimi探索版」具备反思能力,可以改善回答质量,例如在反思后主动补充回答更多信息。

纯鸿蒙系统开启公测

10月8日,华为宣布原生鸿蒙操作系统HarmonyOS NEXT正式开启公测,首批公测机型包括华为Mate 60系列、华为Mate X5系列和华为MatePad Pro 13.2英寸系列。华为今年1月推出HarmonyOS NEXT系统的开发者预览版,并表示该系统将只能安装为鸿蒙开发的原生应用,不再兼容安卓应用。今年6月,华为宣布HarmonyOS NEXT首次将AI融入系统,推出Harmony Intelligence(鸿蒙原生智能),依托昇腾的算力和盘古大模型,提供系统级的AI能力。目前,已有超1万个应用和元服务上架HarmonyOS NEXT应用市场,包括美团、小红书、钉钉、微博等。此前在适配鸿蒙系统方面进展缓慢的腾讯系应用也有了新进展,10月12日,鸿蒙版微信加入公测。

硬件篇

特斯拉计划2026年推出4种自研电池,采用干法工艺

10月3日,有报道称,特斯拉内部同时启动了4个新版本的4680电池项目,并计划在2026年推出4款新电池,新电池代号为NC05、NC20、NC30和NC50(NC代表新电池)。其中,NC05为「主力」,将用于自动驾驶出租车Robotaxi和电动卡车Cybertruck等;NC20预计用于SUV和Cybertruck;NC30预计用于Cybertruck以及未来一款全电动轿车;NC50将专注于性能跑车。

Waymo同现代汽车合作生产Robotaxi,此前曾与极氪合作

10月4日,有报道称,Google旗下的自动驾驶子公司Waymo与韩国汽车制造商现代汽车达成了战略合作伙伴关系。现代汽车的IONIQ 5车型将集成Waymo第6代完全自动驾驶技术Waymo Driver,并在美国佐治亚州的现代汽车工厂完成组装。搭载Waymo Driver的IONIQ 5将于明年年底开始初步路测。双方还计划将相关车辆部署在Waymo的无人驾驶出租车服务网络Waymo One上。据称,Waymo将购买并拥有这些车辆。早在2021年年底,吉利旗下的极氪就获得了Waymo第6代自动驾驶汽车的生产定点,车型与极氪MIX(俗称「宝宝巴士」)同源。今年6月,Waymo宣布第6代车型已在美国开启路测。而现代汽车成为Waymo新的合作伙伴,或与美国商务部的新禁令有关。半个月前,[美国商务部提议禁止美国道路上的智能网联汽车、自动驾驶汽车使用来自中国的关键软件和硬件]。

特斯拉发布首款自动驾驶出租车Cybercab

当地时间10月10日晚间,[特斯拉发布旗下首款自动驾驶出租车Cybercab和自动驾驶客货车Robovan]。两款产品设计都相当激进,其中Cybercab没有后车窗,车门像蝴蝶翅膀一样向上打开,只有2个座位,采用感应充电。而与传统汽车和其他厂商的Robotaxi最大的不同在于,Cybercab是一款专门为自动驾驶设计的车——负责开车的是AI,车内甚至没有方向盘和踏板。这款车预计售价低于3万美元,预计2026年或2027年量产。

AMD发布新款人工智能芯片MI325X,与英伟达竞争

10月10日,AMD在旧金山举办的一次活动中宣布推出一款新款人工智能芯片Instinct MI325X,对标英伟达的Blackwell系列。此外,AMD还计划将于2025年下半年发布下一代MI350系列芯片,提升内存容量和底层架构,比之前的MI300X和MI250X芯片显著提高性能。AMD声称,MI325X将比英伟达H200 GPU的能力提高1.8倍,在人工智能训练方面能力相近或高出10%。MI325X最早将在今年四季度量产出货,并在明年一季度通过戴尔、Eviden、技嘉、惠普企业、联想等服务器制造商更广泛地提供。

字节发布首款AI硬件——一款可以呼唤大模型的耳机

10月11日,字节跳动在没有召开发布会的前提下直接发售了一款硬件产品——AI智能体耳机Ola Friend。这款产品沿用了开放式耳机的形态,单只重6.6g,续航时间为8小时,搭配充电盒使用可达到28小时。充电15分钟可以播放音乐2小时,充满需要2小时。Ola Friend预售价1199元,与苹果旗下的AirPods系列蓝牙耳机相当。在官方宣传片中,用户佩戴Ola Friend耳机,喊出关键词「豆包豆包」,即可唤醒字节自研的聊天机器人「豆包」,开启语音交互。要调用耳机中的豆包,用户需要先将耳机和手机里的字节豆包App配对,才能使用耳机呼唤豆包。这意味着用户脱离了手机蓝牙允许的10米范围,耳机里的豆包也会掉线。

钱与人才流动

OpenAI联创Durk Kingma加入Anthropic

10月1日,OpenAI联合创始人Durk Kingma在社交媒体X发帖,宣布他将入职人工智能初创公司Anthropic。2015年,Kingma加入OpenAI创始团队担任研究科学家,带领算法团队开发主要用于生成式AI模型的技术和方法。他曾于2018年6月从OpenAI离职,加入DeepMind,领导了关于文本、图像和视频生成模型的多个项目。

Sora负责人之一Tim Brooks加入DeepMind

10月4日,OpenAI的文生视频大模型Sora团队负责人之一Tim Brooks在社交媒体X发帖称,自己已经离开OpenAI,加入Google DeepMind团队。Google DeepMind首席执行官Demis Hassabis发帖欢迎Brooks,期待他「将世界模拟器的长期梦想变成现实」。此前,Google曾用「世界模拟器」一词形容其基础世界模型Genie,此模型能根据单个图像提示,生成交互式、动作可控的环境。

OpenAI任命新的后训练主管,又有一名元老离职

10月10日,有报道称OpenAI任命了Liam Fedus为后训练团队主管。后训练团队的任务是提高模型的稳健性、可靠性和安全性,确保OpenAI的产品在发布之前满足高标准。[上一任后训练主管Barret Zoph已于9月底和首席技术官Mira Murati、首席研究官Bob McGrew同时离职。]新上任的Liam Fedus曾在Google Brain工作,于2022年9月加入OpenAI,参与过ChatGPT的研发,是9月13日发布的新推理模型OpenAI o1七大负责人之一。差不多同一时间,OpenAI高级研究员Luke Metz在社交媒体宣布离职。他和Barret Zoph、Liam Fedus有着相似的职业背景,同样在Google担任过研究员,也是ChatGPT的幕后元老和o1的贡献者。近日还有消息称,Barret Zoph正在计划成立一家新公司,但尚不清楚Luke Metz和Mira Murati等人是否加入。

-END-

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/890687.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

这是我见过最全LLM大模型基础知识学习汇总,建议收藏!

关于如何入门LLM,大多数回答都提到了调用API、训练微调和应用。但是大模型更新迭代太快,这个月发布的大模型打榜成功,仅仅过了一个月就被其他模型超越。训练微调也已经不是难事,有大量开源的微调框架(llamafactory、fi…

大模型本地部署教程 | 搭建本地AI问答系统

前言 大家好,因为对AI大模型很感兴趣,相信很多兄弟们跟我一样,所以最近花时间了解了一些,有一些总结,分享给大家,希望对各位有所帮助。 本文将讲解如何在本地搭建一个简易的AI问答系统,主要用j…

【网络】【Linux】多路转接技术

多路转接技术 文章目录 1.select1.1select系统调用及参数介绍1.2select基本工作流程1.3select技术实现echo服务器1.4select优缺点1.5select的适用场景 2.poll(了解)2.1poll系统调用及参数介绍2.2poll技术实现echo服务器2.3poll优缺点 3.epoll3.1epoll系…

探索 ES6 生成器 ( Generator ) 的异步编程应用

一. 前言 在之前的文章中,我们介绍了生成器函数的基本概念和常见应用,包括异步操作的顺序执行、控制异步流程等,同时也了解到 Promise 和生成器结合的应用可以帮助我们更方便地处理异步操作。详细了解请参考之前的文章: 学习 ES…

前端Vue3字体优化三部曲(webFont、font-spider、spa-font-spider-webpack-plugin)

前端Vue字体优化三部曲(webFont、font-spider、spa-font-spider-webpack-plugin) 引言 最近前端引入了UI给的思源黑体字体文件,但是字体文件过于庞大,会降低页面首次加载的速度,目前我的项目中需要用到如下三个字体文…

Java 8 的内存结构

Java8内存结构图 虚拟机内存与本地内存的区别 Java虚拟机在执行的时候会把管理的内存分配成不同的区域,这些区域被称为虚拟机内存,同时,对于虚拟机没有直接管理的物理内存,也有一定的利用,这些被利用却不在虚拟机内存…

每天3分钟,彻底弄懂神经网络的优化器(十)Nadam

1. Nadam算法的提出 Nadam(Nesterov-accelerated Adaptive Moment Estimation)算法是由Tim Salimans et al. 在2016年提出的。这一算法结合了Adam算法和Nesterov Accelerated Gradient(NAG)算法的优点,旨在提高优化算…

[运维]6.github 本地powershell登录及设置ssh连接

当我在本地的git hub 进行修改后,需要推送到远程github仓库。 当我运行了git add . git commit -m "ingress-controller image" 以后,运行git push origin main,发现由于网络原因无法连接到远程github仓库。 此时开始设置ssh连…

MySQL中表的约束

1,概念 表中一定要有各种约束,通过约束,让我们来插入数据库中的数据是符合预期的。 约束本质是通过技术手段,倒逼程序员插入正确的数据;反过来,站在MySQL的角度来单,内部已经插进来的数据&…

即插即用hilo注意力机制,捕获低频高频特征

题目:Fast Vision Transformers with HiLo Attention 论文地址: https://arxiv.org/abs/2205.13213 创新点 HiLo自注意力机制:作者提出了一种新的自注意力机制,称为HiLo注意力,旨在同时捕捉图像中的高频和低频信息。该方法通过…

通信工程学习:什么是SPI串行外设接口

SPI:串行外设接口 SPI,即串行外设接口(Serial Peripheral Interface),是一种由Motorola公司首先在其MC68HCXX系列处理器上定义的同步串行接口技术。SPI接口主要用于微控制器(MCU)与外部设备之间…

1. 到底什么是架构

1. 什么是架构 定义:架构,又名软件架构,是有关软件整体结构与组件的抽象描述,用于指导大型软件系统各个方面的设计优秀架构的特点:优秀的性能、超强的TPS/QPS的承载能力、高可用决定了你能够支撑多少PV的流量 2. 什么…

【Linux修炼进程之权限篇】探讨Linux权限问题

【Linux修炼】——权限问题 目录 一:认识Linux下用户的分类 1.1:如何添加新用户【使用root用户创建添加】 1.2:su指令用法 二:Linux下权限是什么? 2.1:权限所认证的是身份(人身份角色) 2.2&#xff…

【WPF】04 Http消息处理类

这里引入微软官方提供的HttpClient类来实现我们的目的。 首先,介绍一下官方HttpClient类的内容。 HttpClient 类 定义 命名空间: System.Net.Http 程序集: System.Net.Http.dll Source: HttpClient.cs 提供一个类,用于从 URI 标识的资源发送 HTTP 请…

dbt doc 生成文档命令示例应用

DBT提供了强大的命令行工具,它使数据分析师和工程师能够更有效地转换仓库中的数据。dbt的一个关键特性是能够为数据模型生成文档,这就是dbt docs命令发挥作用的地方。本教程将指导您完成使用dbt生成和提供项目文档的过程。 dbt doc 命令 dbt docs命令有…

Gitxray:一款基于GitHub REST API的网络安全工具

关于Gitxray Gitxray是一款基于GitHub REST API的网络安全工具,支持利用公共 GitHub REST API 进行OSINT、信息安全取证和安全检测等任务。 Gitxray(Git X-Ray 的缩写)是一款多功能安全工具,专为 GitHub 存储库而设计。它可以用于…

STM32CUBEIDE的使用【三】RTC

于正点原子潘多拉开发板&#xff0c;使用stm32官方免费软件进行开发 CubeMx 配置 使用CubeMx 配置RTC 勾选RTC 设置日期和时间 配置LCD的引脚用来显示 STM32CUBEIDE 在usbd_cdc_if.c中重定向printf函数用于打印 #include <stdarg.h>void usb_printf(const char *f…

第十六章 RabbitMQ延迟消息之延迟插件优化

目录 一、引言 二、优化方案 三、核心代码实现 3.1. 生产者代码 3.2. 消息处理器 3.3. 自定义多延迟消息封装类 3.4. 订单实体类 3.5. 消费者代码 四、运行效果 一、引言 上一章节我们提到&#xff0c;直接使用延迟插件&#xff0c;创建一个延迟指定时间的消息&…

【C++算法】双指针

目录 一、快乐数&#xff1a; 二、有效三角形的个数&#xff1a; 三、盛最多水的容器&#xff1a; 四、复写0&#xff1a; 五、三数之和&#xff1a; 总结&#xff1a; 一、快乐数&#xff1a; 题目出处&#xff1a; 202. 快乐数 - 力扣&#xff08;LeetCode&#xff09…

ROS2 通信三大件之动作 -- Action

通信最后一个&#xff0c;也是不太容易理解的方式action&#xff0c;复杂且重要 1、创建action数据结构 创建工作空间和模块就不多说了 在模块 src/action_moudle/action/Counter.action 下创建文件 Counter.action int32 target # Goal: 目标 --- int32 current_value…