GPT 4.5 可能是戳破 AI 泡沫的模型

GPT 4.5 可能是戳破 AI 泡沫的模型

Andrew Zuo

本文点评:在AI技术狂飙突进的同时,也有许多声音包括本文的作者在内都认为AI行业正陷入巨大泡沫,技术突破逐渐停滞,高昂的硬件成本与资本退潮或将引爆寒冬。然而,这些观点大多忽视了技术的本质价值,真正值得关注的并非模型参数是否再翻百倍,而是现有AI技术已经实实在在推动各行业降本增效、提升生产力。AI的价值从来不只是技术炫技,而是作为工具深度嵌入社会生产,带来生产方式与商业模式的深刻变革。技术高原期,并非泡沫破裂的信号,而是AI赋能产业全面加速的起点。

AI 正处在一个泡沫里,而且已经在泡沫里待了挺长时间了。基本上每一家 AI 公司都在赔钱。微软每个 Copilot 用户都在亏钱,Anthropic 在亏钱,甚至 OpenAI 也在亏钱。是的,连他们那个每月 200 美金的专业版订阅:

离谱的事情:我们现在在 OpenAI 专业订阅上是亏钱的!

大家用得比我们预期的多得多。

你怎么能在一个每月 200 美金的订阅上亏钱啊!?

AI 明显是不可持续的。每家公司都只是在烧钱,拼命往下卷。

我其实已经想了很久,这个泡沫什么时候会破。唯一还没破的原因就是一堆蠢投资人还在妄想着赚大钱,不断砸钱进去。当他们意识到 AI 的进展已经停滞,他们就会停止这种荒唐的融资狂潮,AI 泡沫就会破。

而且我觉得我们离那个点已经不远了。我之前写过一篇文章,标题是《LLM 已经停滞的三个原因》,里面讲了 AI 产业面临的三个大问题:硬件问题、电力短缺、还有模型崩溃。

但即便这样,各家公司还是继续把模型做得越来越大、越来越强。但我觉得我们终于在刚发布的 GPT 4.5 上撞到天花板了。而且我觉得 GPT 4.5 可能就是那个戳破 AI 泡沫的模型。

首先让我们看看我们是怎么走到这一步的。目前的 AI 热潮其实就是靠把模型越做越大撑起来的。GPT-1 有 1.17 亿参数。GPT-2 有 15 亿参数。GPT-3 有 1750 亿参数。现在 OpenAI 并没有公开 GPT-4 有多少参数,但网上很多乱七八糟的人都很大胆地声称他们知道具体参数是多少。他们通常猜大概是 1.7 万亿参数左右。

那 GPT-5 会有多少参数呢?GPT-2 大概是 GPT-1 的 12.8 倍。然后 GPT-3 又比它大了大概 116.6 倍。再然后 GPT-4 又比 GPT-3 大了大概 9.7 倍。所以我们大概可以预计 GPT-5 会比 GPT-4 大个 10 到 100 倍。为了讨论方便,我们就假设它大概是 30 倍,大约是 51 万亿参数。30 倍大,也就意味着 30 倍贵。

这个就很有意思了,因为 OpenAI 最近发布的这个 GPT-4.5,大概就是 GPT-4o 成本的 30 倍:

这让我怀疑 GPT-4.5 本来是要叫 GPT-5 的,但因为表现太让人失望了,他们才改名叫 GPT-4.5。其实我们之前都知道这个模型的代号:Orion。而且当时大家都说它会非常厉害。

结果呢?并不是!

实际上在发布公告里他们自己都说了:

GPT 4.5 是一个非常庞大且计算密集的模型,所以它比 GPT 4o 贵,而且不是 GPT 4o 的替代品。基于这个原因,我们正在评估是否要在 API 里长期提供它,因为我们需要在支持当前能力和构建未来模型之间做平衡。我们期待在真实场景里更多了解它的优点、能力和潜在应用。如果 GPT 4.5 对你的使用场景有独特价值,你的反馈会对我们决定方向起到重要作用。

“我们正在评估是否要在 API 里长期提供它” 这个话确实不太让人放心。

其他人也指出 GPT-4.5 的表现让人失望。ArsTechnica 直接称它是“柠檬货”,说“已经盖棺定论:OpenAI 最新、最强的传统 AI 模型 GPT-4.5 又大、又贵、又慢,比 GPT-4o 只强了一点点,成本却贵了 30 倍输入和 15 倍输出。”而且很多人都表达了类似的看法。

虽然我也不确定这些吐槽要不要全信。大家都很快指出它贵了 30 倍。但其实这个模型比 GPT-4 刚发布那会儿也没贵多少。

GPT-4 刚发布时,他们不是按百万 token 计费的,而是按千 token 计费。而且当时有两个版本:一个是 8K 上下文窗口的,一个是 32K 上下文窗口的。贵的那个每千输入 token 要 6 美分,每千输出 token 要 12 美分。也就是每百万输入 token 60 美金,每百万输出 token 高达 120 美金。对,GPT-4 刚出来的时候就是贵到离谱,所以我才不想在我的应用里用它。

如果 OpenAI 当初把 Orion 直接叫 GPT-5,我敢肯定成本最后也会慢慢降下来。他们可能后面还会出 GPT-5o 和 GPT-5o mini。那为什么没这样做?

因为 GPT-4 刚发布的时候,它确实比 GPT-3.5 好太多了。谁还记得这张图:

这跨度确实挺大的。是贵了很多,但跟 GPT-3.5 比确实提升很大。那 Orion 呢?嗯……

他们只展示了这些图,这让我怀疑 GPT-4.5 在很多方面其实打不过 GPT-4o。而且有意思的是,这些图里根本没包含 o3 reasoning 模型,只放了 o3-mini。

不过至少 OpenAI 说它有更多的情绪智能。这让我想起我之前文章里写的一句话:

这就是为什么我们要有情绪智能。这是个笑话,情绪智能根本就不存在。

而且对话感觉更自然的原因,就是你们特意微调成这样的。GPT-3.5 当初也是一样的。GPT-4o 的时候,他们加了一堆乱七八糟的微调,让它每个问题都必须详细解释,因为用户就喜欢那套。

当然,现在还是有可能会出个类似 o4 的模型,基于 Orion 搞的,能打过 o3。但问题是这种思考型模型都需要额外很多 token 去“思考”。如果用 Orion 来思考,那就会贵到离谱。而且还会把所有 GPU 都占满。

坏消息:它是个巨大、昂贵的模型。我们本来真的很想同时推给 plus 和 pro 用户,但最近用户增长太快,我们 GPU 都不够用了。我们下周会新增几万块 GPU,然后推给 plus 用户。(后面还会再加几十万块,我敢肯定你们会把我们能装上的每一块都用光。)

Orion 大概是 30 倍规模,所以也大概需要 30 倍的 GPU。GPT-4 推出来时还不是问题,但 Nvidia 这两年根本没跟上 AI 市场的扩张速度,所以现在 Orion 被 GPU 卡住了。

看来我得给 LLM 停滞的原因再加一条:硬件问题、电力短缺、模型崩溃,还有现在的 GPU 短缺。

所以我真看不出 AI 产业还能往哪走。OpenAI 已经证明了,单纯靠模型规模暴力堆上去,已经不再带来显著性能提升了。大语言模型这种“简单堆料”的时代要结束了。AI 泡沫破掉之后,可能我们会迎来下一个 AI 寒冬。而 GPT 4.5 可能就是那个引爆点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/982626.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Linux内核系列】:进入文件系统的世界

🔥 本文专栏:Linux 🌸作者主页:努力努力再努力wz 那么从本篇文章开始就要进入文件系统的学习了,那么之前的内容主要围绕的是进程的相关概念以及进程控制有关的系统调用接口的介绍,以及最后结合之前所学的知…

CentOS 7.9 安装 ClickHouse 文档

1. 环境准备 确保系统为 CentOS 7.9,并已安装 Docker。如果未安装 Docker,请先安装 Docker。 安装 Docker # 卸载旧版本 Docker(如果有) sudo yum remove -y docker docker-client docker-client-latest docker-common docker-…

(链表 删除链表的倒数第N个结点)leetcode 19

设空结点指向head便于插入和删除结点 考虑特殊情况 head结点被删除 a结点仅用来测试长度,找到目标结点的位置 b结点为空结点指向head返回值 cur用来删除目标值(特殊情况 目标值为head 这时curb) 则开始就将cur初始化为b开始遍历 /*** Definition fo…

电力杆塔倾斜监测装置:守护电网安全的智能卫士

​ ​电力杆塔作为电力传输的重要支撑结构,其安全性直接关系到电网的稳定运行和电力供应的可靠性。然而,由于自然环境的复杂性和外部因素的影响,杆塔倾斜、倒塌等问题时有发生,给电力系统带来了巨大的安全隐患。为了应对这一挑…

【单片机项目】电源如何扩展、电源模块、电池模块如何接线

一、前言 解决2个关键问题: 【1】如果项目编号小于172之前的项目。 可能会遇到电源模块不够接,需要扩展电源的问题。 【2】如果项目编号是大于 172之后项目,部分项目用到了稳压电源模块或者是电池模块。 这篇文章单独讲解一下如何接线。 …

NO.28十六届蓝桥杯备战|string|insert|find|substr|关系运算|stoi|stol|stod|stof|to_string(C++)

insert 如果我们需要在字符串中间的某个位置插⼊⼀个字符串,得掌握⼀个函数就是insert string& insert (size_t pos, const string& str); //pos位置前⾯插⼊⼀个string字符串 string& insert (size_t pos, const char* s); //pos位置前⾯插⼊⼀个…

贪心算法一

> 作者:დ旧言~ > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:了解什么是贪心算法,并且掌握贪心算法。 > 毒鸡汤:有些事情,总是不明白,所以我不会坚持。早安! >…

逐梦DBA:MySQL的编码设置

一、MySQL的编码设置 1.1 默认插入中文数据存在的问题 1.1.1 在 MySQL5.7 版本,默认在安装成功后存在中文乱码的问题 1. 通过 show create table xxx查看可以发现默认的字符集: 2. show variables like character_%;查看编码命令发现默认为拉丁 如果我…

Windows 图形显示驱动开发-WDDM 3.2-GPU-P 设备上的实时迁移(一)

本文介绍了通过 SR-IOV(单根 I/O 虚拟化)分区虚拟化的异构计算设备(GPU、NPU 等)实时迁移的功能设计。 通过 WDDM 和 MCDM 驱动程序模型支持分区的设备现已成为我们虚拟化产品不可或缺的一部分。 因此,必须支持实时迁移并帮助我们的虚拟化抽象实现最大程度的可靠性&…

张驰咨询:用六西格玛重构动力电池行业的BOM成本逻辑

在动力电池行业,BOM(物料清单)成本每降低1%,都可能改写企业的利润曲线。某头部企业的三元锂电池BOM成本曾较行业标杆高出11%,单电芯利润率被压缩至3%的生死线。然而,通过张驰咨询的六西格玛方法论&#xff…

Java 大视界 -- Java 大数据在智能政务公共服务资源优化配置中的应用(118)

💖亲爱的朋友们,热烈欢迎来到 青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也…

单例模式的五种实现方式

1、饿汉式 ①实现:在类加载的时候就初始化实例 ②优点:线程安全 ③缺点:实例在类加载的时候创建,可能会浪费资源 //饿汉式 public class EagerSingleton{private EagerSingleton(){} //私有构造方法private static EagerSingle…

WPS工具栏添加Mathtype加载项

问题描述: 分别安装好WPS和MathType之后,WPS工具栏没直接显示MathType工具,或者是前期使用正常,由于WPS更新之后MathType工具消失,如下图 解决办法 将文件“MathType Commands 2016.dotm”和“MathPage.wll”从Matht…

从开源大模型工具Ollama存在安全隐患思考企业级大模型应用如何严守安全红线

近日,国家网络安全通报中心通报大模型工具Ollama默认配置存在未授权访问与模型窃取等安全隐患,引发了广泛关注。Ollama作为一款开源的大模型管理工具,在为用户提供便捷的同时,却因缺乏有效的安全管控机制,存在数据泄露…

战略合作升级 | 大势智慧携手广西地测院,共绘智慧测绘新蓝图

2月26日,武汉大势智慧科技有限公司(以下简称“大势智慧”)与广西壮族自治区地理信息测绘院(以下简称“广西地测院”)在南宁举行战略合作升级签约仪式暨技术交流座谈会。 大势智慧董事长黄先锋与广西地测院党委书记、院…

MCU-SDRAM-W9825G6KH的存储单元

ARM-M7的Memory架构: 在Cortex-M7中,存储器一共有4GB的地址空间,4GB的地址空间又被划分为8个区域块,每个块有512M的内存。 Note:4GB的地址空间为 0x0000 0000 - 0xFFFF FFFF,可寻址的512M的地址空间为 0x00…

DeepSeek-R1国产化系统gpu驱动+cuda+ollama+webui可视化离线私有化部署

1.概述 网上大部分教程都是在线部署,完全离线私有化部署的文章不多,本文介绍从GPU驱动、cuda、ollama、deepseek模型和open webui等完全离线安装几个方面,让小白0基础也可以私有化部署大模型deepseek-R1。 我使用的设备是银河麒麟V10操作系统…

【蓝桥杯】每天一题,理解逻辑(3/90)【Leetcode 快乐数】

闲话系列:每日一题,秃头有我,Hello!!!!!,我是IF‘Maxue,欢迎大佬们来参观我写的蓝桥杯系列,我好久没有更新博客了,因为up猪我寒假用自己的劳动换了…

飞机大战lua迷你世界脚本

-- 迷你世界飞机大战 v1.2 -- 星空露珠工作室制作 -- 最后更新:2024年1月 ----------------------------- -- 迷你世界API适配配置 ----------------------------- local UI { BASE_ID 7477478487091949474-22856, -- UI界面ID ELEMENTS { BG 1, -- 背景 BTN_LE…

AI绘画软件Stable Diffusion详解教程(6):文生图、提示词细说与绘图案例

文生图即以文字描述来生成图像,这是目前所有AI绘画软件的基本功能之一。要想画一副好的图片,除了选择好的模型,在文生图中,提示词特别关键。 一、什么是提示词(Prompt) 提示词又称创意、关键词、咒语、ca…