新火种AI|Claude 3.5一夜封王超越GPT-4o!留给OpenAI的时间真的不多了...

AI大模型更新换代的速度,的确快到令人难以想象。

相信很多人现在对“最先进AI大模型”的印象还停留在GPT-4,但事实上,大模型领域的头把交椅早已悄然易主了好几回。就在GPT-4惊艳全球不久之后,其“死对头” Anthropic发布了Claude 3系列,瞬间将GPT-4拉下了神坛。随后,OpenAI发布了GPT-4o,又暂时抢回来了属于自己的领先地位。

但如今,OpenAI不得不再次面临严峻挑战。就在最近,Anthropic发布了Claude 3.5 Sonnet,不仅较先前版本各方面性能都有了质的提升,还又一次将GPT-4o按在地上摩擦。

Claude 3.5 Sonnet昨夜震撼上线!性能更突出,价格更便宜,直接吊打GPT-4o。

6月20日深夜,Anthropic突然发布了下一代旗舰大模型Claude 3.5 Sonnet。

那么,Claude 3.5 Sonnet究竟惊艳在哪里呢?

首先,跟自己上一版本中最强的Claude 3 Opus相比,Claude 3.5 Sonnet不仅速度提升了200 %,其成本还直接降低了80 %,性价比直接拉满

此外,Claude 3.5 Sonnet拥有最强视觉模型,在所有标准测试中,均超越了前代Claude 3 Opus。

更重要的是,Claude 3.5 Sonnet不仅跟自己比才厉害,其各项性能和效率也遥遥领先于GPT-4o。

尤为值得一提的是,Claude官网上还推出新功能——Artifacts 预览版。说白了,这就是创建了一个动态工作区。用户可以通过Claude生成文档,代码,矢量图,或是简单的游戏。而Artifacts则可以出现聊天界面旁边,这样用户能够实时查看,迭代和创建自己的作品。外界认为,Artifacts 预览这一功能的出现,标志着Claude将从对话式 AI 进化为协作式工作环境

目前,Claude 3.5 Sonnet 已经在 Claude.ai 和 Claude iOS 应用程序上免费提供,而 Claude Pro 和 Team 计划订户则可以享受更高速率。此外,Claude 3.5 Sonnet 还可以直接通过 Anthropic API,亚马逊云科技 Bedrock 等渠道使用。

除了在性能上全面碾压,其价格也明显低于GPT-4o。

如今,Claude 3.5 Sonnet已经面向全球开启免费试用了。在费用上,Sonnet处理每百万输入token仅需3美元,每百万输出token仅为15美元。对比之下,GPT-4o的每百万输入token收费5美元,每百万输出token为15美元。

压力给到了OpenAI:GPT-5何时能问世?

对于Anthropic此次发布的新产品,外界普遍持有肯定的态度

前OpenAI对齐团队负责人Jan Leike就表示,自己很喜欢喜欢Sonnet新模型。他提到,自己会要求Sonnet解释ML论文。虽然不一定全对,但会比自己粗读略读的结果要好,速度也快得多。可以说,自动对齐的研究距离我们越来越近了。

Anthropic的产品经理Michael Gerstenhaber则直接将自己公司的新模型称之为“世界上最智能的模型”。他表示,“我们正处于这个行业寒武纪大爆发的开端”。而更加先进的Claude 3.5 Haiku和最强版Claude 3.5 Opus会在今年晚些时候陆续推出。由此可见,各大模型厂商们是彻底卷起来了,竞争也越来越激烈。

而好奇的网友们也在Claude 3.5 Sonnet发布的第一时间上手测评。大家发现,Sonnet写代码的速度着实惊人。有的网友仅仅通过一次对话,就用threejs+cannonjs创建出一个3D太阳系模型,包含了物体和碰撞效果。还有网友认为,使用Claude 3.5 Sonnet进行编码的效率比其他任何大型语言模型都要高,还可以达到GPT-4的10倍。特别是在全新的Artifacts功能的加持下,用户可以边聊天边生成和运行代码,简直令人惊叹。还有网友借助Sonnet力量,在不到2分钟的时间里做出了一个戴着太阳镜的小狗吃骨头的游戏。

正如前面提到的那样,Claude 3.5引入的超强实时交互功能Artifacts,毫无疑问,这一亮点开启了交互式AI最有潜力的形式。它标志着Claude从对话式AI向协作工作环境的转变,而在不久的未来,Anthorpic还会设想整个组织都能在共享空间中集中知识,文档以及工作,而Claude会随时提供服务。

Claude 3.5 Sonnet表现如此出色,很多网友戏言:压力直接给到OpenAI了。毕竟,如果今年年底GPT-5再不发布,OpenAI被中美两国的大模型迅速赶超这件事将会成为不争的事实。

即便GPT-5如期而至,大家也会担忧,相较GPT-4,新一版的推理能力会不会显著提高?现在硅谷坊间盛传,一次显著的性能提升至少要依靠10万张,乃至20万,30万张GPU卡。在这种情况下,OpenAI是否会有足够的GPU卡来训练高质量数据?就目前来看,这一切都是未知数。

Anthropic与OpenAI之间再添新仇!两大AI独角兽公司之间的较量愈演愈烈...

大家对Claude和GPT之间的角力如此关注,这其中有一个很关键的因素,那就是大模型比拼背后潜藏的,是Anthropic与OpenAI之间的“爱恨情仇”。

就在今年5月,也就是Claude 3 Opus强势上线的时候,Anthropic的创始人Dario Amodei和Daniela Amodei(二人是兄妹)就对OpenAI展开了暗戳戳的“嘲笑”,称Anthropic的人工智能是世界上最好的。他们表示,Claude 3 Opus是世界上最强大的人工智能模型(在当时) 。

Amodei兄妹曾是OpenAI的前员工。2020年6月,就在OpenAI发布第3代大语言模型GPT-3的半年之后,负责OpenAI研发的研究副总裁Dario Amodei和安全政策副总裁Daniela Amodei决定离职。究其原因,是因为他们对当时OpenAI管理层的理念和政策不甚认同,在价值观上存在着严重的偏差。离职后,他们创建了一家专注于安全的人工智能公司,即Anthropic。

值得一提的是,Anthropic的创始团队其实就是GPT系列产品的早期开发者,这也是他们后来所推出的Claude系列可以与GPT系列想抗衡的重要原因。

Anthropic团队有一个很明确的目标,就是构建一套“可靠,可解释,可控”的以人类(利益)为中心的人工智能系统。

事实上,这些关键词是OpenAI的昔日愿景。但在2019年之后,尤其是OpenAI接受了微软100亿美元的投资之后,愿景与现实起了冲突。如今,Amodei兄妹重拾了老东家的愿景,并研发出了更为智能的AI大模型,直接站在了老东家的对立面,成为其名副其实的竞争对手。

如今3年过去了,Anthropic拥有7名联合创始人,发展稳定,业务蒸蒸日上,还与谷歌,亚马逊之间展开了价值数十亿美元的合作关系。反观OpenAI,却在过去的几个月里损兵折将:创始成员Andrej Karpathy在2月份离开了 OpenAI,联合创始人 Ilya Sutskever前段时间官宣离职等核心成员离职的事情不断发生。

毫无疑问,这两大AI独角兽公司未来的竞争会日趋白热化。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/734062.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024/6/22 英语每日一段

France is the only country in Europe with an EPR that covers the textile industry. Critics say the policy does little for “end-of-line” countries such as Ghana because the fee paid by clothing producers is low at just €0.06 for each item, and the funds …

8_机械臂工作台坐标系标定及验证

1、机械臂实际数据 AUBO 机械臂xOxy方式标定用户坐标系: O: X轴正半轴一点: XOY象限任意一点(还是有一些要求的): 一些坐标点的验证: 2、如何根据上述3点,计算work1坐标系与base坐标系的关系? 最开始在网上没找到相关的…

90V转12V1A恒压WT6039

90V转12V1A恒压WT6039 WT6039降压DC-DC转换器芯片专为处理宽泛的电压输入范围设计,支持从12V至90V。该芯片集成了关键功能,如使能控制开关、参考电源、误差放大器、过热保护、限流保护及短路保护等,以确保系统在各种操作条件下的安全与稳定性…

【朝花夕拾】RT1170 CSI 如何使能摄像头Y8功能

【朝花夕拾】RT1170 CSI 如何使能摄像头Y8功能 一,文档简介二,RT1170 CSI Y8黑白格式配置与测试2.1 软硬件情况2.2 Y8黑白格式的具体配置2.3 测试结果 一,文档简介 RT1170的CSI可以支持YUV格式,所谓的YUV分为三个分量&#xff1a…

xocde编辑器支持修改为中文吗?不支持

xocde编辑器支持修改为中文吗? 不支持

储能电池竞争出海分析

锂电池的激烈竞争进一步蔓延到储能行业。为保市场份额和现金流稳定,不少储能电池企业都开始大幅度降低报价只求中标储能项目。 随着6月的储能电芯的最高限价和系统报价都已经贴近成本价,一二三线的储能电池厂商将要如何应对? 1、储能规模快速…

Redis进阶 - Redis 淘汰策略

我们知道Redis是分布式内存数据库,基于内存运行,可是有没有想过比较好的服务器内存也不过几百G,能存多少数据呢,当内存占用满了之后该怎么办呢?Redis的内存是否可以设置限制? 过期的key是怎么从内存中删除的…

重学java 80.Junit单元测试

我总是着急的解释我自己,却忘了厚爱无需多言 —— 24.6.21 一、Junit介绍 1.概述 Junit是一个单元测试框架,可以代替main方法去执行其他的方法 2.作用 可以单独执行一个方法,测试该方法是否能跑通 3.注意 Junit是第三方工具,所以使用之前需要导入jar包 二、J…

1.SG90

目录 一.实物图 二.原理图 三.简介 四.工作原理 一.实物图 二.原理图 三.简介 舵机(英文叫Servo),是伺服电机的一种,伺服电机就是带有反馈环节的电机,这种电机可以进行精确的位置控制或者输出较高的扭矩。舵机…

在线二维码解码器:将二维码转换成网址链接

在当今数字化时代,二维码(QR码)已成为一种便捷的信息传递工具。它不仅可以存储大量数据,还能快速分享信息。然而,有时我们需要将二维码中的内容转换为网址链接,以便在浏览器中直接访问。小编将详细介绍如何…

关于jupyter notebook的使用经验

jupyter notebook 第一点,调整每次打开jupyter notebook的时候的位置第二点,如何设置jupyter notebook可以使用本地anaconda创建的虚拟环境呢?第三点,使用jupyter notebook的技巧 以下三点都是独立的,可以根据自己的需…

【Gradio】构建自定义多模态聊天机器人

这是我们构建自定义多模态聊天机器人组件两部分系列的第一部分。在第一部分中,我们将修改 Gradio 聊天机器人组件,使其能够在同一消息中显示文本和媒体文件(视频、音频、图片)。在第二部分中,我们将构建一个自定义的文…

3D视觉引导机器人提升生产线的自动化水平和智能化程度

随着智能化技术的不断发展,汽车制造企业正积极寻求提升智能化水平的途径。富唯智能的3D视觉引导机器人抓取技术为汽车制造企业提供了一种高效、智能的自动化解决方案。 项目目标 某汽车制造企业希望通过引入智能化技术提升生产线的自动化水平和智能化程度。他们希望…

哎呦我, HashMap KeySet有序? 好像是哈

背景:有8个格子,上架物品时需要从第一个格子开始上架,不能跳格子,也就是说 如果格子1空着,就不能把物品放到格子2。有这么个顺序的情况 前人模块功能实现: 用HashMap 初始化格子信息,然后用 Ke…

2024年【T电梯修理】免费试题及T电梯修理考试总结

题库来源:安全生产模拟考试一点通公众号小程序 T电梯修理免费试题参考答案及T电梯修理考试试题解析是安全生产模拟考试一点通题库老师及T电梯修理操作证已考过的学员汇总,相对有效帮助T电梯修理考试总结学员顺利通过考试。 1、【多选题】TSGT7005-2012《…

基于vue3 + ant-design 使用阿里图标库iconfont.cn

对于使用 iconfont.cn 的用户&#xff0c;通过设置 createFromIconfontCN 方法参数对象中的 scriptUrl 字段&#xff0c; 即可轻松地使用已有项目中的图标。 组件封装 IconFont <template><IconFont :type"iconType" /> </template><script se…

联想Y7000P 2023款拆机教程及升级内存教程

0.电脑参数介绍 联想Y7000P 2023电脑&#xff0c;笔者电脑CPU为i7-13700H&#xff0c;14核20线程&#xff1b;标配内存为三星的DDR5-5600MHz-8GB*2&#xff0c;由于电脑CPU限制&#xff0c;实际内存跑的频率为5200MHz; 2个内存插槽&#xff0c;2个固态硬盘插槽。每个内存插槽最…

【Linux基础】SSH登录

SSH简介 安全外壳协议&#xff08;Secure Shell Protocol&#xff0c;简称SSH&#xff09;是一种加密的网络传输协议&#xff0c;可在不安全的网络中为网络服务提供安全的传输环境。 SSH通过在网络中建立安全隧道来实现SSH客户端与服务器之间的连接。 SSH最常见的用途是远程登…

python自动化办公工具:自动批量生成奖状的工具(可视化)

&#x1f446;点击关注 获取更多编程干货&#x1f446; 不知道大家有没有注意到一种趋势&#xff0c;现在即便是那些非程序员&#xff0c;甚至对计算机一窍不通的人&#xff0c;也开始学习Python了&#xff0c;其“普及程度”实在让人感到有些惊讶。 那么&#xff0c;对于那些…

Github 2024-06-22 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-06-22统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量TypeScript项目3JavaScript项目2Python项目2HTML项目1Rust项目1Dart项目1Dockerfile项目1Shell项目1C++项目1Swift项目1RustDesk: 用Rust编写的…