原文链接:ChatGPT发布最新版本!新版GPT-4 Turbo重回王座!碾压Claude
那个聪明、强大的 ChatGPT,终于又回来了!
ChatGPT也能用上最强的GPT-4 Turbo了!今天,新版GPT-4 Turbo再次重夺大模型排行榜王座,超越了Claude 3 Opus。
referer:https://twitter.com/OpenAI/status/1778574613813006610
同时OpenAI已经宣布,最新版本的能力会同时在开放。
referer:https://twitter.com/OpenAI/status/1778574617449545809
有了GPT-4 Turbo加持后,ChatGPT写作、数学、逻辑推理和编码的能力得到提升。
OpenAI 内部员工也发文表示,ChatGPT是目前最强大的。
就连奥特曼本人表示,「GPT-4现在更加智能,使用起来也更舒适」。
GPT大玩家在ChatGPT Plus版本上查看,发现训练数据已经更新到了2024年的4月份。
根据基准测试结果,GPT-4 Turbo在数学能力比上一代有了明显改进。
最重要的是!GPT-4 Turbo 可在 ChatGPT Plus、Team 、Enterprise 和 API 中使用。你还有什么理由不升级!
根据 ChatGPT升级 很方便就可以使用ChatGPT Plus和API了。
测评说明
前段时间,Anthropic手里的最强大模型Claude 3 Opus,可以说是霸榜各大榜单。
不过,就在今天,OpenAI凭借着全新的gpt-4-turbo,王者归来!
根据大模型专业评测机构lmsys.org 最新发布的gpt-4-turbo评测报告得出结论。
lmsys从多个领域收集了超过8000张人类投票,发现GPT-4-Turbo在编程与推理方面的表现,超越了其他模型。
referer:https://twitter.com/lmsysorg/status/1778555678174663100
研究人员还对编程领域中包含代码片段的所有对话进行了标记。在这一方面,GPT-4-Turbo展现出更强的性能。
类似的,Naman Jain也发现,新版GPT-4-Turbo在LiveCodeBench(包含编程竞赛题)上的表现,提高了惊人的4.5分,超越了其他所有的大模型。
作为程序员的 我 不要太开心。
其他综合测评
模型评分的置信区间 (CIs) :
整体的胜率热图:
### 总结
这一次OpenAI看来是真的被逼急了,拿出来自己的看家本领了,同时恭喜ChatGPT杀回第一名。
作为程序员的 GPT玩家,看到了这次ChatGPT在编程方面巨大的提升,真的是超级激动!
日常的工作和生活,我现在都是直接使用ChatGPT Plus来完成了,不仅功能更加丰富而且能力也更加强大。
建议大家还没有升级到ChatGPT的,可以根据 升级chatgpt教程 升级体验一下,当前最为强大的人工智能工具。
当前人工智能飞速发展,作为见证这个发展的我们,我觉得我们每个人都可以体验和使用 ChatGPT Plus 工具,感受一下科技和人工智能给我们带来的震撼。