今天,OpenAI再一次引爆了科技圈。这次的核心亮点无疑是他们的全新模型:GPT-4o,以及基于此模型构建的全新ChatGPT版本。
GPT-4o是什么?
OpenAI 最新推出的 GPT-4o,“o”代表“Omni”,这一拉丁词根在英语中常用作前缀,表示“全体”、“所有”或“全面的”。
GPT-4o在多模态基准测试集上的表现,远超以往任何模型,特别是在图表理解和视觉回答等方面表现出了无与伦比的优势。
文本能力:
音频能力:
各个语言的考试能力:
最核心的是最后一个:
GPT-4o不仅仅是一个多模态模型,它融合了文本处理、图像分析、视频理解及语音交互功能。最关键的是,它能实时处理音频和视觉信息,这在以往的模型中是不可想象的。
此模型以其全面的响应能力,可以在对话中实时反馈,用户亦可随时中断其回答。与前代模型 GPT-4 Turbo 相比,GPT-4o 的处理速度提高了一倍,同时成本减半,展示了显著的技术进步。
GPT-4o有哪些新功能和优势?
GPT-4o 的引入不仅标志着技术上的里程碑,也带来了多方面的新功能和显著优势:
多模态交互能力:该模型首次将文本、声音和图像输入完美融合,实现多样化的输出,极大地增强了与人类的交互自然性。
增强的视觉和语音功能:用户现可直接上传图片或视频,GPT-4o 能即刻进行内容分析和对话,如翻译外语菜单、讨论图像内容等。新版ChatGPT在语音对话中几乎无延迟,能够感知到用户的情绪,甚至是呼吸声。它不仅能够理解人类的情感,还能表达出几乎与真人无异的情绪反应。
性能与成本的双重优化:在提供顶级AI服务的同时,新模型的运行效率和成本效益都有显著提升,处理速度是以往的两倍,成本降低50%。
ChatGPT的表现,不仅仅是在模拟对话上,它甚至能直接与用户进行视频对话,识别用户的所有表情和情绪变化。
此次发布会的一个亮点是,现场直接开启了摄像头,当OpenAI的工作人员向ChatGPT展示写有“我爱ChatGPT”的纸条时,它竟像个害羞的小女生般尖叫起来。这种情感的展现,让人难以相信这仅仅是一台AI。
更多更新
随着 GPT-4o 的推出,OpenAI 新推出的 macOS 桌面应用程序,使得用户能够更便捷地接入和使用 GPT-4o,通过简单的快捷键便可激活 AI 助手,实现无缝的多任务处理。
未来展望和评价
在 OpenAI CEO 奥特曼的最新博文中,他对 GPT-4o 的未来给予了高度评价。他认为,这种新型的计算机界面将彻底改变人们与技术的互动方式,使其更加直观、自然。奥特曼特别指出,随着 AI 技术的进一步发展,用户将享受到更加智能、快速且有趣的交互体验,这将不仅限于文字和声音,还将扩展到更全面的视觉和动态视频交互。
如何使用GPT-4o ?
现在网页版GPT-4o已经免费对所有用户开放了!这是一个令人兴奋的消息。免费用户有条数限制,如果想增加使用次数,可以使用ChatGPT Plus账号(获取Plus参考:)
如果没有被灰度到 gpt-4o,可以试试这个关于如何使用GPT-4o的详细教程:
1. 访问网页版GPT-4o:您可以通过在浏览器中输入以下网址来访问网页版GPT-4o:
2.在ChatGPT对话中切换模型,使用GPT-4o:一旦进入GPT-4o的用户界面,您就可以开始与模型进行对话了。您可以在输入框中键入您的问题、请求或对话内容,并等待GPT-4o生成回答。GPT-4o将根据您的输入内容提供有意义和连贯的回答。
我的更多文章在工众号【机器学习与物联网】,欢迎阅读,谢谢你!
最后我们直接给大家整了一套很全面的AI中文前沿资(https://jingle.bio/xiaobaotong1/,若打不开请扫码或者联系薇信1947099691获取最新资料),精选最优质的前10%优质资讯 ,按照人群和内容定位分类,希望能够帮助你快速找到优质内容。