OpenAI春季发布会, GPT-4o引爆科技圈 |千字文全面解读

今天,OpenAI再一次引爆了科技圈。这次的核心亮点无疑是他们的全新模型:GPT-4o,以及基于此模型构建的全新ChatGPT版本。

GPT-4o是什么?


OpenAI 最新推出的 GPT-4o,“o”代表“Omni”,这一拉丁词根在英语中常用作前缀,表示“全体”、“所有”或“全面的”。

0114c8c6115b7ddb292146d35b5d099f.jpeg

GPT-4o在多模态基准测试集上的表现,远超以往任何模型,特别是在图表理解和视觉回答等方面表现出了无与伦比的优势。

文本能力:

f6ba2393aa5067e31652d03d73c4bc20.jpeg

音频能力:

59afbce700a41e0577b3306dae229472.jpeg

各个语言的考试能力:

ee7dc14d9801d476745d50dc1db1ab74.jpeg

最核心的是最后一个:

135b6ba67885807cd15b90a044ca0b20.jpeg

GPT-4o不仅仅是一个多模态模型,它融合了文本处理、图像分析、视频理解及语音交互功能。最关键的是,它能实时处理音频和视觉信息,这在以往的模型中是不可想象的。

此模型以其全面的响应能力,可以在对话中实时反馈,用户亦可随时中断其回答。与前代模型 GPT-4 Turbo 相比,GPT-4o 的处理速度提高了一倍,同时成本减半,展示了显著的技术进步。

GPT-4o有哪些新功能和优势?


GPT-4o 的引入不仅标志着技术上的里程碑,也带来了多方面的新功能和显著优势:

  • 多模态交互能力:该模型首次将文本、声音和图像输入完美融合,实现多样化的输出,极大地增强了与人类的交互自然性。


  • 增强的视觉和语音功能:用户现可直接上传图片或视频,GPT-4o 能即刻进行内容分析和对话,如翻译外语菜单、讨论图像内容等。新版ChatGPT在语音对话中几乎无延迟,能够感知到用户的情绪,甚至是呼吸声。它不仅能够理解人类的情感,还能表达出几乎与真人无异的情绪反应。


  • 性能与成本的双重优化:在提供顶级AI服务的同时,新模型的运行效率和成本效益都有显著提升,处理速度是以往的两倍,成本降低50%。


ChatGPT的表现,不仅仅是在模拟对话上,它甚至能直接与用户进行视频对话,识别用户的所有表情和情绪变化。

19ed5953cc7879298c64612fa0d75535.jpeg

此次发布会的一个亮点是,现场直接开启了摄像头,当OpenAI的工作人员向ChatGPT展示写有“我爱ChatGPT”的纸条时,它竟像个害羞的小女生般尖叫起来。这种情感的展现,让人难以相信这仅仅是一台AI。


更多更新


随着 GPT-4o 的推出,OpenAI 新推出的 macOS 桌面应用程序,使得用户能够更便捷地接入和使用 GPT-4o,通过简单的快捷键便可激活 AI 助手,实现无缝的多任务处理。

未来展望和评价


在 OpenAI CEO 奥特曼的最新博文中,他对 GPT-4o 的未来给予了高度评价。他认为,这种新型的计算机界面将彻底改变人们与技术的互动方式,使其更加直观、自然。奥特曼特别指出,随着 AI 技术的进一步发展,用户将享受到更加智能、快速且有趣的交互体验,这将不仅限于文字和声音,还将扩展到更全面的视觉和动态视频交互。

如何使用GPT-4o ?

现在网页版GPT-4o已经免费对所有用户开放了!这是一个令人兴奋的消息。免费用户有条数限制,如果想增加使用次数,可以使用ChatGPT Plus账号(获取Plus参考:)


如果没有被灰度到 gpt-4o,可以试试这个关于如何使用GPT-4o的详细教程:

1. 访问网页版GPT-4o:您可以通过在浏览器中输入以下网址来访问网页版GPT-4o:

chatgpt.com/?model=gpt-4o

181c422308d18a0008112f07041c9802.jpeg

2.在ChatGPT对话中切换模型,使用GPT-4o:一旦进入GPT-4o的用户界面,您就可以开始与模型进行对话了。您可以在输入框中键入您的问题、请求或对话内容,并等待GPT-4o生成回答。GPT-4o将根据您的输入内容提供有意义和连贯的回答。

4d3309eb08cc32112860087f49bb6f18.jpeg

47f470f8df6a8c477895f77a772b7c90.jpeg

我的更多文章在工众号【机器学习与物联网】,欢迎阅读,谢谢你!

最后我们直接给大家整了一套很全面的AI中文前沿资(https://jingle.bio/xiaobaotong1/,若打不开请扫码或者联系薇信1947099691获取最新资料),精选最优质的前10%优质资讯 ,按照人群和内容定位分类,希望能够帮助你快速找到优质内容。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/624931.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CentOS报错: Fontconfig head is null, check your fonts or fonts configuration

错误 解决方案 这个报错的原因时java读取本地字体时发现字体损坏或者缺失,只需要补充一下字体就可以了,解决方法安装FontConfig组件即可: sudo yum install fontconfig

弥合孤岛:克服构建 DevOps 文化的挑战

持续变革正在发生软件开发行业。DevOps 因其对自动化、协作和持续改进的关注而成为优化软件交付并弥合开发和运营团队之间鸿沟的重要方法。然而,过渡到真正的 DevOps 文化并非没有挑战。本文探讨了您在追求 DevOps 时可能面临的障碍并提供了解决方案。 01 了解 Dev…

JINGWHALE 数字认证体系 · 进阶知识库

JINGWHALE 数字认证体系 是 JINGWHALE 数字科学艺术创新中心 的数字认证服务。 ◢◤ 宗旨 致力于数字化知行合一的知识赋能! ◥ 数字化人才培养 培养数字化思维,传播数字化知识,赋能各行业数字化。 ◥ 职业人才发展 无缝衔接学校高等…

Databend 开源周报第 144 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 了解 Databend …

有一个21年的前端vue项目,死活安不上依赖

在公司开发的时候遇到的一个很玄幻的问题,这个项目是21年开发的,现在我是24年中途二开增加新功能 这个项目经过多人之手,现在已经出现了问题------项目依赖安不上,我能启动完全是因为在23年的时候写这个项目的时候将依赖费九牛二虎之力下载好后打成了压缩包发给另外一个安不上依…

分析 vs2019 c++ 中的 decltype 与 declval

(1) decltype 可以让推断其参数的类型。按住 ctrl 点击 decltype ,会发现无法查阅 其定义 : (2) 但 STL 库里咱们可以查阅函数 declval 的 定义,很短,摘抄如下: templat…

PostgreSQL源码安装

文章目录 一、先决条件检查二、源码安装1、获取源代码2、编译安装1.运行 configure2.运行make 3、PostgreSQL的配置4、安装contrib目录下的工具 三、初始化数据库1、创建数据库管理员2、创建数据库实例3、启动和停止数据库4、设置数据库密码 四、PostgreSQL的简单配置1、pg_hba…

Java项目实现报文数据校验注解方式(必输项、值大小)

普通项目 导入校验依赖 <dependency><groupId>org.hibernate</groupId><artifactId>hibernate-validator</artifactId><version>4.1.0.Final</version></dependency><dependency><groupId>javax.validation</…

系统定期执行命令的方法

系统定期执行命令的方法 一、进入超级用户下 执行命令&#xff1a;sudo su 二、添加要执行的命令 例子&#xff1a;每天0点执行一次myapp.sh命令 先后输入&#xff1a;crontab -e、 1、 回车 设置每天0点执行一次myapp.sh操作&#xff0c;需要写绝对路径 含义&#xff1…

RK3576 Camera:资源介绍

RK3576是RK今年上市的中高端旗舰芯片&#xff0c;定位弱于RK3588。这篇文章主要分享一下RK3576这颗主控芯片的camera资源。 &#xff08;1&#xff09;RK3576 camera资源 ①RK3576 camera硬件框图 RK3576的camera硬件框图如图所示&#xff0c;拥有一路4lane的DCPHY&#xff…

Spring Cloud Consul 4.1.1

该项目通过自动配置和绑定到 Spring 环境和其他 Spring 编程模型习惯用法&#xff0c;为 Spring Boot 应用程序提供 Consul 集成。通过一些简单的注释&#xff0c;您可以快速启用和配置应用程序内的常见模式&#xff0c;并使用基于 Consul 的组件构建大型分布式系统。提供的模式…

银河麒麟v10 重装系统恢复原home分区

现象&#xff1a;系统还原后在锁屏状态下输入密码后闪退回锁屏 ctrl alt f1切到命令行模式&#xff0c;查看/home目录下的用户文件夹里无文件 1、blkid找到data分区的uuid和设备编号&#xff0c;记录下来&#xff1b; 2、sudo mount /dev/sda5 3、sudo vi /etc/fstab&#xf…

JAVA中类和对象(承接上次的补充)

目录&#xff1a; 一.static修饰成员方法 二.static成员变量初始化 三.代码块 一.static修饰成员方法: 1.一般类中的数据成员都设置为 private &#xff0c;而成员方法设置为 public &#xff0c; 问&#xff1a;那设置之后&#xff0c;Student类中&#xff0c;被Student修饰…

数据结构——01-抽奖数人-链表-实验题目与解答

数据结构抽奖数人链表实验题目与解答 一、**实验题目** 抽奖游戏&#xff1a; n个人围成一圈&#xff0c;由第一个人开始&#xff0c;依次报数&#xff0c;数到第m人&#xff0c;便抽出来作为中奖人&#xff0c;然后从他的下一个人数起&#xff0c;数到第m人&#xff0c;再抽…

VALSE 2024合合信息 | 文档解析与向量化技术加速多模态大模型训练与应用

第十四届视觉与学习青年学者研讨会&#xff08;VALSE 2024&#xff09;近期在重庆悦来国际会议中心圆满举行&#xff0c;由中国人工智能学会&#xff08;CAAI&#xff09;、中国图象图形学会&#xff08;CSIG&#xff09;、中国民族贸易促进会主办&#xff0c;重庆邮电大学承办…

goconvey测试框架的使用

尽管Golang已经内置了功能强大的testing包&#xff0c;其易用性令人称赞。然而&#xff0c;当我们希望更直观地处理和判断测试结果时&#xff0c;结合使用goconvey能为我们提供极大的便利。goconvey不仅为我们提供了丰富的断言函数&#xff0c;这些函数还极大地方便了我们在进行…

Web测试是在测什么?容易被忽视的小细节总结!

随着Internet和Intranet/Extranet的快速增长&#xff0c;Web已经对商业、工业、银行、财政、教育、政府和娱乐及我们的工作和生活产生了深远的影响。许多传统的信息和数据库系统正在被移植到互联网上&#xff0c;电子商务迅速增长&#xff0c;早已超过了国界。范围广泛的、复杂…

C# XPTable in .net6(XPTable控件使用说明八)

经过作者schoetbi、armin-pfaeffle的努力&#xff0c;XPTable已经可以在 winform .net6 .net8的环境下使用&#xff0c;版本升级到了2.0&#xff0c;这样就可以在winform下同时使用XPTABLE和EFcore, 这样就可以解决大部分的场景了。

网络工程师----第二十八天

计算机基础 第五章&#xff1a;运输层 运输层的两个协议&#xff1a; 1、传输控制协议TCP&#xff1a; TCP最主要的特点&#xff1a; (1)TCP是面向连接的。应用程序在使用TCP协议之前&#xff0c;必须先建立连接。在传送数据完毕后&#xff0c;必须释放已经建立的TCP连接。…

【数据分析面试】43.寻找给小费最多的客人(Python:字典用法)

题目&#xff1a; 寻找给小费最多的客人 &#xff08;Python) 给定两个非空列表user_ids和tips&#xff0c;编写一个名为most_tips的函数&#xff0c;用于找到给小费最多的客户。 示例&#xff1a; 输入&#xff1a; user_ids [103, 105, 105, 107, 106, 103, 102, 108, 1…