免费的GPT4终于要来了!OpenAI直播发布会详细解读!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识,包括但不限于AI科普AI工具测评AI效率提升AI行业洞察。关注我,AI之路不迷路,2024我们一起变强。

上周我在“重磅!5月13日下周一,OpenAI直播发布新功能!”一文中预告了OpenAI的这场被OpenAI CEO称为“magic”的直播发布会,本周一,它如约而至。

OpenAI果然没有令人失望。首先,主持人Mira Murati(OpenAI CTO)官宣了ChatGPT的桌面客户端,以及全新的web UI界面。其次,重头戏来了,Mira介绍了一款全新的模型GPT-4o,并且宣布这款GPT-4模型会对所有用户开放,当然包括免费用户!

ChatGPT桌面版客户端

根据Mira介绍,ChatGPT桌面版客户端即将公测,会最先推出macOS版本,然后会在今年晚些时候推出Windows版本。还是延续了OpenAI一贯的灰度发布的作风,目前已经开始陆续向用户推出。

我也收到了OpenAI的灰度测试,收到测试后ChatGPT会有信息提醒如下。注意,macOS版本目前仅支持Apple芯片的Macbook,系统要求macOS 14及以上。

为什么要发布桌面端?其中一大亮点就是可以直接共享电脑屏幕给ChatGPT,更加方便和ChatGPT对话。在直播后半程的demo中,OpenAI的Research lead给我们展示了这一功能。

最新的模型GPT-4o

直播发布会大概有效时长25分钟,至少有20分钟都是在介绍或者演示GPT-4o这个最新的模型。目前该模型已开始灰度发布,已经有不少小伙伴收到了这个新模型的使用资格。我也正好在今天下午就收到了体验资格。

收到灰度测试邀请的小伙伴在重新进入ChatGPT页面后会收到下面这个弹窗提醒。

在左上角模型选择处,已经多出来了一个GPT-4o的选项。

那么,为什么是GPT-4o模型?它牛在哪里?

多模态能力

GPT-4o,全名为GPT-4 omni,omni在英文里是“全能”的意思。

GPT-4o是一个本质上的多模态模型,能够深度理解和生成不同格式的内容,包括文本、语音和图像。这使得它可以在各种交互中更加灵活,例如接受语音命令或处理视觉数据。

理解能力是AI能够和我们人类进行交互的基础。而多模态级别的理解能力将会使得AI和我们交互方式更进一步。在直播发布会的后半程,OpenAI的研究人员为观众在实时对话中演示了这一最新模型的多模态能力,GPT-4o快速且正确地识别出了白纸上写的数学方程以及文字。这种多模态级别的理解能力虽然靠OCR识别实现,但它对外给人的感觉已经不再像一个应用程序,而是一个有理解能力的“智能体”!

实时语音和视频对话

注意,GPT-4o具有实时语音对话的功能!

可能有小伙伴能够联想到,之前ChatGPT以及Kimi Chat也有对话功能,也就是“语音模式”,你可以以语音的形式问问题,然后对方会针对你的问题进行回复,当然也是以语音的形式。但这种形式归根结底只能算是“对话”,而远远不是“实时对话”!比如,对于AI的语音回答,你必须从头听到尾,然后你再问,它再答。

什么是“实时对话”,就像是你和朋友打电话那样,你可以随时打断对方,表达自己的观点,而对方也能够理解你的意思,对给予回应。这就是新模型GPT-4o具有的功能,可以简单理解为由世界上最强大的LLM模型驱动的Siri,Alexa,小度和小爱同学。

在demo中,OpenAI的研究人员能够随意打断GPT-4o的讲话,就像是真正的对话那样。并且,GPT-4o的回复是实时的,而不是像以前那样,需要思考几秒钟(其实是在生成答案),然后再用语音回答,导致对话的体验很不连贯。更重磅的,GPT-4o甚至能够理解说话者的情感,具有了情感感知的能力!GPT-4o能够听到并判断出demo者在喘粗气,它会给出"slow down"的建议,并且,GPT-4o能够根据要求任意改变语调、音色等等,可以把音色加上各种从弱到强的感情色彩!

更快的响应速度

GPT-4o的响应速度是GPT-4 Turbo的两倍,这有助于更快速地应答和更有效地处理数据。同时,这也是为什么这个模型能够做到如此逼真的“实时对话”。

增加可访问性

Mira宣布,GPT-4o会在未来的几周内对所有用户免费开放,而付费用户的使用数量限制是免费用户的五倍。

支持API使用

对于开发者来说,该模型的API rate limit显著提高,是GPT-4 Turbo的五倍,允许在各种应用中更广泛地使用该模型,从简单的脚本到复杂的集成系统。

目前,GPT-4o模型的API已是可用状态,定价为GPT-4 Turbo的一半:

  • 输入:5 USD/1M Tokens

  • 输出:15 USD/1M Tokens


精选推荐

  1. 完全免费白嫖GPT4的三个方法,都给你整理好了!

  2. AI领域的国产之光,ChatGPT的免费平替:Kimi Chat!

  3. Kimi Chat,不仅仅是聊天!深度剖析Kimi Chat 5大使用场景!

  4. 我用AI工具5分钟制作一个动画微电影!这个AI现在免费!

  5. 当全网都在疯转OpenAI的Sora时,我们普通人能做哪些准备?——关于Sora,你需要了解这些!

  6. 文心一言4.0 VS ChatGPT4.0哪家强?!每月60块的文心一言4.0值得开吗?

  7. ChatGPT和文心一言哪个更好用?一道题告诉你答案!

  8. 字节推出了“扣子”,国内版的Coze,但是我不推荐你用!

  9. 白嫖GPT4,Dalle3和GPT4V - 字节开发的Coze初体验!附教程及提示词Prompt

  10. 2024年了你还在用百度翻译?手把手教会你使用AI翻译!一键翻译网页和PDF文件!


都读到这里了,点个赞鼓励一下吧,小手一赞,年薪百万!😊👍👍👍。关注我,AI之路不迷路,原创技术文章第一时间推送🤖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/623037.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

简单易懂的HashMap使用指南:从入门到精通

哈喽,各位小伙伴们,你们好呀,我是喵手。运营社区:C站/掘金/腾讯云;欢迎大家常来逛逛 今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一…

Wifi——Wifi断连问题分析

一、iperf测试wifi断连 1.信号强度差 -36表示非常强;但网络质量依然非常差。 可以分析出四个原因: 2.与throughput相关 为什么同一个网络的信号强度估算会有一定差异?! 下图是上述log的一些信息:

DTC 2024回顾丨zData X 多元数据库一体机:开创多元数据库时代部署新范式

导语 在2024“数据技术嘉年华”上,云和恩墨数据库一体机产品总经理刘宇在“数据库极致特性”专题论坛发表了题为《打造多元数据库部署新范式,引领一体化资源池创新之路》的演讲。他深入分析了国产数据库面临的挑战,并详细介绍了云和恩墨如何利…

F5G-A万兆光网商用启航,挥动FTTR F50星光之翼,北京联通助力首都家庭飞向全光智慧时代...

2001年,王菲在发行的新歌《光之翼》中唱道:静静地按下电源开关/屏幕的色彩越来越亮/在虚拟的城市/找一个让心灵休息的地方/张开透明翅膀/朝着月亮飞翔/搜寻最美一个现世的天堂…… 将时间拨回千禧年,“看不见的城市”“伊托邦”“网络之城”&…

享元模式详解

享元模式 1 概述 定义: ​ 运用共享技术来有效地支持大量细粒度对象的复用。它通过共享已经存在的对象来大幅度减少需要创建的对象数量、避免大量相似对象的开销,从而提高系统资源的利用率。 2 结构 享元(Flyweight )模式中存…

问题解决记录 | kettle中出现中文乱码

spoon.bat的启动文件中进行修改 if "%PENTAHO_DI_JAVA_OPTIONS%""" set PENTAHO_DI_JAVA_OPTIONS"-Xms1024m" "-Xmx2048m" "-Dfile.encodingUTF-8"

2.数据类型与变量(java篇)

目录 数据类型与变量 数据类型 变量 整型变量 长整型变量 短整型变量 字节型变量 浮点型变量 双精度浮点型 单精度浮点型 字符型变量 布尔型变量(boolean) 类型转换 自动类型转换(隐式) 强制类型转换(显式) 类型提升 字符串类型 数据类…

独立游戏《星尘异变》UE5 C++程序开发日志3——实现一个存存组件

本篇日志中,我将会介绍如何实现一个有格子,每个格子有容量的物品库存,如下图: 一.库存容器 1.储存数据的容器 库存容器最重要的目的就是存储每一种类的物品拥有的数量,这里我用的是哈希表: std::unordere…

“圣诞树图案的打印~C语言”

圣诞树图案的打印~C语言 题目原文:[圣诞树](https://www.nowcoder.com/practice/9a03096ed8ab449e9b10b0466de29eb2?tpId107&rp1&ru/ta/beginner-programmers&qru/ta/beginner-programmers/question-ranking&difficulty&judgeStatus&tags&…

机器学习中的聚类

目录 认识聚类算法 聚类算法API的使用 聚类算法实现流程 聚类算法模型评估 认识聚类算法 聚类算法是一种无监督的机器学习算法。 它将一组数据分成若干个不同的群组,使得每个群组内部的数据点相似度高,而不同群组之间的数据点相似度低。常用的相似…

Linux0.11 中全局描述符表(GDT)

在Linux内核中,全局描述符表(Global Descriptor Table,简称GDT)是一个关键的数据结构,主要用于管理处理器的内存段和相关的权限与属性。它属于x86架构中的保护模式特性,允许操作系统对内存访问进行更精细的…

HFSS学习-day5-边界条件

边界条件 概述边界条件类型1、理想导体边界条件(Perfect E)2、理想磁边界条件(Perfect H)3、有限导体边界条件(Finite Conductivity)4、辐射边界条件(Radiation)5、对称边界条件&…

微信小程序开发题库

一. 单选题&#xff08;共12题&#xff0c;60分&#xff09; 1. (单选题) 有如下HTML代码&#xff1a; <!DOCTYPE html> <html> <head> <meta charset"UTF-8"> <title>Document</title> <style> ul,li{ margin:0; p…

企业为什么需要HTTPS

一.什么是HTTPS HTTPS &#xff08;全称&#xff1a;Hyper Text Transfer Protocol over SecureSocket Layer&#xff09;&#xff0c;是以安全为目标的 HTTP 通道&#xff0c;在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性 。HTTPS 在HTTP 的基础下加入SSL&a…

算法day05

第一题 1004. 最大连续1的个数 III 题目如下所示&#xff1a; 如上题所示&#xff1a; 题目本意是在一个数组中只有1和0&#xff0c;给定一个k值&#xff0c;将小于k个0翻转成1&#xff0c;然后返回最终得到最长的1的个数&#xff1b; 我们将这到题的意思转化为另外一种意思&…

C++ | Leetcode C++题解之第88题合并两个有序数组

题目&#xff1a; 题解&#xff1a; class Solution { public:void merge(vector<int>& nums1, int m, vector<int>& nums2, int n) {int p1 m - 1, p2 n - 1;int tail m n - 1;int cur;while (p1 > 0 || p2 > 0) {if (p1 -1) {cur nums2[p2-…

Gitee添加仓库成员

1.进入你的项目 2.点击管理 3.左侧有个仓库管理 4.要加哪个加哪个&#xff0c;有三个方式~ 可以直接添加之前仓库合作过的开发者

STM32有什么高速接口吗?

STM32 有一些高速接口&#xff0c;比如 USART、SPI、I2C 等&#xff0c;这些接口可以用于与外部设备进行高速数据传输。我这里有一套stm32入门教程&#xff0c;不仅包含了详细的视频讲解&#xff0c;项目实战。如果你渴望学习stm32&#xff0c;不妨点个关注&#xff0c;给个评论…

上位机图像处理和嵌入式模块部署(树莓派4b的替代品)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 实话实说&#xff0c;树莓派4b的产品力还是比较优秀的&#xff0c;价格还算适中。但是和国产卡片电脑比起来&#xff0c;则逊色不少。功能差不多的…

牛客小白月赛90VP

1&#xff0c;签到&#xff1a;https://ac.nowcoder.com/acm/contest/78306/A AC代码&#xff1a; #include<bits/stdc.h> using namespace std; int n,m,a[100010]; long long sum; int main() {cin>>n>>m;for(int i1;i<n;i) cin>>a[i];for(int …