GPT-4o:免费且更快的模型

OpenAI GPT-4o 公告

OpenAI 推出了增强版 GPT-4 模型——OpenAI GPT-4o,用于支持 ChatGPT。首席技术官 Mira Murati 表示,更新后的模型速度更快,并在文本、视觉和音频处理方面有了显著提升。GPT-4o 将免费向所有用户开放,付费用户的使用容量可达免费用户的五倍。

首席执行官 Sam Altman 强调,该模型具备“原生多模态”能力,能够生成内容或理解语音、文本和图像中的指令。开发者将可以访问该 API,费用是 GPT-4 Turbo 的一半,速度则是其两倍。

ChatGPT 的语音模式即将新增功能,使其能够作为实时语音助手并观察周围环境。Altman 回顾了 OpenAI 的发展历程,指出公司现在主要通过付费 API 向开发者提供先进的 AI 模型。

在发布之前,有关 OpenAI 的公告存在不同的猜测,包括 AI 搜索引擎、集成到 GPT-4 中的语音助手或新模型 GPT-5。OpenAI 选择在 Google I/O 之前发布,我们预计 Gemini 团队将在 I/O 上发布各种 AI 产品。

解析名称:GPT-4o

  • GPT: GPT 代表生成式预训练 Transformer,一种用于语言处理任务的神经网络架构。OpenAI GPT-4o 建立在其前身 GPT-3 和 GPT-4 的基础上。
  • “o” 代表 Omni: 字母“o”表示 GPT-4o 的关键特性——全模式能力。与之前的模型不同,GPT-4o 可以处理并响应各种格式的信息:文本、语音甚至视频。这样可以更全面地理解用户输入,从而提供更相关的响应。

可实时推理音频、视觉和文本的 AI 模型(功能)

无论你如何提出问题和请求,人工智能都能理解。无论是说话、打字还是展示图片,OpenAI 的最新成果 GPT-4o 都会迅速且智能地回应。以下是 GPT-4o 成为人工智能革命性飞跃的原因:

像天才一样思考,像闪电一样行动:

  • 更聪明: GPT-4o 在基于文本的任务中拥有与 GPT-4 Turbo 相当的推理和编码能力。此外,它在理解和响应音频、视频以及非英语语言方面表现优异。
  • **极快的速度:**瞬间获得答案!GPT-4o 的响应速度是 GPT-4 Turbo 的两倍,适合实时应用。

更实惠,更强大:

  • 价格减半,乐趣加倍: OpenAI GPT-4o 比其前身便宜得多,输入和输出令牌的价格都只有一半,使得这项先进技术更易获得。
  • 更高效: GPT-4o 的速率限制是其前代的五倍,允许用户更广泛地探索其功能并处理更大的数据集。

清晰的视觉,流利的表达:

  • 更清晰的视觉: GPT-4o 改进的视觉处理能力使其能够更准确地解释和响应图像。
  • **打破语言障碍:**跨境沟通变得更简单。GPT-4o 能有效处理非英语语言,并通过新的文本分解系统,使沟通更流畅。

始终保持最新:

  • 最新知识: GPT-4o 的知识库更新至 2023 年 10 月的信息,确保提供最相关、最准确的答复。

这只是 GPT-4o 功能的一瞥。未来,你可能会看到它:

  • 使用另一个 GPT-4o 实时创作音乐!
  • 通过逼真的对话练习求职面试。
  • 在实时翻译的帮助下学习新语言。

OpenAI 在开发过程中优先考虑安全性,因此你可以放心使用 GPT-4o。

使用新的 ChatGPT 桌面应用程序 (MacOS) 增强工作流程

更快完成任务:

  • 使用键盘快捷键(Option + Space)立即询问 ChatGPT 问题,无需切换应用程序!
  • 直接在应用程序中讨论屏幕截图,非常适合集思广益或获取反馈。

与 ChatGPT 对话(即将推出):

  • 使用 ChatGPT 开始语音对话,非常适合深入讨论。(目前提供基于文本的语音模式)

现可供 Plus 用户 (MacOS) 使用:

  • 所有人很快都会获得访问权限!Windows 版本将于今年晚些时候推出。

模态

通过图像看世界(即将提供视频支持):

目前,GPT-4o API 可以通过其视觉功能理解视频内容。视频需要以每秒 2-4 帧的速度分解为静止图像(帧)。可以在整个视频中均匀采样这些帧,或使用特定算法选择关键帧。欲了解更多信息,请参阅“GPT-4o 入门指南”。

聆听您的声音(数量有限):

虽然目前还未广泛普及,但 OpenAI 计划在未来几周内向选定的可信测试人员推出音频支持。GPT-4o 将能够直接理解口语,使交互更加自然。

生成图像:

如果你的目标是创建图像,GPT-4o 尚未实现。OpenAI 的 DALL-E 3 API 仍然是生成创意视觉内容的首选。

探索 GPT-4o 的功能

现在,让我们探索 GPT-4o 的令人兴奋的可能性:

  • **和谐二重唱:**想象一下两个 GPT-4o 模型互动甚至一起唱歌!这为探索 AI 驱动的音乐创作的新形式打开了大门。
  • **完善面试技巧:**需要在即将到来的面试中脱颖而出吗?使用 GPT-4o 进行练习,模拟真实的面试环境,进行真实的对话。
  • **有人玩石头、剪刀、布吗?:**想玩吗?GPT-4o 可以成为你的游戏伙伴,快速玩一轮石头、剪刀、布。
  • **攻克数学难题:**被数学题难住了?GPT-4o 可以帮助你理解复杂的概念和解方程。
  • **解锁新语言:**学习一门新语言?GPT-4o 可以成为你的私人语言导师,提供实时翻译并协助语言习得。
  • **打破语言障碍:**跨语言无缝沟通现已成为现实。GPT-4o 可以实时翻译语言,促进全球协作和理解。

使用 OpenAI GPT-4o 是否安全?

GPT-4o 完全可以安全使用,因为 OpenAI 优先考虑人工智能的安全性和负责任的开发。以下是 GPT-4o 的安全措施:

  • 多模态安全设计: GPT-4o 从头开始在其所有功能(文本、图像和未来的音频/视频)中整合了安全措施。过滤训练数据和训练后优化模型行为等技术有助于降低潜在风险。此外,还专门为语音输出创建了新的安全系统。
  • 严格的风险评估: OpenAI 根据自己的安全框架对 GPT-4o 进行了细致的评估,重点关注网络安全、生物安全风险 (CBRN)、说服技术和模型自主性等领域。这些评估表明,GPT-4o 在任何类别中的风险不超过“中等”。该评估涉及整个开发过程中的全面自动化和人工评估过程。
  • **外部红队测试:**为了识别新模式(音频和视频)带来的潜在风险,GPT-4o 与 70 多位外部专家进行了广泛的测试。这些专家专注于社会心理学、偏见检测和错误信息等领域。从这一过程中获得的经验被用于进一步完善 GPT-4o 的安全措施,确保更安全、更值得信赖的交互体验。
  • 持续的安全改进: OpenAI 承认,特别是在音频功能方面,存在新的风险需要考虑。虽然文本和图像功能最初会发布,但音频功能将分阶段推出。最初,音频输出将仅限于一组预定的声音,并受现有安全协议的约束。OpenAI 将在即将发布的系统卡中提供有关所有模式的安全措施的更多详细信息。

OpenAI 在探索 GPT-4o 的全部潜力的同时,致力于持续降低风险。
订阅国外服务,如GPT、Midjourney、OnlyFans等,请使用WildCard

结论:释放 GPT-4o 的力量

OpenAI 的 GPT-4o 现已推出,它已准备好彻底改变您的 AI 交互体验。文本和图像功能将首先推出,无论是在 ChatGPT 的 GPT-4o 免费版还是 GPT Plus 版中。Plus 用户将享受更高的消息限制。准备好通过文本提示和图像输入体验 GPT-4o 的强大功能吧。

想要使用语音与 GPT-4o 互动?ChatGPT Plus 用户即将迎来以 GPT-4o 为特色的语音模式新 alpha 版本。

开发者可以立即加入!通过 OpenAI API 访问 GPT-4o 的文本和视觉功能,与 GPT-4 Turbo 相比,它具有速度快、价格合理和更高的速率限制等优势。虽然音频和视频功能即将推出,但初始访问权限将授予一组选定的合作伙伴。

请继续关注 OpenAI 揭示 GPT-4o 全部潜力的激动人心的更新!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/666528.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Rainbond 携手 TOPIAM 打造企业级云原生身份管控新体验

TOPIAM 企业数字身份管控平台, 是一个开源的IDaas/IAM平台、用于管理账号、权限、身份认证、应用访问,帮助整合部署在本地或云端的内部办公系统、业务系统及三方 SaaS 系统的所有身份,实现一个账号打通所有应用的服务。 传统企业 IT 采用烟囱…

【数据分享】中国科技统计年鉴Excel版(1991-2023年)

大家好!今天我要向大家介绍一份重要的中国科技统计数据资源——《中国科技统计年鉴》。这份年鉴涵盖了从1991年到2023年中国科技统计全面数据,并提供限时免费下载。 数据介绍 在数字化时代的浪潮中,数据的重要性日益凸显。对于研究人员、政…

AI 赋能前端 -- 文本内容概要生成

幸福不在于你获得了什么,而在于你比他人多获得了什么 是比较出来的 大家好,我是柒八九。一个专注于前端开发技术/Rust及AI应用知识分享的Coder 此篇文章所涉及到的技术有 OpenAILangChainRust/WebAssemblyWeb Workerreact+ts+vite配置环境变量(env)因为,行文字数所限,有些概…

5. MySQL运算符和函数

文章目录 【 1. 算术运算符 】【 2. 逻辑运算符 】2.1 逻辑非 (NOT 或者 !)2.2 逻辑与运算符 (AND 或者 &&)2.3 逻辑或 (OR 或者 ||)2.4 异或运算 (XOR) 【 3. 比较运算符 】3.1 等于 3.2 安全等于运算符 <>3.3 不等于运算符 (<> 或者 !)3.4 小于等于运算符…

【观察】数字化生存时代已来临,能源转型如何实现“再升级”?

20多年前&#xff0c;尼古拉斯尼葛洛庞帝在《数字化生存》一书中预言&#xff1a;“数字化生存是现代社会中以新技术为基础的新的生存方式。” 随着数字经济的蓬勃发展&#xff0c;尼葛洛庞帝的预言逐渐被验证。今天&#xff0c;新技术带来的数字化和智能化正全方位影响着经济…

计算机网络-BGP路由通告原则

前面一章我们学习了BGP的路由产生方式以及查看路由表信息。BGP自身并不会发现并计算产生路由。BGP通过network、import-route、aggregate聚合方式生成BGP路由后&#xff0c;通过Update报文将BGP路由传递给对等体。那BGP向邻居通告路由时遵循哪些原则呢&#xff1f; BGP通告遵循…

521源码-源码论坛-宝塔面板操作日志是存放在哪里的? 如何删除部分日志记录

我们帮别人搭建或者登录了&#xff08;不是自己权属的宝塔面板&#xff09;&#xff0c;会留下登录及操作的日志&#xff0c;我们不想留下这些操作日志&#xff0c;可以通过下面的方法处理掉&#xff0c;以达到无痕迹访问操作的目的&#xff1a; 如图所示的面板操作日志&#…

计算机网络——如何保证 TCP 传输的可靠性

TCP 是传输层上的协议&#xff0c;它是可靠的&#xff0c;面向连接的。 概括 1. 设置传输格式&#xff0c;包括分为 TCP 段、使用校验和、使用序列号 2. 数据丢失之后的重传&#xff0c;超时重传、快速重传、SACK 选择确认、D-SACK 重复选择确认 3. 流量控制&#xff0c;控…

【学习笔记】数据结构(一)

基本概念和术语 &#x1f449;数据&#xff1a;所有能被输入到计算机中&#xff0c;且被计算机处理的符号的集合&#xff1b; 是计算机操作对象的总称&#xff1b;是计算机处理信息的载体&#xff1b;是信息的某一种特定的符号表示形式包括数值型数据、非数值型数据 &#x1…

变种水仙花

变种水仙花 题干要求&#xff1a; 变种水仙花数 - Lily Number&#xff1a;把任意的数字&#xff0c;从中间拆分成两个数字&#xff0c;比如1461 可以拆分成&#xff08;1和461&#xff09;,&#xff08;14和61&#xff09;,&#xff08;146和1),如果所有拆分后的乘积之和等于…

干Java的有4年的工作经验;想转行做labview能行吗?

在开始前刚好我有一些资料&#xff0c;是我根据网友给的问题精心整理了一份「 Java的资料从专业入门到高级教程」&#xff0c; 点个关注在评论区回复“888”之后私信回复“888”&#xff0c;全部无偿共享给大家&#xff01;&#xff01;&#xff01;bVIEW和Java都是软件工具&a…

Golang | Leetcode Golang题解之第120题三角形最小路径和

题目&#xff1a; 题解&#xff1a; func minimumTotal(triangle [][]int) int {n : len(triangle)f : make([]int, n)f[0] triangle[0][0]for i : 1; i < n; i {f[i] f[i - 1] triangle[i][i]for j : i - 1; j > 0; j-- {f[j] min(f[j - 1], f[j]) triangle[i][j]…

【新能源大巴BMS结构与乘用车的区别】

新能源大巴BMS结构与乘用车的区别 这篇文章主要介绍新能源大巴的电池和BMS的结构与乘用车的区别。 主要有&#xff0c;新能源大巴行业、新能源电池系统结构和新能源大巴的BMS系统。 第一部分 新能源大巴行业 其实数数全球的商用车(大巴卡车)&#xff0c;大致的方向还是沿着就…

机器视觉halcon学习——检测斜面两边之间距离的数据稳定性

一个样品的斜面&#xff0c;因为有景深&#xff0c;所以无法同时聚焦到两条边。想办法聚焦到其中一条不太有特征的边&#xff0c;另一条边通过白色的特征来检测。 dev_open_window(0, 0, 800, 800, black, WindowHandle) dev_set_color(red) * Image Acquisition 01: Code gen…

leetcode及牛客网二叉树相关题、单值二叉树、相同的树、二叉树的前序、中序、后序遍历、另一棵树的子树、二叉树的遍历等的介绍

文章目录 前言一、单值二叉树二、相同的树三、二叉树的前序遍历四、二叉树的中序遍历五、二叉树的后序遍历六、另一棵树的子树七、二叉树的遍历总结 前言 leetcode及牛客网二叉树相关题、单值二叉树、相同的树、二叉树的前序、中序、后序遍历、另一棵树的子树、二叉树的遍历等…

交换机堆叠技术

堆叠 一、园区网络以及数据中心技术发展演进 1、xSTP&#xff08;STP&#xff0c;RSTP&#xff0c;MSTP&#xff09; 问题&#xff1a; 收敛慢链路利用率不高次优路径------mstp不持支负载vlan数量限制&#xff08;4k&#xff09;&#xff0c;网络规模瓶颈 二、堆叠基本概念…

vue实现左侧拖拽拉伸,展开收起

需求&#xff1a;1.左侧是个树形结构&#xff0c;有的文字过长展示不全&#xff0c;想通过拖拽显示全部的数据 2.展开收起 实现图中效果 <div class"catalog-drag"><svg t"1687228434888" class"icon" viewBox"0 0 1…

【主动均衡和被动均衡】

文章目录 1.被动均衡2.主动均衡1.被动均衡 被动均衡一般通过电阻放电的方式,对电压较高的电池进行放电,以热量形式释放电量,为其他电池争取更多充电时间。这样整个系统的电量受制于容量最少的电池。充电过程中,锂电池一般有一个充电上限保护电压值,当某一串电池达到此电压…

将点作为C++ map容器key值时的踩坑记录

1.背景 空间点具有X,Y,Z坐标等数据&#xff0c;一些情况下我们需要将点作为map容器的key值&#xff0c;比如识别重复点或处理轮廓等情况。 2.问题 将点作为map的key值&#xff0c;需要自定义比较器或者重载实现点类的小于<操作运算符&#xff0c;判断规则是a < b 和 b…

使用Python发送企业微信消息

大家好&#xff0c;在本文中&#xff0c;我们将探讨如何使用 Python 发送企业微信消息。将详细说明如何通过 Python 脚本实现消息的发送。无论是希望自动化某些任务&#xff0c;还是想要快速地向团队发送实时通知&#xff0c;本文都将为您提供一站式的解决方案。 企业微信提供了…