GPT-4o API 全新版本发布:提升性能,增加性价比

5月13日,OpenAI 发布了全新ChatGPT模型 GPT-4o,它在响应速度和多媒体理解上都有显著提升。在这篇文章中,我们将介绍 GPT-4o 的主要特点及其 API 集成方式。

什么是 GPT-4o?

GPT-4o 是 OpenAI 于5月13日发布的最新多模态 AI 模型,其中“4o”的“o”代表“omni”,意为“全能的”。与先前的 ChatGPT 不同,GPT-4o 能够处理文本、音频、图像和视频的数据交互。

GPT-4o 图片

访问官网了解更多:https://openai.com/index/hello-gpt-4o/

GPT-4o 关键功能

更快速的响应时间

OpenAI表示,GPT-4o 相较于前代模型在响应速度上有显著提升。以前的 GPT 模型在与人类对话时需要完成语音识别、文本生成和语音合成三个步骤,总延迟时间在 2.8~5.4 秒之间。而 GPT-4o 缩短了响应时间到 3.20 秒,几近实时交互。

更好的声音情感识别

以前的模型常常忽略说话者的语气和背景噪音。GPT-4o 改进了这点,它可以识别和理解音频中的情感标记,使得对话更加自然。

情感识别功能

令牌使用量减少

GPT-4o 对多种语言(包括日语)的令牌使用进行了优化。例如,一段日语对话所需的令牌数从37 减少到24。因此,语言处理变得更加高效。

令牌使用示例

免费使用基础功能

GPT-4o 发布后,原本付费的服务(如 GPT、GPT Store 和 GPT-4)均可免费使用。

提供桌面客户端

除了线上访问,现在 macOS 用户还可以通过桌面应用访问 ChatGPT,Windows 版本也将在今年下半年推出。

集成 GPT-4o API

将 GPT-4o 的功能集成到您的应用中,可以通过 API 接口非常方便地实现。那么如何使用 GPT-4o API 呢?

GPT-4o API 使用方法

根据 OpenAI 提供的信息,GPT-4o API 可以通过 Chat Completions API、Assistants API 和 Batch API 使用,支持文本和视觉数据的多模态输入。

GPT-4o API 特性

与旧版 API 相比,GPT-4o API 在以下几个方面有了改进:

  • 更智能:在文本分析、推理和编程上有显著提升。
  • 响应更快:响应速度是 GPT-4 Turbo 的两倍。
  • 价格更低:输入和输出的费用比 GPT-4 Turbo 减少了一半。
  • 速率限制提升:与 GPT-4 Turbo 相比,速率限制提高了五倍。
  • 增强的视觉处理能力:优化了视觉处理。
  • 更好的非英语语言处理:在处理非英语语言文本时更为高效。

GPT-4o API 定价

根据 OpenAI API 定价页面的信息,GPT-4o 文本输入和输出的成本为:

  • 输入:5美元 / 百万 Tokens
  • 输出:15美元 / 百万 Tokens

视觉处理的费用根据图像宽度和高度计算。

定价示例

使用 JPEG-4o API 时的注意事项

使用或从旧版本切换到 GPT-4o API 时,请注意以下几点:

  1. GPT-4o API 支持通过感知能力理解不含音频的视频,需要将视频转换成帧输入模型。
  2. 截至 2024年5月14日,GPT-4o 不支持音频模式。
  3. GPT-4o 不支持图像生成功能,建议继续使用 DALL-E 3 API。
  4. OpenAI 建议目前使用 GPT-4 或 GPT-4 Turbo 的用户尝试 GPT-4o,评估其表现是否更优。

管理您的 API

GPT-4o API 的调试和管理至关重要。下面是 APIHub 中的 OpenAI 的接口文档。

Apifox

获取和使用 OpenAI API 密钥

要开始使用 GPT-4o API,你需要获取 OpenAI API 密钥。步骤如下:

1. 创建 OpenAI 账户

首先访问 OpenAI 官网并创建一个新账户。

OpenAI 账户

2. 获取 API 密钥

登录账户后,访问 API 密钥页面并点击“Create new secret key”生成新的密钥。

生成 API 密钥

记录并安全存储你的 API 密钥,因为生成后无法再次查看。

测试和管理 GPT-4o API

Apifox 是测试和管理 GPT-4o API 的理想工具。它提供了一个 OpenAI API 项目,涵盖所有 OpenAI 提供的 API。

OpanAI 项目

选择左侧菜单中的每一项,开始使用 GPT-4o API。

API 管理

实战:将 GPT-4o API 与 Apifox 结合使用

访问 Apifox 上的 OpenAI API 项目,选择 Chat Completions API。根据 ChatGPT 规范,输入 HTTP 方法和端点 URL。

在“Body”选项卡中以 JSON 格式输入 ChatGPT 消息,将 "model":"gpt-4o" 包含在内。

输入开发

在“Headers”选项卡中添加授权参数,输入你的 ChatGPT API 密钥,然后点击“发送”按钮。

Headers设定

你可以在 Apifox 中将 OpenAI 的 API 密钥设置为环境变量,以简化后续操作。

环境变量

总结

本文介绍了 OpenAI 新推出的 GPT-4o 模型及其 API 集成方式:

  • 速度更快
  • 支持更多类型的输入
  • 令牌使用量减少
  • 更高性价比的 API 费用
  • 改进的视觉和非英语文本处理能力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/627813.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式详细教程:基于STM32实现语音识别系统

目录 文章主题环境准备语音识别系统基础代码示例:实现语音识别系统应用场景:智能家居与便携设备问题解决方案与优化 1. 文章主题 文章主题 本教程将详细介绍如何在STM32嵌入式系统中使用C语言实现语音识别系统,特别是如何通过STM32与麦克风…

HTTP代理可以应用在那些领域呢

HTTP代理是IP代理领域中一个重要组成部分,它基于HTTP协议传输,使用海外服务器帮助用户绕开访问限制,浏览查看海外资讯信息。 HTTP代理可以应用在哪些领域呢? 1.保护使用者隐私 当今越来越数据被上传到网络云端上,用户…

网关过滤器实现接口签名检验

背景 往往项目中的开放接口可能被别有用心者对其进行抓包然后对请求参数进行篡改,或者重复请求占用系统资源为此我们行业内使用比较多的策略是接口签名校验。签名校验的实现可以用注解aop的形式实现,也可以使用过滤器统一拦截校验实现,此篇文…

从新手到高手,教你如何改造你的广告思维方式!

想要广告震撼人心又让人长时间记住?答案肯定是“创意”二字。广告创意,说白了就是脑洞大开,想法新颖。那些很流行的广告,都是因为背后的想法特别、新颖。做广告啊,就得不停地思考,创新思维是关键。 广告思…

智能数据提取:在严格数据治理与安全标准下的实践路径

一、引言 随着信息技术的飞速发展,数据已成为企业最宝贵的资产之一。然而,数据量的爆炸式增长和数据格式的多样化,使得传统的数据提取方法变得效率低下且难以满足业务需求。智能数据提取技术应运而生,它通过应用人工智能和机器学…

基于Springboot汽车租赁预约管理系统

一:功能介绍 本系统是Springboot项目采用的技术栈主要有Spring、mybaits、springboot、mysql数据库 功能角色主要分为管理员、超级管理员、用户等几个角色 二:功能截图 三:源码获取

CheckStyle静态样式之道

优质博文:IT-BLOG-CN 在标准化的统一样式检查规范里,最为常用的统一样式工具是checkstyle插件,而不是国内阿里的代码规约插件。 【1】下载插件 【2】配置生效 配置生效及告警设置 【3】配置checkstyle.xml 官网地址 官网最新Releases 下面…

2024年京东618红包领取口令是什么?2024年618京东红包活动时间是从什么时候开始到几号结束?

2024年京东618红包活动时间 京东618红包活动时间是从2024年5月28日开始,一直持续到6月18日结束。 2024年京东618红包领取方式 在2024年京东618活动时间内,每天都可以打开手机京东APP,输入框搜索红包领取口令「 天降红包882 」,搜…

253 基于matlab的液压位置控制源代码

基于matlab的液压位置控制源代码,有摩擦补偿,利用滑模控制器实现,神经网络逼近。最后实现位置角度和速度的控制。输出控制误差。程序已调通,可直接运行。 253 液压位置控制 滑模控制器 控制误差 - 小红书 (xiaohongshu.com)

Excel 每 N 列内容填成一行

Excel表格从第 2 列起,每 N 列为一组,以 N2 为例: ABCDEFG1IDType 1Count 1Type 2Count 2Type 3Count 321a640d290a32d12000a1900f600043f48000f3600e160054c46000e3100b120065e47000c3400d140076b64000b3600c1200 现在要进列转行&#xff…

5G技术相关部分图解

1、面向5G商用网络的全系列解决方案 面向5G商用网络的全系列解决方案涵盖了从核心网到接入网的各个方面,确保网络的高性能、高可靠性和高安全性 2、2\3\4\5G带宽图解 G带宽的提升将推动许多新型应用的发展,并提供更快速、更可靠的移动通信体验。然而…

为Akamai 云平台上部署的资源配置2FA跳板机-上

为重要账户启用2FA,这几乎已经成为保护账户和数据安全的一种标准做法。无论登录常见应用或服务,或是访问企业内部资源,时不时都会需要进行2FA验证。那么当你在Akamai Connected Cloud云平台中部署了各类资源(云计算、云存储、SaaS…

【文末附gpt升级方案】腾讯混元文生图大模型开源:中文原生Sora同款DiT架构引领新潮流

在人工智能与计算机视觉技术迅猛发展的今天,腾讯再次引领行业潮流,宣布其旗下的混元文生图大模型全面升级并对外开源。这次开源的模型不仅具备强大的文生图能力,更采用了业内首个中文原生的Sora同款DiT架构,为中文世界的视觉生成领…

记录用python转换headers

转换前 转换后效果 代码如下。注意需要在控制台切换到content.txt所在位置,不然运行代码会报file not found错误 # 假设txt文件内容如下 txt open(content.txt).read()# 使用splitlines()方法将txt内容分割为行,然后使用json.loads()方法将每一行转换为…

【创业新风向】2024年个人创业的8大热门选择,迎接轻资创业契机

随着社会的快速发展和科技的日新月异,个人创业已成为越来越多人的选择。2024年,随着市场需求的不断变化和新兴行业的崛起,个人创业领域也涌现出了一系列热门选择。本文将为您揭示2024年个人 keJ0277 创业的8大热门选择,助您把握轻…

如何让自己上百度百科

百度百科是一部内容开放、自由的网络百科全书,如何将自己的个人信息加入其中呢?以下是几个步骤和注意事项: 确定是否有资格创建百度百科 根据百度百科的规定,只有具有一定影响力的人物,如知名人物、公众人物等&#x…

Baidu Comate测评之数据分析与视图展示

Baidu Comate智能代码助手主页: https://comate.baidu.com/?inviteCodeu49zjbng 目录 Baidu Comate智能代码助手 VS Code扩展插件Baidu Comate安装 登录到Baidu Comate ​编辑Baidu Comate基本操作示例 提问示例 Baidu Comate代码补全示例 单行推荐 多行…

TimesFM: 预训练的时间序列基础模型

大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在阅读过程中有些知识点存在盲区,可以回到如何优雅的谈论大模型重新阅读。另外斯坦福2024人工智能报告解读为通识性读物。若对于如果…

Kubernetes集群自动化部署

目录 1.1 实验介绍 1.1.1 关于本实验 1.1.2 实验目的 1.2 环境准备 步骤 1 设置节点名 步骤 2 配置 hosts 节点名解析 步骤 3 配置免密登录 步骤 4 清空 iptables、关闭防火墙并禁用 selinux 步骤 5 关闭交换分区 步骤 6 开启 ipvs 步骤 7 设置时间同步 步骤 8 配置…

【Kubenetes】微服务治理:服务网格Istio安装搭建体验

文章目录 ServiceMesh介绍Istio解决方案安装Istio第一步 下载istio第二步 安装istio环境第三部 安装istio应用第四部 暴露到外部流量然后再下一步 把dashboard弄好 ServiceMesh介绍 扯淡环节 什么是服务网格?–服务间通信,可扩展性和灵活性服务网格的工作原理 --…