OpenAI 重磅更新 变得更强啦 | 包括更多可控的 API 模型、函数调用能力、更长的上下文和更低的价格

文章目录

  • 一、前言
  • 二、主要内容
  • 三、总结

🍉 CSDN 叶庭云https://yetingyun.blog.csdn.net/


一、前言

OpenAI 官网:https://openai.com/blog/function-calling-and-other-api-updates

在这里插入图片描述

功能调用和其他 API 更新。OpenAI 宣布更新,包括更多可控的 API 模型、函数调用能力、更长的上下文和更低的价格。

美国时间 6 月 13 日 OpenAI 官网突然发布了 ChatGPT 的最新能力更新。重点如下:

新功能:在 Chat Completions API 中添加了新的函数调用能力,能让模型在需要的时候调用函数并生成对应的 JSON 对象作为输出。这让开发人员能够更准确地从模型获取结构化数据,实现从自然语言到 API 调用或数据库查询的转换,也可以用于从文本中有效提取结构化数据。(经过 OpenAI 微调后,只要你用通俗易懂的自然语言与其交流,它便可识别你的意图并将其转化成可执行的函数。这种能力使你无需过多编程经验,也能轻松实现编程,而且还能更轻松地从繁杂的结构中获取结构化数据)

模型更新:更新了更易控制的 gpt-4 和 gpt-3.5-turbo 版本,以及 gpt-3.5-turbo 的新 16k 上下文版本,相比之前标准的 4k 版本能处理更长的文本。(可以支持 20 页文本啦!)

模型弃用:公布了 gpt-3.5-turbo-0301 和 gpt-4-0314 模型的弃用时间线。这些模型的用户可以在特定时间之前选择升级到新的模型,过了这个时间后,旧模型将不再可用。(一方面,如果您仍在使用这些模型,请跟上疯狂的 OpenAI 的节奏。另一方面,很多参考 OpenAI 过往版本模型的人,在此提醒 OpenAI 已经快弃用了这些模型啦)。

OpenAI 还强调了一下,所有的这些模型都继续保持在 3 月 1 日推出的数据隐私和安全保证:客户拥有他们请求生成的所有输出,他们的 API 数据不会被用于训练。

通过这些更新,OpenAI 将邀请更多的等待名单上的人尝试 GPT-4,期待看到你使用 GPT-4 构建的项目!OpenAI 鼓励开发者反馈,以帮助确保模型更新的平稳过渡。


二、主要内容

我们在今年早些时候发布了 gpt-3.5-turbo 和 gpt-4,仅在短短几个月的时间里,就看到开发者们基于这些模型构建了令人惊叹的应用程序

今天,我们将推出一些令人兴奋的更新:

  • Chat Completions API 中新增了函数调用功能
  • 更新和更可控的 gpt-4 和 gpt-3.5-turbo 版本
  • 新的 16k 上下文版本的 gpt-3.5-turbo(与标准 4k 版本相比)
  • 我们最先进的 embeddings 模型成本降低了 75%
  • gpt-3.5-turbo 输入令牌成本降低 25%
  • 宣布逐步淘汰 gpt-3.5-turbo-0301 和 gpt-4-0314 模型

所有这些模型都具有我们在 3 月 1 日引入的相同数据隐私和安全保证,客户拥有其请求生成的所有输出,并且他们的 API 数据不会用于训练。

函数调用

开发者现在可以向 gpt-4-0613 和 gpt-3.5-turbo-0613 描述函数,并让模型智能地选择输出一个 JSON 对象,其中包含调用这些函数的参数。这是一种更可靠地连接 GPT 与外部工具和 API 的新方法。

这些模型已经被微调,既可以检测到何时需要调用函数(根据用户的输入),又可以响应符合函数签名的 JSON。函数调用使开发人员能够更可靠地从模型中获取结构化数据。例如,开发人员可以:

  • 创建聊天机器人,通过调用外部工具(例如 ChatGPT 插件)来回答问题。将 “给安雅发电子邮件,询问她下周五是否想喝咖啡” 这样的查询转换为函数调用,例如 send_email(to: string, body: string),或者将 “波士顿天气如何?” 转换为 get_current_weather(location: string, unit: ‘celsius’ | ‘fahrenheit’)。
  • 将自然语言转换为 API 调用或数据库查询。将 “本月我的前十位客户是谁?” 转换为内部 API 调用,例如 get_customers_by_revenue(start_date: string, end_date: string, limit: int),或者将 “上个月 Acme 公司下了多少订单?” 转换为使用 sql_query(query: string) 的 SQL 查询。
  • 从文本中提取结构化数据。定义一个名为 extract_people_data(people: [{name: string, birthday: string, location: string}]) 的函数,以提取维基百科文章中提到的所有人物。这些用例是通过我们 /v1/chat/completions 端点中新的 API 参数 functions 和 function_call 实现的,允许开发者通过 JSON Schema 描述函数,并可选择要求其调用特定函数。请参阅我们的开发文档并添加 evals,如果您发现可以改进函数调用的情况。

函数调用示例如下:

在这里插入图片描述

自从 ChatGPT 插件的 alpha 版本发布以来,我们已经学到了很多关于如何安全地使工具和语言模型协同工作的知识。然而,仍有一些未解决的研究问题。例如,一个概念验证漏洞说明了不受信任的数据可以指示模型执行意外操作。我们正在努力减轻这些和其他风险。开发人员可以通过只消费来自可信工具的信息并在执行具有现实影响(例如发送电子邮件、在线发布或购买)的操作之前包含用户确认步骤来保护其应用程序。

新模型

GPT-4

  • gpt-4-0613 包含一个更新和改进的模型,具有函数调用功能。
  • gpt-4-32k-0613 包括与 gpt-4-0613 相同的改进,以及更长的上下文长度,以更好地理解较大的文本。
  • 通过这些更新,我们将邀请更多等待名单中的人在未来几周内尝试 GPT-4,并打算使用此模型完全删除等待名单。感谢所有耐心等待的人们,我们很高兴看到您使用 GPT-4 构建了什么!

GPT-3.5 Turbo

  • gpt-3.5-turbo-0613 包含与 GPT-4 相同的函数调用,以及通过系统消息更可靠的可操纵性,这两个功能使开发人员能够更有效地引导模型的响应。
  • gpt-3.5-turbo-16k 提供了比 gpt-3.5-turbo 4 倍的上下文长度,价格是其两倍:每 1K 输入标记 0.003 美元和每 1K 输出标记 0.004 美元。 16k 上下文意味着该模型现在可以在单个请求中支持约 20 页文本。

模型弃用

今天,我们将开始升级和弃用三月份宣布的 gpt-4 和 gpt-3.5-turbo 的初始版本。使用稳定模型名称(gpt-3.5-turbo、gpt-4 和 gpt-4-32k)的应用程序将在 6 月 27 日自动升级到上述新模型。为了比较不同版本之间的模型性能,在我们的 Evals 库中支持公共和私有评估,以展示模型变化如何影响您的使用情况。

需要更多时间进行过渡的开发者可以通过在 API 请求的 “model” 参数中指定 gpt-3.5-turbo-0301、gpt-4-0314 或 gpt-4-32k-0314 来继续使用旧版模型。这些旧版模型将可访问至 9 月 13 日,此后再指定这些模型名称的请求将失败。您可以通过我们的模型弃用页面保持最新状态。这是对这些模型的第一次更新;因此,我们热切欢迎开发者反馈帮助我们确保平稳过渡。

价格更低

OpenAI 不断提高系统效率,并将这些节省成本的优惠传递给开发者,从今天开始生效。

Embeddings:text-embedding-ada-002 是最受欢迎的 embeddings 模型。今天,我们将其费用降低了 75%,现在仅需 $0.0001 per 1K tokens。

GPT-3.5 Turbo:gpt-3.5-turbo 是我们最受欢迎的聊天模型,为数百万用户提供 ChatGPT 服务。今天,我们将 gpt-3.5-turbo 输入令牌的费用降低了 25%。现在,开发人员可以以每 1K 个输入令牌 $0.0015 和每 1K 个输出令牌 $0.002 的价格使用此模型,相当于大约每美元 700 页。

gpt-3.5-turbo-16k 的定价为每 1K 输入令牌 $0.003 和每 1K 输出令牌 $0.004。

开发者反馈是平台演进的基石,我们将继续根据所听到的建议进行改进。 我们很期待看到开发者如何在他们的应用程序中使用这些最新模型和新功能。


三、总结

更强大的函数调用能力,更新且更易控制的模型版本,以及上下文长度的扩展,这些都进一步优化了开发者的用户体验。

此外,还调整了模型的定价策略,降低了 Embeddings 模型和 GPT-3.5 Turbo 的价格,进一步提高了其产品的性价比。

开发者反馈是平台演进的基石,OpenAI 将继续根据所听到的建议进行改进。很期待看到开发者如何在他们的应用程序中使用这些最新模型和新功能。


📚️ 参考链接:

  • OpenAI 重磅更新,又变强了!
  • OpenAI Pricing | Simple and flexible. Only pay for what you use.
  • OpenAI | Model endpoint compatibility
  • OpenAI API 重磅升级:支持函数调用,价格更亲民!
  • 沈向洋:致 AI 时代的我们 —— 请不要忽视写作的魅力

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/33065.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

哈工大计算机网络课程网络层协议详解之:互联网控制报文协议(ICMP)

哈工大计算机网络课程网络层协议详解之:互联网控制报文协议(ICMP) 在互联网中,IP数据报的传输很容易出现差错,当出现差错时,最简单的处理办法就是对该IP数据报进行丢弃。但是,并不是直接丢弃就…

Linux 学习记录40(C++篇)

Linux 学习记录40(C/QT篇) 本文目录 Linux 学习记录40(C/QT篇)一、QT软件的使用1. 新建工程 二、C语言和C的区别1. C对C的扩充2. C对C的兼容 三、第一个C程序1. cout标准输出流对象(1.介绍:(2. 运算符(3. cout的使用 2. cin标准输出流对象(1.介绍:(3. ci…

TCP/IP详解(一)

TCP/IP协议是Internet互联网最基本的协议,其在一定程度上参考了七层OSI(Open System Interconnect,即开放式系统互联)模型 OSI参考模型是国际组织ISO在1985年发布的网络互联模型,目的是为了让所有公司使用统一的规范来…

序列化和反序列化的认识【protobuf、json、xml】

1. 什么是序列化与反序列化? 程序员在编写应用程序的时候往往需要将程序的某些数据存储在连续的内存中,然后将其写入文件或是将其传输到网络中的另一台计算机上以实现通讯。这个将程序数据转换成能被存储并传输的格式的过程被称为序列化(seri…

web存储(Storage)

目录 1、基本概念 2、功能监测 2.1 测试可用性 2、W3C标准 3、基本方法或属性 4、 Local Storage 4.1 描述 4.2 示例 5、sessionStorage 5.1 描述 5.2 示例 6、StorageEvent(存储事件) 6.1 构造函数 6.2 实例属性 6.3 实例方法 6.4 响应…

【spring源码系列-04】注解方式启动spring时refresh的前置工作

Spring源码系列整体栏目 内容链接地址【一】spring源码整体概述https://blog.csdn.net/zhenghuishengq/article/details/130940885【二】通过refresh方法剖析IOC的整体流程https://blog.csdn.net/zhenghuishengq/article/details/131003428【三】xml配置文件启动spring时refres…

团体程序设计天梯赛-练习集L2篇⑨

🚀欢迎来到本文🚀 🍉个人简介:Hello大家好呀,我是陈童学,一个与你一样正在慢慢前行的普通人。 🏀个人主页:陈童学哦CSDN 💡所属专栏:PTA 🎁希望各…

线性代数高级--矩阵的秩--SVD分解定义--SVD分解的应用

目录 矩阵的秩 概念 k阶子式 矩阵的秩的定义 矩阵的秩的性质 SVD分解 概念 注意 SVD的分解过程 SVD分解的应用 矩阵的秩 概念 矩阵的秩是线性代数中的一个重要概念,用于描述矩阵的行(或列)向量的线性无关程度。矩阵的秩可以通过…

Spring Data JPA 报 HOUR_OF_DAY: 0 -> 1异常的解决过程和方案

在进行数据查询时,控制台报了Caused by: com.mysql.cj.exceptions.WrongArgumentException: HOUR_OF_DAY: 0 -> 1异常,查询得知:这是由于查mysql库,转换类型为datetime类型的字段引起的。 网上的解决方案有多种,大…

fastadmin如何自定义一个列表上的按钮。

参考文档: 首先,这是没有新增按钮的,只有删除和编辑。 然后js按钮是这一块: 我现在呢想加上一个撤销的按钮怎么办呢,只需要在js加上这一串代码就行了。 {field: "operate",title: __("Operate")…

uni-app 使用axios发请求 运行到微信开发者工具报错 Adapter “http‘ is not available in the build

场景 最近在使用uni-app开发H5移动端,跟往常一样使用axios发请求,做一些全局的请求拦截响应拦截操作 uni-app数据存储,uni-ui组件开发,配置axios,vuex。配置了vue.config.js文件做跨域操作 运行到谷歌浏览器一切正常…

HBase(8):扫描操作

1 需求 查看ORDER_INFO表中所有的数据 1.2 scan命令 在HBase,我们可以使用scan命令来扫描HBase中的表。语法: scan 表名 1.3 扫描ORDER_INFO表 scan ORDER_INFO,{FORMATTER => toString} 注意:要避免scan一张大表! 2 需求二:查询订单数据(只显示3条) scan ORDE…

从0开始,精通Go语言Rest微服务架构和开发

说在前面 现在拿到offer超级难,甚至连面试电话,一个都搞不到。 尼恩的技术社区中(50),很多小伙伴凭借 “左手云原生右手大数据”的绝活,拿到了offer,并且是非常优质的offer,据说年…

响应式数据大屏开发rem、%、vh/vm

前言 响应式数据大屏开发rem、%、vh/vm 我们在开发数据大屏的时候难免会需要解决响应式问题 ,那么响应式是什么呢? 响应式:响应式布局是元素随着屏幕发生宽高大小变化 盒子布局发生变化 通俗的来说: 自适应:元素随着…

尚硅谷大数据Flink1.17实战教程-笔记02【Flink部署】

尚硅谷大数据技术-教程-学习路线-笔记汇总表【课程资料下载】视频地址:尚硅谷大数据Flink1.17实战教程从入门到精通_哔哩哔哩_bilibili 尚硅谷大数据Flink1.17实战教程-笔记01【Flink概述、Flink快速上手】尚硅谷大数据Flink1.17实战教程-笔记02【Flink部署】尚硅谷…

深入理解深度学习——Transformer:编码器(Encoder)部分

分类目录:《深入理解深度学习》总目录 相关文章: 注意力机制(AttentionMechanism):基础知识 注意力机制(AttentionMechanism):注意力汇聚与Nadaraya-Watson核回归 注意力机制&#…

Unix/Linux编程:UDS 流(Stream)

〇、前言 socket 是一种 IPC (Inter-Process Communication,进程间通信)方法,它允许位于同一主机(计算机)或使用网络连接起来的不同主机上的应用程序之间交换数据。通过使用Socket,开发人员可以…

HTML5 游戏开发实战 | 贪吃蛇

在该游戏中,玩家操纵一条贪吃的蛇在长方形场地里行走,贪吃蛇按玩家所按的方向键折行,蛇头吃到食物(豆)后,分数加10分,蛇身会变长,如果贪吃蛇碰上墙壁或者自身的话,游戏就结束了(当然也可能是减去…

企业级微服务架构实战项目--xx优选-用户登录

一 用户登录的触发页面 1.登录常量 2.登录地址 3.配置域名 4.启动程序 触发连接小程序后端的登录接口 小程序controller的登录方法

XR云新未来圆桌精彩回顾 | XR应用场景迭代下的新商业模式

6月15日,由平行云联合首都在线共同主办,中关村软件园协办,以“XR云新未来|弹性算力赋能可交互、沉浸式商业实践”为主题的XR行业交流盛会在北京成功举办。 本次会议我们邀请到平行云科技创始人兼CEO 李岩、XREAL 云XR负责人 吴维、瑞帆科技…