你的朋友圈是否被近日 OpenAI 的开发者大会刷屏了?这是预料之中的事。在近日,OpenAI 首度召开了旨在定义未来应用市场的开发者大会。
让我们迅速捕捉 OpenAI 最新的动态以及 ChatGPT 的更新亮点。
1、OpenAI 最新动态
今晨的盛会聚焦于以下要点:对 OpenAI 过去一年发展的回望、新产品的揭幕、以及 GPT Store 的预告。让我们一起回顾这些精彩瞬间。
首先,大会回顾了 OpenAI 过去一年的里程碑,特别提到了 ChatGPT 的迭代革新和围绕 OpenAI 生态所集结的开发者社区活力。
ChatGPT 现已拓宽至语音互动、图像处理以及与 DALL-E 3 的协同工作等功能。
ChatGPT 目前的活跃用户数飙升至亿级别,同时,API 调用者的数量已经突破了两百万大关。
OpenAI 在技术推广和普及方面的成就可谓是少有企业能望其项背,新推出的 GPT-4 Turbo 模型功能强大,引人瞩目。
GPT-4 Turbo 的突破主要体现在以下六大方面:
首先是上下文长度的大幅提升,从 32k 提高到了 128k,超越了竞争者 Anthropic 的 100k 上下文限制。GPT-4 Turbo 还在长篇上下文中实现了更连贯、更精确的交互。
其次是为开发者提供了更多强大的控制功能,以便更有效地使用 API 和函数调用。
新增了 JSON Mode,确保模型以特定的 JSON 格式回应,便于 API 调用。
同时,模型支持多函数调用,并引入了 seed parameter,保证在必要时返回固定的输出。
知识库方面,内部和外部知识库都得到了升级。GPT 的知识库更新至 2023 年 4 月。
GPT 的知识库更新至 2023 年 4 月
除此之外,GPT-4 Turbo 也增强了对外部知识库的支持,允许上传外部数据库或文件。
第四个亮点是多模态能力的增强,新模型整合了 OpenAI 的视觉模型 DALL·E 3,并提供了多种预设声音供选择。
多模态能力的增强
第五点是模型微调与定制,GPT-3.5 Turbo 16k 的版本现在可以进行定制微调,价格也更加亲民。
最后一点是速率限制的提升,GPT-4 用户可以享受每分钟速率限制翻倍的体验。
GPT Store 的首次亮相,标志着插件系统向更广泛的应用领域的扩展。 此外,ChatGPT 官方未来将为参与应用开发的开发者推出收益分成计划。
GPT Store 的首次亮相
2、ChatGPT 功能更新速览
让我们来看看 ChatGPT 近期推出的新功能,包括语音交互、图像识别和全能工具模式。
2.1、 Assistants API
在OpenAI开发者大会上,OpenAI推出了Assistants API,使开发人员能够在他们的应用程序中构建助手。
借助Assistants API,OpenAI的客户可以构建具有特定指令、利用外部知识并能够调用OpenAI生成式AI模型和工具来执行任务的助手。这样的应用案例范围广泛,从基于自然语言的数据分析应用程序到编码助手,甚至是人工智能驱动的假期规划器。
Assistants API提供了以下封装能力:
持久的线程:人们无需处理长时间的对话历史。
内置的检索:利用来自OpenAI模型外部的知识,如公司员工提供的产品信息或文档,以增强开发人员创建的助手。
提供新的Stateful API来管理上下文。
内置的代码解释器:可以在沙盒执行环境中编写和运行Python代码。这一功能于3月份针对ChatGPT推出,可以生成图形和图表、处理文件,使使用Assistants API创建的助手能够迭代运行代码来解决代码和数学问题。
改进的函数调用:使助手能够调用开发人员定义的编程函数,并将响应合并到他们的消息中。
Assistants API目前处于测试阶段,现在所有开发人员都可以使用它。开发者可以前往Assistants Playground尝试Assistants API的测试版,而无需编写任何代码。
OpenAI将Assistants API视为帮助开发者在其应用程序中构建类似助手体验的第一步。借助Assistants API,构建助手应用将变得更加简单。OpenAI表示,随着时间的推移,他们将不断提升Assistants API的能力。此外,他们计划未来允许客户提供自己的Copilot工具,以补充其平台上的代码解释器、检索组件和函数调用功能。
2.2、语音交互
「语音交互」功能让用户能与 ChatGPT 进行自然的语言对话,不需要额外插件即可使用。
这一功能的实现,得益于 Whisper 语音系统的集成,能将语音输入转换为文字;再通过文本到语音模型,将对话转换为仿真人声输出。
无论你面临情感困惑还是职业选择,ChatGPT 的语音功能都能给予陪伴和建议。
2.3、图像识别
ChatGPT 对图像识别功能进行了升级,不论是简单的日常问题还是复杂的商业分析,只需上传图片,ChatGPT 即可提供帮助。
目前,这一功能专为 GPT-4 用户开放,可以在 ChatGPT 应用中直接使用。
2.4、All Tools
最近,ChatGPT 引入了「All Tools」模式,集成了网络搜索、文件浏览、数据分析和图像生成等多项功能。
此模式允许用户在一个界面内使用多种工具,无需切换不同模式,提升了使用的便捷性和效率。「All Tools」模式的引入,将 ChatGPT 打造成了一个多功能的平台。