【GPT-4 Turbo】、功能融合:OpenAI 首个开发者大会回顾

GPT-4 Turbo、功能融合:OpenAI 首个开发者大会回顾

就在昨天 2023 年 11 月 6 日,OpenAI 举行了首个开发者大会 DevDay,即使作为目前大语言模型行业的领军者,OpenAI 卷起来可一点都不比同行差。

OpenAI 在大会上不仅公布了新的 GPT-4 Turbo 模型,还推出了几项从业务角度看可能冲击其他 AI 公司市场份额的服务,并对现有功能进行了升级和融合,基本上很多做着类似功能的第三方项目和公司都能感受到来自 OpenAI 的威胁。

接下来我就给大家总结一下这次 OpenAI 开发者大会的主要内容,每项内容还会根据我自己的经验给大家进行一些简单的解读。

新的模型:GPT-4 Turbo

首先,大会最重磅的内容自然是发布新的模型 GPT-4 Turbo。不同于 GPT-3.5 到 GPT-4 更新换代般的升级,OpenAI 最近专注于打磨现有的功能,GPT-4 Turbo 的主要更新还是将之前截止 2022 年的知识库更新到现在的 2023 年 4 月,以及支持最大 128K Token 的输入。

新的 API 价格

按照 OpenAI 的说法,现在的 GPT-4 Turbo 不仅更新了知识库,而且最高支持 300 页文档作为输入,是之前 8K Token 限制的 16 倍,而且超长文档输入内容处理的准确性也会比前辈有所提高。之前各类大语言模型最热门的第三方项目就是花式处理超长文档类的应用服务,甚至另一个热门大模型 Claude2.0 最大的卖点就是能够输入 100K Token 的超长文档。

GPT-4 能够处理更长内容的 Advanced Data Analysis(高级数据分析,效果可以查看我之前的文章)功能推出后,这些项目已经明显受到影响,现在 GPT-4 Turbo 一出,这些模型和项目剩下能够与其竞争的点就只剩下更低的价格或者直接免费了。

除此以外,GPT-4 Turbo 性能和处理速度比起前辈也有所提升,所以 OpenAI 也放宽了每分钟输入和输出的 Token 限制,由于性能的提升 API 调用价格也随之下降,输入和输出价格分别只有之前的 1/3 和 1/2(包括即将推出的 gpt-4-1106-preview 模型),虽然比起 GPT-3.5 还是要贵上不少,但对于必须调用的商业项目或者第三方项目来讲还是一个很大的利好,毕竟 GPT-4 的效果比起 GPT-3.5 要好上太多。

更低的 API 价格,连 GPT 3.5 都更便宜了

可重现的输出

另外这次 GPT-4 Turbo 模型还有一个值得关注的新特性,那就是在一定时间之内可以实现可重现输出 —— 也就是相同的问题每次都会得到一模一样的答案。

之前阻碍很多人把 GPT 真正用于自己的工作或者项目里面的一大因素就是它随心所欲的输出,即使是相同的问题,每次都有可能得到不同的答案,不同的格式也很难将 GPT 融入到工作流程或者程序里面,现在 GPT-4 Turbo 有了一定程度的复现能力(虽然目前还是 Beta 中的 Beta),还能返回某段时间内不同生成内容的概率,这个特性对于商业用户开发人员来讲要比其他更新来的更加实用。

功能融合

最后是一个用户体验上的改进,也能极大增加 ChatGPT 的能力,那就是将目前分开的功能融合在一起。目前 GPT-4 有高级数据分析、联网搜索、AI 画图和插件等功能,但是用户每次只能选择其中的一个,不同功能之间也无法互相调用。

现在 OpenAI 宣布即将把这些功能都整合到一起,用户只需要在使用的时候用自然语言说出自己想要调用的功能,或者直接说出自己的需求,ChatGPT 就会根据需求或者在合适的时候自动调用对应的功能,这极大拓宽了用户使用 ChatGPT 的使用场景和灵活度,像是之前没有办法实现的「搜索信息然后生成图片」或者「在代码解释器中的库能够联网」等需求现在都可以轻松实现。

功能融合后的界面

JSON 模式和函数调用(Function Calling)优化

JSON 是一种特定格式表示的数据结构,用来方便开发者和程序传递与处理数据,形式如 {"项目 A 的名称": "项目 A 的内容", "项目 B 的名称": "项目 B 的内容"}

对于想要用 GPT 进行正儿八经项目和需求的公司和个人,这次 OpenAI 宣布的更新也是十分实用。首先新模型在必须遵守指令的任务上表现会更好更稳定,比如能够比之前输出更加固定的指定内容(如 JSON 和特殊排版),接着 OpenAI 还在 API 调用的参数上添加了新的 JSON 模式,能够保证 GPT 始终会按要求返回格式正确的 JSON,这让更多用户能够更放心地选择使用 GPT 执行任务,也不用每次都在 Prompt 里面反复提醒 GPT 一定要返回 JSON 格式了。JSON 模式在 GPT-4 和 GPT-3.5 上都可以启用(包括未来发布的 1106 版本模型)。

JSON 模式

另外 OpenAI 在另一个常见的大语言模型与项目结合方式 —— Function Calling 上也做出了优化,Function Calling 函数调用可以让用户把自己项目上的功能和特性「介绍」给 GPT,接着 GPT 就能在合适的时机调用这些功能并从用户自己的项目上获取到返回信息。

目前 GPT-4 的插件商店里面的插件就是使用这个特性。本次 GPT-4 Turbo 不仅优化了准确性,提高调用函数的正确率以及调用时机的正确率,而且能够在一次对话中同时调用多个函数(目前每次只能调用一个),这极大节省了每次运行的时间和资源。之后即使普通用户也能感受到调用插件时明显更快错误率更低。

函数调用优化

这两个功能更新明显是面向更加专业的用户,让 GPT 在第三方项目和商业产品上表现更好更稳定,这样也能极大提升普通用户和公司在自己的项目里面使用大语言模型的动力,顺便把第三方的工具框架干掉(微软:???)。

自定义模型和文档库

OpenAI 给专业用户和商业公司的惊喜还不止这些,这次发布会还发布了一卡车的工具,一个新的 Assistants API 以及微调模型的权限来帮助有更高需求的用户和公司打造专属于它们的模型。

首先是现在使用 Assistants API 能够调用 GPT 上几乎所有的新功能,Assistants API 本身就是一个特别训练的 AI,可以让你用自然语言调用包括高级数据分析、函数调用、AI 画图、图片识别、语音生成和插件等等几乎所有 OpenAI 目前能够提供的功能。

用户还可以调用 Assistants API 直接来检索自己的数据库和文档库,甚至不需要将数据库和文档库矢量化就可以将自己的数据转化为 GPT 的知识库。当然,OpenAI 反复强调所有的用户数据都不会用于训练自己的模型,并且会定时删除。这项功能不用等,现在你就可以直接进入 OpenAI Assistants Playground 进行试用。

用户可以把自己的文档投喂给 Assistants API

数据安全声明

修改甚至完全定制模型

OpenAI 还宣布会制作一个新的微调界面,让开发者可以微调 GPT-3.5 甚至 GPT-4 模型。另外大佬公司们如果有特别大的项目(几十亿 Token 以上)OpenAI 也不介意多赚点钱,针对金主的特定领域和需求训练定制的 GPT-4,包括修改模型训练过程的每个步骤,从执行额外的特定领域预训练,到运行为特定领域量身定制的自定义 RL 后训练过程。

客户将拥有对其自定义模型的独占访问权限。根据 OpenAI 现有的企业隐私政策,自定义模型不会提供给其他客户或与其他客户共享,也不会用于训练其他模型,提供给 OpenAI 用于训练自定义模型的专有数据也不会在任何其他对话中重复使用。

按照 OpenAI 的说法,这个功能只会开放给很有限的公司和组织,而且非常昂贵。低情商说法就是不是真正的富哥和大佬就不要点这个申请链接。

GPTs:属于每个人的模型

当然,普通用户也可以在某种程度上定制模型。OpenAI 在现有插件开发的基础上升级为 GPTs,插件商店也会升级为像是苹果应用商店一样的平台。

用户可以使用自然语言对 GPT 进行编程,给 GPT 指定一个特定的指令,或者特殊的知识,以及像是上面函数调用类似的与自己项目或者第三方服务结合的能力,这些编程是在模型之上的额外数据,所以不会像上面微调甚至定制模型那样深入。

好处是上手难度同样很低,加上 GPT 用自然语言就可以进行编程,OpenAI 还提供了专门负责创建插件的 AI 让用户使用自然语言创建自定义 GPT。未来可以想象每个用户都可以拥有一个专属于自己的 GPT,甚至能像是现在 Steam 创意工坊和虚幻引擎商店一样成为一个新产业。

版权盾

为了让用户和公司更加放心使用生成型人工智能产品,Google、Microsoft、Amazon 和 Adobe 这些拥有 AI 服务的大厂,都相继宣布为「陷入人工智能生成产品纠纷」的客户提供法律援助和相关费用报销。

虽然各家政策背后都有不少的条件和限制,比如:必须是企业用户、用途必须「商业上合理」、还有必须是大厂认为合理的情况下等等,但这已经成为一个趋势。

作为 AI 领域最大的大厂,OpenAI 现在也宣布跟进这个政策,推出 Copyright Shield—— 如果用户面临有关版权侵权的法律索赔,OpenAI 现在将介入保护客户并支付由此产生的费用,当然条件是仅适用于 ChatGPT Enterprise 和开发人员平台的正式发布功能。


通过虚拟卡 WildCard 的方式来升级 GPT 4.0 最快了,大概2分钟就可以升级完成, 而且升级 GPT 4.0 价钱也不贵,虚拟卡一年10美元,GPT4 每个月也才 20美元。如果你觉得 GPT 4.0 对你可能有帮助,那就赶快来升级吧!

ChatGPT4.0升级教程

所有功能都提供 API

现在 GPT-4 很多惊艳的功能都是只能在官方网页版或者客户端中体验,现在 OpenAI 给它们都做了对应的 API,包括视觉识别 GPT-4 Turbo With Vision,DALL·E 3 AI 画图以及谁听谁震惊的下一代语音合成框架 TTS。

提供 API 的功能

虽然目前这些 API 还要付费,价格比起同类产品往往也要贵一点。但也能看出 OpenAI 横扫 AI 领域的野望,而且目前看来它也有这个能力,这些功能绝大部分都比肩同类最好的产品,甚至视觉识别和语音合成这两方面在我体验后可以称之为「次世代」。

我认为不考虑价格的话,很可能其他产品甚至连和它对比的意义都没有。我强烈建议大家自己亲自体验一次,特别是语音合成效果特别惊艳,各种功能的体验也可以查看我之前的文章。

各种项目的价格

另外 OpenAI 还在不断进步,不仅要推出下一代的语音识别框架 WhisperV3,而且 DALL·E 3 还即将采用和 Stable Diffusion 一致的解释器 —— 这意味着两家的模型能够通用。这些 API 的提供和改进基本上能够影响到 AI 行业的每一家公司,这也是好事,更强更激烈的竞争最终还是能够带来更快的进步,以及对消费者来讲更高的性价比。

总结

以上就是 OpenAI 在首次开发者大会上发布的主要内容了,这次推出的所有更新和新功能基本上都在推进 GPT 在聊天以外的实际应用,并且以 GPT 为核心,打造更加丰富的生态和能力。可以看出 OpenAI 是非常想成为不仅是大语言模型,而是 AI 领域的 Top1,也非常想让 GPT 真正融入到这个领域的实际项目里,而不是只能作为一个聊天机器人。

AI 目前已经过了夺人眼球的阶段,现在 OpenAI 走在一条非常正确的道路上,放弃追求每代都必须有巨大提升,而是专注于让 GPT 更加可用,更加实用,更多能用,满足更多人的需求,让更多人真正能利用 AI 帮到自己,提升自己,才能在未来将人工智能变成如水电网般自然的基础设施。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/525558.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

机器学习 —— 数据分析与图表绘制

本文使用工具 Anaconda下载安装与使用 Jupyter Notebook的使用 本文使用数据集 机器学习实验所需内容.zip 以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,这就需要知道几个业务指标,本次的分析…

Redis 和 Mysql 数据库数据如何保持一致性

1.1前言 我们在实际项目中经常会使用到Redis缓存用来缓解数据库压力,但是当更新数据库时,如何保证缓存及数据库一致性,一般我们采用延时双删策略。 目前系统中常用的做法是一个查询接口,先查询Redis,如果不存在则查询…

在展会上如何介绍产品和公司,柯桥俄语培训

1.Приглашаем Вас… 邀请您…… 2. Позвольте пригласить Вас… 请允许邀请您…… 3.Имеем честь пригласить Вас … 诚挚邀请您…… 4. Посылаем Вам приглашение на… 给您&#xff0…

性能优化 - 你能说一说,为什么做了骨架屏,FCP的指标还是没有提升吗

难度级别:中高级及以上 提问概率:80% FCP的全程是First Contentful Paint,是衡量网页性能的一个重要指标,很多人把FCP理解为元素内容首次渲染到浏览器上的时间。但由于现在比较流行的Vue或是React项目中,HTML文档最初只有一个id为app的DIV…

Qt使用iostream的cout

在QT想使用iostream的cout。 参考以下博客: (转载)Qt中使用cout输出的方法 pro里加上; CONFIG console勾选 Run in Terminal clean工程,重新构建 上面是cout的,下面是我的另一个函数的qDebug输出的。

上位机图像处理和嵌入式模块部署(qmacvisual之tcp客户端)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 视觉算法出了结果之后,一般都要通知到其他设备进行某些动作的。以前通信的方式,一般都是有线的,什么232、485、…

【Linux】HTTPS协议

HTTPS协议 1.什么是"加密"2.为什么要加密3.常见的加密方式4.数据摘要&&数据指纹5.数字签名6.理解链 - 承上启下7.HTTPS 的工作过程探究方案一:只使用对称加密方案二:只使用非对称加密方案三:双方都使用非对称加密方案四&am…

C顺序表:通讯录

目录 前言 通讯录数据结构 通讯录初始化 查找名字 增加联系人 删除联系人 展示所有联系人 查找联系人 修改信息 销毁通讯录 完整通讯录代码 前言 数据结构中的顺序表如果已经学会了,那么我们就可以基于顺序表来完成一个通讯录了 通讯录其实我们使用前…

项目运维方案资料-(word原件)31页

1. 文档介绍 2. 人员与责任 3. 运维过程内容 4. 运维资源 5. 运维服务规划保障 6. 事件处置 7. 质量改进 8. 运维边界及内容 软件开发管理全套资料获取方式①:点我获取 获取方式②:本文末个人名片直接获取。

SpringBoot快速入门笔记(5)

文章目录 一、elemetnUI1、main.js2、App.vue3、fontAwesome 一、elemetnUI 开源前端框架,安装 npm i element-ui -S 建议查看官方文档 Element组件,这里是Vue2搭配elementUI,如果是vue3就搭配elementPlus,这里初学就以Vue2为例子…

Matlab 基础语法 小结

input x input(prompt) # input digit str1 input(prompt,s) # input string执行图像处理任务 require Image Processing Toolbox Image Processing Toolbox™ provides a comprehensive set of reference-standard algorithms and workflow apps for image processing, a…

农业气象站的工作原理

TH-NQ8农田小气候监测站是一种专门用于监测农田内小范围气候状况的设备,其作用主要体现在以下几个方面: 实时监测与记录:通过配备的多种传感器,能够实时监测和记录农田内不同位置的气温、湿度、风速、风向、降雨量等气象要素的变化…

Android 9.0 framework层实现app默认全屏显示

1.前言 在9.0的系统rom产品定制化开发中,在对于第三方app全屏显示的功能需求开发中,需要默认app全屏显示,针对这一个要求,就需要在系统启动app 的过程中,在绘制app阶段就设置全屏属性,接下来就实现这个功能 效果图如下: 2.framework层实现app默认全屏显示的核心类 fram…

nginx配置实例-动静分离

目录 一、相关概念 1.1动静分离概念 1.2动静分离的两种实现方法 二、实例配置 2.1 准备工作:在linux系统中准备静态资源,方便后面做测试 2.2 修改nginx配置文件 2.3 在浏览器测试 一、相关概念 1.1动静分离概念 将动态请求跟静态请求分开&#xf…

下半年跨境电商全球市场持续扩大,掌握测评自养号技术将迎来新机遇

2024年跨境电商在下半年有望继续保持稳健增长,市场将更加国际化、便捷化和智能化,为消费者和卖家带来更多机遇和发展空间。 全球化市场持续扩大,随着全球市场的进一步开放和互联网的普及,跨境电商将继续拓展到更多的国家和地区。消…

使用aspose相关包将excel转成pdf 并导出

SpringBoot 项目 基于aspose相关jar包 将excel 转换成pdf 导出 1、依赖的jar包 &#xff0c; jar获取链接 aspose相关三方jar &#xff0c;下载解压后,在项目路径下建一个libs包&#xff0c;然后将下图两个jar 拷贝至刚新建的libs目录中 2、pom.xml中加入maven引入 <depend…

通用开发技能系列:Scrum、Kanban等敏捷管理策略

云原生学习路线导航页&#xff08;持续更新中&#xff09; 本文是 通用开发技能系列 文章&#xff0c;主要对编程通用技能 Scrum、Kanban等敏捷管理策略 进行学习 1.什么是敏捷开发 敏捷是一个描述软件开发方法的术语&#xff0c;它强调增量交付、团队协作、持续规划和持续学习…

具身智能机器人实现新里程碑!新型3D世界模型问世

随着人工智能技术的不断进步&#xff0c;视觉-语言-动作&#xff08;VLA&#xff09;模型在机器人控制、自动驾驶、智能助手等领域展现出了广阔的应用前景。这类模型能够将视觉、语言、动作等多模态信息进行融合&#xff0c;实现从感知到决策的端到端学习。然而&#xff0c;现有…

【Python基础】生成器

文章目录 [toc]什么是生成器生成器示例生成器工作流程生成器表达式send()方法和close()方法send()方法close()方法 个人主页&#xff1a;丷从心. 系列专栏&#xff1a;Python基础 学习指南&#xff1a;Python学习指南 什么是生成器 在Python中&#xff0c;使用生成器可以很方…

Longan Pi 3H 开发板体验

Longan Pi 3H 开发板体验 开箱内容 打开包装&#xff0c;你可以看到以下物品 一个Longan Pi 3H盒子Longan Pi 3H开发板 产品基本介绍 Longan Pi 3H 是基于 Longan Module 3H 核心板的 ARM Linux 开发板&#xff0c;以 H618 (Quad core ARM Cortex-A531.5Ghz , 64-bit) 为主控…