GPT-4 Turbo:OpenAI发布旗舰版GPT-4模型,更便宜|更强大|128K上下文|支持多模态

一、介绍

OpenAI 在 2023 年 11 月 7 日举行首届开发者大会,此次展会的亮点无疑是 GPT-4 Turbo 的亮相,它是 OpenAI 著名的 GPT-4 模型的升级版。 GPT-4 Turbo 有两种变体:一种用于文本分析,另一种能够理解文本和图像。 GPT-4 Turbo 的上下文窗口扩展为 128,000 个标记或大约 100,000 个单词,比其前身 GPT-4 大四倍。该模型还提供对截至 2023 年 4 月的知识截止日期的最新信息的访问。

GPT-4 Turbo 的推出突显了 OpenAI 致力于快速迭代其人工智能系统并民主化对世界上最复杂的大型语言模型的访问。让我们仔细看看 GPT-4 Turbo 的特殊之处以及它将如何塑造人工智能的未来。

GPT-4 Turbo 可供所有付费开发者通过在 API 中传递“ gpt-4-1106-preview ”来尝试

二、知识更丰富、更新更及时

GPT-4 Turbo 的突出特点之一是其扩展的知识库。最初的 GPT-4 接受了截至 2021 年 9 月的数据训练,而 GPT-4 Turbo 则接受了截至 2023 年 4 月的数据训练。这意味着新模型吸收了额外 19 个月的信息,使其更了解最近的数据。事件和主题。

对于构建需要理解或讨论时事的人工智能应用程序的开发人员来说,对世界有最新的理解是非常有益的。当被问及政治、商业、技术、文化等当代主题时,GPT-4 Turbo 将能够提供更准确、更细致的答复。其及时的知识使该模型特别适合新闻聚合、智能助手、社交机器人和其他依赖及时信息的服务。

三、庞大的上下文窗口

除了扩展的知识之外,GPT-4 Turbo 还配备了显着扩展的上下文窗口。上下文窗口决定模型在制定响应时可以考虑多少文本信息。

GPT-4 Turbo 支持 128,000 个令牌的上下文窗口 - 比 GPT-4 中之前的 32,000 个令牌窗口大四倍。这相当于该模型能够同时考虑大约 300 页的文本,提供急需的上下文以确保相关性、连贯性和逻辑一致性。

增强的上下文窗口还可以实现更复杂的对话,同时降低模型丢失情节的风险,从而使应用程序面向未来。对于聊天机器人、数字助理、辅导系统和其他长时间交换用例来说,扩大的上下文窗口是一个游戏规则改变者。

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
  model="gpt-4-1106-preview",
  messages=[
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "Who won the world series in 2020?"},
    {"role": "assistant", "content": "The Los Angeles Dodgers won the World Series in 2020."},
    {"role": "user", "content": "Where was it played?"}
  ]
)
response['choices'][0]['message']['content']

四、多模态能力

虽然最初的 GPT-4 仅限于文本,但 GPT-4 Turbo 配备了多模态功能,使其能够理解和生成图像。开发人员可以将图像传递给 GPT-4 Turbo,让它自动生成详细的标题、分析视觉内容,甚至读取图像中的文本。

这种视觉智能极大地拓展了开发人员构建计算机视觉应用程序的视野,通过音频描述、智能 OCR 系统等帮助视障人士。支持图像的 GPT-4 Turbo 让人工智能更接近人类体验世界和与世界互动的方式。

OpenAI 还通过新的文本转语音模型增强了 GPT-4 Turbo 的音频能力。通过从文本生成流畅、自然的语音,应用程序现在可以向用户大声说出其响应,这对于语音界面和可访问性至关重要。在文本、图像和音频之间,GPT-4 Turbo 开创了多模态 AI 的新时代。

五、更实惠的定价

除了技术实力外,GPT-4 Turbo 还因其非常实惠的定价模式而脱颖而出。尽管与前身相比,OpenAI 的功能有了显着提高,但 OpenAI 仍设法使 GPT-4 Turbo 更加经济。

GPT-4 Turbo 每 1000 个输入代币的成本为 0.01 美元,每 1000 个输出代币的成本为 0.03 美元。与原始 GPT-4 定价相比,这意味着输入代币成本降低了 3 倍,输出代币成本降低了 2 倍。

对于预算有限、希望实施人工智能的开发人员来说,较低的成本消除了巨大的进入壁垒。得益于庞大的上下文窗口和多模式功能,GPT-4 Turbo 比以前的模型具有更多的每个代币价值。较低的价格和增强的功能相结合,使该版本成为负担得起的人工智能的令人兴奋的飞跃。

六、额外的增强功能

除了上述重大升级之外,OpenAI 还引入了一系列其他改进,使 GPT-4 Turbo 更加强大、高效且对开发人员友好。这些包括:

  • 可重复的输出 - GPT-4 Turbo 现在可以对相同的输入生成一致的响应,从而实现更严格的测试。

  • 对数概率——该模型现在可以输出其生成的代币的对数概率,从而解锁高级应用程序。

  • JSON 模式 — GPT-4 Turbo 可以将其输出限制为有效的 JSON 格式,以便无缝集成到 Web 服务中。

  • 改进的指令遵循——模型更忠实地遵循“以 XML 格式响应”等格式指令。

  • GPT-3.5 Turbo 刷新 — GPT-3.5 模型还获得了 16k 上下文窗口支持等升级,使其功能更接近 GPT-4。

  • 代码执行——GPT-4 Turbo 可以通过 OpenAI 的新 Codex 模型编写并安全地执行 Python 代码,从而实现复杂的计算。

GPT-4 Turbo增强功能演示

这些增强功能共同为开发人员提供了更细粒度的控制、灵活性和功能,以便在 GPT-4 Turbo 框架上构建下一代 AI 应用程序。

七、人工智能助手的未来

可以说,OpenAI 公告中最令人兴奋的元素之一就是 Assistant API 的发布。该工具集使开发人员能够构建高级人工智能助手,这些助手可以执行长期任务、利用外部知识源、执行自定义代码等。

Assistants API 使开发人员能够在自己的应用程序和服务中创建类似代理的 AI 体验。例如,旅游服务可以有一个人工智能助手,可以与用户交互,协作计划假期、提取推荐目的地、比较航班价格、提供天气预报并主动回答问题。

可以指示这些人工智能助手追求特定目标,调用相关的机器学习模型和数据资源,并跟踪长时间对话中的上下文。其结果是辅助人工智能超越了仅仅响应,而是采取主动并推动解决方案。

助理还可以根据需要调用新工具,包括:

  • 代码解释器:在沙盒执行环境中编写和运行Python代码,可以生成图形和图表,并处理具有多种数据和格式的文件。它允许您的助手迭代运行代码来解决具有挑战性的代码和数学问题等等。

  • 检索:利用外部模型的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。这意味着您不需要计算和存储文档的嵌入,或实现分块和搜索算法。 Assistants API 根据我们在 ChatGPT 中构建知识检索的经验,优化了要使用的检索技术。

  • 函数调用:使助手能够调用您定义的函数并将函数响应合并到其消息中。

八、总结

OpenAI DevDay 是一个非常引人注目的活动,其中包含突破性公告和更新。从 GPT-4 Turbo 和用户创建的 GPT 的推出到 GPT Store 和新 API 的推出,OpenAI 不断展示着他们推动 AI 技术边界的承诺。他们专注于为开发人员和用户提供支持,并为释放人工智能全部潜力的创新应用铺平道路。

OpenAI 一直在致力于推动全球人工智能的发展。它们确保这次开发大会发布的 GPT-4 Turbo 和所有已经提供的模型都不会使用私人用户数据进行训练,并在发布新系统之前进行广泛测试,以最大程度地减少有害的偏见和缺陷。

OpenAI 的内容审核技术有助于保护 GPT-4 Turbo 等模型免受行为违规和有害刻板印象的影响。他们积极采取措施来遏制风险,这种方法增强了人们对人工智能作为正义力量的信心。

九、References

[1] New models and developer products announced at DevDay:

https://openai.com/blog/new-models-and-developer-products-announced-at-devday

[2] OpenAI DevDay:

https://www.youtube.com/watch?v=U9mJuUkhUzk

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/129426.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【架构】后端项目经典分层架构介绍

文章目录 前言分层架构项目实践示例项目结构 其他知识 前言 开发后端项目时,我们最常见的一种架构模式就是分层架构 。 所谓的分层架构,就是把系统自上而下分为多个不同的层,每一层都有特定的功能和职责,且只和自己的直接上层与…

游戏缺失d3dx9_39.dll的5个修复方法,深度解析d3dx9_39.dll文件的作用

在当今的数字化时代,电子游戏已经成为了人们休闲娱乐的重要方式之一。然而,对于许多玩家来说,他们在享受游戏带来的乐趣的同时,也可能会遇到各种各样的问题,其中最常见的就是游戏无法正常运行。而这些问题中&#xff0…

chatglm3-6b记录问答对

# 打开文件,第二个参数是打开文件的模式,a代表追加,也就是说,打开这个文件之后直接定位到文件的末尾 file open(chatlog.txt, "a") # 写入数据 file.write(ask:prompt_text\n) file.write(response:response\n) # 关闭文件 fil…

2023.11.10联赛 T3题解

题目大意 题目思路 感性理解一下,将一个数的平方变成多个数平方的和,为了使代价最小,这些数的大小应该尽可能的平均。 我们可以将 ∣ b i − a i ∣ |b_i-a_i| ∣bi​−ai​∣放入大根堆,同时将这个数划分的次数以及多划分一段减…

基于.NET的强大文件格式开源转换工具

推荐一个非常强大、轻便的强大文件格式转换工具。 01 项目简介 一个基于.NET平台的开源文件格式转换工具,可以支持Windows 7/8/10等操作系统。安装后在右键菜单中出现 “File Converter” 项目,可以方便地通过右键菜单对选中文件进行格式转换&#xff…

找到【SVM】中最优的惩罚项系数C

因为本来SVM是想找到间隔最大的分割面,所以C越大,SVC会选择边际更小的,能够更好的分类所有训练点的决策边界,不过模型的训练时间也会越长。如果C的设定值较小,那SVC会尽量最大化边界,决策功能会更简单&…

【论文阅读】多模态NeRF:Cross-Spectral Neural Radiance Fields

https://cvlab-unibo.github.io/xnerf-web intro 从不同的light spectrum sensitivity获取信息,同时需要obtain a unified Cross-Spectral scene representation – allowing for querying, for any single point, any of the information sensed across spectra。…

【师兄啊师兄2】大爆料,敖乙回归,创造新里程碑,有望做成年番

Hello,小伙伴们,我是小郑继续为大家深度解析国漫资讯。 深度爆料《师兄啊师兄》最新资讯消息,玄机公司,作为动漫制作界的佼佼者,其制作的动漫作品一直以来备受瞩目。如今,在斗罗大陆第二部和吞噬星空第四季的热播之下…

[C/C++]数据结构 深入挖掘环形链表问题

前言 在上一篇文章中讲述了如何判断链表是否带环,在观看本片文章时建议先了解一下这篇文章的内容[C/C]数据结构 链表OJ题:环形链表。本篇文章我们将讲述关于环形链表的几种不同的情况如下,同时我们要解决另一个环形链表问题----找到入环点 slow一次走一步fast一次走两步一定会…

网络工程师回顾学习(第二部分)

第六章:网络互连与互联网 需要掌握: (1)网络互连设备 (2)网络互连的基本原理和关键技术 (扩展:TCP/IP协议簇) (3)Internet协议及其提供的网络…

Android---屏幕适配的处理技巧

在几年前,屏幕适配一直是困扰 Android 开发工程师的一大问题。但是随着近几年各种屏幕适配方案的诞生,以及谷歌各种适配控件的推出,屏幕适配也显得越来越容易。下面,我们就来总结一下关于屏幕适配的那些技巧。 ConstraintLayout …

CSRF(跨站请求伪造)攻击演示

目录 CSRF(跨站请求伪造)攻击演示CSRF 是什么CSRF 演示项目代码CSRF 演示过程服务启动演示 CSRF(跨站请求伪造)攻击演示 CSRF 是什么 CSRF(Cross-Site Request Forgery)跨站请求伪造,是一种网络安全攻击,其目标是利用被攻击者在…

【FastCAE源码阅读7】视图方向切换按钮实现原理

在FastCAE工具栏上有视图切换按钮,如下图所示: 本文介绍如何实现。 FastCAE集成了Python解析器,当单击按钮时,中间用Python执行的,最后调用MainWindow.dll库接口实现的。 具体的Python代码在Python模块的py文件夹下的…

Kali无线网卡无法识别

啊莫,该不会有人Kali系统识别不了自己的无线网卡吧! 环境:本来用作监听功能的3037芯片无线网卡,自己胡乱调,一不小心调试成了物理网卡的功能,变成了WLAN2网卡,结果用在了Windows系统上!如果你也是这样,点开你的网络适配器看看吧! 解决思路:1.删驱动 删除Windows上的…

基于JavaWeb+SSM+Vue微信小程序校园兼职任务平台系统的设计和实现

基于JavaWebSSMVue微信小程序校园兼职任务平台系统的设计和实现 源码传送入口前言主要技术系统设计功能截图Lun文目录订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码传送入口 前言 随着社会的发展和全球疫情的冲击,大学生的就业形势越来越严峻。越…

PLC开放式以太网通信网络状态查看工具netstat

在进行PLC的开放式以太网通信时,为了查看网络状态我们可以利用ping这个强有力的工具,还可以使用netstat这个工具。 博途PLC开放式以太网通信 UDP通信 博途PLC 1200/1500PLC开放式以太网通信TSEND_C通信(UDP)_RXXW_Dor的博客-CSDN博客文章浏览阅读1.7k次。开放式TSEND_C通信…

地理数据常用处理

自助式绘图工具kepler UTM坐标转WGS84 首先根据UTM对应表找到目标地区的编号,中国东部地区属于UTM Zone 50N 再查找UTM 50N 的EPSG标准 https://epsg.io/?qUTMzone50N 得到 EPSG:32650 Transform coordinates geohash编码与解码 import transbigdata as tbd …

LeetCode(1)合并两个有序数组【数组/字符串】【简单】

目录 1.题目2.答案3.提交结果截图 链接: 88. 合并两个有序数组 1.题目 给你两个按 非递减顺序 排列的整数数组 nums1 和 nums2,另有两个整数 m 和 n ,分别表示 nums1 和 nums2 中的元素数目。 请你 合并 nums2 到 nums1 中,使合…

Postman —— post请求数据类型

1、Postman中post的数据类型 post中有以下数据类型 1、form-data 2、x-www-form-urlencoded 3、raw 4、binary 2、Postman请求不同的post数据类型 from-data multipart/form-data,它将表单的数据组织成Key-Value形式,也可以上传文件,当…

Shell速成:快速提升你的Linux命令行技能

1 diff 对比文件不同 diff file1 file2 # 区分两个文件不同的地方[num1,num2][a|c|d][num3,num4] num1,num2 ##第一个文件中的行 a ##添加 c ##更改 d ##删除 < ##第一个文件中的内容 > ##第二个文件中的内容 num3,num4 ##第二个文件中的行-b忽略空格 -B忽略空行 -i…