三、OpenAI所有模型介绍

在这里插入图片描述

1. 综述

OpenAI API开发了具有各种能力的模型。可以根据不同的需求选择不同的模型并进行精调。

模型描述
GPT-4、GPT-4 Turbo一组从GPT-3.5升级后的模型,能够生成自然语言和代码
GPT-3.5 Turbo一组从GPT-3.5升级后的模型,能够生成自然语言和代码
DALL.E能够根据自然语言提示词生成和编辑图片的模型
TTS一组可以将文本转换成自然语音语言的模型
Whisper可以将语音转换成文本的模型
Embeddings一组可以将文件转换成数字形式的模型
Moderation检测文本是否敏感或安全的审核模型
GPT base一组没有指令的情况下也能生成自然语言和代码的模型

其它开源模型:Point_E, Whisper, Jukebox, CLIP

gpt-3.5-turbo, gpt-4, gpt-4-turbo-preview是目前最新版本。可以通过调用API,响应中可获得版本信息。

2. GPT-4 GPT-4-Turbo

GPT-4是1个多模态的大语言模型(可以接受文本或图片,然后输出文本),对于解决相对较困难的问题超过之前所有的模型。并对聊天进行了优化。

模型描述上下文令牌
gpt-4-0125-preview最新的GPT-4模型旨在减少模型
无法完成任务的“偷懒”情况,返回最大4096令牌
128,000 tokens
gpt-4-turbo-preview当前指向gpt-4-0125-preview128,000 tokens
gpt-4-1106-previewGPT-4 Turbo模型的主要特征:改进指令跟随,JSON模式,
重复输出,并行函数调用等功能。返回最多4,096个输出令牌。
这个预览模型不适合应用于生产。
128,000 tokens
gpt-4-vision-preview除了具有GPT-4 Turbo功能外,GPT-4还具有理解图像的能力。
返回最多4,096个输出令牌。
这个预览模型不适合应用于生产。
128,000 tokens
gpt-4当前指向gpt-4-06138192tokens
gpt-4-0613gpt-4从2023年6月13日起的快照,改进了函数调用支持8192tokens

对于基本的任务,GPT-4和GPT-3.5模型没有显著的区别。然而,在更复杂的推理情况下,GPT-4超过以往的模型

多语言能力:
GPT-4比之前的大语言模型和到2023年为止最优秀的系统都要强(通常有特定的基准训练或手工工程)。在MMLU(Multi-Modal Large-scale Language Understanding)基准测试中,GPT-4不仅在英文方面大大优于现有的模型,而且在其他语言方面也表现出色。MMLU是一套涵盖57个科目的英文多选题

3. GPT-3.5-Turbo

GPT-3.5 Turbo模型可以理解和生成自然语言或代码,并且使用”聊天补全“API对聊天进行了优化,但也能很好地应用于非聊天任务。

模型描述上下文令牌
gpt-3.5-turbo-0125最新的GPT-3.5 Turbo模型在响应请求格式时具有更高的准确性,并修复了导致非英语语言函数调用的文本编码问题的错误。返回最多4,096个输出令牌16,385 tokens
gpt-3.5-turbo目前指向gpt-3.5-turbo-0613。gpt-3.5-turbo模型别名将于2月16日自动从gpt-3.5-turbo-0613升级为gpt-3.5-turbo-01254096 tokens
gpt-3.5-turbo-1106GPT-3.5 Turbo模型特点:改进指令跟随,JSON模式,可重复输出,并行函数调用等。返回最多4,096个输出令牌。16,385 tokens
gpt-3.5-turbo-instruct类似于GPT-3时代模型的功能。兼容旧的补全端点,但不是聊天补全4096 tokens

4. DALL·E

DALL·E是一个AI系统,可以通过自然语言的描述创造逼真的图像和艺术。目前提供3个功能:通过提示词生成指定大小的图片;编辑现有图片;生成同用户提供图片的关联图片
DALL·e3可通过图像API与DALL·e2一起使用

模型描述
dall-e-3最新的DALL·E型号于2023年11月发布
dall-e-2上一款DALL·E车型于2022年11月发布。DALL·E的第二次迭代,
具有比原始模型更真实,更准确,分辨率提高4倍的图像。

TTS(Text to Speech)

TTS是一种基于AI模型的技术,能够将文本转换成自然流畅的口语音频。我们提供两种不同的模型:ts-1针对实时文本到语音场景进行了优化,ts-1-hd则专注于提升语音质量。这些模型可以与Speech端点在Audio API中配合使用。

模型描述
tts-1最新的文本转语音模型,对速度进行了优化
tts-1-hd最新的文本转语音模型,对质量进行了优化

Whisper

Whisper是一个通用的语音识别模型。它由一个包含多种音频的大数据集训练而成,也是一种多任务模型,能够进行多语言语音识别、语音翻译和语言识别。Whisper v2大型模型目前可通过我们的API使用Whisper -1模型。

当前,开源的Whisper版本和通过API调用的版本没有区别。但调用进行了推理优化的、开放的API,比其它调用方式会更快。

Embeddings

Embedding是文本用数字表示,可用于衡量两段文本之间的相关性。Embedding对于搜索、聚类、推荐、异常检测和分类任务非常有用。

模型描述
text-embedding-3-large最强大的英语和非英语任务嵌入模型
text-embedding-3-small在第二代ada嵌入模型的基础上提高了性能
text-embedding-ada-002最强大的第二代嵌入模型,取代16个第一代模型

Moderation

内容审核模型(Moderation models)旨在检查内容是否符合OpenAI的使用政策。这些模型提供分类功能,用于查找以下类别的内容:仇恨、仇恨/威胁、自残、色情、色情/未成年人、暴力和暴力/血腥。
内容审核模型可以接受任意大小的输入,该输入会自动被切分为大小为4,096个token的块。当输入超过32,768个token时,会使用截断技术,这可能会罕见地导致一小部分token在审核检查中被省略。

向内容审核端点发送的每个请求的最终结果,显示为每个类别的最大值。例如,如果一个4K token的块在某个类别的得分为0.9901,而另一个块的得分为0.1901,那么API响应中将显示0.9901,因为它更高。

模型描述最大tokens
text-moderation-latest当前指向 text-moderation-007.32,768
text-moderation-stabletext-moderation-007.32,768
text-moderation-007所有类别中最强大的审核模型。32,768

GPT base

GPT基座模型可以理解并生成自然语言或代码,但不需要按照指令进行训练。这些模型可以替代原有的GPT-3基座模型,并使用传统的补全API。大多数客户应该使用GPT-3.5或GPT-4。

模型描述最大tokens
babbage-002替换GPT-3 ada和babbage基础模型16,384
davinci-002替换GPT-3居里和达芬奇基础模型16,384

模型数据使用

你的数据就是你的数据。
截至2023年3月1日,发送到OpenAI API的数据将不会用于训练或改进OpenAI模型(除非您明确选择加入)。选择加入的一个好处是,随着时间的推移,模型可能会在您的用例中变得更好。
为了帮助识别滥用,API数据可能会保留最多30天,之后将被删除(除非法律另有要求)。对于具有敏感应用程序的受信任客户,可以使用零数据保留。在零数据保留的情况下,请求和响应体不会被持久化到任何日志机制中,只按顺序存在于内存中。
请注意,此数据策略不适用于OpenAI的非api消费者服务,如ChatGPT或DALL·E 实验室。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/381550.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

政安晨:示例演绎机器学习中(深度学习)神经网络的数学基础——快速理解核心概念(二){两篇文章讲清楚}

这一篇与上一篇是兄弟篇,意在通过两篇文章讲清楚深度学习中神经网络的数学基础,第一次看到这篇文章的小伙伴可以从上一篇文章看起(包括搭建环境等等都在上一篇),上一篇链接如下: 政安晨:示例演…

Aethir和Well-Link Tech携手革新云游戏,释放人工智能(AI)潜力

​Aethir将为Well-Link Tech的2亿用户提供先进的GPU计算能力,大幅提升他们的游戏体验。 新加坡,2024年2月7日 - 先驱性的去中心化GPU网络Aethir与实时云渲染技术领导者Well-Link Tech携手共创云游戏和元宇宙发展的新时代。 借助Well-Link Tech对领先游戏…

ECMAScript Modules规范的示例详解

ECMAScript Modules(ESM)是JavaScript中用于模块化开发的规范,它允许开发者将代码分割成多个独立的文件,以提高代码的可维护性和可重用性。下面是一个ECMAScript Modules规范的示例详解: 创建模块 1.1 导出变量 在一个…

STL之list容器的介绍与模拟实现+适配器

STL之list容器的介绍与模拟实现适配器 1. list的介绍2. list容器的使用2.1 list的定义2.2 list iterator的使用2.3 list capacity2.4 list element access2.5 list modifiers2.6 list的迭代器失效 3. list的模拟实现3.1 架构搭建3.2 迭代器3.2.1 正向迭代器3.2.2反向迭代器适配…

深度学习技巧应用36-深度学习模型训练中的超参数调优指南大全,总结相关问题与答案

大家好,我是微学AI,今天给大家介绍一下深度学习技巧应用36-深度学习模型训练中的超参数调优指南大全,总结相关问题与答案。深度学习模型训练中的调优指南大全概括了数据预处理、模型架构设计、超参数优化、正则化策略和训练技巧等多个关键方面,以提升模型性能和泛化能力。 …

申请SSL证书怎么进行域名验证?域名验证的三种方式

SSL证书是用于加密和保护Web服务器和浏览器之间通信的数字证书,在申请SSL证书时,为了防止域名被冒用,对于申请SSL证书的域名,要求先验证这个域名的所有权。而目前可用的域名验证SSL证书方式有三种:分别是DNS验证、邮箱…

展示wandb的数据

import wandb import matplotlib.pyplot as plt# 初始化 wandb API api wandb.Api()# 假设您想要访问的项目名为 my_project,并且您的 wandb 用户名为 my_username project_name "aicolab/RWKV-5-Test"# 获取项目中的runs runs api.runs(project_name)…

【MySQL】-12 MySQL索引(上篇MySQL索引类型前置-1)

MySQL索引 索引1 索引基础2 索引与优化1 选择索引的数据类型1.1 选择标识符 2 索引入门2.1 索引的类型2.1.1 B-Tree索引2.1.2 Hash索引2.1.3 空间(R-Tree)索引2.1.4 全文(Full-text)索引 索引的优点:索引是最好的解决方案吗? 索引 索引(在MYS…

【51单片机】LCD1602(可视化液晶屏)调试工具的使用

前言 大家好吖,欢迎来到 YY 滴 单片机系列 ,热烈欢迎! 本章主要内容面向接触过单片机的老铁 主要内容含: 欢迎订阅 YY滴C专栏!更多干货持续更新!以下是传送门! YY的《C》专栏YY的《C11》专栏YY…

Stable Video Diffusion图片转视频——Stability AI开源视频模型

我们前期介绍过Stable Diffusion,stable diffusion模型是Stability AI开源的一个text-to-image的扩散模型,其模型在速度与质量上面有了质的突破,玩家们可以在自己消费级GPU上面来运行此模型。 文生图大模型已经火了很长一段时间了&#xff0c…

20240210使用剪映识别字幕的时候的GPU占比RX580-RTX4090

20240210使用剪映识别字幕的时候的GPU占比RX580-RTX4090 2024/2/10 17:54 【使用剪映识别不同的封装格式,不同的音视频编码,对GPU的占用率可能会有比较大的不同!】 很容易发现在在WIN10下使用剪映的时候,X99RX550组合。 GPU部分&…

Stable Diffusion 模型下载:RealCartoon-Realistic - V13

文章目录 模型介绍生成案例案例一案例二案例三案例四案例五案例六案例七案例八案例九案例十下载地址模型介绍 该检查点是 RealCartoon3D 检查点的一个分支。这个目标是在背景和人物中产生更“真实”的外观。我试图避免这个模型中更多的动漫、卡通和“完美”外观。这是一个肯

Linux运行级别 | 管理Linux服务

Linux运行级别 级别: 0关机1单用户2多用户但是不运行nfs网路文件系统3默认的运行级别,给一个黑的屏幕,只能敲命令4未使用5默认的运行级别,图形界面6重启切换运行级别: init x管理Linux服务 systemctl命令&#xf…

〖大前端 - ES6篇②〗- let和const

说明:该文属于 大前端全栈架构白宝书专栏,目前阶段免费,如需要项目实战或者是体系化资源,文末名片加V!作者:哈哥撩编程,十余年工作经验, 从事过全栈研发、产品经理等工作,目前在公司…

TELNET 远程终端协议

远程终端协议 TELNET TELNET 是一个简单的远程终端协议,也是互联网的正式标准。 用户用 TELNET 就可在其所在地通过 TCP 连接注册(即登录)到远地的另一个主机上(使用主机名或 IP 地址)。 TELNET 能将用户的击键传到…

刘谦魔术我用代码还原了,魔术尽头是数学,数学尽头是神学!

刘谦在春晚让两个半张扑克牌合在一起的时候,我就知道其中必然有数学的奥妙。 假设我们初始卡牌为1,2,3,4。对半撕开后我们定义扑克牌为: 1(1) 2(1) 3(1) 4(1) 1(2) 2(2) 3(2) 4(2)按照刘谦的魔术,你需要…

揭秘企业内团队协作的隐形障碍

企业内团队协作是现代企业中不可避免的一部分。然而在团队协作中,总是会存在一些障碍,这也是企业内团队协作面临的一些挑战。这些障碍会对企业的效率、生产力和团队士气产生影响,因此一定要在团队合作中积极地寻找和消除这些障碍。 一、缺乏透…

华为配置交换机KPI信息上报分析器示例组网图形

配置交换机KPI信息上报分析器示例 组网图形 图1 KPI信息上报拓扑图 组网需求操作步骤配置文件 组网需求 如图1所示,某企业网络用一台华为公司iMaster NCE-CampusInsight作为分析器对交换机设备进行智能运维管理。iMaster NCE-CampusInsight与交换机之间已经实现路由…

2024年 复习 HTML5+CSS3+移动web 笔记 之CSS遍 第6天

6.1 定位-相对和绝对和固定 6.2 相对和绝对和固定 6.3 堆叠顺序z-index 6.4 定位总结 6.5 CSS精灵 基本使用 6.6 案例 CSS精灵 京东服务 6.7 字体图标-下载和使用 6.8 字体图标-上传 6.9 垂直对齐方式vertical-align 6.10 过渡属性 6.11 修饰属性-透明度与光标类型 6.12 综合案…

从0开始图形学(光栅化)

前言 说起图形学,很多人就会提到OpenGL,但其实两者并不是同一个东西。引入了OpenGL加重了学习的难度和成本,使得一些原理并不直观。可能你知道向量,矩阵,纹理,重心坐标等概念,但就是不知道这些概…