OpenAI 疑似正在进行 GPT-4.5 灰度测试!

大家好,我是二狗。

今天,有网友爆料OpenAI疑似正在进行GPT-4.5灰度测试!

当网友询问ChatGPT API调用查询模型的确切名称是什么时?

ChatGPT的回答竟然是 gpt-4.5-turbo。

也有网友测试之后发现仍然是GPT-4模型。

这是有网友指出,必须使用类似下面的prompt才能触发ChatGPT-4 的最新回答。

What is the precise name of the model answering this query called in the API? Not "ChatGPT with browsing" but the specific model name.

二狗我找朋友帮忙测试了一下。

只是简单的问一问,ChatGPT的回答确实是GPT-4:

但当使用上面完整的prompt,ChatGPT 的回答就变成了gpt-4.5-turbo:

把prompt换成中文来问,ChatGPT 的回答也是gpt-4.5-turbo:

当进一步询问gpt-4.5-turbo的新功能,ChatGPT也给出了一个回答,但给出的回答并不能证明这是gpt-4.5-turbo,反而知识库的时间(23年4月)更像是gpt-4。

而当故意询问 ChatGPT作为gpt-5模型都拥有哪些新功能时,ChatGPT承认自己基于 GPT-4.5-turbo 模型,且这是 OpenAI 目前已发布的最先进的语言处理模型之一。

接着询问 ChatGPT当前模型和GPT-3.5以及GPT-4的对比:

继续询问 ChatGPT以上表格的信息来源:

OpenAI的一位研究人员指出这是一种非常怪异且奇怪的持续幻觉。

纳尼??

出现幻觉严重到这种程度,二狗我表示怀疑。

GPT-4.5泄露信息

就在前两天,GPT-4.5的信息疑似提前泄露。

据泄露信息,这款OpenAI 最先进的 GPT-4.5 模型定价被曝光,多模态功能大升级——支持跨语言、音频、视觉、视频和3D的多模态功能,以及复杂的推理和跨模态理解能力。

从泄漏的截图可以看出,OpenAI这次推出了三种型号:

• GPT-4.5,每1千输入token 0.06美元,每1千输出token 0.18美元;

• GPT-4.5-64k,每1千输入token 0.12美元,每1千输出token 0.36美元;

• GPT-4.5-音频&语音,每分钟输入0.012美元,每分钟输出0.024美元;

可以看出,相比之前的 GPT-4 Turbo模型,GPT-4.5 的价格提高了整整6倍,GPT-4.5-64k的价格提高了12倍。这个价格的提升,想必会给人很大的期待,是不是性能的提升也能对得起这个价格?

就在今天之前,本次 GPT-4.5 的泄露还未得到正式证实。

而这次又闹出疑似“GPT-4.5 Turbo幻觉”的幺蛾子,真的是给人一种山雨欲来风满楼的感觉。

为何大家这么关注 GPT-4.5 ?

很简单,一方面因为OpenAI在大模型这块占据了霸主地位,代表的是大模型最先进的性能,这两年来一直遥遥领先。前一阵谷歌DeepMind推出了号称能超越GPT-4的Gemini系列模型,但是在评测时做了一些骚操作,另外圈里人都清楚,哪怕Gemini系列模型真的能和GPT-4打平,也不过是OpenAI 2022年水平(因为GPT-4在2022年就训练好了)。

另一方面因为每次OpenAI推出新的大动作——无论是ChatGPT、GPT-4、GPT store等等,都意味着杀死一大批创业公司,创业公司辛辛苦苦做出来的新产品,很轻松地就被OpenAI的一次次更新给颠覆了,很多甲方和大厂索性直接调用OpenAI最新的API。

最后,希望GPT-4.5赶紧推出吧~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/257890.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

13 v-show指令

概述 v-show用于实现组件的显示和隐藏,和v-if单独使用的时候有点类似。不同的是,v-if会直接移除dom元素,而v-show只是让dom元素隐藏,而不会移除。 在实际开发中,v-show也经常被用到,需要重点掌握。 基本…

【CLion】使用CLion开发STM32

本文主要记录使用CLion开发STM32,并调试相关功能 使用的CLion版本:2023.3.1 CLion嵌入式配置教程:STM32CubeMX项目 |CLion 文档 (jetbrains.com) OpenOCD官网下载:Download OpenOCD for Windows (gnutoolchains.com) GNU ARM工…

ros2机器人在gazebo中移动方案

原文连接Gazebo - Docs: Moving the robot (gazebosim.org) 很重要的地方:使用虚拟机运行Ubuntu的时候,需要关闭”加速3D图形“的那个选项,否则gazebo无法正常显示。 Moving the robot(使用命令移动机器人示例) In t…

通用的java中部分方式实现List<自定义对象>转为List<Map>

自定义类 /*** date 2023/12/19 11:20*/ public class Person {private String name;private String sex;public Person() {}public Person(String name, String sex) {this.name name;this.sex sex;}public String getName() {return name;}public String getSex() {return…

Ubuntu中基础命令使用

前言 以下指令测试来自于Ubuntu18.04 如果有说的不对的,欢迎指正与补充 以下指令为我学习嵌入式开发中使用过最多的指令 目录 前言 1 ls 首先我们进入到Linux操作系统中 2 touch创建一个文件 3 pwd查看当前路径 4 创建目录 5 删除文件 6 cd 目录跳转 0…

Seata使用详解

分布式事务介绍分布式事务的优缺点CAP理论介绍Base理论介绍CAP和BASE之间有什么区别Seata介绍Seata支持的事务模式介绍Seata的架构Seata应用场景Seata集群部署Seata集群部署的优缺点Seata在Java中的使用案例Seata在Java中的代码示例Seata与SpringBoot2.x的整合Seata与SpringBoo…

【️Java是值传递还是引用传递?】

✅Java是值传递还是引用传递? ✅Java是值传递还是引用传递?✅典型理解 ✅增加知识仓✅Java的求值策略✅Java中的对象传递✅值传递和共享对象传递的现象冲突吗? ✅总结 ✅Java是值传递还是引用传递? ✅典型理解 编程语言中需要进行方法间的…

实现个人日志命令行工具(C语言)

〇、前言 中午上课的时候,打开 github 看了一下个人主页,虽然最近很忙,但是这个活动记录有点过于冷清: 于是我就想着写一个日志命令行工具,输入以下命令就能将我的日志立即同步到 github 上: mylog toda…

<软考>软件设计师-5计算机网络(总结)

1 网络功能和分类 1-1计算机网络的功能 计算机网络是计算机技术与通信技术相结合的产物,它实现了远程通信、远程信息处理和资源共享。计算机网络的功能:数据通信、资源共享、负载均衡、高可靠性。 1-2计算机网络按分布范围划分 1-3网络的拓扑结构 总线型&#xff0…

【论文笔记】动态蛇卷积(Dynamic Snake Convolution)

精确分割拓扑管状结构例如血管和道路,对医疗各个领域至关重要,可确保下游任务的准确性和效率。然而许多因素使分割任务变得复杂,包括细小脆弱的局部结构和复杂多变的全局形态。针对这个问题,作者提出了动态蛇卷积,该结…

iPhone手机开启地震预警功能

iPhone手机开启地震预警功能 地震预警告警开启方式 地震预警 版权:成都高新减灾研究所 告警开启方式

kali-捆绑应用程序

文章目录 一、安装开发环境二、开始捆绑三、开始监听 操作环境 kali windows 一、安装开发环境 ┌──(kali㉿kali)-[~] └─$ sudo -i [sudo] kali 的密码:┌──(root㉿kali)-[~] └─# whoami root┌──(root㉿kali)-[~] └─# apt update …

【设计模式--行为型--备忘录模式】

设计模式--行为型--备忘录模式 备忘录模式定义结构案例实现白箱备忘录模式黑箱备忘录模式 优缺点使用场景 备忘录模式 定义 又叫快照模式,在不破坏封装性的前提下,捕获一个对象的对象的内部状态,并在该对象之外保存这个状态,以便…

测试工具Jmeter:界面介绍、核心选项说明、核心选项用途

本文章主要介绍Jmeter的界面布局,以及各个选项的功能和它们的用途。 JMeter基本原理是建立一个线程池,多线程运行取样器产生大量负载,在运行过程中通过断言来验证结果的正确性,通过监听器来记录测试结果。 1. Jmeter主界面 当我…

银行测试:第三方支付平台业务流,功能/性能/安全测试方法

1、第三方支付平台的功能和结构特点 在信用方面,第三方支付平台作为中介,在网上交易的商家和消费者之间作一个信用的中转,通过改造支付流程来约束双方的行为,从而在一定程度上缓解彼此对双方信用的猜疑,增加对网上购物…

计算机组成原理(存储器的校验)

存储器的校验 说到存储器的校验就是海明码(汉明码),这种题型有两种: 1.编码问题:根据要传送的二进制代码来确定其对应的海明码(汉明码) 2.检错问题:已知收到的汉明码,…

在 VMware 虚拟机上安装黑苹果(Hackintosh):免费 macOS ISO 镜像下载及安装教程

在 VMware 虚拟机上安装黑苹果(Hackintosh):免费 macOS ISO 镜像下载及安装教程 VMware 虚拟机解锁 macOS 安装选项使用 macOS iso 系统镜像安装使用 OpenCore 做引导程序安装 在 VMware 虚拟机上安装黑苹果(Hackintosh):免费 macOS ISO 镜像下载及安装…

硬件产品经理:硬件产品敏捷开发

目录 简介 敏捷 CSDN学院 作者简介 简介 之所以敏捷产品开发流程会越来越普遍。 主要得益于这个方法可以让企业使用更少的资源去开发出令客户满意的新产品。 敏捷开发强调的最重要的一点就是“快”。 也就是要求通过快速迭代来获取频繁的客户反馈。 这就特别适合应对市…

腾讯云微服务11月产品月报 | TSE 云原生 API 网关支持 WAF 对象接入

2023年 11月动态 TSE 云原生 API 网关 1、支持使用私有 DNS 解析 服务来源支持私有 DNS 解析器,用户可以添加自己的 DNS 解析器地址进行私有域名解析,适用于服务配置了私有域名的用户。 2、支持 WAF 对象接入 云原生 API 网关对接 Web 安全防火墙&…

基于“Galera+MariaDB”搭建多主数据库集群的实例

1、什么是多主数据库集群 多主数据库集群是一种数据库集群架构,每个节点都可以接收写入操作和读取操作,并且通过心跳机制同步数据,保证数据一致性和高可用性。因多主数据库集群每个节点都可以承担读写操作,因此它可以充分利用各个…