OpenAI 承认 ChatGPT 最近确实变懒,承诺修复问题

文章目录

  • 一. ChatGPT 指令遵循能力下降引发用户投诉
    • 1.1 用户抱怨回应速度慢、敷衍回答、拒绝回答和中断会话
  • 二. OpenAI 官方确认 ChatGPT 存在问题,展开调查
  • 三. OpenAI 解释模型行为差异,回应用户质疑
  • 四. GPT-4 模型变更受人事动荡和延期影响

一. ChatGPT 指令遵循能力下降引发用户投诉

1.1 用户抱怨回应速度慢、敷衍回答、拒绝回答和中断会话

不知道大家有没有发现,自 11 月 6 日 OpenAI 的开发者大会以来,ChatGPT 似乎变得越来越懒了?具体而言,这一个月来,陆续有网友发现,ChatGPT 在其指令遵循能力上下滑严重,经常避开一些繁琐的重复性的任务,只给出一个启发性的“框架”,里面留下大量空白让用户自己去填空。

image-20231213094716574

OpenAI 在上周遭到部分用户投诉,许多用户声称,他们在使用 ChatGPT 或 GPT-4 API 时,会遇到回应速度慢、敷衍回答、拒绝回答、中断会话等一系列问题,OpenAI 承认了这一事实,并在声称将彻底、妥当地修复相关问题。

OpenAI 此前解释称,GPT-4 变懒惰的原因是,OpenAI 从 11 月 11 日起就未再更新模型,而 GPT 模型也正因此变得不可预测,当前该公司正在着手修复问题

据悉,用户抱怨 GPT-4 模型变“懒惰”是指,用户请求 GPT-4 撰写表格,但该模型仅仅输出三行;输入一段代码,模型只输出一些信息,随后再指示用户填写剩下的其他部分。有时候,GPT-4 甚至会告诉人们“你们完全可以自己完成这些工作”。

image-20231213094831858

二. OpenAI 官方确认 ChatGPT 存在问题,展开调查

伴随着大家质疑的声浪,昨天 OpenAI 官方下场,回应了关于 ChatGPT 变懒的传闻,与“律师函警告”不同,OpenAI 官方承认了确实存在这个问题,但是强调了他们从 11 月 11 日起并没有更新模型,目前出现这种问题的原因未知,正在组织人手进一步调查。

除了放出消息,OpenAI 还积极回复了网友们关心的问题,比如有网友质疑:所谓模型不就是那个权重参数的文件?如果这个文件没有改变,为什么一个固定的文件会变懒?

image-20231213095232360

而 OpenAI 回复,“模型行为的差异很微妙”,一些 Prompt 会出现这个问题,而另一些又不会,用户与开发者可能很久之后才会注意到这些问题(意思是说不是模型突然变懒,而是之前就懒但是大家没注意到……)

image-20231213095309613

三. OpenAI 解释模型行为差异,回应用户质疑

在承认 ChatGPT 变懒之后,官方也发布了一系列的帖子了强调模型的训练过程,比如训练一个 Chat 模型并不是像传统的软件工程,哪怕使用相同的数据集在不同的训练方式下也会在个性、写作风格 、拒绝行为、表现评估等等方面产生完全不同的模型。更新模型的过程也不像是在一个网站里上线一个新功能那样纯粹的加法模式,而是需要多人手工进行规划、创建与评估才能将模型的一个新的行为模式上线:

image-20231213095408168

OpenAI 后续解释称,由于模型长期未更新,这导致 GPT 模型行为出现了细微的变化,但只有少部分提示词效果变差,GPT-4 模型在整体层面依然能够保证妥善运行。

OpenAI 声称,他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型,同时也鼓励用户积极对模型表现进行回馈

四. GPT-4 模型变更受人事动荡和延期影响

有些人开始猜测是因为 OpenAI 合并模型、同时运行 GPT-4 和 GPT-4 Turbo 导致服务器持续过载、公司试图通过限制结果来节省资金等造成的。

众所周知,OpenAI 的运营成本极其昂贵,今年 4 月,研究人员表示,每天需要花费 70 万美元,即每次查询花费 36 美分,才能维持 ChatGPT 的运行。根据行业分析师当时的说法,OpenAI 必须将其 GPU 群扩大至 30000 台,才能在今年剩余时间内保持其商业性能。除了为其所有合作伙伴提供计算之外,OpenAI 还需要支持 ChatGPT 其他流程。

GPT-4 模型停更与该公司的人事动荡密不可分,OpenAI 的 CEO Sam Altman 离职风波及欧美假期共同导致了 OpenAI 日常事务呈现混乱局面,除了 GPT-4 例行更新遭到延期外,原定于今年 12 月初上线供开发人员分享模型的 GPT Store,也被延期到 2024 年初上线。

image-20231213100553716

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/240653.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于Java SSM框架实现固定设备资产管理系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现固定设备资产管理系统演示 摘要 21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认…

二、结合各种图形库实现各种demo(11-20)

demo地址https://bidding-m.gitee.io/maptalks-test-next/#/ 11、isects 12、right click menu 13、infoWindow 14、image marker 15、multi image marker 16、vector-marker-fill 17、line-gradient-arrow 18、rotated-marker-with-line 19、smoothness-line 20、polygon 欢迎…

orb-slam2学习总结

目录 视觉SLAM 1、地图初始化 2、ORB_SLAM地图初始化流程 3、ORB特征提取及匹配 1、对极几何 2、对极约束 (epipolar constraint) 3、基础矩阵F、本质矩阵E 5、单目尺度不确定性 6、单应矩阵(Homography Matrix) 6.1 什么是单应矩…

干不完的996,加不完的007,浅谈程序员的内卷化

目录 一. 什么是内卷化 二. 程序员的内卷化 2.1. 码农时代 2.2. 开源时代 2.3. 加班文化 三. 如何不被内卷化 3.1. Stay Hungry, Stay Foolish 3.2. 工程能力 3.2.1. 架构 3.2.2. 规范 3.2.3. 管理 3.2.4. 排错 3.3. 学会思考 四. 结尾 一. 什么是内卷化 最近开始…

【算法与数据结构】37、LeetCode解数独

文章目录 一、题目二、解法三、完整代码 所有的LeetCode题解索引,可以看这篇文章——【算法和数据结构】LeetCode题解。 一、题目 二、解法 思路分析:本题也是一道困难题,难点在于如何构建数独棋盘,如何检查棋盘的合法性&#xff…

Halcon一维码识别

文章目录 参数连接halcon 自带案例1(设置校验位识别条码)Halcon 自带案例2(设置对比度识别条码)Halcon 自带案例3(存在曲面变形)Halcon 自带案例4(设置条码扫描线)Halcon 自带案例5&…

Linux---Ubuntu操作系统

1. Ubuntu操作系统的介绍 Ubuntu操作系统是属于Linux操作系统中的一种,它是免费、稳定又可以拥有绚丽界面的一个操作系统 2. Ubuntu图形界面的介绍 任务栏 窗口操作按钮 窗口菜单条 任务栏效果图: 窗口操作按钮效果图: 窗口菜单条效果图: 3. 与Windows目录结…

『C++成长记』拷贝构造函数

🔥博客主页:小王又困了 📚系列专栏:C 🌟人之为学,不日近则日退 ❤️感谢大家点赞👍收藏⭐评论✍️ 目录 一、拷贝构造函数 📒1.1拷贝构造函数的概念 📒1.2拷贝构造…

Java项目-瑞吉外卖Day6

导入用户地址功能,为用户添加地址: 添加AddressBook实体类,创建相关service,mapper,serviceImpl,controller类。 controller类直接使用的资料提供的代码。 实现菜品展示移动端开发: 看到前端发…

添加,更换和删除 vSphere License

目录 1. 删除 License2. 添加 License(1)输入许可证密钥(2)编辑许可证名称(3)确认许可证信息 3. 分配/更换 License(1)为 vCenter Server 分配 License(2)为 …

Android : 序列化 Parcelable 简单应用

1.Parcelable 介绍 Parcelable 是 Android 提供的一个序列化接口,用于将数据写入 Parcel,以及从 Parcel 中读取数据。一个类只要实现了这个接口,该类的对象就可以被序列化,主要用于 IPC(进程间通信)、Bind…

产品经理之如何编写竞品分析(医疗HIS系统管理详细案例模板)

目录 一.项目周期 二.竞品分析的目的 三.竞品分析包含的维度 四.如何选择竞品 五.竞品画布 六.案例模板 一.项目周期 在整个项目的周期,产品经理所做的事情主要在项目前期做市场分析、需求调研等,下面一张图概况了整个项目周期产品经理、开发工程师…

网络安全——Iptables防DDoS攻击实验

一、实验目的要求: 二、实验设备与环境: 三、实验原理: 四、实验步骤: 五、实验现象、结果记录及整理: 六、分析讨论与思考题解答: 一、实验目的要求: 1、掌握常见DDoS攻击SYN Flood的攻击…

gdb本地调试版本移植至ARM-Linux系统

移植ncurses库 本文使用的ncurses版本为ncurses-5.9.tar.gz 下载地址:https://ftp.gnu.org/gnu/ncurses/ncurses-5.9.tar.gz 1. 将ncurses压缩包拷贝至Linux主机或使用wget命令下载并解压 tar-zxvf ncurses-5.9.tar.gz 2. 解压后进入到ncurses-5.9目录…

解决员工安全隐患的终极方案!迅软DSE答疑员工终端安全管控策略揭秘!

企业终端安全管控对于企事业单位来说至关重要。迅软DSE终端安全系统提供了丰富的终端安全桌面管理策略,可以对终端用户的上网行为和终端操作行为进行管理和控制,从而实现桌面终端的标准化管理,解决终端安全管理问题,并提高员工工作…

阿里云SLB的使用总结

一、什么是SLB 实现k8s的服务service的一种推荐方式,也是服务上云后,替代LVS的一个必选产品。 那么它有什么作用呢? 1、负载均衡,是它与生俱来的。可以配置多个服务器组:包括虚拟服务器组、默认服务器组、主备服务器…

小程序使用Nodejs作为服务端,Nodejs与与MYSQL数据库相连

小程序使用Nodejs作为服务端,Nodejs与与MYSQL数据库相连 一、搭建环境二、配置Nodejs三、与小程序交互四、跨域处理/报错处理五、nodejs连接mysql数据库六、微信小程序连接nodejs报错七、小程序成功与服务端相连,且能操作数据库一、搭建环境 新建空文件夹:Win + R进入cmd命令…

C++STL的list模拟实现

文章目录 前言 list实现push_back迭代器(重点)普通迭代器const迭代器 inserterase析构函数构造函数拷贝构造赋值 vector和list的区别 前言 要实现STL的list, 首先我们还得看一下list的源码。 我们看到这么一个东西,我们知道C兼容C,可以用struct来创建一…

Quartus II + Modelsim 脚本仿真

软件版本:Intel Quartus Prime Design Suite: 23.2 方式参考附件Intel 官方文档:Questa*-Intel FPGA Edition Quick-Start: Intel Quartus Prime Pro Edition 第1步,创建一个ram ip,并形成一个例化的top层ip 第2步,自…

独立完成软件的功能的测试(2)

独立完成软件的功能的测试(2) (12.13) 1. 对穷举场景设计测试点(等价类划分法) 等价类划分法的概念: 说明:数据有共同特征,成功失败分类: 有效&#xff1a…