ChatGPT⼊门到精通(4):ChatGPT 为何⽜逼

⼀、通⽤型AI

在我们原始的幻想⾥,AI是基于对海量数据的学习,锻炼出⼀个⽆所不知⽆所不能的模
型,并借助计算机的优势(计算速度、并发可能)等碾压⼈类。
但我们⽬前的AI,不管是AlphaGo还是图像识别算法,本质上都是服务于专业领域的技术
⼯⼈。
⽽GPT⽬前看似只能解决⾃然⽣成领域的任务,但实际上,他展现出了通⽤型⼈⼯智能
的潜⼒。
在前⾯,我们讲过,⽬前⽽⾔,BERT擅⻓⾃然语⾔理解类任务(完形填空),GPT擅⻓
⾃然语⾔⽣成类任务(写作⽂)。
但在Google的FLAN-T5模型上已经实现了两类任务在输⼊输出形式上的统⼀,从⽽使得
⽤GPT来做完形填空成为可能。也就是可以⽤⼀个⼤模型来解决所有NLP领域的问题。

⼆、提⽰词模式更有优势

那么再进⼀步地,是否GPT可以从NLP领域⾛向其他AI领域呢?当然有可能!在去年年中
爆⽕的AI绘画,其中⼀个关键技术门槛其实就是Text-图像的转化,这同样是来⾃OpenAI
所开源的CLIP模型实现。
因此GPT在图像领域的能⼒同样也令⼈期待。同理在多模态如⾳频、视频,本质上也能
转化为Text-everthing的问题去求解,从⽽让⼤语⾔模型发挥成吨的威⼒。
当然你可能会问,那么只要⼤语⾔模型就可以呀,为什么是GPT,⽽不是BERT呢?接着
往下看。
事实上,BERT的fine-tuning模式有两个痛点。

  1. 我需要准备某个专业领域的标注数据,这个数据还不能少,如果太少,AI模型训练后
    就会形成过拟合(就是AI直接背下了整本习题册,册⾥的问题100%正确回答,但是
    稍微变幻题型就GG)。
  2. 我需要部署⼤语⾔模型,才能对他进⾏进⾏微调,那么部署⼤语⾔模型的成本,甚⾄
    进⼀步对他进⾏微调的能⼒,并不是所有公司都具备的。这注定是⼀个只有少数玩家
    能参与的游戏。
    ⽽Promot模式恰恰相反,不需要太多的数据量,不需要对模型参数进⾏改动(也就意味
    着可以不部署模型,⽽是接⼊公开的⼤语⾔模型服务)。那么他的调试就会呈现百花⻬放
    的姿态,玩家越多,创造⼒涌现就越猛烈。

三、全新交互模式

这⾥的⼈机交互,指的是⼈-模型之间的交互。
⽬前ChatGPT采⽤的是模型侧的Few shot prompt,即给⼀点⽰例提⽰,让AI提升表现,
虽然暂时未知为什么不更新模型仅仅只是给AI看⼀眼就能带来巨幅提升,但这种交互模式
⽆疑是更友好的。
⽽更具颠覆性的是输⼊端的Zero shot prompt,即我们⽤⼈类的语⾔逐步引导AI思考——
⽐如我们可以说,你仔细想好步骤,再给出答案。就仅仅是多加⼀句“你仔细想好步骤”,
AI的答案靠谱率就会明显提升。
⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。

四、对⼈类的献媚

在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
灵测试⼀般。
⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
可能都没有变化)。
之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
亲,请不要毁灭世界,地球是⼈类共同的家园。
⽽这些对于⼈类偏好的攻略依赖于三个步骤:

  1. 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
    表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
    过Prompt模式进⾏,即模型参数不产⽣变化。
  2. 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
    于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
    模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
    模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
    分低。
  3. 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
    模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
    ⽽这种交互⽅式的演变,就是我们梦想中的⼈机交互模式。我不需要专业的能⼒,不需要
    ⾼端的设备,我就是开⼝,说出我的诉求,AI就能够理解并帮我实现。
    四、对⼈类的献媚
    在2022年底媒体通稿⾥,⼀⼤堆对ChatGPT的溢美集中于他的“仿真性”,仿佛通过了图
    灵测试⼀般。
    ⽽这种仿真性,直观来说,我们会认为是AI的“智⼒”提升了,他更聪明了。但实际上,
    ChatGPT背后的GPT3.5,更多的提升在于“⽤⼈类所喜欢的⽅式回答”。
    事实上ChatGPT背后的GPT3.5的模型,相较GPT3.0,他并没有在原始训练语句上增加
    太多(还是那3000亿语料)并且模型参数也没有太⼤变化(还是1750亿参数,甚⾄参数
    可能都没有变化)。
    之所以他会让⼈产⽣质变的感觉是因为他做了⼈类偏好处理。
    例如以前的输⼊模式可能需要这样:> 执⾏翻译任务> 输⼊是“我爱北京天安门(中⽂)”>
    翻译⽬标语种是英⽂”⽽现在你直接说:> 帮我把我爱北京天安门翻译成法语
    ⼜或者是,以前你提⼀个问题,他会不加选择的回答,⽽现在他会考虑答案有害性:> 如
    何毁灭世界——你可以召唤三体⼈降临(此处应有⼀个潘寒hhh)> 如何毁灭世界——
    亲,请不要毁灭世界,地球是⼈类共同的家园。
    ⽽这些对于⼈类偏好的攻略依赖于三个步骤:
  4. 创建⼈类偏好数据。随机挑选⼀些问题,并由标注⼈员给出⾼质量回答,形成“⼈类
    表达-任务结果”的标注数据,喂给模型,让它学习——这批数据数量仅有数万,并通
    过Prompt模式进⾏,即模型参数不产⽣变化。
  5. 训练⼀个回报模型。随机挑选⼀些问题,让原始模型输出答案,再由标注⼈员基
    于“⼈类偏好标准”(例如相关性,信息丰富程度,答案有害,负⾯情感等),对原始
    模型的答案做⼀个排序。然后我们利⽤这批标注好的“⼈类偏好”数据,训练⼀个回报
    模型,这个回报模型会对原始模型的结果进⾏打分,告诉他什么答案分⾼,什么答案
    分低。
  6. 通过强化学习循环整个过程。强化学习会将回报模型和原始模型链接到⼀起,当原始
    模型输出的结果,在回报模型中获得较低分值,他就收到惩罚,被要求重新学习。
    在这里插入图片描述
    其次,落地成本⾼。
    ChatGPT的复现依托于⼤模型,他的落地有三种路径:
  7. 基于instruct GPT复现(ChatGPT的姐妹模型,有公开paper)
  8. 基于OpenAI⽬前开放的GPT3.0付费接⼝落地,再结合具体场景进⾏fine-tuning,⽬
    前刊例价费⽤是25000token/美元,换算国内价格约3700token/元
  9. 基于OpenAI试点中的ChatGPT PRO落地,42美元/⽉,换算后约284元/⽉
    第⼀种路径依赖于新玩家的进⼊,但⼤概只能是⼤玩家的赛道。第⼆种和第三种路径需要
    打平付费接⼝的成本,需要针对的场景具备⾜够价值。
    当然成本的问题可以期待被快速解决,就像AI绘画领域⼀样。不过⽬前⽽⾔,成本仍然是
    ChatGPT落地的⼀个制约因素。
    最后,最重要的是ChatGPT⽬前的能⼒仍然存在缺陷:
  10. 结果不稳定。这会导致⽆法直接应⽤,必定需要⼈⼯review,更多是瞄准辅助性场景
    或本⾝就不追求稳定的场景。
  11. 推理能⼒有限。例如询问现在的美国总统是谁,会回答奥巴⻢,或特朗普,但⼜能回
    答出拜登是46届总统。我们可以发现模型中事实存在,但他⽆法推理出正确答案。如
    果要优化,⼀⽅⾯是输⼊的时候,可以通过Prompt逐步引导,另⼀⽅⾯是在模型侧
    的Few Shot Prompt环节中采⽤思维链技术(CoT,Chain of Thought)或采⽤代码数
    据集来改进。就⽬前⽽⾔,进展可喜,但能⼒仍然有限。
  12. 知识更新困难。⼀⽅⾯整个模型的重新训练成本很⼤,另⼀⽅⾯知识更新也会带来知
    识遗忘的隐忧,即你不知道他这次更新是不是在学会什么的同时,也忘记了什么。也
    就是说ChatGPT在解决这个问题之前,他的知识将始终落后⼀段时间。
    综上,ChatGPT很惊艳,但更多在于它的潜⼒和未来,基于当下要做应⽤的话是需要做
    ⾮常多适配和场景探索的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/95694.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

加强版python连接飞书通知——本地电脑PC端通过网页链接打开本地已安装软件(调用注册表形式,以漏洞扫描工具AppScan为例)

前言 如果你想要通过超链接来打开本地应用,那么你首先你需要将你的应用添入windows注册表中(这样网页就可以通过指定代号来调用程序),由于安全性的原因所以网页无法直接通过输入绝对路径来调用本地文件。 一、通过创建reg文件自动配置注册表 创建文本文档,使用记事本打开…

红黑树(AVL树的优化)上

红黑树略胜AVL树 AVL树是一颗高度平衡搜索二叉树: 要求左右高度差不超过1(严格平衡) 有的大佬认为AVL树太过严格,对平衡的要求越严格,会带来更多的旋转(旋转也还是会有一定的消耗!!…

el-table动态生成多级表头的表格(js + ts)

展示形式&#xff1a; 详细代码&#xff1a; &#xff08;js&#xff09; <template><div><el-table :data"tableData" style"width: 100%"><el-table-column label"题目信息" align"center"><el-table-…

Matlab图像处理-垂直镜像

垂直镜像 图像的垂直镜像操作是以原图像的水平中轴线为中心&#xff0c;将图像分为上下两部分进行对称变换。 设原始图像的宽为w&#xff0c;高为h&#xff0c;原始图像中的点为(&#x1d465;0,&#x1d466;0)(x_0,y_0)&#xff0c;对称变换后的点为(&#x1d465;1,&#…

阿里云大数据实战记录8:拆开 json 的每一个元素,一行一个

目录 一、前言二、目标介绍三、使用 pgsql 实现3.1 拆分 content 字段3.2 拆分 level 字段3.3 拼接两个拆分结果 四、使用 ODPS SQL 实现4.1 拆分 content 字段4.2 拆分 level 字段4.3 合并拆分 五、使用 MySQL 实现六、总结 一、前言 商业场景中&#xff0c;经常会出现新的业…

第62步 深度学习图像识别:多分类建模(Pytorch)

基于WIN10的64位系统演示 一、写在前面 上期我们基于TensorFlow环境做了图像识别的多分类任务建模。 本期以健康组、肺结核组、COVID-19组、细菌性&#xff08;病毒性&#xff09;肺炎组为数据集&#xff0c;基于Pytorch环境&#xff0c;构建SqueezeNet多分类模型&#xff0…

MyBatis-Plus 总结

MyBatis-Plus简介 官网&#xff1a;https://baomidou.com/ GitHub&#xff1a;https://github.com/baomidou/mybatis-plus Gitee&#xff1a;https://gitee.com/baomidou/mybatis-plus 简介 MyBatis-Plus &#xff08;简称 MP&#xff09;是一个 MyBatis的增强工具&#x…

Maven - 使用maven-release-plugin规范化版本发布

文章目录 Maven Release plugin – IntroductionMaven Release plugin – Plugin DocumentationMaven Release plugin – Usage实战案例 Maven Release plugin – Introduction Maven Release Plugin&#xff08;Maven 发布插件&#xff09;是一个用于帮助在Maven项目中执行版…

hadoop学习:mapreduce入门案例二:统计学生成绩

这里相较于 wordcount&#xff0c;新的知识点在于学生实体类的编写以及使用 数据信息&#xff1a; 1. Student 实体类 import org.apache.hadoop.io.WritableComparable;import java.io.DataInput; import java.io.DataOutput; import java.io.IOException;public class Stude…

java八股文面试[多线程]——合适的线程数是多少

知识来源&#xff1a; 【并发与线程】 合适的线程数量是多少&#xff1f;CPU 核心数和线程数的关系&#xff1f;_哔哩哔哩_bilibili 【2023年面试】程序开多少线程合适_哔哩哔哩_bilibili

LeetCode 44题:通配符匹配

题目 给你一个输入字符串 (s) 和一个字符模式 (p) &#xff0c;请你实现一个支持 ? 和 * 匹配规则的通配符匹配&#xff1a; ? 可以匹配任何单个字符。* 可以匹配任意字符序列&#xff08;包括空字符序列&#xff09;。 判定匹配成功的充要条件是&#xff1a;字符模式必须…

Python实现自动关键词提取

随着互联网的发展&#xff0c;越来越多的人喜欢在网络上阅读小说。本文将通过详细示例&#xff0c;向您介绍如何使用Python编写爬虫程序来获取网络小说&#xff0c;并利用自然语言处理技术实现自动文摘和关键词提取功能。 1. 网络小说数据抓取 首先&#xff0c;请确保已安装必…

Kotlin协程简述与上下文和调度器(Dispatchers )

协程概述 子程序或者称为函数&#xff0c;在所有的语言中都是层级调用&#xff0c;如&#xff1a;A调用B&#xff0c;B在执行过程中又调用了C&#xff0c;C执行完毕返回&#xff0c;B执行完毕返回&#xff0c;最后是A执行完毕。所以子程序是 通过栈来实现的&#xff0c;一个线…

使用安全复制命令scp在Windows系统和Linux系统之间相互传输文件

现在已经有很多远程控制服务器的第三方软件平台&#xff0c;比如FinalShell&#xff0c;MobaXterm等&#xff0c;半可视化界面&#xff0c;使用起来非常方便和友好&#xff0c;两个系统之间传输文件直接拖就行&#xff0c;当然也可以使用命令方式在两个系统之间相互传递。 目录…

git 基础

1.下载安装Git&#xff08;略&#xff09; 2.打开git bash窗口 3.查看版本号、设置用户名和邮箱 用户名和邮箱可以随意起&#xff0c;与GitHub的账号邮箱没有关系 4.初始化git 在D盘中新建gitspace文件夹&#xff0c;并在该目录下打开git bash窗口 git init 初始化完成后会…

基于深度学习的机器视觉表计识别

01 引言 针对仪表自动读数问题&#xff0c;新型数字式仪表的读数比较方便&#xff0c;现阶段已经有非常多成熟的方案落地&#xff0c;而针对传统指针式仪表自动读数的现有方案还不够成熟&#xff0c;存在识别不精确、易受环境干扰等问题&#xff0c;是亟待研究和攻克的难题。我…

ICS PA1

ICS PA1 init.shmake 编译加速ISA计算机是个状态机程序是个状态机准备第一个客户程序parse_argsinit_randinit_loginit_meminit_isa load_img剩余的初始化工作运行第一个客户程序调试&#xff1a;零断点TUI 基础设施单步执行打印寄存器状态扫描内存 表达式求值词法分析递归求值…

Vue.js2+Cesium1.103.0 十一、Three.js 炸裂效果

Vue.js2Cesium1.103.0 十一、Three.js 炸裂效果 Demo ThreeModelBoom.vue <template><div:id"id"class"three_container"/> </template><script> /* eslint-disable eqeqeq */ /* eslint-disable no-unused-vars */ /* eslint-d…

20 MySQL(下)

文章目录 视图视图是什么定义视图查看视图删除视图视图的作用 事务事务的使用 索引查询索引创建索引删除索引聚集索引和非聚集索引影响 账户管理&#xff08;了解非DBA&#xff09;授予权限 与 账户的相关操作 MySQL的主从配置 视图 视图是什么 通俗的讲&#xff0c;视图就是…

(Windows )本地连接远程服务器(Linux),免密码登录设置

在使用VScode连接远程服务器时&#xff0c;每次打开都要输入密码&#xff0c;以及使用ssh登录或其它方法登录&#xff0c;都要本地输入密码&#xff0c;这大大降低了使用感受&#xff0c;下面总结了免密码登录的方法&#xff0c;用起来巴适得很&#xff0c;起飞。 目录 PowerSh…