快速了解ChatGPT(大语言模型)

目录

GPT原理:文字接龙,输入一个字,后面会接最有可能出现的文字。

GPT4

学会提问:发挥语言模型的最大能力


参考李宏毅老师的课快速了解大语言模型做的笔记:

Lee老师幽默的开场:

 GPT:chat Generative Pre-trained Transformer

GPTS:专属的客制化的老师。

GPT原理:文字接龙,输入一个字,后面会接最有可能出现的文字。

回答问题的方式: 

 

 给每一个后面可能输出的符号一个概率值,输出概率最大的字符(token)。拆成token的方式也是比较有意思,会根据词性,词缀或者短语来生成token,那为什么这样子分呢?

因为英文单词是无法穷举的,他太多了,而token是一个可以进行穷举,类似的,中文方块字的token划分方式也是如此,可能将短语、不同词性的词划分成一个token。

        而且输出一个词会将输出的词又添加到输入词的后面,然后又生成后续的一个token,直到end的几率是最高的就结束。其实最后的输出并不是概率最大就输出概率大的token,而是进行一个掷色子的操作,所以就导致每次输出的结果可能是不同的,那为什么每次不选概率最大的进行输出呢?

有论文验证,为什么要掷骰子 ,这篇论文就讲了如果每次选几率最大的token可能输出会出现左边的情况,每次说的一样的话,而右边就是比较正常的,所以chatGPT才会出现骗人的场景。

        但是台湾省是没有玫瑰花节日的,但你告诉GPT是有的,GPT就会进行乱说,并生成一个假的网址。

        那它是如何有记忆功能的呢?就是上下文联通的功能?比如这样:

 是因为你问的问题,包括GPT输出的内容,GPT都会作为模型的输入,最后输出新的回答。

实际上模型所做的事情:

将最有可能输出的token的几率升高一点,将其他token的输出的几率降低一点,然后依次类推:

 Transformer里面的每个方块其实就是线性袋鼠的矩阵运算,需要大量可学习的参数,里面有上亿个参数。

 上图是第一代的GPT。

然后慢慢的:

不愧是李老师,PPT还是这么的幽默,模型参数量越来越大,

这是当时与其他模型相比时的正确率,当时准确率还不算特别高。然后OPENAI还不善罢甘休,他们说GPT3其实已经很聪明了,他为什么准确率不高是因为他不知道人类社会的规则,他只是学习了网络上的很多资料,碰到什么学什么,根本不知道他要做什么事情,而且回答是毫无逻辑的,

 SO,下一个阶段:

那就是让他继续学习。引入人类老师来指导GPT进行学习,那这种方法叫做监督式学习,而前面的方法叫做自监督学习,所以前面就是预训练,后面老师的指导就是大模型微调!(我终于懂了

 Fine-Tune!!!

这里有篇论文论证了监督式学习的重要性,https://arxiv.org/abs/2203.02155, 上图说明的问题是:(1)大的模型没有监督式学习老师的监督也可能不会超过小模型通过好的监督式学习的方式(小模型也有机会胜过大模型

(2)好的老师+大模型,效果会更好。

 

 

 还有增强式学习(强化学习,不提供正确的答案,而是提供反馈,什么样的答案是好的,什么样的答案是不好的,监督式学习人类就需要花费比较多的时间或者精力,而增强式学习我们每个人都可以做出贡献,我们在提问的同时就可以隐式的引导GPT回答出更加准确的答案,强化学习这边的知识我还没学过,下次有机会学学。

 强化学习一般放在网络的后端进行引导。

ChatGPT的强化学习步骤:

(1)模仿老师的偏好

(2)向模拟老师学习

监督式学习+强化学习也就是Alignment!!!(原来如此),就是对齐的过程。

GPT4

然后,GPT4技术报告,长达近百页,作者就有3页,主要就是炫耀GPT4有多麽多麽强。但是技术细节论文里面是没有写的

 亮点就是看得见了,可以传图片给GPT4,理解图片。

发挥语言模型的最大能力

1.把需求写清楚

2.提供资料给ChatGPT

3.提供范例:描述给他抽象的内容,比如晶晶体。

4.鼓励ChatGPT再想一想,让他解决问题时候,不要让他直接给答案,让他一步一步给出计算过程,那他答对的几率就会大大增加。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/206483.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

SQL server 基线安全加固操作

账号管理、认证授权 ELK-Mssql-01-01-01 编号 ELK-Mssql-01-01-01 名称 为不同的管理员分配不同的账号 实施目的 应按照用户分配账号,避免不同用户间共享账号,提高安全性。 问题影响 账号混淆,权限不明确,存在用户越权使用的可能。 …

Kafka的存储机制和可靠性

文章目录 前言一、Kafka 存储选择二、Kafka 存储方案剖析三、Kafka 存储架构设计四、Kafka 日志系统架构设计4.1、Kafka日志目录布局4.2、Kafka磁盘数据存储 五、Kafka 可靠性5.1、Producer的可靠性保证5.1.1、kafka 配置为 CP(Consistency & Partition tolerance)系统5.1.…

Pandas进阶:transform 数据转换的常用技巧

引言 本次给大家介绍一个功能超强的数据处理函数transform,相信很多朋友也用过,这里再次进行详细分享下。 transform有4个比较常用的功能,总结如下: 转换数值 合并分组结果 过滤数据 结合分组处理缺失值 一. 转换数值 pd.…

Linux常用命令——mv命令

文章目录 1. 简介2. 命令格式3. 主要参数4. 常见用法及示例4.1 移动文件4.2 重命名文件4.3 交互式移动文件4.4 强制移动文件4.5 移动多个文件4.6 使用通配符移动文件 5. 注意事项6. 结论 1. 简介 mv 命令在Linux系统中用于移动文件或目录,同时也可以用于重命名文件…

解决antd upload自定义上传customRequest,上传时一直loading加载的问题

问题&#xff1a;antd自定义上传customRequest时&#xff0c;无法正常显示上传成功状态&#xff0c;一直在上传的loading状态中。 查看customRequest参数 解决方法&#xff1a;调用onSuccess事件&#xff0c;解决loading一直加载的问题。 <template><a-uploadref&q…

cmake和vscode 下的cmake的使用详解(一)。

本文的内容 参考如下内容。 1.【基于VSCode和CMake实现C/C开发 | Linux篇】https://www.bilibili.com/video/BV1fy4y1b7TC?vd_source0ddb24a02523448baa69b0b871ab50f7 2.Notion – The all-in-one workspace for your notes, tasks, wikis, and databases. 3.关于如何利用…

11.30_黑马Redis实战篇分布式锁

实战篇9 设立一个在jvm外的锁监视器&#xff0c;可以处理多线程的问题 实战篇10 获取锁的时候&#xff0c;要同时发生获取锁以及设置到期时间。 实战篇11 thinking&#xff1a;JAVA中的自动拆箱与装箱&#xff1f; 【Java基础】自动拆装箱_Elephant_King的博客-CSDN博客 TR…

SQL Sever 基础知识 - 数据筛选

SQL Sever 基础知识 - 四、数据筛选 四、筛选数据第1节 DISTINCT - 去除重复值1.1 SELECT DISTINCT 子句简介1.2 SELECT DISTINCT 示例1.2.1 DISTINCT 一列示例1.2.2 DISTINCT 多列示例 1.2.3 DISTINCT 具有 null 值示例1.2.4 DISTINCT 与 GROUP BY 对比 第2节 WHERE - 过滤查询…

笔记64:Bahdanau 注意力

本地笔记地址&#xff1a;D:\work_file\&#xff08;4&#xff09;DeepLearning_Learning\03_个人笔记\3.循环神经网络\第10章&#xff1a;动手学深度学习~注意力机制 a a a a a a a a a a a

C语言--有三个字符串,要求找出其中长度最大的那一个

一.题目描述 有三个字符串&#xff0c;要求找出其中长度最大的那一个。 比如&#xff1a;输入三个字符串是&#xff1a; 第一个字符串:hello 第二个字符串&#xff1a;worldasd 第三个字符串&#xff1a;abcd 输出&#xff1a;最长的字符串是&#xff1a;worldasd 二.思路分析…

井盖位移报警器安装,智能化井盖厂家推荐

当井盖发生位移或倾斜时&#xff0c;通常会引起所处道路的安全隐患&#xff0c;给过往的车辆和行人带来许多潜在的危险。为了避免潜在的安全事故频繁出现&#xff0c;及时发现并处理井盖位移或倾斜才能更好的保障人民的安全。因此安装井盖位移报警器是满足政府和市民需求的。 单…

边缘计算网关:智能制造的“智慧大脑”

一、智能制造的崛起 随着科技的飞速发展&#xff0c;智能制造已经成为了制造业的新趋势。智能制造不仅能够提高生产效率&#xff0c;降低生产成本&#xff0c;还能够实现个性化定制&#xff0c;满足消费者多样化的需求。然而&#xff0c;智能制造的实现离不开大量的数据处理和分…

智能优化算法应用:基于鸽群算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用&#xff1a;基于鸽群算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用&#xff1a;基于鸽群算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.鸽群算法4.实验参数设定5.算法结果6.参考文献7.MATLAB…

ARM与大模型,狭路相逢

编辑&#xff1a;阿冒 设计&#xff1a;沐由 从去年底至今&#xff0c;伴随着OpenAI旗下ChatGPT的火爆&#xff0c;一波AI大模型推动着AI应用全面进入了大模型时代。与此同时&#xff0c;随着边缘算力的提升&#xff0c;AI大模型的部署也逐渐从云端涉入到边缘。 世界对AI算力的…

cpu飙高问题,案例分析(三)——非标导入引发CPU彪高,与RateLimiter限流

一、背景 非标导入使用easyexcel组件进行导入处理&#xff0c;10几万的数据量引发CPU彪高。 二、排查思路 查看线程栈相关信息&#xff1b;pinpoint监控查看性能及代码调用情况&#xff1b;是否存在大量阻塞慢SQL&#xff1b;是否存在短时间内频繁日志输出&#xff1b; 三、…

element中el-form-item设置label-width=‘auto‘报错

文章目录 一、问题二、解决三、最后 一、问题 el-form中的设置了全局标题宽度是200px&#xff0c;此时想要对el-form-item取消标题宽度&#xff0c;设置了label-widthauto&#xff0c;结果&#xff0c;报错了~~~ <el-form label-width"200px" label-position&quo…

echarts 地图

效果图 业务组件 <template><mapEcharts :itemStyle"mapProps.itemStyle" :emphasisLabelStyle"mapProps.emphasisLabelStyle":emphasisItemStyle"mapProps.emphasisItemStyle" :labelInfo"mapProps.labelInfo":rippleEffec…

类和对象——(3)再识对象

归纳编程学习的感悟&#xff0c; 记录奋斗路上的点滴&#xff0c; 希望能帮到一样刻苦的你&#xff01; 如有不足欢迎指正&#xff01; 共同学习交流&#xff01; &#x1f30e;欢迎各位→点赞 &#x1f44d; 收藏⭐ 留言​&#x1f4dd; 你说那里有你的梦想&#xff0c;…

Git常用命令#merge分支合并

要查看所有分支&#xff0c;包括本地和远程仓库的分支&#xff0c;可以使用以下命令&#xff1a; 1.查看分支 1.1 查看本地分支 git branch这个命令会列出本地所有的分支&#xff0c;当前所在的分支会有 * 标记。 1.2 查看远程分支 git branch -r这个命令会列出远程仓库的分…

RAM++(recognize anything++)—— 论文详解

一、概述 1、是什么 RAM&#xff08;RAM plus plus&#xff09;论文全称 《Open-Set Image Tagging with Multi-Grained Text Supervision》。区别于图像领域常见的分类、检测、分割&#xff0c;他是标记任务——多标签分类任务&#xff08;一张图片命中一个类别&#xff09;&…