学习大语言模型(LLM),从这里开始

在见识了ChatGPT的各种强大能力后,不少 NLP一线从业人员很自然地想到,以后开发者只要借助 ChatGPT,就可以做到现在大部分NLP工程师在做的事,比如文本分类、实体抽取、文本推理等。甚至随着大语言模型(largelanguagemodel,LLM)能力的不断提升,它们可能做得比NLP 工程师都要好。

如何利用大语言模型做一些NLP任务或服务?这本关于大语言模型的开发指南《ChatGPT原理与应用开发》来啦!

ChatGPT原理与应用开发

Datawhale的开源大模型实战教程,透彻解读4类常见NLP任务的系统设计,书-课-代码仓库全方位学习,每个人都可以用大语言模型轻松做出自己的AI产品。

本书主要面向非算法、有一定编程基础、对人工智能和 ChatGPT(或其他类似的大语言模型)感兴趣,并乐意使用大语言模型接口开发相关应用的读者。当然,部分内容不需要任何编程经验也可以学习。通过本书进一步降低大语言模型的使用 门槛,让更多对人工智能和大语言模型感兴趣的非 NLP 工程师或算法专业人士, 能够无障碍地使用大语言模型并创造价值。希望新的技术突破能够更多地改善我 们所处的世界。

本书内容

本书内容聚焦于如何使用大语言模型开发新的功能和应用,一共有 8 章内 容,分别如下。

第 1 章 基础知识 —大语言模型背后,主要介绍了与 ChatGPT 相关 的 NLP 领域的基础知识和原理,具体内容包括自然语言背景、Token 与 Embedding、语言模型、Transformer、GPT和RLHF 等。掌握了这部分知 识,就能大概知道 ChatGPT 或其他大语言模型是怎么回事。

第 2 章 相似匹配—万物皆可 Embedding, 主要介绍了文本表示, 以 及与文本匹配相关的任务和应用。这是 NLP 领域(以及其他一些算法领 域)最常用的技术,具体内容包括相似匹配基础、接口使用,以及简单 问答、聚类任务和推荐应用。

第 3 章 句词分类—句子 Token 都是类别,主要介绍了 NLP 领域最常 见的任务—分类。这其实也是人类最基本的认知方式(比如用男或女、 老或少、勤奋、乐于助人等简单的标签化方式具象化某个个体),具体内 容包括句词分类基础、接口使用,以及文档问答、模型微调和智能对话 应用。

第 4 章 文本生成—超越理解更智能,主要介绍了与文本生成技术相 关的任务,具体内容包括文本摘要、文本纠错和机器翻译。文本生成技 术在实际场景中的使用相对少一些,也相对独立一些。

第 5 章 复杂推理—更加像人一样思考,主要介绍了如何使用大语言 模型做复杂的逻辑推理任务。这部分内容在现实中的应用很少,但在新 的产品形态上有很多想象空间。

第 6 章 工程实践—真实场景大不同,主要介绍了如何在真实业务上 使用大语言模型。我们不再仅仅构建一个简单的 Demo(demonstration 的 简写,指示例、样品),而是要将大语言模型真正用在产品开发上。我们 会给出一些需要特别注意的事项,以帮助读者更高效地构建应用。

第 7 章 局限与不足—工具不是万能的,主要介绍了 ChatGPT(或其 他类似的大语言模型)的缺陷或不擅长的地方,包括事实性错误、实时 更新、性能瓶颈等方面。我们在畅想和利用 ChatGPT 或其他类似的大语言模型做各种人工智能应用时,也应该了解其不擅长的地方:一方面要 对其有更加全面的认识;另一方面,反向思维有时候也能想象出好的应 用或服务。

第 8 章 商业应用—LLM是星辰大海,可以把该章当作一篇调研报告 来阅读,主要针对工具应用和行业应用两大方面展开,期望能够给读者 更多启迪,帮助大家构思更好的应用或服务。

本书有两个基本的设计理念。

各章相对独立,彼此之间没有明显的依赖关系。这既体现在内容上,也 体现在设计上。读者可以灵活选取自己感兴趣的章节阅读。

以“任务”为核心。我们始终强调“任务”多于“工具”,ChatGPT 是目 前大语言模型领域总体效果最好的,但未来一定会有其他大语言模型出 现。不过,只要我们理解了要做的事情,理解了系统设计,工具就能为 我们所用。

阅读建议

通过上面的介绍,相信读者应该对本书有了初步了解。下面主要从创作者的 角度简单说明如何更好地使用本书。

第一,我们期望读者能够亲自动手完成一个应用或服务的 Demo 。光看不做 在编程领域是绝对不行的,实践出真知,脑子想、嘴上说与亲自干完全不一样。 而且,万事开头难,做了第一个,后面再做类似的就会相对容易一些。

第二,我们期望读者能在学习过程中多思考,既可以与自己工作的实际业务 相结合,也可以天马行空地构想。我们非常期待读者能分享自己的想法,众人拾 柴火焰高,个人能想到的太少了,但这么多人一起想,也许能够改变一个行业。

第三,我们期望读者能对 NLP 领域的常见任务有个基本的认识。我们并非 想要读者都成为 NLP 工程师,阅读本书也不会让你成为 NLP 工程师。但我们期望读者能够利用 ChatGPT (或其他类似的大语言模型)提供的接口来完成 NLP 任务,并提供相关服务。期望读者在阅读完本书后都具备这样的能力。

第四,洛克菲勒说过:真正重要的不在于有多少知识,而在于如何使用现有 的知识。知识只是潜在的力量,只有将其付诸应用,而且是建设性的应用,才会 显示出其威力。本书内容围绕着任务展开,很多设计思路和细节其实可以应用到 多个领域。我们再次强调,期望读者能够多实践,多应用,尤其是与自己的工作 多结合。

第五,由于创作团队精力有限,本书难免有疏漏甚至错误,我们期望读者在 学习的同时,也能积极给我们提建议,我们将不胜感激。

ChatGPT 火爆背后蕴含着一个基本道理:人工智能能力得到了极大突破— 大模型,尤其是大语言模型的能力有目共睹,未来只会变得更强。世界上唯一不 变的就是变化。适应变化、拥抱变化、喜欢变化。“天行健,君子以自强不息。” 我们相信未来会有越来越多的大模型出现。人工智能正在逐渐平民化,将来每个 人都可以利用大语言模型轻松地做出自己的人工智能产品。我们正在经历一个伟 大的时代,我们相信这是一个值得每个人全身心拥抱的时代,我们更加相信这个 世界必将因此而变得更加美好。

详细目录

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/417195.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

面试数据库篇(mysql)- 07索引创建原则与失效及优化

索引创建原则 1). 针对于数据量较大,且查询比较频繁的表建立索引。 2). 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引。 3). 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高。 4). 如果是字符…

算法基础(三)(模拟)

1.模拟算法介绍: 模拟算法通过模拟实际情况来解决问题,一般容易理解但是实现起来比较复杂,有很多需要注意的细节,或者是一些所谓很“麻烦”的东西。模拟题一般不涉及太难的算法,一般就是由较多的简单但是不好处理的部…

buuctf_web_knife

题目: 哥们,名字叫白给的shell,嘻嘻。本题主要练习一下蚁剑工具 激动的心,颤抖的手,我打开了蚁剑。在空白处右击 然后,输入URL,密码(所以上面说白给)是Syc 添加后点进…

【Java程序设计】【C00322】基于Springboot的高校竞赛管理系统(有论文)

基于Springboot的高校竞赛管理系统(有论文) 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于Springboot的高校竞赛管理系统,本系统有管理员、老师、专家以及用户四种角色; 管理员:首页、个人中心、管…

1 数据分析概述与职业操守

1、 EDIT数字化模型 E——exploration探索 (是什么) 业务运行探索:探索关注企业各项业务的运行状态、各项指标是否合规以及各项业务的具体数据情况等。 指标体系——目标(O)、策略(S)、指标&a…

jenkins插件下载失败bug

如果遇到安装jenkins插件经常失败并报以下类似错误,很可能是因为jenkins国外官方插件地址下载速度非常慢,我们可以修改为国内插件地址。 java.io.IOException: Failed to load: SCM API Plugin (scm-api 676.v886669a_199a_a_) - Jenkins (2.361.4) or h…

cmake如何将源文件按照指定的组织方式进行分组,在IDE例如vistual stdio或者xcode项目工程文件中展示和管理这些源文件

1、我们先来看下面的一个项目的结构 TestGroup工程下面的main.cpp同级的有两个文件夹,到时候我们想在IDE比如xcode或者visual stdio2019中也显示这样的结构怎么弄呢(答案是用cmake中的source_group函数) 2、假如没有用source_group生成的xcode工程是怎么样的&#…

map和set的简单介绍

由于博主的能力有限,所以为了方便大家对于map和set的学习,我放一个官方的map和set的链接供大家参考: https://cplusplus.com/ 在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque&#x…

2.29作业

1.编写链表,链表里面随便搞点数据 使用 fprintf 将链表中所有的数据,保存到文件中 使用 fscanf 读取文件中的数据,写入链表中 //main.c#include "link_list.h" int main() {link_p Lcreate_head();insert_tail(L,12);insert_tai…

【小沐学QT】QT学习之信号槽使用

文章目录 1、简介2、代码实现2.1 界面菜单“转到槽”方法2.2 界面信号槽编辑器方法2.3 QT4.0的绑定方法2.4 QT5.0之后的绑定方法2.5 C11的方法2.6 lamda表达式方法 结语 1、简介 在GUI编程中,当我们更改一个小部件时,我们通常希望通知另一个小程序。更普…

如何测试抖音

如何测试抖音 其实,现在的面试题,对于基础的测试用例和场景考察越来越多样化,就跟这样一道面试题。 面试官一上来就是跟我说下怎么测试刷抖音? 很多人一上来就开始各种UI测试,兼容性测试,易用性测试&#…

SWOT分析法是什么?

SWOT法又称态势分析法,是一种通过分析对象内外部因素从而得出战略结论的分析方法。核心理念在于通过对影响因素进行分类梳理,再通过聚合考虑来得出结论。主要就是四个维度:优势(Strengths)、劣势(Weaknesse…

深度学习介绍与环境搭建

深度学习介绍与环境搭建 慕课大学人工智能学习笔记,自己学习记录用的。(赋上连接) https://www.icourse163.org/learn/ZUCC-1206146808?tid1471365447#/learn/content?typedetail&id1256424053&cid1289366515人工智能、机器学习与…

C++ 二分查找函数lower_bound() 和 upper_bound()

lower_bound() 和 upper_bound() 是 C 标准库中的函数&#xff0c;用于在有序序列中查找目标值的插入位置。 lower_bound() 函数&#xff1a; lower_bound() 函数返回一个迭代器&#xff0c;指向第一个不小于目标值的元素位置。 template<class ForwardIt, class T> F…

怎么根据输入的网站url获得域名及主机ip地址(代码)

好久没更新csdn了。24年二月最后一天&#xff0c;写篇文章吧&#xff0c;作为24年第一篇文章&#xff0c;是不是最后一篇我就不知道了。 最近在写端口扫描的代码&#xff0c;输入是网站的url&#xff0c;输出是开放的端口。 首先就要将输入的网站url转化为域名和主机ip地址&a…

方格分割644--2017蓝桥杯

1.用dfs解决&#xff0c;首先这题的方格图形就很像一个走迷宫的类型&#xff0c;迷宫想到dfs&#xff0c;最中心点视为起点&#xff0c;起点有两个小人在这个方格里面对称行动&#xff0c;直到走出迷宫&#xff08;一个人走出来了另一个人就也走出来了&#xff0c;而走过的点会…

0代码自动化测试:RF 框架实现企业级 UI 自动化测试!

RobotFramework框架可以作为公司要做自动化 但是又不会代码的一种临时和紧急情况的替代方案&#xff0c;上手简单。 前言 现在大家去找工作&#xff0c;反馈回来的基本上自动化测试都是刚需&#xff01;没有自动化测试技能&#xff0c;纯手工测试基本没有什么市场。 但是很多人…

入栏需看——《python》专栏介绍专栏目录

《python》专栏介绍&专栏目录 专栏地址&#xff1a;点击跳转 专栏导航如下&#xff1a; 文章目录 &#x1f330;基础篇&#x1f330;自动篇&#x1f330;自动篇-办公&#x1f330;自动篇-运维 &#x1f330;分享篇&#x1f330;题库篇&#x1f381;产品篇&#x1f330;可视…

虚拟机看不到共享文件夹

johnjohn-virtual-machine:/mnt/hgfs$ cat /etc/issue Ubuntu 20.04.6 LTS \n \l 看下是否挂载 johnjohn-virtual-machine:/mnt/hgfs$ vmware-hgfsclient FPGAs_AdaptiveSoCs_Unified_2023.2_1013_2256 xilinx 取消挂载 johnjohn-virtual-machine:/mnt/hgfs$ sudo umount /mn…

网络——DHCP服务器、DNS服务器实验

网络——DHCP服务器、DNS服务器实验 一、DHCP服务器实验 DHCP——动态主机配置协议&#xff0c;用来管理ip地址的分配。网络中的每台计算机都有至少一个ip地址。在Windows网络连接对话框中可以设置成自动获取ip地址&#xff0c;这样主机作为DHCP client就可以自动从DHCP serve…