搞懂LLM中的Token,看这一篇就够了

一、Token是什么?

1.1 Token一定表示一个汉字么?

下面这个例子中我让ChatGPT按照Token的划分粒度将“我喜欢苹果”进行倒序输出。

image.png

这个例子说明:Token既可能是一个单词,例如“苹果”,也可能是一个汉字,例如:“我”

1.2 Token是固定不变的么?

比如在上述例子中,只要出现苹果这个词的地方,苹果是不是一定会被认为是一个Token,我们看另一个例子:
这个例子中我让ChatGPT按照Token的划分粒度将“我喜欢苹果派”进行倒序输出,你会发现苹果派单独成了一个Token。

image.png

这个例子说明Token在不同的上下文中不是一成不变的,有的上下文中“苹果”是一个Token,而在另一个上下文中“苹果派”是一个Token

1.3 Token的定义

在大语言模型中,Token是模型进行语言处理的基本信息单元,它可以是一个字,一个词甚至是一个短语句子。Token并不是一成不变的,在不同的上下文中,他会有不同的划分粒度。

如果要用一个中文单词来翻译Token,我更愿意将其称之为词元

二、为什么会有Token

ChatGPT并不是适用于某一门特定语言的大语言模型,它几乎适用于所有流行的自然语言。而Token的出现就是为了在概念上能够与具体的特定语言无关。

用专业的话表达:Token概念的提出是为了与特定的语言解耦

那ChatGPT到底是如何利用Token进行工作的呢?其实GPT由一个针对不同语言的非常全的Token词汇表,它能表达出所有人类的自然语言。当我们向GPT进行提问时,GPT会做如下处理:

  • GPT首先会识别我们的语言种类,例如中文、英文
  • GPT会根据自己的Token序列化规则将我们输入的文本转换为多个Token
  • GPT根据自己的Token词汇表以及训练的结果为我们输入的Token生成预测后的Token
  • GPT将生成的Token再转换成人类可读的自然语言提供给我们

image.png

三、Token对我们有哪些影响

image.png

从官方文档中我们可以看到每个模型都有一个MAX TOKENS的参数,这个参数的意思就是在一次会话中,模型能基于整个上下文记忆的最大的Token数量,这个上下文既包含了我们的输入,也包含了我们的输出。

在上面这个解释中会有两个概念:

  • 一次会话:所谓的一次会话是指你打开了一个和ChatGPT的聊天窗口,只要你一直在这个窗口内和ChatGPT聊天,那么这个窗口就是你和ChatGPT的一次会话,无论你们已经聊了多久
  • 上下文:所谓的上下文就是指在最新的一个提问之前所有的聊天记录

值得注意的是,这里的上下文记忆的最大Token数量,不仅仅是指你单次提问的语句的最大Token数量,而是整个会话中之前所有的输入和输出的Token数量

当单次会话中达到最大的Token数量之后,ChatGPT并不会停止输出,而是选择性的遗忘最前面的对话,然后可能会输出错误的结果。

这跟我们人类之间聊天是一样的,如果两个人聊天聊了很久,那么最开始聊的话题很有可能会被两个人遗忘。

四、Token对提示词编写有哪些影响

  • 理解了Token的限制,我们需要去形成“当前消耗了多少Token”的体感,这样当我们发现GPT的输出不符合预期的时候,我们可以首先考虑是否是因为上下文消耗的Token超过了限制,导致GPT忘记了最前面的内容。
  • 秉承奥卡姆剃刀原理,能不多说一句废话就不多说一句。尤其在连续的多轮对话中,我们一定要养成精简有效的表达习惯。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/526471.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

新版本v24.1发布,私有网盘也能创建互联网对外分享链接了

24年龙年到来之际,我们发布了v24.1版本,其中商业版优先响应了客户期待已久的外网分享特性,现在客户既可以创建内网登录账号可用的分享链接,也可以安全地创建互联网可访问的公共链接,产品应用场景得到了延伸。而社区版则…

T-GATE:交叉注意力使文本到图像扩散模型中的推理变得麻烦

今天给大家带来最近一项非常有意思的研究通过计算出,交叉注意力的输出会趋向于一个固定点。 然后在保真度提升阶段忽略文本条件不仅可以减少计算的复杂性。并提出了TGATE这种简单而无需训练的方法,用于高效地生成图像。 TGATE的做法是,一旦交…

【利器篇】前端40+精选VSCode插件,总有几个你未拥有!

前言 姊妹篇: 【利器篇】35精选chrome插件,含15前端插件,总有一款值得你停留 关于关于 【前端工具系列】: 有句话,事半功倍,其必然是借助了某些思想和工具。 VSCode是我们前端开发的武器,本文…

软件设计师-基础知识科目-数据结构3

三、 数据结构: 时间复杂度: 背复杂度对应的代码。Tips:时间复杂度估算看最内层循环,如若没有循环和递归则为O(1)。 空间复杂度: 需要单独空间存储数据时使用。考点:非递归的空间…

教你如何优雅做好项目管理?

导言 项目本身无好坏之分,项目管理有做好与做坏之别。在互联网大厂的体制下,想要做坏一个项目很难(可以通过换人、追加资源等方式消除风险),想要做好一个项目不容易,需要团队及 PM 付出大量心血和精力。在…

测开面经(pytest测试案例,接口断言,多并发断言)

pytest对用户登录接口进行自动化脚本设计 a. 创建一个名为"test_login.py"的测试文件,编写以下测试脚本 import pytest import requests# 测试用例1:验证登录成功的情况 # 第一个测试用例验证登录成功的情况,发送有效的用户名和密…

日期时间相关的类

分界线jdk8 jdk8之前和之后分别提供了一些日期和时间的类,推荐使用jdk8之后的日期和时间类 Date类型 这是一个jdk8之前的类型,其中有很多方法已经过时了,选取了一些没有过时的API //jdk1.8之前的日期 Date Date date new Date(); // 从1970年…

(源码+部署+讲解)基于Spring Boot和Vue的大学志愿者服务平台的设计与实现

摘要: 随着互联网技术的快速发展,大学校园内的志愿者活动日益增多,传统的志愿者管理方式已难以满足现代化、信息化的需求。因此,设计并实现一个基于Spring Boot和Vue的大学志愿者服务平台显得尤为重要。本文详细阐述了该平台的设计…

基于java+springboot+vue实现的教学辅助系统(文末源码+Lw)23-225

摘 要 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供服务。针对信息管理混乱,出错率高,信息安全性差&#…

JDK下载及安装说明

1.JDK下载 访问oracle官网:http://www.oracle.com 在首页点击Downloads,进入oracle软件下载页。 在下载页面,点击Java。 选择Java (JDK) for Developers,点击。 在 Java SE Downloads 页面,点击中间的DO…

ES高级查询语法DSL实战 - 第504篇

历史文章(文章累计500) 《国内最全的Spring Boot系列之一》 《国内最全的Spring Boot系列之二》 《国内最全的Spring Boot系列之三》 《国内最全的Spring Boot系列之四》 《国内最全的Spring Boot系列之五》 《国内最全的Spring Boot系列之六》 《…

【grpc】一、grpc入门,从protobuf开始

一、protobuf简介 Protocol Buffers,是Google公司开发的一种数据描述语言,类似于XML能够将结构化数据序列化,可用于数据存储、通信协议等方面。 关于相关工具的安装网上很多资料了,这里不再赘述。但是有几点需要注意的&#xff0…

【吊打面试官系列】Java高并发篇 - Java 中用到的线程调度算法是什么?

大家好,我是锋哥。今天分享关于 【Java 中用到的线程调度算法是什么?】面试题,希望对大家有帮助; Java 中用到的线程调度算法是什么? 采用时间片轮转的方式。可以设置线程的优先级,会映射到下层的系统上面的…

使用 Python 批量提取 Excel 中的图片(提供工具下载链接)

本文收录于《Python入门核心技术》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。 大家好,我是水滴~~ 本文主要讲解如何利用 Python 来批量提取 Excel 中的图片,分别保存到目录中。并将程序打包成可执行文件&am…

cloudcompare对点云数据打标签流程

1.导入点云txt文件 2.点击小剪刀进行分割 这时视角不能动了,进行框选分割,分割出上牙和下牙 3.打标签 点击加号在前六列的基础上再加上一列,列名为label 这里设置其他为0,上牙的标签为1,下牙为2 左边状态栏可以看到 4.合并为一个…

VueDraggablePlus 支持 Vue2 和 Vue3 的拖拽组件

官网:https://alfred-skyblue.github.io/vue-draggable-plus/

Jmeter接口测试:响应断言元件

响应断言元件介绍: 响应断言元件的功能是对接口的响应信息进行自动断言校验,来判断接口测 试得到的接口返回值是否正确。jmeter中该元件支持将请求或响应的各个字段与 模式字符串进行比较。有了该元件,就可以完成自动化接口测试,…

自媒体内容创作助手:5款必备ai写作工具一览! #科技#知识分享#学习

这些工具不仅可以快速生成高质量的文本内容,还可以根据用户的需求进行个性化定制。它们可以帮助我们节省大量的时间和精力,让我们更加专注于创意和细节的打磨。本文将为大家详细介绍几个AI写作工具,让你在写作领域更上一层楼。 1.元芳写作 …

从MySQL5.7平滑升级到MySQL8.0的最佳实践分享

一、前言 升级需求:将5.7.35升级到8.0.27, 升级方式 in-place升级【关闭现有版本MySQL,将二进制或包替换成新版本并在现有数据目录上启动MySQL并执行升级任务的方式,称为in-place升级】 原版本 5.7.35 CentOS Linux release 7.9.2009 新版本…

数字图像处理项目——基于BCNN和迁移学习的鸟类图像细粒度分类(论文/代码)

完整的论文代码见文章末尾 以下为核心内容 摘要 本文采用了ResNet50、VGG19、InceptionV3和Xception等四种不同的深度神经网络模型,并应用于鸟类图像的细粒度分类问题中,以探究其在该任务上的性能表现。 其中,本文使用了BCNN(B…