LLM - 大语言模型(LLM) 概述

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/136617643

LLM

大语言模型(LLM, Large Language Model)的发展和应用是一个非常广泛的领域,涉及从早期的统计模型到现代基于深度学习的模型。在自然语言处理领域的应用非常广泛,包括但不限于聊天机器人、内容生成、情感分析、自动摘要、问答系统等。强大的文本生成能力,使其在内容创作领域具有巨大潜力,可以用于撰写文章、创作诗歌、生成新闻报道等。也可以为教育提供丰富的资源和工具,如自动评分、个性化学习辅导等,还可以用于构建智能客服系统,提高客户服务的响应速度和准确性。

以下是语言模型发展的4个阶段:

  1. 早期发展: 最初的语言模型基于统计方法和简单的神经网络,如循环神经网络(RNN)。这些模型在文本生成、机器翻译和语音识别等领域有所应用。
  2. Transformer架构: 随着Transformer架构的提出,语言取得了重大进展。Transformer提供了一种有效的方法来处理长距离依赖问题,并且在处理大量数据时表现出色。
  3. 预训练-微调范式: 研究者提出了预训练-微调(Pretraining-Finetuning)范式,通过在大量无标签数据上预训练模型,然后在特定任务上进行微调,以提高模型在特定任务上的表现。
  4. 多模态: 近年来,多模态大语言模型成为研究热点,这类模型不仅处理文本,还能理解图像和声音等其他类型的数据。

总的来说,大语言模型的发展推动了人工智能在理解和生成自然语言方面的能力,为各种应用提供了强大的支持。

LLM


1. 大语言模型概念

概念

世界科学发展的5个范式是对科学研究方法演变的概括,每个范式代表了一种独特的研究方法和科学理解的方式,即:

  1. 经验范式:这是最古老的科学范式,依赖于直接观察自然现象并从中获取知识。不依赖于复杂的理论,而是基于实验和经验的积累。
  2. 理论范式:随着数学和逻辑的发展,科学家开始使用理论模型来解释观察到的现象。这个范式包括了像牛顿运动定律这样的经典理论。
  3. 计算范式:计算机的出现使得科学家能够解决以前无法手工计算的复杂问题。这个范式依赖于数值模拟和计算机仿真。
  4. 数据范式:在大数据时代,科学研究开始依赖于收集、存储和分析大量数据。这个范式利用统计和机器学习方法来从数据中提取知识。
  5. 科学智能范式:这是最新的范式,结合了人工智能技术,特别是深度学习,来加速科学发现。利用AI来模拟和预测复杂系统的行为,有时甚至可以发现新的科学规律。

这些范式并不是相互排斥的,而是相辅相成,共同推动科学进步。


2. 大语言模型发展

Development
大语言模型的三种主要架构,即Encoder-Only、Decoder-Only、Encoder-Decoder,各有其特点和应用场景:

  1. Encoder-Only架构:
    • 这种架构专注于输入文本的理解,通常用于分类、实体识别或其他需要理解文本含义的任务。
    • 通过编码器处理输入文本,提取特征,然后用于下游任务。
    • 例如,BERT(Bidirectional Encoder Representations from Transformers)就是一个典型的Encoder-Only模型。
  2. Decoder-Only架构:
    • Decoder-Only架构专注于生成文本,适用于语言生成任务,如文本续写、创作等。
    • 通过解码器从给定的上下文中生成下一个单词或序列。
    • GPT(Generative Pretrained Transformer)系列模型是Decoder-Only架构的代表。
  3. Encoder-Decoder架构:
    • 这种架构结合了编码器和解码器的优点,能够理解输入文本并生成相应的输出。
    • 通常用于需要理解和生成文本的任务,如机器翻译、文本摘要等。
    • GLM(General Language Model)模型就是一个典型的Encoder-Decoder架构。

每种架构都有其独特的优势。


3. 大语言模型构建

构建流程

构建大型语言模型(LLM)的过程通常包括以下4个步骤:

  1. 预训练(Pretraining): 在这一阶段,模型在大规模的数据集上进行训练,以学习语言的基本规则和模式。这些数据集通常包含了广泛的主题和语言风格。
  2. 有监督微调(Supervised Fine Tuning, SFT): 预训练完成后,模型会在特定任务的数据集上进行微调。这些数据集是有标签的,即每个输入数据都有一个正确的输出,模型通过这些数据学习执行特定的任务。
  3. 奖励建模(Reward Modeling): 在这个阶段,模型会学习如何根据给定的奖励信号来优化其行为。这通常涉及到从人类反馈中学习,以便模型能够更好地满足用户的需求。
  4. 强化学习(Reinforcement Learning, RL): 最后,模型通过强化学习进一步优化,这是一种让模型通过试错来学习的方法。模型会在模拟环境中进行实验,根据其行为的结果来调整策略,以最大化奖励。

这个流程是迭代的,模型可能会经过多轮的预训练、微调和优化,以不断提高其性能和适应性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/458656.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Bugku MISC做题笔记

简单套娃DX 这一题需要对png图片的结构有所了解。详细可参考https://www.w3.org/TR/png/ 幸好每一张图片只有一个错误,逐步调试,就可以发现所有错误,修正即可。具体错误参看python程序中的注释: import ossrc_dir .\\XD\\ de…

鸿蒙开发(八)添加常用控件(下)

添加控件的文章分成了上下两篇,上篇介绍了文本显示、文本输入、按钮、图片、单选框、切换按钮这六种常用控件,本篇继续介绍其他几种很重要但略微复杂的控件。 鸿蒙系列上一篇: 鸿蒙开发(七)添加常用控件(…

【数据结构】串 解析+完整代码(求子串、比大小、定位操作)

1.串的实现 1.1 串的定义 定义 串,即字符串,是由零个或多个字符组成的有限序列。 串是一种特殊的线性表,数据元素间呈线性关系。 空串:串长度为0时;子串:串中任意个连续的字符组成的子序列;主串…

ConcurrentHashMap 为什么不能插入 null?

1、典型回答 简单来说,ConcurrentHashMap 不允许插入 null 值是JDK 源码规定的,如下源码所示(此源码基于JDK 1.8): 从上述源码可以看出,在添加方法的第一句就加了判断:如果 key 值为 null 或者是 value 值为 null&…

Spring Cloud Alibaba微服务从入门到进阶(一)(SpringBoot三板斧、SpringBoot Actuator)

Springboot三板斧 1、加依赖 2、写注解 3、写配置 Spring Boot Actuator Spring Boot Actuator 是 Spring Boot 提供的一系列用于监控和管理应用程序的工具和服务。 SpringBoot导航端点 其中localhost:8080/actuator/health是健康检查端点,加上以下配置&#xf…

基于PHP构建的HTML5点餐系统的设计13.91

随着互联网时代的发展,人们的生活方式正在发生改变。传统的餐饮行业也正在发生变革。人们不再满足过去的点餐方式,需要更好的体验。本课题旨在结合点餐系统的技术优势,设计一个能够方便顾客与商家,并且节约人力成本以及可以很好地…

中国金融统计年鉴、中国保险统计年鉴、中国人口与就业统计年鉴、国民经济和社会发展公报、中国劳动统计年鉴

数据下载链接:百度云下载链接 统计年鉴是指以统计图表和分析说明为主,通过高度密集的统计数据来全面、系统、连续地记录年度经济、社会等各方面发展情况的大型工具书来获取统计数据资料。 统计年鉴是进行各项经济、社会研究的必要前提。而借助于统计年…

Java代码基础算法练习---2024.3.14

其实这就是从我学校的资源,都比较基础的算法题,先尽量每天都做1-2题,练手感。毕竟离我真正去尝试入职好的公司(我指的就是中大厂,但是任重道远啊),仍有一定的时间,至少要等我升本之后…

【黑马程序员】Python文件、异常、模块、包

文章目录 文件操作文件编码什么是编码为什么要使用编码 文件的读取openmodel常用的三种基础访问模式读操作相关方法 文件的写入注意代码示例 异常定义异常捕获捕获指定异常捕获多个异常捕获所有异常异常else异常finally 异常的传递 python 模块定义模块的导入import模块名from …

【北京大学】徐高《金融经济学二十五讲》

一、经济的任务 经济的任务之一是确保有效地分配稀缺资源,这是经济学中的一个核心问题。资源是有限的,而需求是无限的,因此经济系统需要通过合理的机制来分配资源以满足社会的需求。以下是关于经济分配资源的几个方面: 1. 资源配…

【RPG Maker MV 仿新仙剑 战斗场景UI (三)】

RPG Maker MV 仿新仙剑 战斗场景UI 三 二级战斗指令菜单RMMV效果代码效果 仿仙剑UI代码效果 二级战斗指令菜单 仙剑1中二级战斗的菜单内容如下:物品、防御、围攻、逃跑、状态这五项。 现在来完成金玉其外的UI部分,内核具体的功能需要后期进行填充了&…

聚酰亚胺PI材料难于粘接,用什么胶水粘接?那么让我们先一步步的从认识它开始(一)

聚酰亚胺PI的基本概念 聚酰亚胺(Polyimide,简称PI)是一种重要的高性能聚合物材料。是指主链上含有酰亚胺环的一类聚合物,是综合性能最佳的有机高分子材料之一。它具有最高的阻燃等级(UL-94),以及…

C语言从入门到实战————数组和指针的深入理解

前言 在C语言中,数组和指针有的密切得联系,因为数组名本身就相当于一个指针常量。指针是一个变量,专门用来存储另一个变量的内存地址,通过这个地址可以访问和操作该变量的值,同时也包括数组。数组是一组连续存储的同类…

离线安装数据库 mysql 5.7 linux

离线安装数据库 mysql 5.7 linux 方法一 参考链接Linux(Debian10.2)安装MySQL5.7.24环境 赋予文件执行权限chmod x 文件名 使用root用户sudo su解压文件tar xvf mysql-5.7.42-linux-glibc2.12-x86_64.tar.gz重命名mv mysql-5.7.42-linux-glibc2.12-x86_64 mysql将桌面的mys…

【WSL】Windows wsl2 子系统忘记密码,重置修改用户密码

1.问题 windows 子系统 ubuntu 忘记密码,sudo 命令无法使用,需要重置密码 2. 解决 使用 wsl 命令进行修改,打开 cmd 窗口 # root 打开 wsl --user root # 修改 root 密码 passwd root # 修改用户密码 passwd username

【ARM】DS中Coretex-M处理器的常用寄存器介绍

【更多软件使用问题请点击亿道电子官方网站查询】 1、 文档目标 了解ArmDS中Coretex-M处理器的常用寄存器的名称及作用。 2、 问题场景 在对Coretex-M处理器进行开发时,了解常用寄存器的名称及作用,可以: 编写正确的程序: 寄存器是程序员用…

AI会取代低代码吗?——探讨两者在软件开发中的角色和关系

引言 在当今快速发展的数字化时代,软件开发已成为企业和商户必不可少的一项工作。为了应对不断增长的需求和日益复杂的业务要求,开发人员和企业正在寻求更加高效、快速的软件开发解决方案。在这样的背景下,低代码开发平台和人工智能&#xf…

【嵌入式开发·Arduino板】I2C接口通讯及应用 | 串口通讯实例 | I2C的类库函数,I2C接口的应用

“跟猫学,保持冷漠,适当撒娇,几乎不动心。跟猪学,保持食欲,充足睡眠,几乎不烦恼。” 🎯作者主页: 追光者♂🔥 🌸个人简介: 💖[1] 计算机专业硕士研究生💖 🌿[2] 2023年城市之星领跑者TOP1(哈尔滨)🌿 🌟[3] 2022年度博客之星人工智能领域…

集合系列(四) -LinkedHashMap详解

一、摘要 在集合系列的第一章,咱们了解到,Map的实现类有HashMap、LinkedHashMap、TreeMap、IdentityHashMap、WeakHashMap、Hashtable、Properties等等。 本文主要从数据结构和算法层面,探讨LinkedHashMap的实现。 二、简介 LinkedHashMap可…

虚拟机网络链接

在虚拟网络设置中找到如下界面: "子网 IP" 192.168.79.0/24 表示一个局域网络,它有254个可能的IP地址可供分配(192.168.79.1到192.168.79.254),255.255.255.0 是子网掩码,定义了网络和主机部分。…