【大模型】3分钟了解提示(Prompt)工程、检索增强(RAG)和微调

我们先看下面这个图:
在这里插入图片描述
简单理解大模型是通过海量训练数据训练出来的,它的能力非常强,但是有时候会给出错误的回答。那产生错误的原因可能是什么呢?

1.提问错误(提示工程)

在我们提问的方式不对的情况下,大模型可能会给出不合理的回答,利用提示工程来提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。

2. 缺乏相关知识(检索增强-RAG)

另外一个原因可能是大模型的虽然是通过海量数据训练,但它的训练数据大部分是互联网公开数据,且数据有时效性,一些垂直领域的知识和实时性的知识它是缺乏的。利用检索增强(RAG)先检索相关知识,把相关知识通过prompt提供给大模型,再生成答案往往能得到解决。

3. 模型能力不足(微调)

大模型的在通用场景时有不错的能力,但是可能会缺乏特定领域的解决能力,例如:医学、金融领域等。通过提供特定领域的知识对模型进行微调训练,让模型记住特定领域的知识,可以有效减少对应领域的幻觉。

附录

  1. 提示工程(Prompt Engineering)

    • 是什么?
      • 提示工程是通过精心设计输入给语言模型,以获得更好的输出结果。
    • 适合场景:
      • 当你需要快速尝试不同任务,或者不想修改模型时。
      • 适用于生成文本、回答问题等任务。
  2. 检索增强生成(RAG)

    • 是什么?
      • RAG结合了信息检索和文本生成,首先从数据库中检索相关信息,再用生成模型产生答案。
    • 适合场景:
      • 当需要结合外部知识库或文档进行回答时。
      • 适用于问答系统、文档摘要等。
  3. 微调(Fine-tuning)

    • 是什么?
      • 微调是在特定任务或数据集上进一步训练预训练模型,使其更适合特定应用。
    • 适合场景:
      • 当你有特定领域的数据,并希望模型在该领域表现更好时。
      • 适用于情感分析、特定领域的文本生成等。

对比表格

特性提示工程RAG微调
操作难度
灵活性
依赖数据无需额外数据需要外部知识库需要特定领域数据
适应性一般
响应速度
开发成本
适用场景快速原型开发需要外部信息的复杂任务特定领域的精准任务

应用场景选择

  • 使用提示工程:

    • 当需要快速试验不同任务,或在没有特定数据的情况下进行文本生成。
  • 使用RAG:

    • 当任务需要结合外部文档或知识库来提供更准确的信息时。
  • 使用微调:

    • 当有足够的特定领域数据,并需要模型在该领域达到最佳性能时。

参考资料:

  • 通俗易懂理解提示工程、RAG和微调
  • 提示工程指南

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/899838.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

MySql中常用的日期函数

TIMESTAMPDIFF(unit, start_time, end_time):日期相减 计算两个时间之间的差值,并以指定的单位返回结果。unit参数可以是以下之一:SECOND、MINUTE、HOUR、DAY、WEEK、MONTH、QUARTER或YEAR。这个函数返回的是两个时间之间的差值,可…

Anchor DETR论文笔记

原文链接 [2109.07107] Anchor DETR: Query Design for Transformer-Based Object Detection (arxiv.org)https://arxiv.org/abs/2109.07107 原文笔记 What 提出了一种新的基于锚点的查询设计,即将锚点编码为对象查询。 Why 对象检测任务是预测图像中每个对象…

消息队列(仿RabbitMQ)—— 生产消费模型

本篇将实现一个3000多行的一个小项目,基于AMQP(高级消息队列协议)的消息队列,主要仿照 RabbitMQ 实现该代码,其本质也是生产消费模型的一个升级版本。实现的功能为:消息发布端将消息发送到服务器端&#xf…

vue elementui el-table实现增加行,行内编辑修改

需求&#xff1a; 前端进行新增表单时&#xff0c;同时增加表单的明细数据。明细数据部分&#xff0c;可进行行编辑。 效果图&#xff1a; <el-card><div slot"header"><span style"font-weight: bold">外来人员名单2</span><…

Idea、VS Code 如何安装Fitten Code插件使用

简介 Fitten Code是由非十大模型驱动的AI编程助手&#xff0c;它可以自动生成代码&#xff0c;提升开发效率&#xff0c;帮您调试Bug&#xff0c;节省您的时间。还可以对话聊天&#xff0c;解决您编程碰到的问题。免费且支持80多种语言&#xff1a;Python、C、Javascript、Typ…

Spring Cache Caffeine 高性能缓存库

​ Caffeine 背景 Caffeine是一个高性能的Java缓存库&#xff0c;它基于Guava Cache进行了增强&#xff0c;提供了更加出色的缓存体验。Caffeine的主要特点包括&#xff1a; 高性能&#xff1a;Caffeine使用了Java 8最新的StampedLock乐观锁技术&#xff0c;极大地提高了缓存…

多模态大语言模型(MLLM)-Deepseek Janus

论文链接&#xff1a;https://arxiv.org/abs/2410.13848 代码链接&#xff1a;https://github.com/deepseek-ai/Janus 本次解读Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation 前言 Deepseek出品&#xff0c;必属精品。 创新点 传…

Redis学习笔记(二)--Redis的安装与配置

文章目录 一、Redis的安装1、克隆并配置主机2、安装前的准备工作1.安装gcc2.下载Redis3.上传到Linux 3、安装Redis1.解压Redis2.编译3.安装3.查看bin目录 4、Redis启动与停止1.前台启动2.命令式后台启动3.Redis的停止4.配置式后台启动 二、连接前的配置1、绑定客户端IP2、关闭保…

使用 Elasticsearch 作为向量数据库询问有关你的 GitHub 存储库的问题

作者&#xff1a;来自 Elastic Fram Souza 本博客介绍了使用 RAG 和 Elasticsearch 实现语义代码查询的 GitHub Assistant&#xff0c;提供对 GitHub 存储库的洞察&#xff0c;并可扩展到 PR 反馈、问题处理和生产准备情况审查。 该项目允许你直接与 GitHub 存储库交互并利用语…

xlsx xlsx-style-vite 实现前端根据element 表格导出excel且定制化样式 背景 列宽等

前言 先看下最终效果图吧&#xff0c;需要的可以参考我的实现方式 这是最终导出的表格文件 类似这种的&#xff0c;特定单元格需要额外标注&#xff0c;表头也有月份然后细分的&#xff0c;表格组件是这样的 注意 别使用xlsx-style 这个库&#xff0c;太多问题了&#xff0c;…

如何选择云主机或者VPS挂EA?

近年来&#xff0c;随着EA交易在零售外汇圈的逐渐流行&#xff0c;越来越多的交易者开始使用外汇VPS&#xff08;虚拟专用服务器&#xff09;来挂载EA&#xff08;智能交易系统&#xff09;进行交易。通过外汇VPS&#xff0c;可以最大程度地减少MT4客户终端与MT4服务器之间的延…

多特征变量序列预测(四) Transformer-BiLSTM风速预测模型

往期精彩内容&#xff1a; 时序预测&#xff1a;LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较 全是干货 | 数据集、学习资料、建模资源分享&#xff01; EMD、EEMD、FEEMD、CEEMD、CEEMDAN的区别、原理和Python实现&#xff08;一&#xff09;EMD-CSDN博客 EMD、EEM…

【模型部署】python中socket编程入门知识-系列1

写在前面&#xff1a; 首先感谢兄弟们的订阅&#xff0c;让我有创作的动力&#xff0c;在创作过程我会尽最大能力&#xff0c;保证作品的质量&#xff0c;如果有问题&#xff0c;可以私信我&#xff0c;让我们携手共进&#xff0c;共创辉煌。 路虽远&#xff0c;行则将至&#…

[实时计算flink]基于Paimon的数据库实时入湖快速入门

Apache Paimon是一种流批统一的湖存储格式&#xff0c;支持高吞吐的写入和低延迟的查询。本文通过Paimon Catalog和MySQL连接器&#xff0c;将云数据库RDS中的订单数据和表结构变更导入Paimon表中&#xff0c;并使用Flink对Paimon表进行简单分析。 背景信息 Apache Paimon是一…

深度学习之梯度下降法 | Chapter 2 | Deep Learning | 3Blue1Brown

目录 前言1. 总览2. 回顾3. 训练数据的使用4. 代价函数5. 梯度下降法6. 梯度向量7. 梯度下降小结8. 分析网络9. 网络如何学习的研究相关资料结语 前言 3Blue1Brown 视频笔记&#xff0c;仅供自己参考 这个章节主要介绍梯度下降的思想&#xff0c;之后进一步探索网络的能力以及隐…

助农贷款、保险精准定价,背后的“星绽”机密计算全球开源

文&#xff5c;白 鸽 编&#xff5c;王一粟 河南平顶山种植日本引进白草莓的李朝阳&#xff0c;和山东临沂种植山楂和桃子的李东旭&#xff0c;都是网商银行“农户秒贷”项目的受益者。 “发果农工资&#xff0c;收购水果&#xff0c;遇上天气灾害时周转应急时&#xff0c;“…

E/MicroMsg.SDK.WXMediaMessage:checkArgs fail,thumbData is invalid 图片资源太大导致分享失败

1、微信分享报&#xff1a; 2、这个问题是因为图片太大导致&#xff1a; WXWebpageObject webpage new WXWebpageObject();webpage.webpageUrl qrCodeUrl;//用 WXWebpageObject 对象初始化一个 WXMediaMessage 对象WXMediaMessage msg new WXMediaMessage(webpage);msg.tit…

MySQL-12.DQL-条件查询

一.DQL-条件查询 -- DQL:条件查询 -- 1.查询 姓名 为 杨逍 的员工 select id, username, password, name, gender, image, job, entrydate, create_time, update_timefrom tb_emp where name 杨逍;-- 2.查询 id小于等于5 的员工信息 select * from tb_emp where id < 5;-…

Flutter 小技巧之 equatable 包解析以及宏编程解析

今天我们聊聊 equatable 包的实现&#xff0c;并通过 equatable 去理解 Dart 宏编程的作用和实现&#xff0c;对于 Flutter 开发者来说&#xff0c;Dart 宏编程可以说是「望眼欲穿」。 equatable 正如 equatable 这个包名所示&#xff0c;它的功能很简单&#xff0c;主要是用…

LeetCode 热题100之双指针

1.移动零 思路分析1&#xff08;纯模拟&#xff09; 定义指针j&#xff0c;用来收集不是0的数&#xff1b;收集完毕之后&#xff0c;再把剩下位置处置为0即可。 具体实现代码&#xff08;详解版&#xff09;&#xff1a; class Solution { public:void moveZeroes(vector<…