Elasticsearch:RAG vs Fine-tunning (大语言模型微调)

如果你对 RAG 还不是很熟悉的话,请阅读之前的文章 “Elasticsearch:什么是检索增强生成 - RAG?”。你可以阅读文章 “Elasticsearch:在你的数据上训练大型语言模型 (LLM)” 来了解更多关于如何训练你的模型。在今天的文章中,我们来讲述 RAG 及 大语言模型的优缺点。这篇文章旨在优化语言模型的终极指南。

介绍

你是否正在努力充分利用大型语言模型 (LLM)? 你不是一个人。 好消息是,你可以选择:检索增强生成 (RAG) 和微调。 但哪一款适合你呢? 让我们来看看吧。

两大巨头:RAG 和微调

  • RAG:想象一下你的 LLM 是一名侦探。 RAG 允许它在解决案件(回答你的查询)之前从各种来源搜索线索(数据)。
    • 该方法帮助模型搜索并使用外部信息来回答问题或生成文本。 可以把它想象成一个学生在回答问题之前先在教科书中查找事实。

在很多的情况下,我们可以很方便地使用 Elasticsearch 来作为向量数据库,并轻松地实现 RAG。详细实现请参阅文章 “ChatGPT 和 Elasticsearch:OpenAI 遇见私有数据(一)”。

  • 微调:将其视为 LLM 的专门训练营。 它针对特定游戏(任务)磨练自己的技能,使其成为明星玩家。
    • 在这里,你可以根据特定数据训练已经构建的模型,以使其更好地完成特定任务。 这就像一位厨师已经知道如何烹饪,但参加了一门特殊的课程来改进特定的食谱。

是什么让他们与众不同

  • 目标:RAG 是你的数据侦探,而微调则将你的模型变成专家。
  • 轻松又省钱:RAG 就像按照菜谱做饭一样; 它更容易而且通常更便宜。 Fine-Tuning 就像创造一道美食; 它很复杂,但可以更令人满意。

风险:为什么你的选择很重要

明智地选择,否则你最终可能会得到一个低效、昂贵且难以管理的模型。 以下是如何避免陷阱。

你的清单:做出正确的选择

  • 你需要外部信息吗? 选择 RAG。
  • 想要自定义行为吗? 选择微调。
  • 有很多具体数据吗? 微调会发光。
  • 数据不断变化? RAG 保持更新。
  • 需要解释模型的答案吗? RAG 提供更高的透明度。

现实世界场景:哪一个获胜?

我们将探讨如何在 RAG 和微调之间进行选择,以完成总结文章、在公司环境中回答问题以及自动化客户支持等任务。

超越基础:需要考虑的其他因素

从可扩展性和实时需求到道德和现有系统,我们将讨论其他可能使天平有利于一种方法而不是另一种方法的因素。

结论:你的成功之路

请记住,最好的方法是符合你的特定需求和目标的方法。 在许多情况下,你需要同时使用两者。 因此,评估、选择和优化你的 LLM 成功之路!

更多有关 Elasticsearch 在大数据及人工智能方面的文章,请参阅 “AI”。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/119893.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Git 内容学习

一、Git 的理解 Git是一个分布式版本控制系统(Distributed Version Control System,简称 DVCS),用于对项目源代码进行管理和跟踪变更。分为两种类型的仓库:本地仓库和远程仓库。 二、Git 的工作流程 详解如下&#x…

CATIA环境编辑器用不了时创建项目快捷方式

CATIA环境编辑器用不了时创建项目快捷方式 一、参考适用情况示例二、 解决步骤(一) 先正确放置winb_64部署包(二) 添加环境文件(三) 修改加入的环境文件(四) 复制本机CATIA快捷方式后重命名(五) 修改快捷方式目标的值 一、参考适用情况示例 二、 解决步骤 (一) 先正确放置winb…

社区分享|杭银消费金融基于MeterSphere开展接口自动化测试

杭银消费金融有限公司(以下简称“杭银消费金融”)成立于2015年12月,是经中国银保监会批准,由杭州银行作为主发起人,联合滴滴出行、中国银泰等企业组建的持牌消费金融机构,注册资本为25.61亿元。杭银消费金融…

关于Alibaba Cloud Toolkit 下载配置以及后端自动部署

idea中File-Settings-Plugins 搜索Alibaba Cloud Toolkit点击下载,下载完成重启 1、点击 Tools-Alibaba Cloud-Deploy to Host 部署到主机 2、配置服务器ip、jar包启动命令、服务器jar存放位置 3、设置服务器ip用户名密码,点击测试连接情况 4、配置脚本…

计算机的运算方法

无符号数 定义:没有符号的数,在寄存器中的每一位均可用来存放数值 表示范围:n 位无符号数 0~2n -1 有符号数 定义:符号位数值位 “0”代表正,“1”代表负 表示范围:n 位有符号整数 原码、反码&#x…

Rust编程基础之引用与借用

1.引用与借用 在上一章节最后的代码中, 我们必须将 String 返回给调用函数,以便在调用 calculate_length 后仍能使用 String,因为 String 被移动到了 calculate_length 内。相反我们可以提供一个 String 值的引用(reference)。引…

理解交叉熵(Cross Entropy)

交叉熵(Cross-Entropy)是一种用于衡量两个概率分布之间的距离或相似性的度量方法。在机器学习中,交叉熵通常用于损失函数,用于评估模型的预测结果与实际标签之间的差异。 在分类问题中,交叉熵损失函数通常用于多分类问…

uniapp小程序才到第五层就报错navigateto:fail webview count limit exceed

错误截图 原因 小程序官方描述是说可以跳转10层,但是使用uniapp开发的程序在小程序中才运行到第五层就报错了,原因是因为没有设置appId。如果设置了就正常了。

Docker与微服务实战——基础篇

Docker与微服务实战——基础篇 第一章 Docker 简介1.1 docker 理念1.2 容器与虚拟机比较 第二章 Docker 安装2.1 前提说明2.2 Docker的基本组成2.2.1 镜像(image)2.2.2 容器(container)2.2.3 仓库(repository&#xff…

php实现普通和定时跳转的几种方式

一、普通跳转 1、使用header函数:通过设置HTTP头部信息实现页面跳转。可以使用Location头部指定跳转的URL。例如: header("Location: http://www.example.com"); exit(); 2、使用JavaScript:可以使用JavaScript的window.location…

HCIA_数据链路层

如果数据进行封装时,基于E2或者802.3标准,此时我们称之为是一个以太网帧 1、EthernetII 采用EthernetII协议会在数据基础之上多出18Byte,EthernetII的数据长度是46-1500B FCS(Frame check Sequence)帧校验序列&#…

Linux安装nodejs问题

安装nodejs后,使用node -v报下图 参考下面两个可解决:【Linux-编译器gcc/glibc升级】CentOS7.9使用NodeJS18时报错/lib64/libm.so.6: version GLIBC_2.27‘ not found-CSDN博客 报错信息ImportError: /lib64/libstdc.so.6: version CXXABI_1.3.9‘ not f…

技术分享 | app自动化测试(Android)--元素定位方式与隐式等待

元素定位是 UI 自动化测试中最关键的一步,假如没有定位到元素,也就无法完成对页面的操作。那么在页面中如何定位到想要的元素,本小节讨论 Appium 元素定位方式。 Appium的元素定位方式 定位页面的元素有很多方式,比如可以通过 I…

C++day4

1.思维导图 2.设计一个Per类&#xff0c;类中包含私有成员:姓名、年龄、指针成员身高、体重&#xff0c;再设计一个Stu类&#xff0c;类中包含私有成员:成绩、Per类对象p1&#xff0c;设计这两个类的构造函数、析构函数和拷贝构造函数、拷贝赋值函数。 #include <iostream&…

mybatis在springboot当中的使用

1.当使用Mybatis实现数据访问时&#xff0c;主要&#xff1a; - 编写数据访问的抽象方法 - 配置抽象方法对应的SQL语句 关于抽象方法&#xff1a; - 必须定义在某个接口中&#xff0c;这样的接口通常使用Mapper作为名称的后缀&#xff0c;例如AdminMapper - Mybatis框架底…

2023年中国金融控股公司研究报告

第一章 行业概况 1.1 定义 金融控股公司这一术语最初源自美国&#xff0c;特别是在美国的《金融服务法案》关于银行控股公司组织结构的条文中&#xff0c;首次出现了“金融控股公司”&#xff08;Financial Holding Company&#xff09;这一法律术语&#xff0c;尽管法案中并…

使用Ruby编写通用爬虫程序

目录 一、引言 二、环境准备 三、爬虫程序设计 1. 抓取网页内容 2. 解析HTML内容 3. 提取特定信息 4. 数据存储 四、优化和扩展 五、结语 一、引言 网络爬虫是一种自动抓取互联网信息的程序。它们按照一定的规则和算法&#xff0c;遍历网页并提取所需的信息。使用Rub…

《安富莱嵌入式周报》第326期:航空航天级CANopen协议栈,开源USB PD电源和功耗分析,开源EtherCAT伺服驱动板,时序绘制软件,现代机器人设计

周报汇总地址&#xff1a;嵌入式周报 - uCOS & uCGUI & emWin & embOS & TouchGFX & ThreadX - 硬汉嵌入式论坛 - Powered by Discuz! 更新一期视频教程&#xff1a; BSP视频教程第28期&#xff1a;CANopen协议栈专题&#xff0c;CANopen主从机组网实战&a…

考研408-计算机网络 第一章-计算机网络体系结构学习笔记及习题

第一章 计算机网络体系结构 一 计算机网络概述 1.1 概念及功能 1.1.1 计算机网络的概念 计算机网络就是互连的、自治的计算机系统的集合 互连&#xff1a;通过通信链路互联互通 自治&#xff1a;各个节点之间无主从关系&#xff0c;高度自治的 1.1.2 计算机网络的功能 功…

【STM32】Systick定时器

一、STM32的5种定时器简介 1.独立看门狗&#xff08;IWDG&#xff09; VS 窗口看门狗&#xff08;WWDG&#xff09; 1.独立看门狗&#xff08;IWDG&#xff09; 独立看门狗&#xff1a;当没有到设定时间之前&#xff0c;给它喂了狗&#xff0c;就会回到初始值。 2.窗口看门狗…