T-RAG = RAG + Fine-Tuning + Entity Detection

原文地址:T-RAG = RAG + Fine-Tuning + Entity Detection

T-RAG 方法的前提是将 RAG 架构与开源微调的 LLM 和实体树向量数据库相结合。重点是上下文检索。

2024 年 2 月 15 日

介绍

大型语言模型 (LLM) 越来越多地应用于各个领域,包括对私营企业文档的问答,其中数据安全性稳健性至关重要。

检索增强生成(RAG)是构建此类应用程序的重要框架,但确保其稳健性需要广泛的定制。

本研究分享了部署 LLM 应用程序以对私人组织文档进行问答的经验,使用名为Tree-RAG (T-RAG)的系统,该系统合并了实体层次结构以提高性能。

评估证明了这种方法的有效性,为现实世界的LLMs应用提供了宝贵的见解。

数据隐私

由于这些文档的敏感性,安全风险是首要问题,因此在公共 API 上使用专有的 LLM 模型来避免数据泄露风险是不切实际的。

这就需要使用可以在本地部署的开源模型。

此外,有限的计算资源和基于可用文档的较小的训练数据集也带来了挑战。

此外,确保对用户查询的可靠和准确的响应会增加复杂性,在此类环境中部署强大的应用程序时需要进行广泛的定制和决策。

Take-Aways

我对这项研究感兴趣的是,研究人员开发了一种应用程序,将检索增强生成(RAG)经过微调的开源大型语言模型(LLM)集成起来以生成响应。该模型使用源自组织文档的指令数据集进行训练。

他们引入了一种新颖的评估指标,称为Correct-Verbose,旨在评估生成的响应的质量。该指标根据答案的正确性来评估答案,同时还考虑包含超出原始问题范围的其他相关信息。

T-RAG

Tree-RAG (T-RAG) 的工作流程如下:

对于给定的用户查询,在向量数据库中搜索相关文档块,该块充当LLM上下文学习的上下文参考。

如果查询提到任何组织相关实体,则从实体树中提取有关实体的信息并将其添加到上下文中。经过微调的 Llama-2 7B 模型根据所提供的数据生成响应。

来源

T-RAG 的一个特点是除了用于上下文检索的矢量数据库之外还包含实体树。

实体树

T-RAG 的一个显着特点是它结合了实体树和向量数据库以进行上下文检索。实体树存储有关组织实体及其层次结构排列的详细信息。该树中的每个节点代表一个实体,其父节点指示它们各自的组成员身份。

在检索过程中,该框架利用实体树来增强从向量数据库检索的上下文。

实体树搜索和上下文生成的过程如下:

  1. 最初,解析器模块扫描用户查询以查找与组织内的实体名称相对应的关键字。
  2. 一旦识别出一个或多个匹配,就从树中提取有关每个匹配实体的详细信息。
  3. 这些详细信息被转换为文本陈述,提供有关实体及其在组织层次结构中的位置的信息。
  4. 随后,该信息与从向量数据库检索的文档块合并以构建上下文。
  5. 通过采用这种方法,当用户询问实体时,模型可以获得有关实体及其在组织内的层次定位的相关信息。

来源

考虑上图,上下文生成的检索过程涉及利用组织图中的说明性示例来演示如何执行树搜索和检索。

除了获取上下文文档之外,spaCy 库还与自定义规则一起使用来识别组织内的命名实体。

如果查询包含一个或多个此类实体,则从树中提取有关该实体的分层位置的相关信息并将其转换为文本语句。然后将这些语句与检索到的文档一起合并到上下文中。

但是,如果用户的查询未提及任何实体,则省略树搜索,并且仅利用检索到的文档中的上下文。

综上所述

我发现这项研究很有趣,因为它结合了 RAG 和微调。利用本地托管的开源模型来解决数据隐私问题,同时解决推理延迟、令牌使用成本以及区域和地理可用性问题。

同样有趣的是如何通过 spaCy 框架使用实体进行实体搜索和上下文生成。事实上,这不仅仅是一项研究成果,而是基于构建供实际使用的LLMs应用程序的经验而得出的经验教训。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/444474.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Pb量级超大容量光存储

近日,中国科学院上海光学精密机械研究所(以下简称“上海光机所”)与上海理工大学等科研单位合作,在超大容量三维超分辨光存储研究中取得突破性进展。研究团队利用国际首创的双光束调控聚集诱导发光超分辨光存储技术,实…

docker-compose这下会用了吗?

概要 默认的模板文件是 docker-compose.yml,其中定义的每个服务可以通过 image 指令指定镜像或 build 指令(需要 Dockerfile)来自动构建。 注意如果使用 build 指令,在 Dockerfile 中设置的选项(例如:CMD, EXPOSE, V…

Linux 学习(持续更新。。。)

wc命令 命令直接执行&#xff0c;输出包含四项&#xff0c;分别代表&#xff1a;行数、字数、字节数、文件。 例子:编译下列代码: #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <string.h> #include <fcntl.h> #inclu…

报错Importing ArkTS files to JS and TS files is not allowed. <etsLint>

ts文件并不支持导入ets文件&#xff0c;为了方便开发应用卡片&#xff0c;entryformAbility创建的时候默认是ts文件&#xff0c;这里只需要把ts文件改成ets便可以轻松的导入所需要的ets即可 我创建了一个鸿蒙开发的交流群&#xff0c;喜欢的鸿蒙朋友可以扫码或者写群号&#xf…

【编译原理】1、python 实现一个 JSON parser:lex 词法分析、parser 句法分析

文章目录 一、实现 JSON lexer&#xff08;词法解析器&#xff09;二、lex 词法分析2.1 lex string 解析2.2 lex number 解析2.3 lex bool 和 null 解析 三、syntax parser 句法分析3.1 parse array 解析数组3.2 parse object 解析对象 四、封装接口 一、实现 JSON lexer&#…

时间感知自适应RAG(TA-ARE)

原文地址&#xff1a;Time-Aware Adaptive RAG (TA-ARE) 2024 年 3 月 1 日 介绍 随着大型语言模型&#xff08;LLM&#xff09;的出现&#xff0c;出现了新兴能力的概念。前提或假设是LLMs具有隐藏的和未知的能力&#xff0c;等待被发现。企业家们渴望在LLMs中发现一些无人知晓…

Linux网络基础2之协议

(&#xff61;&#xff65;∀&#xff65;)&#xff89;&#xff9e;嗨&#xff01;你好这里是ky233的主页&#xff1a;这里是ky233的主页&#xff0c;欢迎光临~https://blog.csdn.net/ky233?typeblog 点个关注不迷路⌯▾⌯ 目录 1.协议 1.序列化与反序列换 2.协议定制 二…

LLM实施的五个阶段

原文地址&#xff1a;Five Stages Of LLM Implementation 大型语言模型显着提高了对话式人工智能系统的能力&#xff0c;实现了更自然和上下文感知的交互。这导致各个行业越来越多地采用人工智能驱动的聊天机器人和虚拟助手。 2024 年 2 月 20 日 介绍 从LLMs的市场采用情况可以…

armv8/armv9 MMU深度学习

目录 1、MMU概念介绍2、虚拟地址空间和物理地址空间2.1、(虚拟/物理)地址空间的范围2.2、物理地址空间有效位(范围)2.2.1、页表翻译相关寄存器的配置 3、Translation regimes4、地址翻译/几级页表&#xff1f;4.1、思考&#xff1a;页表到底有几级&#xff1f;4.2、以4KB granu…

【数据通信】数据通信基础知识---信号

1. 信息、数据、信号 信息是人们通过施加于数据的一些规定而赋予数据的特定含义&#xff08;ISO定义&#xff09;通信就是在信源和信宿之间传递信息。 信息和消息的关系&#xff1a;消息中包含信息&#xff0c;消息不等于信息。 消息所包含信息的多少&#xff0c;与在收到消息…

前端框架的发展历程

文章目录 前言 一、静态页面时代 二、JavaScript的兴起 三、jQuery的出现 四、前端框架的崛起 1.AngularJS 2.React 3.Vue.js 五、面向组件化的发展趋势 总结 前言 前端框架的发展史就是一个不断进化的过程&#xff0c;它的发展和进化一定程度…

你还可以通过“nrm”工具,来自由管理“npm”的镜像

你还可以通过“nrm”工具&#xff0c;来自由管理“npm”的镜像 nrm&#xff08;npm registry manager&#xff09;是npm的镜像管理工具&#xff0c;有时候国外的资源太慢&#xff0c;使用这个就可以快速地在npm源间切换。 1.安装nrm 在命令行执行命令&#xff0c;npm install…

数字化转型导师坚鹏:科技金融政策、案例及数字化营销

科技金融政策、案例及数字化营销 课程背景&#xff1a; 很多银行存在以下问题&#xff1a; 不清楚科技金融有哪些利好政策&#xff1f; 不知道科技金融有哪些成功案例&#xff1f; 不知道科技金融如何数字化营销&#xff1f; 课程特色&#xff1a; 以案例的方式解读原…

Matlab|10节点潮流计算程序(通用性强)

主要内容 潮流计算程序matlab 牛拉法 采用matlab对10节点进行潮流计算&#xff0c;采用牛拉法&#xff0c;程序运行可靠&#xff0c;牛拉法实现通用性强&#xff0c;可替换参数形成其他节点系统的潮流计算程序。 下载链接

探索React中的类组件和函数组件

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

深入浅出计算机网络 day.1 概论① 信息时代的计算机网络

我想&#xff0c; 我不会暗下来的&#xff0c; 生命是周而复始的橙黄橘绿时 —— 24.3.9 内容概述 计算机网络的各类应用 计算机网络带来的负面问题 我国互联网发展情况 一、计算机网络的各类应用 1.信息浏览和发布 2.通信和交流 3.休闲和娱乐 4.资源共享…

数据库-第十一章 并发控制【期末复习|考研复习】

前言 总结整理不易&#xff0c;希望大家点赞收藏。 给大家整理了一下数据库系统概论中的重点概念&#xff0c;以供大家期末复习和考研复习的时候使用。 参考资料是王珊老师和萨师煊老师的数据库系统概论(第五版)。 数据库系统概论系列文章传送门&#xff1a; 第一章 绪论 第二/…

UE5.2 SmartObject使用实践

SmartObject是UE5新出的一项针对AI的功能&#xff0c;可为开发者提供如公园长椅、货摊等交互对象的统一外观封装&#xff0c;如UE的CitySample&#xff08;黑客帝国Demo&#xff09;中就运用到了SmartObject。 但SmartObject实践起来较为繁琐&#xff0c;主要依赖于AI及行为树…

LeetCode-1004. 最大连续1的个数 III

每日一题系列&#xff08;day 20&#xff09; 前言&#xff1a; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f308; &#x1f50…

ActiveRAG—主动学习

原文地址&#xff1a;ActiveRAG — Active Learning 2024 年 2 月 26 日 大型语言模型&#xff08;LLM&#xff09;的出现开创了对话式人工智能的新时代。这些模型可以生成非常类似人类的文本&#xff0c;并且比以往更好地进行对话。然而&#xff0c;他们仍然面临着仅仅依靠预先…