一睹:微软最新发布的LazyGraphRAG

微软近期推出了一项革新性的技术——LazyGraphRAG,这是一种启用图谱的检索增强生成(Retrieval Augmented Generation,RAG)技术,它以其卓越的效率和成本效益,彻底颠覆了传统观念中对“懒惰”的刻板印象。

位于雷德蒙德的微软研究团队宣称,这项最新的RAG技术在成本和质量上展现出了“与生俱来的可扩展性”,并在成本与质量的连续谱上呈现出“卓越的性能”。此外,它还成功降低了对整个数据集进行全局搜索的成本,同时提升了局部搜索的效率。

简而言之,LazyGraphRAG绝非徒有其名。

需要指出的是,GraphRAG是“Graphs”和RAG的合成词,它是一种通过文本提取、网络分析以及大型语言模型(LLM)的提示和总结,利用单一端到端系统深入理解基于文本的数据集的技术。更多详细信息,敬请访问微软官方网站(https://www.microsoft.com/en-us/research/project/graphrag/?ref=thestack.technology)。

图片

 

LazyGraphRAG融合了VectorRAG和GraphRAG的优势,并“同时克服了它们各自的局限性”。

在微软的官方声明中,他们强调了LazyGraphRAG的卓越性能:“LazyGraphRAG展现了其作为一个统一且灵活的查询系统的能力,它能够在本地至全局的查询范围内,显著超越多种专业化查询机制,而且避免了在初始阶段对大型语言模型(LLM)数据进行总结所带来的成本。”

“LazyGraphRAG以其闪电般的索引速度和微乎其微的成本,成为了一次性查询、探索性数据分析以及流数据应用的理想选择。此外,随着相关性测试预算的增长,它能够平稳地提升答案的质量,这使得LazyGraphRAG成为了评估检索增强生成(RAG)方法的宝贵工具。”

在对LazyGraphRAG的不同相关性测试预算水平与多种竞争方法的比较研究中,微软采用了以下参数:

  • 数据集:涵盖了5,590篇美联社新闻文章,这些文章的使用已获得相应许可。

  • 查询:设计了100个合成查询,其中包括50个本地查询和50个全局查询。

  • 指标:评估了全面性、多样性和增强性这三个关键指标,这些指标的评估是通过大型语言模型(LLM)对每一对答案进行直接比较来完成的。

  • 条件:研究包括了三种不同相关性测试预算设置下的LazyGraphRAG,以及来自GraphRAG和学术文献的八种其他竞争条件,具体条件详见下表。

条件描述
Z100_Lite使用相关性测试预算为100的LazyGraphRAG,并在所有步骤中使用低成本LLM模型
Z500使用相关性测试预算为500的LazyGraphRAG,使用低成本LLM进行相关性测试,以及更高级(成本更高)的LLM进行查询优化和映射/简化答案生成
Z1500使用相关性测试预算为1500的LazyGraphRAG,使用低成本LLM进行相关性测试,以及更高级(成本更高)的LLM进行查询优化和映射/简化答案生成
C1在社区级别1进行GraphRAG全局搜索
C2在社区级别2进行GraphRAG全局搜索
C3_Dynamic使用动态社区选择 在社区级别3进行GraphRAG全局搜索
LSGraphRAG本地搜索
DRIFTGraphRAG DRIFT搜索
SS_8K使用向量RAG进行语义搜索,检索8k个输入令牌
SS_64K使用向量RAG进行语义搜索,检索64k个输入令牌(包括为了检验长上下文窗口对向量RAG的影响)
RAPTOR一种基于层次聚类的RAG方法,与LazyGraphRAG共享一些相似特性

图片

 

如上图所示,展示了LazyGraphRAG在不同相关性测试预算(100、500、1,500)下,针对每种(本地、全局)查询组合以及(全面性、多样性、增强性)指标的竞争条件的获胜率的聚类条形图。

LazyGraphRAG在与八种竞争条件的对比中取得了显著的获胜率。在最低预算水平,即利用低成本LLM模型进行100个相关性测试(成本与SS_8K相当)时,LazyGraphRAG在本地和全局查询上均显著优于所有条件。当预算增加至500个相关性测试,采用更先进的LLM模型(相当于C2查询成本的4%)时,LazyGraphRAG在本地和全局查询上均显著优于所有条件。随着相关性测试预算增加至1,500,LazyGraphRAG的获胜率持续上升,充分展示了其在成本与质量之间的可扩展性。

向量RAG与图谱RAG:对比与分析

向量RAG,亦称为语义搜索,是一种以查询相似度为基准,挑选最佳匹配源文本片段的“最佳优先搜索”方法,微软对此进行了阐释。

“然而,它未能充分考虑全局查询中数据集的广泛性,”微软进一步指出。

“图谱RAG全局搜索则是一种广度优先搜索,它利用源文本实体的社区结构,确保在处理查询时能够覆盖整个数据集的广度,”研究人员阐述道。“但这种方法在处理局部查询时,并未考虑到最佳社区的选择。”

在回答涉及整个数据集的全局查询时,例如“主要主题是什么?”或“这些信息展示了X的哪些方面?”,第二种技术相较于传统的向量RAG更为有效。它在提供覆盖广泛内容的答案方面表现出色。

相较之下,向量RAG在处理局部查询时更为擅长,这类查询的答案通常与问题本身高度相似,微软指出,这在涉及“谁、什么、何时、何地”的问题中是“常见的”情况。这也是“最佳优先”这一术语的由来。

图片

展示了图谱RAG与LazyGraphRAG之间的差异

LazyGraphRAG的内涵与特性

LazyGraphRAG通过迭代深化的方式,融合了最佳优先和广度优先搜索的动态——即先在有限深度内进行搜索,随后逐步深入数据集。

微软强调,LazyGraphRAG的数据索引成本与向量RAG持平,仅为完整图谱RAG成本的0.1%。

“在相同的LazyGraphRAG配置下,其全局查询答案质量与图谱RAG全局搜索相当,但查询成本降低了700倍以上,”微软补充道。“对于图谱RAG全局搜索成本的4%,LazyGraphRAG在本地和全局查询上均显著超越了所有竞争方法。”

LazyGraphRAG为何被赋予“懒惰”之名?

微软对这一问题的回答如下:“相较于完整的GraphRAG全局搜索机制,LazyGraphRAG在推迟使用大型语言模型(LLMs)和显著提升答案生成效率方面表现出了‘懒惰’。其整体性能可以通过一个核心参数——相关性测试预算——以一致的方式平衡成本与质量。”

因此,这种勤奋的RAG之所以被冠以“懒惰”之名,是因为它优化了LLMs的使用,将它们的应用推迟到真正必要之时。它不会预先处理整个数据集,而是首先进行初步的相关性测试,通过分析较小的数据子集来识别可能相关的信息。

这些初步测试完成后,系统才会动用更为资源密集的LLMs进行深入分析。

这让人回想起比尔·盖茨在微软任职期间的一句名言,而非他现在所做的任何工作:“我倾向于选择一个懒惰的人来承担艰巨的任务。因为一个懒惰的人会寻找到完成任务的简便方法。”

参考:https://www.microsoft.com/en-us/research/blog/lazygraphrag-setting-a-new-standard-for-quality-and-cost/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/930144.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

linux_kernel_编程

内核报错信息查看 include/uapi/asm-generic/errno-base.h 设备树的读取操作 struct device_node *ncof_property_read_bool(nc, "spi-cpha")if (!of_node_name_eq(nc, "slave"))rc of_property_read_u32(nc, "reg", &…

arm64 UOS平台docker配置gitlab

arm64 UOS平台docker配置gitlab 加载或下载gitlab docker镜像配置 加载或下载gitlab docker镜像 docker load < gitlab.tar docker tag xxx gitlab_arm 配置 创建gitlab目录&#xff0c;在gitlab目录下创建etc log opt 目录创建启动文件start_gitlab.sh并增加执行权限 d…

【Homework】【8】Learning resources for DQ Robotics in MATLAB

作业任务 创建一个名为“VS050RobotDH”的类&#xff0c;该类代表Denso VS050机器人&#xff0c;其DH参数如下表所示&#xff0c;并且完全由旋转关节组成。&#xff08;请记住第6课的内容&#xff09; θ \theta θ d d d a a a α \alpha α − π -\pi −π0.3450 π 2 \fra…

Cannot resolve symbol ‘ActivityThread‘ | Android 语法

背景 ActivityThread 是 Android 系统内部使用的一个类,它位于 android.app 包中,但在 Android SDK 的公共 API 中并没有公开。 由于 ActivityThread 是隐藏的内部类,因此在编写单元测试或功能开发时,无法直接引用它。可以使用反射来访问内部 API,或者使用依赖注入的方式…

TSWIKI知识库软件

TSWIKI 知识库软件介绍 推荐一个适合本地化部署、自托管的知识库软件 TSWIKI介绍 tswiki 是一个适合小团队、个人的知识库、资料管理的软件&#xff0c;所有数据均本地化存储。可以本地化、私有云部署&#xff0c;安装简单。在线预览。 主要功能说明 1、简化的软件依赖和安…

Agent AI: Surveying the Horizons of Multimodal Interaction---医疗保健、视频音频、多模态

医疗保健领域 在医疗保健领域&#xff0c;大型语言模型&#xff08;LLMs&#xff09;和视觉语言模型&#xff08;VLMs&#xff09;可以作为诊断代理、患者护理助手&#xff0c;甚至是辅助治疗工具&#xff0c;但它们也伴随着独特的挑战和责任。AI代理在提高患者护理质量和拯救生…

Ajax:回忆与节点

一点回忆 面对我的Ajax学习&#xff0c;实现前后端交互&#xff0c;最开始我采用的使用网络寻找intellij IDEA Ultimate破解方法&#xff0c;然后最终成功&#xff0c;然后按照相关教程配置java ee项目&#xff0c;然后中间又去配置了Tomcat服务器&#xff0c;然后又去学习了一…

游戏引擎学习第35天

开场介绍 今天的任务是继续改进一个虚拟的瓦片地图系统&#xff0c;使其适合处理更大的世界。我们希望这个系统能管理大范围的游戏世界&#xff0c;其中包含按需存储的小区域。昨天&#xff0c;我们介绍了“内存区域”的概念&#xff0c;用于管理持久性存储。我们计划今天继续…

MySQL 死锁排查

现象 发生死锁&#xff0c;服务会出现如下报警&#xff0c; Deadlockfound when trying to get lock; try restarting transaction。 思路 出现类似问题&#xff0c;应先评估死锁对业务和数据的影响范围。如果有损&#xff0c;选择合适的止损方式&#xff0c;然后再去分析解…

2.linux中调度kettle

一.准备转换&#xff0c;等会在linux中用 1.添加excel输入组件&#xff0c;并添加对应的文件 2.添加列拆分为多行组件 3.添加文本文件输出组件 4.保存转换 二.linux安装java 1.把jdk-8u144-linux-x64.tar.gz上传到linux的/lx目录下 2. 解压jdk包&#xff0c;然后配置环境变量…

2025澄迈漓岛音乐节品牌招商大会成功举行

——共谋音乐盛事&#xff0c;携手推动文化经济发展 12月6日&#xff0c;“2025澄迈漓岛音乐节品牌招商大会”&#xff08;以下简称“招商大会”&#xff09;在澄迈举行。本次大会由澄迈福山发展有限公司、福山咖啡文化风情镇旅游区联合主办&#xff0c;海南绿发投资有限公司承…

华为关键词覆盖应用市场ASO优化覆盖技巧

在我国的消费者群体当中&#xff0c;华为的品牌形象较高&#xff0c;且产品质量过硬&#xff0c;因此用户基数也大。与此同时&#xff0c;随着影响力的增大&#xff0c;华为不断向外扩张&#xff0c;也逐渐成为了海外市场的香饽饽。作为开发者和运营者&#xff0c;我们要认识到…

【深度学习】手机SIM卡托缺陷检测【附链接】

一、手机SIM卡托用途 SIM卡托是用于固定和保护SIM卡的部件&#xff0c;通过连接SIM卡与手机主板的方式&#xff0c;允许设备访问移动网络&#xff0c;用户可以通过SIM卡进行通话、发送短信和使用数据服务。 二、手机SIM卡托不良影响 SIM卡接触不良&#xff0c;造成信号中断&…

Flask使用长连接

Flask使用flask_socketio实现websocket Python中的单例模式 在HTTP通信中&#xff0c;连接复用&#xff08;Connection Reuse&#xff09;是一个重要的概念&#xff0c;它允许客户端和服务器在同一个TCP连接上发送和接收多个HTTP请求/响应&#xff0c;而不是为每个新的请求/响…

APSYN140频率综合器/频率源模块的输出功率设置范围在实际应用中有什么优势?

APSYN140频率综合器模块的输出功率设置范围从-10dBm至20dBm。 APSYN140-X系列多通道相参频率合成器--四通道输出43.5GHz 在实际应用中具有以下优势&#xff1a; 1. 适应不同应用需求 宽广的输出功率范围从100kHz至40GHz&#xff08;9kHz至43.5GHz可设&#xff09;使得APSYN14…

NLP论文速读(斯坦福大学)|使用Tree将语法隐藏到Transformer语言模型中正则化

论文速读|Sneaking Syntax into Transformer Language Models with Tree Regularization 论文信息&#xff1a; 简介&#xff1a; 本文的背景是基于人类语言理解的组合性特征&#xff0c;即语言处理本质上是层次化的&#xff1a;语法规则将词级别的意义组合成更大的成分的意义&…

RISC-V架构下OP-TEE 安全系统实践

安全之安全(security)博客目录导读 本篇博客&#xff0c;我们聚焦RISC-V 2024中国峰会上的RISC-V和OP-TEE结合的一个安全系统实践&#xff0c;来自芯来科技桂兵老师。 关于RISC-V TEE(可信执行环境)的相关方案&#xff0c;如感兴趣可参考RISC-V TEE(可信执行环境)方案初探 首…

车载VR可视化解决方案

车载VR可视化解决方案是通过融合跟踪用户头部运动的特殊预测算法与惯性测量数据而开发的。该系统将大范围虚拟现实跟踪技术与IMU传感器相结合&#xff0c;为VR和AR应用打造了一套全面的运动跟踪与渲染流程&#xff0c;极大地方便了虚拟现实头显制造商定制可视化流程。 该车载VR…

Git常用的命令【提交与回退】

git分布式版本控制系统 &#xff08;SVN集中式版本控制系统&#xff09;之间的对比 git有本地仓库和远程仓库&#xff0c;不同的开发人员可以分别提交自己的本地仓库并维护代码的版本控制。 然后多个人员在本地仓库协作的代码&#xff0c;可以提交到远程仓库中做整合。 git本…