LlamaIndex介绍

LlamaIndex介绍

article2025/2/21 21:22:37/文章来源:https://blog.csdn.net/jinselizhi/article/details/139436948

LlamaIndex

LangChain v0.2

教程分成以下部分：

1、入门

2、学习

3、用例

4、示例

5、高级

6、组件指南

RAG

用额外的信息来提高回答的质量。

在这里插入图片描述

分为 5个阶段：

（1）loading 加载原始文件，LlamaHub 提供数百种连接器可供选择

node 节点和 document 文档：document 指的是数据源的容器，比如PDF、API等；node 指的是 Llamaindex 中数据的原子单元，表示 document 的“块”。节点具有元数据（将它们与所在的文档以及其他节点相关联）
connectors 连接器：connectors 或叫 Reader 作用是将来自不同数据源和数据格式的数据提取到 documents 和 nodes中

（2）Indexing 创建允许查询数据的数据结构，即 vector embeddings，以便找到query的相关数据、即上下文

Indexes 索引：Indexes 一旦您导入了数据，LlamaIndex将帮助您将数据索引到易于检索的结构中。这通常涉及生成 vector embeddings，这些嵌入存储在称为 vector store 的专用数据库中。索引还可以存储有关数据的各种元数据。
Embeddings：数据的数字表示。LlamaIndex会将查询转化为嵌入表示，而您的向量存储将找到与查询嵌入数值上相似的数据。

（3）storing 存储索引或其他元数据

（4）querying 查询，包括子查询、多步查询和混合策略

Retrievers 检索器：检索器定义了如何在给定查询时高效地从索引中检索相关上下文。检索策略是检索到的数据相关性及其执行效率的关键
Routers 路由器：路由器决定使用哪个检索器从知识库中检索相关上下文。更具体地说，RouterRetriever类负责选择一个或多个候选检索器来执行查询。它们使用选择器基于每个候选者的元数据和查询来选择最佳选项
Node Postprocessors 节点后处理器：node postprocessor 接收一组检索到的节点，并对它们 applies transformations 应用转换、filtering 过滤或 re-ranking 重新排序的逻辑
Response Synthesizers 响应合成器：Response Synthesizers 利用用户查询和一组给定的检索到的文本块，从LLM生成响应

（5）evaluation 评估，客观衡量回复的准确性 accurate、忠实度 faithful和速度 fast。

RAG的应用

（1）Query Engines

它接受自然语言查询，并返回响应以及检索到的引用上下文并传递给 LLM。

（2）Chat Engines

用于与数据进行对话（多次来回而不是单个问答）

（3）Agents

代理是一个自动化决策者，由 LLM 提供支持，通过一组工具与世界进行交互。

代理可以采取任意数量的步骤来完成给定的任务，动态地决定最佳的行动方案，而不是遵循预先确定的步骤。这赋予它额外的灵活性来处理更复杂的任务。

LLamaIndex和Langchain的区别

LlamaIndex和LangChain是构建LLM应用程序的两个框架。

LlamaIndex专注于RAG用例，LangChain得到了更广泛的应用、提供了一些上线工具 LangServe、LangSmith。

如果是和RAG相关的用例，LlamaIndex会方便很多，可以说是首选。

但是如果应用需要一些非RAG的功能，可能LangChain是一个更好的选择。

通过4个任务比较LangChain和LlamaIndex

大模型应用框架LangChain与LlamaIndex：谁更胜一筹

LlamaIndex的抽象程度更高、LangChain更适合定制化程度更高的场景

LlamaIndex的帮助文档更具有可读性、LangChain的帮助文档更极客

截止到 20240604

langchain 86.5k star

llama_index 32.3k star

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/678551.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

借助调试工具理解BLE协议_1.蓝牙简介和BLE工作流程

借助调试工具理解BLE协议_1.蓝牙简介和BLE工作流程

1.蓝牙简介蓝牙是一种近距离无线通信技术，运行在2.4GHz免费频段，目前已大量应用于各种移动终端，物联网，健康医疗，智能家居等行业。蓝牙4.0以后的版本分为两种模式，单模蓝牙和双模蓝牙。单模蓝牙&#xf…

阅读更多...

聊聊测试的右移

聊聊测试的右移

这是鼎叔的第九十九篇原创文章。行业大牛和刚毕业的小白，都可以进来聊聊。欢迎关注本公众号《敏捷测试转型》，星标收藏，大量原创思考文章陆续推出。本人新书《无测试组织-测试团队的敏捷转型》已出版（机械工业出版社&#xff09…

阅读更多...

体育赛事直播系统开发源码搭建

体育赛事直播系统开发源码搭建

随着体育产业的蓬勃发展，体育赛事直播已成为广大观众获取赛事信息的重要途径。为了满足观众日益增长的需求，开发一套专业的体育赛事直播系统成为当务之急。本文将围绕体育赛事直播系统开发源码搭建进行深入探讨，从技术选型、系统架构、安全防…

阅读更多...

教你一绝招：如何快速提高学习成绩--这样学习，你离考取重点高中或名牌大学很近了

教你一绝招：如何快速提高学习成绩--这样学习，你离考取重点高中或名牌大学很近了

教你一绝招：如何快速提高学习成绩这样学习，你离考取重点高中或名牌大学很近了我本来是讲写作的，但回想起过去学习与考试情况，何不把自己的学习经验与绝技告诉如今苦学的孩子，让其尽快进步，早日实现自己的…

阅读更多...

面试一个多月，我上岸了！

面试一个多月，我上岸了！

大家好，我是枫哥，🌟阿里云技术专家、📝资深面试官、🌹Java跳槽网课堂创始人。拥有多年一线研发经验，曾就职过科大讯飞、美团网、平安等公司。目前组建的团队，专注Java技术分享，一对一…

阅读更多...

副业兼职不知道做什么，不如先试试这个，一天挣个百八十很简单

副业兼职不知道做什么，不如先试试这个，一天挣个百八十很简单

在市场上，总是不乏赚钱的机会和各式各样的挣钱项目。许多人往往认为，那些赚得盆满钵满的人纯粹是因为运气好、能力强、条件优越且智商高。然而，事实并非如此简单。实际上，每一个项目或操作方法的背后，都有其独特的逻…

阅读更多...

期刊的分类与级别

期刊的分类与级别

在学术界，期刊的分类与级别构成了一个评价学术成果和学者贡献的重要标准，同时也是学术出版与学术交流的基础。然而，对于初涉学者来说，理解期刊的分类与级别可能并不直观。本文旨在提供一个系统性的解释，并阐述为何期刊…

阅读更多...

含有嘧啶的光活性阳离子共轭微孔聚合物通过“吸附杀死”抗菌策略促进感染伤口愈合

含有嘧啶的光活性阳离子共轭微孔聚合物通过“吸附杀死”抗菌策略促进感染伤口愈合

引用信息： 文章：Photoactive cationic conjugated microporous polymers containing pyrimidine with an adsorption-killantibacterial strategy for infected wound healing. 期刊：Chemical Engineering Journal（影响因子…

阅读更多...

2024最全软件测试面试八股文（答案+文档+视频讲解）

2024最全软件测试面试八股文（答案+文档+视频讲解）

Part1 1、你的测试职业发展是什么？ 测试经验越多，测试能力越高。所以我的职业发展是需要时间积累的，一步步向着高级测试工程师奔去。而且我也有初步的职业规划，前3年积累测试经验，按如何做好测试工程师的要点去要求自…

阅读更多...

Python语言在地球科学交叉领域中的技术应用

Python是功能强大、免费、开源，实现面向对象的编程语言，Python能够运行在Linux、Windows、Macintosh、AIX操作系统上及不同平台（x86和arm），Python简洁的语法和对动态输入的支持，再加上解释性语言的本质&…

阅读更多...

【微信支付】获取微信开发信息（全网最详细！！！）

【微信支付】获取微信开发信息（全网最详细！！！）

前言 1、申请商户号申请流程与资料详细申请步骤申请开通接入微信支付步骤 2、申请微信小程序申请小程序步骤查看小程序AppID 3、微信支付普通商户与AppID账号关联 4、获取开发中需要的密钥和证书 4.1、申请证书 4.2、下载证书工具 4.3、证书工具—填写商户信息…

阅读更多...

七大战略性新兴产业崭露头角：新能源电燃灶或将成为未来厨房新宠

七大战略性新兴产业崭露头角：新能源电燃灶或将成为未来厨房新宠

近日，在国家发布的七大战略性新兴产业名单中，新能源产业赫然在列，作为其中的重要组成部分，华火新能源电燃灶凭借其独特的优势，正逐渐走进人们的视野，有望成为未来厨房的新宠。华火新能源电燃灶作为清洁能源…

阅读更多...

实验笔记之——DPVO（Deep Patch Visual Odometry）

本博文记录本文测试DPVO的过程，本博文仅供本人学习记录用~ 《Deep Patch Visual Odometry》代码链接：GitHub - princeton-vl/DPVO: Deep Patch Visual Odometry 目录配置过程测试记录参考资料配置过程首先下载代码以及创建conda环境 git clo…

阅读更多...

吴恩达深度学习笔记：机器学习（ML）策略（1）（ML strategy（1））1.3-1.4

吴恩达深度学习笔记：机器学习（ML）策略（1）（ML strategy（1））1.3-1.4

目录第三门课结构化机器学习项目（Structuring Machine Learning Projects）第一周机器学习（ML）策略（1）（ML strategy（1））1.3 单一数字评估指标（S…

阅读更多...

PDF编辑流程，另附5款好用的PDF编辑器

PDF编辑流程，另附5款好用的PDF编辑器

pdf作为一个用来定稿打印的格式，偏偏许多时候需要事后去编辑它。而它格式复杂、混乱，解码困难，再好的编辑器也难免乱码。这里就从目前的pdf编辑流程上给大家稍微科普下。首先,PDF编辑软件读取需要编辑的PDF文件，解析PDF文件的内…

阅读更多...

被踢指数高！这本8.8分双1区“毕业神刊”，2个月可录！虽备受国人喜爱，但需谨慎投稿！

被踢指数高！这本8.8分双1区“毕业神刊”，2个月可录！虽备受国人喜爱，但需谨慎投稿！

【欧亚科睿学术】近期，经查询，小编发现ELSEVIER旗下一本热门顶刊竟在JCAR官网上显示被踢指数高。图片来源：JCAR KNOWLEDGE-BASED SYSTEMS(ISSN ：0950-7051)是人工智能领域的一本国际性、跨学科期刊。目前，该期刊影响…

阅读更多...

Qt实用技能-必看系列

Qt实用技能-必看系列

注：所有qt项目不能放到含中文的目录中如何将material库添加进项目 1.构建运行项目 2.切换到debug目录，复制.a文件 3.粘贴到新建的libs目录 4.新建include目录存放头文件，将原项目所有头文件一并复制粘贴到include。 5.将文件与我们的项目产生联系。在pro文件将编译依赖的…

阅读更多...

Linux线程 -- 互斥锁和条件变量

Linux线程 -- 互斥锁和条件变量

在多线程编程中，互斥量（mutex）是用于保护共享资源的同步机制，确保在任一时刻只有一个线程能够访问共享资源。互斥量用于防止竞态条件（race conditions），确保数据一致性。基本概念互斥量&…

阅读更多...

计网期末复习指南（六）：应用层（DNS、FTP、URL、HTTP、SMTP、POP3）

计网期末复习指南（六）：应用层（DNS、FTP、URL、HTTP、SMTP、POP3）

前言：本系列文章旨在通过TCP/IP协议簇自下而上的梳理大致的知识点，从计算机网络体系结构出发到应用层，每一个协议层通过一篇文章进行总结，本系列正在持续更新中... 计网期末复习指南（一）：计算…

阅读更多...

图论：倍增求解最近公共祖先LCA

图论：倍增求解最近公共祖先LCA

说明：CSDN和公众号文章同步发布，需要第一时间收到最新内容，请关注公众号【比特正传】。最近公共祖先LCA是NOI大纲中指定的提高组的图论部分的知识点，难度系数为6，提高组考察难度为5~8。引入树是一种特殊的图&…

阅读更多...

最新文章