LlamaIndex介绍

LlamaIndex

LangChain v0.2

教程分成以下部分:

1、入门

2、学习

3、用例

4、示例

5、高级

6、组件指南

RAG

用额外的信息来提高回答的质量。

在这里插入图片描述

分为 5个阶段:

(1)loading 加载原始文件,LlamaHub 提供数百种连接器可供选择

  • node 节点和 document 文档:document 指的是 数据源的容器,比如PDF、API等;node 指的是 Llamaindex 中数据的原子单元,表示 document 的“块”。节点具有元数据(将它们与所在的文档以及其他节点相关联)
  • connectors 连接器:connectors 或叫 Reader 作用是 将来自不同数据源和数据格式的 数据提取到 documents 和 nodes中

(2)Indexing 创建允许查询数据的数据结构,即 vector embeddings,以便找到query的相关数据、即上下文

  • Indexes 索引:Indexes 一旦您导入了数据,LlamaIndex将帮助您将数据索引到易于检索的结构中。这通常涉及生成 vector embeddings,这些嵌入存储在称为 vector store 的专用数据库中。索引还可以存储有关数据的各种元数据。

  • Embeddings:数据的数字表示。LlamaIndex会将查询转化为嵌入表示,而您的向量存储将找到与查询嵌入数值上相似的数据。

(3)storing 存储索引或其他元数据

(4)querying 查询,包括子查询、多步查询和混合策略

  • Retrievers 检索器: 检索器定义了如何在给定查询时高效地从索引中检索相关上下文。检索策略是检索到的数据相关性及其执行效率的关键
  • Routers 路由器路由器决定使用哪个检索器从知识库中检索相关上下文。更具体地说,RouterRetriever类负责选择一个或多个候选检索器来执行查询。它们使用选择器基于每个候选者的元数据和查询来选择最佳选项
  • Node Postprocessors 节点后处理器:node postprocessor 接收一组检索到的节点,并对它们 applies transformations 应用转换、filtering 过滤或 re-ranking 重新排序的逻辑
  • Response Synthesizers 响应合成器:Response Synthesizers 利用用户查询和一组给定的检索到的文本块,从LLM生成响应

(5)evaluation 评估,客观衡量回复的准确性 accurate、忠实度 faithful和速度 fast。

RAG的应用

(1)Query Engines

它接受自然语言查询,并返回响应以及检索到的引用上下文并传递给 LLM。

(2)Chat Engines

用于与数据进行对话(多次来回而不是单个问答)

(3)Agents

代理是一个自动化决策者,由 LLM 提供支持,通过一组工具与世界进行交互。

代理可以采取任意数量的步骤来完成给定的任务,动态地决定最佳的行动方案,而不是遵循预先确定的步骤。这赋予它额外的灵活性来处理更复杂的任务。

LLamaIndex和Langchain的区别

LlamaIndex和LangChain是构建LLM应用程序的两个框架。

LlamaIndex专注于RAG用例,LangChain得到了更广泛的应用、提供了一些上线工具 LangServe、LangSmith。

如果是和RAG相关的用例,LlamaIndex会方便很多,可以说是首选。

但是如果应用需要一些非RAG的功能,可能LangChain是一个更好的选择。

通过4个任务比较LangChain和LlamaIndex

大模型应用框架LangChain与LlamaIndex:谁更胜一筹

LlamaIndex的抽象程度更高、LangChain更适合定制化程度更高的场景

LlamaIndex的帮助文档更具有可读性、LangChain的帮助文档更极客

截止到 20240604

langchain 86.5k star

llama_index 32.3k star

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/678551.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

借助调试工具理解BLE协议_1.蓝牙简介和BLE工作流程

1.蓝牙简介 蓝牙是一种近距离无线通信技术,运行在2.4GHz免费频段,目前已大量应用于各种移动终端,物联网,健康医疗,智能家居等行业。蓝牙4.0以后的版本分为两种模式,单模蓝牙和双模蓝牙。 单模蓝牙&#xf…

聊聊测试的右移

这是鼎叔的第九十九篇原创文章。行业大牛和刚毕业的小白,都可以进来聊聊。 欢迎关注本公众号《敏捷测试转型》,星标收藏,大量原创思考文章陆续推出。本人新书《无测试组织-测试团队的敏捷转型》已出版(机械工业出版社&#xff09…

体育赛事直播系统开发源码搭建

随着体育产业的蓬勃发展,体育赛事直播已成为广大观众获取赛事信息的重要途径。为了满足观众日益增长的需求,开发一套专业的体育赛事直播系统成为当务之急。本文将围绕体育赛事直播系统开发源码搭建进行深入探讨,从技术选型、系统架构、安全防…

教你一绝招:如何快速提高学习成绩--这样学习,你离考取重点高中或名牌大学很近了

教你一绝招:如何快速提高学习成绩 这样学习,你离考取重点高中或名牌大学很近了 我本来是讲写作的,但回想起过去学习与考试情况,何不把自己的学习经验与绝技告诉如今苦学的孩子,让其尽快进步,早日实现自己的…

面试一个多月,我上岸了!

大家好,我是枫哥,🌟阿里云技术专家、📝资深面试官、🌹Java跳槽网课堂创始人。拥有多年一线研发经验,曾就职过科大讯飞、美团网、平安等公司。目前组建的团队,专注Java技术分享,一对一…

副业兼职不知道做什么,不如先试试这个,一天挣个百八十很简单

在市场上,总是不乏赚钱的机会和各式各样的挣钱项目。许多人往往认为,那些赚得盆满钵满的人纯粹是因为运气好、能力强、条件优越且智商高。然而,事实并非如此简单。 实际上,每一个项目或操作方法的背后,都有其独特的逻…

期刊的分类与级别

在学术界,期刊的分类与级别构成了一个评价学术成果和学者贡献的重要标准,同时也是学术出版与学术交流的基础。然而,对于初涉学者来说,理解期刊的分类与级别可能并不直观。本文旨在提供一个系统性的解释,并阐述为何期刊…

含有嘧啶的光活性阳离子共轭微孔聚合物通过“吸附杀死”抗菌策略促进感染伤口愈合

引用信息: 文 章:Photoactive cationic conjugated microporous polymers containing pyrimidine with an adsorption-killantibacterial strategy for infected wound healing. 期 刊:Chemical Engineering Journal(影响因子…

2024最全软件测试面试八股文(答案+文档+视频讲解)

Part1 1、你的测试职业发展是什么? 测试经验越多,测试能力越高。所以我的职业发展是需要时间积累的,一步步向着高级测试工程师奔去。而且我也有初步的职业规划,前3年积累测试经验,按如何做好测试工程师的要点去要求自…

Python语言在地球科学交叉领域中的技术应用

Python是功能强大、免费、开源,实现面向对象的编程语言,Python能够运行在Linux、Windows、Macintosh、AIX操作系统上及不同平台(x86和arm),Python简洁的语法和对动态输入的支持,再加上解释性语言的本质&…

【微信支付】获取微信开发信息(全网最详细!!!)

前言 1、申请商户号 申请流程与资料 详细申请步骤 申请开通接入微信支付步骤 2、申请微信小程序 申请小程序步骤 查看小程序AppID 3、微信支付普通商户与AppID账号关联 4、获取开发中需要的密钥和证书 4.1、申请证书 4.2、下载证书工具 4.3、证书工具—填写商户信息…

七大战略性新兴产业崭露头角:新能源电燃灶或将成为未来厨房新宠

近日,在国家发布的七大战略性新兴产业名单中,新能源产业赫然在列,作为其中的重要组成部分,华火新能源电燃灶凭借其独特的优势,正逐渐走进人们的视野,有望成为未来厨房的新宠。 华火新能源电燃灶作为清洁能源…

实验笔记之——DPVO(Deep Patch Visual Odometry)

本博文记录本文测试DPVO的过程,本博文仅供本人学习记录用~ 《Deep Patch Visual Odometry》 代码链接:GitHub - princeton-vl/DPVO: Deep Patch Visual Odometry 目录 配置过程 测试记录 参考资料 配置过程 首先下载代码以及创建conda环境 git clo…

吴恩达深度学习笔记:机器学习(ML)策略(1)(ML strategy(1))1.3-1.4

目录 第三门课 结构化机器学习项目(Structuring Machine Learning Projects)第一周 机器学习(ML)策略(1)(ML strategy(1))1.3 单一数字评估指标(S…

PDF编辑流程,另附5款好用的PDF编辑器

pdf作为一个用来定稿打印的格式,偏偏许多时候需要事后去编辑它。而它格式复杂、混乱,解码困难,再好的编辑器也难免乱码。这里就从目前的pdf编辑流程上给大家稍微科普下。 首先,PDF编辑软件读取需要编辑的PDF文件,解析PDF文件的内…

被踢指数高!这本8.8分双1区“毕业神刊”,2个月可录!虽备受国人喜爱,但需谨慎投稿!

【欧亚科睿学术】 近期,经查询,小编发现ELSEVIER旗下一本热门顶刊竟在JCAR官网上显示被踢指数高。 图片来源:JCAR KNOWLEDGE-BASED SYSTEMS(ISSN :0950-7051)是人工智能领域的一本国际性、跨学科期刊。目前,该期刊影响…

Qt实用技能-必看系列

注:所有qt项目不能放到含中文的目录中 如何将material库添加进项目 1.构建运行项目 2.切换到debug目录,复制.a文件 3.粘贴到新建的libs目录 4.新建include目录存放头文件,将原项目所有头文件一并复制粘贴到include。 5.将文件与我们的项目产生联系。在pro文件将编译依赖的…

Linux线程 -- 互斥锁 和 条件变量

在多线程编程中,互斥量(mutex)是用于保护共享资源的同步机制,确保在任一时刻只有一个线程能够访问共享资源。互斥量用于防止竞态条件(race conditions),确保数据一致性。 基本概念 互斥量&…

计网期末复习指南(六):应用层(DNS、FTP、URL、HTTP、SMTP、POP3)

前言:本系列文章旨在通过TCP/IP协议簇自下而上的梳理大致的知识点,从计算机网络体系结构出发到应用层,每一个协议层通过一篇文章进行总结,本系列正在持续更新中... 计网期末复习指南(一):计算…

图论:倍增求解最近公共祖先LCA

说明:CSDN和公众号文章同步发布,需要第一时间收到最新内容,请关注公众号【比特正传】。 最近公共祖先LCA是NOI大纲中指定的提高组的图论部分的知识点,难度系数为6,提高组考察难度为5~8。 引入 树是一种特殊的图&…