开源向量数据库介绍

在开源矢量数据库的世界里,有些名字因其性能、灵活性和健壮性而脱颖而出。

1. Milvus

Milvus 由 Zilliz 推出,是一款高度可定制的开源矢量数据库,在处理大规模数据方面大放异彩。由于其出色的可扩展性,当你需要处理大量数据时,它是一个极佳的选择。Milvus 使非结构化数据搜索更易于访问,无论部署环境如何,都能提供一致的用户体验。

2. Faiss

Faiss 由 Facebook 的人工智能研究团队开发,是另一个令人印象深刻的向量数据库,擅长高维向量搜索。它以高效和快速著称,是时间敏感型应用的最佳选择。Faiss 是一个用于对密集向量进行高效相似性搜索和聚类的库。它包含的算法可搜索任何大小的向量集,甚至可能无法放入 RAM 的向量集。它还包含用于评估和参数调整的支持代码。Faiss 是用 C++ 编写的,并为 Python/numpy 提供了完整的封装。一些最有用的算法是在 GPU 上实现的。

3. Annoy (Approximate Nearest Neighbors Oh Yeah)

Annoy 由 Spotify 创建,是一个轻量级但功能强大的数据库。它专为快速搜索大型数据集而设计,非常适合需要快速得到结果的应用程序。它是一个带有 Python 绑定的 C++ 库,用于搜索空间中与给定查询点相近的点。它还能创建基于文件的大型只读数据结构,并将其映射到内存中,以便多个进程共享相同的数据。

‍4. Nmslib (Non-Metric Space Library)

Nmslib 是一个专门的开源矢量数据库,专注于非度量空间。对于那些需要更利基解决方案的独特项目来说,它是一个不错的选择。该项目的目标是为通用和非度量空间的搜索创建一个有效而全面的工具包。尽管该库包含各种度量空间访问方法,但其主要重点是通用和近似搜索方法,尤其是非度量空间的方法。NMSLIB 可能是第一个原则性支持非度量空间搜索的库。

5. Qdrant

Qdrant(读作:象限)是一种矢量相似性搜索引擎和矢量数据库。它提供了一种生产就绪的服务,具有方便的 API,可用于存储、搜索和管理带有附加有效载荷的点矢量Qdrant 专为扩展过滤支持而定制。Qdrant 是为扩展过滤支持而定制的,因此适用于各种基于神经网络或语义的匹配、分面搜索和其他应用。

Qdrant 由 Rust 编写,因此即使在高负载情况下也能快速可靠地运行。查看基准测试。

6. Chroma

Chroma 是开源嵌入式数据库。Chroma 使知识、事实和技能可插入 LLM,从而轻松构建 LLM 应用程序。Chroma 设计得足够简单,可以快速上手,也足够灵活,可以满足多种用例。您可以使用自己的嵌入模型,用自己的嵌入来查询 Chroma,并对元数据进行过滤。

7. LanceDB

LanceDB 是一个用于向量搜索的开源数据库,采用持久存储,大大简化了嵌入的检索、过滤和管理。LanceDB 的核心是用 Rust 编写的,使用 Lance 构建,Lance 是一种开源列式格式,专为高性能 ML 工作负载而设计。LanceDB API 可与不断发展的 Python 和 Javascript 生态系统无缝协作。使用 DataFrames 操作数据,使用 Pydantic 构建模型,使用 LanceDB 存储和查询。

8. Vectra

Vectra 是一个适用于 Node.js 的本地矢量数据库,功能类似于 Pinecone 或 Qdrant,但使用本地文件构建。每个 Vectra 索引都是磁盘上的一个文件夹。文件夹中有一个 index.json 文件,其中包含该索引的所有矢量以及任何索引元数据。 创建索引时,您可以指定要索引的元数据属性,只有这些字段会存储在 index.json 文件中。项目的所有其他元数据都将存储在磁盘上的一个单独文件中,该文件的关键字为 GUID。

请记住,您的整个 Vectra 索引都会加载到内存中,因此它不太适合长期聊天机器人记忆等场景。为此,请使用真正的矢量数据库。

9. Vespa

Vespa 是一个开源平台,适用于需要对大型结构化、文本和矢量数据进行低延迟计算的应用程序。Vespa.ai 可用于在任何规模下利用大数据实时做出人工智能驱动的决策,并具有无与伦比的性能。

企业使用 vespa.ai 解决结构化、文本和矢量搜索以及实时推荐、个性化和目标定位等问题。该平台根据 Apache 2.0 许可开源,可从 vespa.ai 下载,或在 cloud.vespa.ai 作为无服务器托管服务使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/448186.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python对头发二维建模(考虑风力、重力)

目录 一、背景 二、代码 一、背景 数值方法被用于创建电影、游戏或其他媒体中的计算机图形。例如,生成“逼真”的烟雾、水或爆炸等动画。本文内容是对头发的模拟,要求考虑重力、风力的影响。 假设: 1、人的头部是一个半径为10厘米的球体。…

python学习28

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…

llc的基波分析法

对于我们之前分析的 LLC等效谐振电路的分析,其实我们发现分析的并不是完整的方波输入,而是用正弦波来分的 那么为何用基波来分析呢,因为对于方波而言,根据傅里叶级数它是可以分解成基波、 1次、3次、5次.......等各种奇次谐波的入…

《ElementPlus 与 ElementUI 差异集合》el-input 和 el-button 属性 size 有变化

差异 element-ui el-input 和 el-button 中,属性size 值是 medium / small / minielement-plus el-input 和 el-button 中,属性size 值是 ‘large’ | ‘default’ | ‘small’; 如果你是自动升级,Vue3 系统会有如下警告“ el-b…

NLP深入学习:结合源码详解 BERT 模型(一)

文章目录 1. 前言2. BERT 关键流程2.1 整体流程2.2 Pre-training(预训练)2.2.1 Masked Language Model (MLM)2.2.2 Next Sentence Prediction (NSP) 2.3 Fine-tuning(微调) 3. 总结4. 参考 1. 前言 BERT(Bidirectiona…

访问一次网站的全过程

目录 流程图: 一、应用层开始 1. 在浏览器输入https://www.baidu.com 2. DNS获取IP地址 3. 根据HTTP协议生成HTTP请求报文 应用层结束 二、传输层开始 4. TCP三次握手 传输层结束 三、网络层开始 5. IP寻址 6. ARP协议获取MAC地址 网络层结束 四、数据…

Linux中三次握手,四次挥手状态图,端口复用 半关闭状态,心跳包

tcp三次握手和四次挥手状态图: 为什么需要2MSL: 原因1:让四次挥手过程更加可靠,确保最后一个发送给对方的ACK到达;若对方没有收到ACK应答,对方会再次发送FIN请求关闭,此时在2MSL时间内被动关闭…

实际应用中运放里多余的引脚怎么处理?

实际应用中运放里多余的引脚怎么处理?-电子发烧友网 (elecfans.com)

Python实现图片(合并)转PDF

在日常的工作和学习过程当中,我相信很多人遇到过这样一个很普通的需求,就是将某一个图片转为PDF或者是将多个图片合并到一个PDF文件。但是,在苦苦搜寻一圈之后发现要么要下载软件,下载了还要注册,注册了还要VIP,甚至SVIP才能实现这样的需求! 今天,我带大家把这个功能打…

SSM整合项目(使用Vue3 + Element-Plus创建项目基础页面)

1.配置Vue启动端口 1.修改vue.config.js const {defineConfig} require(vue/cli-service) module.exports defineConfig({transpileDependencies: true }) module.exports {devServer: {port: 9999 //启动端口} }2.启动 2.安装Element Plus 命令行输入 npm install eleme…

css相邻元素边框重合问题,解决方案

1、如下图所示&#xff0c;在给元素设置边框后&#xff0c;相邻元素会出现重合的问题 2、解决方案 给每个元素设置margin-top以及margin-left为负的边框 <div style"width: 300px;display: flex;flex-wrap: wrap;margin-top: 50px;"><div style"border…

Python——读写属性

采用读写属性的目的就是把录入的数据控制在合理区间。 如&#xff1a;学生的年龄&#xff08;age&#xff09;&#xff0c;学生的身高&#xff08;height&#xff09;... 方法一&#xff1a;利用实例方法来控制 class Student:def __init__(self,name"",age0):self.…

docker离线搭建仓库

要在Docker中搭建本地仓库&#xff0c;可以按照以下步骤进行操作&#xff1a; 首先安装 Docker。根据不同的操作系统选择合适的版本并完成安装过程。打开命令行工具&#xff08;如Terminal或PowerShell&#xff09;&#xff0c;运行以下命令来创建一个新的容器并将其设置为本地…

基于yolov7与arduino的眼睛跟随模块

基于yolov7与arduino的眼睛跟随模块 整个模块的介绍摄像模块图片传输模块图像检测模块控制模块动力模块 整个模块的介绍 我们首先需要一个图片收集的模块来对当前的图片进行收集然后将图片传至服务端对图片中的眼睛利用YOLO进行检测最后将数据传至arduino使其控制动力模块来进…

物奇平台超距断连无蓝牙广播问题解决方法

是否需要申请加入数字音频系统研究开发交流答疑群(课题组)?可加我微信hezkz17, 本群提供音频技术答疑服务,+群赠送语音信号处理降噪算法,蓝牙耳机音频,DSP音频项目核心开发资料, 物奇平台超距断连无蓝牙广播问题解决方法 一 问题反馈 二解决方法: 1 运行流程分析 对应代…

【RabbitMQ】RabbitMQ的交换机

交换机类型 在上文中&#xff0c;都没有交换机&#xff0c;生产者直接发送消息到队列。而一旦引入交换机&#xff0c;消息发送的模式会有很大变化&#xff1a;可以看到&#xff0c;在订阅模型中&#xff0c;多了一个exchange角色&#xff0c;而且过程略有变化&#xff1a; Pub…

数据结构与算法第三套试卷小题

1.删除链表节点 **分析&#xff1a;**首先用指针变量q指向结点A的后继结点B&#xff0c;然后将结点B的值复制到结点A中&#xff0c;最后删除结点B。 2.时间复杂度的计算 **分析&#xff1a;**当涉及嵌套循环的时候&#xff0c;我们可以直接分析内层循环即可&#xff0c;看内…

小白优化Oracle的利器”sqltrpt.sql”脚本

SQL调优顾问是Oracle自带的一个功能强大的内部诊断工具&#xff0c;用于对性能不佳的SQL语句给出优化建议。但如果从命令行调用它比较麻烦&#xff0c;幸运的是&#xff0c;Oracle提供了一个方便的内置脚本“sqltrpt.sql”&#xff0c;简化了调用过程。 sqltrpt.sql脚本位于Or…

实践:qemu 运行 linux riscv with AIA(APLICIMSIC)

RISCV架构 Linux AIA支持 目标&#xff1a;在 Qemu 中运行一个支持 riscv aia 的 linux 翻译参考自&#xff1a;https://lwn.net/Articles/963231/ 文章日期&#xff1a;2024年2月22日&#xff0c;星期四&#xff08;截至2024年3月&#xff0c;最新&#xff09; 这个网站里在不…

EasyExcel导出自定义表格

谈到新技术&#xff0c;每个人都会有点恐惧&#xff0c;怕处理不好。确实&#xff0c;第一次使用新技术会遇到很多坑&#xff0c;这次使用 EasyExcel 这个新技术去做 excel 导出&#xff0c;还要给表格加样式&#xff0c;遇到不同的版本问题&#xff0c;遇到颜色加错了地方&…