Elasticsearch:向量数据库基础设施类别的兴衰

过去几年,我一直在观察嵌入技术如何从大型科技公司的 “秘密武器” 转变为日常开发人员工具。接下来发生的事情 —— 向量数据库淘金热、RAG 炒作周期以及最终的修正 —— 教会了我们关于新技术如何在更广泛的生态系统中找到一席之地的宝贵经验。

更多有关向量搜索及结合传统搜索的混合搜索,请详细阅读 “Elastic AI 专栏”。

嵌入成为主流

曾经是科技巨头的领域,现在正成为各地开发人员的标准做法。十多年来,谷歌、Meta 和亚马逊等公司一直使用嵌入技术来大规模支持推荐系统和搜索功能。现在,开发人员可以通过预先训练的模型和改进的工具使用这些技术。

通过深度学习,我们可以将几乎任何类型的内容(文本、图像、视频、音频、代码)转换为向量表示,以捕获数据中的模式和关系。虽然这些技术在表示学习研究中有着深厚的根基,但如今革命性的是它们的可访问性。强大的预训练模型和直观的 API 将曾经复杂的研究转变为日常开发人员的实用工具。

这些嵌入使开发人员能够构建以前仅限于拥有大量研发预算的科技巨头的功能。嵌入生态系统在多个方面蓬勃发展。OpenAI、Cohere、Jina 和 Voyager 等商业提供商提供高质量的托管模型(主要是文本),而开源社区则提供了强大的替代方案,如 Sentence Transformers。HuggingFace 已成为共享和发现这些模型的事实平台,拥有数千种适用于不同语言、模态、领域和任务的嵌入模型。他们的转换器库和模型中心使尝试不同的嵌入方法变得轻而易举。

结果如何?曾经是大型科技公司高级 ML 团队专属领域的方法现在正被集成到日常应用程序中。无论是使用商业 API 还是开源模型,开发人员都可以选择最适合其成本、定制和部署要求的方法。以前难以有效搜索的内容(视频、播客记录、技术图表、科学论文)现在可以以更复杂(更有效)的检索系统的方式来呈现。

向量数据库的兴衰

基于嵌入的应用程序的激增带来了新的挑战:高效地大规模存储、索引和搜索这些高维向量。这一差距催生了向量数据库类别,Pinecone 等公司在 2022-2023 年通过定义向量操作的专用基础设施引领潮流。在 2022 年底 ChatGPT 推出后,该类别出现了爆炸式增长,因为开发人员纷纷使用检索增强生成 (Retrieval-Augmented Generation - RAG) 构建 AI 应用程序。这种激增的部分原因是人们普遍误以为基于嵌入的相似性搜索是检索 LLMs 上下文的唯一可行方法。由此产生的 “向量数据库淘金热” 吸引了大量投资和关注向量搜索基础设施,尽管传统信息检索技术对许多 RAG 应用程序同样有价值。

然而,形势迅速发展。最初是纯向量搜索引擎,现在扩展了其功能以匹配传统搜索功能。向量数据库提供商已经认识到,现实世界的应用程序通常需要的不仅仅是相似性搜索。他们越来越多地添加过滤、分面和文本搜索等功能,这些功能以前是传统搜索引擎的领域。

这种融合反映了一种更深刻的理解,即单靠向量搜索不足以满足实际的现实用例。没有比 Elasticsearch 的发展更好地说明这种融合的例子了。作为搜索市场的领导者,Elastic 认识到了基于嵌入的搜索的潜力,并开始整合这些功能。2024 年,他们将 Elasticsearch 重新定位为 “具有完全集成向量数据库的搜索引擎”,承认现代搜索应用程序需要传统的基于文本和向量的操作。这种转变不仅仅是营销 —— Elasticsearch 通过优化索引结构增强了其向量搜索实现,并增加了对高效近似最近邻 (ANN) 搜索算法的支持。通过将向量搜索功能直接引入其搜索平台,Elastic 证明了搜索的未来在于将相关性评分和文本分析等传统搜索功能与嵌入相结合的统一解决方案。他们的方法验证了业内许多人已经开始认识到的事情:向量搜索不是一个单独的类别,而是现代搜索工具包中的一项基本功能。

与此同时,老牌数据库供应商几乎毫不掩饰地看着这场淘金热。许多供应商没有将向量搜索视为一个单独的类别,而是耸耸肩,将向量功能直接集成到现有产品中。PostgreSQL、MongoDB、Redis 和其他供应商都增加了对向量数据类型和相似性搜索操作的原生支持 —— 将其视为添加新索引类型的兴奋之情。从他们的角度来看,向量只是索引和查询的另一种数据类型,类似于文本、数字或地理空间坐标。这种集成简化了许多应用程序的架构,允许开发人员在熟悉的系统中管理向量操作以及传统数据工作负载,而无需说服他们的 CTO 采用另一个专门的数据库。

然而,将向量类型添加到现有数据库并不是看起来那么简单。存储和检索向量是一回事,构建复杂的检索系统是另一回事。许多这样的数据库缺乏完善的排名机制、相关性调整和久经考验的文本匹配算法(如 BM25),而专用搜索引擎花了几十年的时间来完善这些算法。这就是为什么那些关心搜索质量的公司仍然会转向专用搜索引擎,而不是将他们的数据库视为一刀切的解决方案。现实情况是,高质量的信息检索需要一套深层次的排名策略和相关性优化功能,而不仅仅是简单的向量相似度计算。正如没有一个关心搜索质量的人会使用常规数据库来支持他们的电子商务搜索一样,添加向量功能并不能突然将 SQL 数据库转变为一个完整的检索引擎。

结论

回顾过去,很明显我们把事情复杂化了。虽然嵌入从根本上改变了我们表示和比较内容的方式,但它们不需要一个全新的基础设施类别。我们称之为 “向量数据库” 的东西实际上是具有向量功能的搜索引擎。市场已经在纠正这种分类 —— 向量搜索提供商迅速添加传统搜索功能,而成熟的搜索引擎则整合了向量搜索功能。这种类别融合并不奇怪:构建一个好的检索引擎一直是关于结合多种检索和排名策略。向量搜索只是该工具箱中的另一个强大工具,而不是一个独立的类别。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/952728.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【华为云开发者学堂】基于华为云 CodeArts CCE 开发微服务电商平台

实验目的 通过完成本实验,在 CodeArts 平台完成基于微服务的应用开发,构建和部署。 ● 理解微服务应用架构和微服务模块组件 ● 掌握 CCE 平台创建基于公共镜像的应用的操作 ● 掌握 CodeArts 平台编译构建微服务应用的操作 ● 掌握 CodeArts 平台部署微…

计科高可用服务器架构实训(防火墙、双机热备,VRRP、MSTP、DHCP、OSPF)

一、项目介绍 需求分析: (1)总部和分部要求网络拓扑简单,方便维护,网络有扩展和冗余性; (2)总部分财务部,人事部,工程部,技术部,提供…

【C++入门】详解合集

目录 💕1.C中main函数内部———变量的访问顺序 💕2.命名空间域 namespace 💕3.命名空间域(代码示例)(不要跳) 💕4.多个命名空间域的内部重名 💕5.命名空间域的展开 …

预编译SQL

预编译SQL 预编译SQL是指在数据库应用程序中,SQL语句在执行之前已经通过某种机制(如预编译器)进行了解析、优化和准备,使得实际执行时可以直接使用优化后的执行计划,而不需要每次都重新解析和编译。这么说可能有一些抽…

qemu搭建虚拟的aarch64环境开发ebpf

一、背景 需求在嵌入式环境下进行交叉编译,学习ebpf相关技术,所以想搭建一个不依赖硬件环境的学习环境。 本文使用的环境版本: 宿主机: Ubuntu24.02 libbpf-bootstrap源码: https://github.com/libbpf/libbpf-boots…

深度学习从入门到实战——卷积神经网络原理解析及其应用

卷积神经网络CNN 卷积神经网络前言卷积神经网络卷积的填充方式卷积原理展示卷积计算量公式卷积核输出的大小计算感受野池化自适应均值化空洞卷积经典卷积神经网络参考 卷积神经网络 前言 为什么要使用卷积神经网络呢? 首先传统的MLP的有什么问题呢? - …

2015年西部数学奥林匹克几何试题

2015/G1 圆 ω 1 \omega_1 ω1​ 与圆 ω 2 \omega_2 ω2​ 内切于点 T T T. M M M, N N N 是圆 ω 1 \omega_1 ω1​ 上不同于 T T T 的不同两点. 圆 ω 2 \omega_2 ω2​ 的两条弦 A B AB AB, C D CD CD 分别过 M M M, N N N. 证明: 若线段 A C AC AC, B D BD …

《Spring Framework实战》14:4.1.4.5.自动装配合作者

欢迎观看《Spring Framework实战》视频教程 自动装配合作者 Spring容器可以自动连接协作bean之间的关系。您可以通过检查ApplicationContext的内容,让Spring自动为您的bean解析协作者(其他bean)。自动装配具有以下优点: 自动装配…

JVM之垃圾回收器概述(续)的详细解析

ParNew(并行) Par 是 Parallel 并行的缩写,New 是只能处理的是新生代 并行垃圾收集器在串行垃圾收集器的基础之上做了改进,采用复制算法,将单线程改为了多线程进行垃圾回收,可以缩短垃圾回收的时间 对于其他的行为(…

有一台服务器可以做哪些很酷的事情

有一台服务器可以做哪些很酷的事情 今天我也来简单分享一下,这几年来,我用云服务器做了哪些有趣的事情。 服务器推荐 1. 个人博客 拥有个人服务器,你可以完全掌控自己的网站或博客。 与使用第三方托管平台相比,你能自由选择网站…

灌区闸门自动化控制系统-精准渠道量测水-灌区现代化建设

项目背景 本项目聚焦于黑龙江某一灌区的现代化改造工程,该灌区覆盖广阔,灌溉面积高达7.5万亩,地域上跨越6个乡镇及涵盖17个村庄。项目核心在于通过全面的信息化建设,强力推动节水灌溉措施的实施,旨在显著提升农业用水的…

3.flask蓝图使用

构建一个目录结构 user_oper.py from flask import Blueprint, request, session, redirect, render_template import functools # 创建蓝图 user Blueprint(xkj, __name__)DATA_DICT {1: {"name": "张三", "age": 22, "gender": …

vue3学习日记1 - Pinia

最近发现职场前端用的框架大多为vue,所以最近也跟着黑马程序员vue3的课程进行学习,以下是我的学习记录 视频网址: Day2-02.Pinia-counter基础使用_哔哩哔哩_bilibili 学习日记: vue3学习日记1 - 环境搭建-CSDN博客 vue3学习日…

IP 地址与蜜罐技术

基于IP的地址的蜜罐技术是一种主动防御策略,它能够通过在网络上布置的一些看似正常没问题的IP地址来吸引恶意者的注意,将恶意者引导到预先布置好的伪装的目标之中。 如何实现蜜罐技术 当恶意攻击者在网络中四处扫描,寻找可入侵的目标时&…

Leetocde516. 最长回文子序列 动态规划

原题链接&#xff1a;Leetocde516. 最长回文子序列 class Solution { public:int longestPalindromeSubseq(string s) {int n s.size();vector<vector<int>> dp(n, vector<int>(n, 1));for (int i 0; i < n; i) {dp[i][i] 1;if (i 1 < n &&…

Linux物理地址到虚拟地址的映射

相关理论&#xff1a; Linux中用户空间是无法直操作寄存器的&#xff0c;需要先将寄存器对应的物理地址通过转换成虚拟地址然后在进行操作。 高性能处理器一般会提供一个内存管理单元&#xff08;MMU&#xff09;,该单元辅助操作系统进行内存管理&#xff0c;提供虚拟地址和物理…

openCvSharp 计算机视觉图片找茬

一、安装包 <PackageReference Include"OpenCvSharp4" Version"4.10.0.20241108" /> <PackageReference Include"OpenCvSharp4.runtime.win" Version"4.10.0.20241108" /> 二、准备两张图片 三、编写代码 using OpenCv…

数字孪生助力智慧机场全方位管理

智慧机场利用图扑可视化技术&#xff0c;实现航班动态、乘客流量和行李追踪的实时监控与分析&#xff0c;优化资源配置&#xff0c;提高运营效率&#xff0c;为旅客提供更加便捷的出行体验。

景联文科技提供高质量多模态数据处理服务,驱动AI新时代

在当今快速发展的AI时代&#xff0c;多模态数据标注成为推动人工智能技术进步的关键环节。景联文科技作为行业领先的AI数据服务提供商&#xff0c;专注于为客户提供高质量、高精度的多模态数据标注服务&#xff0c;涵盖图像、语音、文本、视频及3D点云等多种类型的数据。通过专…

【Docker】入门教程

目录 一、Docker的安装 二、Docker的命令 Docker命令实验 1.下载镜像 2.启动容器 3.修改页面 4.保存镜像 5.分享社区 三、Docker存储 1.目录挂载 2.卷映射 四、Docker网络 1.容器间相互访问 2.Redis主从同步集群 3.启动MySQL 五、Docker Compose 1.命令式安装 …