Elastic Support Hub 转向语义搜索

作者:Chris Blaisure

我们很高兴与大家分享 Elastic Support Hub 最近的增强功能:它现在由语义搜索提供支持!

但在我们更详细地了解对 Elastic® Support Hub 所做的更改及其对客户的影响之前,我们需要花点时间解释语义搜索的概念,这一点很重要。 从本质上讲,语义搜索是一种使用人工智能返回更相关的搜索结果的搜索方法。 观看这个解释这个概念的图片:

如上所示,语义搜索将用户搜索内容的意图与可用内容而不是单词相匹配。 你可以在我们的博客 Elastic Learned Sparse Encoder 简介:Elastic 用于语义搜索的 AI 模型中了解有关其背后 AI 的更多信息。 本博客的其余部分讲述了有关将 Elastic Support Hub 迁移到语义搜索的故事。

我们为什么要做出这样的改变?

如今所有科技新闻似乎都与大型语言模型和生成式人工智能有关。 Elastic 凭借其向量数据库功能和内置自然语言模型处于领先地位。 我们应该在与我们的产品相同的前沿上构建我们的支持应用程序,这是有道理的。 通过现在进行这一更改,我们可以向我们的产品开发团队提供反馈,并使产品对每个人来说都更好。

配置语义搜索的最大收获

与大多数新技术创新一样,它需要拆除、替换旧代码,并可能更新底层架构。 我们的内部应用程序开发团队直面这些挑战,现在我们可以更好地迭代 Elasticsearch® 的任何新功能。 从我们团队的角度来看,设置过程中有两个突出的重要特征:

1. 考虑到 ELSER(Elastic 用于语义搜索的专有转换器模型)是 Elasticsearch (8.8) 中相对较新的功能,我们的开发团队很高兴看到引导式 UI 体验,使 Elasticsearch 能够通过 ELSER 摄取管道。

这使我们的开发人员能够快速将必要的文本扩展配置添加到摄取管道中,从而使语义搜索成为可能。 这使得配置体验变得更容易上手并更快地看到结果。

2. 像ELSER这样的机器学习模型需要专用的机器资源来运行(至少 4GB)。 由于我们已经在 Elastic Cloud 上运行,因此我们能够启用具有自动扩展功能的专用机器学习 (ML) 节点,以满足我们的资源需求并获得更一致的性能。

搜索结果的早期评估

我们正在启用各种系统来帮助我们大规模地理解用户查询、搜索结果和相关性。 然而,在我们的用户测试中,我们已经可以看到各种查询的显着改进。 例如,我们在标准全文搜索和新的语义搜索实现上测试了短语 “How to index data into Elasticsearch (如何将数据索引到 Elasticsearch)”。

这是两种搜索方法的并排比较。

虽然没有一篇文章解释了索引数据的所有方法(有很多),但你可以看到这些结果有多么根本的不同。 对于全文搜索,我们提供了指南、故障排除文章和带有匹配关键字的博客的组合,但没有一个回答 “如何” 的问题。 或者换句话说,文本搜索没有捕获查询的含义(语义上),而是尽力匹配关键字。

对于语义搜索结果,你可以查看通常与数据索引相关的博客。 更有趣的是 “How to ingest data into Elasticsearch Service (如何将数据引入Elasticsearch Service)” 的第四个返回结果,因为术语 “ingest” 实际上与将数据添加到索引的过程更相关。 Elastic 的开箱即用转换器模型了解向索引添加数据的语义,并返回更相关的结果,无论确切的关键字如何。

下一步是什么?

虽然我们认为这是我们为客户提供相关搜索结果的能力的巨大飞跃,但我们知道我们的工作尚未完成。 随着时间的推移,我们将评估我们所拥有的有关搜索术语、结果和阅读文章的数据。 这些数据将使我们能够添加同义词 (synonyms) 并配置适当的权重和提升,以便为你(我们的客户)在 support.elastic.co 上搜索 Elastic 内容时提供最佳体验。

>> 了解有关支持中心提供的所有服务的更多信息。

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或引用了第三方生成人工智能工具,这些工具由其各自所有者拥有和运营。 Elastic 对第三方工具没有任何控制权,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害负责。 使用人工智能工具处理个人、敏感或机密信息时请务必谨慎。 你提交的任何数据都可能用于人工智能培训或其他目的。 无法保证你提供的信息将得到安全或保密。 在使用之前,你应该熟悉任何生成式人工智能工具的隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 和相关标记是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。 所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elastic Support Hub moves to semantic search | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/228429.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

java死锁的成因和解决方案

一、什么是死锁? 在Java中,死锁是指两个或多个线程互相持有对方所需要的锁,并且在无法继续执行的情况下永久地等待对方释放锁。这种情况下,所有涉及的线程都无法继续执行,程序被卡住,无法正常终止。 死锁通…

Question 1----dlib问题

复现代码时,在环境里边导入dlib包时一直出现setup.py运行失败,查找网上一些解决方法,使用whl文件本地导入 仍然不能解决,通过向师兄请教,成功解决问题。 首先需要先安装两个库:(已经安装好了VS…

pyside/qt03——人机协同的编程教学—直接面向chatGPT实战开发(做中学,事上练)

先大概有个草图框架,一点点丰富 我纠结好久,直接用Python写UI代码 还是用designer做UI 再转Python呢, 因为不管怎么样都要转成Python代码, 想了想还是学一下designer吧,有个中介,有直观理解。 直接这样也可…

“福利”还是“陷阱”?公司给员工放假3个月引发劳动权益争议

近日,广东佛山一家玻璃制造公司的长达3个月放假通知引发广泛关注。这一决策引发了社会对员工福利和公司经营平衡的深入思考。公司表示,此次决策是为了维修老化设备,但随之而来的疑虑则主要集中在员工的收入和劳动权益问题上。 公司表示&…

Java线程池—附阿里巴巴Java开发手册强制规范要求

文章目录 一、线程池概述二、创建线程池三、线程池执行Runnable任务四、线程池执行Callable任务五、线程池工具类(Executors)—不推荐 一、线程池概述 线程池就是一个可以复用线程的技术。 想象一下,如果不使用线程池会有什么问题&#xff1…

spring IOC介绍

spring的Ioc真是个好东西啊,那它到底是什么东西呢,控制反转,到底是怎么转的呢? 假设啊你现在是一个导演,想排部戏,那是不是得需要演员和舞台(spring中的bean),如果按平常的编程思维就是new 一个…

女装品牌网站建设的作用如何

服装是任何人都需要的必备品,尤其是女装,由于女性群体爱美追求时尚的心理更高,因此市场中有大量女装品牌以及大量消费者,其规模非常高,众多大小品牌林立及消费征集下,商家们经营也并不太容易,企…

YouTube网红营销:出海品牌扩大影响力的关键

随着数字媒体的兴起,社交媒体已成为品牌与消费者之间建立联系的重要桥梁。其中,YouTube作为全球最大的视频分享平台,不仅拥有庞大的用户群体,还聚集了众多有影响力的网红。这些网红在各自的领域内拥有强大的话语权和号召力&#x…

区块链实验室(28) - 拜占庭节点劫持区块链仿真

在以前的FISCO环境中仿真拜占庭节点攻击区块链网络。该环境共有100个节点,采用PBFT作为共识机制,节点编号分别为:Node0,Node,… ,Node99。这100个节点的前2010区块完全相同,自区块2011开始分叉。…

No suitable driver found for jdbc:mysql://localhost:3306(2023/12/7更新)

有两种情况: 压根没安装下载了但没设为库或方法不对 大多数为第一种情况: 一. 下载jdbc 打开网址选择一个版本进行下载 https://nowjava.com/jar/version/mysql/mysql-connector-java.html 二.安装jdbc 在项目里建一个lib文件夹 在把之前下载的jar文…

【开源】基于Vue+SpringBoot的陕西非物质文化遗产网站

文末获取源码,项目编号: S 065 。 \color{red}{文末获取源码,项目编号:S065。} 文末获取源码,项目编号:S065。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 设计目标2.2 研究内容2.3 研究方法与…

四十一、高可用

一、定义 TC(Tencent Cloud)的异地多机房容灾架构是指,在不同的地理位置上配置多个数据中心,以确保系统的高可用性和容灾能力。当某个数据中心发生故障或者不可用时,可以自动切换到其他数据中心来提供服务,…

vscode如何为python设置静态类型检测工具:mypy

设置好之后的效果如下图所示,你可以在下方problems一栏看到工作区所有文件存在的问题 安装mypy就像其他插件一样,在extensions中搜索mypy,再install即可。 但是安装以后,我的vscode弹出了以下通知: The mypy daemon e…

Global IIIumination(GI)全局光照原理(一)3D空间全局光照

文章目录 一、Global IIIumination(GI)全局光照基本概念二、主流的全局光照方法:三、Reflective shadow maps(RSM)反射阴影贴图 全局光照四、Light Propagation Volumes (LPV)光线传播体积 全局光照1.第一步&#xff0…

Linux中的网络时间服务器

本章主要介绍网络时间的服务器 使用chrony配置时间服务器配置chrony客户端服务器同步时间 1.1 时间同步的重要性 一些服务对时间要求非常严格,例如如图所示的由三台服务器搭建的ceph集群 这三台服务器的时间必须保持一致,如果不一致,就会显…

C语言之动态内存管理(malloc calloc realloc)

C语言之动态内存管理 文章目录 C语言之动态内存管理1. 为什么要有动态内存管理2. malloc 和 free2.1 malloc2.2 free2.3 例子 3. calloc 和 realloc3.1 calloc3.2 realloc 4. 常见的动态内存错误4.1 对NULL指针的解引⽤操作4.2 对动态开辟空间的越界访问4.3 对⾮动态开辟内存使…

Themis: Fast, Strong Order-Fairness in Byzantine Consensus

目录 笔记后续的研究方向摘要引言秩序井然 Themis: Fast, Strong Order-Fairness in Byzantine Consensus CCS 2023 笔记 后续的研究方向 摘要 我们介绍了Themis,这是一种将交易的公平排序引入(许可的)拜占庭共识协议的方案,最…

【洛谷】更换头像

错误展示 今天换头像的时候发现一直换不了,即使显示修改成功,然后我等了半个多小时也还没换好 解决办法 上传成功头像后,按ctrl F5 结果 更新成功!

文本润色工具有哪些,高质量的文本润色软件

在当今信息过载的时代,文本的重要性愈发凸显。即便是最精心构思的文章,若未经过仔细的润色,也难以达到最佳的表达效果。本文将专心分享文本润色工具的种类。 文本润色工具的种类 文本润色工具根据其功能和应用范围可以分为多个种类&#xff…

菜鸟学习日记(python)——推导式

python中的推导式是一种独特的数据处理方式,可以从一个数据序列去构建另一个新的数据序列的结构体。 它包括以下推导式: 列表(list)推导式字典(dict)推导式集合(set)推导式元组&am…