Elasticsearch 和 Kibana 8.16:Kibana 获得上下文和 BBQ 速度并节省开支!

作者:来自 Elastic Platform Product Team

Elastic Search AI 平台(Elasticsearch、Kibana 和机器学习)的 8.16 版本包含大量新功能,可提高性能、优化工作流程和简化数据管理。

  • 使用更好的二进制量化 (Better Binary Quantization - BBQ) 和生成式 AI (GenAI) 来提高热度:向量搜索中速度快、精度高、成本节省惊人
    • Elasticsearch 的新 BBQ 算法重新定义了向量量化 — 提高查询速度、排名精度和成本效率。与乘积量化 (product quantization - PQ) 等替代方案相比,实现超过 90% 的召回率,延迟更低,并将 RAM 使用率降低 95%。
  • Kibana 获得上下文:探索更智能的数据调查的力量
    • 得益于其可扩展的上下文架构,Kibana Discover 可以动态适应你正在分析的数据类型。节省时间并提高生产力,使数据探索比以往更顺畅。
  • 查询演变:Elasticsearch 查询语言 (ES|QL) 中的快速跟踪、智能堆栈和地理黑客
    • 借助 Elastic 的三个新功能(推荐查询、快速距离排序和按聚合过滤),在 ES|QL 中解锁更快、更轻松、更灵活的查询。

深入了解这些更新和更多增强功能 - 所有这些都旨在提高速度、生产力和可用性。

Elastic 8.16 中还有什么新功能?查看 8.16 公告帖子以了解更多信息 >>

GenAI 中的增强功能

在 8.16 中,Elastic 通过提高效率、可扩展性和可用性,继续在生成 AI 领域保持创新步伐。借助 BBQ,通过将内存需求减少高达 97%,实现顶级查询速度和成本节省。新推出的正式版推理 API 只需单击几下即可提供对 Elastic 强大的 AI 模型的生产就绪访问以及实时交互。借助自适应资源和灵活的分块策略,你可以在高需求时获得最佳性能,在空闲时则无需支付任何费用。

BBQ

Elasticsearch 推出了一个全新的稠密向量量化算法,在查询延迟、排名质量和所需计算资源(成本)方面取得了令人惊讶的效果。

这一算法的整体概念与 PQ(Product Quantization)相似,因为 Elasticsearch 会生成一个比原始向量小得多的预测向量。初始搜索使用的是预测向量,随后对结果进行过采样以进行重新排序,并使用原始向量对其进行排序,从而产生一组针对查询的结果。生成预测向量的方法与 PQ 完全不同,基于生成一个比原始向量更节省存储空间的比特向量,同时仍能预测正确的排名。

关键点在于,BBQ 能够提供优秀的排名效果,达到超过 90% 的召回率(相比于对原始向量进行暴力搜索/brute force),并且通过 2x 到 5x 的过采样优化查询结果。查询延迟也优于其他替代方法,包括 PQ。最重要的是,BBQ 的内存需求仅为使用 HNSW 算法处理原始向量时所需内存的 3% 到 5%,大幅降低了成本。如需了解算法的更详细描述和一些测试结果,请查阅这篇博客。

要使用它,只需将 index_options 定义为 bbq_hnsw 或 bbq_flat 类型,并且不要忘记使用 script_score 查询对完整向量进行过采样和重新排序。该功能仍处于技术预览阶段,我们暂时计划在即将发布的版本中简化使用它的体验。

推理 API 已正式发布

我们很高兴地宣布,推理 API 现已正式发布。从 8.16 开始,它现在被推荐用于生产,提供生产级稳定性、稳健性和性能。Elastic 的推理 API 集成了最先进的 AI 推理,同时提供了无与伦比的易用性。它将 Elastic 的 AI 语义搜索模型 — Elastic Learned Sparse EncodeR (ELSER) — 以及你的 Elastic 托管模型和越来越多的知名外部模型和任务整合在一起,形成统一、精简的语法,供你的 Elastic 向量数据库使用。与 semantic_text 或 Elastic 向量数据库支持的向量字段一起使用,你可以无缝轻松地执行 AI 搜索、重新排名和完成。

在 8.16 中,我们还添加了流式完成,以改进流程和实时交互以及 GenAI 体验。推理 API 为你提供最先进的 AI 推理,并提供更多服务和任务供你使用。

ELSER、e5、训练模型自适应资源和分块策略

推理需要计算资源,因此模型部署必须自动适应推理负载 — 在高负载期间(例如在摄取高峰和繁忙搜索时间)扩大规模,并在推理负载下降时缩小规模。到目前为止,你必须主动管理这部分,即使启用了 Elastic Cloud ML 自动扩展功能也是如此。你如何控制所涉及的所有参数,以便在任何时间点实现搜索和摄取需求的最佳成本/性能权衡?

从 8.16 开始,ELSER 和你在 Elastic 中使用的其他 AI 搜索和自然语言处理 (natural language processing - NLP) 模型会根据推理负载自动调整资源消耗 — 在高峰时段提供你需要的性能,并在低谷时段降低成本,在空闲时间一直降至零成本。e5 模型在 Elastic 的标准保修范围内。

此外,不需要复杂的配置。通过用户友好的用户体验,你只需单击一下即可配置针对搜索优化和针对采集优化的模型部署。优化配置在后台透明地进行。你还可以轻松规划更多动态资源以用于搜索或采集。我们将继续改善这种体验。结合 Elastic Cloud 上 ML 自动扩展的灵活性和 Elastic Cloud Serverless 的惊人弹性,你可以完全控制性能和成本。

在 8.16 中,你可以选择使用单词或基于序列的分块策略来与训练模型一起使用,还可以自定义最大大小和重叠参数。合适的分块策略可以带来收益,具体取决于你使用的模型、文本的长度和性质以及搜索查询的长度和复杂性。

多层嵌套的检索器和 GA

检索器是一种抽象,可从查询中返回排名靠前的文档。它旨在允许嵌套,并使定义查询变得更容易。检索器还允许在定义查询时具有更大的灵活性。自从我们在 8.14 中发布该功能以来,它变得越来越流行,我们收到了允许多层嵌套的请求。例如,用户请求通过 RRF 检索器组合密集向量(kNN 检索器)、ELSER 和 BM25(标准检索器),然后使用文本相似性重新排序检索器通过外部服务对它们进行重新排序,该检索器现已受支持。在 8.16 中,我们还添加了对其他搜索功能(如折叠结果和突出显示)的支持。并且我们已将包括 RRF 在内的检索器公开发布。

快速查询:ES|QL 的高级新功能

Elastic 8.16 引入了三个强大的新功能,旨在使查询更快、更轻松、更灵活。推荐的 ES|QL 查询提供即时指导,包括自动完成选项和预构建的查询建议,非常适合任何技能水平的用户。按距离排序现在可将快速地理搜索和前 N 个查询的性能提升高达 100 倍。通过每个聚合过滤,你可以为每个聚合定义唯一的过滤器,为你的分析带来精确度。

推荐的 ES|QL 查询

现在,在 ES|QL 编辑器中创建查询比以往任何时候都更容易。推荐的查询有助于简化流程,尤其是对于不熟悉语法或数据结构的用户。此功能减少了查询创建时间,并简化了新用户和有经验用户的学习曲线。你现在可以从 ES|QL 帮助菜单中快速选择推荐的查询,或使用自动完成功能更快地开始使用。

ES|QL 中按距离排序的速度更快

在 ES|QL 中展示了完整的地理搜索功能后,我们将注意力转向性能优化 — 从常见的过滤情况开始,到按距离对结果进行排序。对于涉及在距离内搜索文档和/或按距离对文档进行排序的一系列查询,我们的性能提高了 10 倍到 100 倍。这还包括在 WHERE 和 SORT 命令中使用 EVAL 命令之前定义距离函数的能力。我们的最佳结果 — 查询速度提高了大约 100 倍 — 是非常有用的 top-N 查询,对结果进行排序和限制,如我们的每夜基准测试仪表板所示:

ES|QL 中的按聚合过滤

ES|QL 中的聚合在 8.16 中变得更加灵活。现在,你可以在查询中为每个聚合定义一个过滤器,例如根据不同组(如 Web 服务器的状态代码)的不同条件计算计数统计信息:

FROM web-logs | STATS success = COUNT(*) WHERE 200 <= code AND code < 300,
redirect = COUNT(*) WHERE 300 <= code AND code < 400,
client_err = COUNT(*) WHERE 400 <= code AND code < 500,
server_err = COUNT(*) WHERE 500 <= code AND code < 600,
total_count = COUNT(*)

仪表板闪耀与数据飞跃:Kibana 8.16 的新功能

Kibana 8.16 引入了强大的新功能,提升了 Discover、仪表板和导航的用户体验,旨在提高生产力并简化数据探索。Discover 现在会根据数据类型自适应数据表,使用户更容易分析日志。仪表板新增快速访问功能,包括最近查看、收藏和使用情况分析。此外,全新的解决方案导向左侧菜单导航为搜索、可观测性和安全用户量身定制界面,提供更直观且高效的 Kibana 使用体验。

发现上下文数据呈现

Kibana 8.16 中的 Discover 现在可以根据正在探索的数据类型自动调整数据表呈现。对于使用日志的用户,相关字段(如 log levels)现在会自动显示在表格中或 Discover 文档查看器中的自定义日志概览中。这种简化的上下文感知方法通过简化数据探索和突出显示关键日志见解(无需额外配置)来提高工作效率。

轻松高效地管理仪表板

作为 Kibana 仪表板管理的一系列改进的一部分(请参阅 8.15 中的仪表板视图创建器和编辑器),我们添加了旨在提高效率和可用性的新功能。现在,你可以通过三种方式轻松对仪表板进行排序 - 保留 “Recently Viewed” 默认设置、为你最喜欢的仪表板加注星标以便快速轻松地找到,以及查看详细的使用情况统计信息。

此外,新的使用情况洞察功能允许你单击仪表板列表视图中的 “info” 图标以访问过去 90 天内仪表板视图的直方图。这可以洞察仪表板的受欢迎程度,帮助你识别和删除未使用的仪表板,最终优化你的工作区。这些更新使仪表板的管理和组织更快、更直观。

解决方案视图左侧菜单导航

Kibana 的新解决方案视图左侧菜单导航(可在 Elastic Cloud Hosted 中使用)通过将左侧菜单导航重点放在搜索、可观察性或安全性的相关功能上,为用户提供更简化的体验。这种有针对性的方法消除了混乱,使 Kibana 用户更容易找到满足其特定需求的菜单项,并使用户能够更有效地导航。从 8.16 开始,用户可以从四个视图中进行选择:Search、Observability、Security 或 Classic(保留以前的布局以保持连续性)。简化的左侧菜单导航通过仅显示每个解决方案所需的菜单项来改善日常工作流程。

Search 解决方案视图

Observability 解决方案视图

Security 安全 解决方案视图

Dev Console UX 改进

我们很高兴地宣布 Dev Console 有了新的改进 — 它是我们用户中最受欢迎的应用之一!最新的改进包括入门指南,可帮助新用户快速熟悉控制台。对于经验丰富的用户,我们引入了新功能,例如将输出复制到剪贴板以及导入或导出文件。此外,整体响应能力得到了优化,同时还进行了多项生活质量改进,以简化工作流程并提高效率。这些更新使 Dev Console 更加用户友好,增强了所有用户的入门和日常操作。

亮点之外:Elastic 8.16 的其他值得关注的更新

除了主要功能外,Elastic 8.16 还带来了众多实用的增强功能,旨在优化性能、简化工作流程并简化管理。

使用事件摄取时间进行更高效的搜索

使用 “event.ingested” 字段根据其摄取日期时间搜索数据的查询现在与使用可搜索快照时使用 “@timestamp” 的查询具有相同的性能提升。这要归功于一项优化,该优化允许根据 “event.ingested” 集群状态中存储的最小值和最大值跳过分片。

数据流最大和默认保留的全局设置

数据流对于随时间高效摄取日志和指标至关重要,而管理数据保留对于保持系统效率和成本效益至关重要。在此版本中,管理员可以访问两个新的全局设置,允许他们定义部署中所有数据流的最大和默认保留期,确保删除过时的数据,同时保持成本可控。

Interval 查询与 span 查询功能相当

Inteval 查询旨在取代 span 查询。它更易于定义;它提供接近度分数;在某些情况下,它的性能更高。这两个查询通常用于法律和专利搜索。在 8.16 中,我们在interval 查询中启用了正则表达式和范围,并将多项 interval 查询(前缀/prefix、通配符/wildcard、模糊/fuzzy、正则表达式/regexp 和范围/range)的最大子句从 128 个增加到可配置参数(与跨度查询使用的参数相同)。

日志分析仪表板面板

使用日志模式分析将日志分组为模式,以加快洞察和解决问题的时间。使用 Elastic 的人工智能 IT 运营 (AIOps) 功能,在几秒钟内处理数千个日志并识别噪音中的信号。借助仪表板内提供的日志模式分析,AIOps 越来越多地嵌入到你的工作流中。过滤模式将相应地调整仪表板的数据,或者选择过滤以在 Discover 中过渡你以进行进一步探索。

直观的 Space 设置

Kibana 8.16 简化了角色分配,允许管理员直接从 Space 设置直观地分配角色和权限。新的 “Permissions” 选项卡可以对单个或多个空间进行高效的角色管理,为访问控制带来用户友好的方法。

支持异常检测中的夏令时 (DST) 变化

在 8.16 中,我们引入了对异常检测中 DST 变化的支持。通过选择正确的时区设置 DST 日历,并将其单独或分组应用于你的异常检测作业,以方便你使用。然后,让你的异常检测模型在未来许多年内无需任何与 DST 相关的干预即可工作。不再因 DST 变化而导致异常检测误报。让你的检测不间断地完成工作。

更多关于这个的描述,请参考文章 “在 Elasticsearch 中顺利管理季节性时间变化”。

文件上传器 PDF 支持

文件上传器提供了一种简单的数据上传方式,可在几秒钟内开始使用 Elastic。现在,你可以从 PDF 文件上传数据,只需单击一下即可前往 Search Playground。使用它可快速获取数据并利用 Elastic 技术。

试试吧!

在发行说明中了解这些功能和更多内容。

现有的 Elastic Cloud Hosted 和 Elastic Cloud Serverless 客户可以直接从 Elastic Cloud 控制台访问其中的许多功能。没有利用云上的 Elastic?开始免费试用。

本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。

在这篇博文中,我们可能使用或提到了第三方生成 AI 工具,这些工具由其各自的所有者拥有和运营。Elastic 无法控制第三方工具,我们对其内容、操作或使用不承担任何责任,也不对你使用此类工具可能产生的任何损失或损害承担任何责任。将 AI 工具用于个人、敏感或机密信息时,请谨慎行事。你提交的任何数据都可能用于 AI 培训或其他目的。我们无法保证你提供的信息会保持安全或保密。在使用任何生成 AI 工具之前,你应该熟悉其隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 及其相关标志是 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其各自所有者的商标、徽标或注册商标。

原文:Elasticsearch and Kibana 8.16: Kibana gets contextual and BBQ speed and savings! | Elastic Blog

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/916051.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

亮数据——助力全球数据抓取的高效代理平台

目录 实际案例&#xff1a;利用代理服务抓取企业信息完整代码运行结果 亮数据的技术优势与应用场景产品更新&#xff1a;简化注册流程与智能助手升级立即注册&#xff0c;开启您的数据抓取之旅&#xff01; 在如今的大数据时代&#xff0c;企业决策越来越依赖于数据分析&#x…

使用win32com将ppt(x)文件转换为pdf文件

本文来记录下如何使用win32com将ppt(x)文件转换为pdf文件 文章目录 win32com概述win32com优缺点代码实例本文小结 win32com概述 Pywin32 是一个用于与 Microsoft Windows 操作系统交互的 Python 扩展模块&#xff0c;它提供了对多个 Windows API 的访问&#xff0c;包括对 Mic…

Win11专业版Docker安装、配置记录

零&#xff0c;系统环境配置 首先&#xff0c;安装Docker需要系统支持开启硬件虚拟化及Hyper-V功能&#xff0c;所以这里需要Win10/11的专业版&#xff0c;这样才能进行Docker for Windows软件安装。 1&#xff0c;硬件虚拟化 至于如何开启硬件虚拟化&#xff0c;自行百度即…

[JAVAEE] 面试题(四) - 多线程下使用ArrayList涉及到的线程安全问题及解决

目录 一. 多线程下使用ArrayList 1.1. 自行判断加锁 1.2 使用Collections.synchronizedList()套壳加锁 1.3 CopyOnWriteArrayList类 二. 总结 一. 多线程下使用ArrayList 多线程下使用ArrayList会涉及到线程安全问题, 例如: public static void main(String[] args) thro…

idea项目运行时 java: 错误: 不支持发行版本 21

java项目运行时&#xff0c;同样的项目别的都是正常运行&#xff0c;单个这个项目一直报 java: 错误: 不支持发行版本 21&#xff0c; 报错的解释 这个错误表明你正在尝试使用Java编译器编译一个类&#xff0c;但是编译器遇到了一个它不支持的版本号&#xff0c;在这个上下文…

kafka和Flume的整合

目录 一、Kafka作为Source 【数据进入到kafka中&#xff0c;抽取出来】 1、在我的flume的conf文件夹下&#xff0c;有个myconf文件夹&#xff1a; 2、 创建一个flume脚本文件&#xff1a; kafka-memory-logger.conf 3、测试 二、kafka作为Sink 【数据从别的地方抽取到kafka里…

Tomcat漏洞利用工具-TomcatScanPro(二)

项目地址 https://github.com/lizhianyuguangming/TomcatScanPro 简介 本项目是一个针对 Tomcat 服务的弱口令检测、漏洞检测以及本地文件包含&#xff08;LFI&#xff09;攻击工具。除了支持 CVE-2017-12615 漏洞的多种利用方式外&#xff0c;新版本还集成了 CNVD-2020-104…

【2024软考架构案例题】你知道 Es 的几种分词器吗?Standard、Simple、WhiteSpace、Keyword 四种分词器你知道吗?

&#x1f449;博主介绍&#xff1a; 博主从事应用安全和大数据领域&#xff0c;有8年研发经验&#xff0c;5年面试官经验&#xff0c;Java技术专家&#xff0c;WEB架构师&#xff0c;阿里云专家博主&#xff0c;华为云云享专家&#xff0c;51CTO 专家博主 ⛪️ 个人社区&#x…

Web认证机制 Cookie、Token、Session、JWT、OAuth2 解析

标题 一、Cookie二、Session三、Token四、JWTSSO&#xff08;单点登录&#xff09; 五、OAuth2如何设计权限系统区别总结 Cookie、Token、Session 和 JWT 都是在 Web 开发中常用的身份验证和授权技术&#xff0c;它们各有优缺点&#xff0c;适用于不同的场景。 Cookie 简单易用…

GEE遥感云大数据在灾害、水体与湿地领域典型案例实践:洪涝灾害、水体质量、河道轮廓、地下水变化监测;洪水敏感性和风险模拟;红树林遥感制图等

以Earth Engine&#xff08;GEE&#xff09;、PIE-Engine为代表全球尺度地球科学数据&#xff08;尤其是卫星遥感数据&#xff09;在线可视化计算和分析云平台应用越来越广泛。GEE平台存储和同步遥感领域目前常用的MODIS、Landsat和Sentinel等卫星影像、气候与天气、地球物理等…

安装一键式重置密码插件(Linux)-CloudResetPwdAgent

为了保证使用镜像创建的裸金属服务器可以实现一键式密码重置功能&#xff0c;建议您在制作镜像时安装重置密码插件“CloudResetPwdAgent”。 前提条件 需保证虚拟机根目录可写入&#xff0c;且剩余空间大于600MB。 1.下载插件包 华为云已提供下载包连接 在PC机里下载好软件…

力扣-Mysql-3328-查找每个州的城市 II(中等)

一、题目来源 3328. 查找每个州的城市 II - 力扣&#xff08;LeetCode&#xff09; 二、数据表结构 表&#xff1a;cities ---------------------- | Column Name | Type | ---------------------- | state | varchar | | city | varchar | ----------------…

深度学习神经网络创新点方向

一、引言 深度学习神经网络在过去几十年里取得了令人瞩目的成就&#xff0c;从图像识别、语音处理到自然语言理解等众多领域都有广泛应用。然而&#xff0c;随着数据量的不断增长和应用场景的日益复杂&#xff0c;对神经网络的创新需求也愈发迫切。本文将探讨深度学习神经网络…

SpringBoot 3.3.5 试用CRaC,启动速度提升3到10倍

文章目录 一 CRaC是什么二 CRaC的原理三 CRaC 的应用场景四 支持版本五 实践 今天和小伙伴们来聊一个稍微新一点的技术话题—CRaC。 CRaC&#xff08;Coordinated Restore at Checkpoint&#xff0c;检查点协调恢复&#xff09;是一个 OpenJDK 项目&#xff0c;旨在解决 Java 应…

大模型本地部署:Ollama+MaxKB 部署本地知识库

前言 本文我们介绍另外一种部署本地知识库的方案&#xff1a; Ollama MaxKB 相对来说&#xff0c;容易安装且功能较完善&#xff0c;30 分钟内即可上线基于本地大模型的知识库问答系统&#xff0c;并嵌入到第三方业务系统中。 缺点是如果你的电脑配置不高&#xff0c;问题…

Nuxt.js 应用中的 schema:beforeWrite 事件钩子详解

title: Nuxt.js 应用中的 schema:beforeWrite 事件钩子详解 date: 2024/11/14 updated: 2024/11/14 author: cmdragon excerpt: schema:beforeWrite 钩子是 Vite 提供的一个功能强大的生命周期钩子,允许开发者在 JSON Schema 被写入之前执行自定义操作。利用这个钩子,您可以…

Scrapy爬取heima论坛所有页面内容并保存到数据库中

前期准备&#xff1a; Scrapy入门_win10安装scrapy-CSDN博客 新建 Scrapy项目 scrapy startproject mySpider03 # 项目名为mySpider03 进入到spiders目录 cd mySpider03/mySpider03/spiders 创建爬虫 scrapy genspider heima bbs.itheima.com # 爬虫名为heima &#…

MacBook 下载vscode不能被解压及打开的解决方案

mac 下载vscode不能被解压解决方案如下 1.下载全能解压 进行解压 解压完如果提示 已损坏&#xff0c;无法打开。 您应该将它移到废纸篓 2.允许“任何来源”开启 开启终端输入 sudo spctl --master-disable回车 3. 扩展文件属性 先输入 sudo xattr -r -d com.apple.quaran…

【AI声音克隆整合包及教程】第二代GPT-SoVITS V2:技术、应用与伦理思考

一、引言 在当今科技迅速发展的时代&#xff0c;声音克隆技术成为人工智能领域的一个备受瞩目的分支。GPT-SoVITS V2作为一种声音克隆工具&#xff0c;正逐渐进入人们的视野&#xff0c;它在多个领域展现出巨大的潜力&#xff0c;同时也引发了一系列值得深入探讨的问题。本文旨…

DAY113代码审计-PHPTP框架微P系统漏审项目等

一、环境安装 导入数据 Debug 版本信息收集 一、不安全写法的sql注入&#xff08;拼接写法绕过预编译机制&#xff09; 1、Good.php的不安全写法 2、查找可以参数 3、找路由关系 application/index/controller/Goods.php http://172.19.1.236:8833/index.php/index/goods/aj…