elasticsearch过滤器filter:原理及使用

码到三十五 : 个人主页

目录

    • 一、引言
    • 二、Elasticsearch的过滤器概述
    • 三、使用DSL进行过滤操作
      • 术语过滤
      • 范围过滤
      • 复合过滤
    • 四、优化策略
    • 五、结语

一、引言

Elasticsearch是一个功能强大的开源搜索引擎,广泛应用于各种数据检索和处理场景。在Elasticsearch中,过滤器(Filter)是一个核心概念,用于在查询过程中过滤出满足特定条件的文档。在Elasticsearch 7及以上版本过滤器在功能和使用方式上发生了一些变化。本文将详细介绍基于Elasticsearch 7及以上版本的过滤器技术,包括其工作原理、DSL使用示例以及优化策略等内容。

二、Elasticsearch的过滤器概述

在Elasticsearch 7及以上版本中,过滤器的概念已经逐渐被查询(Query)中的布尔子句(Bool Clause)所取代。尽管在之前的版本中,过滤器被用于快速筛选文档而不计算得分,但在新版本中,这种功能已经集成到了查询的布尔子句中。通过使用布尔子句中的filter子句,我们可以实现与过滤器相似的功能,同时保持查询的灵活性。

三、使用DSL进行过滤操作

在Elasticsearch中,Domain Specific Language(DSL)是一种用于构建查询和过滤器的声明式语言。下面我们将通过几个示例来展示如何在Elasticsearch 7及以上版本中使用DSL进行过滤操作。

术语过滤

假设我们有一个包含商品信息的索引,想要筛选出包含特定关键词的商品。可以使用布尔查询中的filter子句结合term查询来实现术语过滤。

GET /products/_search
{
  "query": {
    "bool": {
      "filter": [
        { "term": { "product_name.keyword": "phone" } }
      ]
    }
  }
}

上述查询将返回所有product_name字段包含"phone"关键词的商品文档。
在这里插入图片描述

范围过滤

如果我们想要根据价格范围来筛选商品,可以使用range查询来实现范围过滤。

GET /products/_search
{
  "query": {
    "bool": {
      "filter": [
        { "range": { "price": { "gte": 100, "lte": 500 } } }
      ]
    }
  }
}

这个查询将返回价格在100到500之间的商品文档。

复合过滤

通过结合多个filter子句,我们可以构建更复杂的过滤逻辑。例如,我们可以同时按照产品名称和价格范围进行筛选。

GET /products/_search
{
  "query": {
    "bool": {
      "filter": [
        { "term": { "product_name.keyword": "phone" } },
        { "range": { "price": { "gte": 100, "lte": 500 } } }
      ]
    }
  }
}

这个查询将返回产品名称为"phone"且价格在100到500之间的商品文档。

四、优化策略

  • 使用keyword字段进行精确匹配

在构建术语过滤时,应使用keyword类型的字段进行精确匹配,而不是text类型的字段。Text类型的字段会经过分词处理,可能导致不准确的匹配结果。

  • 避免在过滤器中使用脚本

复杂的脚本过滤器可能导致性能下降。尽量使用内置的查询和过滤器类型来满足需求,避免不必要的脚本计算。

  • 利用缓存机制

Elasticsearch会对过滤器的结果进行缓存,以提高查询效率。确保过滤器的逻辑稳定且不会频繁变化,以充分利用缓存机制带来的优势。

  • 控和分析查询性能

使用Elasticsearch提供的监控和分析工具,定期检查查询性能,并根据需要进行调优。例如,可以调整缓存策略、优化查询语句或增加硬件资源等方式来提高性能。

五、结语

通过深入了解过滤器的原理和使用方式,并结合DSL构建查询语句,我们可以更好地利用Elasticsearch进行数据检索和处理。同时,注意优化策略和监控性能也是确保查询高效性的关键。


关注以下公众号获取更多深度内容,纯干货 !

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/716057.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

jetson nano音频驱动代码分析

jetson nano音频驱动代码分析 英伟达audio框架(abub) Platform和Codec驱动程序的功能是 tegra210-admaif:代表音频 DMA (ADMA) 和音频集线器 (AHUB) 之间接口的内核驱动程序 tegra210-xxxx:代表AHUB中各种硬件加速器的内核驱动 tegra210-ahub&#xff1…

怎么缩小pdf文件大小

在数字化时代,pdf文件已经成为我们日常生活和工作中不可或缺的一部分。然而,随着pdf文件内容的增多,其大小也会相应增加,这给文件的传输、存储和共享带来了诸多不便。因此,如何有效地压缩pdf文件大小,成为了…

21组Midjourney绘画关键词,专为游戏设计的奇异生物的盛宴

21组AI绘画关键词,无一不在专为游戏设计的领域中发挥着巨大的作用。从2D游戏艺术到Xbox 360图形,从科幻怪物到异世界写实,这些关键词为游戏开发者提供了丰富多彩的创意资源。通过AI绘画工具,游戏画面呈现更加逼真、独特的设计风格…

【Linux应用】Linux系统的设备管理——Udev

1.udev概述 udev是 Linux2.6内核里的一个功能,它替代了原来的 devfs,成为当前 Linux 默认的设备管理工具,能够根据系统中的硬件设备的状态动态更新设备文件,包括设备文件的创建,删除等。 udev以守护进程的形式运行&am…

开源、无广告的小巧的动态壁纸软件

一、简介 1、开源、无广告的小巧的动态壁纸软件。它是绿色软件,软件压缩包大小仅有 0.5MB,目前仅支持 Windows 平台。它简单好用,支持将各种尺寸、分辨率的 MP4、MOV 等主流格式的视频文件设置为桌面动态壁纸,性能表现以及稳定性都…

【NOI】C++程序结构入门之循环结构四——带余除法

文章目录 前言一、带余除法1.1 概念1.2 编程中的使用1.2.1 模运算1.2.2 判断奇偶性1.2.3 判断倍数关系1.2.4 循环和迭代控制1.2.5 密码学与安全1.2.6 算法设计1.2.7 数据验证与错误处理 二、例题讲解问题:1389 - 数据分析问题:1750 - 有0的数问题&#x…

【Unity实战篇】| 快速制作一个简易时钟,包括2D和3D时钟

前言 【Unity实战篇】| 快速制作一个时钟,包括2D和3D时钟一、2D时钟制作1.1 钟表盘制作1.2 指针制作1.3 钟表搭建1.4 设置时钟的中心点1.5 时钟旋转逻辑 二、3D时钟制作2.1 搭建表盘和指针2.2 调整指针的位置和节点2.3 时钟旋转逻辑 总结 前言 时钟 这个东西想必不…

【C++】数据类型、函数、头文件、断点调试

四、基本概念 这部分和C语言重复的部分就简写速过,因为我之前写过一个C语言的系列,非常详细。C和C这些都是一样的,所以这里不再一遍遍重复码字了。感兴趣的同学可以翻看我之前的C语言系列文章。 1、数据类型 编程的本质就是操作数据。 操…

PyCharm配置教程,手把手教你如何配置

文章目录 引言1. 安装 PyCharm1.1 下载和安装1.2 初次启动 2. 基本配置2.1 设置界面2.2 常用配置项 3. 项目配置3.1 创建新项目3.2 配置解释器 4. 虚拟环境配置4.1 创建虚拟环境4.2 使用已有虚拟环境4.3 管理依赖 5. 插件和扩展5.1 安装插件5.2 推荐插件 6. 调试配置6.1 配置调…

React+TS前台项目实战(九)-- 全局常用组件弹窗Dialog封装

文章目录 前言Dialog公共弹窗组件1. 功能分析2. 代码详细注释3. 使用方式4. 效果展示 总结 前言 今天这篇主要讲全局公共弹窗Dialog组件封装,将用到上篇封装的模态框Modal组件。有时在前台项目中,偶尔要用到一两个常用的组件,如 弹窗&#x…

Linux常⽤服务器构建-samba

目录 1. 介绍 2. 安装 3. 配置 3.1 创建存放共享⽂件的路径 3.2 创建samba账户 4 重启samba 5. 访问共享⽂件 5.1 mac下访问⽅式 5.2 windows下访问⽅式 1. 介绍 Samba 是在 Linux 和 UNIX 系统上实现 SMB 协议的⼀个免费软件,能够完成在 windows 、 mac 操作系统…

6.12ctf练习

[西湖论剑 2022]Node Magical Login 源码在这里:GitHub - CTF-Archives/2022-xhlj-web-node_magical_login: A web challenge in 2022 西湖论剑大赛打开 打开环境是个登录框,先进行了扫描和抓包都没有看见什么有价值的东西,看源码 大致连接…

LeetCode136只出现一次的数字

题目描述 给你一个 非空 整数数组 nums ,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。你必须设计并实现线性时间复杂度的算法来解决此问题,且该算法只使用常量额外空间。 解析 需要想到异或运算&#…

【BES2500x系列 -- RTX5操作系统】系列文章索引

💌 所属专栏:【BES2500x系列】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! &#x1f49…

如何将asf转换成mp4?教你3种轻松转换方法

如何将asf转换成mp4?ASF是一种视频格式,但在现代的视频编辑和播放中,MP4格式因其广泛的兼容性和高质量的压缩技术而备受欢迎。因此,将ASF转换为MP4格式的需求时常出现。MP4还采用了高效的压缩技术,能在保证视频质量的同…

前端JS必用工具【js-tool-big-box】学习,打开全屏和关闭全屏

这一小节,我们说一下 js-tool-big-box 工具库中,打开全屏和关闭全屏的方法学习。 我们知道,浏览器想打开全屏,按一下 F11 键就可以了,但一来这个功能不一定所有使用的用户都知道,二来在一些例如大屏的需求…

芯片封测从入门到精通

文章目录 📑前言一、作者简介二、书籍亮点三、内容简介四、适读人群 📑前言 在科技日新月异的今天,芯片作为现代电子设备的核心部件,其性能与可靠性直接决定了整个产品的竞争力。而芯片封测,作为确保芯片性能与可靠性…

《Windows API每日一练》4.3 点和线的绘制

理论上,所有的图形设备驱动程序所需要的就是SetPixel函数和GetPixel函数。其余的一切都可以使用在GDI模块中实现的更高层的例程来处理。例如,画一条线,GDI可以不停地调整x和y坐标,然后连续调用多次SetPixel函数来实现。 事实上&a…

了解压电传感器:压电效应

压电加速度计的个关键方面是压电效应。一般来说,压电材料在受到机械应力时可以产生电力。 相反,对压电材料施加电场可以使其变形并产生小的机械力。尽管大多数电子工程师都熟悉压电效应,但有时并没有完全理解这种有趣现象的细节。 更深入地…

电脑剪贴板历史记录查看,让你的信息管理更加有序!

剪贴板是电脑中一个非常实用的功能,允许用户在不同的应用程序之间复制和粘贴文本、图像、文件等内容。然而,默认情况下,剪贴板只能存储最近一次复制的内容,这可能会限制我们的工作效率。幸运的是,电脑剪贴板历史记录查…