Elasticsearch:DSL Query

Query DSL的分类

Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有的数据,一般测试用,例如:match_all,但有分页限制,一次20条左右
  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。常见的有两种
    • match_query
    • multi_match_query
  • 精确查询:根据精确词条值查找数据,一般查找keyword、数值、日期、boolean等类型字段。(不需要分词,整体做倒排索引)
    • ids (按照id查询)
    • range (按照数值范围查询)
    • term (按照数据的值查询)
  • 地理(geo)查询:根据经纬度查询,例如:
    • geo_distance
    • geo_bounding_box
  • 复合(compound)查询:符合查询可以将上述各种查询条件组合起来,合并查询条件
    • bool
    • function_score

DSL Query基本语法
查询的基本语法如下:

GET /indexName/_search
{
  "query":{
    "查询类型":{
      "查询条件":"条件值"
    }
  }
}

查询所有

GET /indexName/_search
{
  "query":{
    "match_all":{
    }
  }
}

全文检索查询

全文检索查询会对用户输入内容分词,常用于搜索框搜索

  • match查询:全文检索查询的一种,会对用户输入内容分词,然后去倒排索引库检索。
    语法
GET /indexName/_search
{
  "query":{
    "match":{
      "字段":"搜索的内容"
    }
  }
}

实例

GET /es_test/_search
{
  "query":{
    "match":{
      "name.lastName":"张"
    }
  }
}

结果

{
  "took" : 5,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 0.2876821,
    "hits" : [
      {
        "_index" : "es_test",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.2876821,
        "_source" : {
          "info" : "测试es",
          "email" : "xxx@163.com",
          "name" : {
            "firstName" : "三",
            "lastName" : "张"
          },
          "age" : 16
        }
      }
    ]
  }
}

查询所有

GET /es_test/_search
{
  "query":{
    "match":{
      "all":"张"
    }
  }
}
  • multi_match:与match查询类似,允许同时查询多个字段,即从对应的字段中查询匹配的内容。参与查询字段越多,查询性能越差,建议使用copy_to将多个要查的字段copy到一个字段。
    语法
GET /indexName/_search
{
  "query":{
    "mutil_match":{
      "query":"要查询的内容",
      "fields":["字段1","字段2"]
    }
  }
}

精确查询

精确查询一般是查找keyword、数值、日期、boolean等类型字段。所以不会对搜索条件分词。
常见的有:

  • term:根据词条精确值查询
    语法
GET /indexName/_search
{
  "query":{
    "term":{
      "FIELD":{
        "value":"VALUE"
      }
    }
  }
}

例子

GET /es_test/_search
{
  "query":{
    "term":{
      "age":{
        "value":"16"
      }
    }
  }
}
  • range:根据值的范围查询
    语法
GET /indexName/_search
{
  "query":{
    "range":{
      "FIELD":{
        "gte":10,
        "lte":20
      }
    }
  }
}

例子

GET /es_test/_search
{
  "query":{
    "range":{
      "age":{
        "gte":10,
        "lte": 20
      }
    }
  }
}

地理查询

根据经纬度查询,常见的使用场景:查询附近的酒店,查询附近的出租车,搜索附近的人

  • geo_bounding_box:查询geo_point值落在某个矩形范围的所有文档
GET /indexName/_search
{
  "query": {
    "geo_bounding_box":{
      "FIELD1":{
        "top_left":{
          "lat":31.1,
          "lon":121.5
        }
      },
      "FIELD2":{
        "bottom_right":{
          "lat":30.9,
          "lon":121.7
        }
      }
    }
  }
}
  • geo_distance:查询到指定中心点小于某个距离值的所有文档
GET /indexName/_search
{
  "query": {
    "geo_distance":{
      "distance":"15km",
      "FIELD":"31.21,121.5"
    }
  }
}

复合查询

复合(compound)查询,可以将其他简单查询组合起来,实现更复杂的搜索逻辑,例如:

  • function score:算分函数查询,可以控制文档相关性算分,控制文档排名。例如百度竞价

相关性打分算法
当我们利用match查询时,文档结果会根据与搜索词条的关联度打分(_score),返回结果时按照分值降序排列。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
使用function score query,可以修改文档的相关性算分(query score),根据新得到的算分排序。

GET /indexName/_search
{
  "query": {
    "function_score": {
      "query": {"match": {"all": "外滩"} // 原始查询条件,搜索文档并根据相关性打分(query score)
    },
    "functions": [
        {
          "filter": {"term":{"id": "1"}}, //过滤条件,符合条件的文档才会被重新算分
          "weight":10 //算分函数,算分函数的结果称为function score,将来会与query score运算,得到新分数,常见的算分函数有:weight:给一个常量值,作为函数结果(function score);field_value_factor:用文档中的某个字段值作为函数结果;random_score:随机生成一个值,作为函数结果;script_score:自定义计算公式,公式结果作为函数结果
        }
      ]
    },
    "boost_mode":"multiply"//加权模式,定义function score与query score的运算方式,包括:multiply:两者相乘,默认就是这个;replace:用function score替换query score;其他:sum,avg,max,min
  }
}
  • 布尔查询,是一个或多个查询子句的组合。子查询的组合方式有:
  • must:必须匹配每个子查询,类似"与"
  • should:选择性匹配子查询,类似"或"
  • must_not:必须不匹配,不参与算分,类似"非"
  • filter:必须匹配,不参与算分
GET /indexName/_search
{
  "query": {
    "bool": {
      "must": [
        {"term": {"city": "上海"}}
      ],
      "should": [
       {"term": {"brand": "皇冠假日"}},
       {"term": {"brand": "华美达"}}
      ], 
      "must_not": [
        {"range": {"price": {"lte": 500}}}
      ],
      "filter": [
        {"range": {"score": {"gte": 45}}}
      ]
    }
  }
}

Reference
黑马程序员

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/31301.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

i5 3470+XSB75M-PK+HD 7750安装黑苹果macOS Big Sur 11.7.7

我本次使用的是 HD 7750 进行安装黑苹果(闲鱼80元买的),这款显卡直接就是免驱,最高可以安装的版本是 macOS Monterey ,但是建议安装至 macOS Big Sur 以获得较好的体验。 EFI(OC引导) EFI.zip …

【网络2】MII MDIO

文章目录 1.MII:ISO网络模型中物理层(phy)和数据链路层(mac)属于硬件,其余都属于软件kernel2.MDC/MDIO:不仅管phy,只要支持mdio协议都可以管2.1 3.RGMII时序调整:下面波形…

2023-06-19 Untiy进阶 C#知识补充2——C#版本与Unity的关系

文章目录 一、Unity 与 C# 版本二、Unity 的 .Net API 兼容级别 一、Unity 与 C# 版本 Unity 版本C# 版本Unity 2021.2C# 9Unity 2020.3C# 8Unity 2019.4C# 7.3Unity 2017C# 6Unity 5.5C# 4 ​ 更多信息可以在 Unity 官网说明查看:Unity - Manual: C# compiler (u…

EMC学习笔记(七)阻抗控制(一)

阻抗控制(一) 1.特征阻抗的物理意义1.1 输入阻抗1.2 特征阻抗1.3 偶模阻抗、奇模阻抗、差分阻抗 2.生产工艺对阻抗控制的影响 1.特征阻抗的物理意义 1.1 输入阻抗 在集总电路中,输入阻抗是经常使用的一个术语 ,它的物理意义是: …

在 Debian 12 上安装 KubeSphere 实战入门

老 Z,运维架构师,云原生爱好者,目前专注于云原生运维,云原生领域技术栈涉及 Kubernetes、KubeSphere、DevOps、OpenStack、Ansible 等。 前言 知识点 定级:入门级KubeKey 安装部署 KubeSphere 和 KubernetesDebian 操…

arm64架构的linux中断分析(一)

文章目录 1. 中断的概念和作用2. Linux中断处理机制2.1 中断请求2.2 中断处理2.3 中断完成2.4.中断触发和处理步骤详解2.4.1 异常向量表的解读 2.5 硬件中断号和软件中断号 1. 中断的概念和作用 当计算机的CPU需要在执行任务的同时响应外部事件时,中断是一种重要的…

6月份读书学习好文记录

看看CHATGPT在最近几个月的发展趋势 https://blog.csdn.net/csdnnews/article/details/130878125?spm1000.2115.3001.5927 这是属于 AI 开发者的好时代,有什么理由不多去做一些尝试呢。 北大教授陈钟谈 AI 未来:逼近 AGI、融进元宇宙,开源…

kafka消息队列的初步探索

消息队列的作用就是提高运行速度,防止线程堵塞。 kafka的作用 异步 通过在消息队列发送消息的方式,将对应的业务作为监听者,此时我们只需要考虑发送消息的时间即可,大大提高了运行的速度。 解耦 如果使用原来的直接调用对应业务的…

Spring高手之路6——Bean生命周期的扩展点:BeanPostProcessor

文章目录 1. 探索Spring的后置处理器(BeanPostProcessor)1.1 BeanPostProcessor的设计理念1.2 BeanPostProcessor的文档说明 2. BeanPostProcessor的使用2.1 BeanPostProcessor的基础使用示例2.2 利用BeanPostProcessor修改Bean的初始化结果的返回值2.3 …

Nacos配置中心交互模型是push还是pull?

对于Nacos大家应该都不太陌生,出身阿里名声在外,能做动态服务发现、配置管理,非常好用的一个工具。然而这样的技术用的人越多面试被问的概率也就越大,如果只停留在使用层面,那面试可能要吃大亏。 比如我们今天要讨论的…

leetcode216. 组合总和 III(回溯算法-java)

组合总和 III leetcode216. 组合总和 III题目描述解题思路代码演示 回溯算法专题 leetcode216. 组合总和 III 来源:力扣(LeetCode) 链接:https://leetcode.cn/problems/combination-sum-iii 题目描述 找出所有相加之和为 n 的 k 个…

ldsc python程序安装以及测试

教程参考: https://zhuanlan.zhihu.com/p/379628546https://github.com/bulik/ldsc 1. 软件安装 1.1 windows安装教程 首先配置: anaconda,为了需要conda环境git,为了下载github中的ldsc程序 打开windows电脑中的promote&am…

阿里云服务器价格如何?与其他云服务提供商的价格对比如何?

阿里云服务器价格如何?与其他云服务提供商的价格对比如何?   阿里云服务器价格概述   作为全球领先的云计算服务提供商,阿里云在确保服务器性能和安全性的同时,也非常注重产品的价格竞争力。阿里云服务器(ECS&…

基于STM32 ARM+FPGA的电能质量分析仪方案(一)硬件设计

本章主要给出了本系统的设计目标和硬件设计方案,后面详细介绍了硬件电路的设计 过程,包括数据采集板、 FPGAARM 控制板。 3.1系统设计目标 本系统的主要目的是实现电能质量指标的高精度测量和数据分析,其具体技术指标如 下所示&#xff1…

微服务中常见问题

Spring Cloud 组件 Spring Cloud五大组件有哪些? Eureka:注册中心 Ribbon:负载均衡 Feign:远程调用 Hystrix:服务熔断 Zuul/Gateway:服务网关 随着SpringCloud Alibaba在国内兴起,我们项目中…

C语言/C++ 之 打飞机游戏

【项目简介】 1、设计思想:本项目主要是为了实现打飞机游戏,主要包括5个函数模块,和1个主函数框架。分别是chu_shi_hua();、you_cao_zuo;、wu_cao_zuo();、show();、main();等。项目完成过程中主要运用了C/C中的输入输…

网络爬虫是什么

网络爬虫又称网络蜘蛛、网络机器人,它是一种按照一定的规则自动浏览、检索网页信息的程序或者脚本。网络爬虫能够自动请求网页,并将所需要的数据抓取下来。通过对抓取的数据进行处理,从而提取出有价值的信息。 认识爬虫 我们所熟悉的一系列…

3 python进阶篇

文章目录 面向对象类属性和类方法类属性类方法静态方法 单例模式__new__ 方法类实现单例模式 异常 、模块和包异常自定义异常 模块和包模块的搜索顺序包的init文件发布模块(了解) 文件seek文件/目录的常用管理操作eval函数 补充性知识位运算小技巧 参考我…

Python入门教程:掌握for循环、while循环、字符串操作、文件读写与异常处理等基础知识

文章目录 for循环while循环字符串操作访问字符串中的字符切片总结字符串拼接 文件读写try...except 异常处理函数模块和包类和面向对象编程完结 for循环 在 Python 中,for 循环用于遍历序列(list、tuple、range 对象等)或其他可迭代对象。for…

Java中反射机制,枚举,Lambda的使用

目录 一、反射机制 1、含义 2、作用 3、※反射相关的几个类 3.1、Class类(Class对象是反射的基石) 3.2、Class类中相关的方法 3.2.1 (※重要)常用获得类相关的方法 3.2.2 (※重要)常用获得类中属性、变量Field相关的方法 3.2.3 获得类中注解相…