Elasticsearch中【文档查询】DSL语句以及对应的Java实现

目录

全文检索查询

精准查询

布尔查询 

排序、分页查询

高亮

地理查询

复合查询


Elasticsearch提供了基于JSON的DSL(Domain Specific Language)来定义查询。常见的查询类型包括:

  • 查询所有:查询出所有数据,一般测试用。例如:match_all

  • 全文检索(full text)查询:利用分词器对用户输入内容分词,然后去倒排索引库中匹配。例如:

    • match_query 

    • multi_match_query

  • 精确查询:根据精确词条值查找数据,一般是查找keyword、数值、日期、boolean等类型字段。例如:

    • ids

    • range

    • term

  • 地理(geo)查询:根据经纬度查询。例如:

    • geo_distance

    • geo_bounding_box

  • 复合(compound)查询:复合查询可以将上述各种查询条件组合起来,合并查询条件。例如:

    • bool

    • function_score

全文检索查询

单字段查询DSL:

GET /indexName/_search
{
  "query": {
    "match": {
      "字段名": "查询内容"
    }
  }
}

例子:

多字段查询DSL:(搜索字段越多,对查询性能影响越大 ,所以建议在创建索引时使用copy_to字段约束,将需要参与搜索的字段复制到all字段中)

        例如创建索引时,"name"字段设置了"copy_to"参数,将其值复制到"all"字段中。这意味着当你在Elasticsearch中索引一个文档时,文档的"name"字段的值会被同时复制到"all"字段中。这样一来,如果你想要在文档的所有字段中进行全文本搜索,只需要搜索"all"单个字段即可,而不需要分别搜索每个字段。

         这样对all进行单字段查询,性能也有很大提高。

GET /indexName/_search
{
  "query": {
    "multi_match": {
      "query": "搜索内容",
      "fields": ["字段名1", " 字段名2"]
    }
  }
}

Java实现全文查询:

依赖引入可查看我另一张博文第三部分:

        //1.准备Request
        SearchRequest request = new SearchRequest("hotel");
        //2.准备DSL
        request.source()
                .query(QueryBuilders.matchAllQuery());
        //3.发生请求
        SearchResponse response = client.search(request, RequestOptions.DEFAULT);

 对SearchResponse返回结果进行处理:

        //获取最外层的hits
        SearchHits hits = response.getHits();

        //获取总条数
        TotalHits totalHits = hits.getTotalHits();

        //获取里层的hits
        SearchHit[] searchHits = hits.getHits();

        //遍历每条数据
        for (SearchHit hit : searchHits) {
            //获取文档 _id
            String docId = hit.getId();

            //获取每条数据的_source部分(json数据),获取后做下一步处理
            String sourceAsString = hit.getSourceAsString();
        }

返回数据格式

各种查询主要不同的 是query()中构建的是何种查询,例如这里是match_all查询

构建match查询

QueryBuilders.matchQuery("name","酒店")

精准查询

DSL语句:

GET /jungle_study/_search
{
  "query": {
    "term": {
      "city": {
        "value": "北京"
      }
    }
  }
}

构建精确查询

QueryBuilders.termQuery("city","北京")

布尔查询 

复合查询的一种

bool查询中的逻辑关系:

  • must:必须匹配的条件,可以理解为“

  • should:选择性匹配的条件,可以理解为“

  • must_not:必须不匹配的条件,不参与打分

  • filter:必须匹配的条件,不参与打分

DSL:(查询name字段有酒店,并且价格范围在100-500之间的数据)

GET /jungle_study/_search
{
  "query": {
    "bool": {
      "must": [
        {
          "term": {
            "city": "北京"
          }
        },
        {
          "range": {
            "price": {
              "gte": 100,
              "lte": 500
            }
          }
        }
      ]
    }
  }
}

gte : >=  大于或等于

lte  : <=  小于或等于

gt   : >    大于

lt    : <    小于

构建布尔查询

QueryBuilders.boolQuery();
//添加查询条件
boolQuery.must(QueryBuilders.termQuery("city","上海")); //精确查询,添加city精确匹配条件
boolQuery.filter(QueryBuilders.rangeQuery("price").gte(100).lte(500)); //范围查询 ,添加条件价格在100-250之间

排序、分页查询

DSL:(排序和分页与query同级)

from :从哪条数据开始查

size :查询条数

sort :根据price(价格)倒叙排列查询结果

对应Java代码

    // 页码,每页大小
    int page = 1, size = 5;

    // 准备Request
    SearchRequest request = new SearchRequest("jungle_study");
    // 准备DSL
    request.source().query(QueryBuilders.matchAllQuery());

    // 排序 sort
    request.source().sort("price", SortOrder.ASC);
    // 分页 计算from 和 size
    request.source().from((page - 1) * size).size(size);

从DSL可以看出query和sort、from、size是同级,所以也是request.source()去点

高亮

根据搜索关键词对结果做高亮,就是在关键词中添加   <em></em> html标签

 DSL:(也是与query同级)

对查询内容 “酒店” 做高亮,高亮结果是与原数据  _source  同级的  highlight

当我们是使用  all  字段(对所有做过copy_to约束的字段)去做搜索时,需要配置require_field_match属性为false,表示不与查询字段  all  做匹配

 Java代码:

//用request.source()去点,进行配置高亮
request.source().highlighter(new HighlightBuilder().field("name").requireFieldMatch(false));

获取高亮结果:

            // 根据字段名获取高亮结果
            HighlightField highlightField = highlightFields.get("name");

            //不为空时才做下一步处理,
            if (highlightField != null) { 
                // 获取高亮值
                String name = highlightField.getFragments()[0].string();
                //可以覆盖原来的值
            }

地理查询

矩形范围查询DSL:

top_left : 左上坐标点    

bottom_right  :右下坐标点

范围查询

查询一个坐标点的五公里范围内的数据

#根据中心点做范围查询
GET /jungle_study/_search
{
  "query": {
    "geo_distance": {
      "distance": "5km", 
      "location": "31.21,121.5" 
    }
  }
}

"121.5" 是经度(longitude)

"31.21" 是纬度(latitude)

Java中实现:

构建矩形范围查询条件

GeoBoundingBoxQueryBuilder location = QueryBuilders.geoBoundingBoxQuery("location");
//左上坐标点
GeoPoint geoPoint = location.topLeft();
geoPoint.resetLat(31.21);
geoPoint.resetLon(121.5);
//右下坐标点
GeoPoint bottomRight = location.bottomRight();
bottomRight.resetLat(31.21);
bottomRight.resetLon(121.5);


 构建距离范围查询条件

QueryBuilders.geoDistanceQuery("location").distance("5km");

复合查询

常见的有两种 布尔查询 算分函数查询

查询结果中有  _score  代表与搜索词条的关联度打分,结果按照分值降序排列,分越高则排在最前

 ES中使用BM25算法进行词条和文档的相关度做打分。

DSL:

GET /jungle_study/_search
{
  "query": {
    "constant_score": {
      "filter": {
        "term": { "user.id": "kimchy" }
      },
      "boost": 1.2
    }
  }
}

 Java实现:

 @Test
    void testFunctionScore() {
        //1.准备Request
        SearchRequest request = new SearchRequest("jungle_study");

        //构建条件
        BoolQueryBuilder boolQuery = QueryBuilders.boolQuery();
        boolQuery.must(QueryBuilders.termQuery("city","北京")); //精确匹配
        boolQuery.filter(QueryBuilders.rangeQuery("price").gte(100).lte(500)); //范围查询 ,价格在100 - 250

        // 2.算分控制
        FunctionScoreQueryBuilder functionScoreQuery =
                QueryBuilders.functionScoreQuery(
                        // 原始查询,相关性算分的查询
                        boolQuery,
                        // function score的数组
                        new FunctionScoreQueryBuilder.FilterFunctionBuilder[]{
                                // 其中的一个function score 元素
                                new FunctionScoreQueryBuilder.FilterFunctionBuilder(
                                        // 过滤条件
                                        QueryBuilders.termQuery("isAD", true),
                                        // 算分函数
                                        ScoreFunctionBuilders.weightFactorFunction(10)
                                )
                        });
        request.source().query(functionScoreQuery);
    }

 代码与DSL对比说明:

 有关复合查询的官方文档地址:Constant score query | Elasticsearch Guide [7.16] | Elastic

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/592194.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【业务场景】京东实际场景,频繁GC引起的CPU飙高问题的解决

目录 1.业务介绍 2.判断任务类型 3.CPU飙高的原因 1.业务介绍 本文的业务场景是京东零售线公开的一篇文章&#xff0c;文章内容详细介绍了京东零售线如何将广告相关的定时任务从半小时优化到秒级的&#xff0c;原文链接&#xff1a; 半小时到秒级&#xff0c;京东零售定时…

BUUCTF:Web 解析(一)

前言 Buuctf Web 是一个在线安全挑战平台&#xff0c;旨在提高参与者对网络安全的理解和实践能力。本文将详细介绍 Buuctf Web 的特点、挑战和机遇&#xff0c;帮助读者更好地了解这一领域。 一、Buuctf Web 的特点 多样化的挑战场景&#xff1a;Buuctf Web 提供了多种挑战场…

Redis事务,管道,发布订阅

Redis事务 redis事务本质上是一组命令的集合,按照顺序串行化执行命令而不被其他命令打断 redis事务开启后将要执行的命令放到事务队列中,提交事务后一次性顺序排他地执行所有命令 关键词:单线程,无隔离级别,不保证原子性,排他性,顺序性 要注意和mysql的acid进行区分 怎么用…

【JavaEE】多线程安全问题

文章目录 1、什么是多线程安全问题2、出现线程不安全的原因2.1 线程在系统中是随机调度&#xff0c;抢占式执行的2.2 多个线程同时修改同一个变量2.3 线程针对变量的修改操作&#xff0c;不是“原子”的2.4 内存可见性问题2.5 指令重排序 3 、如何解决线程安全问题3.1 锁操作3.…

2024年3月Scratch图形化编程等级考试(三级)真题试卷

2024年3月Scratch图形化编程等级考试&#xff08;三级&#xff09;真题试卷 选择题 第 1 题 Scratch运行程序后&#xff0c;角色一定不会说出的数字是&#xff1f;&#xff08; &#xff09; A.2 B.4 C.6 D.8 第 2 题 Scratch角色初始位置如下图所示&#xff0c;右图…

14_Scala面向对象编程_属性

属性 1.类中属性声明 // 1.给Scala声明属性&#xff1b;var name :String "zhangsan"val age :Int 302.系统默认赋值 scala由于初始化变量必须赋值&#xff0c;为了解决此问题可以采用下划线赋值&#xff0c;表示系统默认赋值 , –但是此方法局限于变量&…

ArkTS开发原生鸿蒙HarmonyOS短视频应用

HarmonyOS实战课程“2024鸿蒙零基础快速实战-仿抖音App开发&#xff08;ArkTS版&#xff09;”已经于今日上线至慕课网&#xff08;https://coding.imooc.com/class/843.html&#xff09;&#xff0c;有致力于鸿蒙生态开发的同学们可以关注一下。 课程简介 本课程以原生鸿蒙Ha…

Hibernate执行流程分析及配置文详解

目录 1、Hibernate执行流程分析及配置文件详解 1&#xff09;Configuration对象 2&#xff09;ServiceRegistry对象&#xff08;hibernate4的新特性&#xff09; 3&#xff09;SessionFactory对象 4&#xff09;Session对象 5&#xff09;Transaction对象 6&#xff09;…

缓冲流,BufferReader,BufferWriter,案例

IO流的体系 字节缓冲流的作用 提高字节流读取数据的性能 *原理&#xff1a;字节缓冲输入流自带了8Kb的缓冲池&#xff0c;字节缓冲输出流也自带了8kb的缓冲池 构造器说明public BufferedInputStream(InputStream is)把低级的字节输入流包装成一个高级的缓冲字节输入流&#…

对链表进行插入排序(详细解析)

对链表进行插入排序&#xff08;详解&#xff09; 题目&#xff1a; 对链表进行插入排序 给定单个链表的头 head &#xff0c;使用 插入排序 对链表进行排序&#xff0c;并返回 排序后链表的头 。 插入排序 算法的步骤: 插入排序是迭代的&#xff0c;每次只移动一个元素&a…

特斯拉FSD落地分析

再续前缘 媒体的神经从马斯克的湾流私人飞机起飞那一刻开始,就开始被牵动着。28/4 号的突然访华,在大多数人看来其实已经早已是计划之中,从摆在台面上的消息来看,主要目的是为了在大陆推广FSD的落地,也为8月份FSD 的正式版本做预热,和中国上海的第一次联姻造就了特斯拉m…

17 内核开发-内核内部内联汇编学习

​ 17 内核开发-内核内部内联汇编学习 课程简介&#xff1a; Linux内核开发入门是一门旨在帮助学习者从最基本的知识开始学习Linux内核开发的入门课程。该课程旨在为对Linux内核开发感兴趣的初学者提供一个扎实的基础&#xff0c;让他们能够理解和参与到Linux内核的开发过程中…

【Linux】进程exec函数族以及守护进程

一.exec函数族 1.exec函数族的应用 在shell下敲shell的命令都是在创建shell的子进程。而我们之前学的创建父进程和子进程代码内容以及通过pid与0的关系来让父子进程执行不同的代码内容都是在一个代码文件里面&#xff0c;而shell是如何做到不在一个文件里面写代码使之成为子进…

06|LangChain | 从入门到实战 -六大组件之Agent

点点赞~ 注意&#xff1a;langchain的版本迭代比较快&#xff0c;社区维护&#xff0c;代码当中或许部分方法在某个版本不再支持 01&#xff5c;LangChain | 从入门到实战-介绍 02&#xff5c;LangChain | 从入门到实战 -六大组件之Models IO 03&#xff5c;LangChain | 从入…

asp.net结课作业中遇到的问题解决2

目录 1、如何实现评论交流的界面 2、如果想要将文字添加到数据库中&#xff0c;而不是乱码&#xff0c;该怎么修改 3、如果想要添加的数据已经存在于数据库&#xff0c;就不允许添加了&#xff0c;该如何实现 4、想要实现某个模块下有好几个小的功能该如何实现 5、想要实现…

代码随想录算法训练营第25天 | 216.组合总和III、17.电话号码的字母组合

代码随想录算法训练营第25天 | 216.组合总和III、17.电话号码的字母组合 自己看到题目的第一想法看完代码随想录之后的想法 链接: 216.组合总和III 链接: 17.电话号码的字母组合 自己看到题目的第一想法 216.组合总和III&#xff1a;递归函数终止条件为搜索得到的数相加为n&…

【架构系列】RabbitMQ应用场景及在实际项目中如何搭建可靠的RabbitMQ架构体系

作者:后端小肥肠 创作不易&#xff0c;未经允许禁止转载。 1. 前言 RabbitMQ&#xff0c;作为一款高性能、可靠的消息队列软件&#xff0c;已经成为许多企业和开发团队的首选之一。它的灵活性和可扩展性使得它适用于各种应用场景&#xff0c;从简单的任务队列到复杂的分布式系统…

阿里低代码引擎学习记录

官网 一、关于设计器 1、从设计器入手进行低代码开发 设计器就是我们用拖拉拽的方法&#xff0c;配合少量代码进行页面或者应用开发的在线工具。 阿里官方提供了以下八个不同类型的设计器Demo&#xff1a; 综合场景Demo&#xff08;各项能力相对完整&#xff0c;使用Fusion…

【前端项目——分页器】手写分页器实现(JS / React)

组件介绍 用了两种方式实现&#xff0c;注释详细~ 可能代码写的不够简洁&#xff0c;见谅&#x1f641; 1. 包含内容显示的分页器 网上看了很多实现&#xff0c;很多只有分页器部分&#xff0c;没和内容显示联动。 因此我增加了模拟content的显示&#xff0c;这里模拟了32条数…

Python数据分析案例44——基于模态分解和深度学习的电负荷量预测(VMD+BiGRU+注意力)

案例背景 承接之前的案例&#xff0c;说要做模态分解加神经网络的模型的&#xff0c;前面纯神经网络的缝合模型参考数据分析案例41和数据分析案例42。 虽然我自己基于各种循环神经网络做时间序列的预测已经做烂了.....但是还是会有很多刚读研究生或者是别的领域过来的小白来问…