kibana es 语法记录 elaticsearch

目录

一、认识elaticsearch

1、什么是正向索引

2、什么是倒排索引

二、概念

1、说明

2、mysql和es的对比

三、mapping属性

1、定义

四、CRUD

1、查看es中有哪些索引库

2、创建索引库

3、修改索引库

4、删除索引库

5、新增文档

6、删除文档

5、条件查询


一、认识elaticsearch

elasticsearch基于倒排索引结构

1、什么是正向索引

正向索引就像mysql数据库,如果根据非索引字段查询数据,会逐行获取表中所有数据,然后判断是否满足规则

例如:设置数据库中有title字段,为非索引字段流程如下:

1)用户搜索数据,条件是title符合`"%手机%"`

2)逐行获取数据,比如id为1的数据

3)判断数据中的title是否符合用户搜索条件

4)如果符合则放入结果集,不符合则丢弃。回到步骤1

2、什么是倒排索引

  • 文档:就是用来搜索的数据,等同于mysql数据库中的一条记录
  • 词条:利用分词器分出来的词条,例如数据中title为:我是中国人,分词器就可以分为:我 、是、 中国人、 中国、 国人等几个词条出来

* 将每一个文档的数据利用算法分词,得到一个个词条
* 创建表,每行数据包括词条、词条所在文档id、位置等信息
* 因为词条唯一性,可以给词条创建索引,例如hash表结构索引

流程:

1)用户输入条件`"华为手机"`进行搜索。

2)对用户输入内容**分词**,得到词条:`华为`、`手机`。

3)拿着词条在倒排索引中查找,可以得到包含词条的文档id:1、2、3。

4)拿着文档id到正向索引中查找具体文档。

  • 正向索引是最传统的,根据id索引的方式。但根据词条查询时,必须先逐条获取每个文档,然后判断文档中是否包含所需要的词条,是**根据文档找词条的过程。
  • 而倒排索引**则相反,是先找到用户要搜索的词条,根据词条得到保护词条的文档的id,然后根据id获取文档。是**根据词条找文档的过程。

二、概念

1、说明

elasticsearch是面向document存储的,一个doc就是数据库的一条记录,该条记录会被序列化成json的格式存入文档中,文档中包含很多的字段(filed)等同于数据库中的列

2、mysql和es的对比

三、mapping属性

1、定义

mapping是对文档中field的约束,例如对字段类型的约束。就像数据库中的表结构

  • * type:字段数据类型,常见的简单类型有:
    •   * 字符串:text(可分词的文本)、keyword(精确值,例如:品牌、国家、ip地址)
    •   * 数值:long、integer、short、byte、double、float、
    •   * 布尔:boolean
    •   * 日期:date
    •   * 对象:object
  • * index:是否创建索引,默认为true
  • * analyzer:使用哪种分词器
  • * properties:该字段的子字段

例如下面的json文档:

{
    "age": 21,
    "weight": 52.1,
    "isMarried": false,
    "info": "这是一个程序员",
    "email": "nuanqin@163.com",
    "score": [99.1, 99.5, 98.9],
    "name": {
        "firstName": "思",
        "lastName": "陈"
    }
}

对应的每个字段映射(mapping):

  • * age:类型为 integer;参与搜索,因此需要index为true;无需分词器
  • * weight:类型为float;参与搜索,因此需要index为true;无需分词器
  • * isMarried:类型为boolean;参与搜索,因此需要index为true;无需分词器
  • * info:类型为字符串,需要分词,因此是text;参与搜索,因此需要index为true;分词器可以用ik_smart
  • * email:类型为字符串,但是不需要分词,因此是keyword;不参与搜索,因此需要index为false;无需分词器
  • * score:虽然是数组,但是我们只看元素的类型,类型为float;参与搜索,因此需要index为true;无需分词器
  • * name:类型为object,需要定义多个子属性
  •   * name.firstName;类型为字符串,但是不需要分词,因此是keyword;参与搜索,因此需要index为true;无需分词器
  •   * name.lastName;类型为字符串,但是不需要分词,因此是keyword;参与搜索,因此需要index为true;无需分词器

四、CRUD

可采用es的可视化工具kibana进行执行CRUD语句,

入口:kibana的Dev Tools

1、查看es中有哪些索引库

GET /_cat/indices?v

2、创建索引库

PUT /索引库名称
{
  "mappings": {
    "properties": {
      "字段名":{
        "type": "text",
        "analyzer": "ik_smart"
      },
      "字段名2":{
        "type": "keyword",
        "index": "false"
      },
      "字段名3":{
        "properties": {
          "子字段": {
            "type": "keyword"
          }
        }
      },
      // ...略
    }
  }
}

3、修改索引库

倒排索引结构虽然不复杂,但是一旦数据结构改变(比如改变了分词器),就需要重新创建倒排索引,这简直是灾难。因此索引库**一旦创建,无法修改mapping**。

虽然无法修改mapping中已有的字段,但是却允许添加新的字段到mapping中,因为不会对倒排索引产生影响。

PUT /索引库名/_mapping
{
  "properties": {
    "新字段名":{
      "type": "integer"
    }
  }
}

4、删除索引库

    DELETE /索引库名

5、新增文档

新增文档类似于数据库的新增一条记录

POST /索引库名/_doc/文档id
{
    "字段1": "值1",
    "字段2": "值2",
    "字段3": {
        "子属性1": "值3",
        "子属性2": "值4"
    },
    // ...
}

#例如:
POST /heima/_doc/1
{
    "info": "我是一个程序员",
    "email": "nuanqin@163.com",
    "name": {
        "firstName": "思",
        "lastName": "陈"
    }
}

6、删除文档

DELETE /{索引库名}/_doc/id值

5、条件查询

基本语法:

  • * 请求方式:PUT
  • * 请求路径:/索引库名,可以自定义,若不带索引库名代表查询所有库
  • * 请求参数:mapping映射
  • *_search代表搜索
#带索引库名 -->
GET /index_name/_search
{
  "query": {
    "match_all": {}
  }
}

#不带索引库名
GET /_search
{
  "query": {
    "match_all": {}
  }
}

#用于搜索字段中包含特定文本的文档:
GET /index_name/_search
{
  "query": {
    "match": {
      "message": "error"
    }
  }
}

#精确匹配字段值
GET /index_name/_search
{
  "query": {
    "term": {
      "status": "200"
    }
  }
}

#组合查询多个条件
GET /index_name/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "message": "error" } },
        { "term": { "status": "200" } }
      ]
    }
  }
}

#过滤特定范围内的数据
GET /my-index/_search
{
  "query": {
    "range": {
      "field_name": {
        "gte": "2024-01-01",
        "lte": "2024-01-31"
      }
    }
  }
}

#分页查询
GET /my-index/_search
{
  "query": {
    "match_all": {}
  },
  "from": 0,
  "size": 10
}

#排序查询
GET /my-index/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [
    { "field_name": { "order": "asc" } }
  ]
}

#完整示例
GET /my-index/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "title": "Elasticsearch" } }
      ],
      "filter": [
        { "range": { "timestamp": { "gte": "2024-01-01", "lte": "2024-01-31" } } }
      ],
      "must_not": [
        { "term": { "status": "deleted" } }
      ]
    }
  },
  "aggs": {
    "status_count": {
      "terms": {
        "field": "status",
        "size": 10
      }
    }
  },
  "sort": [
    { "timestamp": { "order": "desc" } }
  ],
  "from": 0,
  "size": 10
}

五、响应结果解析

1、took

  • 含义:表示 Elasticsearch 执行查询所花费的时间,单位为毫秒。

  • 示例"took": 4 表示查询耗时 4 毫秒。

2、timed_out

  • 含义:表示查询是否超时。如果查询在指定时间内完成,则为 false;如果超时,则为 true

  • 示例"timed_out": false 表示查询没有超时。

3、_shards

  • 含义:包含分片的统计信息,说明查询涉及的分片总数、成功分片数、跳过分片数和失败分片数。

  • 字段解析

    • total:查询涉及的分片总数。

    • successful:成功处理的分片数。

    • skipped:跳过的分片数。

    • failed:失败的分片数。

"_shards": {
          "total": 1,
          "successful": 1,
          "skipped": 0,
          "failed": 0
}

4、hits

  • 含义:包含查询结果的核心部分,包括匹配的文档列表和统计信息。

  • 字段解析

    • total

      • value:表示匹配查询条件的文档总数。

      • relation:表示 value 的准确性,eq 表示精确值,gte 表示大于或等于。

    • max_score:表示最相关文档的相关性得分(_score),如果没有使用相关性评分(如 match_all 查询),则为 null

    • hits:包含匹配的文档列表,每个文档是一个 JSON 对象,包含以下字段:

      • _index:文档所在的索引名称。

      • _type:文档的类型(在 7.x 以后默认为 _doc)。

      • _id:文档的唯一标识符。

      • _score:文档的相关性得分,表示文档与查询条件的匹配程度。

      • _source:文档的原始内容,包含所有字段的值。

      • sort:如果使用了排序,表示文档的排序值。

5、aggragations

  • 含义:如果查询中包含聚合操作(aggs),则此字段包含聚合结果。

  • 示例

"aggregations": {
          "ageAgg": {
                    "doc_count_error_upper_bound": 0,
                    "sum_other_doc_count": 0,
                    "buckets": [{
                                        "key": 38,
                                        "doc_count": 2
                                      },
                                      {
                                        "key": 28,
                                        "doc_count": 1
                                      } ]

                        },
          "ageAvg": {
            "value": 34.0
          }
}
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/970979.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

三、Unity基础(主要框架)

一、Unity场景概念 如果把游戏运行过程理解成表演,那么场景就是舞台; 场景本质上是一个配置文件,这个配置文件决定了场景中有哪些东西; 二、Scene和Game窗口 1、Scene 滚轮缩放、拖动 单独选中也可以 最下面这个是全能工具…

pdf文档提取信息

目录 一、前言二、核心代码说明1、PyPDF2提取文本2、pdfplumber提取文本和表格3、fitz提取文本和图片4、fitz按页提取图片一、前言 本博客文章介绍pdf的文本、图片、表格等信息提取的技术方案对比。目前比较熟知的是pdfplumber 、PyPDF2 、fitz(PyMuPDF)。 它们之间对比如下 …

Git指南-从入门到精通

代码提交和同步命令 流程图如下: 第零步: 工作区与仓库保持一致第一步: 文件增删改,变为已修改状态第二步: git add ,变为已暂存状态 bash $ git status $ git add --all # 当前项目下的所有更改 $ git add . # 当前目录下的所有更改 $ g…

我们来学HTTP/TCP -- 三次握手?

三次握手 题记三次呼叫结语 题记 来,我们来演示下川普王和普京帝会面了 哎呦!你好你好,握手…哎嗨!侬好侬好,握手…欧嘿呦玛斯,握手… 抓狂啊!作孽啊!!! 不说人话啊! 关键的是,“三…

kubectl top输出与Linux free命令不一致原因?

当你在 Kubernetes 集群中使用 kubectl top 命令查看资源使用情况时,可能会发现与在节点上直接运行 Linux free 命令得到的结果不一致。这种不一致可能源于多个原因,以下是一些关键因素: MobaXterm中文版下载: https://pan.quark…

【设计模式】【行为型模式】迭代器模式(Iterator)

👋hi,我不是一名外包公司的员工,也不会偷吃茶水间的零食,我的梦想是能写高端CRUD 🔥 2025本人正在沉淀中… 博客更新速度 👍 欢迎点赞、收藏、关注,跟上我的更新节奏 🎵 当你的天空突…

论文解读之DeepSeek R1

今天带来DeepSeek R1的解读 一、介绍 deepseek主打复杂推理任务,如数学、代码任务。 R1以预训练过的V1-base初始化,主要发挥了RL在长思维链上的优势,R1-Zero直接RL而在前置步骤中不进行SFT,即缺少了有监督的指令微调阶段&#…

Linux:用 clang 编译带 sched_ext 功能内核

文章目录 1. 前言2. 编译过程2.1 准备内核源代码2.2 安装编译工具2.3 配置、编译、运行2.3.1 配置2.3.2 编译2.3.3 运行 3. 参考资料 1. 前言 限于作者能力水平,本文可能存在谬误,因此而给读者带来的损失,作者不做任何承诺。 2. 编译过程 …

FPGA之​​​​​​​​​​​​​​HRBANK与HOBANK有什么区别?

在FPGA设计中,HP Bank(High-Performance Bank)与HR Bank(High-Range Bank)是针对I/O电气特性划分的不同区域,二者的主要区别在于支持的电压范围、信号速率以及应用场景。以下是具体对比: 核心区…

Ubuntu 下 nginx-1.24.0 源码分析 - ngx_ssl_init 函数

#if (NGX_OPENSSL)ngx_ssl_init(log); #endif objs/ngx_auto_config.h 中 #ifndef NGX_OPENSSL #define NGX_OPENSSL 1 #endif 所以这个条件编译成立 NGX_OPENSSL 是一个宏定义,用于控制与 OpenSSL 相关的功能是否被启用 若用户通过./configure参数(如-…

pandas(13 Caveats Gotchas和SQL比较)

前面内容:pandas(12 IO工具和稀松数据) 目录 一、Caveats警告 & Gotchas预见 1.1 在Pandas中使用if/Truth语句 1.2 位运算布尔 1.3 isin操作 1.4 重新索引reindex和 loc&iloc 使用注意事项 1.5 loc和iloc 二、Python Pandas 与SQL的比较 2.1 数…

MongoDB 7 分片副本集升级方案详解(下)

#作者:任少近 文章目录 1.4 分片升级1.5 升级shard11.6 升级shard2,shard31.7 升级mongos1.8重新启用负载均衡器1.9 推荐MongoDB Compass来验证数据 2 注意事项: 1.4 分片升级 使用“滚动”升级从 MongoDB 7.0 升级到 8.0,即在其他成员可用…

洛谷 P2894 USACO08FEB Hotel 题解

题意 第一行输入 n , m n,m n,m&#xff0c; n n n 代表有 n n n 个房间 ( 1 ≤ n ≤ 50 , 000 ) (1\leq n \leq 50,000) (1≤n≤50,000)&#xff0c;编号为 1 ∼ n 1 \sim n 1∼n&#xff0c;开始都为空房&#xff0c; m m m 表示以下有 m m m 行操作 ( 1 ≤ m < 50…

VS2022中.Net Api + Vue 从创建到发布到IIS

VS2022中.Net Api Vue 从创建到发布到IIS 前言一、先决条件二、创建项目三、运行项目四、增加API五、发布到IIS六、设置Vue的发布 前言 最近从VS2019 升级到了VS2022,终于可以使用官方的.Net Vue 组合了,但是使用过程中还是有很多问题,这里记录一下. 一、先决条件 Visual …

BGP分解实验·18——BGP选路原则之权重

在本地对进入的NLRI做权重设置&#xff0c;从而对过滤特定的路由进行优选。严格来说&#xff0c;权重值并不能算是路径属性&#xff0c;因为它并处传递&#xff0c;所能影响的仅仅限于本地路由器。 实验拓扑如下&#xff1a; 完成实验拓扑的基础实验&#xff0c;R1的配置如下…

正点原子ESP32S3系列开发板全面支持小智AI

什么是小智AI? 小智AI项目是由虾哥发起并开源的一个项目。该项目能帮助更多人入门AI硬件开发&#xff0c;了解如何将当下飞速发展的大语言模型应用到实际的硬件设备中。 小智AI功能如下&#xff1a; WiFi / ML307 Cat.1 4G BOOT键唤醒和打断&#xff0c;支持点击和长按两种触…

【2025最新计算机毕业设计】基于SpringBoot+Vue高校社团管理系统 【提供源码+答辩PPT+文档+项目部署】

作者简介&#xff1a;✌CSDN新星计划导师、Java领域优质创作者、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流。✌ 主要内容&#xff1a;&#x1f31f;Java项目、Python项目、前端项目、PHP、ASP.NET、人工智能…

探寻性能优化:如何衡量?如何决策?

目录 一、衡量指标说明 &#xff08;一&#xff09;响应时间&#xff08;Response Time&#xff09; 平均响应时间&#xff08;Average Response Time&#xff09; 百分位数响应时间&#xff08;Percentile Response Time&#xff09; &#xff08;二&#xff09;吞吐量&a…

YOLO11环境搭建CUDA12.6

1.安装CUDA和cuDNN 1.1安装CUDA 1.1.1查看当前你的电脑显卡支持的最高CUDA版本,后面的安装不能超过它 通过命令的方式查看 输入nvidia-smi 1.1.2 下载CUDA 官网地址:CUDA Toolkit Archive | NVIDIA Developer 选择cuda_12.6.3 下载完成后,如下: 安装,一直下一步即可:…

Java多线程——性能与可伸缩性

可伸缩性 当增加计算资源时&#xff08;如CPU、内存、存储容量或I/O带宽&#xff09;&#xff0c;程序的吞吐量或处理能力能相应的增加 Amdahl定理 F为必须被串行执行的部分&#xff0c;在N个处理器的机器中&#xff0c;在增加计算资源所能达到的最高加速比是 N趋于无穷大时…