简述Elasticsearch(ES)是什么 全文搜索概念 (倒排索引 管理文档)

今天 我们来说说 NoSql 中的 Elasticsearch 大家基本都叫它 ES
官方介绍 它是一个分布式全文搜索引擎
分布式是一个系统架构的概念
而 全文搜索引擎
全文搜索 可以说基本大家天天都在接触 就比如

我们京东购物 想买什么东西 在全文输入框中搜索 它就会在所有物品中 帮你找出需要的
在这里插入图片描述
它会将 所有的数据进行一个分类 然后 在你输入时 将与你输入内容想匹配的数据都推送出来
但 还有一个分类的概念

比如 我们只是靠name 搜索 用户搜索的 spring
那么 下图中 1 2 3 4都没有问题 但第五本书显然会被过滤掉 因为它的name 不包含内容
在这里插入图片描述
但是按照逻辑讲 他和 spring有关系 它应该要出现 所以 我们不能只按name查询

而 我们查询 spring 实战 那么 它们也该出来 只要能匹配上的 不管内容是否能完全一样 都要出来
这就是 全文搜搜 而 ES 就是一个全文搜索的解决方案
在这里插入图片描述
全文搜索 思路是 将某个内容分词
例如 Spring实战 第5版
那么 词就会被拆分为
Spring
实战
第5版
在这里插入图片描述
当然 也不能乱拆 就比如 我每个字母 每一个字符都拆
那用户输入什么都带出来一大片没有意义的数据

我们 我们通过关键字分组
例如 我们输入 Spring 为搜索关键字 那么 就会带出 1 2 3 4 5条数据的 数据id与部分字段内容
实战为关键字 就会带出 第1条数据的 id与部分内容字段
di5版也是 会带出第一条数据的 id和部分字段数据
在这里插入图片描述
就比如 进洞 我们搜素电动 他就会带出 很多关于电动物品的信息
但是 这里 每条数据都只是带出了一部分信息
在这里插入图片描述
当我们点击某个进去 查看详情 它其实是将你点的数据 id拿到 然后根据id再去查询详情
在这里插入图片描述
因为有些字段 外面展示本来就不需要呀 就比如这个视频 外面用过图片就好了 进来了再加载视频这种很大的东西 要不然 匹配出 一百个商品 还加载 一百个视频吗?

那么 就是说 全文搜索 我们先要对提供的数据进行分词 将一个文本 分词若干个关键字
然后 通过这些关键字 帮助用户匹配出符合要求的数据

这种方式 会大大提高搜索效率
还有就是 索引的概念 我们传统索引是根据id查数据
而这里 我们是根据数据得到id 这个过程叫倒排索引 然后再用id获取数据 用传统索引都OK

然后就是 我们为了更好的管理 需要提前建立关系 每个关键字 对应 某些数据 部分内容与id的数据关系 被我们称作文档
例如 Spring 关键字 对应 1 2 3 4 5 条数据的 id与部分字段 这个对应关系 就是一个文档
创建无数个文档 存入 这样就会方便使用
然后就是 根据关键字 使用文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/344889.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Pytest中conftest.py的用法

Pytest中conftest.py的用法 ​ 在官方文档中,描述conftest.py是一个本地插件的文件,简单的说就是在这个文件中编写的方法,可以在其他地方直接进行调用。 注意事项 只能在根目录编写conftest.py 插件加载顺序在搜集用例之前 基础用法 这里…

自由落体(C语言刷题)

专栏(刷题):https://blog.csdn.net/2301_79293429/category_12545690.html 这一题直接给我梦回高中😶‍🌫️ //题目理解:小车开始运动的时候小球都开始下落, // 需要知道下落到 小车顶部的时间 和 落地的时间&#xf…

RC滤波电路的原理

RC滤波电路分为低通滤波和高通滤波 低通滤波通过低频信号 看上面这两个电路 先分析低通滤波 由于电容C具有隔直通交的特性,所以输入的高频分量相当于经过电阻R后直接对地短接,并没有输出到后端负载上,只有低频的输入分量才会输出到后端。 电…

怎样进行医学论文翻译,需要掌握哪些技能?

众所周知,医学领域是一个高度专业化的领域,其中包含了大量的研究成果和学术论文。通过翻译医学论文,可以促进国际医学专家之间的使用、借鉴与交流,进而提高医学水平。那么,怎样进行医学论文翻译比较好呢?翻…

Spring Boot 中的外部化配置

Spring Boot 中的外部化配置 一、配置文件基础1.配置文件格式(1)YAML 基本语法规则(2)YAML 支持三种数据结构 2.application 文件3.application.properties 配置文件4.application.yml 配置文件5.Environment6.组织多文件7.多环境…

【JavaEE进阶】 MyBatis使用XML实现增删改查

文章目录 🎍前言🍀配置连接字符串和MyBatis🍃写持久层代码🚩添加mapper接⼝🚩添加UserInfoXMLMapper.xml🚩单元测试 🌴增(Insert)🚩返回⾃增id 🎋删(Delete)&…

spring Cloud Stream 实战应用深度讲解

springCloudStream 简介 Spring Cloud Stream是一个框架,用于构建与共享消息传递系统连接的高度可扩展的事件驱动微服务。 该框架提供了一个灵活的编程模型,该模型建立在已经建立和熟悉的 Spring 习惯用语和最佳实践之上,包括对持久发布/订…

matlab appdesigner系列-常用18-表格

表格,常用来导入外部表格数据 示例: 导入外界excel数据:data.xlsx 姓名年龄城市王一18长沙王二21上海王三56武汉王四47北京王五88成都王六23长春 操作步骤如下: 1)将表格拖拽到画布上 2)对app1右键进行…

解决方案 | 基于SFTP协议的文件传输断点续传Java实现方案

背景 因项目需要,我们服务每天都需要通过SFTP协议来对接上下游进行文件传输,但是对于一些大文件,在与第三方公司的服务器对接过程中很可能会因为网络问题或上下游服务器性能问题导致文件上传或者下载被中断,每次重试都需要重新对…

骨传导是表示啥?骨传导耳机的工作原理是什么

近期,骨传导耳机这种创新的产品引发了市场关注,也引起了大量用户的疑问:骨传导是表示啥?骨传导的工作原理是什么?下面让我们来详细解析一下骨传是表示啥?以及骨传导耳机的工作原理是什么。 骨传导是表示啥&…

在Word中插入高亮/好看代码

Md2All 一个markdown工具 Md2All 网址 代码一定要用code 高亮主题可选 atom-one-light > 复制到word > 调节字体可选Cnsolas, 间距等 效果 另一个高亮工具 效果

集简云新增邮件发送功能,适用多种创意场景并提升邮件发送效率

在数字营销中,电子邮件依旧是连接企业与客户的重要桥梁。集简云深知这一点,本周推出为企业通讯打造的内置应用——集简云邮件发送,帮助用户创建充满个性化的交易电子邮件,还能通过HTML自定义代码来实现用户的创意场景。可与近千款…

多态应用实例

目录 多态优点1.模拟冲泡饮品过程2.电脑组装 多态优点 多态的优点: 代码组织结构清晰;可读性强;利于前期和后期的扩展以及维护。 如果想扩展新的功能,不需要修改源码,遵循开发中开闭原则,只需在补充所需…

yml配置文件怎么引用pom.xml中的属性

目录 前言配置测试 前言 配置文件中的一些参数有时要用到pom文件中的属性,做到pom文件变配置文件中也跟着变,那如何才能做到呢,下面咱们来一起探讨学习。 配置 1.首先要在pom.xml中做如下配置,让maven渲染src/main/resources下配…

性能优化(CPU优化技术)-NEON 介绍

「发表于知乎专栏《移动端算法优化》」 本节主要介绍基本 SIMD 及其他的指令流与数据流的处理方式,NEON 的基本原理、指令以及与其他平台及硬件的对比。 🎬个人简介:一个全栈工程师的升级之路! 📋个人专栏:…

【力扣】记录一下竞赛分上 Knight

记录一下力扣上 Knight 力扣的题还是相对来说比较简单的,前两个月写的题多一点,后面几乎都是只做了每日一题,感觉正常来说刷个两三个月的题水平就差不多够了,甚至在我才刷半个月的时候就可以做三题了,排名和现在差不多…

vue3源码(二)reactiveeffect

一.reactive与effect功能 reactive方法会将对象变成proxy对象&#xff0c; effect中使用reactive对象时会进行依赖收集&#xff0c;稍后属性变化时会重新执行effect函数。 <div id"app"></div><script type"module">import {reactive,…

2024年需要重点关注的15种计算机病毒

2024年&#xff0c;计算机病毒威胁变得愈发多元化和复杂化。涉及勒索病毒、二维码病毒、挖矿木马等15种类型&#xff0c;这些病毒从数据勒索到系统入侵&#xff0c;对全球网络安全构成严峻挑战。 2024年&#xff0c;计算机病毒威胁变得愈发多元化和复杂化。涉及勒索病毒、二维码…

Java 报错java.Net.UnknownHostException:raw.githubusercontent.com

1.问题 今天在vscode 学习如何使用 plantUML生成图片的时候&#xff0c;发生错误 java.util.concurrent.ExecutionException: java.net.UnknownHostException: raw.githubusercontent.com issue raw.githubusercontent.com java.util.concurrent.ExecutionException: java.n…

vulhub之Zabbix篇

CVE-2016-10134--SQL注入 一、漏洞介绍 zabbix是一款服务器监控软件&#xff0c;其由server、agent、web等模块组成&#xff0c;其中web模块由PHP编写&#xff0c;用来显示数据库中的结果。 漏洞环境 在vulhub靶场进行复现&#xff0c;启动zabbix 3.0.3。 二、复现步骤 1…