Elasticsearch是做什么的?

初识elasticsearch

官方网站:Elasticsearch:官方分布式搜索和分析引擎 | Elastic

Elasticsearch是做什么的?

Elasticsearch 是一个分布式搜索和分析引擎,专门用于处理大规模数据的实时搜索、分析和存储。它基于 Apache Lucene 构建,能够快速、高效地执行全文搜索、结构化搜索以及数据分析任务。由于其强大的功能,Elasticsearch 常用于以下几种场景:

1. 全文搜索
Elasticsearch 提供快速、精确的全文搜索,支持复杂查询如模糊匹配、短语搜索、词条权重,广泛用于内容管理系统、电子商务、社交平台等。

2. 数据分析
通过聚合功能,Elasticsearch 可高效进行实时数据分析,支持多维聚合查询,适用于日志分析、业务数据分析等场景。

3. 日志与监控
结合 Elastic Stack(Logstash、Kibana),Elasticsearch 实现实时日志采集、分析和可视化,常用于系统监控、错误检测等。

4. 数据存储
作为分布式文档存储,Elasticsearch 可水平扩展,处理海量数据,保证高可用性和故障冗余。

5.地理位置查询
支持地理空间查询,适用于地图应用、物流、外卖等基于位置的服务场景。

核心特点

倒排索引:Elasticsearch 使用倒排索引来快速查找文档中包含特定词语的条目,特别适合全文搜索场景。

分布式架构:它天生支持水平扩展,允许在集群中分布和存储数据,保证性能和高可用性。

实时性:数据索引和搜索可以在毫秒级内完成,非常适合需要实时响应的数据查询场景。

RESTful API:通过简单的 RESTful API 进行操作,便于与其他系统集成。

典型应用场景

  1. 搜索引擎:用于内容搜索、产品搜索(如电商网站)、文档搜索等。
  2. 日志分析:通过 Elastic Stack(包括 Logstash 和 Kibana),构建日志管理和监控系统。
  3. 推荐系统:电商、流媒体、社交平台等使用 Elasticsearch 进行个性化推荐。
  4. 实时数据分析:企业实时分析海量数据,用于业务决策。

倒排索引是什么?和MySQL数据库有什么不同?

倒排索引(Inverted Index)是一种数据结构,广泛用于全文搜索引擎中。它的主要作用是将文档与其包含的单词进行关联,从而实现快速的文本检索。

基本原理:

        文档与词汇表的映射:倒排索引将每个单词(或词项)映射到包含该单词的文档列表中。相比于传统的正排索引(即存储文档到词汇的映射),倒排索引更加高效。

        结构:倒排索引通常包括两个主要部分:词汇表和文档列表。

假设有三个文档:

        文档1:我 爱 编程

        文档2:我 爱 学习

        文档3:编程 很有趣

构建倒排索引后的结构如下:

倒排索引与 MySQL 数据库的不同:

  • 数据存储结构

    • 倒排索引:主要用于存储词项与文档之间的映射,更加适合文本搜索。
    • MySQL:使用行或列存储数据,通常是基于表的关系型数据库。
  • 查询性能

    • 倒排索引:在处理全文搜索时,可以快速查找包含特定词项的所有文档,支持复杂的查询。
    • MySQL:虽然支持索引(如B树索引),但在处理复杂的文本搜索时性能不如倒排索引。
  • 更新效率

    • 倒排索引:对于频繁更新的文档,重建索引的开销较大。
    • MySQL:支持行级更新,但对于大量数据的复杂查询,性能可能下降。

倒排索引的搜索流程如下(以搜索"华为手机"为例),如图:

流程描述:

1.用户输入条件"华为手机"进行搜索。

2.对用户输入条件分词,得到词条:华为手机

3.拿着词条在倒排索引中查找(由于词条有索引,查询效率很高),即可得到包含词条的文档id:1、2、3

4.拿着文档id到正向索引中查找具体文档即可(由于id也有索引,查询效率也很高)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/895410.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

python语言入门必须要学习的模块化编程案例游戏---画图案例(三)【源码大全】

彩虹五角星 import turtle #引用turtle库 q turtle.Pen() #构造画笔 turtle.bgcolor("black") …

windows mysql 8.0版本重置root密码

1.停止mysql服务 以管理员运行cmd 2.安全模式启动 mysqld --console --skip-grant-tables --shared-memory 3.修改密码 再开个cmd窗口就可以进入了:mysql 先进入mysql database:use mysql 修改密码:ALTER USER rootlocalhost IDENTIFIED …

数据链路层数据帧格式及网络层IP数据包格式

数据帧格式 前导码:进入物理层之前的缓冲区,包含的是7个字节(56比特)交替出现的0和1,作用:提醒接受系统有帧到来,并且使它与输入定时同步 帧起始定界符:1字节(8比特&…

《深度学习》【项目】自然语言处理——情感分析 <下>

目录 一、了解项目 1、任务 2、文件内容 二、续接上篇内容 1、打包数据,转化Tensor类型 2、定义模型,前向传播函数 3、定义训练、测试函数 4、最终文件格式 5、定义主函数 运行结果: 一、了解项目 1、任务 对微博评论信息的情感分…

基础IO -- 理解文件(2)

目录 三:理解文件 1.先用和认识系统调用的文件操作 a. 标记位传参的理解 b.文件打开后权限 c. 关闭文件 d. 向文件里写入 2.引入文件操作符fd 3.理解fd 4.Linux下一切皆文件 5.解决前面衍生出的一些问题 C语言FILE*的理解 C语言为什么这么做 三&#xff…

视觉检测解决方案

视觉检测解决方案是一种利用计算机视觉技术模拟人类视觉功能,对工业产品进行非接触式的图像采集、处理与分析,以实现自动化检测、识别与测量的过程。以下是朗观视觉小编对视觉检测解决方案的详细阐述: 一、技术原理 视觉检测解决方案主要基于…

21世纪当代国学易经起名大师颜廷利:全球知名哲学家思想家

融合儒道精髓,东方智慧倡和谐与品德,道家无为而治显自然之道。21世纪全球最具影响力的思想家颜廷利哲学深思,西方哲学则重人本、实用与理性,科学思维引领实证探索,共绘智慧新篇章。 当代知名哲学家思想家教育家颜廷利的…

前端html css js 练习巩固沉淀2

做一个这样的特效 相当于步骤一样的样式逻辑 我直接粘贴代码了 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0">…

【02】Windows特殊权限-Trustedinstaller

知识点&#xff1a; “TrustedInstaller” 是 Windows 操作系统中的一个特殊账户&#xff0c;用于管理和保护重要的系统文件。它是 Windows 模块安装程序 (Windows Modules Installer) 的一部分&#xff0c;负责安装、修改和删除 Windows 更新和可选组件。默认情况下&#xff…

【C++篇】领会C++标准库:STL

文章目录 前言 &#x1f4ac; 欢迎讨论&#xff1a;如果你在学习过程中有任何问题或想法&#xff0c;欢迎在评论区留言&#xff0c;我们一起交流学习。你的支持是我继续创作的动力&#xff01; &#x1f44d; 点赞、收藏与分享&#xff1a;觉得这篇文章对你有帮助吗&#xff1…

5、JavaScript(四) ajax+js高级+BOM

25.ajax : 前端向后端异步的取数据而无需刷新页面的技术 1 公司中的整体工作流程 1、项目开发的流程 每个职位该做的工作&#xff1a; 产品经理&#xff1a;提需求的 与客户沟通 画出原型图给程序员使用 UI设计师&#xff1a;美化 替换UI框架&#xff1a;antd element-ui e…

如何克隆Git仓库的子目录:稀疏检出

一、环境 Git 2.34.1 二、前言 一般来说&#xff0c;我们在克隆git仓库的时候&#xff0c;都是一整个仓库都克隆出来的。如果假设现在有一个很大的仓库&#xff0c;仓库里有多个子项目&#xff0c;而我们只想克隆其中一个子项目的时候&#xff0c;应该怎么做呢&#xff1f; …

【时间之外】IT人求职和创业应知【11】

认知决定你的赚钱能力。以下是今天可能影响你求职和创业的热点新闻&#xff1a; 今日关键字&#xff1a;AI【不用解释吧】 1. 尚福林&#xff1a;人工智能将对金融业的经营运行产生深远影响 新闻概要&#xff1a; 在2024金融街论坛年会上&#xff0c;十三届全国政协经济委员…

Oracle VirtualBox虚拟机导入VMware ESXi的方法

VDI文件导入VMware ESXi 软件版本 Oracle VirtualBox 版本7.0 VMware EXSi 5.5 VDI(Virtual Disk Image)是Oracle VirtualBox支持的虚拟磁盘格式。本次操作的VDI文件20GB左右&#xff0c;包含一个使用unbuntn的非结构化系统。而VMware EXSi 6.5支持的格式是OVF或VMDK。 操作步…

数据结构广度优先搜索遍历(有向图和无向图均可)(C语言代码+邻接矩阵方式+连通图和非连通图均可)

#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> #include<stdlib.h> #define MAXVEX 100//最大顶点数 typedef struct {int vexs[MAXVEX];//存储顶点的数组int matrix[MAXVEX][MAXVEX];//存储邻接矩阵的二维数组int vexnum, edgenum;//顶点数边数 }MGraph;…

医院信息化与智能化系统(3)

医院信息化与智能化系统(3) 这里只描述对应过程&#xff0c;和可能遇到的问题及解决办法以及对应的参考链接&#xff0c;并不会直接每一步详细配置 如果你想通过文字描述或代码画流程图&#xff0c;可以试试PlantUML&#xff0c;告诉GPT你的文件结构&#xff0c;让他给你对应的…

Leetcode 最小路径和

这段代码解决的是LeetCode第64题“最小路径和”&#xff0c;其核心思想是动态规划&#xff08;Dynamic Programming&#xff0c;简称DP&#xff09;。以下是算法的具体解释&#xff1a; 1. 问题描述&#xff1a; 我们给定一个包含非负整数的 m x n 网格&#xff08;grid&…

智慧园区能带来哪些便利?

所谓智慧园区&#xff0c;是指通过信息化手段&#xff0c;实现园区内各项业务的数字化和智能化管理。园区管理者可以利用智能化平台实时监控各项运营情况&#xff0c;如能源使用、安全监控和物流运输等&#xff0c;及时调整管理策略&#xff0c;提高运营效率。智慧园区利用大数…

基于SSM+微信小程序的打印室预约管理系统(打印2)

&#x1f449;文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1、项目介绍 基于SSM微信小程序的打印室预约管理系统实现了管理员和用户两个角色。 1、管理员功能有个人中心&#xff0c;用户管理&#xff0c;附近打印店管理&#xff0c;文件打印管理&#xff0c;当…

【配色网站分享】

个人比较喜欢收藏一些好看的插画、UI设计图和配色&#xff0c;于是有了此篇&#xff0c;推荐一些配色网站&#xff0c;希望能对自己和大家有些帮助。 1.uiGradients 一个主打渐变风网站&#xff0c;还可以直接复制颜色。 左上角的“show all gradients”可以查看一些预设的渐…