1.Elasticsearch概述
Elasticsearch 是一个分布式的全文检索引擎。采用Java语言开发,基于Apache协议的开源项目,具有实时搜索,稳定,可靠,快速的特点。
1.1 全文检索引擎
分为通用搜索引擎(百度、谷歌)与站内搜索引擎,全文检索在处理非结构化文本数据方面非常有用
1.2 结构化数据与非结构化数据
每个属性都有对应的字段的数据就是结构化数据,反之无法用二维表表述的数据就是非结构化数据
1.3 ES全文检索的原理
Elasticsearch基于Lucene库构建而成,它使用了倒排索引的方式来实现全文检索。
1.3.1 倒排索引
就是查找内容,根据内容得到内容所在文档
1.3.2 正排索引
就是通过路径找到文档,再从文档找某段内容
2. ES安装
Elasticsearch:官方分布式搜索和分析引擎 | Elastic在 RESTful 风格的分布式免费开源搜索和分析引擎开源中,Elasticsearch 处于领先地位,速度快,可实现水平可扩展性和可靠性,并能让您轻松进行管理。免费启用。https://www.elastic.co/cn/elasticsearch/
2.1 启动ES
双击 bin/elasticsearch.bat
TIPS:
启动后ES会占用两个端口。
9200:ES对外提供服务的端口
9300:ES进行集群间通信与数据传输的端口
2.2 修改ES的配置文件
elasticsearch-8.8.2\config\elasticsearch.yml
2.3 添加编码配置
elasticsearch-8.8.2\config\jvm.options
2.4 打开浏览器访问
http://localhost:9200
3.ES的使用
常见操作 | |
---|---|
新增索引 | PUT http://localhost:9200/job |
查询索引中数据 | GET http://localhost:9200/job |
删除索引 | DELETE http://localhost:9200/job |
查询所有索引数据 | GET localhost:9200/_all |
查询索引的摘要信息 | GET http://localhost:9200/_cat/indices?v |
获取所有映射 | GET http://localhost:9200/_mapping |
3.1 启用/关闭索引
POST http://localhost:9200/job/_close
POST http://localhost:9200/job/_open
3.2 ES的数据类型
类型 | 说明 | 示例 |
text | 当一个字段是要被全文搜索的,比如文章内容、产品描 述等使用text类型。 设置text类型以后,字段内容会被分析,在生成倒排索 引以前,字符串会被分一个一个词项。 | 比如:java软件工程师, 会被分词为 java 、 软 件 、 工程师 |
keyword | keyword类型适用于索引结构化的字段,如果字段需要 进行过滤、排序、聚合。keyword类型的字段只能通过 精确值搜索到。 | 比如:城市,我们搜索北 京、深圳,这类词不应该 被拆分。 |
date | 通过format设置日期格式,常见的可以设置成年月日时分秒、年月日及毫秒值三种格式。 ignore_malformed。默认值false。如果为true,则忽略格式错误的数字。如果为false(默认值),则格式错误的数字将引发异常并拒绝整个文档。 null_value。默认是null。接受采用配置格式之一的日期值作为该字段,以替换任何显式的空值。默认为null,这意味着该字段被视为丢失。 | |
byte,short,integer,long | 整型 | 比如:职位ID、薪水。 |
float, half_float, scaled_float,double | 浮点型 | |
integer_range, long_range, float_range,double_range,date_range | 范围型 |