目录
1. ik分词器的作用(效果)
(1)标准分析器效果
(2)ik_smart分词
(3)ik_max_word分词
2. 首先根据自己的elasticsearch的版本下载对应的ik分词器版本
3. 将下载好的ik分词器放入elasticsearch的plugins中
4. 配置静态自定义分词
1. ik分词器的作用(效果)
(1)标准分析器效果
标准分析器是Elasticsearch默认的分析器,主要用于英文文本。对于中文文本,它通常会将每个汉字作为一个单独的词汇进行分词
例如我们想要查询的文本是:
我最喜欢IK分词器
标准分析器查询结果:
我, 最, 喜欢, IK, 分词器
IK分词器提供了两种模式:ik_smart 和 ik_max_word
- ik_smart:粗粒度分词,只输出文本中的最有可能的词组
- ik_max_word:细粒度分词,会尽可能多地输出文本中的词组,包括可能的组合
(2)ik_smart分词
对于查询的文本是:
我最喜欢IK分词器
ik_smart 分词查询结果:
我最喜欢IK分词器
(3)ik_max_word分词
对于查询的文本是:
我最喜欢IK分词器
ik_max_word分词查询结果:
我最喜欢, 我最喜欢IK, 我最喜欢IK分词, 我最喜欢IK分词器, IK分词器
2. 首先根据自己的elasticsearch的版本下载对应的ik分词器版本
下载链接:
Index of: analysis-ik/stable/https://release.infinilabs.com/analysis-ik/stable/
3. 将下载好的ik分词器放入elasticsearch的plugins中
我这里使用的是Final Shell
将下载的文件放到指定的ik目录,然后使用unzip进行解压文件夹,这样就完成的ik分词器的安装,如下所示:
4. 配置静态自定义分词
打开conifg的IKAnalyer
在ext_dict这行内,配置静态自定义分词