elasticsearch hanlp 插件安装操作

elasticsearch hanlp 插件安装操作

  • 下载 hanlp 插件
  • 上传hanlp插件到elasticsearch服务器
  • 安装hanlp插件
  • kibana测试

下载 hanlp 插件

这里大家根据自己对应的 elasticsearch 版本下载匹配版本的 hanlp 插件,由于 hanlp 及 elasticsearch 各个版本之间差别较大,如果版本不匹配可能导致 hanlp 插件安装失败或者安装之后不可用,这里我们用的 elasticsearch 版本是6.7.1,因此我下载的 hanlp 插件版本也是6.7.1,已经放在了百度网盘,插件地址:
链接:https://pan.baidu.com/s/1jqCgZUrYUqzLl0wTvbRWMA?pwd=fteq
提取码:fteq 有需要的可以去下载。

另外需要其他版本 hanlp 插件的可以去 github 上面下载,下载地址: https://github.com/KennFalcon/elasticsearch-analysis-hanlp/tree/master 通过切换版本选择适合自己当前用的es版本的 hanlp 插件
在这里插入图片描述

上传hanlp插件到elasticsearch服务器

这里你可以先把插件的zip包上传到任何一个位置都行,后续再通过 cp 、 mv 命令将文件移动到指定目录下;或者直接上传到目标目录下都是可以的,在上传之前有一个 ES_HOME 的概念,这里需要提前说明一下,对于我的服务器来说, ES_HOME 路径就是 /elk6.7.1/elasticsearch-6.7.1
在这里插入图片描述

安装hanlp插件

切换到es对应的插件文件夹 plugins 下,创建 hanlp 文件夹 analysis-hanlp

cd ES_HOME/plugins/

mkdir analysis-hanlp

在这里插入图片描述
切换到 analysis-hanlp 文件夹下,上传文件 elasticsearch-analysis-hanlp-6.7.1.zip 或者将上面已经上传好的文件通过命令 cp 、 mv 拷贝至 analysis-hanlp 文件夹下

cd analysis-hanlp

rz 本地文件地址

在这里插入图片描述
解压 hanlp 插件文件 elasticsearch-analysis-hanlp-6.7.1.zip

unzip elasticsearch-analysis-hanlp-6.7.1.zip

解压完成之后回到 ES_HOME 下的 config 文件夹下创建 analysis-hanlp 文件夹

cd ES_HOME/config/

mkdir analysis-hanlp

切换到 hanlp 插件解压后文件的 config 文件夹中,拷贝 config 文件夹下的文件到 ES_HOME 下的 config 文件夹下的 analysis-hanlp

cd ES_HOME/plugins/analysis-hanlp/config

mv ./* ES_HOME/config/analysis-hanlp/

在这里插入图片描述
再次切换到ES_HOME下给对应新增文件的目录递归赋予用户及用户属组权限并重启es

cd ES_HOME

chown -R es.es plugins/

chown -R es.es config/

# 重新启动es

至此 elasticsearch hanlp 插件的安装就算完成了,在 kibana 上面测试

kibana测试

测试代码如下

POST _analyze

{

  "text": "自建底商转为办公自用 为什么不属于销售或者视同销售?",

  "analyzer": "hanlp"

}

测试效果

{

  "tokens" : [

    {

      "token" : "自建",

      "start_offset" : 0,

      "end_offset" : 2,

      "type" : "l",

      "position" : 0

    },

    {

      "token" : "底商",

      "start_offset" : 2,

      "end_offset" : 4,

      "type" : "nz",

      "position" : 1

    },

    {

      "token" : "转为",

      "start_offset" : 4,

      "end_offset" : 6,

      "type" : "v",

      "position" : 2

    },

    {

      "token" : "办公",

      "start_offset" : 6,

      "end_offset" : 8,

      "type" : "vn",

      "position" : 3

    },

    {

      "token" : "自用",

      "start_offset" : 8,

      "end_offset" : 10,

      "type" : "vn",

      "position" : 4

    },

    {

      "token" : "为什么",

      "start_offset" : 11,

      "end_offset" : 14,

      "type" : "ryv",

      "position" : 5

    },

    {

      "token" : "不",

      "start_offset" : 14,

      "end_offset" : 15,

      "type" : "d",

      "position" : 6

    },

    {

      "token" : "属于",

      "start_offset" : 15,

      "end_offset" : 17,

      "type" : "v",

      "position" : 7

    },

    {

      "token" : "销售",

      "start_offset" : 17,

      "end_offset" : 19,

      "type" : "vn",

      "position" : 8

    },

    {

      "token" : "或者",

      "start_offset" : 19,

      "end_offset" : 21,

      "type" : "c",

      "position" : 9

    },

    {

      "token" : "视同",

      "start_offset" : 21,

      "end_offset" : 23,

      "type" : "n",

      "position" : 10

    },

    {

      "token" : "销售",

      "start_offset" : 23,

      "end_offset" : 25,

      "type" : "vn",

      "position" : 11

    },

    {

      "token" : "?",

      "start_offset" : 25,

      "end_offset" : 26,

      "type" : "w",

      "position" : 12

    }

  ]

}

测试结果效果图如下
在这里插入图片描述
到这里整个elasticsearch hanlp插件的安装及测试就算完成了,欢迎大家有问题的讨论哈。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/695391.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++ 贪心算法——跳跃游戏、划分字母区间

一:跳跃游戏 55. 跳跃游戏 题目描述:给你一个非负整数数组 nums ,你最初位于数组的 第一个下标 。数组中的每个元素代表你在该位置可以跳跃的最大长度。判断你是否能够到达最后一个下标,如果可以,返回 true &#xff1…

英语学习笔记34——What are they doing?

What are they doing? 他们在做什么? 词汇 Vocabulary sleep v. 睡觉 ing形式:sleeping 例句:那个男孩正在睡觉。    That boy is sleeping. 相关:sleepy 困的 例句:我太困了。    I’m so sleepy. shave v.…

Vision-LSTM: xLSTM 作为通用视觉主干

摘要 尽管Transformer最初是为自然语言处理引入的,但它现在已经被广泛用作计算机视觉中的通用主干结构。最近,长短期记忆(LSTM)已被扩展为一种可扩展且性能优越的架构——xLSTM,它通过指数门控和可并行化的矩阵内存结…

LabVIEW轴承试验机测控系统

开发了一种基于LabVIEW软件开发的大功率风电机组增速箱轴承试验机测控系统。系统主要用于模拟实际工况,进行轴承可靠性分析,以优化风电机组的性能和可靠性。通过高度自动化的测控系统,实现了对试验机的精确控制,包括速度、振动、温…

Android 事件分发机制详解(上)

前言 Android事件分发机制是Android开发者必须了解的基础。 目录 一. 基础认知 1.1 事件分发的由来 安卓的View是树形结构的,View可能会重叠在一起,当我们点击的地方有多个View都可以响应的时候,这个点击事件应该给谁呢?为了解…

iCloud完全指南:释放Apple云服务的终极潜力

iCloud是苹果公司提供的云服务,它允许用户存储和同步照片、文档、音乐、应用数据以及更多类型的文件。通过有效利用iCloud,用户可以在不同设备间无缝地访问和编辑内容。本文旨在全面介绍如何高效使用iCloud,确保您能够最大化这一服务的价值。…

适用于电脑的 5 大嗨格式数据恢复替代方案

嗨格式数据恢复是有一定知名度的 Windows 和 Mac 恢复程序,旨在恢复格式化、删除和丢失的图片、视频和音频。该应用程序支持多种文件格式以及相机 RAW 图像。最好的部分?它的预览功能可以在恢复照片和其他媒体文件之前检查和验证它​​们——这可以节省大…

Github 2024-06-10 开源项目日报 Top10

根据Github Trendings的统计,今日(2024-06-10统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量C项目2Go项目2PHP项目1Blade项目1TypeScript项目1Lua项目1Dart项目1Swift项目1Cuda项目1Python项目1MDX项目1Ventoy: 100%开源的可启动USB解决方…

Spring 自动配置 condition

目录 前言 1. 自定义condition加载bean 1.1. 自定义一个condition注解 1.2. 实现自定义注解对应的实现类 1.3. 使用如上注解 1.4. 使用Spring上下文获取一下改bean 2. 我们来看看Spring是如何加载redisTemplate的。 2.1. 找到Spring的autoconfigure的jar包,我们…

超详解——python数字和运算——基础篇

目录 1.位运算 2. 常用内置函数/模块 math模块: random模块: decimal模块: 3.内置函数: 总结: 1.位运算 位运算是对整数在内存中的二进制表示进行操作。Python支持以下常见的位运算符: 按位与&…

Fedora的远程桌面

要在 Fedora 40 上开启远程桌面功能。 首先,要确保已安装 gnome-remote-desktop 和 vino 包。 这些软件包通常默认安装在 Fedora 的 GNOME 桌面环境中。 可以按照以下步骤操作: 1、判断电脑是否安装了 gnome-remote-desktop 和 vino 包: tomfedora:…

Web后端开发(请求-数组集合、日期、JSON参数)(三)

数组参数:请求参数名与形参数组名称相同且请求参数为多个,定义数组类型形参即可接收参数 RequestMapping("/arrayParam") public String arrayParam(String[] hobby){System.out.println(Arrays.toString(hobby));return "OK"; } …

短剧小程序剧场短剧APP定制开发付费短剧之为什么自建?

在当今数字时代,拥有一个属于自己的小剧场短剧影视小程序不仅是追求创作梦想的新途径,也是与观众建立紧密联系的有效方式。这种新兴的平台为创作者提供了前所未有的自由和机会,使他们能够直接与广大观众交流和分享作品。 1、源码分享的重要性…

使用GPT-soVITS再4060下2小时训练声音模型以及处理断句带来的声音模糊问题

B站UP主视频 感谢UP主“白菜工厂1145号员工”的“熟肉”,我这篇笔记就不展示整一个训练和推理流程,重点写的4060该注意的一些事项。如何解决断句模糊的问题,在本篇笔记的最末尾。 相关连接: 原项目github UP主的说明文档 1、训…

【冒泡排序】

冒泡排序的核心思想就是&#xff1a;两两相邻的元素进行比较 如果不满足顺序就交换&#xff0c;满足顺序就找下一对 //⽅法1 void bubble_sort(int arr[], int sz)//参数接收数组元素个数 {int i 0;for(i0; i<sz-1; i){int j 0;for(j0; j<sz-i-1; j){if(arr[j] > a…

Java学习 - MyBatis - 初识MyBatis

前言 什么是持久化 持久化是将程序数据在持久状态和瞬时状态间转换的机制&#xff0c;将数据保存到可永久保存的存储设备中。最常见的就是将内存中的对象存储在数据库中&#xff0c;或者存在磁盘文件、XML 数据文件中等等。其中&#xff0c;文件 IO 属于持久化机制&#xff0…

C++11新特性【上】(统一的列表初始化、auto、decltype、右值引用、万能引用、完美转发)

一、C11简介 在2003年C标准委员会曾经提交了一份技术勘误表(简称TC1)&#xff0c;使得C03这个名字已经取代了 C98称为C11之前的最新C标准名称。不过由于C03(TC1)主要是对C98标准中的漏洞 进行修复&#xff0c;语言的核心部分则没有改动&#xff0c;因此人们习惯性的把两个标准合…

攻防世界---misc---BotW-

1、下载附件是一张图片 2、查看图片属性&#xff0c;用winhex分析&#xff0c;没有发现奇怪的地方&#xff0c;用binwalk&#xff0c;接着使用foremost 3、得到两张图片&#xff0c;一张是原图&#xff0c;一张是特殊的字符 4、经过查阅资料得知&#xff0c;这是希卡文字&#…

《庆余年》角色穿越高考:谁将笑傲现代考场?

一、引言 《庆余年》是一部以古代中国为背景的权谋小说&#xff0c;其角色们各具特色&#xff0c;聪明才智、武艺高强、忠诚耿直等特质使得他们在古代世界中游刃有余。然而&#xff0c;如果我们将这些角色置于现代高考的背景之下&#xff0c;他们将如何面对这一挑战&#xff1…

Llama模型家族之Stanford NLP ReFT源代码探索 (三)reft_model.py代码解析

LlaMA 3 系列博客 基于 LlaMA 3 LangGraph 在windows本地部署大模型 &#xff08;一&#xff09; 基于 LlaMA 3 LangGraph 在windows本地部署大模型 &#xff08;二&#xff09; 基于 LlaMA 3 LangGraph 在windows本地部署大模型 &#xff08;三&#xff09; 基于 LlaMA…