SPSSAU【文本分析】|我的词库

我的词库

文本分析时,可能涉及到一些新词,比如‘内卷’,这个词很可能在词典中并未出现过,词库也不认识它。但研究者自己认识它,此时可将该词纳入到新词词库中,让系统统计词频等信息时也对该词进行统计。当然还有一些停用词,比如‘好了’,这个词没有实际的意义没有统计词频等必要,此时可对该词设置为停用词。除此之外,还可设置情感词,比如:‘元宇宙’可能是个正向词(也可能是负向情感,由研究者决定),那么可自主设置其情感分值。操作上为点击‘我的词库’,然后选择即可,如下图:

接下来针对三个词库的设置进行具体说明。


新词词库

如果是新词,那么其操作方式为输入或者粘贴即可,通常可在‘新词发现’时找出一些潜在的新词,然后整理在EXCEL中,最后一次性复制和粘贴到框框中就好。比如下图:

批量加入新词后,左侧框中即呈现出全部新词。当然也可对新词进行移除处理,也可以搜索是否某个新词已经加入新词库,也或者下载出所有设置好的新词等。如下图所示:

特别提示:

在‘新词发现’功能处,有加入或者移出新词的功能。但通常情况下建议一次性将新词批量处理,在处理完成后,重新进行分析,重新进行分析的方式为:点‘我的项目’-》点击‘重新分析ICON’。

停用词

停用词是指已经不再需要计算频率的词,研究者可自行批量设置,类似如下图操作即可:

批量加入停用词后,左侧框中会展示所有的停用词,研究者也可删除停用词,搜索是否某个词为停用词,并且下载所有的停用词等。如下图所示:

特别提示:

在词云分析和词定位分析处,均有加入或者移出停用词的功能。但通常情况下建议一次性将停用词批量处理,在处理完成后,重新进行分析,重新进行分析的方式为:点‘我的项目’-》点击‘重新分析ICON’。

情感词

如果系统未识别到某个关键词的情感得分,也或者希望自己设置情感词,此时可进行设置。其输入格式为:“情感词,情感分值”,比如“很好,0.8”,此处情感分值建议规则为:-1到1分之间,大于1/3为情感正向,小于-1/3为情感负向[SPSSAU的情感计分规则是这样],情感得分绝对值越大意味着情感程度越高。

当有多个情感词时,换行输入(或者粘贴即可),操作类似如下图:

在加入情感词之后,左侧框中会展示所有自定义的情感词,研究者也可删除它,搜索是否某个词为自定义情感词,并且下载所有自定义情感词等。如下图所示:

特别提示:

在情感词自定义设置之后,如果需要查看按词情感分析,那么需要重新分析,重新进行分析的方式为:点‘文本情感分析’-》“按词”-》点击‘重新分析’。如下图所示:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/394280.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

内存池源码剖析

SGI STL vector内存池源码 SGI STL包含了一级空间配置器和二级空间配置器,其中一级空间配置器allocator采用malloc和free来 管理内存,和C标准库中提供的allocator是一样的,但其二级空间配置器allocator采用了基于freelist 自由链表原理的内存…

MySql性能优化

0 引言 MySQL优化,一方面是找出系统的瓶颈,提高MySQL数据库整体的性能;另一方面需要合理的结构设计和参数调整,以提高用户操作响应的速度;同时还要尽可能节省系统资源,以便系统可以提供更大负荷的服务。 …

Django后端开发——模型层及ORM介绍

文章目录 参考资料Django配置MySQL安装mysqlclient创建数据库进入数据库的操作可能遇到的问题及解决方案Pycharm配置settings.py 模型![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/c83753397bf6481d8defde26537903bf.png)ORM介绍示例终端:settings.py…

transformer 最简单学习1 输入层embeddings layer

词向量的生成可以通过嵌入层(Embedding Layer)来完成。嵌入层是神经网络中的一种常用层,用于将离散的词索引转换为密集的词向量。以下是一个典型的步骤: 建立词表:首先,需要从训练数据中收集所有的词汇&…

open3d DBSCAN 聚类

DBSCAN 聚类 一、算法原理1.密度聚类2、主要函数 二、代码三、结果四、相关数据 一、算法原理 1.密度聚类 介绍 基于密度的噪声应用空间聚类(DBSCAN):是一种无监督的ML聚类算法。无监督的意思是它不使用预先标记的目标来聚类数据点。聚类是指试图将相似的数据点分…

ALINX黑金AXU3EGB 开发板用户手册 CAN接口信号方向标识错误说明

如上篇文章 CAN收发器 SN65HVD232 的D R引脚方向是 D是输入,R是输出。 https://blog.csdn.net/zhengwenbang/article/details/136151668?spm1001.2014.3001.5501 因此 ALINX黑金AXU3EGB 用户手册 Page 43页 图 3-10-1 PS 端 CAN 收发芯片的连接示意图,…

[深度学习] 深入理解什么是卷积神经网络

​ 🌈 博客个人主页:Chris在Coding 🎥 本文所属专栏:[深度学习] ❤️ 热门学习专栏:[Linux学习] ⏰ 我们仍在旅途 目录 1.卷积的定义 2.卷积的"卷"在哪里 3.什么又是卷积神…

七、动态菜单—递归组件的使用

layout布局 左侧菜单menu页面刷新后默认高亮 左侧菜单组件 Menu <template><template v-for"(item, index) in menuList" :key"item.path"><!-- 没有子路由 --><template v-if"!item.children"><el-menu-item v-if&…

宇通壹基金交通安全训练营走进瑞金市九天社区

春节即将临近&#xff0c;孩子的安全是家长们最大的牵挂&#xff0c;培养良好的交通安全意识和出行习惯从日常教育做起。2月6日上午&#xff0c;瑞金赋能公益联合瑞金市九天社区新时代文明实践站&#xff0c;在九天御景小区开展宇通壹基金交通安全训练营进社区暨“关注交通安全…

机器人初识 —— 电机传动系统

一、背景 波士顿动力公司开发的机器人&#xff0c;其电机传动系统是其高性能和动态运动能力的核心部分。电机传动系统通常包括以下几个关键组件&#xff1a; 1. **电动马达**&#xff1a;波士顿动力的机器人采用了先进的电动马达作为主要的动力源&#xff0c;如伺服电机或步进…

【Docker】docker安装

需要云服务器等云产品来学习Linux可以移步/-->腾讯云<--/官网&#xff0c;轻量型云服务器低至112元/年&#xff0c;新用户首次下单享超低折扣。 目录 一、Ubuntu安装docker 1、查看操作系统和CPU架构 2、卸载docker 3、配置docker下载源 4、安装docker 5、解决报错…

springboot745简历系统

springboot745简历系统 获取源码——》公主号&#xff1a;计算机专业毕设大全

vue+springboot登录与注册功能的实现

①首先写一个登录页面 <template> <div style"background-color: #42b983;display: flex;align-items: center;justify-content: center;height: 100vh"><div style"background-color: white;display: flex;width: 50%;height: 50%;overflow: h…

力扣题目训练(13)

2024年2月6日力扣题目训练 2024年2月6日力扣题目训练492. 构造矩形495. 提莫攻击500. 键盘行166. 分数到小数199. 二叉树的右视图85. 最大矩形 2024年2月6日力扣题目训练 2024年2月6日第十三天编程训练&#xff0c;今天主要是进行一些题训练&#xff0c;包括简单题3道、中等题…

【Redis】深入理解 Redis 常用数据类型源码及底层实现(4.详解Hash数据结构)

Hash数据结构 看过前面的介绍,大家应该知道 Redis 的 Hash 结构的底层实现在 6 和 7 是不同的,Redis 6 是 ziplist 和 hashtable,Redis 7 是 listpack 和 hashtable。 我们先使用config get hash*看下 Redis 6 和 Redis 7 的 Hash 结构配置情况(在Redis客户端的命令行界面…

图数据库 之 Neo4j - Cypher语法基础(5)

节点(Nodes) Cypher使用()来表示一个节点。 () # 最简单的节点形式&#xff0c;表示一个任意无特征的节点&#xff0c;其实就是一个空节点(movie) # 如果想指向一个节点在其他地方&#xff0c;我们可以给节点添加一个变量名(如movie)&#xff0c;表示一个变量名为 movie的节点…

后端扫盲系列 - vue入门指南

vue特点 组件化&#xff1a;用户界面分解为可重用的组件&#xff0c;这些组件可以使开发的页面更加模块化和可维护双向数据绑定&#xff1a;vue提供了一种轻松绑定数据和DOM元素之间的机制&#xff0c;意味着数据发送变化时&#xff0c;视图会自动更新&#xff0c;反之亦然虚拟…

阿里云香港轻量应用服务器怎么样,建站速度快吗?

阿里云香港服务器中国香港数据中心网络线路类型BGP多线精品&#xff0c;中国电信CN2高速网络高质量、大规格BGP带宽&#xff0c;运营商精品公网直连中国内地&#xff0c;时延更低&#xff0c;优化海外回中国内地流量的公网线路&#xff0c;可以提高国际业务访问质量。阿里云服务…

华为配置旁挂二层组网直接转发示例

配置旁挂二层组网直接转发示例 组网图形 图1 配置旁挂二层组网直接转发示例组网图 业务需求组网需求数据规划配置思路配置注意事项操作步骤配置文件扩展阅读 业务需求 企业用户通过WLAN接入网络&#xff0c;以满足移动办公的最基本需求。且在覆盖区域内移动发生漫游时&#xff…

基于51/STM32单片机的智能药盒 物联网定时吃药 药品分类

功能介绍 以51/STM32单片机作为主控系统&#xff1b; LCD1602液晶显示当前时间、温湿度、药品重量 3次吃药时间、药品类目和药品数量 HX711压力采集当前药品重量 红外感应当前药盒是否打开 DS1302时钟芯片显示当前年月日、时分秒、星期 DHT11采集当前环境温度和湿度 …