软件测试|使用Python提取出语句中的人名

简介

在自然语言处理(NLP)中,提取文本中的人名是一项常见的任务。Python作为一种流行的编程语言,拥有强大的NLP库和工具,使我们能够轻松地进行这项任务。在本文中,我们将使用Python示例来演示如何提取文本中的人名。

环境准备

我们将使用以下Python库来执行人名提取任务:

  • spaCy:一个流行的NLP库,它提供了命名实体识别(NER)功能,可以帮助我们识别文本中的人名。
  • re:Python的正则表达式库,用于进行文本模式匹配。

re是Python自带的库,所以我们不需要额外进行安装,但是spaCy是第三方库,需要我们安装,安装命令如下:

pip install spacy

注:当我们安装spaCy库之后,还需要安装其语言模型,安装命令如下:

# 英文模型
python -m spacy download en_core_web_sm
# 中文模型
python -m spacy download zh_core_web_sm

示例代码

下面是一个Python示例,演示如何使用spaCy库来提取文本中的人名:

import spacy

# 加载spaCy的英文模型
nlp = spacy.load("zh_core_web_sm")

# 输入文本
text = "欢迎大家参加本次活动。张三、李四和王五将会发表演讲。"

# 使用spaCy处理文本
doc = nlp(text)

# 提取人名
people_names = []
for ent in doc.ents:
    if ent.label_ == "PERSON":
        people_names.append(ent.text)

# 打印提取到的人名
for name in people_names:
    print(name)

在上面的示例中,我们首先加载了spaCy的英文模型,并指定了文本。然后,我们使用spaCy对文本进行处理,识别其中的命名实体。最后,我们筛选出标记为"PERSON"(人名)的实体,并将它们存储在people_names列表中。

运行代码,输出结果如下:

张三
李四
王五

总结

spaCy是一个高性能、易于使用的自然语言处理库,可以处理多种语言,提供了许多预训练模型和可扩展功能。本文主要介绍了提取人名的功能,后续我们还将介绍spaCy的其他强大功能。

最后感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/326775.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot与微服务测试:JUnit和Mockito的单元和集成测试实践

微服务架构的流行使得测试变得更为重要。在Spring Boot应用中,使用JUnit和Mockito进行单元和集成测试是一种常见的实践。本文将深入探讨如何利用这两个测试框架,确保Spring Boot微服务的可靠性和稳定性。 单元测试 1.1 JUnit简介 JUnit是Java中最为流行…

LinuxC/C++编译指令

以C为例,C语言只需将指令中的g改成gcc即可 创建并编写一个源文件 一般情况下,对源文件直接一步编译即可 g 源文件名 -o 生成文件名 或者 g -o 生成文件名 源文件名 下面是对代码进行分步编译的指令 对源文件预处理,生成.i文件 对.i文件进行编译&#…

基于pyqt5+scapy 根据ip 具体端口 进行扫描 的程序

先给出代码 import sysfrom PyQt5 import uic from PyQt5.QtWidgets import *from scapy.all import * import argparse import logging from scapy.layers.inet import IP, TCP from scapy.sendrecv import sr1class MyWindow(QWidget):def __init__(self):super().__init__(…

文理导航期刊投稿方式

《文理导航》杂志系国家新闻出版总署批准,内蒙古自治区文旅厅主管,内蒙古自治区北方文化研究院主办的,面向大中专院校、中小学教育的专业性教育刊物,阅读对象是关心教育事业发展的大中专院校、职业教育、中小学教育的专家、教研员…

WBTT:“Fair Launch”如何做到更加公平

铭文是一种全新的资产发行方案,它让非图灵完备的链上生态具备发行资产的能力,而铭文赛道的兴起也让比特币生态再次回到加密世界的中心。铭文市场的兴起,更被称之为“散户的狂欢”,因为这种“Fair Launch”的启动方式正在让所有参与…

MyTinySTL 简单分析(二)--util.h exceptdef.h

目前在学习STL,看到一个开源的项目MyTinySTL,非常不错。想着照着这个代码自己敲一遍应该也能有些进步。然后就开始了学习过程。 首先分析的是vector 以下是由vector.h关联的所有头文件 本篇分析一下util.h , xxx 这里先来研究几个函数 st…

如何区分GPT-3.5模型与GPT-4模型?

GPT 3.5 和 GPT-4 有什么区别? GPT-3.5 在经过大量数据训练后,成功地发展到可以考虑 1750 亿个参数以响应提示。这使其具备令人印象深刻的语言技能,以非常人性化的方式回应各种查询。然而,GPT-4 在更为庞大的训练数据基础上进行了…

CCF认证+蓝桥杯习题训练

贪心 *上取整公式* *代码展示* #include <iostream> #include <cstring> #include <algorithm>using namespace std;const int N 1e5 10;typedef long long LL;int v[N] , a[N];int main() {int n , d;cin >> n >> d;for(int i 1 ; i < n…

人脸识别打卡系统的设计与应用!人脸识别打卡系统有什么用?

教育行业的快速日新月异&#xff0c;对信息化建设的要求也越来越高。学校物业管理成为保障学校正常运行的重要环节。然而&#xff0c;在实践中&#xff0c;由于服务人员数量不足、管理不规范等问题&#xff0c;服务质量往往难以保证物业对学校师生的服务质量。为了解决这一问题…

武理多媒体信息共享平台的架构设计与实现

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java实战 |…

GUI开发丨基于Tkinter+SQLite3的智能图书管理系统

文章目录 写在前面实验介绍实验内容SQLite3数据库GUI界面 运行结果写在后面 写在前面 本期内容&#xff1a;基于TkinterSQLite3的智能图书管理系统 实验需求&#xff1a; tkintersqlite3 项目下载地址&#xff1a;https://download.csdn.net/download/m0_68111267/88744196…

WhatsApp广播列表功能介绍及用法

如果遇到想要发送一条信息给多个客户的时候&#xff0c;WhatsApp广播功能就能帮到你。WhatsApp的广播功能可以让你将同一条消息发送给多个联系人&#xff0c;而这些联系人不会知道你已向其他联系人发送了相同的消息。所以广播功能非常适合于一次向多个人发送通知或公告&#xf…

软件测试|SQLAlchemy query() 方法查询数据

简介 上一篇文章我们介绍了SQLAlchemy 的安装和基础使用&#xff0c;本文我们来详细介绍一下如何使用SQLAlchemy的query()方法来高效的查询我们的数据。 创建模型 我们可以先创建一个可供我们查询的模型&#xff0c;也可以复用上一篇文章中我们创建的模型&#xff0c;代码如…

x-cmd pkg | tokei - 代码行数统计工具

目录 简介首次用户技术特点竞品和相关作品进一步阅读 简介 tokei 是一个使用 Rust 编写的显示有关代码统计信息的命令行工具&#xff0c;可以分门别类的统计目录内的代码行数。 tokei 具有良好的跨平台性&#xff0c;可以在 Linux、macOS、Windows 等多种平台上安装运行。 首…

[C#]winform部署官方yolov8-obb旋转框检测的onnx模型

【官方框架地址】 https://github.com/ultralytics/ultralytics 【算法介绍】 Yolov8-obb&#xff08;You Only Look Once version 8 with Oriented Bounding Boxes&#xff09;是一种先进的对象检测算法&#xff0c;它在传统的Yolov3和Yolov4基础上进行了优化&#xff0c;加…

Python办公自动化 – 数据预处理和数据校验

Python办公自动化 – 数据预处理和数据校验 以下是往期的文章目录&#xff0c;需要可以查看哦。 Python办公自动化 – Excel和Word的操作运用 Python办公自动化 – Python发送电子邮件和Outlook的集成 Python办公自动化 – 对PDF文档和PPT文档的处理 Python办公自动化 – 对Ex…

1491. 去掉最低工资和最高工资后的工资平均值

1491. 去掉最低工资和最高工资后的工资平均值 class Solution {public double average(int[] salary) {Arrays.sort(salary);salary[0] 0;for(int i 1;i < salary.length - 1;i){salary[0] salary[i];}return salary[0] * 1.0 / (salary.length - 2);} }

【python 的各种模块】(9) 在python使用PIL( 即pillow模块 ) 修改图片

目录 1 导入PIL模块&#xff08;pillow&#xff09; 1.1 PIL的全称&#xff1a;Python Imaging Library 1.2 导入PIL模块 1.2.1 可用的导入形式 1.2.2 常用的导入形式 1.2.3 PIL下面的常用子模块 2 PIL.Image的方法 (读入&#xff0c;生成和显示图片) 2.1 用 PIL.Image…

算法总结——单调栈

纵有疾风起&#xff0c;人生不言弃。本文篇幅较长&#xff0c;如有错误请不吝赐教&#xff0c;感谢支持。 文章目录 一、单调栈的定义二、单调栈的应用&#xff1a;寻找左边第一个比它小的数寻找左边第一个比它小的数的下标寻找右边第一个小于它的数寻找右边第一个小于它的数的…

毫无基础的人如何入门 Python ?

一、写在前面 其实不止是 Python&#xff0c;任何学习都会遇到这么几个难点 迷茫&#xff0c;对于学习过程中&#xff0c;对新的、未知的概念欠缺了解&#xff1b;彷徨&#xff0c;没有目的性的学习&#xff0c;不知道学完之后可以怎么用&#xff1b;乏力&#xff0c;知道很重…