基于深度学习的中文标点预测模型-中文标点重建(Transformer模型)【已开源】

基于深度学习的中文标点预测模型-中文标点重建(Transformer模型)提供模型代码和训练好的模型

前言

  目前关于使用深度学习对文本自动添加标点符号的研究并不多见,已知的开源项目也较少,而对该领域的详细介绍更是稀缺。然而,文本自动添加标点符号的技术在古文识别和语音识别等领域具有重要应用。鉴此,本文提出了一种基于Transformer的深度学习模型,用于对文本进行自动标点符号添加。

文末提供模型代码和训练好的模型文件可供下载

✨ 长文本测试:

下面是一段无标点的长中文文本(模型输入不限制文本长度)

1   在一个遥远的地方有一个美丽的小镇小镇上的人们过着宁静而幸福的生活他们每天日出而作日落而息生活虽然平凡却充满了温馨和乐趣在这个小镇上有一位名叫小明的少年小明是一个聪明好学的孩子他对所有的新事物都充满了好奇每天放学后他都会跑到图书馆去看书汲取各种知识有一天小明在图书馆里发现了一本非常古老的书书的封面已经破旧不堪但书里的内容却深深地吸引了他这本书讲述的是一个关于魔法的故事在故事里描述了一个神秘的魔法世界在那里有会飞的马会说话的树还有能够实现任何愿望的魔法师小明被这个神奇的世界深深地吸引了他开始幻想自己有一天也能进入这个魔法世界亲眼目睹那些神奇的景象小明每天都会拿出那本书仔细阅读书里的每一个字他希望自己能够通过学习书中的知识掌握一些魔法的技巧有一天他发现书的最后一页上写着一段奇怪的文字看上去像是某种咒语小明好奇地读出了那些文字突然之间一阵强烈的光芒包围了他当光芒消失后小明发现自己已经不在图书馆里而是来到了一个完全陌生的地方这个地方看起来就像书中描述的那个魔法世界小明感到既兴奋又紧张他不知道接下来会发生什么但他决定勇敢地探索这个神秘的世界在这个魔法世界里小明遇到了很多奇异的生物和神秘的现象他遇到了一只会说话的猫这只猫告诉他这里是魔法世界而他是被书中的咒语召唤到这里的猫还告诉他如果他想回到原来的世界必须找到一位名叫白胡子的老魔法师只有白胡子老魔法师才能帮助他回去于是小明开始了寻找白胡子老魔法师的旅程在旅途中他遇到了许多困难和挑战但他始终没有放弃他用自己的智慧和勇气克服了一个又一个的障碍终于有一天他在一片神秘的森林里找到了白胡子老魔法师白胡子老魔法师听了小明的故事后非常赞赏他的勇气和智慧他告诉小明要想回到原来的世界他必须完成一个特殊的任务这个任务就是找到三件宝物分别是勇气之剑智慧之石和真诚之心只有集齐这三件宝物才能打开通往原来世界的大门小明听了老魔法师的话后决定不顾一切去完成这个任务他开始了一段新的冒险旅程在旅途中他遇到了许多志同道合的朋友他们一起经历了许多困难和危险但最终他们成功地找到了那三件宝物当小明集齐了勇气之剑智慧之石和真诚之心后他回到了白胡子老魔法师那里老魔法师使用魔法将三件宝物融合在一起打开了通往原来世界的大门小明终于能够回到他熟悉的小镇回到他深爱的家人和朋友身边这段奇幻的冒险经历让小明成长了许多他学会了勇敢面对困难学会了珍惜朋友的帮助也懂得了真诚的重要性从那以后小明变得更加坚强和自信他知道无论遇到什么样的挑战只要勇敢面对就一定能找到解决的办法
  1. 环境配置(推荐使用conda安装环境)
# 使用conda创建环境
conda create -n py310 python=3.10
conda activate py310

# 根据您的电脑情况安装pytorch,且满足torch >= 1.8
pytorch下载官网:https://pytorch.org/

# cd到算法根目录下
cd punc

# 在根目录下安装依赖
pip3 install -U funasr
pip3 install -U modelscope huggingface_hub
  1. 测试
# 进行标点预测(带预测文本放在example下的txt文件内)
python test.py

测试结果如下图👇
在这里插入图片描述


代码&模型下载

  • 基于深度学习的中文标点预测模型

  如果您需要中文音频翻译请访问这篇CSDN文章,文章内提供一个中文音频翻译的轻量级模型👇
基于深度学习的中文语音识别模型(支持wav、mp4、m4a等所有格式音频上传)【已开源】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/690943.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

苹果手机微信如何直接打印文件

在快节奏的工作和生活中,打印文件的需求无处不在。但你是否曾经遇到过这样的困扰:打印店价格高昂,让你望而却步?今天,我要给大家介绍一款神奇的微信小程序——琢贝云打印,让你的苹果手机微信直接变身移动打…

React Hooks路由传参

场景:如何把想要的参数带到跳转过去的页面里呢?很简单 上代码: 在你需要跳转的页面上 引入 Link用来跳转使用 Link跳转并携带参数 然后需要什么参数就带什么过去喽 这里record里面存的就是我的数据 我只需要id和state然后到你跳转过去的页面…

MySQL-备份(三)

备份作用:保证数据的安全和完整。 一 备份类别 类别物理备份 xtrabackup逻辑备份mysqldump对象数据库物理文件数据库对象(如用户、表、存储过程等)可移植性差,不能恢复到不同版本mysql对象级备份,可移植性强占用空间占…

【C语言】详解函数(上)(庖丁解牛版)

文章目录 1. 前言2. 函数的概念3.库函数3.1 标准库和头文件3.2 库函数的使用3.2.1 头文件的包含3.2.2 实践 4. 自定义函数4.1 自定义函数的语法形式4.2 函数的举例 5. 形参和实参5.1 实参5.2 形参5.3 实参和形参的关系 6. return 语句6. 总结 1. 前言 一讲到函数这块&#xff…

算法—字符串操作

394. 字符串解码 - 力扣&#xff08;LeetCode&#xff09; class Solution { public:string longestCommonPrefix(vector<string>& strs) { string retstrs[0];//***1***记得先要初始化ret&#xff0c;作为第一个比较值for(int i0;i<strs.size();i){retfoundcom…

聪明人社交的基本顺序:千万别搞反了,越早明白越好

聪明人社交的基本顺序&#xff1a;千万别搞反了&#xff0c;越早明白越好 国学文化 德鲁克博雅管理 2024-03-27 17:00 作者&#xff1a;方小格 来源&#xff1a;国学文化&#xff08;gxwh001&#xff09; 导语 比一个好的圈子更重要的&#xff0c;是自己优质的能力。 唐诗宋…

视觉SLAM十四讲:从理论到实践(Chapter9:后端1)

前言 学习笔记&#xff0c;仅供学习&#xff0c;不做商用&#xff0c;如有侵权&#xff0c;联系我删除即可 一、目标 1.理解后端的概念。 2.理解以EKF为代表的滤波器后端的工作原理。 3.理解非线性优化的后端&#xff0c;明白稀疏性是如何利用的。 4.使用g2o和Ceres实际操作…

代码随想录算法训练营第36期DAY49

DAY49 139单词拆分 没有思路。 回溯法 回溯怎么做呢&#xff1a;拼接str&#xff0c;看能不能拼出来。注意每个单词能用多次&#xff0c;不是用了就没。 但是语法还是难写。 自己的思路不好&#xff0c;题解思路&#xff1a;枚举所有分割字符串&#xff0c;判断是否在字典…

史上最有趣嫁妆:晋公盘的传奇

在遥远的春秋时代&#xff0c;晋国的晋文公为他的女儿用心打造了一件独特的嫁妆——晋公盘。 晋公盘由青铜制成&#xff0c;形状独特&#xff0c;工艺精湛。在晋公盘内底中央&#xff0c;一对精美的浮雕龙盘绕成圆形&#xff0c;盘上饰有鸟、龟、鱼、蛙等多种动物&#xff0c;最…

利用R包“Phenotype”对表型值进行检查

首先&#xff0c;你需要确保你已经安装了R和RStudio&#xff08;如果你想用RStudio的话&#xff09;。然后&#xff0c;你可以按照以下步骤进行操作&#xff1a; 加载数据&#xff1a;首先&#xff0c;你需要加载你的表型数据。如果你的数据是以CSV、Excel等格式保存的&#x…

设计模式-中介者(调停者)模式(行为型)

中介者模式 中介者模式是一种行为型模式&#xff0c;又叫调停者模式&#xff0c;它是为了解决多个对象之间&#xff0c;多个类之间通信的复杂性&#xff0c;定义一个中介者对象来封装一些列对象之间的交互&#xff0c;使各个对象之间不同持有对方的引用就可以实现交互&#xf…

LabVIEW伺服电机测控系统

LabVIEW伺服电机测控系统 开发了一个基于LabVIEW的伺服电机测控系统。系统主要用于精确控制电机的运动&#xff0c;以达到高效率和高精度的要求。通过使用LabVIEW软件和配套的硬件&#xff0c;开发者能够实现对伺服电机的实时监控和控制&#xff0c;进而提高整个系统的性能和可…

Linux-常用命令-常用设置

1.帮助类命令 1.man命令-获得帮助信息 man [命令或配置文件]例&#xff1a;查看ls命令的帮助信息 man ls输入 ZZ 退出帮助2.服务管理类命令 1.centos7语法 1.1 临时开关服务命令 开启服务&#xff1a; systemctl start 服务名 关闭服务&#xff1a; systemctl stop 服务…

LDR6020一拖二快充线:高效充电的新选择

LDR6020一拖二快充线&#xff1a;高效充电的新选择 随着移动设备的普及和功能的日益增强&#xff0c;电池续航成为了用户关注的重点之一。为了满足用户对于快速充电的需求&#xff0c;各大厂商纷纷推出了各种快充技术和产品。在这个背景下&#xff0c;LDR6020一拖二快充线凭借…

2024年6月8日 (周六) 叶子游戏新闻

万能嗅探: 实测 网页打开 某视频号、某音、某红薯、某站&#xff0c;可以做到无水印的视频和封面下载功能哦&#xff0c;具体玩法大家自行发挥吧。 《丝之歌》粉丝又要失望&#xff1a;大概率不会亮相Xbox发布会即将于后天举行的 Xbox 发布会预计将会有许多令人兴奋的消息。早些…

Linux shell编程学习笔记57:lshw命令 获取cpu设备信息

0 前言 在Linux中&#xff0c;获取cpu信息的命令很多&#xff0c;除了我们已经研究的 cat /proc/cpuinfo、lscpu、nproc、hwinfo --cpu 命令&#xff0c;还有 lshw命令。 1 lshw命令的功能 lshw命令源自英文list hardware&#xff0c;即列出系统的硬件信息&#xff0c;这些硬…

C++ 11 【线程库】【包装器】

&#x1f493;博主CSDN主页:麻辣韭菜&#x1f493;   ⏩专栏分类&#xff1a;C修炼之路⏪   &#x1f69a;代码仓库:C高阶&#x1f69a;   &#x1f339;关注我&#x1faf5;带你学习更多C知识   &#x1f51d;&#x1f51d; 目录 前言 一、thread类的简单介绍 get_id…

连山露【诗词】

连山露 雾隐黄山路&#xff0c;十步一松树。 树上惊松鼠&#xff0c;松子衔木屋。 松子青嫩芽&#xff0c;尖尖头探出。 卷挂白露珠&#xff0c;装映黄山雾。

【安装笔记-20240529-Windows-poedit 翻译编辑器】

安装笔记-系列文章目录 安装笔记-20240529-Windows-Poedit 翻译编辑器 文章目录 安装笔记-系列文章目录安装笔记-20240529-Windows-Poedit 翻译编辑器 前言一、软件介绍名称&#xff1a;Poedit主页官方介绍 二、安装步骤测试版本&#xff1a;Poedit-3.4.4下载链接安装界面 三、…

运维开发(DevOps):加速软件交付的关键方法

1. 什么是运维开发 运维开发&#xff08;DevOps&#xff09;是将软件开发&#xff08;Development&#xff09;与信息技术运维&#xff08;Operations&#xff09;的流程整合在一起的实践方法。DevOps的目标是通过增强开发和运维团队之间的协作&#xff0c;提高软件产品的发布…