OCR转换技巧:如何避免图片转Word时出现多余的换行?

8d7f89f3eaccf2918bc2274817a99cc2.jpeg

在将图片中的文字识别转换为Word文档时,我们很多时候时会遇到识别内容的一个自然段还没结束就换行的问题,这些就是我们常说的多余换行的问题。为什么会产生这个问题呢?主要是由于OCR返回的识别结果是按图片上的文字换行而换行,而不是以自然段为换行依据。

054e4cd92f4cfa4a849ed4a029b9f965.jpeg

这会产生什么样的危害呢?一是word中会出现很多多余的回车符,看起来很是障眼,特别是对有“洁癖”的人来说,心里更不是滋味,怎么办呢?

笔者推荐的方法是使用金鸣表格文字识别大师来解决。具体操作方法如下:

4c0289d9800762bfc9ed4d4a15952efd.jpeg

一、使用高精还原的“智能优化”输出。选择这种输出方式,程序会调用AI智能分段

06650469a836c3cc3b0b1c9242698be1.jpeg

功能,将自动识别自然段,只有满足一个自然段的条件下才会换行。这种输出方式最适合文字较多的图片,如文章、图书、公文等。

ffd0674beccac73a395cd614970656d3.jpeg

二、使用高精还原的“还原结构”。还原结构即还原排版,使用这种方式输出,程序在OCR识别后会根据图片上的文字坐标,还原原有的文字排版,从而避免出现多余的换行。采用这种方式的好处是能还原排版,缺点是图片需要保持整洁和端正,如果图片上的文字排列歪了的话,出来的word排版也会歪,因此,这种输出方式最适合截图识别,以及用传统扫描仪成像的图片识别。

df808775984312e3131ab0cd857d43fb.jpeg

在金鸣表格文字识别移动端,“分段优先”对应“智能优化”,而“排版优先”则对应“还原结构”,它们转出来的效果跟电脑软件是一样的。

974769aa20a088cdaf2b148b4ff4406e.jpeg

另外一种处理方法就是OCR识别后手工处理。在OCR识别后,可以使用文本编辑软件(如Notepad++、Sublime Text等)对识别结果进行处理。例如,可以使用“查找和替换”功能来删除多余的换行符;或者使用“段落格式化”功能来重新排版文本。这种方法比较麻烦,会增加较多的工作量。

总之,为了避免在将图片转换为Word文档时出现多余的换行问题,我们可以选择专业的OCR软件(如金鸣表格文字识别大师),以及进行识别后处理手工处理等方法。这些方法能够有效地提高OCR识别的准确性,并避免出现不必要的换行问题。#word技巧#

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/138772.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

VM虚拟机只有一个C盘怎么添加硬盘新分区盘符

文章底部有个人公众号:热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享? 踩过的坑没必要让别人在再踩,自己复盘也能加深记忆。利己利人、所谓双赢。 前言 VM虚拟机中安装Window 系统后&#x…

Docker学习——⑦

文章目录 1、Docker 为什么需要网络管理2、Docker 网络架构简介2.1 CNM2.2 Libnetwork2.3 驱动 3、常见网络类型4、docker 网络管理命令5、网络详解5.2 docker Bridge 网络5.2 docker Host 网络5.3 docker Container 网络5.4 docker none 网络 1、Docker 为什么需要网络管理 容…

北京永达理慈善基金会与望京街道携手,为乡村振兴贡献10万元

东西部协作是推进巩固脱贫攻坚成果同乡村振兴有效衔接的重要手段。北京市朝阳区人民政府望京街道办事处自2021年起与内蒙古自治区通辽市科左后旗散都苏木、查日苏镇开展为期五年的结对帮扶工作,并号召全社会各界企事业单位及爱心人士帮扶助力,奉献爱心。…

新加坡建筑设备公司【Ten-League】申请3230万美元纳斯达克IPO上市

来源:猛兽财经 作者:猛兽财经 猛兽财经获悉,总部位于新加坡的重型建筑设备和工程咨询服务公司Ten-League International Holdings Limited(简称:Ten-League)近期已向美国证券交易委员会(SEC&am…

java--String使用时的注意事项

1.String使用时的注意事项 第一点: ①String对象的内容不可改变,被称为不可变字符串对象。(因为字符串是引用类型,每次都是引用一个地址,就相当于你有车,但是你不可能天天把车踹兜里,只能把钥匙踹兜里&am…

【2021集创赛】Risc-v杯三等奖:基于E203 ShuffleNet的图像识别SoC

本作品参与极术社区组织的有奖征集|秀出你的集创赛作品风采,免费电子产品等你拿~活动。 团队介绍 参赛单位:中国科学技术大学 队伍名称:Supernova 总决赛奖项:三等奖 1.项目简介 本设计以E203处理器为核心,添加协处理器、神经网…

孙哥Spring源码第29集

第29集 解析事务属性中的传播属性 【视频来源于:B站up主孙帅suns Spring源码视频】【微信号:suns45】 1、事务属性有哪些? 1、事务属性2、传播属性3、只读属性 设置事务为只读,提高事务运行的效率 false 4、超时属性 超时属性 通…

HarmonyOS 学习记录

时光荏苒,岁月如梭,韶华不负,未来可期。转眼间已经30岁了,学习的重要性不言而喻,在接下来的日子里记录下自己学习HarmonyOS的过程。增加一下知识储备,防患于未然嘛 不得不说华为的开发文档写的不错,开发工具直接安装后自动配置环境…

广告业展示服务预约小程序的效果如何

虽然不少人不会与广告业直接接触,但各种形式的广告却是充斥在人们生活中,线下的传单展板、线上的视频、音频、图文等都是广告很好的传播通道,同时广告业能扩展的客户属性也非常广,下到超市小摊,上到企业公司都有大小相…

APS、SAP解析BOM批量核对(我的APS项目三)

APS提供了解析BOM接口 SAP从CU50中解析了BOM 博主开发了一个程序,把两边的BOM数据拉到一起来比对,从最初的一个车型,增加到5个车型,最后成型是30个车型,几乎覆盖了F1、F2的全部车型。 并且程序还实现了消息提醒功能&…

制作企业期刊的网站,小白也能做出超吸睛的期刊

制作企业期刊的网站,对于许多企业来说,是一项既重要又具有挑战性的任务。然而,如果你是一位初学者或者是一位小白,也不用过于担心。按照小编说的步骤去做,你也能制作出吸引人的电子期刊 首先,你需要选择一个…

2011年09月29日 Go生态洞察:image/draw包的深度解析

🌷🍁 博主猫头虎(🐅🐾)带您 Go to New World✨🍁 🦄 博客首页——🐅🐾猫头虎的博客🎐 🐳 《面试题大全专栏》 🦕 文章图文…

2.4 CE修改器:代码替换功能

代码替换功能,需要使用 Cheat Engine 工具的“代码查找”功能,来查找游戏数据存储在内存中的地址。首先找到当前数值的存储地址,并将其添加到下方地址列表中。然后右键单击该地址,并选择“找出是什么改写了这个地址”,…

ppt中的字体,如何批量替换?

想要将PPT中的文字全部更换,有什么方便的方法吗?今天分享两个方法,一键修改ppt文件字体。 方法一: 找到功能栏中的编辑选项卡,点击替换 – 替换字体,在里面选择我们想要替换的字体就可以了。 方法二&…

酷柚易汛ERP - 利润表操作指南

1、应用场景 利润表按业务维度出具的统计企业主营业务、其他业务的收入、成本、利润情况的综合报表。 2、主要操作 2.1 核算利润 打开【资金】-【利润表】核算利润。 利润表分两部分,主营业务及其他业务,各项目计算公式如下: 净利润主营…

欧洲大学专场黑客松,获奖者们在Sui上构建链上物品验证并改进荷兰拍卖

在由区块链学生协会(Blockchain Student Association)与Sui合作的黑客松上,获奖者们构建了旨在吸引新用户并弥合区块链技术与实物资产之间差距的项目。这些新项目展示了Sui的发展前景和灵活性,以及它如何解决现实世界的问题。 来…

Illustrator 2024 v28.0(矢量插画设计)

Illustrator是一款功能强大的矢量图形编辑软件,它是设计师、艺术家和创意专业人士的首选工具,用于创建和编辑各种矢量图形、插图、图标、标志和艺术作品。 以下是Adobe Illustrator的主要功能和特点: 矢量图形编辑:Adobe Illustra…

企业app软件定制开发的特点

企业app软件定制开发的特点 随着移动互联网时代的到来,企业越来越意识到拥有自己的企业app对于提升企业形象、增强市场竞争力的重要性。然而,面对市面上众多的app软件,企业往往需要根据自身的需求和特点进行定制开发。 首先,企业a…

图像实时采集系统

本方案主要在于解决图像实时采集系统对算法校正的仿真实验,以及采集卡接收电路的验证。 由于图像实时跟踪处理系统需要大量的外场景实验,大部分时候只能通过采集的现场图像以在电脑软件中读取图片的形式来进行验证算法,而无法通过采集卡对接…

亚马逊鲲鹏系统强大的指纹系统可有效防止账号关联

亚马逊鲲鹏系统最新的防指纹技术支持绑定不同的代理IP,可以根据ip创建不同的指纹环境,让账号伪装成来自不同地点、不同设备的流量,每个账号环境隔离开来,实现了完全独立的操作任务,避免了账户指纹关联和操作轨迹关联。…