关于飞浆文字识别技术的运用

飞桨PaddlePaddle-源于产业实践的开源深度学习平台,有关文章可以在此进行查询

飞桨(PaddlePaddle)是一个由百度开源的深度学习平台,它提供了丰富的机器学习算法库,支持多种深度学习模型的构建、训练和部署。飞桨平台具有以下特点:

  1. 易用性:飞桨提供了简洁的API设计和丰富的文档,使得初学者和研究人员可以快速上手。

  2. 高性能:飞桨针对多种硬件进行了优化,包括CPU、GPU和百度自研的AI加速芯片XPU,能够提供高效的训练和推理速度。

  3. 灵活性:支持静态图和动态图两种编程模式,用户可以根据需要选择使用。

  4. 多平台支持:飞桨支持在多种操作系统上运行,包括Linux、Windows和Mac OS。

  5. 大规模分布式训练:飞桨提供了大规模分布式训练的能力,支持多机多卡训练,适合处理大规模数据集。

  6. 工业级应用:飞桨在百度内部得到了广泛应用,支持了百度的许多核心业务,如搜索、语音识别、图像识别等。

  7. 模型库:提供了大量的预训练模型和模型库,用户可以根据自己的需求选择合适的模型进行迁移学习或微调。

  8. 工具和组件:飞桨提供了包括数据增强、模型压缩、模型可视化等多种工具和组件,帮助用户优化模型性能和部署。

  9. 社区支持:飞桨拥有活跃的开源社区,用户可以在社区中获取帮助、分享经验和参与讨论。

  10. 端到端部署:飞桨支持模型从训练到部署的全流程,提供了模型导出、转换和在不同设备上运行的能力。

  11. 教育和研究:飞桨平台也广泛应用于教育和研究领域,提供了丰富的教程和案例,帮助学生和研究人员学习深度学习

本次使用的知识飞浆的一小部分内容,想要获取更多关于飞浆的知识,可以在官网上进行查看。

准备工作:

        前景介绍:我们在爬取某些网站的时候,爬取下来的文字有时会不显示,或显示不完全。观察字体也不难发现,字体和字体之间会有不同。网站主要运用了自己制作的字体文件font文件,其中的每一串不同的数字对应一个字,这是一种映射的关系。只要将一串数字和字体对应,就可以完成破解,但人工对应比较麻烦,利用文字识别技术,将获取的文字图片与文件名上的一串数字对应就能很方便的破解。

        前景过程:以某茄小说网为例

不难发现,小说的文章字体不一致,有的粗有的细

在进行网页制作的时候,我们可以设置多个字体,并且可以自定义字体只需有字体文件(以woff开头),在第一个字体中没用该字体会使用第二个字体,都没默认使用微软雅黑

<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Document</title>
    <style>
        // 自定义字体
        @font-face {
            font-family: nihao;
            src: url(./字体/e26e946d8b2ccb7.woff2);
        }
        // 所使用的字体
        h1 {
            font-family: fangsong, nihao;
        }
    </style>
</head>
<body>
    <h1>你好世界</h1>
    <h1>终焉</h1>
</body>
</html>

在检查中也会发现,元素中有些字体看不到,观察样式会发现在第一个字体文件是自定义的字体文件。

  在网络检查-字体中将字体文件下载(通过链接就可以下载)

具体流程:

        1,发现该文字是自定义字体

        2,了解font-face在哪里使用

        3, 通过来源面板调试,找到自定义字体

ord()和chr() 

ord() :放回unicode编码

chr() :返回unicode编码的值

将获取到的未解密的字体数据进行遍历,获取每一个字体的unicode 编码

问题就定位到了每一个unicode对应字符

将获取的自定义字体通过字体在线工具进行查看在线字体查看器 - bejson在线工具

当选中一个文字的时候就会发现文字对应的unicode编码(十六进制) 

观察发现文字的名称中的数字部分就是文字的unicode编码(十进制)

所以要建立字典映射来完成字符与unicode一一对应的字典表,故使用飞浆文字识别提高效率

通过js手段将字体文件保存下来

// 编写好以后复制到控制台中
let targets = document.querySelectorAll("[id^=g]")
let nameEle = document.querySelector("#input-name")
targets.forEach(function(item, index){
    if(index >= 2 && index <= 6){
       setTimeout(function(){
        item.click();
        let url = item.toDataURL("image/png");
        let a = document.createElement("a");
        a.href = url;
        a.download = `${nameEle.value.slice(3)}.png`
        a.click();
       }, 100*index)
    }
})

使用飞浆paddleOCR模型 GitHub - PaddlePaddle/PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle (practical ultra lightweight OCR system, support 80+ languages recognition, provide data annotation and synthesis tools, support training and deployment among server, mobile, embedded and IoT devices)

下载包
pip install paddlepaddle
pip install paddleocr

注意相关安装看官方说明,本文不再赘述

测试 

在终端中输入

paddleocr.exe --image_dir filepath

此时会下载模型 

运行结束后会显示文字识别结果  

 由此可知该图片文字有92%的概率为“却”

单独使用识别:设置--det 为false

paddleocr.exe --image_dir filepath --det false

 结果为

 在python中编写代码,相关代码可在官方文档中查看

from paddleocr import PaddleOCR, draw_ocr
import os
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
# 遍历文件

ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # need to run only once to download and load model into memory
for file_name in os.listdir("../datas/解密图片"):
    img_path = f'../datas/解密图片/{file_name}'
    result = ocr.ocr(img_path, cls=True, det=False)
    for idx in range(len(result)):
        res = result[idx]
        for line in res:
            print(line[0])

最后将识别的文件存入在字典中,完成对字体的破解。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/734182.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【pytorch02】手写数字问题引入

1.数据集 现实生活中遇到的问题 车牌识别身份证号码识别快递单的识别 都会涉及到数字识别 MNIST&#xff08;收集了很多人手写的0到9数字的图片&#xff09; 每个数字拥有7000个图像train/test splitting:60k vs 10k 图片大小28 28 数据集划分成训练集和测试集合的意义…

学生选课系统

摘 要 随着学校规模的日渐庞大与课程种类的丰富&#xff0c;传统手工选课方式的局限日益凸显&#xff0c;其繁琐和易错性在处理庞大数据时尤为明显。在追求个性化学习路径的现代教育浪潮中&#xff0c;学生们对自主选课的需求愈发强烈&#xff0c;他们渴望根据兴趣和职业规划自…

Android系统 抓trace方法(手机及车机)

1、先说说什么是trace trace是一种以perfetto.trace结尾的文件。一般用来分析卡顿、启动时间慢等问题&#xff0c;还可以用来分析方法耗时&#xff0c;android系统的性能、功耗等等问题。所需要使用到的网站是&#xff1a; Perfetto UI 他的前身是Systrace&#xff0c;不过Pe…

Ubuntu24使用kubeadm部署高可用K8S集群

Ubuntu24使用kubeadm部署高可用K8S集群 使用kubeadm部署一个k8s集群&#xff0c;3个master1个worker节点。 1. 环境信息 操作系统&#xff1a;ubuntu24.04内存: 2GBCPU: 2网络: 能够互访&#xff0c;能够访问互联网 hostnameip备注k8s-master1192.168.0.51master1k8s-maste…

已解决!!!mamba2替换mamba,速度提升2到8倍

mamba已经发布有一段时间了&#xff0c;打着击败transformer的口号&#xff0c;确实引起了一大波关注&#xff0c;核心架构的改进也给研究者提供了新的水论文的思路 mamba2已经发布&#xff0c;号称比第一代mamba要提速2到8倍&#xff0c;实际上手时却挺打击信心的&#xff0c;…

天马学航——智慧教务系统(移动端)开发日志六

天马学航——智慧教务系统(移动端)开发日志六 日志摘要&#xff1a;统一身份认证设计&#xff0c;修复了选课信息错乱的问题 界面设计 实现思路 使用 Java 和 Jedis 完成实现&#xff1a; 步骤一&#xff1a;添加 Jedis 依赖 首先需要在项目中添加 Jedis 依赖&#xff0c;…

IPv6知识点整理

IPv6&#xff1a;是英文“Internet Protocol Version 6”&#xff08;互联网协议第6版&#xff09;的缩写&#xff0c;是互联网工程任务组&#xff08;IETF&#xff09;设计的用于替代IPv4的下一代IP协议&#xff0c;其地址数量号称可以为全世界的每一粒沙子编上一个地址 。 国…

迈巴赫S480升级增强现实AR抬头显示hud比普通抬头显示HUD更好用吗

增强AR实景抬头显示HUD&#xff08;Augmented Reality Head-Up Display&#xff09;是一种更高级的驾驶辅助技术&#xff0c;相比于普通抬头显示HUD&#xff0c;它提供了更丰富、更具沉浸感的驾驶体验。以下是它比普通抬头显示HUD多的一些功能&#xff1a; • 信息呈现方式&am…

uniapp 自定义页面顶部导航栏

效果图 1.移除原生导航栏 {"path": "pages/common/homePage/homePage","style": {"navigationBarTitleText": "","navigationStyle": "custom"} } 2.获取不同手机顶部自带 电量高度、信号、时间导航栏…

分享计算机msvcp100.dll,丢失或找不到的7个解决方法

msvcp100.dll是动态链接库文件对于执行使用 Microsoft Visual C 2010 编译器编译的应用程序至关重要。它包含了 C 标准库的实现&#xff0c;提供了应用程序运行时所需的核心功能&#xff0c;如输入/输出操作、字符串处理、数学运算和异常处理等。若系统中缺失或损坏此文件&…

Talk|新加坡国立大学贾鑫宇:适用于高自由度机器人的运动控制器

本期为TechBeat人工智能社区第600期线上Talk。 北京时间6月13日(周四)20:00&#xff0c;新加坡国立大学博士生—贾鑫宇的Talk已经准时在TechBeat人工智能社区开播&#xff01; 他与大家分享的主题是: “适用于高自由度机器人的运动控制器”&#xff0c;向大家系统地介绍了如何通…

计网重点面试题-TCP三次握手四次挥手

三次握手 第一次握手(syn1) 客户端会随机初始化序号&#xff08;client_isn&#xff09;&#xff0c;将此序号置于 TCP 首部的「序列号」字段中&#xff0c;同时把 SYN 标志位置为 1&#xff0c;表示 SYN 报文。接着把第一个 SYN 报文发送给服务端&#xff0c;表示向服务端发…

【SAP ME 42】关于SAP ME自定义开发中NWDS中配置JDK

1、NWDS启动配置JDK -vm C:/Java/jdk1.8.0_361/bin 2、开发组件配置JDK

CBA认证-业务架构师认证的尚方宝剑

CBA业务架构师认证是一种由业务架构师公会&#xff08;Business Architecture Guild&#xff09;授予的专业认证&#xff0c;全称为Certified Business Architect&#xff0c;简称CBA。以下是关于CBA业务架构师认证的主要信息和特点&#xff1a; 认证目的&#xff1a; CBA认证…

2024年AI+游戏赛道的公司和工具归类总结

随着人工智能技术的飞速发展,AI在游戏开发领域的应用越来越广泛。以下是对2024年AI+游戏赛道的公司和工具的归类总结,涵盖了从角色和场景设计到音频制作,再到动作捕捉和动画生成等多个方面。 2D与3D创作 2D创作工具:专注于角色和场景的平面设计,提供AI辅助的图案生成和风…

深信服科技:2023网络安全深度洞察及2024年趋势研判报告

2023 年&#xff0c;生成式人工智能和各种大模型迅速应用在网络攻击与对抗中&#xff0c;带来了新型攻防场景和安全威胁。漏洞利用链组合攻击实现攻击效果加成&#xff0c;在国家级对抗中频繁使用。勒索团伙广泛利用多个信创系统漏洞&#xff0c;对企业数据安全与财产安全造成了…

帕金森综合征的预防方法

帕金森综合征是一种慢性神经退行性疾病&#xff0c;目前尚无法彻底治愈。然而&#xff0c;通过采取一些预防措施&#xff0c;可以降低患病风险或延缓病情发展。以下是一些基于最新研究和医学建议的预防方法&#xff1a; 健康饮食&#xff1a;保持低盐、低脂饮食&#xff0c;多吃…

华为开发者大会:全场景智能操作系统HarmonyOS NEXT

文章目录 一、全场景智能操作系统 - HarmonyOS NEXT1.1 系统特性1.2 关于架构、体验和生态 二、应用案例2.1 蚂蚁mpaas平台的性能表现 三、新版本应用框架发布3.1 新语言发布3.2 新数据库发布3.3 新版本编译器的发布 四、CodeArts和DataArts4.1 CodeArts4.2 DataArts 五、总结 …

Unity3d自定义TCP消息替代UNet实现网络连接

以前使用UNet实现网络连接,Unity2018以后被弃用了。要将以前的老程序升到高版本,最开始打算使用Mirro,结果发现并不好用。那就只能自己写连接了。 1.TCP消息结构 (1). TCP消息是按流传输的,会发生粘包。那么在发射和接收消息时就需要对消息进行打包和解包。如果接收的消息…

RockChip Android12 System之MultipleUsers

一:概述 System中的MultipleUsers不同于其他Preference采用system_dashboard_fragment.xml文件进行加载,而是采用自身独立的xml文件user_settings.xml加载。 二:Multiple Users 1、Activity packages/apps/Settings/AndroidManifest.xml <activityandroid:name="S…