Python OCR 文字识别

    一.引言

文字识别,也称为光学字符识别(Optical Character Recognition, OCR),是一种将不同形式的文档(如扫描的纸质文档、PDF文件或数字相机拍摄的图片)中的文字转换成可编辑和可搜索的数据的技术。随着技术的发展,文字识别技术已经成为信息管理、自动化办公和智能系统的关键组成部分。

二.简介

为了易于集成和使用,我们将文字识别OCR封装为DLL(动态链接库)。这种封装方式不仅保留了算法的性能优势,还提供了跨平台和跨语言的兼容性,目前支持编程语言如下:

  • C++
  • Python
  • 易语言

1.C++头文件


#ifndef _SN_SDK_H__
#define _SN_SDK_H__



#include <windows.h>


enum SN_TRACK_MOVE_TYPE
{
	TRACK_MOVE_TYPE_NORMAL=0,		// 用于常规轨迹 - 普通游戏鼠标轨迹
	TRACK_MOVE_TYPE_SLIDER,			// 用于滑块轨迹,比常规常规轨迹密度更大 - 滑块验证轨迹
};

enum SN_TRACK_POINT_TYPE
{
	TRACK_POINT_TYPE_NORMAL=0,		// 默认绝对坐标
	TRACK_POINT_TYPE_RELATIVE,		// 相对坐标
};


//返回参数
typedef struct SN_RESULT {

	int code;			//错误码,如果为 0 表示成功,否则表示错误号
	char message[4096];	//错误信息,如果为 "OK" 表示成功,否则返回错误信息

}SN_RESULT;


//坐标参数
typedef struct SN_POINT
{
	int x;				//屏幕坐标,左上角(0,0),右下角(1920,1080 - 以实际屏幕为准)
	int y;				//屏幕坐标,左上角(0,0),右下角(1920,1080 - 以实际屏幕为准)

}SN_POINT;

//轨迹参数
typedef struct SN_POINT_PARAMS
{
	struct SN_POINT point;//屏幕坐标,左上角(0,0),右下角(1920,1080 - 以实际屏幕为准)
	int delayTime;		  //延时时间(单位:毫秒),仅供参考

}SN_POINT_PARAMS;


/*创建句柄
*
* 参数:
*	[in] szKey:		卡密(购买卡密:https://shop.4yuns.com/links/7C9F16B7)
* 	[in] pOnnxFilePath:设置 onnx 模型文件路径,如果设置为 NULL,默认和 DLL文件同级目录
* 	[out] pResult:		返回错误信息,参数pResult.code(错误码)如果为 0 表示成功,否则表示错误号;
*
* 返回值:成功返回句柄,失败返回NULL
*
*/
HANDLE WINAPI apiSNCreateHandle(char* szKey, char* pOnnxFilePath, SN_RESULT* pResult);


/*设置鼠标移动轨迹,默认为 0 表示普通轨迹 ; 1 表示滑块验证时移动轨迹(获得的轨迹点数比普通轨迹点数更多)
*
* 参数:
*	[in] handle:		句柄(通过调用apiSNCreateHandle得到)
*  	[in] density:		轨迹密度调节 ,必须大于或者等于 1,默认 1
*								例如:默认1,原本为100个点,density 为 5,会得到20个点;density 为 2,会得到50个点 )
*  	[in] type:			轨迹类型(0代表绝对普通轨迹,1代表滑块轨迹,具体参考enum SN_TRACK_MOVE_TYPE)
*
* 返回值:返回参数SN_RESULT.code(错误码)如果为 0 表示成功,否则表示错误号;
*
*/
int WINAPI apiSNSetTrackParams(HANDLE handle, int density=1, int type=0);


/*获取鼠标移动轨迹
*
* 参数:
*	[in] handle:		句柄(通过调用apiSNCreateHandle得到)
* 	[in] startPoint:	开始坐标,左上角(0,0),右下角(1920,1080 - 以实际屏幕为准)
* 	[in] endPoint:		结束坐标,左上角(0,0),右下角(1920,1080 - 以实际屏幕为准)
*  	[in] type:			轨迹坐标类型(0代表绝对坐标,1代表相对坐标,具体参考enum SN_TRACK_POINT_TYPE)
* 	[out] points:		轨迹数组,如果数组中元素 point 出现(10000,10000),表示鼠标轨迹结束
*
* 返回值:返回参数SN_RESULT.code(错误码)如果为 0 表示成功,否则表示错误号;
*
*/
int WINAPI apiSNMouseMove(HANDLE handle, SN_POINT *startPoint, SN_POINT *endPoint, int type, SN_POINT_PARAMS* points);


/*获取版本号
*
* 参数:
*	[in] handle:		句柄(通过调用apiSNCreateHandle得到)
* 	[out] szVersion:	版本号
*
* 返回值:返回参数SN_RESULT.code(错误码)如果为 0 表示成功,否则表示错误号;
*
*/
int WINAPI apiSNGetVersion(HANDLE handle, char* szVersion);


/*获取OCR文字识别卡密到期时间
*
* 参数:
*	[in]  handle:		句柄(通过调用apiSNCreateOCRHandle得到)
* 	[out] pResult:		返回错误信息,参数pResult->code(错误码)如果为 0 表示成功,否则表示错误号;
*
* 返回值:返回卡密到期时间,失败返回NULL,错误信息请查看参数 pResult->message
*
*/
char* WINAPI apiSNGetKeyExpiresTime(HANDLE handle, SN_RESULT* pResult);


/*获取错误信息
*
* 参数:
*	[in] handle:		句柄(通过调用apiSNCreateHandle得到)
*
* 返回值:返回参数SN_RESULT.code(错误码)如果为 0 表示成功,否则表示错误号;
*
*/
int WINAPI apiSNGetError(HANDLE handle);



/*释放句柄(内存)
*
* 参数:
*	[in] handle:		句柄(通过调用apiSNCreateHandle得到)
*
* 返回值:返回参数SN_RESULT.code(错误码)如果为 0 表示成功,否则表示错误号;
*
*/
int WINAPI apiSNDestroyHandle(HANDLE handle);


#endif // !_SN_SDK_H__

2.Python调用dll接口

from ctypes import cdll, c_char_p, Structure, byref
import ctypes
 
# 定义SN_STATU结构体
class SN_STATU(Structure):
    _fields_ = [("code", ctypes.c_int),
               ("message", c_char_p * 4096)]
 
# 加载DLL
lib = cdll.LoadLibrary('D://SNOCR.dll')
 
# 设置函数参数类型
lib.apiSNInitOCRServer.argtypes = [c_char_p, ctypes.POINTER(SN_STATU)]
lib.apiSNInitOCRServer.restype = ctypes.c_int
 
lib.apiSNCreateOCRHandle.argtypes = [c_char_p, c_char_p, ctypes.POINTER(SN_STATU)]
lib.apiSNCreateOCRHandle.restype = ctypes.c_void_p
 
lib.apiSNGetKeyExpiresTime.argtypes = [ctypes.c_void_p, ctypes.POINTER(SN_STATU)]
lib.apiSNGetKeyExpiresTime.restype = c_char_p
 
lib.apiSNGetOCRFromImage.argtypes = [ctypes.c_void_p, c_char_p, ctypes.POINTER(SN_STATU)]
lib.apiSNGetOCRFromImage.restype = c_char_p
 
lib.apiSNDestroyOCRHandle.argtypes = [ctypes.c_void_p]
lib.apiSNDestroyOCRHandle.restype = ctypes.c_int
 
# 初始化变量
statu = SN_STATU()
key = b"SNKJe9xffLhdFY7r3TcffXq44ThDVcE3BQFQFfVA9VG4"
onnx_path = b"D://SNOCR.onnx"
image_path = b"D://7.jpg"
 
# 1. 启动OCR服务
ret = lib.apiSNInitOCRServer(onnx_path, byref(statu))
if ret < 0:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()
 
# 2. 创建OCR句柄
handle = lib.apiSNCreateOCRHandle(key, onnx_path, byref(statu))
if not handle:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()
 
# 3. 获取卡密到期时间
expires_time = lib.apiSNGetKeyExpiresTime(handle, byref(statu))
if not expires_time:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()
print(f"Expires Time: {expires_time.decode('utf-8')}")
 
# 4. 识别OCR,返回Json字符串
ocr_result = lib.apiSNGetOCRFromImage(handle, image_path, byref(statu))
if not ocr_result:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()
try:
    print(f"OCR Result: {ocr_result.decode('utf-8')}")
except UnicodeDecodeError:
    print(f"OCR Result: {ocr_result.decode('GBK')}")
 
# 5. 释放内存
lib.apiSNDestroyOCRHandle(handle)
 
# 等待输入,防止程序直接退出
input("Press Enter to exit...")

三.效果演示

1.图片1

识别效果:

{
	"type":	0,
	"task_id":	1,
	"err_code":	0,
	"ocr_result":	{
		"single_result":	[{
				"single_rate":	0.939104,
				"left":	102.208336,
				"top":	41.812500,
				"right":	329.854156,
				"bottom":	67.829170,
				"single_str_utf8":	"中国建设银行"
			}, {
				"single_rate":	0.966887,
				"left":	104.431534,
				"top":	68.423492,
				"right":	309.992828,
				"bottom":	84.602386,
				"single_str_utf8":	"China Construction Bank"
			}, {
				"single_rate":	0.968900,
				"left":	102.672920,
				"top":	96.168755,
				"right":	403.258331,
				"bottom":	111.964584,
				"single_str_utf8":	"龙卡通(储蓄卡)LONG CARD(DEBIT CARD)"
			}, {
				"single_rate":	0.975151,
				"left":	41.781921,
				"top":	137.955643,
				"right":	410.251556,
				"bottom":	164.107880,
				"single_str_utf8":	"6227 0033 2069 0222 205"
			}, {
				"single_rate":	0.935433,
				"left":	20.770407,
				"top":	210.668716,
				"right":	77.230583,
				"bottom":	230.122101,
				"single_str_utf8":	"ATM"
			}, {
				"single_rate":	0.960131,
				"left":	103.137505,
				"top":	185.368759,
				"right":	192.337509,
				"bottom":	207.204163,
				"single_str_utf8":	"CCB GZ"
			}, {
				"single_rate":	0.929293,
				"left":	338.376495,
				"top":	201.118103,
				"right":	417.111450,
				"bottom":	224.273529,
				"single_str_utf8":	"UnionPa"
			}, {
				"single_rate":	0.917808,
				"left":	367.485413,
				"top":	220.677078,
				"right":	413.479156,
				"bottom":	239.260422,
				"single_str_utf8":	"银联"
			}],
		"unknown_1":	446,
		"unknown_2":	280
	}
}

2.图片2

识别效果:

{
	"type":	0,
	"task_id":	1,
	"err_code":	0,
	"ocr_result":	{
		"single_result":	[{
				"single_rate":	0.919637,
				"left":	622.061157,
				"top":	123.251556,
				"right":	1046.638920,
				"bottom":	190.015121,
				"single_str_utf8":	"马托13610000670"
			}, {
				"single_rate":	0.996936,
				"left":	40.618664,
				"top":	324.310150,
				"right":	541.513184,
				"bottom":	371.843231,
				"single_str_utf8":	"广州利驰服装有限公司"
			}, {
				"single_rate":	0.997014,
				"left":	624.066650,
				"top":	218.300000,
				"right":	1040.933350,
				"bottom":	242.966675,
				"single_str_utf8":	"地址:广州市海珠区赤岗路173号"
			}, {
				"single_rate":	0.964238,
				"left":	624.066650,
				"top":	251.600000,
				"right":	844.833374,
				"bottom":	276.266663,
				"single_str_utf8":	"金丰大厦503室"
			}, {
				"single_rate":	0.979285,
				"left":	625.300000,
				"top":	286.133331,
				"right":	1044.633300,
				"bottom":	309.566681,
				"single_str_utf8":	"厂址:广州市海珠区赤岗西路232"
			}, {
				"single_rate":	0.996300,
				"left":	624.066650,
				"top":	318.200000,
				"right":	759.733337,
				"bottom":	341.633331,
				"single_str_utf8":	"号-234号"
			}, {
				"single_rate":	0.991057,
				"left":	624.066650,
				"top":	351.500000,
				"right":	925,
				"bottom":	374.933350,
				"single_str_utf8":	"热线:400-688-7260"
			}, {
				"single_rate":	0.964125,
				"left":	625.239319,
				"top":	381.016510,
				"right":	922.600220,
				"bottom":	404.499695,
				"single_str_utf8":	"电话:020-84022958"
			}, {
				"single_rate":	0.993601,
				"left":	624.066650,
				"top":	408.233337,
				"right":	923.766663,
				"bottom":	432.900000,
				"single_str_utf8":	"传真:020-84022572"
			}, {
				"single_rate":	0.950434,
				"left":	625.203430,
				"top":	438.767609,
				"right":	1107.616580,
				"bottom":	464.666626,
				"single_str_utf8":	"邮箱:kunhemwl@yahoo.com.cn"
			}, {
				"single_rate":	0.962023,
				"left":	624.066650,
				"top":	471.133331,
				"right":	1001.466670,
				"bottom":	494.566681,
				"single_str_utf8":	"网址:www.hxkunhe.com"
			}],
		"unknown_1":	1184,
		"unknown_2":	614
	}
}

四.常见问题

1.是否支持多线程

支持

五.更新日志

  • 2024.12.15 OCR 文字识别支持C++/Python/易语言

六.云盘源码下载

  • 百度云盘
  • 夸克云盘
  • 123云盘

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/941915.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

闯关leetcode——3158. Find the XOR of Numbers Which Appear Twice

大纲 题目地址内容 解题代码地址 题目 地址 https://leetcode.com/problems/find-the-xor-of-numbers-which-appear-twice/description/ 内容 You are given an array nums, where each number in the array appears either once or twice. Return the bitwise XOR of all …

深度学习中的并行策略概述:2 Data Parallelism

深度学习中的并行策略概述&#xff1a;2 Data Parallelism 数据并行&#xff08;Data Parallelism&#xff09;的核心在于将模型的数据处理过程并行化。具体来说&#xff0c;面对大规模数据批次时&#xff0c;将其拆分为较小的子批次&#xff0c;并在多个计算设备上同时进行处…

shiro权限校验demo

这里通过链式hashmap添加进去接口权限&#xff0c;用安全管理器设置过滤&#xff0c;并且设置登录跳转&#xff08;登录页面需要自己写&#xff0c;shiro不提供&#xff0c;不像springboot那样智能&#xff09; 效果如下&#xff1a; 点击add和update均跳转到如下登录页面 那么…

基于单片机的多功能智能小车(论文+源码)

1.系统整体方案 此次多功能智能小车的设计系统&#xff0c;其整个控制电路的框架如下图所示。整个系统采用STC89C52单片机为控制器其中&#xff1a;LCD液晶负责显示当前信息,蜂鸣器负责特殊情况下进行报警提醒,红外遥控模块方便用户进行远程操作小车,电机模块拟采用前驱的方式…

Log4j1.27配置日志输出级别不起效

起因&#xff1a;构建独立版本debezuim使用时&#xff0c;日志一直打印debug信息。 原因&#xff1a;包冲突问题&#xff0c;进行排包操作。 参考log4j日志级别配置完成后不生效 系统一直打印debug日志_log4j不起作用-CSDN博客 1、application.properties logging.configc…

LabVIEW如何学习FPGA开发

FPGA&#xff08;现场可编程门阵列&#xff09;开发因其高性能、低延迟的特点&#xff0c;在实时控制和高速数据处理领域具有重要地位。LabVIEW FPGA模块为开发者提供了一个图形化编程平台&#xff0c;降低了FPGA开发的门槛。本篇文章将详细介绍LabVIEW FPGA开发的学习路径&…

shell脚本定义特殊字符导致执行mysql文件错误的问题

记得有一次版本发布过程中有提供一个sh脚本用于一键执行sql文件&#xff0c;遇到一个shell脚本定义特殊字符的问题&#xff0c;sh脚本的内容类似以下内容&#xff1a; # 数据库ip地址 ip"127.0.0.1" # 数据库密码 cmdbcmdb!#$! smsm!#$!# 执行脚本文件&#xff08;参…

Jimureport h2命令执行分析记录

首先找testConnection接口&#xff0c;前面进行了jimureport-spring-boot-starter-1.5.8.jar反编译查找&#xff0c;接口找到发现请求参数是json var1是JmreportDynamicDataSourceVo类型&#xff0c;也就是如上图的dbSource&#xff0c;根据打印的结果可以知道这里是local cac…

蓝牙协议——音量控制

手机设置绝对音量 使用Ellisys查看如下&#xff1a; 使用Wireshark查看如下&#xff1a; 音量的量程是128&#xff0c;0x44的十进制是68&#xff0c;53%或54%音量的计算如下&#xff1a; 68 / 128 53.125%耳机设置绝对音量

熊军出席ACDU·中国行南京站,详解SQL管理之道

12月21日&#xff0c;2024 ACDU中国行在南京圆满收官&#xff0c;本次活动分为三个篇章——回顾历史、立足当下、展望未来&#xff0c;为线上线下与会观众呈现了一场跨越时空的技术盛宴&#xff0c;吸引了众多业内人士的关注。云和恩墨副总经理熊军出席此次活动并发表了主题演讲…

提高保养效率:4S店预约系统的设计与开发

3.1可行性分析 开发者在进行开发系统之前&#xff0c;都需要进行可行性分析&#xff0c;保证该系统能够被成功开发出来。 3.1.1技术可行性 开发该4S店预约保养系统所采用的技术是vue和MYSQL数据库。计算机专业的学生在学校期间已经比较系统的学习了很多编程方面的知识&#xff…

简单了解函数递归

函数递归 一 了解函数递归二 深入理解函数递归的思想三 函数递归的优缺点 一 了解函数递归 首先&#xff0c;我们通过一个简单的代码来理解函数递归。 #include<stdio.h> int Func() {return Func(n1); } int main() {int n 5;Func(n);return 0; }这个就是函数递归&am…

重温设计模式--设计模式七大原则

文章目录 1、开闭原则&#xff08;Open - Closed Principle&#xff0c;OCP&#xff09;定义&#xff1a;示例&#xff1a;好处&#xff1a; 2、里氏替换原则&#xff08;Liskov Substitution Principle&#xff0c;LSP&#xff09;定义&#xff1a;示例&#xff1a;好处&#…

GiliSoft AI Toolkit v10.1

Gilisoft AI Toolkit是一个综合性的软件包&#xff0c;为企业和个人提供了一个集成人工智能技术到其工作流程中的解决方案。该软件包包括了多种与人工智能相关的工具&#xff0c;如聊天机器人、光学字符识别(OCR)、文本到语音(TTS)和自动语音识别(ASR)软件。它的目的是通过各种…

四种自动化测试模型实例及优缺点详解

一、线性测试 1.概念&#xff1a; 通过录制或编写对应应用程序的操作步骤产生的线性脚本。单纯的来模拟用户完整的操作场景。 &#xff08;操作&#xff0c;重复操作&#xff0c;数据&#xff09;都混合在一起。 2.优点&#xff1a; 每个脚本相对独立&#xff0c;且不产生…

git自己模拟多人协作

目录 一、项目克隆 二、多人协作 1.创建林冲仓库 2.协作处理 3.冲突处理 三、分支推送协作 1.创建develop分支 2.发现git push无法把develop推送到远程 ​编辑 3.本地的分支推送到远程分支 四、分支拉取协作 五、远程分支的删除 远程仓库用的gitee 一、项目克隆 …

数据结构---------二叉树前序遍历中序遍历后序遍历

以下是用C语言实现二叉树的前序遍历、中序遍历和后序遍历的代码示例&#xff0c;包括递归和非递归&#xff08;借助栈实现&#xff09;两种方式&#xff1a; 1. 二叉树节点结构体定义 #include <stdio.h> #include <stdlib.h>// 二叉树节点结构体 typedef struct…

多智能体/多机器人网络中的图论法

一、引言 1、网络科学至今受到广泛关注的原因&#xff1a; &#xff08;1&#xff09;大量的学科&#xff08;尤其生物及材料科学&#xff09;需要对元素间相互作用在多层级系统中所扮演的角色有更深层次的理解&#xff1b; &#xff08;2&#xff09;科技的发展促进了综合网…

电脑ip地址会变化吗?电脑ip地址如何固定

在数字化时代&#xff0c;IP地址作为网络设备的唯一标识符&#xff0c;对于网络通信至关重要。然而&#xff0c;许多用户可能会发现&#xff0c;自己的电脑IP地址并非一成不变&#xff0c;而是会随着时间的推移或网络环境的变化而发生变化。这种变化有时会给用户带来困扰&#…

每天40分玩转Django:Django国际化

Django国际化 一、今日学习内容概述 学习模块重要程度主要内容国际化基础⭐⭐⭐⭐⭐基本概念、配置设置字符串翻译⭐⭐⭐⭐⭐翻译标记、消息文件模板国际化⭐⭐⭐⭐模板标签、过滤器动态内容翻译⭐⭐⭐⭐模型字段、表单翻译 二、国际化基础配置 # settings.py# 启用国际化 …