Python OCR文字识别api接口

 一.引言

文字识别,也称为光学字符识别(Optical Character Recognition, OCR),是一种将不同形式的文档(如扫描的纸质文档、PDF文件或数字相机拍摄的图片)中的文字转换成可编辑和可搜索的数据的技术。随着技术的发展,文字识别技术已经成为信息管理、自动化办公和智能系统的关键组成部分。

二.简介

为了易于集成和使用,我们将文字识别OCR封装为DLL(动态链接库)。这种封装方式不仅保留了算法的性能优势,还提供了跨平台和跨语言的兼容性,目前支持编程语言如下:

  • C++
  • Python
  • 易语言

1.C++头文件




#ifndef __SN_OCR__H__
#define __SN_OCR__H__

#include "windows.h"


//返回参数
typedef struct SN_STATU {

	int code;			//错误码,如果为 0 表示成功,否则表示错误号
	char message[4096];	//错误信息,如果为 "OK" 表示成功,否则返回错误信息

}SN_STATU;


/*启动OCR文字识别服务
*
* 参数:
*	[in]  szOnnxFilePath:	设置 onnx 模型文件路径,如果设置为 NULL,默认和 DLL文件同级目录
* 	[out] pResult:			返回错误信息,参数pResult->code(错误码)如果为 0 表示成功,否则表示错误号;
*
* 返回值:成功返回0,失败返回错误号,详细错误信息请参考 pResult
*
*/
int WINAPI apiSNInitOCRServer(char* szOnnxFilePath, SN_STATU* pStatu);


/*创建OCR文字识别句柄
*
* 参数:
*	[in]  szKey:		卡密(购买卡密:https://shop.4yuns.com/links/7C9F16B7)
* 	[in]  pOnnxFilePath:设置 onnx 模型文件路径,如果设置为 NULL,默认和 DLL文件同级目录
* 	[out] pResult:		返回错误信息,参数pResult->code(错误码)如果为 0 表示成功,否则表示错误号;
*
* 返回值:成功返回句柄,失败返回NULL
*
*/
HANDLE WINAPI apiSNCreateOCRHandle(char* szKey, char* szOnnxFilePath, SN_STATU* pStatu);


/*获取OCR文字识别卡密到期时间
*
* 参数:
*	[in]  handle:		句柄(通过调用apiSNCreateOCRHandle得到)
* 	[out] pResult:		返回错误信息,参数pResult->code(错误码)如果为 0 表示成功,否则表示错误号;
*
* 返回值:返回卡密到期时间,失败返回NULL,错误信息请查看参数 pResult->message
*
*/
char* WINAPI apiSNGetKeyExpiresTime(HANDLE handle, SN_STATU* pResult);


/*获取OCR文字识别结果(以json字符串形式返回)
*
* 参数:
*	[in]  handle:			句柄(通过调用apiSNCreateOCRHandle得到)
*  	[in]  szImageFilePath:	图片路径
* 	[out] pResult:			返回错误信息,参数pResult->code(错误码)如果为 0 表示成功,否则表示错误号;
*
* 返回值:返回OCR文字识别结果(以json字符串形式返回),失败返回NULL,错误信息请查看参数 pResult->message
*
*/
char* WINAPI apiSNGetOCRFromImage(HANDLE handle, char* szImageFilePath, SN_STATU* pStatu);


/*释放OCR文字识别句柄(释放内存)
*
* 参数:
*	[in] handle:		句柄(通过调用apiSNCreateOCRHandle得到)
*
* 返回值:返回 0 表示成功,其他值表示错误号;
*
*/
int WINAPI apiSNDestroyOCRHandle(HANDLE handle);

#endif

2.Python调用dll接口

from ctypes import cdll, c_char_p, Structure, byref
import ctypes

# 定义SN_STATU结构体
class SN_STATU(Structure):
    _fields_ = [("code", ctypes.c_int),
               ("message", c_char_p * 4096)]

# 加载DLL
lib = cdll.LoadLibrary('D://SNOCR.dll')

# 设置函数参数类型
lib.apiSNInitOCRServer.argtypes = [c_char_p, ctypes.POINTER(SN_STATU)]
lib.apiSNInitOCRServer.restype = ctypes.c_int

lib.apiSNCreateOCRHandle.argtypes = [c_char_p, c_char_p, ctypes.POINTER(SN_STATU)]
lib.apiSNCreateOCRHandle.restype = ctypes.c_void_p

lib.apiSNGetKeyExpiresTime.argtypes = [ctypes.c_void_p, ctypes.POINTER(SN_STATU)]
lib.apiSNGetKeyExpiresTime.restype = c_char_p

lib.apiSNGetOCRFromImage.argtypes = [ctypes.c_void_p, c_char_p, ctypes.POINTER(SN_STATU)]
lib.apiSNGetOCRFromImage.restype = c_char_p

lib.apiSNDestroyOCRHandle.argtypes = [ctypes.c_void_p]
lib.apiSNDestroyOCRHandle.restype = ctypes.c_int

# 初始化变量
statu = SN_STATU()
key = b"SNKJe9xffLhdFY7r3TcffXq44ThDVcE3BQFQFfVA9VG4"
onnx_path = b"D://SNOCR.onnx"
image_path = b"D://7.jpg"

# 1. 启动OCR服务
ret = lib.apiSNInitOCRServer(onnx_path, byref(statu))
if ret < 0:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()

# 2. 创建OCR句柄
handle = lib.apiSNCreateOCRHandle(key, onnx_path, byref(statu))
if not handle:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()

# 3. 获取卡密到期时间
expires_time = lib.apiSNGetKeyExpiresTime(handle, byref(statu))
if not expires_time:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()
print(f"Expires Time: {expires_time.decode('utf-8')}")

# 4. 识别OCR,返回Json字符串
ocr_result = lib.apiSNGetOCRFromImage(handle, image_path, byref(statu))
if not ocr_result:
    print(f"Error:{statu.message.decode('utf-8')}")
    exit()
try:
    print(f"OCR Result: {ocr_result.decode('utf-8')}")
except UnicodeDecodeError:
    print(f"OCR Result: {ocr_result.decode('GBK')}")

# 5. 释放内存
lib.apiSNDestroyOCRHandle(handle)

# 等待输入,防止程序直接退出
input("Press Enter to exit...")

三.效果演示

1.图片1

识别效果:

{
	"type":	0,
	"task_id":	1,
	"err_code":	0,
	"ocr_result":	{
		"single_result":	[{
				"left":	24.700000,
				"top":	17.333332,
				"right":	326.299957,
				"bottom":	32.499992,
				"str_utf8":	"在易语言中,如何为按钮添加点击事件处理代码?",
				"rate":	"0.995533"
			}, {
				"left":	23.806435,
				"top":	63.233559,
				"right":	324.158508,
				"bottom":	79.905136,
				"str_utf8":	"我想在GUI中添加一个文本框,我应该如何操作?",
				"rate":	"0.967164"
			}, {
				"left":	25.554037,
				"top":	110.492912,
				"right":	354.041595,
				"bottom":	124.103584,
				"str_utf8":	"易语言中有哪些控件是常用的,它们各自有什么特点?",
				"rate":	"0.996690"
			}],
		"width":	"416",
		"height":	"152"
	}
}

2.图片2

识别效果:

{
	"type":	0,
	"task_id":	1,
	"err_code":	0,
	"ocr_result":	{
		"single_result":	[{
				"left":	323.454163,
				"top":	14.279167,
				"right":	389.262512,
				"bottom":	37.870834,
				"str_utf8":	"国热点",
				"rate":	"0.745956"
			}, {
				"left":	17.981834,
				"top":	57.859264,
				"right":	258.913910,
				"bottom":	75.778633,
				"str_utf8":	"Python即将成为年度语言,TIOB",
				"rate":	"0.961854"
			}, {
				"left":	18.625000,
				"top":	86.916664,
				"right":	227.845840,
				"bottom":	100.575000,
				"str_utf8":	"12月TIOBE编程语言榜单已发布",
				"rate":	"0.956302"
			}, {
				"left":	18.004168,
				"top":	130.995834,
				"right":	262.612488,
				"bottom":	147.758331,
				"str_utf8":	"传Win11硬件门槛大降,老旧PC",
				"rate":	"0.990127"
			}, {
				"left":	17.383333,
				"top":	158.933334,
				"right":	256.404175,
				"bottom":	173.212494,
				"str_utf8":	"TPM20是未来Windows不可或缺的",
				"rate":	"0.993834"
			}, {
				"left":	17.976627,
				"top":	203.605774,
				"right":	259.543152,
				"bottom":	221.703751,
				"str_utf8":	"OpenAlSora上线即炸服、1条视",
				"rate":	"0.979807"
			}, {
				"left":	17.362951,
				"top":	231.025940,
				"right":	256.424805,
				"bottom":	246.494904,
				"str_utf8":	"作为一款旨在理解和模拟现实的AI基",
				"rate":	"0.929840"
			}, {
				"left":	19.866667,
				"top":	276.891663,
				"right":	247.712463,
				"bottom":	293.654175,
				"str_utf8":	"彻底放弃React!频繁更新和管",
				"rate":	"0.984215"
			}, {
				"left":	17.383333,
				"top":	304.829163,
				"right":	261.991669,
				"bottom":	319.108337,
				"str_utf8":	"React 真的已经不再适合现代开发了吗?",
				"rate":	"0.973967"
			}, {
				"left":	18.591219,
				"top":	349.496246,
				"right":	256.436981,
				"bottom":	367.271393,
				"str_utf8":	"告别VMware!被博通收购后涨价",
				"rate":	"0.997881"
			}, {
				"left":	17.949070,
				"top":	376.545624,
				"right":	266.386017,
				"bottom":	392.872589,
				"str_utf8":	"面对VMware增长十倍的收费,近日英",
				"rate":	"0.990023"
			}, {
				"left":	322.172638,
				"top":	56.995289,
				"right":	555.074097,
				"bottom":	75.172531,
				"str_utf8":	"TOP专家加盟OpenCloudOS年会",
				"rate":	"0.971594"
			}, {
				"left":	322.833344,
				"top":	86.295837,
				"right":	412.854156,
				"bottom":	99.954170,
				"str_utf8":	"睹重磅阵容!",
				"rate":	"0.936653"
			}, {
				"left":	322.803558,
				"top":	130.880295,
				"right":	564.365479,
				"bottom":	147.844025,
				"str_utf8":	"亿级订单系统的数据库查询性能优",
				"rate":	"0.995852"
			}, {
				"left":	321.567688,
				"top":	157.681427,
				"right":	560.010559,
				"bottom":	173.852203,
				"str_utf8":	"为什么没考虑Donis?因为ES是团队应",
				"rate":	"0.967674"
			}, {
				"left":	321.591675,
				"top":	204.254166,
				"right":	469.970825,
				"bottom":	221.016663,
				"str_utf8":	"ChatGPT崩了上热搜",
				"rate":	"0.984410"
			}, {
				"left":	322.833252,
				"top":	232.191650,
				"right":	485.491608,
				"bottom":	246.470810,
				"str_utf8":	"Gemini20发布|极客头条",
				"rate":	"0.958749"
			}, {
				"left":	320.350000,
				"top":	276.270844,
				"right":	564.337524,
				"bottom":	294.275000,
				"str_utf8":	"2024OpenCloudOS年会即将启航",
				"rate":	"0.951624"
			}, {
				"left":	320.970825,
				"top":	304.829163,
				"right":	435.204163,
				"bottom":	319.108337,
				"str_utf8":	"前瞻亮点独家揭秘",
				"rate":	"0.956549"
			}, {
				"left":	322.212494,
				"top":	350.150000,
				"right":	520.879150,
				"bottom":	366.912506,
				"str_utf8":	"降价+豪礼!双十二福利来了",
				"rate":	"0.984479"
			}, {
				"left":	320.970825,
				"top":	376.845825,
				"right":	518.395813,
				"bottom":	392.366669,
				"str_utf8":	"最值得抢购的C++系列精品课程",
				"rate":	"0.965407"
			}],
		"width":	"596",
		"height":	"417"
	}
}

四.常见问题

1.是否支持多线程

支持

五.更新日志

  • 2024.12.15 OCR 文字识别支持C++/Python/易语言

六.云盘源码下载

  • 百度云盘
  • 夸克云盘
  • 123云盘

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/937177.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Type-C接口电热毯的创新之旅

在科技日新月异的今天&#xff0c;智能家居产品正逐步渗透到我们生活的每一个角落&#xff0c;从智能灯光到温控系统&#xff0c;无一不展现着科技带来的便捷与舒适。而在这个追求高效与智能化的浪潮中&#xff0c;一款结合了最新科技元素的电热毯——Type-C接口电热毯&#xf…

【Unity3D】实现UGUI高亮引导点击

Unity版本2019.4.0f1 Personal <DX11> using UnityEngine; using UnityEngine.UI;public class GuideMask : MonoBehaviour, ICanvasRaycastFilter {public Canvas canvas;public Transform guideTargetTrans;public Image image;private Vector3 guideTargetWorldPos;pr…

docker启动一个helloworld(公司内网服务器)

这里写目录标题 容易遇到的问题&#xff1a;1、docker连接问题 我来介绍几种启动 Docker Hello World 的方法&#xff1a; 最简单的方式&#xff1a; docker run hello-world这会自动下载并运行官方的 hello-world 镜像。 使用 Nginx 作为 Hello World&#xff1a; docker…

Redisson常用方法

Redisson 参考: 原文链接 定义&#xff1a;Redisson 是一个用于与 Redis 进行交互的 Java 客户端库 优点&#xff1a;很多 1. 入门 1.1 安装 <!--redission--> <dependency><groupId>org.redisson</groupId><artifactId>redisson</artifa…

火焰传感器与C++编程:精准检测火灾的技术实现

火灾是我们日常生活中一个不可忽视的安全隐患&#xff0c;而火灾报警系统的实现可以大大提高我们的安全保障。通过嵌入式技术和传感器&#xff0c;我们能够在第一时间识别火灾隐患并发出警报。火焰传感器作为一种专门用于火灾监测的传感器&#xff0c;能高效地通过红外线&#…

arcGIS使用笔记(无人机tif合并、导出、去除黑边、重采样)

无人机航拍建图之后&#xff0c;通过大疆智图软件可以对所飞行的区域的进行拼图&#xff0c;但是如果需要对拼好的图再次合并&#xff0c;则需要利用到arcGIS软件。下面介绍arcGIS软件在这个过程中常用的操作。 1.导入tif文件并显示的方法&#xff1a;点击“”图标进行导入操作…

VMware Workstation的有线连接消失了

进入/var/lib目录下 cd /var/lib 查看是否存在NetworkManager 文件 ls 将其删除&#xff0c;然后虚拟机reboot一下。 sudo rm -r NetworkManager reboot 解决了&#xff0c;可以联网

算法-动态数组-62.不同路径

一、题目 二、思路解析 1.思路&#xff1a; 对于找到目的地它的来源主要来源于目的地的上一格和目的地的左一格 2.常用方法&#xff1a; 无 3.核心逻辑&#xff1a; 1.处理边界&#xff1a; a.只向右移动&#xff0c;至始至终只有一条路径 for(int i0;i<m;i){dp[i][0]1; } …

C# 探险之旅:第三十节 - 类型class(继承Inheritance) —— 当“儿子”继承“老爸”的遗产

嘿&#xff0c;探险家们&#xff01;欢迎再次踏上我们的C#奇幻旅程。今天&#xff0c;我们要聊一个既有趣又实用的话题——继承&#xff08;Inheritance&#xff09;&#xff01;想象一下&#xff0c;如果你的“儿子”能够继承“老爸”的遗产&#xff0c;那编程世界里的对象们也…

Qt:Q_GLOBAL_STATIC实现单例(附带单例使用和内存管理)

转载 https://blog.csdn.net/m0_71489826/article/details/142288179 前言 本文主要写Q_GLOBAL_STATIC实现单例以及单例的释放&#xff0c;网上很多教程只有单例的创建&#xff0c;但是并没有告诉我们单例的内存管理&#xff0c;这就很头疼。 正文 使用 Qt 的 Q_GLOBAL_STA…

12.5【Java exp4】【DEBUG】

pro1 JwtAuthenticationFilter 类在两个不同的位置被定义了&#xff0c;导致Spring无法确定使用哪个定义。 为了解决这个问题&#xff0c;你可以采取以下几种方法之一&#xff1a; 检查类路径中的重复类&#xff1a; 确保 JwtAuthenticationFilter 类没有在多个地方被定义。检…

C++11语法解析(二)

可变参数模板 基本语法及原理 ・C11 支持可变参数模板&#xff0c;也就是说支持可变数量参数的函数模板和类模板&#xff0c;可变数目的参数被称为参数包&#xff0c;存在两种参数包&#xff1a;模板参数包&#xff0c;表示零或多个模板参数&#xff1b;函数参数包&#xff1…

《知识拓展 · 统一建模语言UML》

&#x1f4e2; 大家好&#xff0c;我是 【战神刘玉栋】&#xff0c;有10多年的研发经验&#xff0c;致力于前后端技术栈的知识沉淀和传播。 &#x1f497; &#x1f33b; CSDN入驻不久&#xff0c;希望大家多多支持&#xff0c;后续会继续提升文章质量&#xff0c;绝不滥竽充数…

轻量级日志管理平台:Grafana Loki搭建及应用(详细篇)

前言 Grafana Loki是Grafana Lab团队提供的一个水平可扩展、高可用性、多租户的日志聚合系统&#xff0c;与其他日志系统不同的是&#xff0c;Loki最初设计的理念是为了为日志建立标签索引&#xff0c;而非将原日志内容进行索引。 现在目前成熟的方案基本上都是&#xff1a;L…

【原生js案例】如何让你的网页实现图片的按需加载

按需加载&#xff0c;这个词应该都不陌生了。我用到你的时候&#xff0c;你才出现就可以了。对于一个很多图片的网站&#xff0c;按需加载图片是优化网站性能的一个关键点。减少无效的http请求&#xff0c;提升网站加载速度。 感兴趣的可以关注下我的系列课程【webApp之h5端实…

用于卫星影像间接RPC模型精化的通用光束法平差方法

引言 介绍了通用RPC模型的表达式&#xff0c;which has been down to death 描述了RPC模型产生误差的原因——主要与定义传感器方位的姿态角有关。 每个影像都会对应一个三维点云&#xff0c;但是对同一地物拍摄的不同影像对应出来的三维点云是不一样的&#xff0c;所以才需…

搭建Tomcat(一)---SocketServerSocket

目录 引入1 引入2--socket 流程 Socket&#xff08;应用程序之间的通讯保障&#xff09; 网卡(计算机之间的通讯保障) 端口 端口号 实例 client端 解析 server端 解析 相关方法 问题1&#xff1a;ServerSocket和Socket有什么关系&#xff1f; ServerSocket Soc…

玩转个性地图样式!蜂鸟视图蜂鸟云主题编辑器正式上线

当地图不再只是冷冰冰的数据呈现&#xff0c;而是具有美感、适应多场景需求的设计作品时&#xff0c;地图应用的价值也随之提升。 蜂鸟视图推出全新“主题编辑器”功能&#xff0c;助你轻松定制个性化地图样式&#xff0c;赋予地图更多创意与生命力&#xff01; 一、主题编辑器…

【Figma_01】Figma软件初始与使用

Figma初识与学习准备 背景介绍软件使用1.1 切换主题1.2 官方社区 设计界面2.1 创建一个项目2.2 修改文件名2.3 四种模式2.4 新增界面2.5 图层2.6 工具栏2.7 属性栏section透明度和圆角改变多边形的边数渐变效果描边设置阴影等特效拖拽相同的图形 背景介绍 Ul设计:User Interfa…

MATLAB中all,any函数的应用

all表示要查的范围内全非 0 0 0返回 1 1 1&#xff0c;否则返回 0 0 0 any表示要查的范围内有一个非 0 0 0返回 1 1 1&#xff0c;否则返回 0 0 0 向量和矩阵都可以使用&#xff0c;在矩阵中&#xff0c;可以通过1(看列)或2(看行)设置维度 a l l all all和 a n y any any函数…