ocr之opencv配合paddleocr提高识别率

背景1:在这篇文章编写之前使用到的工具并不是opencv,而是java原有的工具BufferedImage。但因为在使用过程中会频繁切图,放大,模糊,所以导致的jvm内存使用量巨大,分秒中都在以百兆的速度累加内存空间。这种情况会让程序卡顿,频繁的发生full gc。增加了jvm宕机的不确定性,也给自己埋下了定时炸弹。在不断摸索后一直不能解决这个高内存使用率的问题。而这又关乎到程序的稳定,于是在近日发现并决定使用opencv试一试。

背景2:使用BufferedImage的这段时间里虽然通过不断调整jvm①达到了没有明显卡顿的效果,但是这个坑迟早还是会害人的。
注①:怎样调整的jvm可以看这篇博文。调整参数不复杂,只是通过较小堆大小来做的,但这不是最佳解决方案》》

注:只是通过paddleocr识别,准确度不如人意。但是经过矫正,使用放大模糊图片,就像给paddleocr带上了一副眼睛,成功的提高了识别率。美哉。应上了一首名句(不识庐山这面目,只缘身在此山中),让paddle能看到山就好。

一、识别思路

1. 切割图片

切割的位置以及尺寸大小是通过提前测量好的,也就是可以通过系统内的操作。

2. 放大图片①

放大的尺寸大小非常需要测试。首先放大倍数过小会导致图片不够清除。倍数过大导致图片的文件大小过量,这会导致各种的不方便,尤其是在通过后面要讲的paddleocr识别起来效率降低(识别时间过长)。
注①:测试后计划使用的放大倍数选择8

3. 模糊图片

模糊图片的操作会带使得paddleocr在现有模型下提高识别率。据观测,棱角分明的像素体,识别率是很低的(感觉paddleocr被训练的更容易看懂抽象一般)

4. paddleocr识别

这是最后一步。我在实际使用的场景下应用的是打包的exe程序。exe打包的具体内容可以查看我的这篇博文 》》

二、具体实现介绍

注:如何使用opencv呢?我咨询的大模型【文心一言】。说实话在变成使用方面他还是很在行的。在使用大模型方面我还解除了【抖音】的【豆包】,豆包的效果不是很好,文心还是不错。

opencv如何使用

1. 下载opencv4.6.0版本并进行配置

注:我使用的是460版本, 是在官网进行的下载,直接下载网速会特别慢,于是使用的【迅雷】(通过看广告获取快下的资格)
opencv官网下载页面》》

  • 下载后解压缩并配置环境变量

注:双击解压到你指定的目录
在这里插入图片描述
注:将你的下方路径配置到环境变量

E:\prgrames\opencv\build

在这里插入图片描述

  • 将下方文件配置到%JAVA_HOME%\bin目录下

在这里插入图片描述

  • 将下方文件配置到项目中

在这里插入图片描述
注:我配置的位置为根目录的/lib/下
在这里插入图片描述

  • 配置maven依赖
<dependency>
    <groupId>opencv</groupId>
    <artifactId>opencv</artifactId>
    <version>460</version>
    <scope>system</scope>
    <systemPath>${project.basedir}/lib/opencv-460.jar</systemPath>
</dependency>
  • 在java代码中静态加载dll文件
static {
   System.loadLibrary(Core.NATIVE_LIBRARY_NAME);
}

由此就可以开始使用了

2. 编写放大模糊裁剪方法
import cn.hutool.core.util.StrUtil;
import org.opencv.core.Core;
import org.opencv.core.Mat;
import org.opencv.core.Rect;
import org.opencv.core.Size;
import org.opencv.imgcodecs.Imgcodecs;
import org.opencv.imgproc.Imgproc;

import java.io.File;
import java.io.IOException;

/**
 * opencv图片处理
 */
public class OpencvPicHanldle {

    static {
        System.loadLibrary(Core.NATIVE_LIBRARY_NAME);
    }

    /** 裁剪图片 */
    static String CLIP_NAME = "tmp_cp";
    /** 放大图片 */
    static String ZOOM_NAME = "tmp_zm";
    /** 模糊图片 */
    static String BLUR_NAME = "tmp_br";

    public static File blurPic(String inputFilePath, String picFormat, String tmpDir, int redius) {
        // 读取图片
        Mat src = Imgcodecs.imread(inputFilePath);
        // 创建输出Mat对象
        Mat dst = new Mat();
        // 定义高斯滤波器的大小,这里使用5x5的核
        Size ksize = new Size(redius, redius);
        // 定义高斯滤波器的标准差,这里使用0,意味着OpenCV会根据核大小自己计算
        double sigmaX = 0;
        double sigmaY = 0;
        // 应用高斯模糊
        Imgproc.GaussianBlur(src, dst, ksize, sigmaX, sigmaY);
        File file;
        try {
            file = File.createTempFile(BLUR_NAME, StrUtil.DOT+picFormat.toLowerCase(), mkdir(tmpDir));
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        // 保存模糊处理后的图片
        Imgcodecs.imwrite(file.getAbsolutePath(), dst);
        // 显示模糊处理后的图片(如果需要的话)
        // HighGui.imshow("Blurred Image", dst);
        // HighGui.waitKey(0);
        // 释放资源
        src.release();
        dst.release();
        return file;
    }

    public static File clipPic(String filePath, String picFormat, String tmpDir, int x, int y, int w, int h) {
        Mat src = Imgcodecs.imread(filePath);
        // 定义切割区域
        Rect roi = new Rect(x, y, w, h); // x, y 是起始点坐标,width, height 是切割区域的宽和高
        // 获取切割后的图片(子矩阵)
        Mat cropped = new Mat(src, roi);
        File file;
        try {
            file = File.createTempFile(CLIP_NAME, StrUtil.DOT+picFormat.toLowerCase(), mkdir(tmpDir));
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        // 保存切割后的图片
        Imgcodecs.imwrite(file.getAbsolutePath(), cropped);
        // 释放资源
        src.release();
        cropped.release();
        return file;
    }

    public static File zoomPic(String inputFilePath, String picFormat, String tmpDir, double scale) {
        // 读取图片
        Mat src = Imgcodecs.imread(inputFilePath);
        // 定义放大后的尺寸,这里假设放大两倍
        double scaleFactor = scale; // 放大倍数
        Size newSize = new Size(src.width() * scaleFactor, src.height() * scaleFactor);
        // 创建放大后的Mat对象
        Mat dst = new Mat();
        // 使用Imgproc.resize()函数放大图片
        Imgproc.resize(src, dst, newSize);
        File file;
        try {
            file = File.createTempFile(ZOOM_NAME, StrUtil.DOT+picFormat.toLowerCase(), mkdir(tmpDir));
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
        // 保存放大后的图片
        Imgcodecs.imwrite(file.getAbsolutePath(), dst);
        // 释放资源
        src.release();
        dst.release();
        return file;
    }

    public static File mkdir(String dirPath) {
        File dirFile = new File(dirPath);
        if(!dirFile.exists()) {
            dirFile.mkdir();
        }
        return dirFile;
    }

}

3. 对接paddleocr识别
python脚本识别

使用python脚本识别只是为了测试, 实际我在java中使用时用到的为打包后的exe
注:paddleocr的安装详情可查看这篇文章 》》
注:安装后可使用脚本进行测试识别图片 如下是python的识别脚本
注:使用时命令如: 标红处为识别出的内容。

# 参数1为打印识别到的内容
padocr.py C:\main\tmp_zm1295880000423201969.jpg 1

在这里插入图片描述

from paddleocr import PaddleOCR
import sys
def recognize(imgPath,printx):
	# 模型路径下必须含有model和params文件
	ocr = PaddleOCR(
					use_angle_cls = True, # 是否加载分类模型
					use_gpu = False# 是否使用gpu
					,show_log=False
					)			
	#img_path = 'C:/Users/Administrator/Desktop/zuoshangjiao/20240129162437.jpg'
	result = ocr.ocr(imgPath, cls = True)
	#print(f"result:{result}")
	for i,line in enumerate(result):
		#print(f"i:{i}, line:{line}")
		for j,item in enumerate(line):
			print(f"item: {item}")
			for k, body in enumerate(item):
				#if k == 1:
					print(f"k:{k}, point:{body[0]}, value:{body[1]}")
					print(printx)
					if printx == "1":
						print(f"{body[0]}, ordinary:{body[1]}")
					else:
						print(f"{body[0]}")

if __name__ == "__main__":
	recognize(sys.argv[1],sys.argv[2])
java程序
import cn.hutool.core.date.DatePattern;
import cn.hutool.core.date.DateUtil;
import cn.hutool.core.io.FileUtil;
import cn.hutool.core.util.StrUtil;
import lombok.extern.slf4j.Slf4j;
import org.opencv.core.Mat;
import org.opencv.core.Rect;
import org.opencv.core.Size;
import org.opencv.imgcodecs.Imgcodecs;
import org.opencv.imgproc.Imgproc;

import javax.imageio.ImageIO;
import java.awt.*;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;
import java.util.Date;

/**
 * paddleocr识别工具类
 */
@Slf4j
public class PaddleOcrUtil {
    /** 临时文件路径 */
    public static String tmpPath = System.getProperty("user.dir") + StrUtil.SLASH + "tmpFile" + StrUtil.SLASH + DateUtil.format(new Date(), DatePattern.PURE_DATETIME_MS_FORMAT);

    /**
     * 创建图片路径
     */
    static {
        File tmpFile = new File(tmpPath);
        if(!tmpFile.exists()) {
            if(FileUtil.mkParentDirs(tmpPath).exists()) {
                if(tmpFile.mkdir()) {}
            }
        }
    }

    /**
     * 测试使用, 勿删除
     */
    public static void testRec() {
        String cutPic = "D:\\...\\tmp_cp8579718493577844855.jpg";
        String abs = "D:\\...\\tmpFile\\20240328104742415\\acc3";
        File a = OpencvPicHanldle.zoomPic(cutPic, "jpg", abs, 8);
        File b = OpencvPicHanldle.blurPic(a.getAbsolutePath(), "jpg", abs, 5);
        System.out.println(b.getAbsolutePath());
    }

    /**
     * 识别图片
     * @param filePath 整图
     * @param picFormat 整图类型
     * @param x 需要切割的坐标x
     * @param y 需要切割的坐标y
     * @param w 需要切割的坐标w
     * @param h 需要切割的坐标h
     * @return
     */
    public static String rec(String filePath, String picFormat, int x, int y, int w, int h) {
        File outputfile;
        try{
            outputfile = OpencvPicHanldle.clipPic(filePath, picFormat, tmpPath, x, y, w, h);
        }catch (Throwable e) {
            log.error("rec.err: ", e);
            return StrUtil.EMPTY;
        }
        return rec(outputfile, picFormat);
    }

    /**
     * 识别图片具体方法
     * @param outputfile 切割后的图片路径
     * @param formatName 图片类型
     * @return
     */
    private static String rec(File outputfile, String formatName) {
        File zoomFile = null;
        File blurFile = null;
        try {
            // 放大
            zoomFile = OpencvPicHanldle.zoomPic(outputfile.getAbsolutePath(), formatName, tmpPath, 8);
            // 模糊化
            blurFile = OpencvPicHanldle.blurPic(zoomFile.getAbsolutePath(), formatName, tmpPath, 5);
            String console;
            try {
                console = ShellUtils.exec(OcrServiceRegistry.execPath, blurFile.getAbsolutePath());
            } catch (Exception e) {
                throw new RuntimeException(e);
            }
            if(StrUtil.isEmpty(console)) return StrUtil.EMPTY;
            return console.replaceAll("[\\s\\t\\n\\r]+", "");
        }catch (Throwable e) {
            e.printStackTrace();
            return "";
        }finally {
            if(outputfile != null) {
                if(!OcrServiceRegistry.saveClipImage) {
                    outputfile.delete();
                }
            }
            if(zoomFile != null) {
                if(!OcrServiceRegistry.saveBlurImage) {
                    zoomFile.delete();
                }
            }
            if(blurFile != null) {
                if(!OcrServiceRegistry.saveBlurImage) {
                    blurFile.delete();
                }
            }
        }
    }
}

三、使用opencv注意事项

注:不要有中文路径,否则会报错

  • 不要有中文路径(java程序如jar包所在路径)
  • 不要有中文路径(要处理的图片所在路径)

总结

1. 持之以恒

对不满意的事情想办法让他变得更好。
注:心里一直装着的事终于能够落地了。因为一直装着,也就是放在心上,终归有了解决方案。

2. 换种思路

注:避免死心眼钻牛角尖。就比如死磕jvm调优,但还是于事无补。
注:多尝试新的东西,会带来不小的收获

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/496882.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

WIFI驱动移植实验: openssl库的移植(wpa_supplicant 依赖库)

一. 简介 前面实现了WIFI驱动的移植&#xff0c;而连接某个WIFI热点上就需要用到 wpa_supplicant 工具&#xff0c;所以&#xff0c;本文开始为 移植 wpa_supplicant 工具做准备。 wpa_supplicant 依赖于 openssl库 与 libnl库&#xff0c;因此&#xff0c;需要移植一下open…

鸿蒙hdc使用指导

简介 hdc&#xff08;HarmonyOS Device Connector&#xff09;是HarmonyOS为开发人员提供的用于调试的命令行工具&#xff0c;通过该工具可以在windows/linux/mac系统上与真实设备或者模拟器进行交互。 环境准备 hdc工具通过HarmonyOS SDK获取&#xff0c;存放于SDK的toolch…

蓝桥杯练习题总结(三)线性dp题(摆花、数字三角形加强版)

目录 一、摆花 思路一&#xff1a; 确定状态&#xff1a; 初始化&#xff1a; 思路二&#xff1a; 确定状态&#xff1a; 初始化&#xff1a; 循环遍历&#xff1a; 状态转移方程&#xff1a; 二、数字三角形加强版 一、摆花 题目描述 小明的花店新开张&#xff0c;为了吸…

VBA技术资料MF134:单值匹配查找

我给VBA的定义&#xff1a;VBA是个人小型自动化处理的有效工具。利用好了&#xff0c;可以大大提高自己的工作效率&#xff0c;而且可以提高数据的准确度。“VBA语言専攻”提供的教程一共九套&#xff0c;分为初级、中级、高级三大部分&#xff0c;教程是对VBA的系统讲解&#…

【消息队列开发】 实现 MqClientTests 类——测试客户端

文章目录 &#x1f343;前言&#x1f333;所需属性&#x1f334;BeforeEach&#x1f332;AfterEach&#x1f38d;API测试⭕总结 &#x1f343;前言 本次开发任务 测试客户端接口 &#x1f333;所需属性 所需要一共三个属性 BrokerServer&#xff1a;服务器 ConnectionFa…

C++进阶之路---C++11新特性 | lambda表达式

顾得泉&#xff1a;个人主页 个人专栏&#xff1a;《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂&#xff0c;年薪百万&#xff01; 前言&#xff1a;简介lambda 在C中&#xff0c;lambda表达式是一种匿名函数的方式&#xff0c;它可以用来解决以下问题&a…

免费|Python|【需求响应】一种新的需求响应机制DR-VCG研究

目录 1 主要内容 2 部分代码 3 程序结果 4 下载链接 1 主要内容 该程序对应文章《Contract Design for Energy Demand Response》&#xff0c;电力系统需求响应&#xff08;DR&#xff09;用来调节用户对电能的需求&#xff0c;即在预测的需求高于电能供应时&#xff0c;希…

TTS 文本转语音模型综合简述

本文参考文献&#xff1a; [1] Kaur N, Singh P. Conventional and contemporary approaches used in text ot speech synthesis: A review[J]. Artificial Intelligence Review, 2023, 56(7): 5837-5880. [2] TTS | 一文了解语音合成经典论文/最新语音合成论文篇【20240111更新…

使用certbot为网站启用https

1. 安装certbot客户端 cd /usr/local/bin wget https://dl.eff.org/certbot-auto chmod ax ./certbot-auto 2. 创建目录和配置nginx用于验证域名 mkdir -p /data/www/letsencryptserver {listen 80;server_name ~^(?<subdomain>.).ninvfeng.com;location /.well-known…

大数据之scala

为什么学习scala spark是新一代内存级大数据计算框架&#xff0c;是大数据的重要内容 spark就是使用scala编写的&#xff0c;因此为了更好的学习spark&#xff0c;需要掌握scala这门语言 spark的兴起&#xff0c;带动scala语言的发展 scala发展历史 联邦理工学院的马丁 奥德…

spring boot3自定义注解+拦截器+Redis实现高并发接口限流

⛰️个人主页: 蒾酒 &#x1f525;系列专栏&#xff1a;《spring boot实战》 &#x1f30a;山高路远&#xff0c;行路漫漫&#xff0c;终有归途 目录 写在前面 内容简介 实现思路 实现步骤 1.自定义限流注解 2.编写限流拦截器 3.注册拦截器 4.接口限流测试 写在前…

http和https之间的区别和优势

HTTP&#xff08;超文本传输协议&#xff09;和HTTPS&#xff08;安全超文本传输协议&#xff09;是两种在互联网通信中应用广泛的协议&#xff0c;它们在数据传输、安全性、加密等方面有着明显的区别和优势。下面将详细介绍HTTP和HTTPS之间的区别和各自的优势。 区别和优势 1…

2024年腾讯云最新优惠活动整理汇总

随着云计算技术的不断发展&#xff0c;越来越多的企业和个人开始选择将业务迁移到云端。腾讯云作为国内领先的云计算服务提供商&#xff0c;不仅提供了稳定、安全的云服务&#xff0c;还通过一系列的优惠活动&#xff0c;为用户带来了实实在在的福利。2024年&#xff0c;腾讯云…

用Python机器学习模型预测世界杯结果靠谱吗?

看到kaggle、medium上有不少人用球队的历史数据来进行建模预测&#xff0c;比如用到泊松分布、决策树、逻辑回归等算法&#xff0c;很大程度上能反映强者恒强的现象&#xff0c;比如巴西、英格兰等大概率能进8强&#xff0c;就像高考模拟考试成绩越好&#xff0c;大概率高考也会…

美团0316春招笔试题

下面是美团2024-03-16笔试真题&#xff0c;进行了VP&#xff0c;由于未参与评测&#xff0c;故不保证正确性&#xff0c;仅供参考。 第一题 小美点外卖 求和然后减去满减和红包即可。 #include <bits/stdc.h> using namespace std; using LL long long ; int n, t, x,…

开源 | 电动自行车充换电解决方案,从智能硬件到软件系统,全部自主研发

文章目录 一、产品功能部分截图1.手机端&#xff08;小程序、安卓、ios&#xff09;2.PC端 二、小程序体验账号以及PC后台体验账号1.小程序体验账号2.PC后台体验账号关注公众号获取最新资讯 三、产品简介&#xff1f;1. 充电桩云平台&#xff08;含硬件充电桩&#xff09;&…

ffmpeg实现媒体流解码

ffmpeg Version : 5.14 本期主要讲解怎么将MP4媒体流的视频解码为yuv,音频解码为pcm数据;在此之前我们要先了解解复用和复用的概念; 解复用:像mp4是由音频和视频组成的(其他内容流除外);将MP4的流拆分成视频流(h264或h265等)和音频流(AAC或mp3等); 复用:就是将音频…

Mysql配置autocommit实际使用(慎用)

以下内容都是基于MySQL5.7。所有操作建议在MySQL客户端执行。navicat可能会先意想不到的问题 在导入频繁执行update、insert的时候&#xff0c;可以考虑关闭MySQL的自动提交 首先查询当前的状态 1开启 0关闭 select autocommit;设置本次连接关闭自动提交(如果需要永久关闭请修…

RowHammer 攻击:内存的隐形威胁

RowHammer 攻击是一种相对较新的攻击方式&#xff0c;它利用了现代动态随机存取存储器&#xff08;DRAM&#xff09;的物理缺陷&#xff0c;这种攻击方式不同于传统的软件漏洞利用&#xff0c;它直接针对硬件的弱点。这种攻击利用了 DRAM 在运行过程中产生的意外电荷泄漏效应&a…

IP组播基础

原理概述 IANA ( Internet Assigned Numbers Authority &#xff09;将 IP 地址分成了 A 、 B 、 C 、 D 、 E5类&#xff0c;其中的 D 类为组播 IP 地址&#xff0c;范围是224.0.0.0~239.255.255.255。 一个 IP 报文&#xff0c;其目的地址如果是单播 IP 地址&#xff…