【玩转OCR | 腾讯云智能结构化OCR在图像增强与发票识别中的应用实践】

](https://img-home.csdnimg.cn/images/20220524100510.png#pic_center)
🌈个人主页: Aileen_0v0
🔥热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法
💫个人格言:“没有罗马,那就自己创造罗马~”

文章目录

- 引言
图像增强API调用实践
- 1. API选择与参数设置
- 2. 在线调试与结果分析
- 3. 响应结果
- 具体实现代码
发票识别API调用实践
- 1. API选择与参数设置
- 2. 在线调试与结果分析
- 3. 响应结果
- 具体实现代码
- 其它应用场景
- - 1. 交通行业
  - 2. 物流行业
  - 3. 金融行业
- 结论
- 个人见解
- 体验链接

引言

在数字化转型的浪潮中，光学字符识别（OCR）技术已成为企业提高效率、降低成本的关键工具。腾讯云智能结构化OCR产品，以其高精度识别能力和多模态大模型技术，为交通、物流、金融、零售等行业提供了强有力的技术支持。本文将结合实际案例，探讨腾讯云智能结构化OCR在图像增强和发票识别中的应用实践。

图像增强API调用实践

1. API选择与参数设置

在腾讯云API Explorer中，我们选择了“图像增强”API，用于提升图像质量。通过设置相关参数，如ImageBase64（图像的Base64编码字符串）或ImageUrl（图像URL），我们可以将待处理的图像传递给API。

在这里插入图片描述

2. 在线调试与结果分析

通过在线调试功能，我们上传了一张动漫风格的图像，并选择了“文字锐化”作为增强方法。调用API后，系统返回了处理成功的响应，并且提供了增强后的图像。

在这里插入图片描述

3. 响应结果

响应结果显示，处理成功，并且返回了增强后的图像。通过对比原图和增强后的图像，可以明显看出图像质量的提升，尤其是在锐化方面。
在这里插入图片描述

在这里插入图片描述

具体实现代码




package com.tencent;
import com.tencentcloudapi.common.AbstractModel;

import com.tencentcloudapi.common.Credential;
import com.tencentcloudapi.common.profile.ClientProfile;
import com.tencentcloudapi.common.profile.HttpProfile;
import com.tencentcloudapi.common.exception.TencentCloudSDKException;
import com.tencentcloudapi.ocr.v20181119.OcrClient;
import com.tencentcloudapi.ocr.v20181119.models.*;

public class Sample
{
    public static void main(String [] args) {
        try{
            // 实例化一个认证对象，入参需要传入腾讯云账户 SecretId 和 SecretKey，此处还需注意密钥对的保密
            // 代码泄露可能会导致 SecretId 和 SecretKey 泄露，并威胁账号下所有资源的安全性。以下代码示例仅供参考，建议采用更安全的方式来使用密钥，请参见：https://cloud.tencent.com/document/product/1278/85305
            // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
            Credential cred = new Credential("SecretId", "SecretKey");
            // 实例化一个http选项，可选的，没有特殊需求可以跳过
            HttpProfile httpProfile = new HttpProfile();
            httpProfile.setEndpoint("ocr.tencentcloudapi.com");
            // 实例化一个client选项，可选的，没有特殊需求可以跳过
            ClientProfile clientProfile = new ClientProfile();
            clientProfile.setHttpProfile(httpProfile);
            // 实例化要请求产品的client对象,clientProfile是可选的
            OcrClient client = new OcrClient(cred, "", clientProfile);
            // 实例化一个请求对象,每个接口都会对应一个request对象
            ImageEnhancementRequest req = new ImageEnhancementRequest();
            
            // 返回的resp是一个ImageEnhancementResponse的实例，与请求对象对应
            ImageEnhancementResponse resp = client.ImageEnhancement(req);
            // 输出json格式的字符串回包
            System.out.println(AbstractModel.toJsonString(resp));
        } catch (TencentCloudSDKException e) {
            System.out.println(e.toString());
        }
    }
}

发票识别API调用实践

1. API选择与参数设置

在腾讯云API Explorer中，我们选择了“RecognizeGeneralInvoice”API，用于识别发票信息。通过设置相关参数，如ImageBase64或ImageUrl，我们可以将待识别的发票图像传递给API。

在这里插入图片描述

2. 在线调试与结果分析

通过在线调试功能，我们上传了一张发票图像。调用API后，系统返回了识别成功的响应，并且提供了结构化的发票信息，包括发票类型、金额、日期等关键字段。
在这里插入图片描述

在这里插入图片描述

3. 响应结果

响应结果显示，识别成功，并且返回了详细的发票信息。这为企业的自动化报销流程、财务审计等提供了极大的便利。
在这里插入图片描述

具体实现代码



package com.tencent;
import com.tencentcloudapi.common.AbstractModel;

import com.tencentcloudapi.common.Credential;
import com.tencentcloudapi.common.profile.ClientProfile;
import com.tencentcloudapi.common.profile.HttpProfile;
import com.tencentcloudapi.common.exception.TencentCloudSDKException;
import com.tencentcloudapi.ocr.v20181119.OcrClient;
import com.tencentcloudapi.ocr.v20181119.models.*;

public class Sample
{
    public static void main(String [] args) {
        try{
            // 实例化一个认证对象，入参需要传入腾讯云账户 SecretId 和 SecretKey，此处还需注意密钥对的保密
            // 代码泄露可能会导致 SecretId 和 SecretKey 泄露，并威胁账号下所有资源的安全性。以下代码示例仅供参考，建议采用更安全的方式来使用密钥，请参见：https://cloud.tencent.com/document/product/1278/85305
            // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
            Credential cred = new Credential("SecretId", "SecretKey");
            // 实例化一个http选项，可选的，没有特殊需求可以跳过
            HttpProfile httpProfile = new HttpProfile();
            httpProfile.setEndpoint("ocr.tencentcloudapi.com");
            // 实例化一个client选项，可选的，没有特殊需求可以跳过
            ClientProfile clientProfile = new ClientProfile();
            clientProfile.setHttpProfile(httpProfile);
            // 实例化要请求产品的client对象,clientProfile是可选的
            OcrClient client = new OcrClient(cred, "", clientProfile);
            // 实例化一个请求对象,每个接口都会对应一个request对象
            RecognizeGeneralInvoiceRequest req = new RecognizeGeneralInvoiceRequest();
            
            // 返回的resp是一个RecognizeGeneralInvoiceResponse的实例，与请求对象对应
            RecognizeGeneralInvoiceResponse resp = client.RecognizeGeneralInvoice(req);
            // 输出json格式的字符串回包
            System.out.println(AbstractModel.toJsonString(resp));
        } catch (TencentCloudSDKException e) {
            System.out.println(e.toString());
        }
    }
}