玩转OCR | 腾讯云智能结构化OCR初次体验

目录

一、什么是OCR(需要了解)

二、产品概述与核心优势

产品概述

智能结构化能做什么

举例说明(选看)

1、物流单据识别

2、常见证件识别 

3、票据单据识别

4、行业材料识别

三、产品特性

高精度

泛化性

易用性

四、产品实际测试与感受

证书识别

驾驶证识别

营业执照识别 

五、个人看法总结

一、什么是OCR(需要了解)

OCR又被称为光学字符识别技术,在数字化转型的浪潮中企业为了提高效率、降低成本的关键工具,而我们今天介绍的这款产品就是腾讯云推出的智能结构化OCR,它凭借其先进的技术和广泛的应用场景,正在推动跨行业高效精准的文档处理与数据提取新时代。

本文将全面介绍腾讯云智能结构化OCR的功能、技术优势、应用实践以及行业案例,帮助您深入了解并有效运用这一强大的工具。

二、产品概述与核心优势

产品概述

智能结构化(Smart Structure Optical Character Recognition )融合了业界领先的深度学习技术、图像检测技术以及OCR大模型能力,能够实现不限版式的结构化信息抽取。无论是固定卡证还是复杂的物流单据,均可实现智能识别。该产品预学习建立键值对应关系,支持客户定制模板,提升数据提取录入效率,适用于政务、票据核销、行业表单和国际物流等场景。

智能结构化能做什么

上传图片自动提取结构化信息,智能KV格式信息提取

  • 自动化识别千种版式的自动提取
  • 亿级调用经过大规模验证
  • 98%准确率高
  • 1API   1个API解决多种识别问题

举例说明(选看)

要识别的单据证照、不限定版式,智能结构化全搞定,6000+种版面的证照单据支持,无需集成多个接口,单一接口解决诸多证照单据识别问题

1、物流单据识别

适用于各种版式不固定、版面复杂、中英文混排的场景,针对进出口物流、货代、进出口贸易的单据,完成高精度的结构化识别:

  1. 跨境货代场景,涉及单据运单、海外发票、装箱单、提单、进出口报关单、托书、磅单、货物保险单、货运到达通知。
  2. 快递&快运场景,涉及单据:出货单、出库单、签回单。
  3. 国际贸易与采购,涉及单据:采购订单、海外发票、海关进口关税、原厂地证明、国际信用证书。

2、常见证件识别 

适用于各种个人企业证件的识别场景,针对下列典型版式统一、未定制的材料,可完成高精度识别结构化:

  1. 政务类个人证件,如:临时身份证、出生证、结婚证、军官证、警察证、残疾人证、导游证等。
  2. 教育类个人证件,如:学生证、四六级证、教师资格证、毕业证书、学位证、学历认证、办学许可证等。
  3. 交通类个人证件,如:道路运输证、从业资格证、网约车运输证、网约车驾驶证、临时车牌、车辆合格证等。
  4. 企业资质类证照,如:医疗许可证、食品经营许可证、药品生产许可证、烟草专卖许可证、运输许可证等。
  5. 其他单据材料,如:车险保单、快递运单、银行回单、商业汇票、磅单等。
3、票据单据识别

适用于各种票据单据的识别场景,针对下列典型版式统一、未定制的材料,可完成高精度识别结构化:

  1. 金融类票据单据,如:银行纸质回单、银行电子回单、大额汇兑凭证、代理记账许可证书、客户入账通知单等。
  2. 财务类报销单据,如:商品小票、支付截图凭证、滴滴行程单、酒店水单、海关缴纳书、商品订单页等。
  3. 运输类票据单据,如:报关单、运单、英文发票、英文小票、发货卸货单、采购单、配送单等。

4、行业材料识别

适用于细分行业领域各种特殊材料的识别场景,针对下列典型版式统一、未定制的材料,可完成短文本及表格的高精度结构化:

  1. 工业行业材料,如:商品标签、设备铭牌、价签等。
  2. 服务行业材料,如:合同、标书、车辆保险单据、彩票等。
  3. 医疗行业材料,如:药品说明书、出院记录、医院检验报告单等。

三、产品特性

高精度

泛化性

易用性

支持任意固定版式的卡证票据识别,各字段精度均处于业界领先水平,识别准确率达到90%以上。

支持多种常见固定版式的数据结构化提取,如警察证、教师资格证、道路运输证等,适用于多行业场景。

用户仅需简单的几步配置,即可定制个性化结构抽取方式,快速提取数据,无需训练,实现高效录入。

四、产品实际测试与感受

因为我是学生,所以我就简单的拿一个获奖证书来进行测试,简单测试一下该产品的识别效果和能力。

点击跳转到腾讯云OCR API

进行下面的操作(发起请求前需要确保是否已经开通了该服务

然后就可以了,选择你想要识别的图像,然后点击发起请求。

证书识别

这里我们可以看到识别的结果如下:


  "Angle": 0,
  "RequestId": "e56fbd1d-d65e-41f6-ab62-b9f716e2152f",
  "Title": "蓝桥杯大赛获奖证书",
  "Name": "******",//这里我就不展示了
  "CertNumber": "******",//这里我就不展示了
  "IDNumber": "******",//这里我就不展示了
  "IssuingOrganization": "工业和信息化部人才交流中心",
  "CompetitionCommittee": "蓝桥杯大赛组委会",
  "Date": "2023年4月23日",
  "Seal": true,
  "QRCode": true,
  "RecognizeWarnCode": [],
  "RecognizeWarnMsg": [],
  "RegistrationAuthority": "工业和信息化部人才交流中心",
  "RegistrationDate": "2023年4月23日",
  "SetDate": "2023年4月23日",
  "IsDuplication": 1

 调用实例代码


package main

import (
        "fmt"

        "github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/common"
        "github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/common/errors"
        "github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/common/profile"
        ocr "github.com/tencentcloud/tencentcloud-sdk-go/tencentcloud/ocr/v20181119"
)

func main() {
        // 实例化一个认证对象,入参需要传入腾讯云账户 SecretId 和 SecretKey,此处还需注意密钥对的保密
        // 代码泄露可能会导致 SecretId 和 SecretKey 泄露,并威胁账号下所有资源的安全性。以下代码示例仅供参考,建议采用更安全的方式来使用密钥,请参见:https://cloud.tencent.com/document/product/1278/85305
        // 密钥可前往官网控制台 https://console.cloud.tencent.com/cam/capi 进行获取
        credential := common.NewCredential(
                "SecretId",
                "SecretKey",
        )
        // 实例化一个client选项,可选的,没有特殊需求可以跳过
        cpf := profile.NewClientProfile()
        cpf.HttpProfile.Endpoint = "ocr.tencentcloudapi.com"
        // 实例化要请求产品的client对象,clientProfile是可选的
        client, _ := ocr.NewClient(credential, "", cpf)

        // 实例化一个请求对象,每个接口都会对应一个request对象
        request := ocr.NewRecognizeGeneralTextImageWarnRequest()
        


        // 返回的resp是一个RecognizeGeneralTextImageWarnResponse的实例,与请求对象对应
        response, err := client.RecognizeGeneralTextImageWarn(request)
        if _, ok := err.(*errors.TencentCloudSDKError); ok {
                fmt.Printf("An API error has returned: %s", err)
                return
        }
        if err != nil {
                panic(err)
        }
        // 输出json格式的字符串回包
        fmt.Printf("%s", response.ToJsonString())
} 
驾驶证识别

调试API后,系统返回处理成功的响应,并提供识别后的驾驶证内容,识别结果示例如下: 

Address: "广东省深圳市南山区腾讯大厦"
ArchivesCode: ""
BackPageCardCode: ""
BackPageName: ""
CardCode: "440305198305101408"
Class: "C2"
CumulativeScore: ""
CurrentTime: ""
DateOfBirth: "1983-05-10"
DateOfFirstIssue: "2005-05-01"
DriverLicenseType: "Normal"
EndDate: "2025-10-01"
GenerateTime: ""
IssuingAuthority: "上海市公安局交通警察总队"
Name: "刘洋"
Nationality: "中国"
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
Record: ""
RequestId: "6c156215-4f2c-42b4-b41d-ffd8cff488bb"
Sex: "女"
StartDate: "2015-10-01"
State: ""
营业执照识别 

 调试API后,系统返回处理成功的响应,并提供识别后的营业执照内容,识别结果示例如下: 

Address: "深圳市南山区高新区高新南一路飞亚达大厦"
Angle: 0.09112373739480972
Business: "计算机软、硬件的设计、技术开发、销售(不含专营、专控、专卖商品及限制项目);数据库及计算机网络服务;国内商业、物资供销业(不含专营、专控、专卖商品)"
Capital: "人民币柒仟万"
ComposingForm: ""
Electronic: false
IsDuplication: 1
Name: "杭州市魔乐计算机有限公司"
NationalEmblem: true
Period: "1998年11月至长期"
Person: "毛华"
QRCode: true
RecognizeWarnCode: [
]
RecognizeWarnMsg: [
]
RegNum: "110000012345678"
RegistrationAuthority: "广东省工商行政管理局"
RegistrationDate: "1998年11月13日"
RequestId: "0dd108d7-28bb-435f-b9fa-27e6a9d6cb32"
Seal: true
SerialNumber: ""
SetDate: "1998年11月"
Title: "营业执照"
Type: "有限责任公司"

五、个人看法总结

腾讯云提供的产品,识别能力和效果都是不错的,感兴趣的话可以试试。

参考资料

  • 腾讯云 智能结构化OCR产品官网
  • 腾讯云 OCR技术文档
  • 腾讯云 OCR API 接口文档
  • 腾讯云 OCR API 在线调用页面
  • 腾讯云 OCR 体验 Demo
  • 腾讯云 Smart OCR 产品页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/946842.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于微信小程序的校园自助打印系统

博主介绍:java高级开发,从事互联网行业六年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

driftingblues6_vh靶机

首先把靶机换成NAT模式 使用 arp-scan 命令扫描网段内存活的主机,以获取靶机ip地址 arp-scn -l 尝试访问ip 使用御剑扫描子域名,尝试访问robots.txt文件 通过访问文件我们发现了一个/textpattern/textpattern目录 访问一下目录发现了登录页面 他还给了…

STM32使用UART发送字符串与printf输出重定向

首先我们先看STM32F103C8T6的电路图 由图可知,其PA9和PA10引脚分别为UART的TX和RX(注意:这个电路图是错误的,应该是PA9是X而PA9是RX,我们看下图的官方文件可以看出),那么接下来我们应该找到该引脚的定义是什么&#xf…

数据库自增 id 过大导致前端时数据丢失

可以看到,前端响应参数是没有丢失精度的 但是在接受 axios 请求参数时出现了精度丢失 解决方案一:改变 axios 字符编码 axios.defaults.headers[Content-Type] application/json;charsetUTF-8; 未解决 解决方案二:手动使用 json.parse() …

SpringBoot教程(三十二) SpringBoot集成Skywalking链路跟踪

SpringBoot教程(三十二) | SpringBoot集成Skywalking链路跟踪 一、Skywalking是什么?二、Skywalking与JDK版本的对应关系三、Skywalking下载四、Skywalking 数据存储五、Skywalking 的启动六、部署探针 前提: Agents 8.9.0 放入 …

闻泰科技涨停-操盘训练营实战-选股和操作技术解密

如上图,闻泰科技,今日涨停,这是前两天分享布局的一个潜伏短线的标的。 选股思路: 1.主图指标三条智能辅助线粘合聚拢,即将选择方向 2.上图红色框住部分,在三线聚拢位置,震荡筑底,…

计算机体系结构期末复习3:GPU架构及控制流问题

目录 一、GPU设计思路 1.简化流水线、增加核数 2.单指令多线程(SIMT) 3.同时驻留大量线程 4.总思路:多线程单指令多线程 二、GPU的控制流问题 1.什么是控制流问题 2.怎么应对分支分歧 一、GPU设计思路 1.简化流水线、增加核数 2.单指…

面试241228

面试可参考 1、cas的概念 2、AQS的概念 3、redis的数据结构 使用场景 不熟 4、redis list 扩容流程 5、dubbo 怎么进行服务注册和调用,6、dubbo 预热 7如何解决cos上传的安全问题kafka的高并发高吞吐的原因ES倒排索引的原理 spring的 bean的 二级缓存和三级缓存 spr…

2024 年发布的 Android AI 手机都有什么功能?

大家好,我是拭心。 2024 年是 AI 快速发展的一年,这一年 AI 再获诺贝尔奖,微软/苹果/谷歌等巨头纷纷拥抱 AI,多款强大的 AI 手机进入我们的生活。 今年全球 16% 的智能手机出货量为 AI 手机,到 2028 年,这…

SimForge HSF 案例分享|复杂仿真应用定制——UAVSim无人机仿真APP(技术篇)

导读 「神工坊」核心技术——「SimForge HSF高性能数值模拟引擎」支持工程计算应用的快速开发、自动并行,以及多域耦合、AI求解加速,目前已实现航发整机数值模拟等多个系统级高保真数值模拟应用落地,支持10亿阶、100w核心量级的高效求解。其低…

Windows 下安装 triton 教程

目录 背景解决方法方法一:(治标不治本)方法二:(triton-windows)- 安装 MSVC 和 Windows SDK- vcredist 安装- whl 安装- 验证 背景 triton 目前官方只有Linux 版本,若未安装,则会出…

Kali 自动化换源脚本编写与使用

1. 背景与需求 在使用 Kali Linux 的过程中,软件源的配置对系统的更新与软件安装速度至关重要。 Kali 的默认官方源提供了安全且最新的软件包,但有时由于网络条件或地理位置的限制,使用官方源可能会出现速度较慢的问题。 为了解决这一问题&a…

Ajax数据爬取

有时我们用requests 抓取页面得到的结果,可能和在浏览器中看到的不一样:在浏览器中可以看到正常显示的页面数据,而使用requests 得到的结果中并没有这些数据。这是因为 requests 获取的都是原始 HTML 文档,而浏览器中的页面是JavaScript 处理…

基于Docker的ETCD分布式集群

目录 1. 说明 2. 配置表 3. 步骤 3.1 放行端口 3.2 docker-compose 文件 3.3 部署到3台服务器 3.4 相关命令 4. 参考 1. 说明 - 以docker容器方式实现ETCD分布式集群,为其他项目提供支持,经过反复试验成功部署(网上资料大都过期或部署失败)。 -…

CUDA与Microsoft Visual Studio不兼容问题

简介:在安装一些 python库时,涉及到第三方库(特别是需要引用 C 代码)时,通常的安装方式会涉及到编译过程,通常称为"源代码安装"(source installation),或是 “…

Trimble天宝X9三维扫描仪为建筑外墙检测提供了全新的解决方案【沪敖3D】

随着城市化进程的快速推进,城市高层建筑不断增多,对建筑质量的要求也在不断提高。建筑外墙检测,如平整度和垂直度检测,是衡量建筑质量的重要指标之一。传统人工检测方法不仅操作繁琐、效率低下,还难以全面反映墙体的真…

python爬虫——爬取全年天气数据并做可视化分析

一、主题页面的结构与特征分析 1.主题页面的结构与特征分析 目标内容界面: 2. Htmls 页面解析 3.节点查找方法与遍历方法 查找方法:find(): 查找第一个匹配到的节点。find_all(): 查找所有匹配到的节点,并返回一个…

MATLAB程序转C# WPF,dll集成,混合编程

工作中遇到一个需求,有一部分算法的代码需要MATLAB来进行处理,而最后需要集成到C#中的wpf项目中去,选择灵活性更高的dll,去进行集成。(可以简单理解为:将MATLAB的函数,变为C#中类的函数成员&…

Ubuntu24.04最新版本安装详细教程

Ubuntu 24.04 LTS发布说明 推荐的系统配置要求: 双核2 GHz处理器或更高 4 GB系统内存 25 GB磁盘存储空间 可访问的互联网 光驱或USB安装介质 Ubuntu 24.04官方下载网址:https://cn.ubuntu.com/download/desktop 04. Ubuntu 22.04(创建虚拟机方式一) 4…

【YOLO算法改进】ALSS-YOLO:无人机热红外图像|野生动物小目标检测

目录 论文信息 论文创新点 1.自适应轻量通道分割和洗牌(ALSS)模块 2.轻量坐标注意力(LCA)模块 3.单通道聚焦模块 4.FineSIOU损失函数 摘要 架构设计 轻量高效网络架构 - ALSS模块 LCA模块 单通道聚焦模块 损失函数优…