OCR增值税发票识别功能介绍如下:
一、技术原理
OCR增值税发票识别系统基于光学字符识别(OCR)技术和人工智能的支持,将传统纸质发票的信息自动转换为计算机可以读取的数字信息。具体技术流程包括:
图像预处理:确保处理的图像质量符合识别要求,包括光照、摄像头分辨率、图片清晰度等,并通过图像校正、去噪处理等方式提高图像质量。
字符识别:使用OCR技术进行字符识别,将发票上的字符信息进行抠取、分割、识别等处理。该系统可以识别多种字体和语言的发票信息,并能够识别一些特殊的发票信息,例如发票换开注销的信息等。
数据提取:将OCR识别出的字符信息,按照预定义的规则,提取出增值税发票的各个字段信息,如购买方信息、销售方信息、发票号码、发票代码、开票日期、金额、税额等。
二、功能特点
快速准确:OCR增值税发票识别系统能够快速准确地识别发票信息,提高发票处理的效率。
智能识别:系统能够智能识别发票上的关键信息,如发票号码、开票日期等,无需人工干预。
多种字体识别:系统支持多种字体和语言的发票识别,满足不同发票的识别需求。
特殊信息识别:系统能够识别一些特殊的发票信息,如发票换开注销的信息等,提高识别的准确性。
三、应用场景
OCR增值税发票识别系统在各个行业应用广泛,如财务会计、税务管理、企业管理等。具体应用场景包括:
财务会计:系统可以实现发票信息的自动识别、录入、校验和存档,解放了财务从业人员的时间和精力,减少了因人为因素导致的错误发生,提高了财务会计的效率。
税务管理:系统可以自动抽取和归档所有增值税发票及其信息,方便税务管理人员进行查询,减轻了税务管理人员的工作强度,同时也可以提高税务管理工作的数据化水平和效率。
企业管理:系统可以自动分类、存档和搜索增值税发票及其信息,方便企业管理人员进行查询和统计,提高企业管理工作的效率。
四、优势
提高效率:OCR增值税发票识别系统能够自动处理发票信息,大大提高了工作效率。
减少错误:系统减少了人为因素的干扰,降低了错误率。
实时更新:系统可以实时处理新的增值税发票数据,确保数据的实时性和准确性。
数据化分析:系统归档的增值税发票数据可以用于数据分析和统计,为企业决策提供支持。
以上是对OCR增值税发票识别功能的详细介绍,希望能够帮助到您。
增值税发票ocr识别接口:https://www.wapi.cn/api_detail/185/359.html
支持对增值税普票、专票、全电发票(新版全国统一电子发票,专票/普票)、卷票、区块链发票的所有字段进行结构化识别,包括发票基本信息、销售方及购买方信息、商品信息、价税信息等,其中五要素字段的识别准确率超过 99.9%; 同时,支持对增值税卷票的 21 个关键字段进行识别,包括发票类型、发票代码、发票号码、机打号码、机器编号、收款人、销售方名称、销售方纳税人识别号、开票日期、购买方名称、购买方纳税人识别号、项目、单价、数量、金额、税额、合计金额(小写)、合计金额(大写)、校验码、省、市,四要素字段的识别准确率可达95%。
子接口:
增值税发票文字识别OCR
返回格式:json,xml,jsonp调用
请求方式:GET,POST
POST 请求需要设置Header头:Content-Type: application/x-www-form-urlencoded;charset=utf-8
请求说明:
名称 必填 类型 说明 示例参数另存
appid 是 String 应用ID,在后台我的应用查看或者添加 1
format 否 String 返回数据格式类型,每个接口已经说明支持返回格式:json,xml, jsonp调用方法说明 json
sign 是 String 1.使用Md5方式验证,参数按一定规则md5后返回的字符串,详情点击这里阅读
2.使用Hash验证方式,直接跟上密钥即可。如何设置hash验证
通过我的应用里面修改验证方式 52a9dbe274a5c537bbf7a53e2d66c09f
time 否 String 请求时传递的当前服务器时间戳 1545829466
url_image 是 String 支持URL地址或者base64编码数据:
- 使用base64编码图像数据时,base64编码后进行urlencode,要求base64编码和urlencode后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式
- 使用URL地址时,图片完整URL,URL长度不超过1024字节,URL对应的图片base64编码后大小不超过4M,最短边至少15px,最长边最大4096px,支持jpg/jpeg/png/bmp格式, 请注意关闭URL防盗链
Md5验证方式-加密顺序
sign = MD5( appid1formatjsontime1545829466密钥) 查看加密规则说明 密钥不需要键名,请直接跟上32位的密钥
红色部分代表参数值,appid默认为1,请修改为自己的appid值,去我的应用查看以及密钥
*注意:空值不参与加密。
返回参数说明:
名称 必填 类型 说明 示例参数另存
amount_in_figuers 否 String 价税合计(小写) 7.99
amount_in_words 否 String 价税合计(大写) 柒圆玖角玖分
check_code 否 String 校验码。增值税专票无此参数 61084601970281760289
checker 否 String 复核 张三
city 否 String 所属城市 厦门市
codeid 否 Integer 状态码,返回10000状态都会进行计费。具体说明可查看状态码说明 10000
commodity_amount 否 Array 金额
commodity_end_date 否 Array 通行日期止。仅通行费增值税电子普通发票含有此参数
commodity_name 否 Array 货物名称
commodity_num 否 Array 数量
commodity_plate_num 否 Array 车牌号。仅通行费增值税电子普通发票含有此参数
commodity_price 否 Array 单价
commodity_start_date 否 Array 通行日期起。仅通行费增值税电子普通发票含有此参数
commodity_tax 否 Array 税额
commodity_tax_rate 否 Array 税率
commodity_type 否 Array 规格型号
commodity_unit 否 Array 单位
commodity_vehicle_type 否 Array 类型。仅通行费增值税电子普通发票含有此参数
invoice_code 否 String 发票代码 035022200111
invoice_code_confirm 否 String 发票代码的辅助校验码,一般业务情景可忽略 035021100111
invoice_date 否 String 开票日期 2022年12月13日
invoice_num 否 String 发票号码 17230518
invoice_num_confirm 否 String 发票号码的辅助校验码,一般业务情景可忽略 17230518
invoice_tag 否 String 增值税发票左上角标志。 包含:通行费、销项负数、代开、收购、成品油、其他 其他
invoice_type 否 String 发票种类。不同类型发票输出:普通发票、专用发票、电子普通发票、电子专用发票、通行费电子普票、区块链发票、通用机打电子发票、电子发票(专用发票)、电子发票(普通发票) 电子普通发票
invoice_type_org 否 String 发票名称 厦门增值税电子普通发票
is_agent 否 String 是否代开 否
machine_code 否 String 机器编号。仅增值税卷票含有此参数 661927300875
message 否 String 请求状态说明 返回成功
note_drawer 否 String 开票人 李四
online_pay 否 String 电子支付标识。仅区块链发票含有此参数
password 否 String 密码区 29>94<>4450/036+4>05/6/6908+2309><><+>54>1<01<02<7+565/1+357+8–69/>–3747/76106
payee 否 String 收款人 李四
province 否 String 银行卡所属省份 福建省
purchaser_address 否 String 购方地址及电话
purchaser_bank 否 String 购方开户行及账号
purchaser_name 否 String 购方名称 天津机电科技有限公司
purchaser_register_num 否 String 购方纳税人识别号 911201**05M9C29R
remarks 否 String 备注
retdata 否 Array 回数据集合,可能是数据、对象或者字符串
row 否 String 行号 1
seller_address 否 String 销售方地址及电话 厦门市湖里区观日西二里32号801室
seller_bank 否 String 销售方开户行及账号 中国工商银行厦门江头支行4100022909200254537
seller_name 否 String 销售方名称 厦门挖码信息技术有限公司
seller_register_num 否 String 销售方纳税人识别号 91350206MA32JUL977
service_type 否 String 发票消费类型。不同消费类型输出:餐饮、电器设备、通讯、服务、日用品食品、医疗、交通、其他 服务
sheet_num 否 String 联次信息。专票第一联到第三联分别输出:第一联:记账联、第二联:抵扣联、第三联:发票联;普通发票第一联到第二联分别输出:第一联:记账联、第二联:发票联
time 否 String 请求时传递的当前服务器时间戳 1675049940
total_amount 否 String 合计金额 7.99
total_tax 否 String 合计税额 ***
word 否 String 内容 7.99