体验中心网址:
https://www.textin.com/TextIn体验中心 - 在线免费体验中心https://www.textin.com/
合合技术团队CSDN:
合合技术团队的博客_CSDN博客-基于深度学习的文本检测与识别技术白皮书,【通用文本信息抽取技术白皮书】,【技术应用】领域博主
下文记录部分服务的使用感受及技术方案推断
- 通用文字识别
https://www.textin.com/experience/text_recognize_3d1
TextIn - API中心 - 通用文字识别
接受多种语言、360度方向、竖排、手写、手写和印刷判断、字符候选集、字符中心点
- 通用表格识别
TextIn - 在线免费体验中心 - 通用表格识别
TextIn - API中心 - 通用表格识别
非表格区域可自动分块,或组成一个非表格区域、每行高度宽度、线段坐标、无边框or实线
可以处理不同换行方式的大表格,列位置有优先和其他区域强行对齐的意思
推断:肯定开发了对线段的分割
“基于分治思想,合合信息引入深度学习技术,将表格识别分为有线表识别和无线表识别两种方案。有线表识别中,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。
合合信息无线表识别采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。”
- 印章检测识别
TextIn - 在线免费体验中心 - 印章检测识别
https://www.textin.com/document/recognize_stamp
支持识别颜色、形状、内容、抠印章整体图片、展平
推断:下文介绍了检测+矫正+识别、端到端检测识别、img2seq 三种方案【技术新趋势】合合信息:复杂环境下ocr与印章识别技术理解及研发趋势_印章文字识别_合合技术团队的博客-CSDN博客
- 通用NLP信息抽取
没demo,只有文档。支持多页、用户自定义keys
推断:用k-v对做的?
- 办公文档识别
https://www.textin.com/experience/document
TextIn - API中心 - 办公文档识别
版面分析
paragraph(段落)
list(列表)
edge(页眉页脚)
image(图像)
stamp(印章)
formula(公式)
watermark(水印)
table(有线表格)
borderless_table(无线表格)
- 文档图像切边矫正
TextIn - 在线免费体验中心 - 文档图像切边矫正
可在没有纸张边缘的情况下进行矫正,不是简单透视变换,把纸张文字拉直了,有局部的处理,用一张网络上的清单实测很强
测试网图
http://img.zol.com.cn/group/107/a1069086.jpg
方案:
“以弯曲矫正为例,丁凯博士介绍了基于文本行线拟合和坐标变换、基于文本行线优化矫正的方法原理和优缺点,并提到合合信息采用的基于位移场网络学习的方法的系统架构”
Marior去除边距和迭代内容矫正用于自然文档矫正_合合技术团队的博客-CSDN博客
智能文字识别技术-弯曲矫正概述_document image dewarping using deep learning_合合技术团队的博客-CSDN博客
是一种编解码的网络学习位移场
智能图像处理:基于边缘去除和迭代式内容矫正的复杂文档图像校正_合合技术团队的博客-CSDN博客
角点检测+边缘均分初步矫正+迭代式偏移场预测,迭代次数自适应确定
- 图片切边增强
https://www.textin.com/experience/crop_enhance_image
判断照片中主体文档的边缘进行切边,同时增强图像突出文字,支持识别背景复杂的文字内容,返回切边后的图像。
增强模式
1 增亮
2 增亮并锐化
3 黑白
4 灰度
5 去阴影增强
6 点阵图
-1 禁用增强。
推断:边缘检测+透视变换+图像增强,这里压缩率默认95,可能也是cv2方法的直接使用
- PS检测
TextIn - 在线免费体验中心 - PS检测
TextIn - API中心 - PS检测
主要针对证件、发票、合同,返回疑似篡改的坐标、置信度及exitif信息。检测出复制粘贴、拼接、擦除等多种篡改形式
方案:【论文解读】不和谐区域定位_合合技术团队的博客-CSDN博客
“不和谐问题主要是由于图像编辑技术产生的颜色和照明不一致。在本研究中,作者倾向于将输入的图像转换到另一个颜色空间,以放大不和谐区域与背景之间的域差异,从而使模型更容易地识别不和谐区域。为此,作者提出了一种由一个颜色映射模块和一个不和谐的区域定位网络组成的新框架,其中前者配备了一种新的域差异放大损失,后者可以是一个任意的定位网络
”
前端提示文案是可疑字段
- 自动擦除手写文字
TextIn - 在线免费体验中心 - 自动擦除手写文字
TextIn - API中心 - 自动擦除手写文字
黑白锐化、切边、dewarp弯曲矫正、去掉红笔的痕迹
方案:别忘记我:通过局部-全局内容建模进行文本擦除方法_合合技术团队的博客-CSDN博客
“合合信息“字迹擦除”技术融合了内容切分、手写字迹分离网络、文档质量增强技术”
不是简单的分割,是一种img2img或者说img inainting技术
- 去屏幕纹
TextIn - 在线免费体验中心 - 去屏幕纹
效果还可以!
- 图像水印去除
TextIn - 在线免费体验中心 - 图像水印去除
效果还可以!也能处理多种颜色的水印。而且颜色填充得也很自然
推断:SLBR通过自校准的定位和背景细化来去除可见的水印_合合技术团队的博客-CSDN博客
- 文字识别训练平台
为有OCR自主定制开发需求的企业提供低代码、自动化的一站式OCR开发平台
1.1信息抽取(锚点)
基于预置的文字检测与识别模型,针对固定版式的卡证票据,框选出版式参照区与所需提取的信息区域,即可实现数据的结构化提取。选择该模型无需训练,只需要一张样本配置好固定字段与识别字段后,即可直接完成模型创建。
1.2信息抽取(K-V)
基于内置的高性能预训练模型,针对用户标注的键值对位置和文本信息,训练专属场景的AI模型,从而提升文本检测、文本识别、字段属性分析的精度,此方法适用于半固定版式的文档分析,例如卡证、票据。
1.3信息抽取(NLP)
基于内置的多模态(图像、文本)高性能预训练模型,针对用户标注的键值对位置和文本信息,训练专属场景的信息抽取模型,从而提升文本检测、文本识别、字段属性分析的精度,此方法适用于不固定版式的文档分析,例如海外Invoice、物流单据、采购单据等。
1.4信息抽取(长文本)
智能化语义理解,不受文本空间位置变化影响,适用于多页不固定版式文档的信息抽取,例如合同、报告、标书、档案等。
1.5分类识别
通过大量图片类型标注,基于深度学习算法学习图片特征,从而达到图片的分类识别。该模型有两种算法:纯图像算法模式,适合差异较大的图像分类;图像+文本算法模式,能对图像特征与文本特征进行特征融合处理,适合相似度较高的图像分类。
- TCPN
一种类layoutlm的抽取方法,弱监督,有一定ocr纠错能力。
21年,没开源,暂时没啥参考性
【 论文解读TCPN】一个基于序列的弱监督视觉信息抽取学习框架_合合技术团队的博客-CSDN博客