合合信息技术能力

体验中心网址:

https://www.textin.com/TextIn体验中心 - 在线免费体验中心https://www.textin.com/

合合技术团队CSDN:

合合技术团队的博客_CSDN博客-基于深度学习的文本检测与识别技术白皮书,【通用文本信息抽取技术白皮书】,【技术应用】领域博主

下文记录部分服务的使用感受及技术方案推断

  • 通用文字识别

https://www.textin.com/experience/text_recognize_3d1

TextIn - API中心 - 通用文字识别

接受多种语言、360度方向、竖排、手写、手写和印刷判断、字符候选集、字符中心点

  • 通用表格识别

TextIn - 在线免费体验中心 - 通用表格识别

TextIn - API中心 - 通用表格识别

非表格区域可自动分块,或组成一个非表格区域、每行高度宽度、线段坐标、无边框or实线

可以处理不同换行方式的大表格,列位置有优先和其他区域强行对齐的意思

推断:肯定开发了对线段的分割

“基于分治思想,合合信息引入深度学习技术,将表格识别分为有线表识别和无线表识别两种方案。有线表识别中,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。

合合信息无线表识别采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。”

  • 印章检测识别

TextIn - 在线免费体验中心 - 印章检测识别

https://www.textin.com/document/recognize_stamp

支持识别颜色、形状、内容、抠印章整体图片、展平

推断:下文介绍了检测+矫正+识别、端到端检测识别、img2seq 三种方案【技术新趋势】合合信息:复杂环境下ocr与印章识别技术理解及研发趋势_印章文字识别_合合技术团队的博客-CSDN博客

  • 通用NLP信息抽取

没demo,只有文档。支持多页、用户自定义keys

推断:用k-v对做的?

  • 办公文档识别

https://www.textin.com/experience/document

TextIn - API中心 - 办公文档识别

版面分析

paragraph(段落)

list(列表)

edge(页眉页脚)

image(图像)

stamp(印章)

formula(公式)

watermark(水印)

table(有线表格)

borderless_table(无线表格)

  • 文档图像切边矫正

TextIn - 在线免费体验中心 - 文档图像切边矫正

可在没有纸张边缘的情况下进行矫正,不是简单透视变换,把纸张文字拉直了,有局部的处理,用一张网络上的清单实测很强

测试网图

http://img.zol.com.cn/group/107/a1069086.jpg

方案: 

以弯曲矫正为例,丁凯博士介绍了基于文本行线拟合和坐标变换、基于文本行线优化矫正的方法原理和优缺点,并提到合合信息采用的基于位移场网络学习的方法的系统架构

Marior去除边距和迭代内容矫正用于自然文档矫正_合合技术团队的博客-CSDN博客

智能文字识别技术-弯曲矫正概述_document image dewarping using deep learning_合合技术团队的博客-CSDN博客

是一种编解码的网络学习位移场

 智能图像处理:基于边缘去除和迭代式内容矫正的复杂文档图像校正_合合技术团队的博客-CSDN博客

角点检测+边缘均分初步矫正+迭代式偏移场预测,迭代次数自适应确定

  • 图片切边增强

https://www.textin.com/experience/crop_enhance_image

判断照片中主体文档的边缘进行切边,同时增强图像突出文字,支持识别背景复杂的文字内容,返回切边后的图像。

增强模式

1 增亮

2 增亮并锐化

3 黑白

4 灰度

5 去阴影增强

6 点阵图

-1 禁用增强。

推断:边缘检测+透视变换+图像增强,这里压缩率默认95,可能也是cv2方法的直接使用

  • PS检测

TextIn - 在线免费体验中心 - PS检测

TextIn - API中心 - PS检测

主要针对证件、发票、合同,返回疑似篡改的坐标、置信度及exitif信息。检测出复制粘贴、拼接、擦除等多种篡改形式

方案:【论文解读】不和谐区域定位_合合技术团队的博客-CSDN博客

“不和谐问题主要是由于图像编辑技术产生的颜色和照明不一致。在本研究中,作者倾向于将输入的图像转换到另一个颜色空间,以放大不和谐区域与背景之间的域差异,从而使模型更容易地识别不和谐区域。为此,作者提出了一种由一个颜色映射模块和一个不和谐的区域定位网络组成的新框架,其中前者配备了一种新的域差异放大损失,后者可以是一个任意的定位网络

前端提示文案是可疑字段
 

  • 自动擦除手写文字

TextIn - 在线免费体验中心 - 自动擦除手写文字

TextIn - API中心 - 自动擦除手写文字

黑白锐化、切边、dewarp弯曲矫正、去掉红笔的痕迹

方案:别忘记我:通过局部-全局内容建模进行文本擦除方法_合合技术团队的博客-CSDN博客

“合合信息“字迹擦除”技术融合了内容切分、手写字迹分离网络、文档质量增强技术”

不是简单的分割,是一种img2img或者说img inainting技术

  • 去屏幕纹

TextIn - 在线免费体验中心 - 去屏幕纹

效果还可以!

  • 图像水印去除

TextIn - 在线免费体验中心 - 图像水印去除

效果还可以!也能处理多种颜色的水印。而且颜色填充得也很自然

推断:SLBR通过自校准的定位和背景细化来去除可见的水印_合合技术团队的博客-CSDN博客

  • 文字识别训练平台

为有OCR自主定制开发需求的企业提供低代码、自动化的一站式OCR开发平台

1.1信息抽取(锚点)

基于预置的文字检测与识别模型,针对固定版式的卡证票据,框选出版式参照区与所需提取的信息区域,即可实现数据的结构化提取。选择该模型无需训练,只需要一张样本配置好固定字段与识别字段后,即可直接完成模型创建。

1.2信息抽取(K-V)

基于内置的高性能预训练模型,针对用户标注的键值对位置和文本信息,训练专属场景的AI模型,从而提升文本检测、文本识别、字段属性分析的精度,此方法适用于半固定版式的文档分析,例如卡证、票据。

1.3信息抽取(NLP)

基于内置的多模态(图像、文本)高性能预训练模型,针对用户标注的键值对位置和文本信息,训练专属场景的信息抽取模型,从而提升文本检测、文本识别、字段属性分析的精度,此方法适用于不固定版式的文档分析,例如海外Invoice、物流单据、采购单据等。

1.4信息抽取(长文本)

智能化语义理解,不受文本空间位置变化影响,适用于多页不固定版式文档的信息抽取,例如合同、报告、标书、档案等。


1.5分类识别

通过大量图片类型标注,基于深度学习算法学习图片特征,从而达到图片的分类识别。该模型有两种算法:纯图像算法模式,适合差异较大的图像分类;图像+文本算法模式,能对图像特征与文本特征进行特征融合处理,适合相似度较高的图像分类。
 

  • TCPN

一种类layoutlm的抽取方法,弱监督,有一定ocr纠错能力。

21年,没开源,暂时没啥参考性

【 论文解读TCPN】一个基于序列的弱监督视觉信息抽取学习框架_合合技术团队的博客-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/356471.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

xss靶场实战

靶场链接:https://pan.baidu.com/s/1ors60QJujcmIZPf3iU3SmA?pwd4mg4 提取码:4mg4 XSS漏洞原理 XSS又叫CSS(Cross Site Script),跨站脚本攻击。因为与html中的css样式同,所以称之为XSS。在OWASP top 1…

Python Tornado 实现SSE服务端主动推送方案

一、SSE 服务端消息推送 SSE 是 Server-Sent Events 的简称, 是一种服务器端到客户端(浏览器)的单项消息推送。对应的浏览器端实现 Event Source 接口被制定为HTML5 的一部分。相比于 WebSocket,服务器端和客户端工作量都要小很多、简单很多&#xff0c…

深度强化学习(王树森)笔记05

深度强化学习(DRL) 本文是学习笔记,如有侵权,请联系删除。本文在ChatGPT辅助下完成。 参考链接 Deep Reinforcement Learning官方链接:https://github.com/wangshusen/DRL 源代码链接:https://github.c…

政安晨的机器学习笔记——基于Ubuntu系统的Miniconda安装Jupyter Notebook

一、准备工作 Miniconda的安装请参考我的另一篇博客文章: 实例讲解深度学习工具PyTorch在Ubuntu系统上的安装入门(基于Miniconda)(非常详细)https://blog.csdn.net/snowdenkeke/article/details/135887509 这里…

༺༽༾ཊ—Unity之-05-抽象工厂模式—ཏ༿༼༻

首先创建一个项目, 在这个初始界面我们需要做一些准备工作, 建基础通用文件夹, 创建一个Plane 重置后 缩放100倍 加一个颜色, 任务:使用 抽象工厂模式 创建 人物与宠物 模型, 首先资源商店下载 人物与宠物…

C++STL之map、set的使用和模拟实现

绪论​: “我这个人走得很慢,但是我从不后退。——亚伯拉罕林肯”,本章是接上一章搜索二叉树中红黑树的后续文章,若没有看过强烈建议观看,否则后面模拟实现部分很看懂其代码原理。本章主要讲了map、set是如何使用的&am…

torch与cuda\cudnn和torchvision的对应

以上图片来源于这篇博客 于是,我需要手动下载0.9.0torchvision 直接在网站https://pypi.tuna.tsinghua.edu.cn/simple/后面加上torchvision,就不用ctrlF搜torchvision了,即进入下面这个网站,找到对应版本的包下载安装即可 https…

html页面练习——公司发展流程图

1.效果图 2.html <div class"center"><header><h1>发展历程</h1><h3>CONMPANY HISTORY</h3></header><main><div class"left"><div class"time1">2012.12</div><div cla…

C/C++编码问题研究

文章目录 一、Unicode字符集与U8/U16/U32编码二、编码1. 占字节数2. ASCII、GB2312、GBK、GB18030 以及 UTF8 的关系3. BOM4. UTF-8的存储实现 三、编译器字符集设置1. GCC语法Example 2. MSVC语法Example 三、wchar_t五、编码转换函数六、代码 & 实践1. UTF8与UTF16、UTF3…

opencv#35 连通域分析

连通域分割原理 像素领域介绍: 4邻域是指中心的像素与它邻近的上下左右一共有4个像素&#xff0c;那么称这4个像素为中心像素的4邻域。 8邻域是以中心像素周围的8个像素分别是上下左右和对角线上的4个像素。 连通域的定义(分割)分为两种:以4邻域为相邻判定条件的连通域分割和…

老司机用脚本批量巧删恶意文件

作者&#xff1a;田逸&#xff08;formyz&#xff09; 一个NFS服务器&#xff0c;为多个Web项目所共享。这些目录包括PHP程序、图片、HTML页面和用户上传的文档和附件等。因为某些Web框架古老&#xff0c;存在诸如不对上传文件做严格的安全性检查&#xff0c;虽然此NFS服务器位…

腾讯发表多模态大模型最新综述,从26个主流大模型看多模态效果提升关键方法

在大规模语言模型&#xff08;LLMs&#xff09;通往通用人工智能&#xff08;AGI&#xff09;的道路中&#xff0c;从传统的单一的“语言模态”扩展到“图像”、“语音”等等的“多模态”必然是大模型进化的必经之路。 在过去的 2023 年&#xff0c;多模态大规模语言模型&…

建筑效果图渲染制作周期是多久

建筑效果图的渲染制作周期会根据多种因素而变化&#xff0c;包括项目的复杂性、渲染的详细程度、分辨率要求、场景中的元素数量和复杂度、以及项目所需的修改和迭代次数等。 通常&#xff0c;简单的建筑效果图可能在几个工作日内完成&#xff0c;而大型或高度复杂的项目可能需要…

合并两个排序的链表

作者简介&#xff1a;大家好&#xff0c;我是smart哥&#xff0c;前中兴通讯、美团架构师&#xff0c;现某互联网公司CTO 联系qq&#xff1a;184480602&#xff0c;加我进群&#xff0c;大家一起学习&#xff0c;一起进步&#xff0c;一起对抗互联网寒冬 学习必须往深处挖&…

Cantor表(刷题)(C语言)

个人博客主页&#xff1a;https://blog.csdn.net/2301_79293429?typeblog 专栏&#xff1a;https://blog.csdn.net/2301_79293429/category_12545690.html 题目描述 现代数学的著名证明之一是 Georg Cantor 证明了有理数是可枚举的。他是用下面这一张表来证明这一命题的&…

【JLU】校园网linux客户端运行方法

终于给这输入法整好了&#xff0c;就像上面图里那样执行命令就行 写一个开机自启的脚本会更方便&#xff0c;每次都运行也挺烦的 补充了一键运行脚本&#xff0c;文件路径需要自己修改 #!/bin/bashrun_per_prog"sudo /home/d0/ubuntu-drclient-64/DrClient/privillege.s…

Java项目:基于SSM框架实现的高校毕业生就业管理系统(ssm+B/S架构+源码+数据库+毕业论文)

一、项目简介 本项目是一套ssm817基于SSM框架实现的高校毕业生就业管理系统&#xff0c;主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Java学习者。 包含&#xff1a;项目源码、数据库脚本等&#xff0c;该项目附带全部源码可作为毕设使用。 项目都经过严格调…

【linux】-centos7版本前后-变化篇

1.centos7版本前后区别 首先文件系统变化&#xff0c;由EXT4&#xff0c;变为XFS格式。可支持容量500TB的文件&#xff0c;而6代仅能支持16TB。首个进程变为systemd, 替换了熟悉的init进程。它的特点是功能强大&#xff0c;体积也很强大。 systemd给我们带来了一个全家桶命令&…

Java基础数据结构之反射

一.定义 Java的反射机制是在运行状态中的&#xff0c;对于任意一个类都能知道这个类的所有属性和方法&#xff1b;对于任意一个对象&#xff0c;都能够调用它的任意方法及属性。既然能拿到&#xff0c;我们就可以修改部分类型信息。这种动态获取信息以及动态调用对象方法的功能…

3d合并模型是重名材质---模大狮模型网

当合并3d模型时&#xff0c;如果存在重名的材质&#xff0c;可能会导致加载问题。这是因为3D软件在处理重名材质时可能会出现冲突。你可以尝试以下方法解决这个问题&#xff1a; 重命名材质&#xff1a;检查合并的模型中的材质&#xff0c;确保它们具有唯一的命名。修改重名的材…