PP-ChatOCRv2、PP-TSv2、大模型半监督学习工具...PaddleX新特性等你来pick!

875e633d613adbf7f66b02d3286dfb1e.gif

小A是一名刚刚毕业的算法工程师,有一天,他被老板安排了一个活,要对一批合同扫描件进行自动化信息抽取,输出结构化的分析报表。OCR问题不大,但是怎么进行批量的结构化信息抽取呢?小A陷入了苦苦思索...

小B是一名项目经理,最近他接手了一个紧急的AI项目,客户提供的数据很多,但是标注的样本很少,很难达到客户要求的精度指标。而如果大量标注数据,时间上根本来不及。deadline一天天临近,小B整天愁眉苦脸...

小C是一家小型AI服务提供商的老板,长期做项目下来,他总觉得需要沉淀一套标准化的工具,快速应对多种多样的场景需求,尤其要满足多种复杂环境的模型部署,但公司的研发力量被项目缠身,陷入了恶性循环。小C一筹莫展...

俗话说的好,方法总比困难多,新版本的PaddleX有望解决小A、小B和小C的燃眉之急!

转眼间,距离飞桨AI套件PaddleX的正式发布Run in PaddleX!四步搞定10+任务场景36个精选产业模型开发与部署!已经过去了两个月。两个月期间,PaddleX团队快速响应AI落地的新需求、新功能,以期能在今天新内容发布中给大家交一个满意的答卷!接下来,就让我们看一看PaddleX都带来了什么新内容吧!

09f4f2d7f638b14f4ed4330467de1d59.png四大更新内容速览

强大的大小模型结合特色工具

  • PP-ChatOCRv2:PP-OCR与文心一言强强结合,支持1.5万+大字库解决生僻字、多页pdf、表格识别等难题,无需训练即可在20+场景实现关键信息抽取平均准确率80%以上。

  • PP-TSv2:支持时序预测时序异常检测任务。在用电负荷预测、预测性维护等多场景任务自适应寻优!电力场景预测误差降低20%以上,设备异常检测场景召回率提升5%。

  • 大模型半监督学习工具:借助少量有标注数据和大量无标注数据,大大提升模型的精度;在分类、检测、OCR识别3类任务的17个模型上,实现小模型精度提升10%~26%。

40+精选产业高精度模型库

新增RT-DETR-H、TimesNet_AD、PP-HGNetv2-B4等8个精选模型,扩充时序分类、时序异常检测等任务。PaddleX目前已覆盖目标检测、图像分割、3D、OCR、时序预测、图像识别系统、PDF转word等9大AI落地场景。

低代码工具箱全流程开发

新增数据格式转换、数据划分、评估指标说明等10+界面功能优化,工具箱/开发者双模式高低代码联动功能更丰富,布局更美观!

云端&本地端双平台按需使用

云端和Windows本地端能力同步升级,双平台按需选择!AI Studio云端资源随处可达,实现24小时随处AI开发。为充分利用本地算力、避免数据泄露,可一键下载本地端软件,满足多样需求。

小伙伴们还等什么,来AI Studio云端一键体验吧!这里偷偷爆个料,Linux离线版本地端距离发布很近了呦!

  • PaddleX云端快速体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX本地端下载:

    https://aistudio.baidu.com/intro/paddlex

想和志同道合的开发者交流开发经验?想和PaddleX官方开发者交流?欢迎来PaddleX频道交流:

https://aistudio.baidu.com/community/channel/610

接下来,让我们详细看一下更新内容吧!

64155a6ad99582289bd91b2e11a650d6.png新特性详解

b8c6c553818651fe845b4bb3aa4dfc6f.png强大的大小模型结合特色工具

PP-ChatOCRv2

相信大家对PP-ChatOCR的惊艳效果还有很深的印象(点击回顾PP-ChatOCR:基于文心大模型的通用图像关键信息抽取利器,开发提效50%!),现在,我们正式迎来了它的第2版。

PP-ChatOCRv2是一个融合了LLM大模型和OCR技术的通用文本图像智能分析系统,覆盖20+高频应用场景,支持5种文本图像智能分析能力和部署,包括通用场景关键信息抽取(快递单、营业执照和机动车行驶证等)、复杂文档场景关键信息抽取(解决生僻字、特殊标点、多页PDF、表格等难点问题)、通用OCR、文档场景专用OCR、通用表格识别。此外针对垂类业务场景,也支持模型训练、微调和Prompt优化。

6972eb4407f4a04abc25710cb4604b7b.gifPP-ChatOCRv2 多场景识别效果

PP-ChatOCRv2在PP-ChatOCR的基础上进一步升级,小模型+大模型串联逻辑不变,在通用信息抽取、复杂文档信息抽取、代码拓展性、基础功能完备四个方面做了更新。下面是v2的特性总结:

  • 场景丰富:支持5种智能文本图像分析能力,覆盖20+高频应用场景,尤其针对复杂文档场景进行了专项优化。

  • 精准度高:「PP-OCR」与「文心一言」强强结合,支持1.5万+大字库,解决生僻字、多页PDF、表格等难题,无需训练即可在20+场景关键信息抽取平均准确率80%以上。

  • 一键部署:一键获取PP-ChatOCRv2离线部署SDK,助力企业快速实现工程落地。

  • 便捷开发:针对垂类业务场景,通过简单点击UI界面按钮,可完成Prompt优化、模型训练和微调。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7050167

PP-TSv2

说到时序处理,大家一定还记得PaddleX重磅推出的PP-TS(点击回顾PP-TS基于启发式搜索和集成方法的时序预测模型,使预测更加准确),现在让我们看看v2带来了什么新特性。

9c6bc54e9269445fbd7f174407fd9bc7.gifPP-TSv2 电力和交通场景落地效果

  • 场景丰富:支持时序预测时序异常检测两大通用任务,在用电负荷预测、预测性维护、能耗分析、交流流量预估等场景中有重要应用价值。

  • 精准度高:多场景任务自适应寻优。时序预测,在电力场景预测误差降低20%以上;时序异常检测,在设备异常监控场景相同精度下,召回提升约5%。

  • 便捷开发:简单点击UI界面即可完数据的预处理一键化去重,数据格式转化以及划分,高精度的自定义训练,研发成本低。

  • 一键部署:一键获取PP-TSv2离线部署SDK和服务化部署,助力企业快速工程落地。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7044307

大模型半监督学习工具

不知道大家有没有遇到过数据标注成本高、周期长的困扰,有没有那么一种可能,精心标注少量的数据,配合大量的无标注数据,就能达到比肩全量标注的模型精度呢?是的,PaddleX就带来了这样一款提效神器——大模型半监督学习工具。

大模型半监督学习工具(LMSSL)利用视觉大模型的强大特征表征能力和PaddleX的特色半监督学习方法,在少量有标注数据和大量无标注数据的混合数据上学习到更好的特征,从而得到超高精度的大模型;该工具还内置了蒸馏和微调小模型的方法,进一步可以得到精度更高的小模型。

为了验证该工具的有效性,我们测试了其在公开数据集的指标。最终,该工具刷新了图像分类-10%ImageNet、目标检测-10%COCO的半监督学习SOTA精度。目前,该工具支持图像分类、目标检测、OCR识别三类视觉任务17个模型,大家无需关心细节,只需提供更多无标注数据,点击两次按钮,即可得到高精度的大模型和小模型。下面列举了使用该工具后,不同场景中大模型和小模型的精度提升情况。

de6b472d232ce975e18138f306872ff2.png

图像分类不同场景和指标提升情况

b4e5959abe3c020d81b628a1d1f27597.png

目标检测不同场景和指标题提升情况

立即在线体验:

  • 图像分类-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045718

  • 目标检测-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045736

  • OCR识别-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045737

以上这些特色工具有没有让大家眼前一亮呢?未来PaddleX将持续推出更多的特色工具,欢迎保持关注哦~

对这些特色工具很感兴趣,想了解得更深入一些?没问题,关注本公众号,后面陆续会有针对性讲解的文章~

55a388f712ddeb3fb94b38f9f551fedf.png40+精选产业高精度模型库

本次更新中,图像分类、目标检测任务方向分别新增了3个精选模型,为大家带来了更多的精度-速度权衡选择。另外,额外覆盖了时序异常检测、时序分类两个任务方向,各自新增一个精选模型。这些精选模型个个都很能打,有下面的实测数据为证。大家的模型选型又有新的选项啦!

e7f4c1e58579ef9e6464f5209ac485e8.png

PaddleX 本次发版新增模型list

PaddleX已支持的40+算法模型,可参考该链接:

https://aistudio.baidu.com/intro/paddlex/models

后续,PaddleX将持续扩大开发者心心念念的实例分割模型、LLM模型等,欢迎大家进入文章底部的交流频道,反馈对新模型的需求!

f4c610fa24c1f1b46055670d705252fd.png低代码工具箱全流程开发

新版PaddleX正式发布以来,用户对工具箱/开发者双模式高低代码联动的开发方式大家赞赏。PaddleX为了做好极致的AI开发全流程, 这次更新增加了数据分析工具、数据格式转换工具、数据划分工具、评估指标说明等10+功能,低代码工具箱模式功能更丰富,布局更美观!

95668a80648096047aff74dae3180fb9.gif

a50901ea1c545d874b32d10b3de4ed97.png云端&本地端双平台按需使用

云端AI Studio平台,PaddleX可以通过项目大厅和模型库两个入口使用。

Windows本地端PaddleX2.2.0版本也正式发布啦,除特色工具外,云端所有能力实现完全同步。一键下载安装windows本地端,即可完成模型开发全流程。

9b1cd4a1c9e32aab3f68bbd7401f452c.gif

57c908767efa57b4c32e4d14553ba05c.png结语

最后,稍微总结一下:

PaddleX是面向国内外主流AI硬件的,全流程、高效率的飞桨精选AI模型的一站式AI开发套件。PaddleX的使命是助力AI技术快速落地,愿景是使人人成为AI Developer!

在本次更新中,PaddleX带来了强大的大小模型结合特色工具、40+精选产业高精度模型库、低代码工具箱全流程开发、云端&本地端双平台按需使用等特性,希望能给大家带来更大的AI开发效率提升和更好的产品体验!

目前PaddleX依然处在快速迭代中,欢迎大家试用和指正!比心~

添加AI Studio飞桨AI套件官方频道,和大家一起讨论吧,传送门:

https://aistudio.baidu.com/community/channel/610

  • PaddleX云端在线体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX Windows本地端下载地址:

    https://aistudio.baidu.com/intro/paddlex

8b6b8581b46e2b5aa6fe687e68b07130.png

80a67fccfc0f5e974f861e945fa4cad5.jpeg

cb3653ea96efefe92c3b522f67d48b8b.jpeg

239d6b23a8b56b54df020d9311ba562f.jpeg

a401c99d528b126b3bf26ec9de96644e.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/142409.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【06】VirtualService高级流量功能

5.3 weight 部署demoapp v10和v11版本 --- apiVersion: apps/v1 kind: Deployment metadata:labels:app: demoappv10version: v1.0name: demoappv10 spec:progressDeadlineSeconds: 600replicas: 3selector:matchLabels:app: demoappversion: v1.0template:metadata:labels:app…

数据结构:红黑树的原理和实现

文章目录 红黑树的概念红黑树的性质红黑树的模拟实现红黑树的平衡问题 整体实现和测试 本篇用于进行红黑树的拆解和模拟实现,为之后的map和set的封装奠定基础 红黑树的概念 红黑树也是一种二叉搜索树,但是在每一个节点的内部新增了一个用以表示该节点颜…

【python自动化】Playwright基础教程(八)鼠标操作

【python自动化】Playwright基础教程(八)鼠标操作 本文目录 文章目录 【python自动化】Playwright基础教程(八)鼠标操作playwright系列回顾前文代码click模拟鼠标点击dblclick模拟鼠标双击down模拟鼠标按下move模拟鼠标移动up模拟鼠标释放wheel模拟鼠标滚动鼠标长按常用实战引…

mysql数据库可以执行定时任务

在一些业务需要中,经常需要一些定时任务。如Java的schedule,nodejs的node-schedule等。今天第一次接触了使用数据库的存储过程来执行定时任务。 本篇文章以MySQL数据库为例,介绍通过数据库设置定时任务的方法。本文中以介绍操作过程为主&…

三数之和问题

题目描述 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ,同时还满足 nums[i] nums[j] nums[k] 0 。请你返回所有和为 0 且不重复的三元组。 注意:答案中不可以包含重复的三元组。…

asp.net core mvc之 布局

一、布局是什么? 布局是把每个页面的公共部分,提取成一个布局页面(头、导航、页脚)。 二、默认布局 _Layout.cshtml 默认的布局是在 /Views/Shared 目录的 _Layout.cshtml文件。通常Shared目录中的视图都是公共视图。该目录下的…

瑞利长度(Rayleigh length)

瑞利长度 Rayleigh length 在光学,特别是激光学中,我们设鞍腰部(如图中所示的最低处)为A,其横截面面积为a,沿光的传播方向,当横截面面积因为散射达到2a时,我们设此处为B,…

二维码智慧门牌管理系统升级解决方案:运营可视化之道

文章目录 前言一、系统概述二、数据可视化与运营决策 前言 随着科技的飞速发展和人们生活水平的提高,传统的门牌管理系统已经无法满足现代社会的需求。在这个信息化、智能化的时代,一款升级版的二维码智慧门牌管理系统应运而生,它将以全新的…

Vmware虚拟机重装 虚拟机能ping通主机,而主机不能ping通虚拟机的问题

CClean,用它把你电脑上已经卸载的软件但是注册表还没删干净的把注册表删干净,之前说的那种情况(虚拟网络编辑器打不上勾)就迎刃而解了。 Ps:CClean:再网上百度就可以查到,软件对用户也很友好&a…

(11.13 知识总结(路由层)

一、路由层 1.1路由匹配 1.1.1 什么是路由? 路由可以看成是跟在 ip 和 port 之后的地址 1.1.2 url( ) 方法 # 示例 urlpatterns [ url(r^admin/, admin.site.urls), url(r^login/, views.login_func), url(r^register/$, views.register_func), ] url…

【异步并发编程】使用aiohttp构建Web应用程序

文章目录 1. 写在前面1. 什么是aiohttp?1.1. 什么是异步编程? 2. 安装aiohttp3. 异步HTTP服务器4. 异步请求5. aiohttp REST实例 【作者主页】:吴秋霖 【作者介绍】:Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力…

iOS:何为空指针和野指针

一:什么是空指针和野指针 1、空指针 ①.没有存储任何内存地址的指针就成为空指针(NULL指针) ②.空指针就是被赋值为0的指针,在没有被具体初始化之前,其值为0. //以下都是空指针,eg: Person *p1 NULL; …

Linux上C++通过LDAP协议使用kerberos认证AES加密连接到AD服务器

一.前言 记录自己在实现这个流程遇到的各种问题,因为我也是看了许多优质的文章以及组内大佬的帮助下才弄成的,这里推荐一个大佬的文章,写的非常优秀,比我这篇文章写得好得很多,最后我也是看这个大佬的代码最终才实现的…

一行JavaScrip可以做什么?

说在前面 JavaScript 提供了许多方便的方法和操作符来简化常见的任务,使得编程变得更加高效和便捷。无论是数学计算、字符串处理还是数据操作,JavaScript 都能帮助我们以简洁的方式实现所需功能。 代码 1、生成指定范围内的随机整数 const randomInt …

部分背包问题【贪心算法】

部分背包问题是一种经典的贪心问题,物品可以取一部分,也就是可以随意拆分的物品。 算法思路: 用列表保存每个物品的价值及总重量、平均价值(性价比)。输入数据同时计算每种物品的平均价值。使用自定义的compare函数以…

2023亚太杯数学建模思路 - 复盘:校园消费行为分析

文章目录 0 赛题思路1 赛题背景2 分析目标3 数据说明4 数据预处理5 数据分析5.1 食堂就餐行为分析5.2 学生消费行为分析 建模资料 0 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 1 赛题背景 校园一卡通是集…

苹果独占鳌头,国产手机围攻,双十一“照妖镜”显露谁有真实力

随着双十一购物节的结束,电商平台也给出了各手机品牌的销量数据,苹果毫无疑问成为双十一的赢家,不过两家国产手机品牌也显露了他们的实力,已具有与苹果一战之力。 与去年双十一和今年618类似,苹果仍然占据热销榜前列&a…

信驰达科技加入车联网联盟(CCC),推进数字钥匙发展与应用

CCC)的会员。 图 1 深圳信驰达正式成为车联网联盟(CCC)会员 车联网联盟(CCC)是一个跨行业组织,致力于推动智能手机与汽车连接解决方案的技术发展。CCC涵盖了全球汽车和智能手机行业的大部分企业,拥有150多家成员公司。CCC成员公司包括智能手机和汽车制造…

TLP超线程技术

在实现IPL指令级并行的同时实现TLP(Thread Level Parallelism)线程级并行实现多线程有两种主要的方法超线程即同时多线程,在单个处理器或单个核中设置了两套线程状态部件,共享高速缓存和功能部件当两个线程同时需要某个资源时,其中一个线程必…

Mac 本地部署thinkphp8【配置环境】

PHP开发工具 我这里选择的是VSCode,里面安装PHP插件 把thinkphp的项目放到 切换到phpenv ![在这里插入图片描述](https://img-blog.csdnimg.cn/a15cc442fab74754ad86d74f6d9942e5.png URL重写如果不改,在请求的时候地址是这样的‘http://tp.com/index.php…