以人为本的AI技术升级

  • 我们需要以人为本的技术来提高生产力和投资回报率。
  • 通过在数据标注流程中融合机器学习辅助技术,可以减少数据标注所需的时间、资金和人力。
  • 有很多方法可以防止标注员被模型的预测误导。

  在传统的机器学习(Machine Learning)方法下,人工负责标注模型所需的每一行数据。这个任务通常很耗时而且成本高昂,因为成功的人工智能(AI)模型需要数千甚至数百万个准确标注的训练数据。 随着我们不断改进人工智能的构建方法,我们不得不思考如何改进数据标注中的高密度人工作业情况。 现在,澳鹏拥有诸多最先进的预标注模型,用来改善人工智能部署的流程。例如,我们已经开发使用了用于自动驾驶像素级标注、用于图像和文档转录、用于音频分割的预标注模型,以及其他几个预标注或分类模型。在我们不断迭代工具的过程中,我们发现以人为本的技术改进既可以提高生产力,又能实现更大的投资回报率。这种“以人为本的技术”充分考虑操作员的技能、知识、灵活性以及创造力,将其作为一种资产加入了整个人工智能构建流程。 在构建“以人为本的技术”时,我们的目标有两方面:一方面是在保证数据质量的情况下优化标注流程,另一方面是减少重复性的无意义操作,来减轻标注员的负担。 在进行视频标注时,通常需要对视频的各个帧单独进行标注,而每一帧中标注内容的变化非常小;例如,一段很多汽车进行路面行驶的视频包含很多帧,而每一帧中不同车辆的位置变化很小;如果需要对每一帧的每一辆车进行纯手工标注,会非常消耗时间和精力。通过机器学习辅助技术,我们可以对每一帧进行自动预标注,标注员只需要进行关键帧的调整,就可以完成原本无意义重复的标注工作。在这之中,机器学习辅助工具必不可少。 在减轻标注员工作繁复性之外,机器学习辅助工具还可以帮助实现数据标注的质检和交付的自动化。在澳鹏,我们将其称为“智能标注”。智能标注的辅助功能可以在标注前、标注中和标注后,帮助人工标注员提高工作效率和保证标注质量。  

接触点一:标注开始之前

在开始标注作业之前,可以利用平台内置的模型进行预标注,提供一个基础模板。与纯手动标注过程不同,标注员只需检查预测的准确性,而无需从头开始进行标注。例如,如果想标注道路上的汽车,就可以使用我们提供的模型进行预分类和标注。 各种模型可以完成特定任务,应用于不同的标注需求:从审查色情内容,到掩盖个人详细信息,再到在对象周围添加边界框。使用现有模型提供初始数据标注,可以通过自动化部分标注过程来节省时间和成本。其准确性将取决于所选的模型或模型组合。 但您可能会问,如何防止标注员被模型的预测偏见所误导? 事实上,我们通过对几个标注项目进行大规模 A/B 测试进行了检验,结果发现:预标注数据提高了标注质量。换言之,与没有进行初始标注的数据相比,在移交给标注员进行最终标注之前由机器学习模型完成初始标注的数据产生的标注质量更高。 在自动驾驶汽车的一个图像像素标注项目中,使用机器学习模型进行初始标注后,我们所有试验的标注员生产力提高了91.5%,标注质量提高了10%。 如果您的团队仍然担心偏见误导,在生产线的后续两个阶段还有进一步的调整机会。  

接触点二:标注期间

开始标注作业后,可以利用机器学习模型来辅助人工评判。例如,如果作业包括视频标注,则手动过程可能是这样的:首先将视频分成逐帧序列,再由标注员在每一帧中标注每个目标对象。 根据每秒 24 帧的标准帧速率,这项标注任务很快就会变成一项艰辛的重复作业。使用机器学习辅助技术,标注员只需标注一次目标对象,模型就可以跟踪并预测其在后续帧中的位置。以标注道路上的汽车为例,标注员只需在第一帧中标注每辆车,模型就将跟踪其位置并在其余帧中标注这些汽车。然后,标注员只需对其余帧进行审查,根据需要进行更正即可。 在标注作业期间借助机器学习辅助技术,标注员可以提高工作速度和准确性。在不牺牲质量的情况下,使用这种方法最高可以将标注速度提升至手动操作的 100 倍。这种方法的好处还会延伸到标注员身上,它可以减轻认知压力,使标注员在整个任务期间感觉更轻松自在。  

最终接触点:标注完成后

在模型和标注员对数据做出评判之后,即可进入验证阶段。在此阶段,可以使用机器学习模型来验证所做的评判,并在标注员的输入未达到预期质量阈值范围时对标注员做出提醒。 这种方法有几个显著的好处。最显著的好处是,它可以减轻对测试或同行评审的需求,并且降低客户付费进行数据评判,最终却达不到质量要求的风险。在模型验证之后,标注员即可提交作业。

我们不仅需要投资 AI 解决方案,还需要投资 AI 支持流程的相关改进。 —Wilson Pang

假设有一个文本语音项目,就可以使用机器学习辅助的验证工具,并结合设置连贯性或语种等指标。模型将标记出任何不符合这些指标准确性要求的数据标注,然后由人工标注员检查并更正标注。澳鹏在一个涉及聊天机器人训练的文本语音项目中测试了机器学习辅助验证工具。我们发现使用实时模型后,错误率降低了35%。

“这不仅仅可以推进  AI ,还可以改进  AI  流程”

通过以人为本的技术将机器学习与人的操作结合起来,是 AI 创新的前进方向。 数据标注生产线中的机器学习辅助功能对企业和标注员都有帮助:企业可以花费更少的资源更快地推出高质量 AI 解决方案,而标注员可以减少工作的压力和重复性。后者对于为所有从事 AI 项目的个人提升 AI 实践的公平性尤为重要。 我们不仅需要在 AI 解决方案上投入资金,也需要投资于改进 AI 支持的流程。只有这样,才可以改进我们的 AI 伦理方法,并提升使用机器驱动型解决方案来解决全球问题的能力。 AI 并不意味着完全依赖于机器或人;相反,将二者充分结合可以增强彼此的优势并促进成功部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/438816.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

阿珊比较Vue和React:两大前端框架的较量

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

【HarmonyOS】ArkTS-箭头函数

箭头函数 箭头函数是 比普通函数 更简洁 的一种函数写法 () > {}() > {// 函数体 }let 函数名 () > {// 函数体 }let 函数名 () > {// 函数体 } 函数名(实参1, 实参2)let 函数名 (形参1: 类型, 形参2: 类型) > {// 函数体 } 函数名(实参1, 实参2)let 函数名 …

99.qt qml-单例程序实现

在之前讲过: 58.qt quick-qml系统托盘实现https://nuoqian.blog.csdn.net/article/details/121855993 由于,该示例只是简单讲解了系统托盘实现,并没有实现单例程序,所以多次打开后就会出现多个exe出现的可能,本章出一章QML单例程序实现, 多次打开始终只显示出第一个打开…

1.5如何缓解图像分类任务中训练数据不足带来的问题?

1.5 图像数据不足时的处理方法 场景描述 在机器学习中,绝大部分模型都需要大量的数据进行训练和学习(包括有监督学习和无监督学习),然而在实际应用中经常会遇到训练数据不足的问题。 比如图像分类,作为计算机视觉最基本的任务之一&#xff0…

Bytebase 签约合思,覆盖多云数据库变更发布,数据访问控制,安全治理的全生命周期,确保符合合规审计要求

在数字化快速发展时代,有效的规范数据库管理对企业安全运营至关重要。近日,数据库 DevOps 团队协同管理工具 Bytebase 签约费控领域领军企业合思,旨在全面优化数据库操作管理,收口全体员工的变更和查询操作,以提高整体…

基于Nodejs使用Playwright时的一款VSCode插件

上一篇文章讲解了Playwright框架(基于nodejs,使用playwright对网站进行爬虫),并基于Nodejs进行了网站爬虫。这篇文章,我们来讲一个选择Nodejs的原因:vscode中的浏览器模拟插件 vscode中的浏览器模拟插件 P…

vue2【详解】生命周期(含父子组件的生命周期顺序)

1——beforeCreate:在内存中创建出vue实例,数据观测 (data observer) 和 event/watcher 事件配置还没调用(data 和 methods 属性还没初始化) 【执行数据观测 (data observer) 和 event/watcher 事件配置】 2——created&#xf…

微信小程序开发系列(二十二)·wxml语法·双向数据绑定model:的用法

目录 1. 单向数据绑定 2. 双向数据绑定 3. 代码 在 WXML 中&#xff0c;普通属性的绑定是单向的&#xff0c;例如&#xff1a;<input value"((value))"/> 如果希望用户输入数据的同时改变 data 中的数据&#xff0c;可以借助简易双向绑定机制。在对应属性…

项目解决方案:视频监控接入和录像系统设计方案(上)

目 录 1.概述 2. 建设目标及需求 2.1建设总目标 2.2 需求描述 2.3 需求分析 3.设计依据与设计原则 3.1设计依据 3.2 设计原则 &#xff08;1&#xff09;、先进性与适用性 &#xff08;2&#xff09;、经济性与实用性 &#xff08;3&#xff09;、可靠性与…

【机器学习】实验6,基于集成学习的 Amazon 用户评论质量预测

清华大学驭风计划课程链接 学堂在线 - 精品在线课程学习平台 (xuetangx.com) 代码和报告均为本人自己实现&#xff08;实验满分&#xff09;&#xff0c;此次代码开源大家可以自行参考学习 有任何疑问或者问题&#xff0c;也欢迎私信博主&#xff0c;大家可以相互讨论交流哟…

离散数学例题——5.图论基础

基本的图 关联矩阵 子图和补图 度数和握手定理 注意&#xff01;&#xff01;&#xff01;无向图的度数&#xff0c;要行/列和对角线值 根据度数序列判定是否为无向图 度和握手定理证明题 竞赛图 同构图 自补图 通路和回路数量 通路和回路数量 最短路径——dijkstra算法 连通…

ThreadLocal :在 Java中隱匿的魔法之力

优质博文&#xff1a;IT-BLOG-CN ThreadLocal 并不是一个Thread&#xff0c;而是 ThreadLocalVariable(线程局部变量)。也许把它命名为 ThreadLocalVar更加合适。线程局部变量就是为每一个使用该变量的线程都提供一个变量值的副本&#xff0c;是 Java中一种较为特殊的线程绑定机…

SpringAMQP创建交换机和队列

SpringAMQP提供的Exchange接口 一基于bean注解: 一.Fanout交换机 package com.itheima.consumer.config;import org.springframework.amqp.core.Binding; import org.springframework.amqp.core.BindingBuilder; import org.springframework.amqp.core.FanoutExchang…

【MySQL 系列】MySQL 架构篇

在我们开始了解 MySQL 核心功能之前&#xff0c;首先我们需要站在一个全局的视角&#xff0c;来看 SQL 是如何运作执行的。通过这种方式&#xff0c;我们可以在头脑中构建出一幅 MySQL 各组件之间的协同工作方式&#xff0c;有助于我们加深对 MySQL 服务器的理解。 文章目录 1、…

【洛谷 P8662】[蓝桥杯 2018 省 AB] 全球变暖 题解(深度优先搜索+位集合)

[蓝桥杯 2018 省 AB] 全球变暖 题目描述 你有一张某海域 N N N \times N NN 像素的照片&#xff0c;. 表示海洋、 # 表示陆地&#xff0c;如下所示&#xff1a; ....... .##.... .##.... ....##. ..####. ...###. .......其中 “上下左右” 四个方向上连在一起的一片陆地组…

【牛客】VL74 异步复位同步释放

描述 题目描述&#xff1a; 请使用异步复位同步释放来将输入数据a存储到寄存器中&#xff0c;并画图说明异步复位同步释放的机制原理 信号示意图&#xff1a; clk为时钟 rst_n为低电平复位 d信号输入 dout信号输出 波形示意图&#xff1a; 输入描述&#xff1a; clk为时…

Springboot整合rabbitmq(二)

spring boot&#xff0c;为了简化rabbitMQ的使用&#xff0c;它在这里面给咱们提供了一个模板对象。 这个模板对象是什么&#xff1f; 这个模板对象叫RabbitTemplate对象。说白了其实是用来简化rabbitMQ的操作 也就是说之后我们可以通过这个模板对象直接去向rabbitMQ中发送消息…

libevent源码解析:信号事件(二)

文章目录 前言一、用例二、基本数据结构介绍三、源码分析event_base_newevsignal_newevent_addevent_base_dispatch 总结 前言 libevent中对三类事件进行了封装&#xff0c;io事件、信号事件、定时器事件&#xff0c;libevent源码分析系列文章会分别分析这三类事件&#xff0c…

【数据结构与算法】深入浅出:单链表的实现和应用

&#x1f331;博客主页&#xff1a;青竹雾色间. &#x1f618;博客制作不易欢迎各位&#x1f44d;点赞⭐收藏➕关注 ✨人生如寄&#xff0c;多忧何为 ✨ 目录 前言 单链表的基本概念 节点 头节点 尾节点 单链表的基本操作 创建单链表 头插法&#xff1a; 尾插法&#…

测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus

测试一下 Anthropic 宣称超过 GPT-4 的 Claude 3 Opus 0. 引言1. 测试 Claude 3 Opus 0. 引言 今天测试一下 Anthropic 发布的 Claude 3 Opus。 3月4日&#xff0c;Anthropic 宣布推出 Claude 3 型号系列&#xff0c;该系列在广泛的认知任务中树立了新的行业基准。该系列包括…