图像标注是什么?及其类型和应用

什么是图像标注?

图像标注是与您交互的许多人工智能产品的基础,并且是计算机视觉(CV)领域重要的过程之一。在图像标注过程中,数据标注员使用标签或元数据来标记AI模型学习识别的数据特征。然后,这些图像标注的数据被用于训练机器模型,使计算机在见到无标记的新数据时识别出这些特征。 小时候,你知道那个会“汪汪汪”叫的生物是“狗”。我们慢慢长大,发现那个捉迷藏把屁股对着外面的二愣子叫“二哈”,那个走路屁股一扭一扭叫柯基,那个主人已故却依然坚守在车站的“八公”是秋田犬。我们知道狗和猫不同,长大后也发现有一个长得很像兔子的小可爱叫“天竺鼠”。和人类一样,计算机也需要通过许多数之不尽的“动物知识”来学习如何对动物进行分类。图像标注就是以计算机可以理解的方式来提供这些“知识”。 随着致力于人工智能的公司能够获得的图像数据的不断增多,依赖于图像标注的项目的需求也飞速增长。对于在机器学习领域开展业务的企业来说,创建全面、有效的图像标注过程变得越来越重要。  

图像标注类型

图像标注类型

 图像标注有较为常见的三种类型,企业可以根据项目的复杂程度及适用的应用场景选择一种标注类型。对于任何类型,所使用图像数据的质量越高,达到的AI预测结果就会越准确。

一、图像分类

分类是简单又快捷的图像标注方法,仅将一个标签应用于一张图像。例如,你可能想要浏览并分类一系列杂货店货架的图像,并确定哪些货架上有汽水哪些没有汽水。这种方法非常适合收集抽象信息,例如上面的示例,在一天中的时间内,图像中是否有汽车,或者从一开始就过滤掉不符合条件的图像。在提供单一、高级标签方面,分类是一种快捷的图像标注方法,但也是我们重点介绍的三种类型中较为模糊的一种,因为它并不指示图像中物体所在的位置。

二、目标检测

目标检测是让标注员在图像中标注出指定的特定物体。因此,如果分类法将图像归类为包含汽水,那么这种方法进一步表明汽水在图像中的位置,或者是你正在寻找的芬达汽水的位置。有几种方法可用于目标检测,包括以下的标注技术:

  • 2D边界框(2D Bounding Box):标注员应用矩形和正方形来界定目标对象的位置。这是图像标注领域中常用的技术之一。
  • 三维长方体(Cuboid)或3D边界框(3D Bounding Box):标注员将立方体应用于目标对象,以界定对象的位置和深度。
  • 多边形分割(Polygonal Segmentation):当目标对象不对称且不容易放入盒子中时,标注员会使用复杂的多边形来界定对象的位置。
  • 线和样条线标注(Lines and Splines):标注员标识图像中的关键边界线和曲线以分隔各个区域。例如,标注员可以为自动驾驶汽车图像标注项目中标记高速公路的各个车道。

由于目标检测允许重叠使用框或线,因此该方法仍不是高精确的方法。它提供的是物体的一般位置,同时也是相对较快的标注过程。

三、语义分割(Semantic Segmentation)

语义分割通过确保图像的每个组成部分仅属于一个类别来解决物体检测的重叠问题。通俗的来说就是语义分割是对区域内的像素分类而不是目标分类。因此需要标注员为每个像素分配类别(例如行人、汽车或标志)。这有助于训练AI模型如何识别和分类特定对象,即使这些对象被遮挡。例如,如果有一个购物车遮挡了图像的一部分,则可以使用语义分割来识别直至像素级的芬达汽水是什么样,以便模型能够识别出它虽然被遮挡了但实际上仍是芬达汽水。 值得注意的是,图像标注方法并不仅仅局限于上述三种类型。其他的方法包括专门用于人脸识别的类型,例如特征点标注(标注员使用人体姿势点标注来绘制特征,例如眼、鼻和口)。图像转录是另一种常见的标记方法:当数据中包含多模式信息,即图片中有文字并且需要提取该文字时,就会用到这种方法。  

图像标注的常见应用场景

要罗列一份清单来囊括目前利用图像标注的所有应用程序,篇幅将长达数千页。目前,我们将重点介绍各大行业中比较热门的使用场景。

农业

农民可以借助无人机和卫星图像,利用AI来获得无尽的好处,包括估算作物产量、评估土壤状况等。John Deere公司提供一个令人激动的图像标注实例。该公司对相机图像进行标注,以在像素级别区分杂草和农作物。然后,他们参考这些经标注的图像数据将杀虫剂仅施用在生长杂草的区域而不是整个田地中,从而每年节省大量农药开支。

医疗

医生们正在利用AI解决方案进行辅助诊疗。例如,AI可以检查放射学影像,以确定存在某些癌症的可能性。在一个示例中,团队使用数千个标有癌病灶和非癌病灶的扫描图像数据来训练模型,直至机器学会自动区分。AI并不是真的取代医生,但可以在做肠镜的时候提高病灶诊断的准确性。关于计算机视觉如何应用在医疗领域,澳鹏创建了一个网络研讨会,点击了解《计算机视觉技术如何赋能医疗领域》。

制造业

制造商发现图像标注可以帮助他们采集仓库中的库存信息。他们正在训练计算机评估感官图像数据,以确定产品何时缺货、何时补货。某些制造商还使用图像标注项目监控工厂内的基础设施。他们的团队标注设备的图像数据,然后用这些数据训练计算机识别特定的缺陷或故障,从而推动更快的修复和更好的整体维护。

金融

尽管金融业远未充分利用图像标注项目的能力,但仍有数家公司在此领域掀起热潮。例如,凯克萨银行(Caixabank)使用人脸识别技术验证从ATM取款的客户的身份。这是通过名为“人脸关键点标注”的图像标注过程完成的,该过程可绘制眼和口等面部特征。人脸识别提供了一种更快、更精确的身份确认方法,从而降低了欺诈的可能性。图像标注技术也被广泛应用于标注要报销的单据或通过移动设备存入的支票(OCR技术)。

零售

图像标注对于许多不同的AI使用场景也不可或缺。你是否想要使用AI为特定商品提供正确的搜索结果,例如为客户提供“牛仔裤”的搜索结果?要构建可以浏览产品目录并提供用户所需结果的模型,就需要使用图像标注。有几家零售商还在自己的商店中试用机器人。这些机器人会收集货架图像,以确定产品是否库存量低或缺货,从而决策是否需要再订购。这些机器人还可以使用一种称为图像转录的过程,通过扫描“条形码图像”收集产品信息。  

如何使图像标注更容易

正如建立任何AI模型都需要克服重重挑战一样,图像标注也非常困难。AI需要大量高质量的训练数据才能正常工作(计算机可以学习的用例越多,它的表现就越佳),需要有多样化的团队来标注这些数据,还需要全面的数据流程来执行。对于许多企业而言,要投入的时间、金钱和人力成本通常都高得不切实际。对于那些没有内部资源来完成端到端图像标注项目的客户,向第三方供应商寻求帮助是合理的选择。这些供应商可以提供图像数据、标注员、工具和专家团队来协助进行这种大规模的工作。 特别是,在进行图像标注时,往往会遇到一系列的问题。图像可能光线欠佳,目标对象可能被遮挡,部分图像可能连人眼也无法识别。在开始图像标注项目之前,团队需要谨慎考量在此过程中会碰到的各种问题、必须认真考虑如何命名标签和区分类别,因为这些因素可能会影响标注员的标注判断,并最终使机器混淆。对于过于相似的类别如何制定区分标准是需要团队慎重思考的问题。 如何正确地带领团队完成精确图像标注项目,将决定是否会产出高质量的训练数据,而这也恰恰是制定AI战略投资中不可或缺的环节。  

澳鹏图像标注专家Liz Otto Hamel的见解

澳鹏依靠自身的专家团队帮助完成适用于客户机器学习工具的图像标注项目。Liz Otto Hamel是我们的一名产品经理,她将帮助确保“澳鹏数据标注平台”在提供高质量图像标注功能和工具方面超越行业标准。Liz具有学术研究背景并拥有斯坦福大学博士学位。她对评估和满足图像标注需求的建议包括:

  • 定义范围。首先对项目的业务目标作出明确而严格的定义。所标注数据的需求(包括标注几何形状、元数据、本体和格式)将来自项目的业务目标。利用业务价值指导图像标注项目利于保持明确的工作方向。
  • 制定迭代计划。为需要标注的一组数据制定初始标准,然后开始试运行。自己标注一小部分数据。在迭代过程中,你发现可能需要在项目制定的标准中考虑边缘案例。迭代计划将促使你的团队与数据标注供应商开展合作,第三方标注公司能够提供的多元标注工具和专业知识涵盖了各种标注用例,并可以按照你的团队的需求进行修改。
  • 制定整合计划。为了防止数据偏差(模型在自然环境中看到的数据类型的变化),你需要构建可扩展的自动化训练数据流程,以便用新数据不断训练模型。整合计划将促进你的团队与数据标注供应商开展合作,第三方标注公司可以根据你需要训练数据量的增加进行快速扩展。与模型进行交互的受众越多,为保持模型新鲜度所需的图像标注量也增加得越快。从项目开始就要制定一个整合计划。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/39168.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

线程池学习(六)线程池状态转化

线程池状态定义 // runState is stored in the high-order bits // 线程池创建之后的初始状态&#xff0c;这种状态下可以执行任务private static final int RUNNING -1 << COUNT_BITS; // 线程池不再接收新的任务&#xff0c;但是会将队列中的任务执行完 private s…

解决apkanalyzer.bat could NOT be found in D:\Download\Android SDK Tools!警告报错

appium安装过程中很可能出现以下警告报错&#xff0c;咱就按如下操作即可搞定&#xff01;&#xff01;&#xff01; apkanalyzer.bat could NOT be found in D:\Download\Android SDK Tools! 一、下载Command line tools 下载地址&#xff1a;​https://developer.android.g…

Jenkins (一)

Jenkins (一) Docker Jenkins 部署 一. 安装 jenkins $ mkdir -p /home/tester/data/docker/jenkins $ vim jenkins:lts-jdk11.sh./jenkins:lts-jdk11.sh 内容 #! /bin/bash mkdir -p /home/tester/data/docker/jenkins/jenkins_homesudo chown -R 1000:1000 /home/tester/da…

基于simulink的DPLL仿真笔记

该笔记主要用于本人思路整理与记录 本设计运用的是电荷泵一阶环路滤波器&#xff0c;二阶三阶则在此基础上举一反三&#xff0c;以后如有机会会慢慢补全 文章目录 一.仿真模型PS&#xff08;题外话&#xff09; 二.仿真结果三.环路滤波器分析1. 环路滤波器对比LPF2. 环路滤波器…

从零开发短视频电商 单元测试(TestNG)

文章目录 简介简单示例执行测试并查看测试报告方式一 在IDEA中运行testng.xml文件方式二 在IDEA中运行测试类或者package方式三 在Maven中运行测试 统计测试覆盖率方式一 IDEA 支持详细的代码测试覆盖率统计方式二 Maven支持测试覆盖率 在IDEA中创建测试用例使用 IDEA 快速创建…

ELK搭建

ELK介绍&#xff1a; ELK是一组开源工具的缩写&#xff0c;它由Elasticsearch、Logstash和Kibana三个组件组成&#xff0c;用于处理、分析和可视化大量日志数据。 入门级ELK搭建&#xff08;无Docker环境&#xff09; 安装前准备 1.获取安装包 https://artifacts.elastic…

【InsCode Stable Diffusion 美图活动一期】生成着玩

此为内容创作模板&#xff0c;请按照格式补充内容&#xff0c;在发布之前请将不必要的内容删除 一、 Stable Diffusion 模型在线使用地址&#xff1a; https://inscode.csdn.net/inscode/Stable-Diffusion 二、模型相关版本和参数配置&#xff1a; 三、图片生成提示词与反向…

【Docker】详解docker安装及使用

详解docker安装及使用 1. 安装docker1.1 查看docker版本信息 2. Docker镜像操作3. Docker容器操作4.知识点总结4.1 docker镜像操作4.2 docker容器操作4.3 docker run启动过程 参见docker基础知识点详解 1. 安装docker 目前Docker只能支持64位系统。 ###关闭和禁止防火墙开机自…

Hadoop: High Available

序言 在Hadoop 2.X以前的版本&#xff0c;NameNode面临单点故障风险&#xff08;SPOF&#xff09;&#xff0c;也就是说&#xff0c;一旦NameNode节点挂了&#xff0c;整个集群就不可用了&#xff0c;而且需要借助辅助NameNode来手工干预重启集群&#xff0c;这将延长集群的停…

Windows 组策略 部署打印机

一、服务端 1、打印机管理&#xff1a;添加打印机 2、选择打印机 3、第一次安装&#xff0c;选择这个 4、下载驱动&#xff0c;从磁盘安装 5、已成功安装 6、选中打印机右击属性&#xff1a;列出目录 7、创建一个组策略 8、组策略设置 用户设置 → 首选项 → 控制面板 → 打印…

C++day4 (拷贝构造函数、拷贝赋值函数、匿名对象、友元函数、常成员函数、常对象、运算符重载)

#include <iostream> #include <cstring> using namespace std;class mystring { private:char *str; //记录C风格字符串int size; //记录字符串的实际长度public://无参构造mystring():size(10){strnew char[size];//构造出一个长度为10的字符串strcpy(str,&…

22.代理模式

代理模式 二十三种设计模式中的一种&#xff0c;属于结构型模式。它的作用就是通过提供一个代理类&#xff0c;在调用目标方法的时候&#xff0c;不再是直接对目标方法进行调用&#xff0c;而是通过代理类间接调用。让不属于目标方法核心逻辑的代码从目标方法中剥离出来——解耦…

移动端深度学习部署:TFlite

1.TFlite介绍 &#xff08;1&#xff09;TFlite概念 tflite是谷歌自己的一个轻量级推理库。主要用于移动端。 tflite使用的思路主要是从预训练的模型转换为tflite模型文件&#xff0c;拿到移动端部署。 tflite的源模型可以来自tensorflow的saved model或者frozen model,也可…

初识protobuf

Protobuf 全称Protocol Buffers&#xff08;协议缓冲区&#xff09;&#xff0c;是一种轻量级、高效的数据序列化格式&#xff0c;由Google开发。它被设计用于结构化数据的序列化、反序列化以及数据交换&#xff0c;常用于网络通信和数据存储等领域。 Protobuf使用简洁的消息描…

解决appium-doctor报 bundletool.jar cannot be found

一、下载bundletool.jar 下载地址&#xff1a;https://github.com/google/bundletool/releases 二、重命名 重命名这个jar包为bundletool.jar&#xff0c;在android sdk目录下&#xff0c;新建bundle-tool目录&#xff0c;把bundletool.jar包放入其中。 三、配置环境 path后追加…

re学习(19)[ACTF新生赛2020]easyre1(UPX脱壳)

文章链接&#xff1a;BUUCTF在线评测 参考视频&#xff1a;B站 【新手教程三】小Z带你学习什么是ESP定律和什么是堆栈平衡 &#xff1f; - 『脱壳破解区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn 题解&#xff1a; 工具脱壳 key"*F\"N,\"…

蒲公英打包环境搭建碰到问题

一&#xff1a;证书那边选择手动&#xff0c;不要自动&#xff0c;——》debug配置dev证书&#xff0c;release配置ad-hoc证书 二&#xff1a;证书有时候不生效&#xff0c;删除重新下载。~/Library/MobileDevice/Provisioning Profiles 三&#xff1a;更新测试手机时&#…

# Linux终端控制字符详解以及简单应用实践

Linux终端控制字符详解以及简单应用实践 文章目录 Linux终端控制字符详解以及简单应用实践1 控制字符表2 控制字符 ESC &#xff08;0x1B&#xff0c;^[&#xff09;子参数表3 控制字符 ESC &#xff08;0x1B&#xff0c;^[&#xff09;子参数表 - 字符颜色参照表4 实践&#x…

SpringBoot+JWT实现单点登录解决方案

一、什么是单点登录? 单点登录是一种统一认证和授权机制&#xff0c;指在多个应用系统中&#xff0c;用户只需要登录一次就可以访问所有相互信任的系统&#xff0c;不需要重新登录验证。 单点登录一般用于互相授信的系统&#xff0c;实现单一位置登录&#xff0c;其他信任的…

【JavaEE面试题(九)线程安全问题的原因和解决方案】

多线程-初阶 4. 多线程带来的的风险-线程安全 (重点)4.1 观察线程不安全原因是 1.load 2. add 3. save 4.2 线程安全的概念4.3 线程不安全的原因最根本的是 操作系统对线程的调度是随机的★1. 修改共享数据&#xff08;多个线程修改同一个变量&#xff09;★2. 操作不是原子性★…