【深度学习:Automated Data Annotation】开源数据注释完整指南
- 什么是开源数据标注工具?
- 您会使用开源标签工具做什么?
- 主要的开源数据标注工具有哪些?
- CVAT
- MONAI Label
- LabelMe
- RIL-Contour
- Sefexa
- 使用开源注释工具的优点和缺点是什么?
- 开源注释工具的缺点
- **购买与建造:沉没成本谬论颠倒过来**
- 难以扩展注释项目
- 数据安全性薄弱或有限,没有审计跟踪
- 项目负责人无法监控注释团队
- 开源注释工具的优点
- 免费下载和使用!
- 适应性强且可编辑的软件
- 社区支持
- 您什么时候应该考虑使用商业注释工具?
- Wrapping up
开源注释工具和软件广泛应用于计算机视觉和机器学习领域的数百个项目。
在某些情况下,使用开源工具可能是一个优势,特别是当项目或公司处于启动阶段并且注释工作的预算有限时。学术项目经常发现开源工具以及数百个开源数据集(例如 COCO)很有用。
然而,对于商业项目和用例来说,也有缺点。开源并不总是附带机器学习和数据运营团队有效、高效或大规模管理项目所需的工具和功能。
在本文中,我们将了解开源注释工具的用途,提供有关 5 个最流行的开源工具的更多详细信息,然后权衡使用开源工具的利弊,然后再将其与使用更先进的东西的选择。
什么是开源数据标注工具?
开源数据注释工具是一款专门为图像和视频数据集的图像标记和数据注释而设计的软件。注释是训练计算机视觉模型的重要组成部分,因为需要标签和数据注释来训练模型以产生组织所需的结果/结果。
开源工具可以免费使用。任何人都可以下载和使用它们,因此与软件即服务 (SaaS) 产品不同,无需支付许可费或按月订阅费。开源工具通常由类似于慈善机构的基金会通过社区捐赠或科技公司的赞助来维护。
您会使用开源标签工具做什么?
找到合适的开源工具并不总是那么容易。这取决于您需要它的用途,无论是用于图像标签、视频标签还是两者。
或者您是否需要一个针对某些用例具有特定功能的开源标记工具,例如注释医学成像数据集。正如我们在之前的文章中讨论过该主题一样,在这篇文章中,我们将重点关注更广泛的基于计算机视觉的图像和视频用例,例如智能城市、制造、安全和体育分析。
开源标签工具可用于从图像分割到绘制边界框、折线、对象检测以及图像和视频上的许多其他注释和标签等各种用途。您可以使用开源工具进行人体姿势估计 (HPE) 以及数十个其他计算机视觉 (CV) 项目用例。
现在让我们来看看 5 个最流行的计算机视觉项目开源数据注释工具。
主要的开源数据标注工具有哪些?
CVAT
计算机视觉注释工具 (CVAT) 于 2017 年作为英特尔内部项目启动。现在它是一家独立的公司和基金会,其开源图像和视频注释软件的下载量超过 100 万次,并拥有一个由支持者和贡献者组成的热情社区。
使用 CVAT,您可以通过创建分类、分割、3D 长方体和骨架模板来注释图像和视频。 CVAT 用于医疗保健、零售、制造、体育、汽车和空中观测(无人机)领域。
CVAT 是一个由 Intel 支持的开源项目,属于 OpenCV 的范畴,并且由于 MIT 的宽松许可,可以免费用于商业用途。 CVAT 的核心团队将与 OpenCV 团队合作支持该项目,OpenCV 将支持那些从原来的 CVAT.org 迁移到新家 CVAT.ai 的人员。
MONAI Label
MONAI Label 是一款开源图像标注工具,利用 AI 来自动化标注工作。虽然 MONAI Label 主要用于医疗和保健领域,但它可用于任何类型的图像注释项目。这是一个易于安装的生态系统,可以在具有单个或多个 GPU 的计算机上本地运行。服务器端和客户端都可以在相同或不同的计算机上工作,具体取决于您的需要。
LabelMe
LabelMe 是麻省理工学院计算机科学与人工智能实验室推出的一款开源“为计算机视觉研究构建图像数据库的在线注释工具”。
LabelMe 附带可下载的源代码、工具箱、3D 图像的开源版本、可用于计算机视觉培训项目的图像数据集,以及通过 Amazon Mechanical Turk 外包数据标记的功能。
RIL-Contour
RIL-Contour 是另一个开源注释工具,可使用迭代深度学习 (IDL) 加速注释项目。它主要是为医学成像数据集设计的,但也可用于计算机视觉和机器学习项目的任何类型的基于图像的数据集。
RIL-Contour 是一个开源项目,拥有 1000 多名贡献者,其模式和框架源自 ELIXIR(欧洲生物信息基础设施)。
Sefexa
Sefexa 是一个开源图像分割工具。 Sefexa 由布拉格的软件工程师 Ales Fexa 创建,他对计算机视觉和数学充满热情。借助 Sefexa,您可以使用它在基于图像的数据集中进行半自动图像分割、分析图像并将结果导出到 Excel 中,以及从数据集中的图像创建地面实况数据。
现在让我们看看使用开源注释工具的优点和缺点。
使用开源注释工具的优点和缺点是什么?
不幸的是,开源工具有几个缺点,如下:
开源注释工具的缺点
购买与建造:沉没成本谬论颠倒过来
大多数创始人都知道,购买而不是构建有一个优势,因为它可以确保您的工程团队致力于开发您的产品。否则,当市场上有数百种选择时,您的开发人员可能会花费太多时间构建非核心内部技术解决方案。
在视频和图像注释领域,开源解决方案代表了对数千个图像和视频数据集进行注释和标记的挑战的潜在答案。
然而,这是“沉没成本谬论”被颠覆的一个领域。一些公司“直接使用”这些开源工具,或者作为构建内部版本的基础。不幸的是,正如我们下面概述的那样,与购买现成的和可定制的高级注释解决方案的优点相比,开源工具有太多的缺点,而这些优点并没有权衡开源注释工具的缺点。
难以扩展注释项目
最重要的挑战之一是扩展注释项目。
图像和视频注释项目通常涉及注释数千个图像和视频。每个都需要标签和合适的注释,例如边界框、多边形、折线、对象检测、HPE 以及其他所需的任何内容。注释工具尽可能地自动化此过程。
开源工具通常存在技术限制。它们的运行速度可能会变慢,从而使项目花费更长的时间,而且即使开源工具具有自动化功能,来自商业供应商的这些功能通常也更快、更高效、更有效。
然而,只有人类注释者为注释软件提供了一些可以使用的东西,自动化才有可能实现。借助商业且功能齐全的注释工具,扩展这些项目变得更加容易且耗时更少。每个人都可以看到整个团队的工作,更重要的是,项目负责人可以监控注释者并相应地放大和缩小。
使用开源软件,注释团队只能通过 Dropbox 等云存储解决方案共享图像和视频数据集。这使得扩展注释项目变得更加困难,现在您在管理注释项目时不再需要任何麻烦。
数据安全性薄弱或有限,没有审计跟踪
数据安全和审计跟踪是计算机视觉和机器学习项目不可或缺的一部分。
使用开源工具时,没有审计跟踪,数据安全性很弱或根本不存在。如果无法跟踪和监控图像和视频的基本审计跟踪和时间戳,那么确保您的项目遵守相关数据保护法律(例如欧洲的 GDPR、CE 认证或美国的 CCPA)是很困难的。
项目负责人无法监控注释团队
开源工具无法让注释者像高级软件那样经济高效地监控注释团队的工作。由于开源工具不是基于云的,项目负责人无法实时监控注释者的进度。没有仪表板,因此您无法看到谁做了什么、谁表现良好、谁表现不佳。
基准测试需要花费更多的时间和精力。协作依赖于注释者通过基于云的共享文件夹(例如 Dropbox 和 Box)发送完整批次的图像和视频。
注释项目通常需要更多时间,特别是在需要重新注释和重新标记或准确性较低的情况下。当项目的期限紧迫并且需要快速获得准确的培训数据时,使用开源工具可能会花费您的团队时间,而您不能浪费这些时间。
开源注释工具的优点
免费下载和使用!
使用开源注释工具的最佳也是主要原因之一是价格:它们是免费的!
注释工作非常耗时。获得任何能够加速这项工作的工具都是一种额外的好处,如果你不需要为此付费的话,那就更是如此了。
对于初创公司和学术项目来说,开源工具可能是正确的解决方案,特别是当您必须支付注释者团队的预算以及机器学习、计算机视觉或数据操作工程师的费用时。当注释预算紧张时,每一分钱都有帮助。
适应性强且可编辑的软件
开源工具的另一个优点是它们具有适应性和可编辑性。开源工具通常会发布其源代码和文档,因此,如果该工具与您的需求不完全一致,则可以采取相应的方法进行调整和修改。此外,您还可以使用插件、API 和其他技术调整和解决方法来修改开源软件以满足您的具体要求。
社区支持
与由公司提供支持的专有和高级注释软件不同,开源项目通常被大型且活跃的社区所包围。这些人要么是软件用户,要么对软件的开发做出了贡献。您始终可以依靠这些社区来回答您可能遇到的任何问题,因为其他人可能在注释和标签项目期间遇到类似的挑战。
然而,考虑到商业工具支持的性质,许多人会认为这通常胜过社区可以提供的答案,尤其是当您在截止日期前并且需要快速解决问题时。
您什么时候应该考虑使用商业注释工具?
当我们考虑到有效、高效地使用开源工具的挑战,以及需要协作和大规模的工作流程监督时,许多项目领导者有充分的理由转向并更喜欢商业软件解决方案。
借助 Encord 等解决方案,您可以受益于易于使用的协作界面。您需要能够管理不同国家/地区的注释者并根据需要与其他团队合作。当注释者拥有自己的软件本地版本并使用 Dropbox 等服务共享文件时,您就无法轻松做到这一点。
自动化功能同样重要。自动化功能可以为注释团队节省大量时间。例如,插值可以将一幅图像的像素数据与下一幅图像进行匹配,并确保注释者可以在任何方向绘制插值标签,从而节省大量时间。让我们面对现实吧,任何可以节省注释团队时间的事情都值得去做!
具有内置质量控制流程和功能的项目仪表板同样有用。这对于任何注释项目的顺利运行都是至关重要的。对于项目经理来说,这可能决定注释项目的成功或失败。
审计跟踪和数据合规性同样有价值,特别是在具有严格监管合规性的行业,例如医疗保健和与国防有关的任何行业。
Wrapping up
使用开源工具有很多优点。特别是对于初创公司和学术项目。在商业场景中,开源工具可能是开发您自己的内部专有注释解决方案或在购买现成解决方案时决定您需要什么的良好起点。不过,如果您想节省时间,与建造相比,购买始终是最快的途径!
尽管存在某些缺点,开源注释工具将继续流行并不断发展,以适应需要视频和图像数据集注释软件的市场、企业和组织不断变化的需求。