【深度学习:开源数据注释】开源数据注释完整指南

在这里插入图片描述

【深度学习:Automated Data Annotation】开源数据注释完整指南

    • 什么是开源数据标注工具?
    • 您会使用开源标签工具做什么?
      • 主要的开源数据标注工具有哪些?
      • CVAT
      • MONAI Label
      • LabelMe
      • RIL-Contour
      • Sefexa
    • 使用开源注释工具的优点和缺点是什么?
      • 开源注释工具的缺点
      • **购买与建造:沉没成本谬论颠倒过来**
      • 难以扩展注释项目
      • 数据安全性薄弱或有限,没有审计跟踪
      • 项目负责人无法监控注释团队
      • 开源注释工具的优点
      • 免费下载和使用!
      • 适应性强且可编辑的软件
      • 社区支持
      • 您什么时候应该考虑使用商业注释工具?
      • Wrapping up

开源注释工具和软件广泛应用于计算机视觉和机器学习领域的数百个项目。

在某些情况下,使用开源工具可能是一个优势,特别是当项目或公司处于启动阶段并且注释工作的预算有限时。学术项目经常发现开源工具以及数百个开源数据集(例如 COCO)很有用。

然而,对于商业项目和用例来说,也有缺点。开源并不总是附带机器学习和数据运营团队有效、高效或大规模管理项目所需的工具和功能。

在本文中,我们将了解开源注释工具的用途,提供有关 5 个最流行的开源工具的更多详细信息,然后权衡使用开源工具的利弊,然后再将其与使用更先进的东西的选择。

什么是开源数据标注工具?

开源数据注释工具是一款专门为图像和视频数据集的图像标记和数据注释而设计的软件。注释是训练计算机视觉模型的重要组成部分,因为需要标签和数据注释来训练模型以产生组织所需的结果/结果。

开源工具可以免费使用。任何人都可以下载和使用它们,因此与软件即服务 (SaaS) 产品不同,无需支付许可费或按月订阅费。开源工具通常由类似于慈善机构的基金会通过社区捐赠或科技公司的赞助来维护。

您会使用开源标签工具做什么?

找到合适的开源工具并不总是那么容易。这取决于您需要它的用途,无论是用于图像标签、视频标签还是两者。

或者您是否需要一个针对某些用例具有特定功能的开源标记工具,例如注释医学成像数据集。正如我们在之前的文章中讨论过该主题一样,在这篇文章中,我们将重点关注更广泛的基于计算机视觉的图像和视频用例,例如智能城市、制造、安全和体育分析。

开源标签工具可用于从图像分割到绘制边界框、折线、对象检测以及图像和视频上的许多其他注释和标签等各种用途。您可以使用开源工具进行人体姿势估计 (HPE) 以及数十个其他计算机视觉 (CV) 项目用例。

在这里插入图片描述

Encord 中的图像注释

现在让我们来看看 5 个最流行的计算机视觉项目开源数据注释工具。

主要的开源数据标注工具有哪些?

CVAT

计算机视觉注释工具 (CVAT) 于 2017 年作为英特尔内部项目启动。现在它是一家独立的公司和基金会,其开源图像和视频注释软件的下载量超过 100 万次,并拥有一个由支持者和贡献者组成的热情社区。

使用 CVAT,您可以通过创建分类、分割、3D 长方体和骨架模板来注释图像和视频。 CVAT 用于医疗保健、零售、制造、体育、汽车和空中观测(无人机)领域。

CVAT 是一个由 Intel 支持的开源项目,属于 OpenCV 的范畴,并且由于 MIT 的宽松许可,可以免费用于商业用途。 CVAT 的核心团队将与 OpenCV 团队合作支持该项目,OpenCV 将支持那些从原来的 CVAT.org 迁移到新家 CVAT.ai 的人员。

MONAI Label

MONAI Label 是一款开源图像标注工具,利用 AI 来自动化标注工作。虽然 MONAI Label 主要用于医疗和保健领域,但它可用于任何类型的图像注释项目。这是一个易于安装的生态系统,可以在具有单个或多个 GPU 的计算机上本地运行。服务器端和客户端都可以在相同或不同的计算机上工作,具体取决于您的需要。

LabelMe

LabelMe 是麻省理工学院计算机科学与人工智能实验室推出的一款开源“为计算机视觉研究构建图像数据库的在线注释工具”。

LabelMe 附带可下载的源代码、工具箱、3D 图像的开源版本、可用于计算机视觉培训项目的图像数据集,以及通过 Amazon Mechanical Turk 外包数据标记的功能。

RIL-Contour

RIL-Contour 是另一个开源注释工具,可使用迭代深度学习 (IDL) 加速注释项目。它主要是为医学成像数据集设计的,但也可用于计算机视觉和机器学习项目的任何类型的基于图像的数据集。

RIL-Contour 是一个开源项目,拥有 1000 多名贡献者,其模式和框架源自 ELIXIR(欧洲生物信息基础设施)。

Sefexa

Sefexa 是一个开源图像分割工具。 Sefexa 由布拉格的软件工程师 Ales Fexa 创建,他对计算机视觉和数学充满热情。借助 Sefexa,您可以使用它在基于图像的数据集中进行半自动图像分割、分析图像并将结果导出到 Excel 中,以及从数据集中的图像创建地面实况数据。

现在让我们看看使用开源注释工具的优点和缺点。

使用开源注释工具的优点和缺点是什么?

不幸的是,开源工具有几个缺点,如下:

开源注释工具的缺点

购买与建造:沉没成本谬论颠倒过来

大多数创始人都知道,购买而不是构建有一个优势,因为它可以确保您的工程团队致力于开发您的产品。否则,当市场上有数百种选择时,您的开发人员可能会花费太多时间构建非核心内部技术解决方案。

在视频和图像注释领域,开源解决方案代表了对数千个图像和视频数据集进行注释和标记的挑战的潜在答案。

然而,这是“沉没成本谬论”被颠覆的一个领域。一些公司“直接使用”这些开源工具,或者作为构建内部版本的基础。不幸的是,正如我们下面概述的那样,与购买现成的和可定制的高级注释解决方案的优点相比,开源工具有太多的缺点,而这些优点并没有权衡开源注释工具的缺点。

难以扩展注释项目

最重要的挑战之一是扩展注释项目。

图像和视频注释项目通常涉及注释数千个图像和视频。每个都需要标签和合适的注释,例如边界框、多边形、折线、对象检测、HPE 以及其他所需的任何内容。注释工具尽可能地自动化此过程。

开源工具通常存在技术限制。它们的运行速度可能会变慢,从而使项目花费更长的时间,而且即使开源工具具有自动化功能,来自商业供应商的这些功能通常也更快、更高效、更有效。

然而,只有人类注释者为注释软件提供了一些可以使用的东西,自动化才有可能实现。借助商业且功能齐全的注释工具,扩展这些项目变得更加容易且耗时更少。每个人都可以看到整个团队的工作,更重要的是,项目负责人可以监控注释者并相应地放大和缩小。

使用开源软件,注释团队只能通过 Dropbox 等云存储解决方案共享图像和视频数据集。这使得扩展注释项目变得更加困难,现在您在管理注释项目时不再需要任何麻烦。

数据安全性薄弱或有限,没有审计跟踪

数据安全和审计跟踪是计算机视觉和机器学习项目不可或缺的一部分。

使用开源工具时,没有审计跟踪,数据安全性很弱或根本不存在。如果无法跟踪和监控图像和视频的基本审计跟踪和时间戳,那么确保您的项目遵守相关数据保护法律(例如欧洲的 GDPR、CE 认证或美国的 CCPA)是很困难的。

项目负责人无法监控注释团队

开源工具无法让注释者像高级软件那样经济高效地监控注释团队的工作。由于开源工具不是基于云的,项目负责人无法实时监控注释者的进度。没有仪表板,因此您无法看到谁做了什么、谁表现良好、谁表现不佳。

基准测试需要花费更多的时间和精力。协作依赖于注释者通过基于云的共享文件夹(例如 Dropbox 和 Box)发送完整批次的图像和视频。

注释项目通常需要更多时间,特别是在需要重新注释和重新标记或准确性较低的情况下。当项目的期限紧迫并且需要快速获得准确的培训数据时,使用开源工具可能会花费您的团队时间,而您不能浪费这些时间。

开源注释工具的优点

免费下载和使用!

使用开源注释工具的最佳也是主要原因之一是价格:它们是免费的!

注释工作非常耗时。获得任何能够加速这项工作的工具都是一种额外的好处,如果你不需要为此付费的话,那就更是如此了。

对于初创公司和学术项目来说,开源工具可能是正确的解决方案,特别是当您必须支付注释者团队的预算以及机器学习、计算机视觉或数据操作工程师的费用时。当注释预算紧张时,每一分钱都有帮助。

适应性强且可编辑的软件

开源工具的另一个优点是它们具有适应性和可编辑性。开源工具通常会发布其源代码和文档,因此,如果该工具与您的需求不完全一致,则可以采取相应的方法进行调整和修改。此外,您还可以使用插件、API 和其他技术调整和解决方法来修改开源软件以满足您的具体要求。

社区支持

与由公司提供支持的专有和高级注释软件不同,开源项目通常被大型且活跃的社区所包围。这些人要么是软件用户,要么对软件的开发做出了贡献。您始终可以依靠这些社区来回答您可能遇到的任何问题,因为其他人可能在注释和标签项目期间遇到类似的挑战。

然而,考虑到商业工具支持的性质,许多人会认为这通常胜过社区可以提供的答案,尤其是当您在截止日期前并且需要快速解决问题时。

您什么时候应该考虑使用商业注释工具?

当我们考虑到有效、高效地使用开源工具的挑战,以及需要协作和大规模的工作流程监督时,许多项目领导者有充分的理由转向并更喜欢商业软件解决方案。

借助 Encord 等解决方案,您可以受益于易于使用的协作界面。您需要能够管理不同国家/地区的注释者并根据需要与其他团队合作。当注释者拥有自己的软件本地版本并使用 Dropbox 等服务共享文件时,您就无法轻松做到这一点。

自动化功能同样重要。自动化功能可以为注释团队节省大量时间。例如,插值可以将一幅图像的像素数据与下一幅图像进行匹配,并确保注释者可以在任何方向绘制插值标签,从而节省大量时间。让我们面对现实吧,任何可以节省注释团队时间的事情都值得去做!

具有内置质量控制流程和功能的项目仪表板同样有用。这对于任何注释项目的顺利运行都是至关重要的。对于项目经理来说,这可能决定注释项目的成功或失败。

审计跟踪和数据合规性同样有价值,特别是在具有严格监管合规性的行业,例如医疗保健和与国防有关的任何行业。

Wrapping up

使用开源工具有很多优点。特别是对于初创公司和学术项目。在商业场景中,开源工具可能是开发您自己的内部专有注释解决方案或在购买现成解决方案时决定您需要什么的良好起点。不过,如果您想节省时间,与建造相比,购买始终是最快的途径!

尽管存在某些缺点,开源注释工具将继续流行并不断发展,以适应需要视频和图像数据集注释软件的市场、企业和组织不断变化的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/390789.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

openEuler 22.03 LTS 上源码安装 PostgreSQL 15

安装PostgreSQL 15 1 安装必要的依赖 #yum install -y readline-devel zlib-devel gcc2、下载源码 # wget https://ftp.postgresql.org/pub/source/v15.6/postgresql-15.6.tar.gz # tar -xzvf postgresql-15.6.tar.gz3 配置 # cd postgresql-15.6/ # ./configure4 编译安装…

RK3399平台开发系列讲解(调试篇)死锁检测工具lockdep

🚀返回专栏总目录 文章目录 一、常见死锁场景二、lockdep使用方法三、lockdep技术原理3.1、锁类状态3.2、检查规则沉淀、分享、成长,让自己和他人都能有所收获!😄 📢介绍死锁检测工具lockdep。 资料 一、常见死锁场景 场景1:进程重复申请同一个锁,称为AA死锁。例如…

qt 开发 “控件之家“

本篇文章我们来描述一下Qt 控件 是qt中最基本 也是最难缠的 有种“小鬼难缠的感觉” qt常用控件大集合 Qt是一个广泛使用的跨平台应用程序框架,它提供了许多用于构建图形用户界面(GUI)的控件。以下是一些Qt中常用的控件: QPushButton:这是…

LV.23 D2 开发环境搭建及平台介绍 学习笔记

一、Keil MDK-ARM简介及安装 Keil MDK,也称MDK-ARM,Realview MDK (Microcontroller Development Kit)等。目前Keil MDK 由三家国内代理商提供技术支持和相关服务。 MDK-ARM软件为基于Cortex-M、Cortex-R4、ARM7、ARM9处理器设备…

基于requests框架实现接口自动化测试项目实战

requests库是一个常用的用于http请求的模块,它使用python语言编写,在当下python系列的接口自动化中应用广泛,本文将带领大家深入学习这个库,Python环境的安装就不在这里赘述了,我们直接开干。 01、requests的安装 wi…

深夜突发! OpenAI震撼发布了SORA文生视频模型,对职场人的影响可能跟你想的不一样

深夜突发! OpenAI震撼发布了SORA文生视频模型,对职场人的影响可能跟你想的不一样。 马上就要节后返工了,顾问老师也早已回到了温暖的广州。与一位同城的学员相聚在老广州的一个茶楼中,喝起了下午茶。面对各式的广式茶点,在淡淡的茶…

C++并发编程 -3.同步并发操作

本文介绍如何使用条件变量控制并发的同步操作、C 并发三剑客,函数式编程 一.条件变量 1.概念 C条件变量(condition variable)是一种多线程编程中常用的同步机制,用于线程间的通信和协调。它允许一个或多个线程等待某个条件的发生…

迷失在前端框架中的初级开发者,总觉得大厦要从二层开始建

知乎有人提问:现在是框架主导前端时代,还有必要学习Html,CSS和JavaScript吗?我看很愕然,框架可以节省力气,难道都可以替代前端基础了吗? 一、起因 因为贝格前端工场的主营业务就是前端开发&…

【中英双语】OpenAI Sora文本转视频模型的技术分析!全新的AI视频叙事时代即将到来!

大家好,我是木易,一个持续关注AI领域的互联网技术产品经理,国内Top2本科,美国Top10 CS研究生,MBA。我坚信AI是普通人变强的“外挂”,所以创建了“AI信息Gap”这个公众号,专注于分享AI全维度知识…

Shellcode免杀对抗(C/C++)

Shellcode C/C免杀,绕过360安全卫士、火绒安全、Defender C/C基于cs/msf的上线 首先是测试一下shellcode上线,主要是俩种方法 测试环境 攻击机:kali2023 靶机:win10 msf方法 首先是启动msf msfconsole 然后msf生成一个sh…

【C语言】linux内核tcp/ip协议代码

一、linux内核tcp/ip协议源码有哪些? Linux内核中实现TCP/IP协议栈的源代码主要位于内核源码树的net/ipv4和net/ipv6目录下,针对IPv4和IPv6协议。不单是TCP/IP协议,还包含了UDP以及其他相关的网络层协议实现。 这里是一些与TCP/IP协议栈相关…

云计算基础-存储虚拟化(深信服aSAN分布式存储)

什么是存储虚拟化 分布式存储是利用虚拟化技术 “池化”集群存储卷内通用X86服务器中的本地硬盘,实现服务器存储资源的统一整合、管理及调度,最终向上层提供NFS、ISCSI存储接口,供虚拟机根据自身的存储需求自由分配使用资源池中的存储空间。…

对账中心系统架构设计与实现的实践总结

随着数字化时代的到来,越来越多的企业开始使用对账中心系统来管理其财务交易。对于一个成功的对账中心系统,其架构设计和实现非常关键。本文将探讨对账中心系统架构设计与实现的重要性、关键原则和实施过程中需要考虑的要点,帮助企业构建强大…

模型训练 —— AI算法初识

一、背景 AI算法中模型训练的主要目的是为了让机器学习算法从给定的标注数据中学习规律、特征和模式,并通过调整模型内部参数,使模型能够对未见过的数据进行准确预测或决策。具体来说: 1. **拟合数据**:模型通过训练来识别输入数…

【Spring篇】 项目加盐加密处理

目录 1. MD5 加密算法 2. 加盐加密流程 3. Spring Security 实现加盐加密 1. 添加 Spring Security 框架 2. 关闭 Spring Security 认证 3.实现加盐加密 1. MD5 加密算法 MD5 是 Message Digest Algorithm 的缩写,译为信息摘要算法,它是 Java …

QGIS004:【08图层工具箱】-导出到电子表格、提取图层范围

摘要:QGIS图层工具箱常用工具有导出到电子表格、提取图层范围等选项,本文介绍各选项的基本操作。 实验数据: 链接:https://pan.baidu.com/s/1ZK4_ShrQ5BsbyWfJ6fVW4A?pwdpiap 提取码:piap 一、导出到电子表格 工具…

【Web】CTFSHOW java刷题记录(全)

目录 web279 web280 web281 web282 web283 web284 web285 web286 web287 web288 ​web289 web290 web291 web292 web293 web294 web295 web296 web297 web298 web299 web300 web279 题目提示 url里告诉我们是S2-001 直接进行一个exp的搜 S2-001漏洞分析…

文件夹删不掉,显示在另一个文件中打开怎么办

问题: 一、想要删掉这个文件夹,却因为文件夹中的文件打开了删不掉,这里我因为做的测试,所以是知道打开了什么 二、一般情况下文件比较多时,是不知道打开了什么的,长这个样子 解决: 一、打开任…

JAVA面试题并发篇

1. 线程状态 要求 掌握 Java 线程六种状态 掌握 Java 线程状态转换 能理解五种状态与六种状态两种说法的区别 六种状态及转换 分别是 新建 当一个线程对象被创建,但还未调用 start 方法时处于新建状态 此时未与操作系统底层线程关联 可运行 调用了 start 方法…

初识数据库:探索数据的世界

初识数据库:探索数据的世界 1. 什么是数据库?2. 数据库的类型2.1 关系型数据库(RDBMS)2.2 非关系型数据库(NoSQL) 3. 为什么使用数据库?4. 如何选择合适的数据库?5. 结语 在信息技术…