Yolo图片标注的一些问题

1.标注工具的选择 

在img.net和瑞芯微的双重加持下,现在的计算机视觉识别已经在各行业快速推进。进行自行标注时,首先遇到的问题就是标注工具的选择问题,标注工具不需要自己手工完成——也没有必要。类似这样的通用需求,交给专业的开发人员即可。刚刚试用了几种标注工具,部署异常困难。

国产的某几个标注工具,加QQ群,软件庞大的体积,遂放弃。在yolo的官方网站上,它们推荐的标注工具有三个,其中排名第一的是label-studio,csdn有位同志介绍到它,并且提供了docker:

label-studio docker镜像-CSDN博客

它是开源的工具。如果你已经有python环境,最简单的安装方法只有一行:

pip install label-studio 

安装过程会自行解决依赖项,注意,国内使用时尽量把标注源头移向国内镜像。

 1.1 label-studio的运行和必要的依赖项

运行label-studio也只需要一行:

label-studio

 它会以web服务器的方式工作:

标注可以识别到谁上传了资源,然后谁进行了标注。标注过程非常简便。

1.2 不依赖外网使用时,资源需要安装在redis上

windows环境下能部署整套标注环境,所需的redis:win32 or win64

注意,用redis这类内存数据库继续训练加速,始终会达到更快的速度。

然后在进行训练前,也尽量把训练的资源和结果放在固态盘,尽量加快训练的时间。

1.3 一个工程的极简配置

两处:

1.3.1 Label的配置

1.3.2 存储位置

2 yolo视频图片标记的几点注意事项

  1. 注意要对画面中出现到的所有同类物体进行标准。遗漏标记可能会造成不可预知的后果。

  2. 原始图片推荐使用OBB(Oriented Bounding Box)标记,就是倾斜的边界框,有些算法可以直接对此类标记对象进行处理。即使使用传统的矩形水平框,可以使用python对OBB标记进行转换。使用AABB(Axis-Aligned Bounding Box) 对OBB标记文件进行批量自动转换。

  3. 推荐在Label的选择时,选择为对视频本身进行标注。

    稍稍用Python对导出的标注信息进行处理,就能够生成Yolo标准的静态图片格式。

  4. 然后注意原始图片不需要裁剪规整。不同分辨率的图片,更有助于Yolo的训练。虽然最终的识别仍然是按照特定分辨率进行的。

  5. 视频中截取标注资源时,尽量选择一些画面发生明显变化的关键帧。

  6. 不同角度,如果物体本身有多个种类,或者各个视角呈现明显差异,建议分割为不同的识别对象。

  7. label-studio目前不支持h265视频,可以使用ffmpeg转换:

  8. label-studio进行视频标注时有一个非常棒的功能是提供了两个关键标注帧之间,同一个物体位置的平滑处理。

附录A label-studio 视频标注转换为yolo静态图片标准Python转换程序

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/966983.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

排错 -- 用React.js,Solidity,智能合约构建最新区块链应用

真枪实弹:第一个Web3项目【上集】用React.js,Solidity,智能合约构建最新区块链应用详细教程 构建web跟随b站教程中遇到了很多错误,从今天开始构建完整的应用,在此记录一些排错。 问题情况1:跟随视频后无Src文件 问题情况1解决方法&#xff1…

杂记:下载了BootLoader和APP到程序中无反应

杂记:下载了BootLoader和APP到程序中无反应 是因为采用了printf输出打印。占用了大量堆栈导致程序运行异常。并且没有打开Use MicroLIB库的话会导致无法启动程序。 解决办法: 1、关闭printf打印。 2、如果不关闭printf打印,则加大Heap_Size…

Unet 改进:引入残差模块ResidualBlock

目录 1. ResidualBlock 2. UNet 引入残差模块 Tips:融入模块后的网络经过测试,可以直接使用,设置好输入和输出的图片维度即可 1. ResidualBlock 残差连接(Residual Connection)是深度学习中一种重要的技术,主要用于解决深层网络训练中的梯度消失和网络退化问题。它首次…

对接DeepSeek

其实,整个对接过程很简单,就四步,获取key,找到接口文档,接口测试,代码对接。 获取 KEY https://platform.deepseek.com/transactions 直接付款就是了(现在官网暂停充值2025年2月7日&#xff0…

【基于SprintBoot+Mybatis+Mysql】电脑商城项目之上传头像和新增收货地址

🧸安清h:个人主页 🎥个人专栏:【Spring篇】【计算机网络】【Mybatis篇】 🚦作者简介:一个有趣爱睡觉的intp,期待和更多人分享自己所学知识的真诚大学生。 目录 🚀1.上传头像 -持久…

【大模型】硅基流动对接DeepSeek使用详解

目录 一、前言 二、硅基流动介绍 2.1 硅基流动平台介绍 2.1.1 平台是做什么的 2.2 主要特点与功能 2.2.1 适用场景 三、硅基流动快速使用 3.1 账户注册 3.2 token获取 3.2.1 获取token技巧 四、Cherry-Studio对接DeepSeek 4.1 获取 Cherry-Studio 4.2 Cherry-Stud…

告别2023~2024

时间过得真快,距离上次写作2年多了。2023年~2024年的这两年时光里经历太多人生大事: 房贷,提前还贷买车,全款拿下租房搬家媳妇怀孕,独自照顾,……老人离世开盲盒喜提千金,百岁宴&am…

基于yolov11的阿尔兹海默症严重程度检测系统python源码+onnx模型+评估指标曲线+精美GUI界面

【算法介绍】 基于YOLOv11的阿尔兹海默症严重程度检测系统是一种创新的医疗辅助工具,旨在通过先进的计算机视觉技术提高阿尔兹海默症的早期诊断和病情监测效率。阿尔兹海默症是一种渐进性的神经退行性疾病,通常表现为认知障碍、记忆丧失和语言障碍等症状…

2025我的第二次社招,写在春招之季

先说一个好消息,C那些事 4w star了! 前面断更了一个月,本篇文章就可以看到原因,哈哈。 大家好,我叫光城,腾讯实习转正做后端开发,后去小公司做数据库内核,经过这几年的成长与积累&am…

使用Docker + Ollama在Ubuntu中部署deepseek

1、安装docker 这里建议用docker来部署,方便简单 安装教程需要自己找详细的,会用到跳过 如果你没有安装 Docker,可以按照以下步骤安装: sudo apt update sudo apt install apt-transport-https ca-certificates curl software-p…

Java集合List详解(带脑图)

允许重复元素,有序。常见的实现类有 ArrayList、LinkedList、Vector。 ArrayList ArrayList 是在 Java 编程中常用的集合类之一,它提供了便捷的数组操作,并在动态性、灵活性和性能方面取得了平衡。如果需要频繁在中间插入和删除元素&#xf…

【config目录】SpringBoot应用配置存放的地方

application.properties之前总是存放于默认的resources目录下,现在想想其实是不合适的,上线后其实这个配置是需要更改的,因此我们不要打包到jar包中。 根据SpringBoot应用配置查找规则,如果在jar包中resources目录查找不到的话&a…

洛谷 B3616 【模板】队列

B3616 【模板】队列 - 洛谷 | 计算机科学教育新生态 题目描述 请你实现一个队列(queue),支持如下操作: push(x):向队列中加入一个数 x。pop():将队首弹出。如果此时队列为空,则不进行弹出操作…

布丁扫描:手机扫描的纯净之选

在众多手机扫描软件中,布丁扫描凭借其纯粹的使用体验脱颖而出。它是一款功能强大且完全免费的手机端扫描工具,没有任何广告干扰,用户可以畅享纯净的使用过程。更值得一提的是,布丁扫描从未设置过充值入口,也不会在扫描…

2025 CCF BDCI|“基于TPU平台的OCR模型性能优化”一等奖作品

2024年12月,中国计算机学会在海南博鳌成功举办了第十二届CCF大数据与计算智能大赛(简称2024 CCF BDCI)。本届比赛的算能赛道吸引了1748名选手报名,经过激烈角逐,北京航空航天大学的“常务副SOTA”团队脱颖而出&#xf…

22.[前端开发]Day22-CSS单位-CSS预处理器-移动端视口

1 CSS常见单位详解 CSS中的单位 CSS中的绝对单位( Absolute length units ) CSS中的相对单位( Relative length units ) 1.em: 相对自己的font-size;如果自己没有设置, 那么会继承父元素的font-size 2.如果font-size中…

网站改HTTPS方法

默认的网站建设好后打开的样子那看起来像是钓鱼网站,现在的浏览器特别只能,就是你新买来的电脑默认的浏览器同样也会出现这样“不安全”提示。 传输协议启动了向全球用户安全传输网页内容的流程。然而,随着HTTPS的推出,传输协议通…

MySQL的底层原理与架构

前言 了解MySQL的架构和原理对于很多的后续很多的操作会有很大的帮助与理解。并且很多知识都与底层架构相关联。 了解MySQL架构 通过上面的架构图可以得知,Server层中主要由 连接器、查询缓存、解析器/分析器、优化器、执行器 几部分组成的,下面将主要…

极客说|利用 Azure AI Agent Service 创建自定义 VS Code Chat participant

作者:卢建晖 - 微软高级云技术布道师 「极客说」 是一档专注 AI 时代开发者分享的专栏,我们邀请来自微软以及技术社区专家,带来最前沿的技术干货与实践经验。在这里,您将看到深度教程、最佳实践和创新解决方案。关注「极客说」&a…

艾蒿染色体水平基因组-文献精读111

A chromosome-scale genome assembly of Artemisia argyi reveals unbiased subgenome evolution and key contributions of gene duplication to volatile terpenoid diversity 一项关于艾蒿(Artemisia argyi)的染色体尺度基因组组装揭示了无偏的亚基因…