目标检测数据集 - PASCAL VOC2012

文章目录

    • 1. PASCAL VOC2012
    • 2. 标注自己的数据集

1. PASCAL VOC2012

PASCAL VOC挑战赛(The PASCAL VIsual Object Classes)是一个世界级的计算机视觉挑战赛,PASCAL全称:Pattern Analysis,Statical Modeling and Computational Learning,是一个由欧盟资助的网络组织。PASCAL VOC挑战赛主要包括以下几类:图像分类(Object Classification),目标检测(Object Detection),目标分割(Object Segmentation),动作识别(Action Classification)等。

在这里插入图片描述

Classification and detection

在这里插入图片描述

Segmentation

在这里插入图片描述

Action classification

在这里插入图片描述

Person layout

在这里插入图片描述

PASCAL VOC2012下载链接:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/

进入首页,在目录Contents下找到 Development Kit,进入后,点击Download the training/validation data (2GB tar file)即可下载。

测试集下载链接:http://host.robots.ox.ac.uk:8080/eval/downloads/VOC2012test.tar

PASCAL VOC2012针对分类与目标检测,共有20个类别。

在这里插入图片描述

目录结构

在这里插入图片描述

在这里插入图片描述

在Annotations中,每个图像就对应一个XML文件,如:

<annotation>
	<folder>VOC2012</folder>  <!-- 文件夹 -->
	<filename>2007_000187.jpg</filename> <!-- 文件名称 -->
	<source>  <!-- 数据来源 -->
		<database>The VOC2007 Database</database>
		<annotation>PASCAL VOC2007</annotation>
		<image>flickr</image>
	</source>
	<size>  <!-- 图像的宽度、高度、通道数 -->
		<width>500</width>
		<height>375</height>
		<depth>3</depth>
	</size>
	<segmented>1</segmented>  <!-- 图像是否可进行图像分割 -->
	<object>  <!-- 图像中的目标 -->
		<name>tvmonitor</name>  <!-- 目标的类别 -->
		<pose>Frontal</pose>
		<truncated>1</truncated>  <!-- 目标是否被截断 在我们自己标注图像时,当我们标注的目标在图像边缘附近,该属性就会为1 -->
		<difficult>0</difficult>  <!-- 检测的难度 -->
		<bndbox>  <!-- 边界框左上角,右下角的坐标 -->
			<xmin>1</xmin>
			<ymin>95</ymin>
			<xmax>240</xmax>
			<ymax>336</ymax>
		</bndbox>
	</object>
</annotation>

所以,在我们后面读取数据集的时候,就要来解析XML文件。

对于目标检测,我们主要会用到ImageSets下,Main目录中的内容。主要涉及到train.txtval.txttrainval.txt这三个文件。

trainval.txt是将train.txtval.txt融合在一起了。train.txtval.txt是互斥的。

此外,在Main文件夹下,还包含其他的txt文件,如boat_train.txtboat_val.txt等,这是针对单个物体的文件,如在boat_train.txt文件中:

2008_000008 -1
2008_000148  1
2008_000191  0

其中,2008_000008这种是图像的名称。-1代表是该图像中没有船,0代表船这个目标检测起来是有困难的,1代表存在有船这个目标。

载入图像信息流程(针对目标检测)

1.读入Main文件夹下的train.txt文件,获取每一行信息(即每一个图像的名称)

2.根据图像的名称,到Annotations目录下,找到对应的xml文件

3.解析xml文件

4.根据图像的名称,到JPEGImages目录下,找到对应的图像文件,载入内存


2. 标注自己的数据集

图像标注软件:LabelImgLabelme

推荐使用:LabelImg,可以生成xml文件。Labelme主要生成的是JSON文件。

安装LabelImg

pip install labelImg

简单使用流程:

在这里插入图片描述

  • 打开项目文件夹,->data->predefined_classes.txt修改标注类别信息

在这里插入图片描述

  • 打开软件

    启动命令:

    # labelimg 图像文件夹路径 类别文件
    labelimg labelme ./image ./classes.txt 
    

在这里插入图片描述

  • 设置图像文件所在目录,以及标注文件保存目录

    点击改变存放目录,来设置标注文件保存目录。

在这里插入图片描述

  • 标注图像,并保存

    点击创建区块,来进行绘制图框

在这里插入图片描述

然后,进行绘制,并且选取类别

在这里插入图片描述

如果认为,该目标检测起来是有难度的,则进行勾选

在这里插入图片描述

全部标注完成后,点击保存,这样标注信息文件便保存至我们指定的保存目录中了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/338771.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

MySQL的执行流程

一、MySQL的执行流程 MySQL架构分为Server层、存储引擎&#xff0c;其中Server层又分为连接器、查询缓存、分析器、优化器执行器五个部分。当客户端发送请求后依次需要经过 处理请求、查询缓存、语法解析、查询优化、存储引擎部分。 1. 连接器 负责维持和管理连接&#xff…

深度学习常用代码总结(k-means, NMS)

目录 一、k-means 算法 二、NMS 一、k-means 算法 k-means 是一种无监督聚类算法&#xff0c;常用的聚类算法还有 DBSCAN。k-means 由于其原理简单&#xff0c;可解释强&#xff0c;实现方便&#xff0c;收敛速度快&#xff0c;在数据挖掘、数据分析、异常检测、模式识别、金…

资产及价值导入

文章目录 1 Introduction2 Code3 Summary 1 Introduction We will implement the following fuction for importing asset value . In the code we introduce that how to transfer value for BAPI. 2 Code DATA: key TYPE bapi1022_key,generaldata …

【MYSQL】存储引擎MyISAM和InnoDB

MYSQL 存储引擎 查看MySQL提供所有的存储引擎 mysql> show engines; mysql常用引擎包括&#xff1a;MYISAM、Innodb、Memory、MERGE 1、MYISAM&#xff1a;全表锁&#xff0c;拥有较高的执行速度&#xff0c;不支持事务&#xff0c;不支持外键&#xff0c;并发性能差&#x…

二层交换机和三层交换机

二层交换机&#xff1a;将源mac和端口进行转发&#xff0c;是同一个网段进行通信的&#xff0c;不能实现路由转发&#xff0c;若想跨网段则需要接入一个路由器 如&#xff1a;pc1 192.168.1.1 与 pc2 192.168.1.2通信需要经过二层交换机&#xff0c;二层交换机不能配置ip的&am…

Linux ---- 小玩具

目录 一、安装&#xff1a; 1、佛祖保佑&#xff0c;永不宕机&#xff0c;永无bug 2、小火车 3、艺术字和其它 天气预报 艺术字 4、会说话的小牦牛 5、其他趣味图片 我爱你 腻害 英雄联盟 帅 忍 龙 你是猪 福 好运连连 欢迎 加油 想你 忘不了你 我错了 你…

【差分数组】【图论】【分类讨论】【整除以2】100213按距离统计房屋对数目

作者推荐 【动态规划】【数学】【C算法】18赛车 本文涉及知识点 差分数组 图论 分类讨论 整除以2 LeetCode100213按距离统计房屋对数目 给你三个 正整数 n 、x 和 y 。 在城市中&#xff0c;存在编号从 1 到 n 的房屋&#xff0c;由 n 条街道相连。对所有 1 < i < n…

华为机考入门python3--(0)模拟题2-vowel元音字母翻译

分类&#xff1a;字符串 知识点&#xff1a; 字符串转list&#xff0c;每个字符成为list中的一个元素 list(string) 字符串变大小写 str.upper(), str.lower() 题目来自【华为招聘模拟考试】 # If you need to import additional packages or classes, please import …

C语言实现简单的扫雷游戏

目录 1 -> test.c 2 -> game.c 3 -> game.h 1 -> test.c #define _CRT_SECURE_NO_WARNINGS 1#include "game.h"void menu() {printf("************************************\n");printf("********* 1.play ********\n&quo…

多线程编程1

一、线程的引入 上节&#xff0c;我们介绍了进程的概念&#xff0c;以及操作系统内核是如何管理进程的&#xff08;描述组织&#xff09;&#xff0c;PCB中的核心属性有哪些&#xff0c; 引入进程这个概念&#xff0c;最主要的目的&#xff0c;就是为了解决“并发编程”这样的…

Redis常见缓存问题

目录 缓存穿透 造成缓存穿透的原因 缓存穿透问题解决方案 1、缓存空对象返回 2、布隆过滤器 缓存失效(击穿) 缓存雪崩 热点缓存key重建优化 缓存与数据库双写不一致 1、双写不一致情况 2、读写并发不一致 解决方案 缓存穿透 缓存穿透是指查询一个根本不存在的数据&…

通过代理如何调通openai的api

调通openai的api 一、前提二、通过curl调通openai的api三、通过python调通openai的api 一、前提 会魔法上网本地运行代理软件&#xff0c;知道端口号&#xff08;如1081&#xff09;。 127.0.0.1:1081二、通过curl调通openai的api 如果在国外&#xff0c;没有qiang&#xff…

AI大模型开发架构设计(3)——如何打造自己的大模型

文章目录 如何打造自己的大模型1 新时代职场人应用AIGC的5重境界2 人人需要掌握的大模型原理职场人都能听懂的大语音模型的训练过程职场人都能听得懂的大语言模型的Transformer推理过程 3 如何构建自己的大模型需要具备三个方面的能力LangChain是什么&#xff1f;LangChain主要…

【音视频】基于ffmpeg对视频的切割/合成/推流

背景 基于FFmpeg对视频进行切割、合成和推流的价值和意义在于它提供了一种高效、灵活且免费的方式来实现视频内容的定制、管理和分发。通过FFmpeg&#xff0c;用户可以轻松地剪辑视频片段&#xff0c;根据需要去除不必要的部分或提取特定时间段的内容&#xff0c;从而优化观看…

【数据库原理】(37)Web与数据库

随着网络的高速发展和网络服务的日趋完善&#xff0c;网络上的信息量呈几何级数增长。为了有效地组织、存储、管理和使用网上的信息&#xff0c;数据库技术被广泛地应用于网络领域。特别是在Internet上&#xff0c;已建立了数以万计的网站&#xff0c;其中大中型网站的后台大多…

链表中倒数第k个结点(附带源码)

目录 代码部分&#xff1a; 核心&#xff1a;看图 代码部分&#xff1a; struct ListNode* FindKthToTail(struct ListNode* pListHead, int k ) {// write code here// write code hereif (k 0){return NULL;}else{struct ListNode* slow pListHead, * fast pListHead;//…

一个非常流行的R语言调色板:RColorBrewer

R 语言有许多非常优秀的调色板&#xff0c;本文就介绍一个非常流行的&#xff0c;我也经常在用的调色板 R 包&#xff1a;RColorBrewer。 安装 install.packages("RColorBrewer") 加载 library(RColorBrewer) library(knitr) 初探 ?RColorBrewer 在帮助页面可以看到…

雨云VPS使用我的世界整合包开服教程,Pokehaan Craft 2整合包服务器搭建教程

Minecraft整合包服务器搭建教程&#xff0c;宝可梦/神奇宝贝整合包&#xff08;Pokehaan Craft 2&#xff09;开服教程。 其他整合包也可以参考此教程。要看这个整合包的游戏截图可以翻到文章最底下。 5分钟免费开一个MC服&#xff01;雨云免费服务器领取教程&我的世界开…

开源项目盘点-学习类

1&#xff0c;freeCodeCamp 地址&#xff1a;https://github.com/freeCodeCamp/freeCodeCamp 描述&#xff1a;一个程序员学习网站&#xff0c;里面有全栈开发、机器学习的相关知识&#xff0c;是完全免费的&#xff0c;该网站有上千道编码挑战题来帮助你来练习你的技能。 提…

springboot集成easypoi

easypoi,主打的功能就是容易,通过简单的配置&#xff0c;就可以方便的写出Excel导出,Excel模板导出,Excel导入,Word模板导出 pom导入依赖 <dependencies><dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-star…