【数据集】2023自动驾驶开源数据集-学习笔记

文章目录

      • 1. 自动驾驶有哪些公开数据集
      • 2. 预测相关的数据集有哪些

1. 自动驾驶有哪些公开数据集

  • waymo open dataset

    • 适应任务:
      • 域适应,2D追踪,2D检测,3D追踪,3D检测,实时2D检测,实时3D检测,交互预测,动作预测
    • 数据描述:
      • (1) 全天候全光照;
      • (2) Perception Dataset中包括1950段20s的 1920x1280px的视频和对应的点云数据,采样频率为10Hz;标签为Vehicles, Pedestrians, Cyclists, Signs 四类,有2D & 3D bounding box标注,在视频和点云数据集上都有;
      • (3) Motion Dataset有100,000段总计超过200,000,000帧的数据,但是好像只有激光雷达采集的数据和对应的地图还原结果。标签为Vehicles, Pedestrians, Cyclists三类;
      • (4) 大小有上百G
    • 传感器方案:

 

  • Cityscapes
    • 适应任务:
      • 面向分割方面的任务(语义/实例/全景分割)
    • 数据描述:
      • (1) 城市景观数据集,主打城市内的交通场景,可能是这一领域最好的数据集
      • (2) 50座德国及周边国家的城市中春夏秋的数据采集。图像中包含 5000 fine pixel-level annotations和20000 coarse pixel-level annotation。标注分结果分为8大类下的30类标签,简化版标签中含有19类

 

  • CADC
    • 适应任务:
      • 雪天驾驶数据集,场景极具针对性
    • 数据描述:
      • (1) 原始数据的类型很全,美中不足是标注的数据类型太少,只有3D bounding box,标签类型也比较粗糙;采集路线固定,场景较为单调
      • (2) 大小500G+100G
    • 传感器方案:

 

  • nuScenes

    • 适应任务:
      • 提供了Detection, Tracking, Prediction, Lidar Segmentation四类任务的挑战榜,还可以支持语义分割,实例分割,多模态数据融合,端对端决策等问题的研究
    • 数据描述:
      • (1) 全天候全光照数据集
      • (2) 2019年3月正式发布完整版nuScenes datasdet。1000个场景,每个场景约20秒。750 for train + 150 for validation,150 for test。包括图像、雷达、激光雷达数据,全部都是360度视野。由于相机采样频率为12Hz,激光雷达采样频率为20Hz,有一些激光雷达数据没有对应照片帧。train+val有标记,标记的关键帧采样频率为2Hz。标记信息包括2D bounding box,语义分割,实例分割。目标分为23类
      • (3) 2020年先后补充了地图、车辆总线数据、和激光雷达的3D语义分割。地图中包括11类道路信息。激光雷达的分割仅针对750 for train + 150 for validation中的关键帧(应该是与2D的标注信息相对应的),分了32类语义标签
      • (4) 2020年8月发布了nuImages v1.0,仅包含图像信息,93k=67k training+16k val+10k test
      • (5) 总数据量在300GB以上
    • 传感器方案:

 

  • Mapillary Vistas
    • 适应任务:
      • 主要为语义分割和实例分割服务的数据集
    • 数据描述:
      • (1) 目前唯一全球范围的自动驾驶数据集
      • (2) 全天候全光照
      • (3) 本质上属于“众筹”数据集。采集设备参数不统一,传感器安装方案不明,但应该不影响使用

 

  • Lyft L5

    • 适应任务:
      • 感知任务和预测任务
    • 数据描述:
      • (1) 数据构成基本与nuScenes一致
      • (2) 业内最大的自动驾驶公共数据集, 涵盖了Prediction Dataset及Perception Dataset
      • (3) Prediction Dataset涵盖了自动驾驶测车队在Palo Alto沿线遇到的各类目标,如Cars,Cyclists和Pedestrians
      • (4) Perception Dataset则涵盖了自动驾驶车队装置的LiDARs和摄像机采集的真实数据,并通过人工方式标注了大量的3D边界框
    • 传感器方案:

 

  • Oxford RobotCar
    • 适应任务:
      • 目前可以用这个数据集练一练多模态的联合标定任务
    • 数据描述:
      • (1) 全天候全光照
      • (2) 数据集只提供了图像、雷达、激光雷达和GPS/IMU的原始数据,并没有进行额外的标注
      • (3) 数据质量还需观望

 

  • BDD100K
    • 适应任务:
      • 官方推荐使用此数据集的十个自动驾驶任务:图像标注、道路检测、可行驶区域分割、交通参与物检测、语义分割、实例分割、多物体检测追踪、多物体分割追踪、域适应和模仿学习
    • 数据描述:
      • (1) 全天候全光照大型数据集,包含1,100小时的HD录像、GPS/IMU、时间戳信息,100,000张图片的2D bounding box标注,10,000张图片的语义分割和实例分割标注、驾驶决策标注和路况标注
      • (2) 总数据量接近2TB

 

  • A2D2

    • 适应任务:
      • 此数据集支持物体检测、物体追踪、语义理解、基于端对端学习的驾驶决策的研究; SLAM
    • 数据描述:
      • (1) 来自Audi
      • (2) 全天候全光照,提供了图像、点云、GPS、时间戳、车辆总线的原始数据,语义分割、实例分割和3D bounding box的标记信息
      • (3) 总数据量为2.3TB
    • 传感器方案:

 

  • Argoverse

    • 适应任务:
      • 3D追踪和动作预测
    • 数据描述:
      • (1) 全天候全光照
      • (2) 提供了360度的视频和点云信息,并根据点云重建了地图。标注了视频和点云中的3D bounding box。3D追踪的数据集包含113段15-30秒的视频,动作预测中包含323,557段5秒的视频(总计320小时)
      • (3) 共113个场景,室外,包括USA,Pennsylvania,Miami,Florida等
      • (4) 共15类,包括Vehicle,Pedestrian,Stroller,Animal等
      • (5) 数据量具体数值不明,预计几百GB
    • 传感器方案:

 

  • Argoversev2
    • 数据描述:
      • (1) 首批包含用于机器学习和计算机视觉研究的高清地图的数据发布之一
      • (2) Argoverse 2包括四个开源数据集:
        • ① 传感器数据集: 包含1000个带有激光雷达、立体图像和环形摄像头图像的3D注释场景。该数据集改进了Argoverse 1 3D跟踪数据集
        • ② 运动预测数据集: 包含250000个场景,其中包含许多对象类型的轨迹数据。该数据集改进了Argoverse 1运动预测数据集
        • ③ 激光雷达数据集: 包含20000个未标记的激光雷达序列
        • ④ 地图更改数据集: 包含1000个场景,其中200个场景描述了真实世界的高清地图更改

 

  • ApolloScape

    • 适应任务:
      • 交通场景理解(视频语义分割),车辆实例检测,道路分割,自定位,轨迹预测,目标检测与追踪,立体场景还原,场景补全
    • 传感器方案:

 

  • D^2-city
    • 适应任务:
      • 适用于检测和追踪任务
    • 数据描述:
      • 很粗糙、很差

 

  • CULane
    • 适应任务:
      • 针对道路检测的数据集
    • 数据描述:
      • (1) 包含了55个小时133,235帧的图像数据和道路标注,标注形式和不同交通场景的数据比例如下图所示
      • (2) 数据量不是很大,模态较为单一,总共有50GB
      • (3) 数据集可用性不强,更像是为了保证文章完整性公布的

 

  • DBNet

    • 适应任务:
      • 针对基于端对端学习的驾驶决策任务
    • 数据描述:
      • (1) 厦门大学和上海交通大学合作采集的数据集
      • (2) 数据集包括视频、点云、GPS和车辆总线数据,需要注册后下载。采集了约200km的数据,2018年挑战赛的数据总量大约500GB
    • 传感器方案:

 

  • KAIST Multispectral
    • 适应任务:
      • 物体检测、视觉增强、深度估计等CV任务
    • 数据描述:
      • (1) 少见的提供了热像仪数据的数据集
      • (2) 数据集包含95k张图像+热图

 

  • DR(eye)VE
    • 适应任务:
      • 通过预测注意力(图像不同区域的权重)辅助实现驾驶决策
    • 数据描述:
      • (1) 数据体量不算大,任务也比较单一小众,感觉对现在的自动驾驶研究帮助不大

 

  • KITTI

    • 适应任务:
      • 环境重建、光流、深度补全/预测、SLAM、2D/3D物体检测、2D/3D物体追踪、语义/场景分割; 端对端学习的决策任务
    • 传感器方案:

 

  • Caltech Pedestrian
    • 适应任务:
      • 只干了一件事,就是行人检测
    • 数据描述:
      • (1) 整个数据集包括10小时的640 x 480 30 Hz的视频数据
      • (2) 从实用意义上来说Caltech Pedestrian估计是没有太大用处了

 

  • H3D-HRI-US

    • 适应任务:
      • 3D多目标检测和跟踪
    • 数据描述:
      • (1) 使用3D LiDAR扫描仪收集的大型全环绕3D多目标检测和跟踪数据集
      • (2) 其包含160个拥挤且高度互动的交通场景,在27,721帧中共有100万个标记实例
         
  • Udacity

  • LaRA

  • LISA
     

  • DeepTesla

    • 数据描述:
      • 主要包括tesla在两种不同驾驶模式(human driving和autopilot)下的前置相机录制的视频和车辆的转向控制信号

 

  • Berkeley DeepDrive Video dataset
    • 数据描述:
      • 具有各种注释的大型驾驶视频数据集

 

  • ETH pedestrian dataset
    • 数据描述:
      • 在人满为患的市中心拍摄的立体图像,行人众多

 

  • Occ3D
    • 数据描述:
      • (1)清华大学和英伟达出品,第一个大规模占用栅格benchmark
      • (2) 两个3D占用预测数据集: Occ3D nuScenes + Occ3D Waymo
      • (3) 包含600个用于训练的场景、150个用于验证的场景和150个用于测试的场景,总计40000帧
      • (4) Occ3D Waymo包含798个用于训练的序列,202个用于验证的序列,累积了200000帧

 

  • nuPlan
    • 适应任务:
      • 规划任务
    • 数据描述:
      • 世界上第一个自动驾驶的大规模规划基准

 

  • ONCE (One Million Scenes)
    • 适应任务:
      • 3D物体检测
    • 数据描述:
      • (1) 华为2021发布
      • (2) 100 万个 LiDAR 帧,700 万个相机图像 200 平方公里的驾驶区域,144 个驾驶小时 15k 个完全注释的场景,分为 5 个类别(汽车、公共汽车、卡车、行人、骑自行车的人) 多样化的环境(白天/夜晚、晴天/雨天、城市/郊区)

 

  • YouTube Driving Dataset

    • 数据描述:
      • (1) 第一视图驾驶视频
      • (2) 收集总长度超过120小时的134视频。这些视频涵盖了具有各种天气条件 (晴天,雨天,下雪等) 和区域 (农村和城市地区) 的不同驾驶场景
         
  • OpenLane

    • 适应任务:
      • 场景结构感知和推理
    • 数据描述:
      • (1) 迄今为止第一个真实世界和规模最大的 3D 车道数据集
      • (2) OpenLane 拥有 200K 帧和超过 880K 仔细注释的车道

 

2. 预测相关的数据集有哪些

  • nuScenes, Waymo open, Lyft L5, Argoverse/2, ApolloScape, Occ3D, ETH/UCY

  • 此外还有NGSIM、INTERACTION、TRAF、HighD等数据集也支持预测任务

 


【参考文章】
[1]. 自动驾驶开源数据集汇总
[2]. 自动驾驶数据集汇总
[3]. 自动驾驶数据集全面调研,推荐阅读
[4]. 常用数据集的亮点
[5]. 不同数据集的散装介绍
[6]. 适用不同任务的数据集
[7]. 快速查找已公开的自动驾驶数据集

created by shuaixio, 2024.03.12

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/451732.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入解析Java内存模型

一、背景 并发编程本质问题是:CPU、内存以及IO三者之间的速度差异。CPU速度快于内存、内存访问速度又远远快于IO,根据木桶理论,程序性能取决于最慢的操作,即IO操作。这样会出现CPU和内存交互时,CPU性能无法被充分利用…

使用命令行查看同一局域网内所有ip地址

由于学科实践课程提供的局域网IP扫描软件在本机上运行时,无法扫描出树莓派(可能和防火墙设置有关?),所以记录一种通过命令行查看同一局域网下设备IP地址的方法,以手机热点下查找树莓派IP为例。 Step1&#…

Hive面经

hive原理 Hive 内部表和外部表的区别Hive 有索引吗运维如何对 Hive 进行调度ORC、Parquet 等列式存储的优点数据建模用的哪些模型?1. 星型模型2. 雪花模型3. 星座模型 为什么要对数据仓库分层?使用过 Hive 解析 JSON 串吗sort by 和 order by 的区别数据…

读书笔记之《机器与人》:AI如何重构工作方式和流程?

《机器与人: 埃森哲论新人工智能》作者是【美】保罗•多尔蒂和詹姆斯•威尔逊 ,原作名: Human Machine: Reimagining Work in the Age of AI,2018年出版。 保罗•多尔蒂(PAUL DAUGHERTYH):埃森哲首席技术官和创新官、…

策略迭代和价值迭代

策略迭代价值迭代 策略迭代(Policy Iteration)基本步骤例子:公主的营救 价值迭代(Value Iteration)基本步骤例子:公主的营救 策略迭代与价值迭代的区别实现方式目标收敛速度与其他技术的交互 策略迭代&…

浅谈Redis 的 保护模式(protected-mode)

今天在一台服务器上面部署了redis,发现始终无法用工具远程连接,项目里面是正常的,就是工具不行,防火墙也关闭了.折腾了一会才突然想起来,是不是触发了保护模式. 什么时候触发保护模式protected-mode: 同时满足以下两个: 1.bind未指定ip 2.未配置密码 解决方案: 编辑redis…

Room+ViewModel+LiveData

Room框架支持的LiveData会自动监听数据库的变化,当数据库发生变化的时候,会调用onChanged函数更新UI 1.MainActivity package com.tiger.room2;import android.os.AsyncTask; import android.os.Bundle; import android.util.Log; import android.vie…

红帽认证RHCE好考吗?多长时间能考下来?报名费多少一门?哪些人适合考红帽认证?

一、红帽认证等级 红帽认证考试有三个等级,分别是RHCSA(红帽认证系统管理员),RHCE(红帽认证工程师),RHCA(红帽认证架构师)。RHCA是最高级别的认证。 二、RHCE考试 1、考…

一款好用的AI工具——边界AICHAT(二)

目录 3.11、AI智能在线抠图3.12、AI智能图片增强放大3.13、AI图片擦除3.14、AI图片理解3.15、音频视频网页理解模型3.16、角色扮演3.17、AI文档理解对话3.18、公文写作模式3.19、插件库3.20、AI思维导图3.21、PPT一键生成3.22、音视频生成PPT 本篇博文接上一篇博文 一款好用的…

Singularity(四)| 自定义容器

Singularity(四)| 自定义容器 4.1 Singularity Definition 文件 对于可复制的、高质量的容器,我们应该使用定义文件(Definition File)构建 Singularity 容器 。使用定义文件的方式可以在纯文本文件中描述容器的配置和…

数据集踩的坑及解决方案汇总

数据集踩的坑及解决方案汇总 数据集各种格式构建并训练自己的数据集汇总Yolo系列SSDMask R-CNN报错 NotADirectoryError: [Errno 20] Not a directory: /Users/mia/Desktop/P-Clean/mask-RCNN/PennFudanPed2/labelme_json/.DS_StoreFaster R-CNN数据的格式转换划分数据集设定内…

移掉 K 位数字(LeetCode 402)

文章目录 1.问题描述2.难度等级3.热门指数4.解题思路4.1 暴力法4.2 贪心 单调栈 参考文献 1.问题描述 给你一个以字符串表示的非负整数 num 和一个整数 k,移除这个数中的 k 位数字,使得剩下的整数最小。请你以字符串形式返回这个最小的整数。 示例 1 …

进电子厂了,感触颇多...

作者:三哥 个人网站:https://j3code.cn 本文已收录到语雀:https://www.yuque.com/j3code/me-public-note/lpgzm6y2nv9iw8ec 是的,真进电子厂了,但主人公不是我。 虽然我不是主人公,但是我经历的过程是和主…

Igraph入门指南 6

3、make_系列:igraph的建图工具 按照定义,正则图是指各顶点的度均相同的无向简单图,因为我目前没有找到描述度相等的有向(或自环图)的标准名称,所以在本文中借用一下这个概念,并加上定语有向无…

Android studio SDK Manager显示不全的问题解决

发现SDK Manager中只显示已下载的SDK版本,想下载其他版本下载不到,尝试翻墙也没用,修改host文件成功 在多个地点Ping服务器,网站测速 - 站长工具 输入dl.google.com,进行ping检测。 选择一个地址,比如180.163.150.1…

【深度学习笔记】5_12稠密连接网络(DenseNet)

注:本文为《动手学深度学习》开源内容,部分标注了个人理解,仅为个人学习记录,无抄袭搬运意图 5.12 稠密连接网络(DenseNet) ResNet中的跨层连接设计引申出了数个后续工作。本节我们介绍其中的一个&#xf…

Python学习:基础语法

版本查看 python --version编码 默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串。 特殊情况下,也可以为源码文件指定不同的编码: # -*- coding: cp-1252 -*-标识符 第一个字符必须是字母表中字母或…

Java学习笔记------常用API

Math类 常用方法: 1. publicb static int abs(int a) 获取参数绝对值 2. publicb static double ceil(double a) 向上取整 3. publicb static floor(double a) 向下取整 4.public static int round(float a) 四舍五入 5. publicb static int max…

Vue3全家桶 - VueRouter - 【2】重定向路由

重定向路由 在路由规则数组中,可采用 redirect 来重定向到另一个地址: 通常是将 / 重定向到 某个页面; 示例展示: router/index.js:import { createRouter, createWebHashHistory, createWebHistory } from vue-route…