3D目标检测数据集——Waymo数据集

Waymo数据集簡介


发布首页:
https://waymo.com/open/
论文:
https://openaccess.thecvf.com/content_CVPR_2020/papers/Sun_Scalability_in_Perception_for_Autonomous_Driving_Waymo_Open_Dataset_CVPR_2020_paper.pdf
github:
https://github.com/waymo-research/waymo-open-dataset.git

Waymo Open Dataset是Waymo公司为了促进自动驾驶技术、机器感知和相关领域的研究而公开发布的一个大型数据集。该数据集包含了Waymo自动驾驶车队在多个城市和郊区环境中收集的高分辨率传感器数据,涵盖了白天和夜晚、晴天和雨天等多种天气和光照条件下的驾驶场景。
Waymo 数据集包含 3000 段驾驶记录,时长共16.7小时,平均每段长度约为 20 秒。 整个数据集一共包含 60 万帧,共有大约 2500万3D 边界框、2200 万2D 边界框。 

数据采集传感器规格


  使用五个激光雷达传感器和五个高分辨率针孔摄像头进行数据采集。我们限制激光雷达数据的范围,并为每个激光脉冲的前两次返回提供数据。表2包含我们的激光雷达数据的详细规格。相机图像是通过滚动快门扫描拍摄的,精确的扫描模式可能会因场景而异。所有相机图像都被下采样并从原始图像中裁剪;表3提供了摄像机图像的规格。与数据集相关的传感器布局见图1。

1736736985268_19353ACB-231F-4211-8DC9-DDD647259655.png


表3. 前(F)、左前(FL)、右前(FR)、左侧(SL)、右侧(SR)摄像头的摄像头规格。图像大小反映了裁剪和下采样原始传感器数据的结果。摄像机水平视野(HFOV)作为相机传感器帧x-y平面中x轴的角度范围提供(图1)。

5f080676b619b222507757bfc9e6e629.png


坐标系


  所有坐标系都遵循右手规则,数据集包含在运行段内任意两个帧之间转换数据所需的所有信息。
  全局帧在车辆运动之前设置。它是一个东北向上的坐标系:向上(z)与重力向量对齐,正向上;东(x)点沿纬度线直接向东;北(y)指向北极。
  车辆帧随车辆移动。其x轴向前为正,y轴向左为正,z轴向上为正。车辆姿态定义为从车辆帧到全局帧的4x4变换矩阵。全局帧可以用作不同车辆帧之间变换的代理。在该数据集中,近帧之间的变换非常准确。
  为每个传感器定义了传感器帧。它表示为4x4变换矩阵,将数据从传感器帧映射到车辆帧。这也被称为“外在”矩阵。
  LiDAR传感器帧的z指向上。x-y轴取决于激光雷达。

image.png



  相机传感器帧放置在镜头的中心。x轴指向镜头外的镜筒。z轴指向上。y/z平面与图像平面平行。
  图像帧是为每个相机图像定义的2D坐标系+x是沿着图像宽度(即从左侧开始的列索引),+y是沿着图像高度(即从顶部开始的行索引)。原点位于左上角。
  LiDAR球面坐标系基于LiDAR传感器帧中的笛卡尔坐标系。LiDAR笛卡尔坐标系中的点(x,y,z)可以通过以下方程唯一地转换为LiDAR球面坐标系中(距离、方位角、倾角)的元组:


真值标签


  对于任何标签,将长度、宽度和高度分别定义为沿x轴、y轴和z轴的大小。数据集中对汽车、行人、交通标志、自行车人员进行了详细标 注。
        对于激光雷达数据,将每一个物体标注为7自由度3D bbox : ( cx , cy , cz , l , w , h , θ ) 。其中cx,cy,cz表示为bbox中心 坐标,l,w,h表示为物体长宽高,θ表示为物体偏航角,此外对于每一个物体还标注了一个唯一的追踪ID编号。
        图像标注中将每一个物体标注为4自由度2D bbox:(cx,cy,l,w) ,其中cx,cy表示为bbox中心图像坐标,l表示为物体长度,w 表示为物体宽度。
此外,还将标注物体划分为了两个难度:LEVEL_2为物体对应激光雷达点数少于5个,其余则划分为LEVEL_1。


传感器数据


  LiDAR数据在该数据集中被编码为距离图像,每个LiDAR返回一个;提供了前两次返回的数据。
距离图像格式与滚动快门相机图像相似,从左到右逐列填充。每个距离图像像素对应于激光雷达回波。高度和宽度由LiDAR传感器帧中倾斜和方位角的分辨率确定。提供每个距离图像行的每个倾斜。行0(图像的顶行)对应于最大倾斜。列0(图像的最左列)对应于负x轴(即,向后方向)。图像的中心对应于正x轴(即,正向)。需要进行方位角校正,以确保距离图像的中心与正x轴相对应。
  距离图像中的每个像素都包含以下属性。图4展示了一个示例距离图像。

1736739297255_82245B69-0E23-45d0-8844-7D779C123020.png


距离:LiDAR传感器帧中LiDAR点与原点之间的距离。
强度:表示产生激光雷达点的激光脉冲返回强度的测量值,部分基于激光脉冲撞击目标的反射率。
伸长率:激光脉冲的伸长率超过其标称宽度。例如,长脉冲延长可以指示激光反射可能被涂抹或折射,从而使返回脉冲在时间上被拉长。
无标签区域:该字段指示LiDAR点是否属于无标签区域,即标记时忽略的区域。
车辆姿态:捕捉激光雷达点时的姿态。
相机投影:我们提供精确的LiDAR点对相机图像投影,并对滚动快门效果进行补偿。图5显示了LiDAR点可以通过投影精确地映射到图像像素。

同步精度计算如下:



其中,camera_center_time是图像中心像素的曝光时间;
frame_start_time是此数据帧的开始时间;
camera_center_offset是每个相机传感器帧的+x轴相对于车辆向后方向的偏移;
camera_center_offset为90°对于SIDE_LEFT相机,90°+ 45° 对于FRONT_LEFT相机等;
所有相机的同步精度见图3。同步误差的范围为[-6ms,7ms],置信度为99.7%,[-6ms、8ms],置信率为99.9995%。
相机图像:是JPEG压缩图像。滚动快门定时信息被提供给每个图像。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/953347.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Mysql--运维篇--空间管理(表空间,索引空间,临时表空间,二进制日志,数据归档等)

MySQL的空间管理是指对数据库存储资源的管理和优化。确保数据库能够高效地使用磁盘空间、内存和其他系统资源。良好的空间管理不仅有助于提高数据库的性能,还能减少存储成本并防止因磁盘空间不足导致的服务中断。MySQL的空间管理涉及多个方面,包括表空间…

STM32之LWIP网络通讯设计-下(十五)

STM32F407 系列文章 - ETH-LWIP(十五) 目录 前言 一、软件设计 二、CubeMX实现 1.配置前准备 2.CubeMX配置 1.ETH模块配置 2.时钟模块配置 3.中断模块配置 4.RCC及SYS配置 5.LWIP模块配置 3.生成代码 1.main文件 2.用户层源文件 3.用户层头…

Gateway 网关

1.Spring Cloud Gateway Spring cloud gateway是spring官方基于Spring 5.0、Spring Boot2.0和Project Reactor等技术开发的网关,Spring Cloud Gateway旨在为微服务架构提供简单、有效和统一的API路由管理方式,Spring Cloud Gateway作为Spring Cloud生态…

数据结构:栈(Stack)和队列(Queue)—面试题(二)

1. 用队列实现栈。 习题链接https://leetcode.cn/problems/implement-stack-using-queues/description/描述: 请你仅使用两个队列实现一个后入先出(LIFO)的栈,并支持普通栈的全部四种操作(push、top、pop 和 empty&a…

在 .NET 9 中使用 Scalar 替代 Swagger

前言 在.NET 9发布以后ASP.NET Core官方团队发布公告已经将Swashbuckle.AspNetCore(一个为ASP.NET Core API提供Swagger工具的项目)从ASP.NET Core Web API模板中移除,这意味着以后我们创建Web API项目的时候不会再自动生成Swagger API文档了…

双模充电桩发展前景:解锁新能源汽车未来的金钥匙,市场潜力无限

随着全球能源转型的浪潮席卷而来,新能源汽车行业正以前所未有的速度蓬勃发展,而作为其坚实后盾的充电基础设施,特别是双模充电桩,正逐渐成为推动这一变革的关键力量。本文将从多维度深入剖析双模充电桩的市场现状、显著优势、驱动…

Notepad++上NppFTP插件的安装和使用教程

一、NppFTP插件下载 图示是已经安装好了插件。 在搜索框里面搜NppFTP,一般情况下,自带的下载地址容易下载失败。这里准备了一个下载连接:Release v0.29.10 ashkulz/NppFTP GitHub 这里我下载的是x86版本 下载好后在nodepad的插件里面选择打…

Mysql--运维篇--备份和恢复(逻辑备份,mysqldump,物理备份,热备份,温备份,冷备份,二进制文件备份和恢复等)

MySQL 提供了多种备份方式,每种方式适用于不同的场景和需求。根据备份的粒度、速度、恢复时间和对数据库的影响,可以选择合适的备份策略。主要备份方式有三大类:逻辑备份(mysqldump),物理备份和二进制文件备…

在 Safari 浏览器中,快速将页面恢复到 100% 缩放(也就是默认尺寸)Command (⌘) + 0 (零)

在 Safari 浏览器中,没有一个专门的快捷键可以将页面恢复到默认的缩放比例。 但是,你可以使用以下两种方法快速将页面恢复到 100% 缩放(也就是默认尺寸): 方法一:使用快捷键 (最常用) Command (⌘) 0 (零…

LLMs之RAG:《EdgeRAG: Online-Indexed RAG for Edge Devices》翻译与解读

LLMs之RAG:《EdgeRAG: Online-Indexed RAG for Edge Devices》翻译与解读 导读:这篇论文针对在资源受限的边缘设备上部署检索增强生成 (RAG) 系统的挑战,提出了一种名为 EdgeRAG 的高效方法。EdgeRAG 通过巧妙地结合预计算、在线生成和缓存策…

探索网络安全:浅析文件上传漏洞

前言 在数字化时代,网络安全已成为我们每个人都需要关注的重要议题。无论是个人隐私保护,还是企业数据安全,网络威胁无处不在。了解网络安全的基本知识和防护措施,对我们每个人来说都至关重要。 网络安全 网络安全并非只是对网…

Therabody 与Garmin联手,共同推进运动恢复与健康科技新突破

本次合作以数据整合、人工智能驱动的数字教练与科学研究为重点,旨在更好地了解科学恢复对运动表现的影响 (2025年1月13日,中国上海)全球健康领导者Therabody宣布与智能手表品牌Garmin佳明建立战略合作关系,共同致力于…

Cloudflare中转Gemini API,国内免费爽用,Gemini编程,音视频,多模态能力测试

视频版: Cloudflare中转顶级大模型API,国内免费爽用,Gemini编程,音视频,多模态能力测试 谷歌Gemini是所有一线顶级大模型当中唯一一个API可以免费白嫖的。本期视频,我们借助互联网大善人Cloudflare来中转一…

腾讯云AI代码助手编程挑战赛-算法小助手

作品简介 一个可以帮助学习计算机各种算法的AI小助手,提升工作效率。 技术架构 使用Html语言完成图形化页面的样式,使用JavaScript语言来操作对应的逻辑代码。 实现过程 1、创建一个界面 2、获取数据 3、添加按钮与功能 4、程序优化调试 开发环境…

网络安全实验之钓鱼网站的制作及技巧

在红队攻击中,除漏洞以外最简洁高效的攻击方式无疑是钓鱼攻击,通过不同的钓鱼方式可达到不同的攻击效果,本次我会分享最常见的钓鱼手段之一的网站钓鱼技术,同时对可实现的攻击操作进行演示。 更多网站钓鱼实验科普,可…

用户注册模块用户校验(头条项目-05)

1 用户注册后端逻辑 1.1 接收参数 username request.POST.get(username) password request.POST.get(password) phone request.POST.get(phone) 1.2 校验参数 前端校验过的后端也要校验,后端的校验和前端的校验是⼀致的 # 判断参数是否⻬全 # 判断⽤户名是否…

linux-28 文本管理(一)文本查看,cat,tac,more,less,head,tail

之前提到过linux的几个重要哲学思想,使用纯文本文件保存软件的配置信息是其中之一,所以大多数情况下,我们对整个系统的操作,都是通过编辑它的配置文件来完成,那也就意味着,处理文本文件是我们作为系统管理员…

JVM面试相关

JVM组成 什么是程序计数器 详细介绍Java堆 什么是虚拟机栈 能不能解释一下方法区? 直接内存相关 类加载器 什么是类加载器,类加载器有哪些 什么是双亲委派模型 类加载过程 垃圾回收 对象什么时候可以被垃圾回收器回收 JVM垃圾回收算法有那些 JVM的分代…

【Unity3D】利用IJob、Burst优化处理切割物体

参考文章: 【Unity】切割网格 【Unity3D】ECS入门学习(一)导入及基础学习_unity ecs教程-CSDN博客 【Unity3D】ECS入门学习(十二)IJob、IJobFor、IJobParallelFor_unity ijobparallelfor-CSDN博客 工程资源地址&…

Armv8/Armv9架构从入门到精通-介绍

CSDN学院课程连接:https://edu.csdn.net/course/detail/39573 1 讲师介绍 拥有 12 年手机安全、汽车安全、芯片安全开发经验,擅长 Trustzone/TEE/ 安全的设计与开发,对 ARM 架构的安全领域有着深入的研究和丰富的实践经验,能够…