理想汽车提出3DRealCar:首个大规模3D真实汽车数据集

理想提出3DRealCar,这是第一个大规模 3D 实车数据集,包含 2500 辆在真实场景中拍摄的汽车。我们希望 3DRealCar 可以成为促进汽车相关任务的宝贵资源。

理想汽车提出3DRealCar:首个大规模3D真实汽车数据集!

我们精心策划的高质量3DRealCar数据集的特征。3DRealcar包含各种颜色、汽车类型、品牌的详细注释,甚至汽车解析图。特别是,我们的数据集包含三种汽车表面的照明条件,对现有方法提出了挑战。

3D汽车常用于自动驾驶系统、虚拟/增强现实和游戏。然而,现有的3D汽车数据集要么是合成的,要么质量较差,与高质量的真实世界3D汽车数据集存在很大差距,限制了它们在实际场景中的应用。

在本文中,我们提出了第一个大规模 3D 实车数据集,称为 3DRealCar,它具有三个独特功能。(1)高容量:2,500 辆汽车经过 3D 扫描仪的精心扫描,获得具有真实世界尺寸的汽车图像和点云;(2)高质量:每辆汽车平均在 200 个密集的高分辨率 360 度 RGB-D 视图中捕获,从而实现高保真 3D 重建;(3)高多样性:该数据集包含来自 100 多个品牌的各种汽车,在三种不同的照明条件下收集,包括反光、标准和黑暗。此外,我们为每个实例提供详细的汽车解析图,以促进汽车解析任务的研究。

此外,我们删除了背景点云,并将汽车方向标准化为统一轴,仅在没有背景和可控渲染的汽车上进行重建。我们在 3DRealCar 中的每个照明条件下使用最先进的方法对 3D 重建结果进行基准测试。大量实验表明,3DRealCar 的标准照明条件部分可用于生成大量高质量的 3D 汽车,从而改进与汽车相关的各种 2D 和 3D 任务。值得注意的是,我们的数据集让我们了解到,最近的 3D 重建方法在反射和暗光条件下重建高质量 3D 汽车时面临挑战。

相关链接

论文地址:https://arxiv.org/abs/2406.04875

项目主页:xiaobiaodu.github.io/3drealcar

分布

我们的数据集主要包含六种不同的车型。我们还统计了汽车在各种光照条件下的表现。标准条件意味着汽车光照充足,没有强烈的镜面高光。反射条件意味着汽车有镜面高光。光泽材料给最近的 3D 重建方法带来了巨大的挑战。黑暗条件意味着汽车是在地下停车场拍摄的,光照不太好。每辆车拍摄的图像数量平均为 200 张。视图数量从 50 到 400 不等。我们的数据集包含二十多种颜色,但白色和黑色仍然占据了数据集的大部分。此外,我们还展示了汽车尺寸的分布,包括长度、宽度和高度。

支持的任务

由于我们的数据集提供了 RGB-D 图像、点云、汽车解析地图和详细注释,我们可以在其中执行各种 2D 和 3D 任务。具体来说,我们提供汽车解析地图,表明我们的数据集可用于汽车检测、分割和解析任务。此外,我们捕获的 RGB-D 图像支持深度估计任务。由于我们收集了外观各异的各种车型,研究人员可以使用我们的数据集进行不同车型的领域迁移学习。对于 3D 任务,我们捕获的密集视图和点云可用于 3D 重建、3D 生成、新颖视图合成、车辆点云完成和车辆点云解析。利用重建的 3D 汽车,我们可以使用它们来模拟极端情况,以训练强大的自动驾驶感知系统。

3DRealCar数据集的分布。我们展示了汽车类型的分布,照明条件、捕获的视图、汽车颜色和汽车大小。我们尽力捕捉各种各样的汽车颜色和类型的多样性,我们的数据集。

3D 汽车解析

我们的数据集是第一个提供 3D 汽车解析注释的数据集,用于解析 3D 空间中的汽车组件。 由于我们为 3DRealCar 数据集中的每个实例提供了 2D 汽车解析图,我们可以将 2D 解析图提升到 3D,并将每个组件分割为点云和网格。这些 3D 汽车解析图的主要目的是实现对车辆结构的精确和全面分析,这对于自动驾驶、车辆设计、车辆编辑和虚拟现实模拟等应用至关重要。通过使用这些详细的 3D 解析图,开发人员和研究人员可以改进对象识别算法并增强碰撞检测系统。此外,该数据集有助于训练机器学习模型,以更好地理解汽车部件的空间关系和物理属性,从而实现更先进、更可靠的汽车技术。

论文阅读

3DRealCar:一个野外RGB-D汽车数据集360度视图

摘要

3D 汽车通常用于自动驾驶系统、虚拟/增强现实和游戏。然而,现有的 3D 汽车数据集要么是合成的,要么是低质量的,与高质量的真实世界 3D 汽车数据集存在很大差距,限制了它们在实际场景中的应用。在本文中,我们提出了第一个大规模 3D 真实汽车数据集,称为 3DRealCar,它具有三个独特的特点。

  • 高容量:2,500 辆汽车经过 3D 扫描仪的精心扫描,获得具有真实世界尺寸的汽车图像和点云;

  • 高质量:每辆汽车平均在 200 个密集的高分辨率 360 度 RGB-D 视图中捕获,从而实现高保真 3D 重建;

  • 高多样性:数据集包含来自 100 多个品牌的各种汽车,在三种不同的光照条件下收集,包括反光、标准和黑暗。

此外,我们为每个实例提供了详细的汽车解析图,以促进汽车解析任务的研究。此外,我们删除背景点云并将汽车方向标准化为统一轴,仅在没有背景和可控渲染的汽车上进行重建。我们在 3DRealCar 中的每个照明条件下使用最先进的方法对 3D 重建结果进行基准测试。大量实验表明,3DRealCar 的标准照明条件部分可用于生成大量高质量的 3D 汽车,从而改进与汽车相关的各种 2D 和 3D 任务。值得注意的是,我们的数据集让我们了解到,最近的 3D 重建方法在反射和暗光条件下重建高质量 3D 汽车时面临挑战。我们的数据集可在此处获得。

方法

数据收集和预处理。我们先绕一辆车转三圈 同时用3D扫描仪扫描汽车以获得RGB-D图像及其点云。然后我们使用Colmap和SAM获取姿态并去除背景点云。最后,我们使用经过处理数据训练的3DGS来获得3D汽车模型。

我们精心策划的高质量3DRealCar数据集的特征。3 drealcar包含 各种颜色、汽车类型、品牌的详细注释,甚至汽车解析图。特别是,我们的 数据集包含三种汽车表面的照明条件,对现有方法提出了挑战

效果展示

定性比较

近年来先进图像分割方法的定性比较。我们 从我们的图像测试集中选择输入,并评估汽车部件的容量对每种方法的理解。

可视化

新视图合成(左)和图像到3d生成(右)的可视化。我们比较最近最先进的方法的结果,Zero123-XL,Dreamcraft3D,和他们通过在我们的数据集上训练而得到的改进。

重建结果

我们利用最新最先进的 3D 重建方法 3DGS(高斯溅射)在我们的数据集中展示可视化效果。在标准照明条件下,3DGS 能够从我们的数据集中重建相对高质量的 3D 汽车。请注意,这种级别的重建质量足以用于下游任务并进行渲染。然而,在反光和黑暗条件下的结果并不理想。因此,我们的 3DRealCar 的这两个部分给最近的 3D 方法带来了两个挑战。

第一个挑战是镜面高光的重建,由于汽车的特殊性,汽车表面的材质一般都是有光泽的,也就是说汽车在阳光或者强光照射下会产生大量的镜面高光。

第二个挑战是黑暗环境下的重建。在黑暗环境下拍摄的训练图像丢失了大量重建细节。因此,如何在这两种极端光照条件下实现高质量的重建结果是对近期方法的挑战。

我们希望这些结果能够鼓励后续在恶劣条件下进行3D重建的研究。

结论

在本文中,我们提出了第一个大规模高质量 3D 实车数据集,名为3DRealCar。收集到的每辆汽车的密集高分辨率 360 度视图可用于重建高质量的3D汽车。大量实验证明了我们的3DRealCar在3D重建方面的有效性和挑战。得益于从我们的数据集和汽车零件级注释中重建的高质量3D汽车,我们的数据集可用于支持与汽车相关的各种任务。此外,基准测试结果可以作为未来研究的基线。虽然3DRealCar目前只有汽车外部视图,但我们打算在未来提供外部和内部视图,以进一步促进更完整的3D汽车的重建。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/760291.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于公有云部署wordpress

云平台选择 腾讯云 阿里云 华为云 项目部署 一、架构讲解 1.1、定义与组成 LNMP是Linux、Nginx、MySQL(或MariaDB)和PHP(或Perl、Python)的首字母缩写,代表在Linux系统下使用Nginx作为Web服务器,MySQL作为…

【SGX系列教程】(八)Intel-SGX 官方示例分析(SampleCode)——Seal Unseal

文章目录 一.Seal Unseal原理介绍1.1 Intel SGX supported Sealing Policies 二.源码分析2.1 README2.2 重点代码分析2.2.1 主要代码模块交互流程分析2.2.2 App/App.cpp2.2.3 Enclave_Seal/Enclave_Seal.cpp2.2.4 Enclave_Unseal/Enclave_Unseal.cpp 2.3 总结 三.参考文献四.感…

PMBOK® 第六版 结束项目或阶段

目录 读后感—PMBOK第六版 目录 不论是阶段的收尾还是项目整体的收尾,都应是令人振奋的事。然而,在实际生活中,收尾工作却相当艰难。会遭遇负责人调离、换任,导致不再需要已购产品;项目收尾时对照招标文件或合同&…

基于python的房价多元线性回归分析

1.导入必要的库 import pandas as pd import numpy as np import statsmodels.api as sm from sklearn.model_selection import train_test_split from sklearn.metrics import r2_score import matplotlib.pyplot as plt # 忽略Matplotlib的警告(可选&…

SpringBoot实现文章点赞功能

提示:今日是2024年的6月30日,未来的你看到这篇文章,希望你依旧快乐 文章目录 前言 首先在这里前缀部分我就不做要求了,比如说登录信息什么的 数据库表格 这里实现点赞功能,主要是围绕论坛项目完成的 user_info代表用户信息表 for…

20240630每日一题-组合数学-平均分组问题

更多资源请关注纽扣编程微信公众号 将6个小球,其中1个红球,2个黑球,3个白球拍成一列,相同颜色的球没区别,那么有多少种排法? 答案 60种 分析 相同颜色的小球可以看作平均分组,去除对应排序的…

Zookeeper:Zookeeper JavaAPI操作与分布式锁

文章目录 一、Zookeeper JavaAPI操作1、Curator介绍2、创建、查询、修改、删除节点3、Watch事件监听 二、Zookeeper分布式锁原理 一、Zookeeper JavaAPI操作 1、Curator介绍 Curator是Apache Zookeeper的Java客户端。常见的Zookeeper Java API: 原生Java API。ZkC…

基于PHP的酒店管理系统(改进版)

有需要请加文章底部Q哦 可远程调试 基于PHP的酒店管理系统(改进版) 一 介绍 此酒店管理系统(改进版)基于原生PHP开发,数据库mysql,前端jquery插件美化。系统角色分为用户和管理员。系统在原有基础上增加了注册登录注销功能,增加预订房间图片…

临时文件上传系统Plik

什么是 Plik ? Plik 是一个基于 Go 语言的可扩展且用户友好的临时文件上传系统(类似于 Wetransfer)。 软件主要特点: 强大的命令行客户端易于使用的 Web 用户界面多个数据后端:文件、OpenStack Swift、S3、Google Clo…

Swift中的二分查找:全面指南

Swift中的二分查找:全面指南 简介 二分查找是计算机科学中的经典算法,被广泛用于在已排序的数组中高效地搜索目标值。与线性查找逐个检查每个元素不同,二分查找不断将搜索区间减半,因此在处理大数据集时要快得多。 在这篇博客中…

java基于ssm+jsp 固定资产管理系统

1前台首页功能模块 固定资产管理系统,在系统首页可以查看首页、设备信息、论坛信息、我的、跳转到后台等内容,如图1所示。 图1前台首页功能界面图 注册,在注册页面可以填写用户名、密码、姓名、性别、头像、身份证、手机等详细内容&#xff…

基于Ollama Python的本地多模态大模型

0,背景 最近测试Ollama,发现之前直接下载开源模型在我电脑上都跑不动的模型,居然也能运行了(AMD 7840HS核显/32GB内存),突发奇想那些多模态大模型能不能基于Python接口使用,所以决定尝试一下。…

Qt之Pdb生成及Dump崩溃文件生成与调试(含注释和源码)

文章目录 一、Pdb生成及Dump文件使用示例图1.Pdb文件生成2.Dump文件调试3.参数不全Pdb生成的Dump文件调试 二、个人理解1.生成Pdb文件的方式2.Dump文件不生产的情况 三、源码Pro文件mian.cppMainWindowUi文件 总结 一、Pdb生成及Dump文件使用示例图 1.Pdb文件生成 下图先通过…

Springboot+vue电商平台

管理员权限操作的功能包括管理商家,管理商家星级信息,管理用户,管理商品等。 商家权限操作的功能包括管理商品,回复商品评价,管理商品订单等。 用户权限操作的功能包括查看商家,购买商品,提交…

Django之邮箱注册

目录 一、邮箱验证-环境搭建 1.1、注册流程 1.2、环境搭建 二、封装工具类 三、发送邮件接口开发 四、用户调用发送邮件接口 4.1、Fetch API 4.1.1、GET请求 4.1.2、POST请求 五、完成注册功能 一、邮箱验证-环境搭建 1.1、注册流程 1.2、环境搭建 创建项目 django-a…

Variables Reference for vscode

Predefined variables Visual Studio Code 支持在调试、任务配置文件以及一些特定的设置中使用变量替换。这些变量可以使用 ${variableName} 语法在 launch.json 和 tasks.json 文件的某些键和值字符串中使用。 Predefined variables Visual Studio Code 支持以下预定义变量…

【分布式计算框架 MapReduce】高级编程—多任务数据分析

目录 一、对于 sogou_500w_utf 数据,使用 MapReduce 编程模型完成对以下数据的分析任务。 1. 统计搜索的关键字查询频度,找出搜索次数超过 20 次的关键字的个数。 ① 运行截图 ② 源代码 二、改造 WordCount 程序,使得结果的排序规则为按…

APP逆向 day7 JAVA基础2

一.前言 昨天我们讲了点java基础,大家是不是觉得就特别简单,今天讲点稍微难一丢丢的基础,也就是java基础2.0,今天我要和大家说的内容十分的重要,直接关乎到下一节的内容,所以,好好学&#xff0…

React 打包时如何关闭源代码混淆

React 开发中,使用 npm build 命令进行生产代码打包,为了压缩代码并尽量保证代码的安全性,React 打包时会代码进行压缩和混淆,但是有时我们需要 debug 生产环境的源代码,例如当我们调试 SSR 的项目时,需要禁…

<电力行业> - 《第10课:变电》

1 变电 变电环节,顾名思义就是改变电压的环节,主要是在变电站和变电所完成的。变电站和变电所主要区别在于:变电站比变电所更大。 发电厂的变压器和配电变压器也属于“变电”,但我们在说电网环节时,变电特指电网公司…