NERF++:Analyzing and Improving Neural Radiance Fields神经辐射场的分析与改进

在这里插入图片描述

ABSTRACT

神经辐射场(NeRF)可以实现各种捕获设置的令人印象深刻的视图合成结果,包括360度捕获有界场景和前向捕获有界和无界场景。NeRF 将代表视图不变不透明度和视图相关颜色体积的多层感知器(MLPs)匹配到一组训练图像中,并基于立体渲染技术对新视图进行采样。在这份技术报告中,我们首先评论了辐射场及其潜在的模糊性,即形状-辐射模糊性,并分析了 NERF 在避免这种模糊性方面的成功。其次,我们解决了一个参数化问题,涉及到应用 NERF 到360度捕捉大规模,无界的3D 场景中的对象。我们的方法在这个具有挑战性的场景中提高了视图综合保真度。

1 introduction

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2 Preliminaries在这里插入图片描述

在这里插入图片描述

3 shape-radiance ambiguity形状-辐射模糊

NERF 模拟视图相关外观的能力导致了3D 形状和辐射之间固有的模糊性,这种模糊性可以接受退化解(退化解通常指的是非典型或不符合预期的解),在缺乏正规化/正则化的情况下。对于一个任意的、不正确的形状,我们可以证明存在一系列的辐射场,这些辐射场可以很好地解释训练图像,但是对于新的测试视图来说,这些辐射场的概括性很差。

为了说明这种模糊性,假设对于给定的场景,我们将几何图形表示为一个单位球体。换句话说,让我们把 NERF 的不透明度场修正为单位球面上的1,其他地方的0。然后,对于每个训练图像中的每个像素,我们将穿过该像素的光线与球体相交,并定义相交点(以及沿着光线方向)的亮度值作为该像素的颜色。这个人工构造的解决方案是一个有效的 NERF 重建,完全符合输入图像。然而,这种解决方案合成新视图的能力是非常有限的: 准确地生成这样的视图将涉及在每个表面点重建任意复杂的视图依赖函数。除非训练视图非常密集,因为在传统的光场渲染工程中,否则该模型不太可能准确地插入如此复杂的函数

这种形状-辐射模糊性如图2所示。在这里插入图片描述
图2: 为了演示形状-辐射模糊性,我们在一个合成数据集上预训练 NeRF,其中不透明度场 σ 被优化为模拟一个不正确的3D 形状(一个单位球体,而不是推土机形状) ,而辐射场 c 被优化为映射训练射线与球体的交叉点和视图方向到它们的像素颜色。在这个例子中,我们使用3个 MLP 层来模拟视图依赖性的影响(参见图3中的 MLP 结构) ,并适合于50个视点随机分布在半球上的合成训练图像。结果不正确的解决方案很好地解释了训练图像(左两幅图像) ,但是没有推广到新的测试视图(右两幅图像)。

为什么 NERF 避免这种退化的解决方案?我们假设有两个相关的因素来拯救 NeRF: 1)不正确的几何形状迫使辐射场具有更高的内在复杂性(即,更高的频率) ,而相反2) NeRF 的特定 MLP 结构隐含地在表面反射率之前编码平滑的 BRDF

Factor 1: 当 σ 偏离正确的形状时,c 一般必须成为相对于 d 的高频函数来重建输入图像。对于正确的形状,表面光场通常会更加平滑(事实上,朗伯体材料的光场常数)。不正确形状所需要的更高的复杂性更难以用有限容量的 MLP 来表示。
Factor 2:特别地,NeRF 的特定 MLP 结构编码了一个隐式的优先级偏好光滑表面反射函数,其中在任意给定的表面点 x 上 c 相对于 d 是光滑的。这个 MLP 结构,如图3所示,不对称地处理场景位置 x 和观察方向 d: d 被注入到 MLP 末端附近的网络中,这意味着有更少的 MLP 参数,以及更少的非线性激活,参与创建视图依赖效应。此外,用于编码观察方向的傅里叶特征仅由低频分量组成,即,用于编码 d 和 x 的 γ4(·)和 γ10(·)(参见 Eq3).换句话说,对于一个固定的 x,辐射度 c (x,d)相对于 d 的表达式是有限的。在这里插入图片描述
为了验证这个假设,我们进行了一个实验,我们用一个对称处理 x 和 d 的普通 MLP 来代表 c,也就是说,接受两者作为第一层的输入,并用 γ10(·)来编码,以消除任何涉及网络结构引起的观察方向的隐含先验。如果我们使用 c 的这个替代模型从头开始训练 NeRF,我们观察到与 NeRF 的特殊 MLP 相比,测试图像质量降低,如图4和表1所示。这一结果与我们的假设相一致,即在 NERF 的 MLP 辐射c模型中,反射率的隐式正则化有助于恢复正确的解。
在这里插入图片描述
图4: 在 DTU 场景中(Jensen 等,2014; Riegler & Koltun,2020) ,该图显示了用普通的 MLP 替换 NERF 的辐射场 c 模型的效果(同时保持 σ 的结构相同并从头开始训练两个场)。普通的 MLP (vanilla MLP)损害了 NERF 概括新视图的能力。在这里插入图片描述
表1: 在 DTU 场景中(Jensen et al。 ,2014) ,用普通 MLP 代替 NeRF 的 MLP 显著地减少了对新视图的泛化。我们使用与 Riegler & Koltun (2020)相同的数据分割。左边的数字用于插值,右边的数字用于外推/推断。他们评估的全部图像与背景掩盖。

4 inverted sphere parametrization(倒球参数化)

方程2中的体绘制公式对欧几里得深度进行了积分。在这里插入图片描述
当真实场景深度的动态范围较小时,可以用有限个样本对积分进行数值逼近。然而,对于户外,360度捕捉以附近物体为中心,同时观察周围环境,动态深度范围可以非常大,因为背景(建筑物、山脉、云层等)可以任意远离。如此高的动态深度范围导致了 NERF体积场景表示中严重的分辨率问题,因为要合成逼真的图像,Eq2中的积分需要在前景和背景区域有足够的分辨率,这很难通过简单的采样点根据欧几里得三维空间参量化来实现。图5展示了场景覆盖和捕捉细节之间的折衷。在一个更受限制的场景中,所有的摄像机都面向一个将摄像机与场景内容分隔开的平面,NeRF 通过投影映射欧几里德空间的一个子集,即参考摄像机的视图平台到标准化设备坐标(NDC)(McReynolds & Blythe,2005)来解决这个分辨率问题,并在这个 NDC 空间中集成。然而,这个NDC参数化也从根本上限制了可能的视点,因为它没有覆盖参考视图平台外的空间。
在这里插入图片描述
图5: 对于无界场景的360度捕捉,NeRF 的空间参量化要么只模拟场景的一部分,导致背景元素(a)中出现重要的伪影,要么模拟整个场景,由于有限的采样分辨率(b)而导致整体细节的丢失。
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
图9:我们定性地比较了两个T&T场景(卡车、游乐场)和两个LF场景(非洲、火炬)上的NeRF++和NeRF。NeRF++比NeRF产生更清晰的图像,能够更好地表示前景和背景。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/604760.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

力扣刷题--数组--第三天

今天再做两道二分查找的题目,关于二分查找的知识可看我前两篇博客。话不多说,直接开干! 题目1:69.x 的平方根 题目详情:   给你一个非负整数 x ,计算并返回 x 的 算术平方根 。由于返回类型是整数&#…

从零开始的软件测试学习之旅(九)jmeter直连数据库及jmeter断言,关联

jmeter直连数据库及断言,关联 jmeter直连数据库步骤jmeter断言jmeter逻辑控制器if控制器ForEach控制器循环控制器 Jmeter关联Jmeter关联XPath提取器Jmeter关联正则表达式提取器二者比较跨线程组关联 每日复习 jmeter直连数据库 概念 这不叫直连:Jmeter -> java/python 提供的…

单片机-点亮第一盏灯

原理图 需求:点亮或是熄灭LED 通过控制 P5.3引脚输出高电平时,LED灯就点亮,输出低电平时LED灯就熄灭 1.项目创建 新建项目 配置开发板信息 当前位STC芯片的开发板,选择STC MCU Database 搜素具体芯片型号,进行配置…

Spring-依赖注入的处理过程

前置知识 1 入口 DefaultListableBeanFactory#resolveDependency 2 每个依赖都有对应的DependencyDescriptor 3 自定绑定候选对象处理器AutowireCapableBeanFactory 注入处理 我们可以看到AutowireCapableBeanFactory中有两个方法: 第一个是单个注入:…

52页 | 2024大型语言模型行业图谱研究报告(免费下载)

【1】关注本公众号,转发当前文章到微信朋友圈 【2】私信发送 【2024大型语言模型行业图谱研究报告】 【3】获取本方案PDF下载链接,直接下载即可。 如需下载本方案PPT原格式,请加入微信扫描以下方案驿站知识星球,获取上万份PPT解…

【软考高项】三十六、资源管理6个过程

一、规划资源管理 1、定义、作用 定义:定义如何估算、获取、管理和利用团队以及实物资源的过程作用:根据项目类型和复杂程度确定适用于项目资源的管理方法和管理程度 2、输入 项目管理计划 质量管理计划、范围基准项目章程 项目文件 需求文件…

PostgreSQL和openGauss优化器对一个关联查询的SQL优化改写

PostgreSQL和openGauss数据库优化器在merge join关联查询的SQL优化改写 PostgreSQL 查询计划openGauss 查询计划拓展对比 看腻了文章就来听听视频讲解吧:https://www.bilibili.com/video/BV1oH4y137P7/ 数据库类型数据库版本PostgreSQL16.2openGauss6.0 创建测试表…

教你如何用VUE实现一个无缝横向滚动抽奖的效果

最近一位安卓端同事想要实现一个效果如下图,我们先看如下图: 我们看到上面想到如何实现呢? 先说下我的思路: 我先想到的是看能不能用轮播图swiper插件实现,试了下发现自己行不通,原因不是在于插件问题&am…

How Linux Works I - How Linux Start Up

目录 Linux如何启动? 启动信息 内核启动初始化与启动选项 写在前面:上一个专栏中我写完了内核源码层面看Linux,我们把抽象层拉高一点,看看Linux是如何工作的! Linux如何启动? BIOS(Basic Inpu…

05-08 周三 FastBuild FastAPI 引入并发支持和全局捕获异常

时间版本修改人描述2024年5月8日20:41:03V0.1宋全恒新建文档 简介 由于FastBuild之前花费了大概5天的时间优化,但最近重新部署,又发现了一些问题,就很痛苦,五一之后,自己又花了三天的时间系统的进行了优化。 上一波优…

刷题训练之模拟

> 作者:დ旧言~ > 座右铭:松树千年终是朽,槿花一日自为荣。 > 目标:熟练掌握模拟算法。 > 毒鸡汤:学习,学习,再学习 ! 学,然后知不足。 > 专栏选自:刷题训…

华为车BU迈入新阶段,新任CEO对智能车的3个预判

作者 |张马也 编辑 |德新 4月24日,北京车展前夕,华为召开了新一年的智能汽车解决方案新品发布会。 这次发布会,也是华为智能汽车解决方案BU(简称「车BU」)CEO 靳玉志的公开首秀。 一开场,靳玉志即抛出了…

损失一件外套?

2024/05/07,晴 碎碎念一波! 早上洗漱完要出门时,发现自己昨天穿的外套不见了!!!外套上身效果很不错,买了1年多穿的频率非常高,现在丢了还真挺可惜。 衣服口袋有一个耳机&#xff0…

信创基础软件之数据库

一、数据库概述 数据库是一种用于存储和管理拥有固定格式和结构数据的仓库型数据管理系统。其主要用于业务数据的存储和业务逻辑运算,具体负责保障数据的安全性、完整性、多用户对数据的并发使用以及发生故障后的系统恢复。 二、数据库的体系架构 数据库内核:对数…

Java中next()与nextLine()的区别[不废话,直接讲例子]

在使用牛客进行刷题时,我们很多时候会遇到这样的情况: 区别很简单,如果你要输入用空格或者回车分开的数据如: abc_def_ghi 这三组数据( _ 是空格) 用hasNext: 执行结果: 如果只用换行符号进行…

返回链表的中间节点题目讲解(超快方法)

一:题目 二:思路讲解 采用快慢指针方法来解决 1:slow指针一次跳一个节点,fast指针一次跳两个节点,这样当fast到尾节点的时候,slow刚好到中间节点,但是奇数个的时候,fast不会刚好的…

Java | Leetcode Java题解之第59题螺旋矩阵II

题目&#xff1a; 题解&#xff1a; class Solution {public int[][] generateMatrix(int n) {int num 1;int[][] matrix new int[n][n];int left 0, right n - 1, top 0, bottom n - 1;while (left < right && top < bottom) {for (int column left; co…

DenseCLIP环境配置

直接看raoyongming/DenseCLIP: [CVPR 2022] DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting (github.com) 但这里的环境配置可能和现在不太适配&#xff0c;自己配了好久没弄好 后面尝试了另外的版本的&#xff08;但这个版本少了一些内容&#…

MySQL-ELK基础

1&#xff1a;什么是 ELK ELK是由一家elastic公司开发的三个开源项目的首字母缩写&#xff0c;这三个项目分别是&#xff1a;Elasticsearch、Logstash 和 Kibana。三个项目各有不同的功能&#xff0c;之后又增加了许多新项目, 于是 从5.X版本后改名为Elastic Stack Elastic S…

电脑屏幕监控软件都有哪些 | 五大好用屏幕监控软件盘点

电脑屏幕监控软件在企业管理、家庭教育等方面发挥着越来越重要的作用。 这些软件通过实时监控电脑屏幕活动&#xff0c;为用户提供了强大的管理和监控功能。 本文将为您盘点五大好用的电脑屏幕监控软件&#xff0c;帮助您更好地了解并选择适合自己的软件。 电脑屏幕监控软件都…