生成模型 | 三维重建(3D reconstruction)调研及总结【20231219更新版】

本文是关于三维重建的论文调研,主要集中于基于图片到3d的模型,其中期刊会议标志如下:

[🤖 ICCV 2023 ]

 1.3D综述系列

2019_Image-based 3D Object Reconstruction: State-of-the-Art and Trends in the Deep Learning Era

论文地址:1906.06543.pdf (arxiv.org)

 专注于使用深度学习技术从单个或多个RGB图像中估计通用对象的3D形状的一些总结~

 

2021_Single-View 3D reconstruction: A Survey of deep learning methods

论文地址:Single-View 3D reconstruction: A Survey of deep learning methods - ScienceDirect

2023.03.06_A Review of Deep Learning-Powered Mesh Reconstruction Methods

论文地址:2303.02879.pdf (arxiv.org)

首先描述了深度学习环境中 3D 形状的各种表示形式。然后描述了从体素、点云、单图像和多视图图像的三维网格重建方法的发展。

2.必读3D重建系列

2022.12.16_Point-E: A System for Generating 3D Point Clouds from Complex Prompts

论文链接:https://arxiv.org/abs/2212.08751

项目链接:https://github.com/openai/point-e 

Point-E: A system for generating 3D point clouds from complex prompts (openai.com)

 虽然最近在文本条件 3D 对象生成方面的工作显示出有希望的结果,但最先进的方法通常需要多个 GPU 小时才能生成单个样本。这与最先进的生成图像模型形成鲜明对比,后者在几秒钟或几分钟内生成样本。在本文中,我们探索了一种生成 3D 对象的替代方法,该方法可在单个 GPU 上仅用 1-2 分钟生成 3D 模型。我们的方法首先使用文本到图像扩散模型生成单个合成视图,然后使用第二个扩散模型生成 3D 点云,该模型以生成的图像为条件。虽然我们的方法在样品质量方面仍未达到最先进的水平,但它的采样速度要快一到两个数量级,为某些用例提供了实际的权衡。我们在这个 https URL 上发布了我们预先训练的点云扩散模型,以及评估代码和模型。

 

2023.03.20_Zero-1-to-3: Zero-shot One Image to 3D Object

论文链接:2303.11328.pdf (arxiv.org)

项目链接:cvlab-columbia/zero123: Zero-1-to-3: Zero-shot One Image to 3D Object (ICCV 2023) (github.com)

引入了 Zero-1-to-3,这是一个框架,用于在给定单个 RGB 图像的情况下更改对象的相机视角。为了在这种约束不足的环境中进行新颖的视图合成,利用了大规模扩散模型学习自然图像的几何先验。条件扩散模型使用合成数据集来学习相对相机视点的控制,这允许在指定的相机变换下生成同一对象的新图像。尽管它是在合成数据集上训练的,但模型保留了强大的零样本泛化能力,可以对分布外的数据集以及野外图像(包括印象派绘画)进行泛化。视点条件扩散方法可以进一步用于从单个图像进行 3D 重建的任务。定性和定量实验表明,利用互联网规模的预训练,方法明显优于最先进的单视图三维重建和新颖的视图合成模型。

[ 🤖ICCV 2023 ]2023_Make-It-3D: High-Fidelity 3D Creation from A Single Image with Diffusion Prior 

论文地址:2303.14184.pdf (arxiv.org)

代码地址:junshutang/Make-It-3D: [ICCV 2023] Make-It-3D: High-Fidelity 3D Creation from A Single Image with Diffusion Prior (github.com)

摘要

在这项工作中,研究了仅从单个图像创建高保真 3D 内容的问题。这本身就具有挑战性:它本质上涉及估计底层 3D 几何体,同时幻觉看不见的纹理。为了应对这一挑战,我们利用训练有素的 2D 扩散模型的先验知识来充当 3D 创作的 3D 感知监督。我们的方法 Make-It-3D 采用两阶段优化流程:第一阶段通过在正面视图上结合参考图像的约束和在新视图上先验的扩散来优化神经辐射场;第二阶段将粗略模型转换为带纹理的点云,并通过扩散先验进一步提升真实感,同时利用参考图像中的高质量纹理。大量的实验表明,我们的方法大大优于以前的工作,从而产生了忠实的重建和令人印象深刻的视觉质量。我们的方法首次尝试从单个图像为一般对象实现高质量的 3D 创建,并实现了各种应用,例如文本到 3D 创建和纹理编辑。

2023.06_One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization

Project Page: One-2-3-45 

Paper: https://arxiv.org/pdf/2306.16928.pdf

Code: GitHub - One-2-3-45/One-2-3-45: official code of "One-2-3-45: Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization"

Demo:https://huggingface.co/spaces/One-2-3-45/One-2-3-45

 

2023.07.25.v2_Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors

论文地址:arxiv.org/pdf/2306.17843.pdf

论文代码:guochengqian/Magic123: Official PyTorch Implementation of Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors (github.com)

Demo:Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors (guochengqian.github.io)

提出了 Magic123,这是一种两阶段从粗到细的方法,用于使用 2D 和 3D 先验从野外单个未摆姿势的图像生成高质量的纹理 3D 网格。在第一阶段,优化神经辐射场以产生粗略的几何形状。在第二阶段,采用内存效率高的可微网格表示,以生成具有视觉吸引力纹理的高分辨率网格。在这两个阶段,3D内容都是通过参考视图监督和由2D和3D扩散先验组合指导的新视图来学习的。在 2D 和 3D 先验之间引入了一个单一的权衡参数,以控制对生成的几何体的探索(更具想象力)和利用(更精确)。此外,采用文本反演和单目深度正则化来鼓励视图之间的一致外观,并防止退化解决方案。Magic123 展示了与以前的图像到 3D 技术相比的显着改进,这通过对合成基准和各种真实世界图像的广泛实验进行了验证。代码、模型和生成的 3D 资产可在此 https URL 上找到。 

2023.10.26.v2_DreamCraft3D:Hierarchical 3D Generation with Bootstrapped Diffusion Prior 

Paper:arxiv.org/pdf/2310.16818.pdf

Code:deepseek-ai/DreamCraft3D: Official implementation of DreamCraft3D: Hierarchical 3D Generation with Bootstrapped Diffusion Prior (github.com)

Demo:DreamCraft3D: Hierarchical 3D Generation with Bootstrapped Diffusion Prior (mrtornado24.github.io)

 介绍了 DreamCraft3D,这是一种分层的 3D 内容生成方法,可生成高保真和连贯的 3D 对象。通过利用 2D 参考图像来指导几何雕刻和纹理提升的各个阶段来解决这个问题。这项工作的一个中心重点是解决现有作品遇到的一致性问题。为了雕刻出连贯渲染的几何形状,通过与视图相关的扩散模型进行分数蒸馏采样。这种 3D 先验与几种训练策略一起,优先考虑几何体的一致性,但会损害纹理保真度。论文进一步提出了 Bootstrapped Score Distillation 来专门提升质地。在场景的增强渲染上训练了一个个性化的扩散模型 Dreambooth,并为其注入了正在优化的场景的 3D 知识。从这种 3D 感知扩散先验中提炼出的乐谱为场景提供了视图一致的指导。值得注意的是,通过扩散先验和 3D 场景表示的交替优化,我们实现了相辅相成的改进:优化的 3D 场景有助于训练特定于场景的扩散模型,从而为 3D 优化提供越来越一致的视图指导。因此,优化是自举的,并导致实质性的纹理提升。DreamCraft3D 在整个分层生成过程中通过定制的 3D 先验生成具有逼真效果的连贯 3D 对象,从而推动了 3D 内容生成的最新技术。此 https URL 中提供的代码。

 对比结果

3.其他

3.1.基于文本的3D重建

3.1.1.DREAMCRAFT3D: HIERARCHICAL 3D GENERATION WITH BOOTSTRAPPED DIFFUSION PRIOR

论文地址:arxiv.org/pdf/2310.16818.pdf

代码地址:https://github.com/deepseek-ai/DreamCraft3D

关于数字人相关的3D重建请参考这篇博客

【生成模型 | 数字人类的三维重建(3D reconstruction)调研及总结-CSDN博客】~

参考文献

【1】bluestyle97/awesome-3d-reconstruction-papers: A collection of 3D reconstruction papers in the deep learning era. (github.com) 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/262421.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

树莓派,opencv,Picamera2利用舵机云台追踪人脸(PID控制)

一、需要准备的硬件 Raspiberry 4b两个SG90 180度舵机(注意舵机的角度,最好是180度且带限位的,切勿选360度舵机)二自由度舵机云台(如下图)Raspiberry CSI 摄像头 组装后的效果: 二、项目目标…

【K8s】4# 使用kuboard部署开源项目实战

文章目录 1.开源项目2.实战2.1.创建spring-blade命名空间2.2.导入 spring-blade 到 K8S 名称空间2.3.设置存储卷参数2.4.调整节点端口2.5.确认导入2.6.查看集群2.7.导入配置到 nacos2.8.启动微服务工作负载 3.验证部署结果3.1.Nacos3.2. web 4.问题汇总Q1:Nacos启动…

Blender插件-The Grove 10 树木生长动画植物插件

注意:Blender和The Grove的版本匹配。 亲测Blender 2.9与The Grove 10可以配合使用,Blender 3.6会报错,具体看报错记录。 一、下载 CG咖官网地址: Blender插件-树木生长插件植物生成插件 The Grove 10插件资产库 CSDN下载地址…

EasyExcel使用: RGB字体,RGB背景颜色,fillForegroundColor颜色对照表

EasyExcel使用: RGB字体,RGB背景颜色,fillForegroundColor颜色对照表 使用EasyExcel导出表格可能会对字体颜色和单元格背景颜色进行自定义的修改。 可以自定义字体颜色或者每个单元格的颜色 要想自定义颜色,需要重写CellWriteHandler接口&am…

gem5 garnet l1 l2 cache的创建与相连

gem5 garnet l1 l2 cache的创建与相连 主要就是这个图: 细节 我们用的是gem5/configs/deprecated/example/fs.py #fs.py 引入了上两层路径,也就是当前可以看到 gem5/configs/路径。 addToPath("../../")#fs.py引入了gem5/configs/ruby/Ru…

Spring Boot集成RocketMQ之消息对象序列化

以下源码基于rocketmq-spring-boot-start 2.1.1版本,其它版本可能会有差异 一. 前言 当我们在Spring Boot项目中集成RocketMQ后,只需要在配置文件(application.yml)中添加rocketmq的相关配置,即可使用rocketMQTemplate发送对象消息。登录Ro…

【网络技术设备安全】BGP 基础与概述-2-中转 AS 中的 IBGP 路由传递

0x01 中转 AS 中的 IBGP 路由传递 参考该图: 上图,我们模拟一个 1.0 的路由通过 AS 65101 来传递 1:通过图可知,A 与 B 之间的 Peer 为 EBGP,B 与 E 之间为 Peer IBGP,E 与 F 之间为 Peer EBGP 邻接 2&a…

1.使用 Blazor 利用 ASP.NET Core 生成第一个 Web 应用

参考 https://dotnet.microsoft.com/zh-cn/learn/aspnet/blazor-tutorial/create 1.使用vs2022创建新项目 选择 C# -> Windows -> Blzxor Server 应用模板 2.项目名称BlazorApp下一步 3.选择 .NET6.0 或 .NET7.0 或 .NET8.0 创建 4.运行BlazorApp 5.全部选择是。 信…

【CF闯关练习】—— 800分段

🌏博客主页:PH_modest的博客主页 🚩当前专栏:cf闯关练习 💌其他专栏: 🔴每日一题 🟡 C跬步积累 🟢 C语言跬步积累 🌈座右铭:广积粮,缓…

基于西门子博途电机运行时间的先起先停控制

这是我同事在2019年做的一个功能,基于这个功能,可以形成类似的其他更多的功能,这些功能在一些项目上的实用性还是比较强! 1,控制目标博途工控人平时在哪里技术交流博途工控人社群 根据需要启动电机的数量&#xff0c…

PhysX——源码编译

从git下载源码 git主页 https://github.com/NVIDIA-Omniverse/PhysXclone地址 https://github.com/NVIDIA-Omniverse/PhysX.git源码编译 运行PhysX需要两个编译器的支持,CMake 3.12 或以上版本以及Python 2.7.6 版本 进入工程的 physx 目录,运行generate…

案例109:基于微信小程序的高校寻物平台

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

KubePi JWT 默认密钥权限绕过漏洞复现(CVE-2023-22463)

0x01 产品简介 KubePi 是一款简单易用的开源 Kubernetes 可视化管理面板。 0x02 漏洞概述 KubePi 存在权限绕过漏洞,攻击者可通过默认 JWT 密钥获取管理员权限控制整个平台,使用管理员权限操作核心的功能。 0x03 影响范围 KubePi <= 1.6.2 0x04 复现环境 FOFA: ti…

CUMT--Java复习--泛型与集合

目录 一、泛型 1、概述 2、通配符 3、有界类型 二、集合 1、概述 2、迭代器接口 三、集合类 1、Collection接口 2、List接口 3、Set接口 4、Queue接口 5、Map接口 四、集合转换 五、集合工具类 一、泛型 1、概述 从JDK5.0开始&#xff0c;Java引入泛型类型&…

微服务之服务注册与发现

服务注册发现 服务注册就是维护一个登记簿&#xff0c;它管理系统内所有的服务地址。当新的服务启动后&#xff0c;它会向登记簿交待自己的地址信息。服务的依赖方直接向登记簿要 Service Provider 地址就行了。当下用于服务注册的工具非常多 ZooKeeper&#xff0c;Consul&…

谁能更好地检测深度伪造?人还是机器?

本文将和您讨论深度伪造对社会构成的重大威胁&#xff0c;AI检测工具以及人类专家在不同方面的技术优势与劣势。 不知您是否听说过深度伪造&#xff08;Deepfakes&#xff09;这种欺诈应用&#xff1f;由它产生的各种虚假信息已威胁到了人类社会的方方面面。随着人工智能技术的…

全新揭秘:Java WebSocket全双工通信的实践与运用

全新揭秘&#xff1a;Java WebSocket全双工通信的实践与运用 一、简介何为全双工通信全双工&#xff1f;WebSocket的使用场景 二、如何使用Java实现WebSocket1&#xff0c;引用websocket相关starter2&#xff0c;启用websocket3&#xff0c;服务端代码开发4&#xff0c;群发测试…

【数字图像处理】实验四 图像分割

一、实验内容&#xff1a; 1&#xff0e; 熟悉和掌握利用Matlab工具进行数字图像的读、写、显示等数字图像处理基本步骤。 2&#xff0e; 熟练掌握各种图像分割的基本原理及方法。 3&#xff0e; 能够从深刻理解图像分割&#xff0c;并能够思考拓展到一定的应用领域。 二、实验…

GraphPad Prism 10 for Mac v10.0.0.3 安装教程

GraphPad Prism GraphPad Prism是一款非常专业强大的科研医学生物数据处理绘图软件&#xff0c;它可以将科学图形、综合曲线拟合&#xff08;非线性回归&#xff09;、可理解的统计数据、数据组织结合在一起&#xff0c;除了最基本的数据统计分析外&#xff0c;还能自动生成统…

ARM GIC(四) gicv3架构基础

GICv3架构是GICv2架构的升级版&#xff0c;增加了很多东西。变化在于以下&#xff1a; 使用属性层次&#xff08;affinity hierarchies&#xff09;&#xff0c;来对core进行标识&#xff0c;使gic支持更多的core 将cpu interface独立出来&#xff0c;用户可以将其设计在core…