3D 生成重建011-LucidDreamer 优化SDS过平滑结果的一种探索

3D 生成重建011-LucidDreamer 优化SDS过平滑结果的一种探索


文章目录

    • 0论文工作
    • 1论文方法
    • 2 效果

0论文工作

文本到3D生成的最新进展标志着生成模型的一个重要里程碑,为在各种现实场景中创建富有想象力的3D资产打开了新的可能性。虽然最近在文本到3D生成方面的进展显示出了希望,但它们在渲染详细和高质量的3D模型方面往往不足。这个问题特别普遍,因为有许多方法都可以使用蒸馏取样(SDS)。本文指出了SDS的一个明显缺陷,即它给三维模型带来了不一致和低质量的更新方向,导致了过度更新平滑作用为了解决这个问题,我们提出了一种新的方法,称为间隔分数匹配(ISM)。ISM采用确定性扩散轨迹,并利用基于区间的分数匹配部分过度平滑。此外,我们将**三维高斯溅(3D GS)**合并到我们的文本到三维生成管道中。大量的实验表明,我们的模型在很大程度上优于最先进的技术质量和培训效率。
LucidDreamer 旨在解决从文本提示生成高保真三维形状的挑战。该论文指出了现有文本到三维方法的关键局限性,特别是它们难以在样本质量和多样性之间取得平衡。LucidDreamer 以区间得分匹配 (ISM) 为中心的新方法,用于三维生成的扩散模型,从而缓解了这些问题。实际上这种sds相减在magic123和sparsefusion等3d生成都用了相似的技巧,只不过不同作者选择了不同的解释角度。甚至在纹理生成也使用了类似技巧。

1论文方法

  1. 现有方法存在的问题:
    多样性有限: 许多文本到三维模型优先考虑生成与文本一致的合理形状,这通常会导致多样性低和输出重复。
    质量和多样性之间的权衡: 在高保真度细节和生成形状的广泛性之间取得平衡是一项重大挑战。
    下图是论文的结构图,可以发现论文的结构上与SDS优化流派的方法保持一样的结构,一个3d表示,渲染新视图,SDS优化。不同的是论文是早期使用3d gaussian splatting表示的方法。另外论文使用了DDIM和ISM等不同处理。
    此外论文用一个图对SDS过平滑进行一个可视化。简单来说,多次的降噪就是在对不同降噪结果直接求了平均,会导致过平滑。
    在这里插入图片描述

在这里插入图片描述

  1. LucidDreamer 的解决方案:
    a) 区间得分匹配 (ISM): 这是 LucidDreamer 创新的核心。 ISM 为训练用于三维形状生成的扩散模型提供了一种新方法。
  • 核心理念: ISM 不是直接预测噪声数据分布,而是侧重于学习数据两个扰动版本之间的差异(得分)。这允许更有效的训练并更好地捕获底层数据流形,从而生成更高质量的样本。
  • 工作原理:
    1. 使用不同的噪声级别对目标三维形状的两个噪声版本进行采样。
    2. 训练扩散模型以预测这两个噪声版本之间的得分(矢量差)。
    3. 在生成过程中,模型通过迭代应用学习到的得分信息来逐渐对随机三维形状进行去噪。
      b) 用于文本引导生成的得分蒸馏: 为了使用文本提示引导生成过程,LucidDreamer 使用了得分蒸馏。
  • 训练文本到得分网络: 训练一个单独的网络将文本描述映射到相应的三维形状得分。该网络充当文本域和三维形状域之间的“翻译器”。
  • 引导生成: 在生成过程中,来自文本到得分网络的得分会影响扩散过程,确保生成的三维形状与给定的文本提示一致。为了克服多面问题,论文还插入一个3d先验模块。
  1. LucidDreamer 的优势:
    高保真生成: 通过利用 ISM,LucidDreamer 可以生成具有令人印象深刻的细节和真实感的三维形状。
    增强的多样性: 与现有方法相比,使用 ISM 有助于生成更广泛的多样化形状,解决了输出重复的问题。
    有效的文本引导: 得分蒸馏方法使模型能够有效地整合文本信息,确保生成的三维形状与输入提示之间语义一致。
    此外论文用一个图对SDS过平滑进行一个可视化。简单来说,多次的降噪就是在对不同降噪结果直接求了平均,会导致过平滑。

2 效果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/640583.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024 一键批量下载微博内容/图片/视频/评论/转发数据,导出excel和pdf

以李健的微博为例,抓取2010-2024年所有的微博数据excel,包含微博链接,微博内容,发布时间,点赞数,转发数,评论数,话题等。 每个月的微博转评赞总数曲线,2015年是高峰。 微…

Pod进阶——资源限制以及探针检查

目录 一、资源限制 1、资源限制定义: 2、资源限制request和limit资源约束 3、Pod和容器的资源请求和限制 4、官方文档示例 5、CPU资源单位 6、内存资源单位 7、资源限制实例 ①编写yaml资源配置清单 ②释放内存(node节点,以node01为…

APP广告变现怎么实现的,背后逻辑是什么?

广告变现的实现主要基于以下几个关键步骤和逻辑: 用户获取与留存:首先,APP需要吸引足够的用户并确保他们的留存率。只有拥有庞大且活跃的用户基础,APP才能吸引广告商投放广告。因此,开发者需要通过优化APP质量、提升用…

阅读笔记——《未知协议状态机推断技术研究综述》

【参考文献】盛嘉杰, 牛胜杰, 陈阳, 等. 未知协议状态机推断技术研究综述[J]. 计算机与现代化, 2023 (05): 58.【注】本文仅为作者个人学习笔记,如有冒犯,请联系作者删除。 摘要 协议逆向工程(PRE)描述了协议的行为逻辑&#xff…

【Python】—— lambda表达式

目录 (一)应用场景 (二)lambda 语法 (三)示例分析 (四)lambda参数形式 4.1 无参数 4.2 一个参数 4.3 默认参数 4.4 可变参数 :*args 4.5 可变参数 :…

需求响应+配网重构!含高比例新能源和用户需求响应的配电网重构程序代码!

前言 配电网重构作为配电网优化运行的手段之一,通过改变配电网的拓扑结构,以达到降低网损、改善电压分布、提升系统的可靠性与经济性等目的。近年来,随着全球能源消耗快速增长以及环境的日趋恶化,清洁能源飞速发展,分…

orin部署tensorrt、cuda、cudnn、pytorch

绝大部分参考https://blog.csdn.net/qq_41336087/article/details/129661850 非orin可以参考https://blog.csdn.net/JineD/article/details/131201121 报错显卡驱动安装535没法安装、原始是和l4t-cuda的部分文件冲突 Options marked [*] produce a lot of output - pipe it th…

基于SSM的“酒店管理系统”的设计与实现(源码+数据库+文档)

基于SSM的“酒店管理系统”的设计与实现(源码数据库文档) 开发语言:Java 数据库:MySQL 技术:SSM 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 首页 管理员登录页面 用户管理页面 客房信息查询 酒店详细信息 后台…

rmxprt转换的3D模型只有一半?---模大狮模型网

在3D建模和渲染的工作流程中,我们经常需要用到各种转换工具来兼容不同平台或软件之间的模型格式。rmxprt(或其他类似的模型转换工具)就是其中的一种,它能够将模型从一种格式转换为另一种格式。然而,有时在转换过程中可能会遇到一些问题&#…

工作中的冲突,职场人士应如何化解

在职场中,冲突和分歧是不可避免的现象。它们可能来源于工作分配不均、目标不一致、价值观差异或个性不合等。面对这些冲突和分歧,我们需要具备有效的冲突管理技巧来化解问题,以维持团队的和谐与工作效率。 分析冲突的原因至关重要。通常来说&…

StringMVC

目录 一,MVC定义 二,SpringMVC的基本使用 2.1建立连接 - RequestMapping("/...") ​编辑 2.2请求 1.传递单个参数 2.传递多个参数 3.传递对象 4.参数重命名 5.传递数组 6. 传递集合 7.传递JSON数据 8. 获取url中数据 9. 传递文…

uniapp+canvas实现逐字手写效果

在移动端使用 UniApp 进行逐字手写的功能。用户可以在一个 inputCanvas 上书写单个字,然后在特定时间后将这个字添加到 outputCanvas 上,形成一个逐字的手写效果。用户还可以保存整幅图像或者撤销上一个添加的字。 初始化 Canvas: 使用 uni.c…

每日一题《leetcode--1472.设计浏览器历史记录》

https://leetcode.cn/problems/design-browser-history/ 这里我是用双栈实现前进和后退。 #define URL_SIZE 21 #define STACK_SIZE 5000typedef struct {char *BackStack[STACK_SIZE]; //回退栈char *ForwardStack[STACK_SIZE]; //前进栈int BackTop; //回退栈的栈顶下标…

3D瓦片地图组件上线|提供DEM数据接入,全方位呈现三维地图地形!

在用户调研中,我们了解到很多用户自身的可视化项目,需要在垂直空间上表现一些业务,例如:3D地形效果,数据底板建设等,而传统的地图效果不满足此用户需求。瓦片地图能够无限加载大地图,以更三维的…

云端升级,智能适配——LDR6282,USB-C接口显示器的最佳选择

华为MateView USB-C接口显示器技术深度解析与科普 随着科技的飞速发展,终端显示产品也迎来了全新的变革。在众多更新迭代中,华为MateView显示器凭借其独特的USB-C接口设计,为用户带来了前所未有的便捷体验。本文将带您深入探索这款显示器的技…

uniapp开发vue3监听右滑返回操作,返回到指定页面

想要在uniapp框架中监听左滑或者右滑手势,需要使用touchstart和touchend两个api,因为没有原生的左右滑监听api,所以我们只能依靠这两个api来获取滑动开始时候的x坐标和滑动结束后的x坐标做比对,右滑的话,结束时候的x坐…

Flutter 页面布局 Flex Expanded弹性布局

题记 —— 执剑天涯,从你的点滴积累开始,所及之处,必精益求精,即是折腾每一天。 什么是弹性布局(Flex)? 弹性布局(Flex)是一种基于弹性盒子模型的布局方式,类…

【如何让论文中摘要后面的内容不出现在目录中】

首先选择摘要二字,设置为一级标题,然后选择摘要后面的内容设置为正文样式,再选择这一部分看一下是不是都是正文大纲级别,如果是那就可以了。 具体流程如下 1、选择摘要二字,设置为一级标题样式 2、选择摘要后面的文…

Springboot零星知识点1

1、请求路径的组成 2、多个环境配置文件 3、对 自定义的属性 增加文字描述,而且IDEA不会警告 4、读取属性值的两种方式 5、东东

TP6 模型批量插入获取插入的自增ID

在TP框架中,数据插入 添加一条数据,返回添加成功的条数 $data [foo > bar, bar > foo]; Db::name(user)->save($data); // 或者 Db::name(user)->insert($data); 批量添加 $data [[foo > bar, bar > foo],[foo > bar1, bar > foo1],[…