【1211更新】腾讯混元Hunyuan3D-1文/图生3D模型云端镜像一键运行

目录

项目介绍

显存占用

11月21 新增纹理烘焙模块Dust3R

烘焙相关参数:

AutoDL云端镜像

启动说明

标准模型下载


【1212更新】腾讯混元Hunyuan3D-1文图生3D模型云端镜像一键运行

项目介绍

https://github.com/Tencent/Hunyuan3D-1

腾讯混元 3D 生成模型,支持文本和图像条件生成(对于文生3D,支持中/英双语生成)

为了解决现有的3D生成模型在生成速度和泛化能力上存在不足,我们开源了混元3D-1.0模型,可以帮助3D创作者和艺术家自动化生产3D资产。

我们的模型采用两阶段生成方法,在保证质量和可控的基础上,轻量版模型仅需10s即可完成单图生成3D,标准版则大约需要25s。

在第一阶段,我们采用了一种多视角扩散模型,轻量版模型能够在大约4秒内高效生成多视角图像,这些多视角图像从不同的视角捕捉了3D资产的丰富的纹理和几何先验,将任务从单视角重建松弛到多视角重建。

在第二阶段,我们引入了一种前馈重建模型,利用上一阶段生成的多视角图像。该模型能够在大约3秒内快速而准确地重建3D资产。重建模型学习处理多视角扩散引入的噪声和不一致性,并利用条件图像中的可用信息高效恢复3D结构。

最终,该模型可以实现输入任意单视角实现三维生成。

显存占用

  • 标准版模型 需要30GB VRAM (使用 --save_memory需要 24G VRAM ).

  • 轻量版模型 需要 22GB VRAM (使用 --save_memory需要18G VRAM).

  • --save_memory 参数用于减少内存消耗,通过调整算法或数据结构来优化内存使用

--save_memory 参数在某些深度学习框架或库中,如PyTorch,用于在模型训练过程中减少GPU显存的占用。具体来说,这个参数会使得某些模型组件(如网络层)在不需要进行计算时自动移动到CPU内存中,从而节省GPU显存空间。当这些组件再次需要参与计算时,它们会被移回GPU。

这种做法被称为CPU Offloading,它是一种显存节省技术,可以在保持模型性能的同时减少显存的使用,特别适用于显存资源受限的情况。通过将模型的一部分或全部中间变量临时转移到CPU,可以有效地减少GPU显存的占用,同时在需要时再将它们移回GPU以继续计算。这种动态的内存管理策略有助于提高大规模模型训练的效率和可行性。

11月21 新增纹理烘焙模块Dust3R

请注意,这是一个非商业许可证,因此该模块不能用于商业目的。

纹理烘焙是一种在3D建模和渲染中常用的技术,它涉及将模型的材质、光照等信息预先计算并存储为2D纹理,以此来减少实时渲染的计算量,提高渲染效率。这种方法特别适用于将高多边形模型的细节信息转移到低多边形模型上,以保持视觉效果的同时减少性能消耗。

使用Dust3R进行纹理对齐和变形的过程中,Dust3R是一个开源项目,它旨在简化几何3D视觉重建。Dust3R通过一系列操作,包括图像加载、成对处理、预测和全局对齐,来实现3D场景的重建。在纹理烘焙的上下文中,Dust3R可能被用于处理和优化纹理映射,确保在3D模型之间传输纹理数据时,纹理的对齐和变形能够得到有效管理,减少渲染过程中的变形和拉伸问题。

具体来说,Dust3R可以处理图像对,并输出包含3D点信息的预测结果,这些结果可以用于后续的纹理烘焙过程。通过全局对齐器(global_aligner),Dust3R还能够优化预测结果,使得从一个物体投影到另一个几何体上的纹理信息保持准确性。这样,纹理烘焙模块可以利用Dust3R提供的精确3D信息,来实现更好的纹理对齐和变形效果。

烘焙相关参数:

参数默认值描述
--do_bakeFALSE这个参数是一个布尔值,用于指示是否执行烘焙操作。当设置为True时,程序将执行将多视图图像烘焙到网格(mesh)上的操作。烘焙过程中,图像的细节和特征会被捕捉并存储在纹理中,这样可以在渲染时减少计算量,提高效率。如果设置为False,则不会执行烘焙操作。
--bake_align_times3这个参数指定了图像与网格之间对齐的次数。在烘焙过程中,为了确保图像与网格的准确对应,可能需要多次执行对齐操作。这个参数控制了对齐操作的重复次数,以确保图像和网格之间的映射尽可能精确。数值越大,意味着更高的对齐精度,但同时也可能增加计算成本。

注意:如果需要烘焙,请确保--do_bake设置为True并且--do_texture_mapping也设置为True

AutoDL云端镜像

https://www.codewithgpu.com/i/Tencent/Hunyuan3D-1/Hunyuan3D-1.0

镜像大小:25.25GB 第一次拉取镜像较慢,请耐心等候,22分钟左右,

启动成功应该会收到短信通知!

启动说明

  • AutoDL创建实例启动后,点击运行即可

  • 默认端口1080

  • 本地使用「AutoDL-SSH-Tools」转发端口1080

链接:https://pan.quark.cn/s/ee8bef31034c

标准模型下载

注:由于AutoDL系统盘只有30G,只下载了lite模型(4090单显卡可运行)

如需使用标准模型(4090需双卡)可将项目移动到数据盘autodl-tmp下 手动下载

 
mv /root/Hunyuan3D-1 /root/autodl-tmp/Hunyuan3D-1

cd /root/autodl-tmp/Hunyuan3D-1

huggingface-cli download tencent/Hunyuan3D-1 --local-dir weights

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/937964.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PHP 应用 ImageMagick

ImageMagick是什么? ImageMagick是一款功能强大、跨平台的图像处理软件。它可以读取、转换和输出大量的图片格式,支持各种各样的图像处理操作,如调整大小、旋转、加水印、格式转换等。在PHP中使用ImageMagick,可以让我们在web应用…

OpenCV圆形标定板检测算法findGrid原理详解

OpenCV的findGrid函数检测圆形标定板的流程如下: class CirclesGridClusterFinder {CirclesGridClusterFinder(const CirclesGridClusterFinder&); public:CirclesGridClusterFinder

阿里云服务器手动搭建WordPress【官方文档注意事项】

这是官方文档 注意事项 先配LNMP,我的上一篇文章到这里发现,没有基于ubuntu的教程,所以创建服务器时选择centos在官方文档第四步“下载WordPress,并移动至网站根目录”中,首先它让cd /usr/share/nginx/html&#xff…

vue运行项目时local有显示 但是network却显示unavailable

问题描述 日常开发中 和后端本地调试时 后端需要使用你的本地去访问页面 可运行项目时会出现network显示unavailable的情况 解决方式 1.其实这只是vue脚手架对于ip地址获取的方式兼容上有一些问题 但其实是不影响ip访问本地的 你可以直接cmd内ipconfig去查看自己的ip然后…

Go项目-----Kubernetes使用

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言基本概念kubectl工具部署web服务生成镜像编写deployment 编写service启动服务 k8s部署mysql编写pvc编写pv编写service 部署redis集成部署mysql和redis 前言 这…

SpringCloud无介绍快使用,sentinel注解@SentinelResource的基本使用(二十三)

TOC 问题背景 从零开始学springcloud微服务项目 注意事项: 约定 > 配置 > 编码IDEA版本2021.1这个项目,我分了很多篇章,每篇文章一个操作步骤,目的是显得更简单明了controller调service,service调dao默认安装ngi…

紫光展锐5G融云方案,开启云终端新时代

近年来,云终端凭借便捷、高效、高性价比的优势正逐步在各行各业渗透。研究机构IDC的数据显示,2024上半年,中国云终端市场总体出货量达到166.3万台,同比增长22.4%,销售额29亿元人民币,同比增长24.9%&#xf…

基于卷积神经网络的垃圾分类系统实现(GUI应用)

1.摘要 本文主要实现了一个卷积神经网络模型进行垃圾图像分类,为了提高垃圾分类模型的准确率,使用使用Batch Normalization层、使用早期停止策略来防止过拟合等方法来优化模型,实验结果显示最终优化后的模型准确率较高90%左右。最终&#xf…

【51单片机】蜂鸣器快速上手

‌51单片机蜂鸣器是一种将电信号转换为声音信号的器件,在51单片机开发板中常用于产生按键音、报警音等提示信号‌。 ‌蜂鸣器类型‌:蜂鸣器按驱动方式可分为有源蜂鸣器和无源蜂鸣器。有源蜂鸣器内部自带振荡源,只需接上直流电压即可持续发声&…

数据库入门

基本概念 数据库:DataBase简称DB,是一个用于存储和管理数据的仓库。 就像我们每天访问的网站Bilibili,OA、ERP和CRM等内部管理系统,以及我们每天使用的腾讯新闻和Tiktok应用程序一样,我们看到的数据实际上存储在数据库…

vscode插件开发 在activity Bar 开发一个自定义bar(左侧侧边栏自定义一个功能选项)

了解vscode编辑器结构 点击了解编辑器结构视图 在编辑器的左侧创建一个新的item 如下图位置 1,vscode开发基础点击这里 2,了解到基础的vscode插件开发的步骤之后 在package.json文件的contrites下配置下图参数 实现效果如下图

Airborne使用教程

1.安装环境 前提条件:系统已安装Ruby 打开终端输入如下命令 gem install airborne 或者在Gemfile添加 gem airborne 然后运行bundle install 2.编写脚本 在项目中新建api_tests_spec.rb文件 以GET接口"https://www.thunderclient.com/welcome"为…

session 共享服务器

1.安装 kryo-3.0.3.jar asm-5.2.jar objenesis-2.6.jar reflectasm-1.11.9.jar minlog-1.3.1.jar kryo-serializers-0.45.jar msm-kryo-serializer-2.3.2.jar memcached-session-manager-tc9-2.3.2.jar spymemcached-2.12.3.jar memcached-session-manager-2.3.2.jar …

Web 毕设篇-适合小白、初级入门练手的 Spring Boot Web 毕业设计项目:药品进销存信息管理系统(前后端源码 + 数据库 sql 脚本)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 项目介绍 1.1 项目功能 2.0 用户登录功能 3.0 首页界面 4.0 供应商管理功能 5.0 药品管理功能 6.0 采购记录管理功能 7.0 销售记录管理功能 8.0 退货记录管理功能…

PCIE概述

PCIE概述 文章目录 PCIE概述前言一、应用场景二、PCIE理论2.1 硬件2.2 拓扑结构:处理器和设备之间的关系2.3 速率2.4 层次接口2.5 四种请求类型2.5.1 bar空间2.5.2 memory2.5.3 IO2.5.4 configuration2.5.5 message 前言 参考链接: pcie总线知识点解析 …

基于C#开发web网页管理系统模板流程-登录界面和主界面

点击返回目录-> 基于C#开发web网页管理系统模板流程-总集篇-CSDN博客 前言,首先介绍一下本项目将要实现的功能 (一)登录界面 实现一个不算特别美观的登录窗口,当然这一步跟开发者本身的设计美学相关,像蒟蒻博主就没…

优化你的 3D Tiles:性能与质量的平衡

优化你的 3D Tiles:性能与质量的平衡 在现代的三维场景渲染中,3D Tiles 是一种强大的技术,它能以高效、分级加载的方式呈现海量的三维数据。然而,优化 3D Tiles 以实现性能与质量的平衡,却是一个复杂且关键的任务。本…

Unix 和 Windows 的有趣比较

Unix 和 Windows NT 比较 来源于这两本书,把两本书对照来读,发现很多有意思的地方: 《Unix 传奇》 https://book.douban.com/subject/35292726/ 《观止 微软创建NT和未来的夺命狂奔 》 Showstopper!: The Breakneck Race to Create Windows…

数据可视化大屏UI组件库:B端科技感素材PSD

在数据可视化领域,一个出色的大屏UI设计不仅能够准确传达数据背后的信息,更能提升用户的视觉体验。然而,对于UI设计师而言,设计这样一款界面往往面临着寻找合适设计素材的挑战。为了应对这一难题,我们推出了这款数据可…

爬虫逆向学习(十四):分享一下某数通用破解服务开发经验

阅前须知 这篇博客不是教大家怎么实现的,而且告知大家有这个东西,或者说一种趋势,借此分享自己大致的实现经验。具体的实现我也不好整理,毕竟是在别人的基础上缝缝补补。 前言 使用补环境方式破解过某数的同学都知道&#xff0…