腾讯混元文生图开源模型推出小显存版本，仅需 6G 显存即可运行

腾讯混元文生图开源模型推出小显存版本，仅需 6G 显存即可运行

article2025/2/21 4:10:40/文章来源:https://blog.csdn.net/qq_27471405/article/details/140195496

腾讯宣布开源小显存版本的混元文生图模型，降低至 6G 显存即可运行，方便个人电脑本地部署。同时，混元 DiT 模型升级至 1.2 版本，图片质感与构图提升。混元 Captioner 打标模型也正式开源，支持中英文双语，优化文生图场景，能更好地理解和表达中文语义。混元 DiT 模型及插件可通过 Hugging Face Diffusers 和图形化界面 Kohya 调用，提高易用性
原文链接：《腾讯混元DiT再升级：推出6G小显存版本，支持Kohya训练》
在这里插入图片描述

开源小显存版本：
- 腾讯混元DiT推出了一个仅需6G显存即可运行的小显存版本，使得个人电脑用户也能轻松部署和使用。
适配Diffusers库：
- 该小显存版本以及LoRA、ControlNet等插件都已适配至Diffusers库，方便开发者使用。
支持Kohya训练：
- 新增对Kohya图形化界面的支持，使得开发者可以低门槛地训练个性化LoRA模型。
混元DiT模型升级：
- 混元DiT模型升级至1.2版本，在图片质感与构图方面有所提升。
混元Captioner模型开源：
- 腾讯宣布混元文生图打标模型“混元Captioner”正式开源，支持中英文双语，专门针对文生图场景优化，能提供结构化、完整和准确的图片描述。
提升数据质量：
- 混元Captioner通过注入人工标注、模型输出、公开数据等提升描述的完整性，同时注入大量背景知识，提高描述的准确性和完整性。
模型易用性提升：
- 腾讯混元DiT模型通过推出小显存版本、适配Kohya训练界面和升级至1.2版本，进一步降低了使用门槛，提升了图片质量。
混元DiT生态建设：
- 混元DiT自全面开源以来，持续建设生态，包括专属加速库、推理代码开源、LoRA和ControlNet插件等。

混元官网
https://dit.hunyuan.tencent.com/
代码
https://github.com/Tencent/HunyuanDiT
模型
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
论文
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/775948.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

linux ifconfig未找到命令

linux ifconfig未找到命令

linux ifconfig未找到命令 1、使用yum安装net-tools yum install net-toolsyum报未找到命令请查看文章vim未找到命令，且yum install vim安装vim失败 2、安装后使用ifconfig命令 ifconfig

阅读更多...

数据库、创建表、修改表

数据库、创建表、修改表

一、数据库 1、登陆数据库 2、创建数据库zoo 3、修改数据库zoo字符集为gbk 4、选择当前数据库为zoo 5、查看创建数据库zoo信息 6、删除数据库zoo 二、创建表 1、创建一个名称为db_system的数据库 2、在该数据库下创建两张表，具体要求如下员工表 user…

阅读更多...

智慧校园-资产管理系统总体概述

智慧校园-资产管理系统总体概述

智慧校园资产管理系统是面向教育机构设计的一体化数字平台，其核心目标在于通过先进的信息技术手段，全面优化校园内部的资产管理流程。该系统致力于提升资产管理的效率与透明度，同时降低成本并确保所有操作符合财务及审计规范，为校…

阅读更多...

高效PD，稳定传输，LDR6023CQ芯片，打造顶级直播体验

高效PD，稳定传输，LDR6023CQ芯片，打造顶级直播体验

在当今市场，一款备受瞩目的直播神器——无线领夹麦克风（MIC），正风靡于网红直播、在线教育、专业采访、高清视频录制及视频会议等多个领域。麦克风，这一昔日课堂上的常见设备，已随着科技的飞速发展而焕然一新…

阅读更多...

GRPC使用之HelloWorld

GRPC使用之HelloWorld

使用grpc的好处是提供高效的序列化能力，能够跨语言进行调用。这一节我们来学习grpc的入门应用，整篇文章分成3部分: 接口定义，使用grpc的IDL，创建proto文件，编译/生成grpc文件服务端开发，处理客户端请求&am…

阅读更多...

wsl安装Linux系统到指定位置

wsl安装Linux系统到指定位置

默认情况下，wsl安装的系统，会安装到系统C盘，长期下去，很容易把C盘的空间消耗完，从而影响系统的正常运行，所以我建议是将wsl所有的系统都安装到其它磁盘中，便于维护。 1、导出镜像通过wsl -l -v 查看当前已安装的系统版本。导出到当前目录位置，也可以指定目录位置。 w…

阅读更多...

CQ 社区版2.13.3 | 支持全局开启OTP登录、文本导入功能可独立控制……

CQ 社区版2.13.3 | 支持全局开启OTP登录、文本导入功能可独立控制……

又到一月一度的 CloudQuery 发版时间啦！ 本次版本更新，对多个模块进行了功能的优化和完善，比如将文本导入与 insert 权限脱离使文本导入可单独控制；将工具权限与权限等级脱离，使其能独立授权和提权；操作模…

阅读更多...

【JavaWeb程序设计】JSP编程

【JavaWeb程序设计】JSP编程

目录一、编写JSP页面，在界面上显示1-9，9个链接，单击每个链接，能够在另一个页面打印该数字的平方。 1. 运行截图 2. 第一个jsp页面（index.jsp） 3. 第二个jsp页面（square.jsp） 二…

阅读更多...

Purple Pi OH 更改SDK的编译选项

Purple Pi OH 更改SDK的编译选项

本文适用于在Purple Pi OH开发板更改SDK编译选项。触觉智能的Purple Pi OH鸿蒙开源主板，是华为Laval官方社区主荐的一款鸿蒙开发主板。该主板主要针对学生党，极客，工程师，极大降低了开源鸿蒙开发者的入门门槛，具有以下…

阅读更多...

【一念发动便是行】念头，就是命运

【一念发动便是行】念头，就是命运

一个个恶念累积就是负能量，念头就是命运，克除恶念，防范念头，念头都有能量，学圣学须内外庄严检肃，言语有灵多数人的问题都是出在念头上，念头，就是自己的命运； 当我们对自…

阅读更多...

12 Dockerfile详解

12 Dockerfile详解

目录 1. Dockerfile 2. Dockerfile构建过程 2.1. Dockerfile编写规则： 2.2. Docker执行Dockerfile的大致流程 2.3. 总结 3. Dockerfile指令 3.1. FROM 3.2. MAINTAINER 3.3. RUN 3.4. EXPOSE 3.5. WORKDIR 3.6. USER 3.7. ENV 3.8. VOLUME 3.9. ADD …

阅读更多...

51单片机STC89C52RC——14.1 直流电机调速

51单片机STC89C52RC——14.1 直流电机调速

目录目的/效果 1：电机转速同步LED呼吸灯 2 通过独立按键控制直流电机转速。一，STC单片机模块二，直流电机 2.1 简介 2.2 驱动电路 2.2.1 大功率器件直接驱动 2.2.2 H桥驱动正转反转 2.2.3 ULN2003D 引脚、电路 2.3 PWM&…

阅读更多...

大模型LLMs概述：利用大模型 (LLMs) 解决信息抽取任务

大模型LLMs概述：利用大模型 (LLMs) 解决信息抽取任务

论文标题：Large Language Models for Generative Information Extraction: A Survey 论文链接：https://arxiv.org/pdf/2312.17617.pdf 论文主要探讨了大型语言模型（LLMs）在生成式信息抽取（IE）任务中的应用…

阅读更多...

知识库系统平台管理与优化

知识库系统平台管理与优化

在之前做的关于FAQ知识库问答系统中，总结了相关踩坑内容，梳理如下，供大家参考。系统平台的管理与优化对于企业来说至关重要，它不仅关乎数据处理的效率，还直接影响到用户体验和业务成果。本文将从系统平台管理方式、系统…

阅读更多...

World of Warcraft [CLASSIC] Talent Tree

World of Warcraft [CLASSIC] Talent Tree

World of Warcraft [CLASSIC] Talent Tree 天赋树模拟器 01）初始化整个页面，选择游戏职业，初始化3个天赋树 02）初始化天赋树结构，层次为N层 03）每层有4个技能，设置可显示，设置隐藏…

阅读更多...

通用代码生成器模板体系，语句和语句组

通用代码生成器模板体系，语句和语句组

通用代码生成器或者叫动词算子式通用目的代码生成器是一组使用Java编写的通用代码生成器。它们的原理基于动词算子和域对象的笛卡尔积。它们没有使用FreeMarker和或者Velocity等现成的文件式模板引擎。而是使用java语言开发了一套专门为动词算子式代码生成器使用的模板API。而其…

阅读更多...

uniapp启动安卓模拟器mumu

uniapp启动安卓模拟器mumu

mumu模拟器下载 ADB： android debug bridge ， 安卓调试桥，是一个多功能的命令行工具，他使你能够与连接的安卓设备进行交互 # adb连接安卓模拟器 adb connect 127.0.0.1:port # 查看adb设备 adb deviceshubuilderx 有内置的adb&a…

阅读更多...

使用 Git Hooks 防止敏感信息泄露

使用 Git Hooks 防止敏感信息泄露

欢迎关注公众号：冬瓜白在日常开发中，我们可能会不小心将敏感信息提交到 Git。为了防止这种情况，可以利用 Git Hooks 编写一个简单的脚本，当发现提交中包含敏感词时，给出提示。以下是一个基于 pre-commit 钩子的示例…

阅读更多...

【MindSpore学习打卡】应用实践-计算机视觉-深入解析 Vision Transformer（ViT）：从原理到实践

【MindSpore学习打卡】应用实践-计算机视觉-深入解析 Vision Transformer（ViT）：从原理到实践

在近年来的深度学习领域，Transformer模型凭借其在自然语言处理（NLP）中的卓越表现，迅速成为研究热点。尤其是基于自注意力（Self-Attention）机制的模型，更是推动了NLP的飞速发展。然而&#xff0c…

阅读更多...

Git代码提交流程

Git代码提交流程

1. 核心流程 2. 完成流程

阅读更多...

最新文章