ComfyUI中使用 SD3 模型(附模型下载详细说明)

文章目录

  • 背景
  • 安装
    • 方式一
    • 方式二
  • 测试

背景

StabilityAI近日开源了Stable Diffusion 3 Medium,简称 SD3,该模型拥有着20亿参数。其特点如下:

  • 提升了整体图片的质量、真实感
  • 提供了三种文本编码器可组合使用,有助于在性能和效率之间做出权衡。同时在空间推理、构图元素、动作、风格理解能力有了更大的提升
  • 提升了文本质量,减少拼写、字距调整、字母形成和间距方面的错误
  • VRAM 占用空间小,资源高效利用,适合在消费级GPU上运行
  • 通过小数据集可以进行更加精细化的微调,适合模型的定制

放一组官方的图体验下

在这里插入图片描述

安装

如果之前安装过ComfyUI,则直接进入ComfyUI根目录打开Git Bash工具,输入命令git pull即可更新ComfyUI,最新的ComfyUI已经支持SD3的运行了。

SD3相关模型的下载地址为:https://huggingface.co/stabilityai/stable-diffusion-3-medium/tree/main

在这里插入图片描述

那么,这些模型该如何使用呢?

方式一

如果你不想单独在ComfyUI中加载CLIP文本编码器模型,那么可以下载
fp8精度的sd3_medium_incl_clips_t5xxlfp8.safetensors
或者fp16精度的sd3_medium_incl_clips_t5xxlfp16.safetensors
或者sd3_medium_incl_clips.safetensors
这三个模型都内嵌了VAE以及文本编码器模型,所以下载下来直接使用即可
在这里插入图片描述

方式二

如果想将文生图模型、文本编码器模型分开使用,那么,只需要下载文生图模型sd3_medium.safetensors,以及编码器模型clip_g.safetensorsclip_l.safetensorst5xxl_fp8_e4m3fn.safetensors(可选)t5xxl_fp16.safetensors(可选),然后将下载的编码器模型放在ComfyUImodels\clip目录下,如果要放在Stable Diffusion WebUI models\clip目录下,那么需要修改下ComfyUI的配置文件extra_model_paths.yaml,将Stable Diffusion WebUI models\clip目录添加到该配置文件夹中,修改完配置文件需要重启ComfyUI

在这里插入图片描述

然后在ComfyUI中添加TripleCLIPLoader节点来加载文本编码器模型clip_g.safetensorsclip_l.safetensorst5xxl_fp8_e4m3fn.safetensors(可选)t5xxl_fp16.safetensors(可选)
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

其中,t5xxl类型的文本编码器有助于增强模型对prompt的理解能力!
此外,sd3_medium_incl_clips.safetensors模型并没有内嵌t5xxl类型的编码器。

测试

使用StabilityAI官方的测试prompt进行测试。工作流如下:
在这里插入图片描述

反向prompt统一为

bad quality, poor quality, doll, disfigured, jpg, toy, bad anatomy, missing limbs, missing fingers, 3d, cgi
  • a female character with long, flowing hair that appears to be made of ethereal, swirling patterns resembling the Northern Lights or Aurora Borealis. The background is dominated by deep blues and purples, creating a mysterious and dramatic atmosphere. The character’s face is serene, with pale skin and striking features. She wears a dark-colored outfit with subtle patterns. The overall style of the artwork is reminiscent of fantasy or supernatural genres
    在这里插入图片描述
  • Digital art, portrait of an anthropomorphic roaring Tiger warrior with full armor, close up in the middle of a battle, behind him there is a banner with the text “Open Source”.

在这里插入图片描述

  • photo of a dog and a cat both standing on a red box, with a blue ball in the middle with a parrot standing on top of the ball. The box has the text “SD3”
    在这里插入图片描述

  • selfie photo of a wizard with long beard and purple robes, he is apparently in the middle of Tokyo. Probably taken from a phone.
    在这里插入图片描述

  • A vibrant street wall covered in colorful graffiti, the centerpiece spells “SD3 MEDIUM”, in a storm of colors
    在这里插入图片描述

  • photo of a young woman with long, wavy brown hair tied in a bun and glasses. She has a fair complexion and is wearing subtle makeup, emphasizing her eyes and lips. She is dressed in a black top. The background appears to be an urban setting with a building facade, and the sunlight casts a warm glow on her face.
    在这里插入图片描述

  • anime art of a steampunk inventor in their workshop, surrounded by gears, gadgets, and steam. He is holding a blue potion and a red potion, one in each hand
    在这里插入图片描述

  • photo of picturesque scene of a road surrounded by lush green trees and shrubs. The road is wide and smooth, leading into the distance. On the right side of the road, there’s a blue sports car parked with the license plate spelling “SD32B”. The sky above is partly cloudy, suggesting a pleasant day. The trees have a mix of green and brown foliage. There are no people visible in the image. The overall composition is balanced, with the car serving as a focal point.
    在这里插入图片描述

  • photo of young man in a black suit, white shirt, and black tie. He has a neatly styled haircut and is looking directly at the camera with a neutral expression. The background consists of a textured wall with horizontal lines. The photograph is in black and white, emphasizing contrasts and shadows. The man appears to be in his late twenties or early thirties, with fair skin and short, dark hair.
    在这里插入图片描述

  • photo of a woman on the beach, shot from above. She is facing the sea, while wearing a white dress. She has long blonde hair
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/712812.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

iOS18新增通话录音和应用锁!附升级教程及内置壁纸

一觉睡醒,iOS18终于是揭开面纱了,而且已经有测试版给开发者使用了。 不过还是建议咱们普通用户不要轻易尝试,而且在升级之前一定要用iMazing做个备份,以免测试系统出现问题,丢失数据。 这次WWDC2024与之前爆料完全一样…

【计算机网络仿真实验-实验2.6】带交换机的RIP路由协议

实验2.6 带交换机的rip路由协议 1. 实验拓扑图 2. 实验前查看是否能ping通 不能 3. 三层交换机配置 switch# configure terminal switch(config)# hostname s5750 !将交换机更名为S5750 S5750# configure terminal S5750(config)#vlan 10 S5750(config-vlan)#exit S57…

面向事件编程之观察者模式

前言 村里的老人常说:真男人就该懂得遵守“三不原则”——不主动、不拒绝、不负责。 一个复杂的软件系统,其中必然会存在各种各样的“对象”,如果在设计之初没有注意控制好耦合度,导致各个对象甚至是函数之间高度耦合&#xff0…

工业自动化领域常见的通讯协议

工业自动化领域常见的通讯协议,包括PROFINET、PROFIBUS、Modbus、Ethernet/IP、CANopen、DeviceNet和BACnet。通过分析这些协议的技术特点、应用场景及优势,比较它们在工业自动化中的性能和适用性,帮助选择最合适的协议以优化系统性能和可靠性…

记录AE快捷键(持续补充中。。。)

记录AE快捷键 快捷键常用快捷键图层快捷键工具栏图层与属性常用指令视图菜单时间轴常规快捷键项目首选项功能摄像机操作 常用操作导入AI/PS工程文件加选一个关键参数快速回到上下一帧隐藏/显示图层关键帧拉长缩短关键帧按着鼠标左键不松手,在秒表那一列往下移动会都…

为什么电源滤波器中的电容器太大

所有 AC-DC 转换器,无论是线性电源还是具有某种开关元件,都需要一种机制来获取交流侧的变化功率并在直流侧产生恒定功率。通常,大滤波电容器用于在交流功率高于直流负载所需时吸收和存储能量,并在交流功率低于所需时向负载提供能量…

常用的JDK调优监控工具整理

JVM 调优首先要做的就是监控 JVM 的运行状态,这就需要用到各种官方和第三方的工具包了 一、 JDK 工具包 JDK 自带的 JVM 工具可以分为命令行工具和可视化工具 命令行工具 jps: JVM Process status tool:JVM进程状态工具,查看进程基本信息j…

DomoAI让你轻松变身视频达人!支持20s完整视频生成!

账号注册 官网:https://www.domoai.app/zh-Hant/library 功能 支持不同风格的视频类型,支持图片转视频,支持文字转图片,支持静态图片变为动态。 可以切换语言为中文 风格转换 选择不同风格的 支持生成20s,目前接触…

0. 云原生之基于乌班图远程开发

云原生专栏大纲 文章目录 安装乌班图配置静态IP重置root密码开启root远程登录开启远程SSH访问安装docker安装docker-compose安装Edge浏览器安装搜狗输入法安装TeamViewer安装虚拟显示器安装JDK安装maven安装vscodevscode插件安装VSCode配置maven、git、jdk、自动报错vscode快捷…

2024年【陕西省安全员C证】考试及陕西省安全员C证最新解析

题库来源:安全生产模拟考试一点通公众号小程序 陕西省安全员C证考试参考答案及陕西省安全员C证考试试题解析是安全生产模拟考试一点通题库老师及陕西省安全员C证操作证已考过的学员汇总,相对有效帮助陕西省安全员C证最新解析学员顺利通过考试。 1、【多…

树以及二叉树的定义和特点

目录 开场白 树的定义 结点的分类 结点间的关系 树的其他相关概念 树的存储结构 孩子兄弟表示法 二叉树的定义 二叉树的特点 特殊二叉树 满二叉树 完全二叉树 二叉树的性质 二叉树的存储结构 开场白 这一篇文章是关于树的知识,这是一个比较特…

Python 学习 用Python第二册 第9章内容解八皇后问题

----用教授的方法学习 目录 1.八皇后问题 2.状态表示(抽象) 3.检测冲突 4.基线条件 5.递归条件 6.结尾 1.八皇后问题 深受大家喜爱的计算机科学谜题:你需要将8个皇后放在棋盘上,条件是任何一个皇后都不能威胁其他皇后,即任何两个皇后…

利用485缓存器实现两主一丛RS485串行通信

作者:艺捷自动化,其旗下产品有艺捷自动化网站和易为二维码小程序(微信) 对于工控自动化领域的电气工程师来说,基于RS485的串行通讯是最常见的。绝大部分仪表都能支持这种通讯方式。RS485通讯,是一种异步半双工模式&…

誉天5月红帽战报:恭喜14名学员通过RHCE认证,通过率87.5%!

红帽认证是全球公认的Linux权威认证之一,对于Linux从业者来说具有很高的价值和认可度。旨在评估考生在Linux系统管理和应用方面的专业知识和技能。红帽考试是Linux从业者提升自身技能水平和职业竞争力的重要途径之一。 5月份,誉天14名学员通过了RHCE认证…

css入门宝典

3.1.4 通配符选择器 语法 : *{} 作用 : 让页面中所有的标签执行该样式,通常用来清除间距 例子 : *{ margin: 0; //外间距 padding: 0; //内间距 } 一 CSS基本语法 1基础知识 1.1概述 Css (层叠样式表)是种格式化网页的标准方式, 用于控制设置网页的样式&#xff…

WSL Ubuntu安装TensorFlow-GPU、PyTorch-GPU

在Windows 11的WSL Ubuntu中安装TensorFlow-GPU、PyTorch-GPU 0、WSL Ubuntu安装 在Windows 11的商店中下载即可,此处以Ubuntu22.04.3为例 1、CUDA Toolkit安装 参考公孙启的文章Windows11 WSL Ubuntu Pycharm Conda for deeplearning前往nVidia官网下载CUDA …

transformer模型首次体验代码

前言 首先是安装python,更新pip源到清华源。安装transformer pip install transformer安装jupyter lab,也简单一行 pip install jupyterlab现在不想用anaconda了,因为国内没有源了,国外的又慢。直接用pip吧。 然后开始体验之旅…

DeepDriving | CUDA编程-05:流和事件

本文来源公众号“DeepDriving”,仅用于学术分享,侵权删,干货满满。 原文链接:CUDA编程-05:流和事件 1 CUDA流 在CUDA中有两个级别的并发:内核级并发和网格级并发。前面的文章DeepDriving | CUDA编程-04&…

buildroot编译出错you should not run configure as root

虚拟机版本:ubuntu-22.04.4 问题 buildroot在图形配置后,执行 sudo make开始编译出现以下错误configure: error: you should not run configure as root (set FOenvironment to bypass this check) 在网上看到说在/etc/profile文件中添加以下内容 exp…

Ngunx + Tomcat 负载均衡和动态分离

目录 一、tomcat简介 二、Nginx 负载均衡 1. Nginx 应用 2. Nginx 负载均衡实现原理 2.1 正向代理 2.2 反向代理 2.3 具体过程接收请求:Nginx作为反向代理服务器,接收客户端的请求。选择后端服务器:根据预先配置的负载均衡算法&#xf…