文本生图的提示词prompt和参数如何设置(基于Animagine XL V3.1)

昨天搞了半天 Animagine XL V3.1,发现市面上很多教程只是授之以鱼,并没有授之以渔的。也是,拿来赚钱不好吗,闲鱼上部署一个 Deepseek 都能要两百块。这里我还是想写篇文章介绍一下,虽不全面,但是尽量告诉你一些资料如何去找,或者让你能自己写出来,不是一味的复制粘贴。

首先 Stable Diffusion WebUI 的界面如下:
请添加图片描述

接下来我只介绍比较关键的或者能用到的,而且只简单介绍一下,后面会有相关演示:

  • Stable Diffusion checkpoint:这是你选择的模型,位置在stable-diffusion-webui/models/Stable-diffusion
  • Prompt:这个是正向提示词,也就是你想生成什么样的内容。
  • Negative Prompt:这个是反向提示词,也就是你不想生成的内容。
  • Sampling steps:这个是采样率,数值越大,画面细节越多。
  • Width 和 Height:这个是生成画面的宽和高。需要注意,这玩意和画面细节也挂钩,如果小的话生成的细节也少。
  • Batch count:生成的图像批次数。它更高可以降低生成的噪音。
  • Batch size:这个是每次生成几张图,调高需要更大显存,不然速度会慢一些。
  • CFG Scale:这个是遵循 prompt 的严格程度。一般为 7-12,如果你 prompt 写的很细,需要更多的细节,那么可以使用12-16 更高的。当然如果你想让他随机发挥,更低的也行。
  • Seed:这个是“种子”,如果你很满意一张图,那么就保留这个种子,然后修改其他参数进行调整,这样变化就不会那么随机。默认的-1就表示随机生成一个种子。

参数演示

我们首先不演示 Prompt 和 Negative Prompt,先来演示一下其他的参数。因为这两个比较复杂。

下面使用的 Prompt 如下:

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

下面使用的 Prompt 如下:

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

Width 和 Height

前面提到,宽和高是和画面细节挂钩的,比如 512x512 与 1024x1024 的差别如下(Seed 为 3503979678,Sampling steps 为 20,CFG Scale 为 7):

请添加图片描述
请添加图片描述

你可以看到这两张图的细节完全不是一个量级的。

此外,宽高也会影响生成效果。比如 512x1024、1024x1024 与 1024x2048 的差别如下:

请添加图片描述
请添加图片描述

请添加图片描述

需要注意,由于 SD 使用 1024x1024 训练,所以“宽+高”是 1024 的倍数的效果会好一些。一般比例如下:

  • 1:1: 1024x1024, 768x768
  • 3:2: 1152x768
  • 2:3: 768x1152
  • 4:3: 1152x864
  • 3:4: 864x1152
  • 16:9: 1360x768
  • 9:16: 768x1360

Sampling steps

采样率可以提高画面的细节,一般使用 30-40 就足够了。一般宽高有一个不足 1024 的情况下,选择 20 比较合适,1024 往上选择 35 左右。

比如上面同样的参数,Sampling steps 提高为 35,如下:
请添加图片描述
脸部和背景的细节会更多,颜色的层次一也更丰富,你可以放大看头发部分。

Batch count和Batch size

Batch count:生成的图像批次数。Batch size:这个是每次生成几张图。

需要注意:尽管我们设置了种子,到那时 Batch count 和 Batch count 还是会改变种子,比如下面演示的四张图,种子是 3503979678~3503979681。

Batch count 调整为 4,Batch size 为 1,生成图如下。
请添加图片描述

Batch count 调整为 1,Batch size 为 2。可以看到他是一起生成两张图的。
请添加图片描述

生成图如下:

请添加图片描述

Seed

Seed 是种子,也就是“基础”。上面演示 Batch count 和 Batch size 你也看到了,种子的变化会导致画面内容的变化。

这里说明一下如何查看种子。

首先,生成之后,图片下面的内容中有说明:

请添加图片描述

此外,输出位置stable-diffusion-webui/output中的文件名中就记录了种子,这样想找到之前的种子也很方便了。

请添加图片描述

不过还是演示一下生成 4 张图是什么样的:

请添加图片描述

可以看到差别要比种子只差 1 的差别更大。

Prompt 和 Negative Prompt

Prompt 和 Negative Prompt 是最关键的部分了。

首先我们看一下之前的 Prompt 和 Negative Prompt,了解一下常见的一些 prompt。

Prompt

1girl, looking at viewer, wool coat, fur collar,smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

这个参数按顺序是:一个女孩(1girl),看着镜头(looking at viewer),羊毛大衣(wool coat),毛领(fur collar),微笑(smile),站在山坡上(standing on a hillside),下雪中(snowfall),背景是山脉(mountains in the background),杰作(masterpiece),高质量(best quality),非常美观(very aesthetic),1990 年代的风格(1990s style),复古艺术风格(retro artstyle)

可以看到包含人物,姿态,衣服,表情,背景等多种信息。

Negative Prompt

这个 Negative Prompt 是我常用的,很多情况下都很适合。

lowres, bad anatomy, displeasing, ugly, fewer digit, extra digit, missing fingers, bad hands, blurry, (low quality, worst quality:1.3) 

这个参数按顺序是:低分辨率(lower),不好的身体结构(bad anatomy,直翻是不好的解刨学),令人不愉快的(displeasing),丑陋的(ugly),低颜色位数(fewer digit),多手指(extra digit),缺少手指(missing fingers),不好的手(bad hands),模糊的(blurry),(低质量,最差质量1.3)((low quality, worst quality:1.3))。

可以看到主要防止是手不行。其他的就是要画质好点。

艺术家风格

Animagine XL V3.1 里不光可以通过上面的1990s style, retro artstyle,指定风格,也可以通过艺术家风格,方法是在 prompt 中加上(艺术家:1.3)

艺术家列表有个神人做了张图,你可以在 Animagine XL v3.1 - Artists’ Style Sheet. 看到,其中一张如下:

请添加图片描述

好了现在弄一下生成图。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (tinnies:1.3)

生成图如下:

请添加图片描述

再换个艺术家。

1girl, looking at viewer, wool coat, fur collar, smile, standing on a hillside, snowfall, mountains in the background, masterpiece, best quality, very aesthetic, (sekina:1.3)

生成如下:

请添加图片描述

授之以渔:Danbooru tags

Danbooru tags是什么

其实你看我之前的用的,会发现都是一个个短语,并不是句子,但是如何知道用哪些短语呢?

有一个网络数据库叫做 Danbooru tags,它里面记录了包括风格、动作、表情、物品等多种信息,当然也包含一些 NSFW 的内容。

请添加图片描述

比如说慌张(flustered),它的介绍界面如下,其中还包含一些示例,让你更直观的看到:

请添加图片描述

如何使用Danbooru tags

下面用表情和背景演示一下:

表情

之前表情用的是微笑(smile),那我们改成慌张(flustered)看看,其实我觉得根据示例这个应该叫娇羞,而不是慌张:

请添加图片描述
请添加图片描述

可以看到表情变成娇羞的样子了。

背景

把背景的山改成城市街道(city street in the background),注意把站在山坡删了:

1girl, looking at viewer, wool coat, fur collar,smile, snowfall, city street in the background, masterpiece, best quality, very aesthetic, 1990s style, retro artstyle,

生成图如下:
请添加图片描述

如果没删站在山坡:
请添加图片描述

更多的 Prompt 使用你可以看看 Danbooru tags 自己尝试一下。

希望能帮到有需要的人~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/966059.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于docker搭建Kafka集群,使用内部自带的Zookeeper方式搭建

前提条件 按照【kafka3.8.0升级文档成功搭建kafka服务】 环境:192.168.2.91 192.168.2.93 并以192.168.2.91环境kafka自带的zookeeper作为协调器。 使用基于KRaft方式进行kafka集群搭建教程 搭建kafka-ui可视化工具 1、创建kafka集群节点192.168.2.91 &#xff…

GitPuk快速安装配置教程(入门级)

GitPuk是一款国产开源免费的代码管理工具,工具简洁易用,开源免费,本文将讲解如何快速安装和配置GitPuk,以快速入门上手。 1、安装 支持 Windows、Mac、Linux、docker 等操作系统。 1.1 Linux安装 以下以Centos7安装…

奖励模型中的尺度扩展定律和奖励劫持

奖励模型中的尺度扩展定律和奖励劫持 FesianXu 20250131 at Wechat Search Team 前言 最近在考古一些LLM的经典老论文,其中有一篇是OpenAI于ICML 2023年发表的文章,讨论了在奖励模型(Reward Model)中的尺度扩展规律(S…

ASP.NET Core中Filter与Middleware的区别

中间件是ASP.NET Core这个基础提供的功能,而Filter是ASP.NET Core MVC中提供的功能。ASP.NET Core MVC是由MVC中间件提供的框架,而Filter属于MVC中间件提供的功能。 区别 中间件可以处理所有的请求,而Filter只能处理对控制器的请求&#x…

力扣240 搜索二维矩阵 ll

编写一个高效的算法来搜索 m x n 矩阵 matrix 中的一个目标值 target 。该矩阵具有以下特性: 每行的元素从左到右升序排列。每列的元素从上到下升序排列。 示例 1: 输入:matrix [[1,4,7,11,15],[2,5,8,12,19],[3,6,9,16,22],[10,13,14,17,…

Redis03 - 高可用

Redis高可用 文章目录 Redis高可用一:主从复制 & 读写分离1:主从复制的作用2:主从复制原理2.1:全量复制2.2:增量复制(环形缓冲区) 3:主从复制实际演示3.1:基本流程准…

JAVA安全—FastJson反序列化利用链跟踪autoType绕过

前言 FastJson这个漏洞我们之前讲过了,今天主要是对它的链条进行分析一下,明白链条的构造原理。 Java安全—log4j日志&FastJson序列化&JNDI注入_log4j漏洞-CSDN博客 漏洞版本 1.2.24及以下没有对序列化的类做校验,导致漏洞产生 1.2.25-1.2.41增加了黑名单限制,…

vmware ubuntu 扩展硬盘系统文件大小

首先,在VMware中添加扩展硬盘大小: 通过lsblk指令,可以看到添加的未分配硬盘大小情况: NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS fd0 2:0 1 4K 0 disk loop0 7:0 0 4K 1 loop /snap/bare/5 loop1…

DeepSeek R1 Distill Llama 70B(免费版)API使用详解

DeepSeek R1 Distill Llama 70B(免费版)API使用详解 在人工智能领域,随着技术的不断进步,各种新的模型和应用如雨后春笋般涌现。今天,我们要为大家介绍的是OpenRouter平台上提供的DeepSeek R1 Distill Llama 70B&…

阿里云 | DeepSeek人工智能大模型安装部署

ModelScope是阿里云人工智能大模型开源社区 ModelScope网络链接地址 https://www.modelscope.cn DeepSeek模型库网络链接地址 https://www.modelscope.cn/organization/deepseek-ai 如上所示,在阿里云人工智能大模型开源社区ModelScope中,使用阿里云…

kafka服务端之控制器

文章目录 概述控制器的选举与故障恢复控制器的选举故障恢复 优雅关闭分区leader的选举 概述 在Kafka集群中会有一个或多个broker,其中有一个broker会被选举为控制器(Kafka Controler),它负责管理整个集群中所有分区和副本的状态。…

03/29 使用 海康SDK 对接时使用的 MysqlUtils

前言 最近朋友的需求, 是需要使用 海康sdk 连接海康设备, 进行数据的获取, 比如 进出车辆, 进出人员 这一部分是 资源比较贫瘠时的一个 Mysql 工具类 测试用例 public class MysqlUtils {public static String MYSQL_HOST "192.168.31.9";public static int MY…

【蓝桥杯—单片机】第十一届省赛真题代码题解题笔记 | 省赛 | 真题 | 代码题 | 刷题 | 笔记

第十一届省赛真题代码部分 前言赛题代码思路笔记竞赛板配置内部振荡器频率设定键盘工作模式跳线扩展方式跳线 建立模板明确设计要求和初始状态显示功能部分数据界面第一部分第二部分第三部分调试时发现的问题 参数设置界面第一部分第二部分和第四部分第三部分和第五部分 按键功…

【C语言】数 组与指针:深度剖析与等价表达

博客主页: [小ᶻ☡꙳ᵃⁱᵍᶜ꙳] 本文专栏: C语言 文章目录 💯前言💯数组与指针的基本关系💯数组与指针的互换使用数组下标与指针的等价性 💯六个表达式的等价性💯指针运算的注意事项💯数组…

Explain 是 SQL 查询优化中非常重要的工具,它用于分析 SQL 查询的执行计划

Explain 是 SQL 查询优化中非常重要的工具,它用于分析 SQL 查询的执行计划https://mp.weixin.qq.com/s/QKra-Sp5JoaEPSCqfffOtA

Leetcode—487. 最大连续1的个数 II【中等】Plus

2025每日刷题&#xff08;210&#xff09; Leetcode—487. 最大连续1的个数 II 实现代码 class Solution { public:int findMaxConsecutiveOnes(vector<int>& nums) {int zeros 0;int ans 0;for(int l 0, r 0; r < nums.size(); r) {if(nums[r] 0) {zeros;…

C32.【C++ Cont】静态实现双向链表及STL库的list

目录 1.知识回顾 2.静态实现演示图 3.静态实现代码 1.初始双向链表 2.头插 3.遍历链表 4.查找某个值 4.任意位置之后插入元素 5.任意位置之前插入元素 6.删除任意位置的元素 4.STL库的list 1.知识回顾 96.【C语言】数据结构之双向链表的初始化,尾插,打印和尾删 97.【C…

Docker的镜像

Docker的镜像 一&#xff0e;Docker镜像的概念 镜像是Docker&#xff08;镜像&#xff0c;容器&#xff0c;仓库&#xff09;三大核心概念之一。镜像本质上是一个只读文件&#xff0c;它包含了文件系统、源码、库文件、依赖、工具等运行应用程序所必须的文件。 镜像是由文件…

如何在Windows上使用Docker

引言 WSL2&#xff08;Windows Subsystem for Linux2&#xff09;是微软开发的一种技术&#xff0c;允许在 Windows 操作系统上运行 Linux 环境。它提供了一个兼容层&#xff0c;使得用户可以在 Windows 系统中直接运行 Linux 命令行工具、应用程序和开发工具&#xff0c;而无需…

赛博算命之 ”梅花易数“ 的 “JAVA“ 实现 ——从玄学到科学的探索

hello~朋友们&#xff01;好久不见&#xff01; 今天给大家带来赛博算命第三期——梅花易数的java实现 赛博算命系列文章&#xff1a; 周易六十四卦 掐指一算——小六壬 更多优质文章&#xff1a;个人主页 JAVA系列&#xff1a;JAVA 大佬们互三哦~互三必回&#xff01;&#xf…