前言
Stable Diffusion是一种深度学习模型,它能够根据提示词生成高质量的图像。在Stable Diffusion模型中,提示词起着至关重要的作用,因为它们为模型提供了关于所需输出的指导。本文将探讨Stable Diffusion关于提示词的原理,包括提示词的选择、处理和影响模型输出的因素。通过深入了解这些原理,我们可以更好地利用Stable Diffusion模型生成令人惊叹的图像,并探索其在各个领域的应用潜力。
Stable Diffusion 是一种深度学习模型,它能够根据文本提示生成高质量的图像。这种模型通过训练学习了大量文本与图像之间的关系,从而能够“理解”文本提示并生成与之匹配的图像。
具体来说,Stable Diffusion 的嵌入层(Embedding Layer):这一部分将输入的文本提示转化为模型能够理解的数值表示,即嵌入向量。嵌入层通常使用词袋模型(Bag of Words)或者更复杂的模型如 Transformer 来实现。
而Stable Diffusion 的安装颇为复杂,这里可以使用好易智算平台
提示词原理
基础内容
在使用Stable Diffusion模型时,提示词的正确格式和选择对于生成高质量的图像至关重要。以下是一些关于如何优化提示词的建议和示例:
-
使用英文逗号分隔提示词:确保每个提示词之间使用英文逗号分隔,这样可以清晰地定义每个提示词,帮助模型理解。
示例:sunset, beach, serene
-
使用换行和结尾逗号:如果提示词较长或者需要分组,可以使用换行来增加可读性,并在每个提示词或组的末尾加上逗号。
示例:mountain landscape, vibrant colors, high resolution, detailed textures, featuring a prominent peak, with a clear blue sky, and a peaceful river flowing, in a serene and tranquil setting,
-
控制提示词数量:虽然提示词可以提供丰富的信息,但过多的提示词可能会导致模型混淆。建议将提示词数量控制在75个单词以内,以确保每个提示词都能有效地影响图像生成。
示例:starry night, city skyline, neon lights, bustling streets, modern architecture
-
权重分配:在提示词前加上括号和数字可以指定权重,越靠前的提示词通常具有更高的权重。如果不指定权重,默认权重为1。
示例:((majestic)), ( elephant), walking, [through], [ savannah]
-
避免过度堆砌提示词:选择提示词时,应选择最能描述所需图像核心特征的词汇,避免使用冗余或不相关的词汇。
示例:vintage camera, rustic wooden table, soft natural light
而不是vintage camera, old, retro, rustic wooden table, brown, aged, soft natural light, warm tones, antique
通过遵循这些优化提示词的建议,您可以更有效地指导Stable Diffusion模型生成符合您期望的图像。记住,提示词的质量比数量更重要,选择精准而相关的提示词将有助于模型更好地理解您的意图。
各个符号的意义
在使用Stable Diffusion模型时,各种符号的运用对于精确控制图像生成至关重要。以下是对各个符号意义的详细解释和示例,以帮助您更好地理解和使用这些工具。
- 小括号 (),中括号 [],大括号 {}:
- 尖括号 <>:
- 尖括号 <>:用于调用LoRA(Low-Rank Adaptation)模型,这是一种微调技术,可以用于特定的风格或细节控制。
示例:<艺术家名:权重>
。在这个例子中,"艺术家名"是LoRA模型的名称,"权重"是一个数值,用于控制该模型对图像生成的影响程度。
- 尖括号 <>:用于调用LoRA(Low-Rank Adaptation)模型,这是一种微调技术,可以用于特定的风格或细节控制。
- 下划线 _:
- 下划线 _:用于连接单词,使模型将它们视为一个整体,而不是单独的元素。
示例:chocolate,Cake
和chocolate_Cake
。前者表示巧克力和蛋糕是分开的元素,而后者则表示它们是一个整体的"巧克力蛋糕",这有助于模型更准确地理解和生成图像。
- 下划线 _:用于连接单词,使模型将它们视为一个整体,而不是单独的元素。
通过巧妙地使用这些符号,您可以更精细地控制Stable Diffusion模型的输出,实现您想要的图像效果。记住,实验和调整是找到最佳提示词组合的关键。
进阶语法
控制提示词的生效时间
- [提示词:0-1数值]
FOREST , LOTS OF TREES ANO STOHES ,[FLOWERS: 0.7]
这个含义是等到采样到百分之70才开始花的采样
- [提示词 :: 0-1数值]
FOREST , LOTS OF TREES ANO STOHES ,[FLOWERS:: 0.7]
这个含义是等到采样到百分之70之后就不再计算花的采样了
- 提示词1 : 提示词2 : 0-1数值]
[stone : flower :0.7],
这个含义是前百分之70是石头生效,后百分之三十是花朵进行采样
- [提示词1|提示词2]交替采样
1GIRL,[red I blue] HAIR,
在了解了Prompt的基础内容之后,我们可以使用好易智算平台来试试吧!
提示词推荐格式
1. 画质词 + 画风词
首先,让我们来看看那些与画质相关的关键词。
- masterpiece:1.2
这个词意味着插画作品具有极高的艺术价值和技巧性。1.2可能是指作品的评分或是某种特定的标准,但无论如何,它都强调了作品的卓越品质。 - best quality
这无疑是对于插画作品最高标准的赞美。它表明作品在细节、色彩和表现力等方面都达到了极致的水平。 - highres,extremely detailed CG
highres指的是高分辨率,而extremely detailed CG则是指 extremely detailed CG(计算机生成的图像)。这意味着作品中的每一个细节都经过精心雕刻,甚至连头发丝都能清晰地看到。 - perfect lighting
完美的光线处理是高品质插画作品的关键之一。通过巧妙地运用光线,艺术家们能够为作品增添深度和立体感,使人物或物体更加生动逼真。 - 8k wallpaper
8k 是一种超高分辨率的显示技术,其分辨率远高于传统的全高清(1080p)屏幕。这意味着作品可以在大型屏幕上呈现出更加细腻和清晰的视觉效果。
接下来,我们再来看看现实系关键词:
- photograph
这个词通常用来形容非常接近现实的作品。它要求作品中的元素和场景必须具有高度的真实性和细节。 - photorealistic
这是一个更加强调作品真实性的术语。它意味着作品几乎就像一张真实的照片一样,具有极高的视觉相似度。
然后是插画风的关键词:
- illustration
插画风通常指的是具有故事性和艺术性的绘画作品。它强调作品的表现力和创意性。 - painting
这个词通常用于描述具有传统绘画风格的作品。它可能包括油画、水彩画或其他类型的绘画技巧。 - paintbrush
画笔是插画创作中常用的工具之一。这个词可能暗示着作品采用了手绘的风格,或者是用数字工具模仿传统绘画的效果。
二次元风格的关键词: - anime
anime 是日本动画的英文缩写。它通常指的是具有鲜明个性、夸张特征和丰富情感的日本卡通角色。 - comic
comic 指的是漫画。它通常包括连续的故事情节和生动的插图。 - game CG
game CG 指的是游戏中的计算机生成的图像。它通常用于游戏场景、角色和特效的制作。
最后,我们来看三维场景的关键词: - 3D
3D 是一种常见的插画表现形式。它通过创建立体的空间感和透视感来增强作品的真实感和动态感。 - C4D render
C4D 是 Cinema 4D 的缩写,这是一种流行的 3D 建模和渲染软件。render 指的是渲染过程,即通过软件将 3D 模型转换为二维图像的过程。 - unreal engine,octane render
unreal engine 和 octane render 都是先进的图形渲染引擎。它们可以帮助艺术家更轻松地创建出高质量的三维场景和角色。
至于画风词
Cyberpunk 赛博朋克
8bit/16bit pixel 像素风
studio ghibli 宫崎骏风格
pixel style 皮克斯风格
Chinese ink style 水墨画
2.画面主体描述:
- 人物:一位年轻的女性
- 年龄:大约25岁
- 发型:长发,自然卷曲
- 头发颜色:深棕色
- 情绪表情:自信而略带神秘微笑,清晰详细的面孔
- 衣服装束:时尚的黑色皮夹克,搭配牛仔裤和白色运动鞋
- 正在于什么:她正站在一个充满未来科技感的城市街头,似乎在等待着某人或某事的发生。
3.环境,场景,灯光,构图:
- 环境:一个充满未来科技感的城市,高楼大厦和LED屏幕构成了城市的背景。
- 场景:夜晚的街头,路灯和霓虹灯光营造出一种神秘而温馨的氛围。
- 灯光:主要来自路灯和霓虹灯,为场景增添了一种独特的色彩。
- 构图:以人物为中心,城市建筑和灯光为背景,形成了一种深度和立体感。
4. lora模型:
- 提示词:
<lora:cyberpunk_20230617024306:1>,
5. 负面词
NSFW, [worst quality:2], [low quality:2], [normal quality:2], lowres, normal quality, [[monochrome]],[(grayscale)], skin spots, acnes, skin blemishes, age spot, [ugly:1.331], [duplicate:1.331], [morbid:1.21], [extra legs:1.331], [fused fingers:1.5], [too many fingers:1.5], [unclear eyes:1.331], lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, [[extra arms and legs]]
NSFW,【最差质量:2】,【低质量:2】,【正常质量:2】,低分辨率,正常质量,【【单色调】】,【(灰度)】,皮肤斑点,痤疮,皮肤瑕疵,老年斑,【丑陋:1.331】,【重复:1.331】,病态:1.21】 ,【多腿:1.331】 ,【手指融合:1.5】 ,【手指太多:1.5】 ,【【模糊的眼睛:1.331】】,降低,坏手,缺失的手指,多余的手指,坏手,缺失的手指
prompt - all -in - one
在好易智算平台中,已经集成了完整的提示词插件!,如图其插件内提供了大量的提示词和基础的常用模型供我们使用
我们可以直接输入中文,会自动进行翻译
还有一键翻译,等等,赋予了prompt强大的功能,使得我们书写提示词更加的方便