Stable Diffusion初体验——提示词指南

前言

Stable Diffusion是一种深度学习模型,它能够根据提示词生成高质量的图像。在Stable Diffusion模型中,提示词起着至关重要的作用,因为它们为模型提供了关于所需输出的指导。本文将探讨Stable Diffusion关于提示词的原理,包括提示词的选择、处理和影响模型输出的因素。通过深入了解这些原理,我们可以更好地利用Stable Diffusion模型生成令人惊叹的图像,并探索其在各个领域的应用潜力。
SD
Stable Diffusion 是一种深度学习模型,它能够根据文本提示生成高质量的图像。这种模型通过训练学习了大量文本与图像之间的关系,从而能够“理解”文本提示并生成与之匹配的图像。

具体来说,Stable Diffusion 的嵌入层(Embedding Layer):这一部分将输入的文本提示转化为模型能够理解的数值表示,即嵌入向量。嵌入层通常使用词袋模型(Bag of Words)或者更复杂的模型如 Transformer 来实现。
而Stable Diffusion 的安装颇为复杂,这里可以使用好易智算平台
好易智算
位置

提示词原理

基础内容

在使用Stable Diffusion模型时,提示词的正确格式和选择对于生成高质量的图像至关重要。以下是一些关于如何优化提示词的建议和示例:

  1. 使用英文逗号分隔提示词:确保每个提示词之间使用英文逗号分隔,这样可以清晰地定义每个提示词,帮助模型理解。
    示例sunset, beach, serene
    在这里插入图片描述

  2. 使用换行和结尾逗号:如果提示词较长或者需要分组,可以使用换行来增加可读性,并在每个提示词或组的末尾加上逗号。
    示例

    mountain landscape,
    vibrant colors,
    high resolution,
    detailed textures,
    featuring a prominent peak,
    with a clear blue sky,
    and a peaceful river flowing,
    in a serene and tranquil setting,
    

    示例

  3. 控制提示词数量:虽然提示词可以提供丰富的信息,但过多的提示词可能会导致模型混淆。建议将提示词数量控制在75个单词以内,以确保每个提示词都能有效地影响图像生成。
    示例starry night, city skyline, neon lights, bustling streets, modern architecture
    示例

  4. 权重分配:在提示词前加上括号和数字可以指定权重,越靠前的提示词通常具有更高的权重。如果不指定权重,默认权重为1。
    示例((majestic)), ( elephant), walking, [through], [ savannah]
    示例

  5. 避免过度堆砌提示词:选择提示词时,应选择最能描述所需图像核心特征的词汇,避免使用冗余或不相关的词汇。
    示例vintage camera, rustic wooden table, soft natural light 而不是 vintage camera, old, retro, rustic wooden table, brown, aged, soft natural light, warm tones, antique
    在这里插入图片描述

通过遵循这些优化提示词的建议,您可以更有效地指导Stable Diffusion模型生成符合您期望的图像。记住,提示词的质量比数量更重要,选择精准而相关的提示词将有助于模型更好地理解您的意图。

提示词基础

各个符号的意义

在使用Stable Diffusion模型时,各种符号的运用对于精确控制图像生成至关重要。以下是对各个符号意义的详细解释和示例,以帮助您更好地理解和使用这些工具。

  1. 小括号 (),中括号 [],大括号 {}
    权重值
  2. 尖括号 <>
    • 尖括号 <>:用于调用LoRA(Low-Rank Adaptation)模型,这是一种微调技术,可以用于特定的风格或细节控制。
      示例<艺术家名:权重>。在这个例子中,"艺术家名"是LoRA模型的名称,"权重"是一个数值,用于控制该模型对图像生成的影响程度。
  3. 下划线 _
    • 下划线 _:用于连接单词,使模型将它们视为一个整体,而不是单独的元素。
      示例chocolate,Cakechocolate_Cake。前者表示巧克力和蛋糕是分开的元素,而后者则表示它们是一个整体的"巧克力蛋糕",这有助于模型更准确地理解和生成图像。
      在这里插入图片描述

通过巧妙地使用这些符号,您可以更精细地控制Stable Diffusion模型的输出,实现您想要的图像效果。记住,实验和调整是找到最佳提示词组合的关键。

进阶语法

控制提示词的生效时间

  1. [提示词:0-1数值]
FOREST , LOTS OF TREES ANO STOHES ,[FLOWERS: 0.7]

这个含义是等到采样到百分之70才开始花的采样
在这里插入图片描述

  1. [提示词 :: 0-1数值]
FOREST , LOTS OF TREES ANO STOHES ,[FLOWERS:: 0.7]

这个含义是等到采样到百分之70之后就不再计算花的采样了
在这里插入图片描述

  1. 提示词1 : 提示词2 : 0-1数值]
[stone : flower :0.7],

这个含义是前百分之70是石头生效,后百分之三十是花朵进行采样
在这里插入图片描述

  1. [提示词1|提示词2]交替采样
1GIRL,[red I blue] HAIR,

在这里插入图片描述

在了解了Prompt的基础内容之后,我们可以使用好易智算平台来试试吧!

在这里插入图片描述

提示词推荐格式

在这里插入图片描述

1. 画质词 + 画风词

首先,让我们来看看那些与画质相关的关键词。
  1. masterpiece:1.2
    这个词意味着插画作品具有极高的艺术价值和技巧性。1.2可能是指作品的评分或是某种特定的标准,但无论如何,它都强调了作品的卓越品质。
  2. best quality
    这无疑是对于插画作品最高标准的赞美。它表明作品在细节、色彩和表现力等方面都达到了极致的水平。
  3. highres,extremely detailed CG
    highres指的是高分辨率,而extremely detailed CG则是指 extremely detailed CG(计算机生成的图像)。这意味着作品中的每一个细节都经过精心雕刻,甚至连头发丝都能清晰地看到。
  4. perfect lighting
    完美的光线处理是高品质插画作品的关键之一。通过巧妙地运用光线,艺术家们能够为作品增添深度和立体感,使人物或物体更加生动逼真。
  5. 8k wallpaper
    8k 是一种超高分辨率的显示技术,其分辨率远高于传统的全高清(1080p)屏幕。这意味着作品可以在大型屏幕上呈现出更加细腻和清晰的视觉效果。
接下来,我们再来看看现实系关键词:
  1. photograph
    这个词通常用来形容非常接近现实的作品。它要求作品中的元素和场景必须具有高度的真实性和细节。
  2. photorealistic
    这是一个更加强调作品真实性的术语。它意味着作品几乎就像一张真实的照片一样,具有极高的视觉相似度。
然后是插画风的关键词:
  1. illustration
    插画风通常指的是具有故事性和艺术性的绘画作品。它强调作品的表现力和创意性。
  2. painting
    这个词通常用于描述具有传统绘画风格的作品。它可能包括油画、水彩画或其他类型的绘画技巧。
  3. paintbrush
    画笔是插画创作中常用的工具之一。这个词可能暗示着作品采用了手绘的风格,或者是用数字工具模仿传统绘画的效果。
    二次元风格的关键词:
  4. anime
    anime 是日本动画的英文缩写。它通常指的是具有鲜明个性、夸张特征和丰富情感的日本卡通角色。
  5. comic
    comic 指的是漫画。它通常包括连续的故事情节和生动的插图。
  6. game CG
    game CG 指的是游戏中的计算机生成的图像。它通常用于游戏场景、角色和特效的制作。
    最后,我们来看三维场景的关键词:
  7. 3D
    3D 是一种常见的插画表现形式。它通过创建立体的空间感和透视感来增强作品的真实感和动态感。
  8. C4D render
    C4D 是 Cinema 4D 的缩写,这是一种流行的 3D 建模和渲染软件。render 指的是渲染过程,即通过软件将 3D 模型转换为二维图像的过程。
  9. unreal engine,octane render
    unreal engine 和 octane render 都是先进的图形渲染引擎。它们可以帮助艺术家更轻松地创建出高质量的三维场景和角色。
至于画风词
Cyberpunk 赛博朋克
8bit/16bit pixel 像素风
studio ghibli 宫崎骏风格
pixel style 皮克斯风格
Chinese ink style 水墨画

在这里插入图片描述

2.画面主体描述:

  • 人物:一位年轻的女性
  • 年龄:大约25岁
  • 发型:长发,自然卷曲
  • 头发颜色:深棕色
  • 情绪表情:自信而略带神秘微笑,清晰详细的面孔
  • 衣服装束:时尚的黑色皮夹克,搭配牛仔裤和白色运动鞋
  • 正在于什么:她正站在一个充满未来科技感的城市街头,似乎在等待着某人或某事的发生。
    示例

3.环境,场景,灯光,构图:

  • 环境:一个充满未来科技感的城市,高楼大厦和LED屏幕构成了城市的背景。
  • 场景:夜晚的街头,路灯和霓虹灯光营造出一种神秘而温馨的氛围。
  • 灯光:主要来自路灯和霓虹灯,为场景增添了一种独特的色彩。
  • 构图:以人物为中心,城市建筑和灯光为背景,形成了一种深度和立体感。
    在这里插入图片描述

4. lora模型:

  • 提示词:<lora:cyberpunk_20230617024306:1>,

5. 负面词

 NSFW, [worst quality:2], [low quality:2], [normal quality:2], lowres, normal quality, [[monochrome]],[(grayscale)], skin spots, acnes, skin blemishes, age spot, [ugly:1.331], [duplicate:1.331], [morbid:1.21], [extra legs:1.331], [fused fingers:1.5], [too many fingers:1.5], [unclear eyes:1.331], lowers, bad hands, missing fingers, extra digit,bad hands, missing fingers, [[extra arms and legs]]

NSFW,【最差质量:2】,【低质量:2】,【正常质量:2】,低分辨率,正常质量,【【单色调】】,【(灰度)】,皮肤斑点,痤疮,皮肤瑕疵,老年斑,【丑陋:1.331】,【重复:1.331】,病态:1.21】 ,【多腿:1.331】 ,【手指融合:1.5】 ,【手指太多:1.5】 ,【【模糊的眼睛:1.331】】,降低,坏手,缺失的手指,多余的手指,坏手,缺失的手指
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

prompt - all -in - one

在好易智算平台中,已经集成了完整的提示词插件!,如图其插件内提供了大量的提示词和基础的常用模型供我们使用
在这里插入图片描述
我们可以直接输入中文,会自动进行翻译

在这里插入图片描述
在这里插入图片描述

还有一键翻译,等等,赋予了prompt强大的功能,使得我们书写提示词更加的方便
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/753193.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

k8s集群node节点加入失败

出现这种情况&#xff1a; [preflight] FYI: You can look at this config file with kubectl -n kube-system get cm kubeadm-config -o yaml [kubelet-start] Writing kubelet configuration to file "/var/lib/kubelet/config.yaml" [kubelet-start] Writing kub…

计算机网络——数据链路层(数据链路层概述及基本问题)

链路、数据链路和帧的概念 数据链路层在物理层提供服务的基础上向网络层提供服务&#xff0c;其主要作用是加强物理层传输原始比特流的功能&#xff0c;将物理层提供的可能出错的物理连接改造为逻辑上无差错的数据链路&#xff0c;使之对网络层表现为一条无差错的链路。 链路(…

sheng的学习笔记-AI-K均值算法

ai目录&#xff1a;sheng的学习笔记-AI目录-CSDN博客 需要学习前置知识&#xff1a;聚类&#xff0c;可参考 sheng的学习笔记-聚类(Clustering)-CSDN博客 目录 什么是k均值算法 流程 伪代码 数据集 伪代码 代码解释 划分示意图 优化目标 随机初始化 选择聚类数…

酣客的“FFC模式”|白酒商业模式|分润制度顶层架构设计

酣客公社摒弃传统商业模式&#xff0c;提出“心联网”及“FFC模式”的商业模式。 坐标&#xff1a;厦门&#xff0c;我是肖琳 深耕社交新零售行业10年&#xff0c;主要提供新零售系统工具及顶层商业模式设计、全案策划运营陪跑等。 今天和大家分享“酣客”的营销模式&#xff…

Parallels Toolbox for mac(pd工具箱) 6.0.2激活版

Parallels Toolbox 是由 Parallels 公司开发的一款实用工具集合软件&#xff0c;它主要面向使用 Parallels Desktop 的用户&#xff0c;提供了许多方便用户在 macOS 和 Windows 之间进行切换和管理的工具。Parallels Desktop 是一款流行的虚拟化软件&#xff0c;允许用户在 mac…

【24医学顶刊】GANDALF:主动学习 + 图注意力变换器 + 变分自编码器,改善多标签图像分类

GANDALF&#xff1a;主动学习 图注意力变换器 变分自编码器&#xff0c;改善多标签图像分类 提出背景子解法1&#xff1a;多标签信息样本的选择子解法2&#xff1a;生成信息丰富且非冗余的合成样本 例子&#xff1a;胸部X射线图像分析传统方法的操作和局限GaNDLF方法的优势 工…

理解ABP的领域驱动设计

大家好&#xff0c;我是张飞洪&#xff0c;感谢您的阅读&#xff0c;我会不定期和你分享学习心得&#xff0c;希望我的文章能成为你成长路上的垫脚石&#xff0c;让我们一起精进。 关于玩转ABP框架相关的文章&#xff0c;之前在博客园陆续写了《ABP vNext系列文章和视频》&…

电路仿真王者之争:SmartEDA如何领跑业界,打破传统仿真软件格局?

在电子设计领域&#xff0c;电路仿真软件一直扮演着至关重要的角色。它们为工程师们提供了一个虚拟的实验室&#xff0c;可以在不耗费大量实际资源的情况下&#xff0c;进行电路设计、优化和测试。在众多电路仿真软件中&#xff0c;SmartEDA以其独特的优势&#xff0c;逐渐崭露…

嵌入式开发十九:SysTick—系统定时器

在前面实验中我们使用到的延时都是通过SysTick进行延时的。 我们知道&#xff0c;延时有两种方式&#xff1a;软件延时&#xff0c;即CPU 循环等待产生的&#xff0c;这个延时是不精确的。第二种就是滴答定时器延时&#xff0c;本篇博客就来介绍 STM32F4 内部 SysTick 系统定时…

浅谈API生态建设:API安全策略的6项原则

API作为连接系统与应用的桥梁&#xff0c;在助力实现高效业务流程的同时&#xff0c;也不可避免出现资产管理困难、敏感数据泄漏风险骤增等安全问题。前段时间&#xff0c;安全公司Fastly公布了一项重磅调查报告&#xff0c;报告中显示95%的企业在过去1年中遭遇过API安全问题。…

AXI接口简介

AXI接口&#xff0c;全称为Advanced eXtensible Interface&#xff0c;是ARM公司推出的一种高性能、低成本、可扩展的高速总线接口。AXI接口是ARM公司提出的AMBA&#xff08;Advanced Microcontroller Bus Architecture&#xff09;高级微控制器总线架构的一部分。2003年发布了…

简易电阻、电容和电感测量仪-FPGA

通过VHDL语言编写程序用于设计电阻、电容和电感测量仪&#xff0c;通过使用试验箱进行验证是否设计正确&#xff0c;资料获取到咸&#x1f41f;&#xff1a;xy591215295250 \\\或者联系wechat 号&#xff1a;comprehensivable 设计并制作--台数字显示的电阻、电容和电感参数测试…

07-border布局的另一个用处

07-border布局的另一个用处 实现如下的布局: 分析: 1.USERNAME和PASSWORD使用form 2.PASSWORD的文本框使用NewMultiLineEntry 布局1 USERNAME和PASSWORD作为一个form整体&#xff0c;使用border布局&#xff0c;form设置为top&#xff0c;文本框设置为center参数。 packa…

Postman 接口测试 安装使用教程

1 下载官网:https://www.postman.com/downloads/ 2 方便下载,特提供百度云网盘: 链接&#xff1a;Postman 3 windows10 安装&#xff0c;点击安装包 #自动安装&#xff0c;并打开 4 举例&#xff0c;比如豆瓣&#xff0c;get 查询时间&#xff0c;图片登 5 举例&#xff0…

HSRP热备份路由协议(VRRP虚拟路由冗余协议)配置以及实现负载均衡

1、相关原理 在网络中&#xff0c;如果一台作为默认网关的三层交换机或者路由器损坏&#xff0c;所有使用该网关为下一跳的主机通信必然中断&#xff0c;即使配置多个默认网关&#xff0c;在不重启终端的情况下&#xff0c;也不能彻底换到新网关。Cisco提出了HSRP热备份路由协…

传神论文中心|第14期人工智能领域论文推荐

在人工智能领域的快速发展中&#xff0c;我们不断看到令人振奋的技术进步和创新。近期&#xff0c;开放传神&#xff08;OpenCSG&#xff09;社区发现了一些值得关注的成就。传神社区本周也为对AI和大模型感兴趣的读者们提供了一些值得一读的研究工作的简要概述以及它们各自的论…

【干货】一文讲清楚社群裂变的主要模式和SOP流程

一、社群裂变的主要模式 社群裂变是一种依赖于现有成员的推广以吸引新成员的增长策略。以下是几种主要的社群裂变模式&#xff1a; 老带新裂变 定义&#xff1a;通过老用户带动新用户&#xff0c;同时给予某一方或双方奖励的一种裂变形式。 示例&#xff1a;任务宝活动&…

【精选】数据治理项目实施(合集)06——数据标准在数据治理中的落地实践

导读 本文对数据标准管理进行了深入探讨。重点介绍了数据标准的定义&#xff0c;实施路线和具体标准定义的内容&#xff0c;并总结了企业开展数据标准管理面临的常见问题&#xff0c;由于编写的水平和时间有限&#xff0c; 难免有所纸漏&#xff0c; 欢迎大家批评指正。 在现实…

填报高考志愿时,学校、专业和城市怎么选择呢?

我的观点是&#xff1a; 专业>城市>学校 专业是兴趣导向&#xff0c;符合自己的价值观&#xff0c;失去了这种驱动力的专业学习&#xff0c;会变得非常艰难的&#xff0c;而且没有竞争力&#xff0c;所以我的排序第一位是专业。 其次是城市&#xff0c;最好是一线城市&…

OpenAI发布新模型CriticGPT:利用GPT优化GPT训练,RLHF实现超越人类能力!

目录 01 基于GPT-4&#xff0c;改进GPT-4 02 CriticGPT取得了哪些成果呢&#xff1f; 03 RLHF的上限不再是人类 近日&#xff0c;OpenAI突然发布了一个新模型&#xff01;这个模型基于GPT-4训练&#xff0c;旨在帮助下一代GPT的训练。 CriticGPT能够在代码挑错中找到超过75%…