AI 绘画神器 Fooocus 图生图:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取、所需模型下载

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~
本文讲述 Fooocus 的图生图功能,主要内容包括:图像放大或变化、图像提示、图像重绘或扩充、反推提示词、生成参数提取,并分享了所需模型的下载地址。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。

前言

一口气让 Fooocus 生成了 12 张“一个女孩骑着一条龙”的图片:
3_1.jpg
从里边选一张最有气质的照片,就它了:
2024-05-15_10-12-57_7051.png
今天我们就拿这张图片来演示 Fooocus 图生图的功能。

一、图像放大或变化(Upscale or Variatioin)

图像放大或变化(Upscale or Variatioin)可以微调图片或放大图片。

我们将图片拖放至左侧区域(或者上传),然后选择右边的选项,点击【生成】即可。然后,我们对比一下各选项生成的效果:
image.png
不启用:表示不启用图生图功能,会生成新的图片。
变化(细微 0.50):重绘幅度为 0.50,产生细微的变化(女孩表情变了、背景树木更茂密了)。
2024-05-15_10-48-34_4540.png
变化(强烈 0.85):重绘幅度为 0.85,产生强烈的变化(女孩面部和衣服变了,龙变胖了,轮子变成腿了,地面也变成泥地了)。
2024-05-15_10-53-44_2271.png
放大(1.5倍):图片放大了 1.5 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。
2024-05-15_10-58-08_2550.png

放大(2倍):图片放大了 2 倍,增加了细节,使画面更加细腻,女孩脸部也修复了。
2024-05-15_11-01-14_8372.png

快速放大(2倍):图片放大了 2 倍,没有修改图片细节。
2024-05-15_11-02-43_3801.png

二、图像提示(Image Prompt)

图像提示(Image Prompt)相当于 WebUI 中的 ControlNet 功能。勾选【高级设置】后,可以看出它有四种 ControlNet 供我们选择:图像提示(默认)、边缘检测、深度检测、换脸。

image.png
Image Prompt 还有两个重要的参数(Fooocus 已为每一种 ControlNet 设置了不同的默认值,通常无需调整):

  • 停止于(Stop At):停止设置控制在生成过程中应用所选 ControlNet 的影响的步骤数。取值范围为 0~1,通常值为 0.5,值越高,ControlNet 与参考图的粘合度就越高。
  • 权重(Weight):权重设置决定了所选 ControlNet 对最终图像的影响强度。较高的权重值会增加 ControlNet 的影响,而较低的权重值会降低其效果。取值范围为 0~2

2.1 图像提示(ImagePrompt)

图像提示(ImagePrompt)可以根据提示词和参考图中的风格来生成新的图片。

一个女孩骑着一头鳄鱼(a girl rides a crocodile):
2024-05-15_14-35-41_6846.png
一个女孩参差一条蛇(a girl rides a snake):
2024-05-15_14-34-44_1727.png
一个女孩骑着一只狗(a girl rides a dog):
2024-05-15_14-41-43_5941.png

2.2 边缘检测(PyraCanny)

边缘检测(PyraCanny)用于识别并提取图像中的边缘特征。当您想要在生成的图片中保留参考图的特定细节或姿势时,PyraCanny 设置特别有用。它创建一个线条艺术图片,从图像中捕获复杂的细节,并将它们应用到文本提示和其他控制网络。这可以产生与输入图像非常相似的合成,同时结合所需的风格变化。

在【高级设置】中打开【开发者高度模式】,在【ControlNet】中勾选【高度预处理】可以生成预处理的控制图:
image.png
一个女孩骑着一只狗(a girl rides a dog):
2024-05-15_15-01-37_7842.png

2.3 深度检测(CPDS)

深度检测(CPDS,Contrast Preserving Decolorization Structure)即保持对比的退色结构,是由 Fooocus 团队开发的定制控制网络。它结合了深度控制和脱色方法,将图像转换为黑白图像。然后,黑白图像的结构充当控制网来影响最终图像。 CPDS 和 PyraCanny 具有相似的目的,但它们采用不同的方法。虽然您可以组合多个控制网络,但建议使用 Pyan 或 CPDS,但不要同时使用两者。

深度检测在使用【调试预处理】时会生成黑白照片:
image.png
一个女孩骑着一头恐龙(a girl rides a dinosaur):
2024-05-15_15-32-03_7639.png

2.4 换脸(FaceSwap)

换脸(FaceSwap)会检测参考图中的脸部和头发并将其替换为生成图片中的脸部和头发。可以结合提示词使用,AI 将从参考图中识别出面部和头发,并将其应用到最终生成的图像中。

参考图:
src=http___b-ssl.duitang.com_uploads_item_201707_02_20170702210428_PQJT3.png&refer=http___b-ssl.duitang.webp
一个女孩骑着一头龙(a girl rides a dragon):
2024-05-15_15-56-43_2732.png

三、图像重绘或扩充(Inpaint or Outpaint)

3.1 图像重绘或扩充

图像重绘或扩充(Inpaint or Outpaint)可以重绘蒙版内容,还可以扩充图片。

将参考图要重绘的部分使用蒙版遮住:
image.png
生成的图片,会重绘蒙版中的内容:
2024-05-15_16-21-50_2390.png

如果想要扩图,可以在【向外扩充绘制的方向】中勾选扩充的方向。

向上:
2024-05-15_16-32-34_1119.png
向下:
2024-05-15_16-36-16_7326.png
向左:
2024-05-15_16-37-18_4069.png

向右:
2024-05-15_16-38-20_5067.png
向四个方向:
2024-05-15_16-33-20_3267.png

3.2 内部重绘-改善细节(脸、手、眼等)

内部重绘-改善细节(Improve Detail (face, hand, eyes, etc.))可以修复脸、手和眼等。

例如,这个女孩的脸想修复一下,用蒙版遮住:
image.png
重绘后的效果:
2024-05-15_16-42-43_7184.png

3.3 内部重绘-修改内容(添加物体、改变背景等)

内部重绘-修改内容(Modify Content (add objects, change background, etc.))可以添加物体、改变背景等

例如,在地面添加一条狗,就可以在地面上添加蒙版,然后在【内部重绘的附加提示词】中添加 dog
image.png
这样就会在蒙版位置添加一条狗:
2024-05-15_16-45-40_3245.png
例如,将远处的山改为火山:
image.png
修改后的效果:
2024-05-15_16-53-06_8680.png

四、反推提示词(Describe)

反推提示词(Describe)可以提取图片中的关键信息,将结果输出到“提示词”文本框中。

主要包括两种——照片(Photograph)、画作/动漫(Art/Anime):

照片(Photograph)反推出的是一些句子,描述图片中的内容。

反推结果:a woman riding on the back of a motorcycle next to a dragon(一个女人坐在摩托车后座上,旁边是一条龙)
image.png

画作/动漫(Art/Anime)反推出的是一些单词,描述图片中的关键词。

反推结果:1girl, solo, long hair, brown hair, outdoors, wings, shorts, tank top, denim, ground vehicle, nature, motor vehicle, mountain, realistic, dragon, road, riding, dragon wings(女孩,独唱,长发,棕色头发,户外,翅膀,短裤,背心,牛仔布,地面车辆,自然,机动车,山,现实,龙,道路,骑,龙翅膀)
image.png

五、生成参数提取(Metadata)

生成参数提取(Metadata)可以提取用 Stable Diffusion 生成图片的生成信息,包括:正向提示词、负向提示词、采样器、采样步数等等。

image.png

六、模型下载

在使用 Fooocus 图生图功能时,会下载一些模型。我将这些模型放到网盘中了,这里分享给大家。

网盘地址:https://pan.quark.cn/s/5b972ab4e26f
image.png
inpaint 内容放到 Fooocus\models\inpaint目录中:
image.png
controlnet 内容放到 Fooocus\models\controlnet 目录中:
image.png
clip_vision 内容放到 Fooocus\models\clip_vision目录中:
image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/630717.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Typora+PicGo+Gitee设置图床,解决CSDN上传markdown文件图片加载不出来的问题(超级实用)

注: 由于gitee现在已经加上了防盗链,并且只支持1M的图片,我觉得不是很好用(可以买腾讯云或阿里云等),之后找到比较好点的图床工具也会持续更新的。(sm.ms好像还好,github网速不太稳定…

查询新加 字段不返回数据要看 有没有 AllInfoResultMap 有要再里面加字段

查询新加 字段不返回数据要看 有没有 AllInfoResultMap 有要再里面加字段

容联云零代码平台容犀desk:重新定义坐席工作台

在数智化浪潮的推动下,企业亟待灵活适应市场变化、快速响应客户需求,同时还要控制成本并提升效率,传统的软件开发模式因开发周期长、成本高、更新迭代慢等问题,逐渐难以满足企业灵活多变的业务需求。 容犀Desk,观察到…

山东大学计算机考研数据分析,初复试占比6:4,复试内容不少得花精力准备!

山东大学(ShandongUniversity),简称山大,位于中国山东,是中华人民共和国教育部直属的综合性全国重点大学,是国家“211工程”、“985工程”重点建设院校,入选“111计划”、“珠峰计划”、“卓越工…

数据结构——直接插入排序

基本思想 再插入第i个元素时,前面i-1个已经排好序。 排序过程 初始状态(假设第一个元素为有序,其余均为无序元素) 问题一:如何构建初始的有序序列? 办法 将第一个记录看成是初始有序表,然后…

计算概论学习笔记(2)

感谢北大李戈老师讲解的计算概论。 【道阻且长,行则将至】 很多年没有intensive coding,现在这个系列是coding retake,一点点回忆之前的知识,希望能重回到一线。主要内容包括C,C,Pytorch学术前沿项目学习和实践,预计…

AI大模型日报#0515:Google I/O大会、 Ilya官宣离职、腾讯混元文生图大模型开源

导读:欢迎阅读《AI大模型日报》,内容基于Python爬虫和LLM自动生成。目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-34B)生成了今日要点以及每条资讯的摘要。 《AI大模型日报》今日要点:谷歌…

运用MongoDB Atlas释放开发者潜能同时把控成本

在当下的商业环境中,不可预测性已经成为常态,工程团队负责人必须在把控不可预测性和优化IT成本的双重挑战下谋求平衡。 咨询公司德勤2024 MarginPLUS调查收集了300多位企业负责人的见解,报告中重点介绍了面对动荡的全球经济环境,…

国际生物多样性科普暨母亲节亲子活动在天河公园举行

引言:"人类是命运共同体,不论是战胜新冠疫情,还是加强生物多样性保护,实现全球可持续发展,唯有团结合作,才能有效应对全球性挑战。生态兴则文明兴。我们应该携手努力,共同推进人与自然和谐…

抖音评论采集python爬虫(含一二级评论内容)

声明 仅用于学习交流,不用于其他用途 正文 随着抖音评论采集更新需要登录,由于不懈的努力,攻破这一难点,不需要登录采集作品所有评论信息 话不多说上代码看效果: 输入作品id: 这样就拿到评论信息了,可以…

数字化档案真能永久保存吗

数字化档案可以长期保存,但不能永久保存。虽然数字化技术可以提供更好的保存手段和更方便的存取方式,但数字化档案仍然面临一些挑战和风险。 首先,数字化档案需要依赖特定的技术和设备进行读取和处理。如果这些技术和设备过时或无法使用&…

Java 开发 框架安全:Spring 命令执行漏洞.(CVE-2022-22965)

什么叫 Spring 框架. Spring 框架是一个用于构建企业级应用程序的开源框架。它提供了一种全面的编程和配置模型,可以简化应用程序的开发过程。Spring 框架的核心特性包括依赖注入(Dependency Injection)、面向切面编程(Aspect-Or…

工厂自动化升级改造(3)-Modbus与MQTT的转换

什么是MQTT,Modbus,见下面文章 工厂自动化升级改造参考(01)--设备通信协议详解及选型-CSDN博客文章浏览阅读608次,点赞9次,收藏6次。>>特点:基于标准的以太网技术,使用TCP/IP协议栈,支持高速数据传输和局域网内的设备通信。>>>特点:跨平台的通信协议,…

并发-sleep更优雅的实现方案:TimeUnit.枚举常量.sleep()

首先给出结论:线程使用中的暂停,建议优先使用TimeUnit类中的sleep()但需要注意传入时间小于0的异常情况TimeUnit是java.util.concurrent包下的一个类名主要功能是暂停线程的操作拥有与Thread.sleep()一样的功能都是暂停线程,但TimeUnit提供了…

Polylang Pro插件下载:多语言网站构建的终极解决方案

在全球化的今天,多语言网站已成为企业拓展国际市场的重要工具。然而,创建和管理一个多语言网站并非易事。幸运的是,Polylang Pro插件的出现,为WordPress用户提供了一个强大的多语言解决方案。本文将深入探讨Polylang Pro插件的功能…

Hadoop3:HDFS副本节点选择逻辑讲解

一、副本节点选择(机架感知) 说明 第一个副本,因为我们的client可能是web页,也可能是shell终端。 如果是web页,则随机选取一个节点,如果是shell终端,则选择当前shell终端所在的节点。 节点距离最…

问题-小技巧-Win11-如何把Win11鼠标右键界面变成Win10鼠标右键界面

如果Win10的鼠标右键操作不常用,那就按住shift后再按鼠标右键,就会使用Win10的鼠标右键界面。 如果想彻底改成Win10的操作做界面可以看—— 问题-小技巧-Win11-如何把Win11鼠标右键界面改成Win10鼠标右键界面 这个文章详细的讲解了,如果把…

服务网格 SolarMesh v1.13 重磅发布

SolarMesh是行云创新推出的流量治理平台,它基于Istio,为部署在K8s集群上的应用提供全面的流量治理能力。 在之前的版本中,SolarMesh提供的能力有:流量视图,流量控制策略批量配置,API级别的流量数据采集和展…

postgreSQL安装配置

安装 在ubuntu界面执行 sudo apt install postgresql安装完成后,切换到postgres (安装过程中自动创建) sudo su - postgres#然后执行psql,进入数据库 psql创建数据库用户 在数据库中执行create命令创建用户,并带有…

Java——继承详解、super 关键字、super和this的异同、protected关键字、final关键字、继承与组合

1、继承的概念: 继承主要解决的问题:共性的抽取,实现代码复用 可以让我们在保持原有类(父类、超类、基类)特性的基础上进行扩展,增加新功能,这样产生新的类,称为派生类&#xff08…