Diffusers代码学习-ControlNet(Inpaint)

对于Inpaint,需要一个初始图像、一个蒙版图像和一个描述用什么替换蒙版的提示词。ControlNet模型允许添加另一个控制图片来调节模型。让我们用Inpaint蒙版来调整模型。这样,ControlNet可以使用修复掩模作为控件来引导模型在蒙版区域内生成图像。

 

# 以下代码为程序运行进行设置

import os

os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"
from diffusers.utils import load_image, make_image_grid

# 以下代码加载初始图像,并调整图像大小
init_image = load_image(
    "https://hf-mirror.com/datasets/huggingface/documentation-images/resolve/main/diffusers/controlnet-inpaint.jpg"
)
init_image = init_image.resize((512, 512))
# 以下代码加载蒙版图像,并调整图像大小
mask_image = load_image(
    "https://hf-mirror.com/datasets/huggingface/documentation-images/resolve/main/diffusers/controlnet-inpaint-mask.jpg"
)
mask_image.show()
mask_image = mask_image.resize((512, 512))


import numpy as np
import torch

# 创建一个函数,从初始图像和蒙版图像中准备控制图像。

# 这将创建一个张量,如果蒙版图像中的相应像素超过某个阈值,则将原始图像中的像素标记为掩码。

def make_inpaint_condition(image, image_mask):
image = np.array(image.convert("RGB")).astype(np.float32) / 255.0
image_mask = np.array(image_mask.convert("L")).astype(np.float32) / 255.0

assert image.shape[0:1] == image_mask.shape[0:1]
image[image_mask > 0.5] = -1.0 # set as masked pixel
image = np.expand_dims(image, 0).transpose(0, 3, 1, 2)
image = torch.from_numpy(image)
return image


control_image = make_inpaint_condition(init_image, mask_image)


# 加载以Inpaint为条件的ControlNet模型,并将其传递给[SableDiffusionControlNetInpaintPipeline]。

# 使用更快的[UniPCMultipstepScheduler]并启用模型卸载机制,以加快推理并减少内存使用。

from diffusers import StableDiffusionControlNetInpaintPipeline, ControlNetModel, UniPCMultistepScheduler

# 以下代码会引入与ControlNet相关的模型,及Scheduler

controlnet = ControlNetModel.from_pretrained("lllyasviel/control_v11p_sd15_inpaint", torch_dtype=torch.float16,
                                             use_safetensors=True)
pipe = StableDiffusionControlNetInpaintPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", controlnet=controlnet, torch_dtype=torch.float16, use_safetensors=True
)

pipe.scheduler = UniPCMultistepScheduler.from_config(pipe.scheduler.config)

pipe.enable_model_cpu_offload()

# 以下代码由提示词及原始图片,蒙版图片形成控制后生成图片
output = pipe(
    "corgi face with large ears, detailed, pixar, animated, disney",
    num_inference_steps=20,
    eta=1.0,
    image=init_image,
    mask_image=mask_image,
    control_image=control_image,
).images[0]

以下为原始图像

图片

以下为蒙版图像

图片

以下为根据提示词及控制生成的图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/699395.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何轻松解决自养号测评中的买家签收问题?

在当今日益繁荣的跨境电商领域,自养号测评已成为众多卖家提升销量与排名的关键策略。然而,在这条道路上,买家签收难题却像是一座难以逾越的山峰,让不少卖家感到困扰。本文将深入探讨如何巧妙攻克这一难题,为自养号测评…

贪 吃 蛇

简介 简易贪吃蛇,使用 javax.swing 组件构建游戏界面,通过监听键盘按键实现游戏操纵。 功能设计 按1 - 开始游戏按2 - 重新开始按3 - 暂停/继续按Esc-退出游戏统计吃到的苹果个数(得分)难度控制,得分超过阈值时难度…

[总线]AMBA总线架构的发展历程

目录 引言 发展历程 第一代AMBA(AMBA 1) 第二代AMBA(AMBA 2) 第三代AMBA(AMBA 3) 第四代AMBA(AMBA 4) 第五代AMBA(AMBA 5) AMBA协议简介 ASB&#x…

用 Kotlin 多平台开发构建跨平台应用程序:深入探索 KMP 模板工程

用 Kotlin 多平台开发构建跨平台应用程序:深入探索 KMP 模板工程 Kotlin 多平台开发 (KMP) 是一种强大的工具,可用于构建跨平台移动、桌面和 Web 应用程序。它提供了一种统一的代码基础,使开发人员能够高效地针对多个平台开发应用程序。 KM…

【工具】新手如何正确使用Pycharm?

1. 什么是JetBrains Toolbox JetBrains Toolbox是一个管理工具,用于安装、更新和管理JetBrains开发工具的所有版本。它可以简化多个IDE的管理,并确保你总是使用最新版本的软件。 2. 安装JetBrains Toolbox 步骤1:下载Toolbox 访问JetBrai…

演出门票小程序开发

一、实时票务信息更新的重要性 在演出票务市场,票务信息的实时性对于消费者来说至关重要。一旦票务信息出现滞后或错误,不仅可能导致消费者错过心仪的演出,还可能引发一系列不必要的纠纷和投诉。因此,演出门票小程序通过引入实时…

外汇天眼:跟单社区or资金盘 几招教你快速识别

今年有不少外汇跟单社区伙同黑平台收割投资人跑路事件,应天眼老粉要求,今天写一篇与跟单社区相关的内容,教大家如何辨别正规的外汇跟单社区与资金盘诈骗。 相信做过几年外汇的人,应该对跟单社区多少有所耳闻。但外汇跟单社区究竟…

物联网学习小记

https://www.cnblogs.com/senior-engineer/p/10045658.html GOSP: 提供类似Qt的API接口,仅需要几百KB的硬件资源(比Qt小的多),能运行在Qt不支持的低配置硬件上(对Qt生态形成补充),适用于嵌入式…

python-找第一个只出现一次的字符

[题目描述] 给定一个只包含小写字母的字符串,请你找到第一个仅出现一次的字符。如果没有,输出 no。输入: 一个字符串,长度小于 1100。输出: 输出第一个仅出现一次的字符,若没有则输出 no。样例输入1 abcabd…

数字影像产业园:打造数字经济高地,赋能未来产业

成都国际数字影像产业园凭借其得天独厚的区位优势、完善的配套设施、先进的产业定位和便捷的交通条件,逐步成为成都市乃至全国数字影像、文创、媒体产业的重要聚集地。 成都国际数字影像产业园位于成都市金牛区的核心地带,其主导产业为数字影像、文创、媒…

模型的手工下载技巧-代码自动批量下载模型文件

之前分享过通过镜像网站手工下载模型文件的技巧(见这里模型的手工下载技巧-镜像网站的使用)。但有的时候,模型文件数量较多,一个个​手工下载非常不便。比如著名的“麦橘写实”模型。 有没有什么好办法可以把整个目录都下载下来呢…

vulhub之httpd篇

Apache 换行解析漏洞(CVE-2017-15715) Apache HTTPD是一款HTTP服务器,它可以通过mod_php来运行PHP网页。其2.4.0~2.4.29版本中存在一个解析漏洞,在解析PHP时,1.php\x0A将被按照PHP后缀进行解析,导致绕过一…

中电联系列三:rocket手把手教你理解中电联协议!

分享《慧哥的充电桩开源SAAS系统,支持汽车充电桩、二轮自行车充电桩。》 前 言 T/CEC102《电动汽车充换电服务信息交换》共分为四个部分: ——第1部分:总则; ——第2部分:公共信息交换规范; ——第3部分&a…

JavaScript的数据类型(基础数据类型和数据类型转换)

天行健,君子以自强不息;地势坤,君子以厚德载物。 每个人都有惰性,但不断学习是好好生活的根本,共勉! 文章均为学习整理笔记,分享记录为主,如有错误请指正,共同学习进步。…

【初阶数据结构】深入解析顺序表:探索底层逻辑

🔥引言 本篇将深入解析顺序表:探索底层逻辑,理解底层是如何实现并了解该接口实现的优缺点,以便于我们在编写程序灵活地使用该数据结构。 🌈个人主页:是店小二呀 🌈C语言笔记专栏:C语言笔记 &…

java:使用JSqlParser给sql语句增加tenant_id和deleted条件

# 示例代码 【pom.xml】 <dependency><groupId>com.baomidou</groupId><artifactId>mybatis-plus-core</artifactId><version>3.4.3.1</version> </dependency>【MyJSqlParserTest.java】 package com.chz.myJSqlParser;pu…

如何利用 Google 搜索结果页来引导?

在数据驱动的决策世界中&#xff0c;获取准确而全面的信息至关重要。Google 搜索结果抓取是一种强大的技术&#xff0c;可以让企业、调查人员和研究人员从搜索引擎结果中提取可靠的数据。本综合指南将深入研究 Google 搜索结果的最佳实践、工具和道德考量&#xff0c;以确定能够…

4、视觉里程计:特征点法、直接法和半直接法

先说一下我自己的总体理解&#xff1a; 特征点法&#xff0c;基于最小化重投影误。 提取特征点&#xff0c;计算描述子&#xff0c;匹配&#xff0c;运动估计。 计算描述子和匹配部分可以用光流法跟踪替代 总体上先知道像素之间的关系&#xff0c;在估计运动&#xff08;最…

铝合金板件加工迎来3D视觉新时代

在制造业的浩瀚星空中&#xff0c;铝合金板件加工一直以其轻质、高强度、耐腐蚀的特性&#xff0c;扮演着举足轻重的角色。然而&#xff0c;随着市场竞争的加剧和产品需求的多样化&#xff0c;传统的加工方式已难以满足现代制造业对高效率、高精度的追求。在这个关键时刻&#…

详细教学wps中公式如何居中,公式编号如何右对齐

废话少说&#xff0c;首先打开WPS&#xff0c;新建一个空白文档。 详细步骤如下&#xff1a; &#xff08;1&#xff09;新建一个模板样式&#xff0c;在开始一栏中&#xff0c;点击新建样式具体操作看下图&#xff1a; &#xff08;2&#xff09;设计样式 修改样式名称为公…