【亚马逊云新春特辑③】构生成式 AI 文生图工具之借助ControlNet进行AI绘画创作【使用OpenPose优化人物二维码】

文章目录

  • 2.1 使用OpenPose优化人物二维码
    • 1)数据及环境准备
    • 2)导入骨架数据并启用OpenPose控制单元
    • 3)导入二维码并生成美化后的二维码图片

2.1 使用OpenPose优化人物二维码

在上一节体验到了使用ControlNet并结合QR Code生成二维码,在本节中将会了解到如何通过ControlNet的OpenPose模型与二维码结合,使用 OpenPose 相关模型来生成人体姿势并将其用作 QR 码的输入。

OpenPose 姿态检测可生成图像中角色动作姿态的骨架图,这个骨架图可用于控制生成角色的姿态动作。

例如,您可以看到以下图像是使用 QR Code 和 OpenPose 作为输入生成的。 通过一些构图技巧,可以将观看者的焦点转移到图像的其他部分,并使二维码不那么明显。

1)数据及环境准备

本次动手训练营为您准备了样例OpenPose骨架数据以及二维码,您可以参考以下教程或者设计您的OpenPose骨架数据与二维码开始体验。请点击以下链接下载样例数据。

【OpenPose样例数据】

https://static.us-east-1.prod.workshops.aws/public/73d53c8f-3878-4a26-b8fd-992124ba53c1/static/example/pose.json

【样例二维码】
https://static.us-east-1.prod.workshops.aws/public/73d53c8f-3878-4a26-b8fd-992124ba53c1/static/example/example-qr-code.png

为了叠加QR Code与OpenPose效果,需要开启多个ControlNet Unit以叠加使用模型。要激活多个ControlNet Unit,请进入设置标签页

image-20240201173940075

左侧选择ControlNet。拖动拉杆,设置需要使用的ControlNet Unit数量,不小于2。

image-20240201174134580

随后在页面顶部,点击“保存设置”,并点击“重载前端”。

image-20240201174209035

重载界面后,请在“文生图”标签页中,展开ControlNet菜单,检查是否展示为多个ControlNet单元。

image-20240201174339118

2)导入骨架数据并启用OpenPose控制单元

本次动手训练营为您准备了经过设计后的OpenPose骨架数据。请跟随以下步骤导入骨架数据。

  • 点击OpenPose编辑器
  • 点击加载JSON,选中您下载的pose.json文件,并点击确定
  • 随后您应当能看到右侧出现的骨架图,如图所示。确认骨架图无误后,请点击下方的 “发送到文生图“按钮

image-20240201174910022

随后页面会自动跳转到"文生图"标签页中,若没有自动跳转,请选择在“文生图”标签页中,展开ControlNet菜单。并注意以下几个选项的配置:

  • 勾选 “启用” 按钮 :以确保 ControlNet 在图片生成过程中生效;
  • 模型选框:请选择 “control_v11p_sd15_openpose” 来使用ContolNet Openpose进行姿态控制;

image-20240201175127214

可以观察到,骨架在图片的左侧,为一个蜷缩的状态,随后您将使用提示词来生成为一个正在睡觉的女孩。

3)导入二维码并生成美化后的二维码图片

随后点击 “ControlNet Unit 1",进入第二个ControlNet单元,以叠加使用二维码控制模型。请点击上传,选择您下载的样例二维码文件example-qr-code.png,并跟随以下几个选项配置ControlNet单元:

  • 勾选 “启用” 按钮 :以确保 ControlNet 在图片生成过程中生效;
  • 模型选框:请选择 “control_v1p_sd15_qrcode_monster” 来使用ControlNet二维码控制模型;
  • 控制权重:对于叠加OpenPose使用,建议设置为1.7

image-20240201175408855

可以看到,二维码的整体在图片右侧,作为一种构图技巧其目是为与骨架躯体相呼应,使得人物生成更加的自然。

在文生图配置中调整两组数值:

  • 迭代步数:建议在 30-50 之间,默认值 20 不足以引导生成一个高质量的二维码图片
  • 宽度/高度:直接从 ControlNet 发送二维码原图的宽高比至上方

image-20240201175506052

我们希望骨架可以生成为一个正在睡觉且躺在木地板上的的女孩,同时以向日葵作为二维码的定位点。随后请参照以下提示词例子输入,并点击生成:

正向提示词:

(1girl:1.6, side lying sleep, on the garden, sunflowers), wooden floor

反向提示词:

extra hands, extra fingers, extra legs, fewer fingers, (low quality, worst quality:1.4), (bad anatomy), (inaccurate limb:1.2),bad composition, inaccurate eyes, extra digit,fewer digits,(extra arms:1.2), signature, easynegative

image-20240201175627267

最终生成的结果如图所示:

image-20240221140443903

在本例子的设计中,我们通过与OpenPose叠加,偏移二维码等设计和构图技巧,将观看者的焦点转移到图像的其他部分,同时避开了二维码的核心区域,使得人像更加自然。

image-20240221140621339

如果生成的二维码不能够达到期望,可以选择微调以下几个参数,并增加生成的总批次数,不断尝试抽卡以逼近最终期望的效果:

  • 提示词
  • 采样方法
  • OpenPose骨架的结构与位置
  • ControlNet 控制权重
  • ControlNet 引导介入/终止时机

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/415183.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

雾锁王国服务器官方配置要求说明

雾锁王国/Enshrouded服务器CPU内存配置如何选择?阿里云服务器网aliyunfuwuqi.com建议选择8核32G配置,支持4人玩家畅玩,自带10M公网带宽,1个月90元,3个月271元,幻兽帕鲁服务器申请页面 https://t.aliyun.com…

自动从金蝶取数,做BI报表的工具,快来长见识!

技术越进步,分析工具越智能,如今做数据分析、数据可视化,不仅能连接金蝶系统,更能直接从金蝶ERP中取数做分析,自动输出BI数据可视化分析报表。这就是奥威-金蝶BI方案。 是骡子是马,牵出来遛遛就知道&#…

STM32标准库开发—硬件SPI外设

SPI外设简介 SPI1与SPI2所挂载的总线位置不一样,所以时钟频率也不一样,SPI2挂载在APB1时钟频率为36MHZ是SPI1的一半 I2S是一种音频传输协议,适用于STM32大容量产品 一般来说串口发送数据时是低位先行,SPI通信是高位先行 SPI框图 发…

看完这篇爽文我终于学会了示波器(一)

大家好,我是砖一。 示波器是电子行业的工程师的“老熟人”了,有句老话说:电子工程师不能失去示波器,就像西方不能失去耶路撒冷,足以见得示波器的重要地位。今天讲解一下基础知识篇,话不多说,直…

Day 4.进程间的通信:管道和通信

进程间的通信 1.管道 2.信号 3.消息队列 4.共享内存 5.信号灯 6.套接字 1.管道(一次读4k,一共能读16次)64k 1.无名管道 无名管道只能用于具有亲缘关系的进程间的通信 pipe int pipe(int pipefd[2]); 功能:创建一个无名…

云原生高级第一次作业

目录 实验需求: 第一个实验步骤: openEuler 二进制方式安装MySQL 8.0.x 1.首先需要获取软件包 2.然后安装tar和xz格式可进行解压工具 3.接下来就是安装MySQL 4.配置环境变量 5.登入并修改密码 6.停止服务脚本 7.提供配置文件 8.进入/etc/my.cnf…

如何利用动态代理IP进行海外社媒推广?

动态代理IP,顾名思义,是一种可以动态变化的IP地址。与传统的静态IP地址不同,动态代理IP在每次网络请求时都能提供一个新的IP地址。在进行海外推广活动时,它的应用非常关键。 动态代理IP的工作原理基于一个庞大的IP地址池。当用户…

IPD(集成产品开发)—核心思想

企业发展到一定阶段就会遇到管理瓶颈,IPD流程是一种高度结构化的产品开发流程,它集成了业界很多优秀的产品开发方法论,像搭积木一样的组合成一种非常有效的流程。如果我们能根据企业的规模和行业特点,对全流程的IPD进行合适的裁剪…

代码随想录刷题笔记-Day25

1. 分割回文串 131. 分割回文串https://leetcode.cn/problems/palindrome-partitioning/ 给你一个字符串 s,请你将 s 分割成一些子串,使每个子串都是 回文串 。返回 s 所有可能的分割方案。 回文串 是正着读和反着读都一样的字符串。 示例 1&#xf…

端智能:面向手机计算环境的端云协同AI技术创新

近年来,随着移动端设备软硬件能力的进步,移动端的算力有了很大提升,同时面向移动端的机器学习框架和模型轻量化技术越来越成熟,端上的AI能力逐渐进入大众视野,端智能在电商领域也开始逐步走向规模化应用。通过持续探索…

动态规划之解码方法【LeetCode】

动态规划之解码方法 91. 解码方法解法1解法2 91. 解码方法 91. 解码方法 解法1 状态表示(这是最重要的):dp[i]表示以第i个字符为结尾,解码方法的总数。 状态转移方程(最难的):根据最近的一步来…

故障诊断 | 一文解决,PSO-BP粒子群算法优化BP神经网络模型的故障诊断(Matlab)

文章目录 效果一览文章概述模型描述源码设计参考资料效果一览 文章概述 故障诊断 | 一文解决,PSO-BP粒子群算法优化BP神经网络模型的故障诊断(Matlab) 粒子群优化算法(Particle Swarm Optimization, PSO)是一种群体智能优化算法,用于求解优化问题。BP神经网络是一种用于模…

【机器学习】线性回归模型(Linear Regression)

🌸博主主页:釉色清风🌸文章专栏:机器学习🌸今日语录:温柔的一半是知识,没有知识的涵养撑不起你想要的风骨。 ☘️0文章预览 本系列文章主要是根据吴恩达老师的机器学习课程以及自己的理解整合而成&#xf…

【MySQL】基本查询(表的增删改查)-- 详解

CRUD:Create(创建),Retrieve(读取),Update(更新),Delete(删除)。 一、Create insert [into] table_name [(column [, column] ...)] v…

2月28日做题总结(C/C++真题)

今天是2月28日,做题第三天。道阻且长,行则将至;行而不辍,则未来可期! 第一题 static char a[2]{1,2,3};说法是否正确? A---正确 B---错误 正确答案:B 解析:数组定义时&#xf…

Linux系统——Nginx拓展

目录 一、重写功能——rewrite 1.if 1.1 if 2. return 2.1状态码301和302的区别 301 302 3. set 4. break 5. rewrite 5.1 rewrite flag使用 5.2 flag说明 5.3举例 5.3.1访问 bj 跳转 beijing 5.3.2举例——break 5.3.3 http 转 https 5.3.4 break 与 last …

JavaScript 进阶03

编程思想 面向过程 面向过程就是分析出解决问题所需要的步骤,然后用函数把这些步骤一步一步实现,使用的时候再一个一个的依次调用 面向对象 面向对象是把事务分解成为一个个对象,然后由对象之间分工与合作。 在面向对象程序开发思想中&a…

kali安装ARL灯塔(docker)

1、root身份进入容器 ┌──(root㉿Kali)-[~/桌面] └─# su root ┌──(root㉿Kali)-[~/桌面] └─# docker 2、先更新再克隆 ┌──(root㉿Kali)-[~/桌面] └─# apt-get update …

如何在windows系统部署Lychee网站,并结合内网穿透打造个人云图床

文章目录 1.前言2. Lychee网站搭建2.1. Lychee下载和安装2.2 Lychee网页测试2.3 cpolar的安装和注册 3.本地网页发布3.1 Cpolar云端设置3.2 Cpolar本地设置 4.公网访问测试5.结语 1.前言 图床作为图片集中存放的服务网站,可以看做是云存储的一部分,既可…

蓝桥杯-常用STL(三)

常用STL 🎈1.映射🎈2.map的基础使用🔭2.1引入库🔭2.2构造一个映射🔭2.3插入一对映射🔭2.4判断关键字是否存在🔭2.5遍历映射🔭2.6清空 🎈1.映射 🔎映射是指两个…