flux文生图 生成高质量图像

flux文生图 生成高质量图像

flyfish

import torch
from diffusers import FluxPipeline


# 初始化 FluxPipeline
model_path = "/home/FLUX___1-dev"
pipe = FluxPipeline.from_pretrained(model_path, torch_dtype=torch.bfloat16)
pipe.enable_model_cpu_offload()  # save some VRAM by offloading the model to CPU. Remove this if you have enough GPU power


# 创建不同的英文提示列表
prompts = [
    "A magnificent future world where vast, rolling meadows stretch as far as the eye can see, dotted with charming cottages and colorful wildflowers, and the sky is a brilliant canvas of pastel hues.",
    "A vast and idyllic landscape where nature thrives in perfect balance, with towering mountains ranges and crystal - clear rivers flowing through, and the air is filled with the sweet fragrance of blooming flowers."
]


# 设置通用参数
height = 1024
width = 1024
guidance_scale = 3.5
num_inference_steps = 100
max_sequence_length = 512
generator = torch.Generator("cuda")


# 计算prompts总数
total_images = len(prompts)


# 定义生成prompts的数量 每个提示生成的图像数量
num_images_per_prompt = 2


# 循环遍历每个提示并生成图像
for i, prompt in enumerate(prompts):
    # 显示当前生成第几张图像和总共的图像数量
    print(f"Generating images for prompt {i + 1} of {total_images}")
    # 设置随机种子以确保不同的结果(可选)
    seed = i  # 使用索引作为种子,或者使用其他方法设置种子
    generator.manual_seed(seed)


    # 生成图像
    result = pipe(
        prompt,
        height=height,
        width=width,
        guidance_scale=guidance_scale,
        num_inference_steps=num_inference_steps,
        max_sequence_length=max_sequence_length,
        generator=generator,
        num_images_per_prompt=num_images_per_prompt  # 设置每个提示生成的图像数量
    )


    # 保存生成的图像到本地文件
    for j in range(len(result.images)):
        filename = f"flux_dev_hd_{i}_{j}.png"
        result.images[j].save(filename)
        print(f"Saved {filename}")

导入和初始化:

import torch 和 from diffusers import FluxPipeline:导入所需的库。
model_path 和 pipe = FluxPipeline.from_pretrained(...):指定并加载预训练模型。
pipe.enable_model_cpu_offload():将模型从 GPU 卸载到 CPU 以节省 GPU 内存。

提示列表:

prompts:存储用于图像生成的英文描述列表,每个元素是对未来世界的不同描述。

参数设置:

height 和 width:设置生成图像的尺寸。
guidance_scale:控制生成图像与提示的贴合程度。
num_inference_steps:决定推理步骤数量,影响图像质量和计算时间。
max_sequence_length:限制输入提示的长度。
generator:为生成图像提供随机数源。

提示和图像数量计算:

total_prompts:计算提示的总数。
num_images_per_prompt:指定每个提示生成的图像数量。

图像生成和保存:

for i, prompt in enumerate(prompts):遍历提示列表。
generator.manual_seed(seed):设置随机种子。
result = pipe(...):调用 pipe 生成图像,传入各种参数。
for j in range(len(result.images)):遍历生成的图像列表。
filename = f"flux_dev_hd_{i}_{j}.png":生成文件名。
result.images[j].save(filename):保存图像。

guidance_scale 参数的详细解释:

含义

  • guidance_scale 是一个用于控制生成图像过程中引导程度的参数。它决定了在生成图像时,文本提示对最终结果的影响程度。

取值范围和影响

  • 最小值

    • 理论上,guidance_scale 的最小值可以是 0,但在实际应用中,将其设置为 0 会导致生成的图像几乎不受文本提示的影响。此时,生成的图像可能看起来像是随机噪声,因为模型几乎不会考虑输入的文本描述,而主要依据噪声分布进行图像的生成,生成结果可能与你期望的内容相差甚远。
    • 例如,当 guidance_scale = 0 时,对于一个描述为 “A red apple on a green table” 的提示,生成的图像可能完全没有苹果和绿色桌子的特征,而是呈现出毫无意义的噪声图案。
  • 最大值

    • 通常没有明确的最大值限制,但在实践中,较大的值会使生成的图像更严格地遵循文本提示,但也可能导致一些问题。
    • guidance_scale 的值非常大时,可能会使生成的图像过于刻板或不自然。这是因为模型会过度依赖文本提示,可能会导致图像生成的多样性降低,细节上可能出现过度强调某些特征而失去平衡的现象。
    • 例如,对于同样的 “A red apple on a green table” 提示,将 guidance_scale 设置为一个很大的值(如 20)可能会导致生成的苹果和桌子的形状、颜色非常符合描述,但可能显得过于完美和不真实,缺少自然感,甚至可能出现颜色过饱和、形状过于规则等问题。
  • 推荐范围

    • 一般情况下,guidance_scale 的合理范围通常在 1 到 10 之间。
    • 对于更具创造性和灵活性的图像生成,你可以从较低的值开始尝试,比如 1 到 3 左右,这样生成的图像可能会有更多的创意和变化,但可能不会完全符合文本描述。
    • 如果你希望生成的图像更贴近文本描述,可以将其设置在 5 到 10 之间。
      请添加图片描述
      请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/947671.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

设计模式 结构型 装饰器模式(Decorator Pattern)与 常见技术框架应用 解析

装饰器模式(Decorator Pattern),又称为包装器模式(Wrapper Pattern),是一种结构型设计模式。它允许在不改变原有对象结构的基础上,动态地给对象添加一些新的职责(即增加其额外功能&a…

计算机毕业设计Python+Vue.js游戏推荐系统 Steam游戏推荐系统 Django Flask 游 戏可视化 游戏数据分析 游戏大数据 爬虫

2021年12月21日 姓名 专业 软件工程 班级 20-IBM-企Java2 题目 基于hadoopSpark的游戏推荐与可视化系统的设计与实现 指导教师 王文钧、王春娴 一、与本题目有关的国内外研究情况、题目研究的目的和意义、主要内容、本课题创新之处、拟解决的问题: 国内外…

[创业之路-222]:波士顿矩阵与GE矩阵在业务组合选中作用、优缺点比较

目录 一、波士顿矩阵 1、基本原理 2、各象限产品的定义及战略对策 3、应用 4、优点与局限性 二、技术成熟度模型与产品生命周期模型的配对 1、技术成熟度模型 2、产品生命周期模型 3、技术成熟度模型与产品生命周期模型的配对 三、产品生命周期与产品类型的对应关系 …

使用Python类库pandas操作Excel表格

Date: 2025.01.02 20:33:30 author: lijianzhan 简述:pandas 是处理 Excel 文件的强大工具,它提供了简单易用的接口来读取、操作和写入 Excel 数据。以下是使用 pandas 处理 Excel 文件的详细指南,包括常见操作和示例代码。 安装依赖,pandas …

Deepseek v3 的笔记

基本概述 Deepseek v3是Deepseek发布的旗舰模型,属于607B的混合专家(MoE)模型,其中活跃参数为37B。在当前的模型领域,它堪称最佳的开源模型,性能超越了Llama 3.1 405b、Qwen和Mistral等知名模型。根据基准…

Python多分类Logistic回归详解与实践

在机器学习中,Logistic回归是一种基本但非常有效的分类算法。它不仅可以用于二分类问题,还可以扩展应用于多分类问题。本文将详细介绍如何使用Python实现一个多分类的Logistic回归模型,并给出详细的代码示例。 一、Logistic回归简介 Logist…

前端,npm install安装依赖卡在sill idealTree buildDeps(设置淘宝依赖)

输入npm i后,一直卡在sill idealTree buildDeps,一动不动 cnpm可以安装成功,但使用cnpm不会生成package-lock.json文件 设置淘宝依赖,依然卡住,挂梯子也不行 解决方法: // 取消ssl验证 set strict-ssl …

装饰者模式

1、定义 装饰者模式:在不必改变原类和使用继承的情况下,动态地扩展一个对象的功能。它是通过创建一个包装对象,也就是装饰来包裹真实的对象 2、实际应用 星巴克的咖啡系统项目: 星巴克要求的各种下单功能:大杯原味、大…

招银网路Java后端一面,难度有点大!

这是一位武汉理工大学同学的招银网络一面面经,同样附带超详细的参考答案。大家可以用来查漏补缺,针对性地补短板。 招银网络一面还是比较简单的,基本都是一些比较重要且高频的常规八股,项目问的不多。到了二面的时候, 会开始主要考察你的项目。 1、自我介绍 自我介绍一般…

C++之设计模式

设计模式 简介单例模式饿汉模式懒汉模式 工厂模式简单工厂模式工厂方法模式抽象工厂模式 建造者模式代理模式 简介 设计模式是前辈们对代码开发经验的总结,是解决特定问题的⼀系列套路它不是语法规定,而是⼀套⽤来提高代码可复用性、可维护性、可读性、…

云效流水线使用Node构建部署前端web项目

云效流水线实现自动化部署 背景新建流水线配置流水线运行流水线总结 背景 先来看看没有配置云效流水线之前的部署流程: 而且宝塔会经常要求重新登录,麻烦的很 网上博客分享了不少的配置流程,这一篇博客的亮点就是不仅给出了npm命令构建&…

pycharm如何拉取一个git项目,然后,修改后再上传到自建的项目中?

以chattts为例 https://github.com/2noise/ChatTTS.git 1.建一个虚拟环境,用于项目使用 2.pycharm新建工程 3.忽略 提示 勾选,新建远程仓库 设置账号和密码 设置git路径,一般是正确的,点测试即可 &…

(五)开机自启动以及scp工具文件传输小问题

文章目录 程序开机自启动先制作一个可执行程序第一种 通过命令行实现程序开机自启动第二种 通过 Linux 系统镜像实现程序开机自启动 scp工具文件传输小问题 程序开机自启动 原因:做成产品后,用户直接开机使用,总不能在开机执行程序后才可以使…

供需平台信息发布付费查看小程序系统开发方案

供需平台信息发布付费查看小程序系统主要是为了满足个人及企业用户的供需信息发布与匹配需求。 一、目标用户群体 个人用户:寻找兼职工作、二手物品交换、本地服务(如家政、维修)等。 小微企业:推广产品和服务,寻找合…

中建海龙:科技助力福城南产业片区绿色建筑发展

在快速发展的城市化进程中,绿色建筑以其环保、节能、可持续的特点日益受到重视。作为建筑工业化领域的领军企业,中建海龙科技有限公司(简称“中建海龙”)凭借其卓越的科技实力和创新举措,在推动绿色建筑发展方面做出了…

OJ随机链表的复制题目分析

题目内容: 138. 随机链表的复制 - 力扣(LeetCode) 分析: 这道题目,第一眼感觉非常乱,这是正常的,但是我们经过仔细分析示例明白后,其实也并不是那么难。现在让我们一起来分析分析…

动态规划回文串问题系列一>回文子串

题目: 解析: 注意:字串和子数组差不多 状态表示: 状态转移方程: 初始化: 填表顺序: 返回值: 返回dp表里true的个数

万里数据库GreatSQL监控解析

GreatSQL是MySQL的一个分支,专注于提升MGR(MySQL Group Replication)的可靠性及性能。乐维监控平台可以有效地监控GreatSQL,帮助用户及时发现并解决潜在的性能问题。 通过在GreatSQL服务器上安装监控代理,收集数据库性…

君正T41交叉编译ffmpeg、opencv并做h264软解,利用君正SDK做h264硬件编码

目录 1 交叉编译ffmpeg----错误解决过程,不要看 1.1 下载源码 1.2 配置 1.3 编译 安装 1.3.1 报错:libavfilter/libavfilter.so: undefined reference to fminf 1.3.2 报错:error: unknown type name HEVCContext; did you mean HEVCPr…

Sublime Text4 4189 安装激活【 2025年1月3日 亲测可用】

-----------------测试时间2025年1月3日------------------- 下载地址 官方网址:https://www.sublimetext.com 更新日志:https://www.sublimetext.com/download V4189 64位:https://www.sublimetext.com/download_thanks?targetwin-x64 ....…