AI 绘画神器 Fooocus 本地部署指南:简介、硬件要求、部署步骤、界面介绍

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~
随着人工智能技术的飞速发展,AI 绘画逐渐成为创意领域的新宠。Fooocus 作为一款免费开源的 AI 绘画工具,凭借其简单易用、高质量图像生成的特点,吸引了众多用户的关注。本文将详细介绍 Fooocus 的本地部署过程,帮助用户轻松搭建自己的 AI 绘画环境。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。

一、了解 Fooocus

Fooocus 是一款 AI 绘画工具,其最大的特点是简单易操作,由 ControlNet 的作者 lllyasviel(真实身份是斯坦福大学博士生张吕敏)开发。
Fooocus 结合了 Stable Diffusion 和 Midjourney 的优点,它保留了 Stable Diffusion 的开源属性,可以免费部署到本地使用。同时,它也向 Midjourney 学习,简化了操作界面,省去了复杂的参数调节,让用户可以更专注于提示和图像的创作。
Fooocus 的界面非常简洁,只包含图像展示窗口、正向提示词和生成按钮三个部分。它使用了最新推出的SDXL 1.0 模型,可以通过简单的提示词生成各种风格的高质量图像。此外,Fooocus 还包含了 100 多种不同的预设风格,涉及写实、胶片、电影质感、动漫、水彩、黏土、3D、等距、像素、霓虹、赛博朋克、波普、纸艺等各个方面,让用户可以轻松生成更多样、更具艺术性的图像。
image.png
只输入了a girl, garden两个提示词,就生成了精美的图片。

二、硬件要求

在部署 Fooocus 之前,用户需要确保自己的电脑满足以下要求:

  • 操作系统:Windows、Linux 或 macOS 均可(本文使用 Windows)。
  • 处理器:支持 CUDA 加速的 NVIDIA 显卡(可选,但强烈推荐)。
  • 显存:至少 4GB(推荐 8GB 或以上)。
  • 内存:至少 8GB(推荐 16GB 或以上)。
  • 存储空间:预留至少 10GB 的硬盘空间用于下载模型和生成图片。

下面是官方给出的最低配置表,该表根据在不同的操作系统和不同的 GPU 型号下的最低配置:

操作系统GPU型号最低显存最低内存备注
Windows/LinuxNvidia RTX 4XXX4GB8GB最快
Windows/LinuxNvidia RTX 3XXX4GB8GB通常比 RTX 2XXX更快
Windows/LinuxNvidia RTX 2XXX4GB8GB通常比 GTX 1XXX更快
Windows/LinuxNvidia GTX 1XXX8GB8GB公比 CPU 快一点点
Windows/LinuxNvidia GTX 9XX8GB8GB比 CPU 更快或更慢
Windows/LinuxNvidia GTX < 9XX不支持//
WindowsAMD GPU8GB8GB通过 DirectML,比 Nvidia RTX 3XXX 慢约 3 倍
LinuxAMD GPU8GB8GB通过 ROCm,比 Nvidia RTX 3XXX 慢约 1.5 倍
MacM1/M2 MPS共享共享比 Nvidia RTX 3XXX 慢约 9 倍
Windows/Linux/Mac只使用CPU0GB32GB比 Nvidia RTX 3XXX 慢约 17 倍

三、部署步骤

本文介绍在 Windows 环境下的部署步骤,在提供的 Fooocus 安装包中已经集成了 Python 和 Git 环境,我们直接下载使用即可,并且它还会自动更新至最新版本。

3.1 下载 Fooocus 安装包

可以通过下面直接下载 Fooocus:
https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-1-831.7z
如果速度慢,也可以从我分享的网盘中下载:
https://pan.quark.cn/s/5b972ab4e26f
image.png

下载完后,可以看到这样的一个压缩文件:
image.png
我们直接解压即可,下面是解压缩后的内容:
image.png

3.2 下载模型

第一次启动程序时,Fooocus 会自动下载一些默认模型,但这些模型都放在国外的服务器,需要科学上网才能下载。不过我已经将这些模型都放到网盘中了,在这里分享给大家:
https://pan.quark.cn/s/5b972ab4e26f
这些模型需要我们提前下载好,然后放到对应目录下:
image.png
checkpoints 目录中的模型为大模型,下载后放到本地 Fooocus\models\checkpoints文件夹中。
image.png
loras 目录中的模型为 LoRA 模型,下载后放到本地 Fooocus\models\loras文件夹中。

3.3 运行 Fooocus

Fooocus 提供了三个运行程序:run.batrun_anime.batrun_realistic.bat
image.png
这三个程序都可以运行,它们主要区别是使用的大模型不同,不同的大模型也具有不同的风格:

类型程序命令行参数大模型
通用run.batjuggernautXL_v8Rundiffusion
漫画run_anime.bat–preset realisticrealisticStockPhoto_v20
写实run_realistic.bat–preset animeanimaPencilXL_v100

实际上我们只运行 run.bat 即可,到高级选项里面还能进行切换 preset(预设)

双击 run.bat 来启动程序,等待一会后,出现下面提示表示启动成功:
image.png
程序会自动进入 Fooocus 界面,如果没有,在浏览器中输入:http://127.0.0.1:7865/,按回车键后就会进入主界面:
image.png
此时,我们输入一个简单的提示词 a girl,然后点击【Generate】按钮就可以生成图像了:
image.png
这是 Fooocus 最简单的用法了。

四、界面介绍

Fooocus 的界面非常简洁,主要包括主界面、高级界面和输入图像界面。

4.1 主界面

主界面主要用于输入提示词,然后输出图片的地方:
image.png

  • 图像展示区域:这是主要的工作区域,用于展示生成的图像。
  • 提示词输入区域:这是用户输入正向提示词的地方,用于指导 AI 绘画模型生成符合需求的图片。
  • 生成按钮:点击此按钮,Fooocus 将根据用户输入的提示词开始生成图片。
  • 高级选项:勾选后会展开高级界面,可以做一些更高级的设置。
  • 输入图像选项:勾选后会展开输入图像界面,可以根据上传的图片做一系列的操作。

4.2 高级界面

勾选【Advanced】高级选项后,就可以在右侧展开高级界面了,该界面主要包括:Setting(设置)、Style(风格)、Model(模型)、Advanced(高级)四个选项卡:
image.png

  • Setting(设置):主要功能可以修改预设、修改生成速度、修改宽高比、图片生成数量、图片输出格式、填写负向提示词、设置随机种子、查看生成历史等。
  • Style(风格):默认有 100 多种风格可供选择。
  • Model(模型):可以修改主模型、精练模型、LoRA 模型。
  • Advanced(高级):可以调整指导量表、图像清晰度、开发者高度模式。

4.3 输入图像界面

勾选【Input Image】输入图像选项后,会在下方展开输入图像界面,该界面主要包括:Upscale or Variation(图片放大)、Image Prompt(图片提示)、Inpaint or Outpaint(局部修复)、Describe(提示词反推)、Metadata(原数据)五个选项卡:
image.png

  • Upscale or Variation(图片放大):可以将图片放大,增强、微调。
  • Image Prompt(图片提示):可以结合提示词和输入图片来生成新的图片,相当于 ControlNet 功能。
  • Inpaint or Outpaint(局部修复):对图片做一些局部调整。
  • Describe(提示词反推):根据输入图片反推出提示词。
  • Metadata(原数据):获取由 AI 生成图像的原数据,包括提示词、模型等信息。

至于更高级的用法,会在后续文章中讲解,欢迎订阅

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/606882.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

窜货溯源采买的目的

当品牌遇到窜货时&#xff0c;不管是线上还是线下渠道&#xff0c;快速的治理方法&#xff0c;就是找到窜货源头&#xff0c;对源头进行打击&#xff0c;这里面有一步很关键的操作便是买货&#xff0c;将货品买回后做溯源&#xff0c;通过产品本身或者外包装上的条码&#xff0…

【Java orm 框架比较】十 新增hammer_sql_db 框架对比

迁移到&#xff08;https://gitee.com/wujiawei1207537021/spring-orm-integration-compare&#xff09; orm框架使用性能比较 比较mybatis-plus、lazy、sqltoy、mybatis-flex、easy-query、mybatis-mp、jpa、dbvisitor、beetlsql、dream_orm、wood、hammer_sql_db 操作数据 …

[uniapp 地图组件] 小坑:translateMarker的回调函数,会调用2次

大概率是因为旋转和移动是两个动画&#xff0c;动画结束后都会分别调用此函数 即使你配置了 【不旋转】它还是会调用两次&#xff0c; 所以此处应该是官方的bug

未来娱乐新地标?气膜球幕影院的多维体验—轻空间

在中国&#xff0c;一座独特的娱乐场所正在崭露头角&#xff1a;气膜球幕影院。这个融合了气膜建筑与激光投影技术的创新场所&#xff0c;不仅令人惊叹&#xff0c;更带来了前所未有的科幻娱乐体验。让我们一起探索这个未来的娱乐空间&#xff0c;感受其中的多维魅力。 现场演出…

Linux(openEuler、CentOS8)企业内网DHCP服务器搭建(固定Mac获取指定IP)

----本实验环境为openEuler系统<以server方式安装>&#xff08;CentOS8基本一致&#xff0c;可参考本文&#xff09;---- 目录 一、知识点二、实验&#xff08;一&#xff09;为服务器配置网卡和IP&#xff08;二&#xff09;为服务器安装DHCP服务软件&#xff08;三&a…

DenseCLIP论文讲解

文章目录 简介方法总体框架 &#xff08;Language-Guided Dense Prediction&#xff09;上下文感知提示 &#xff08;Context-Aware Prompting&#xff09;应用实例 论文&#xff1a;DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting 代码&#xff1…

Python3实现三菱PLC串口通讯(附源码和运行图)

基于PyQt5通过串口通信控制三菱PLC 废话不多说&#xff0c;直接上源码 """ # -*- coding:utf-8 -*- Project : Mitsubishi File : Main_Run.pyw Author : Administrator Time : 2024/05/09 下午 04:10 Description : PyQt5界面主逻辑 Software:PyCharm "…

一个注解完美实现分布式锁(AOP)

前言 学习过Spring的小伙伴都知道AOP的强大&#xff0c;本文将通过Redisson结合AOP&#xff0c;仅需一个注解就能实现分布式锁。 &#x1f36d; 不会使用aop和redisson的小伙伴可以参考&#xff1a; 【学习总结】使Aop实现自定义日志注解-CSDN博客 【学习总结】使用分布式锁和…

Vulstack红队评估(一)

文章目录 一、环境搭建1、网络拓扑2、web服务器(win7)配置3、域控&#xff08;winserver2008&#xff09;配置4、域内机器&#xff08;windows 2003&#xff09;配置5、调试网络是否通常 二、web渗透1、信息搜集2、端口扫描3、目录扫描4、弱口令5、phpmyadmin getshell日志gets…

AI时代:人工智能大模型引领科技创造新时代

目录 前言一. AI在国家战略中有着举足轻重的地位1.1 战略1.2 能源1.3 教育 二. AI在日常生活中扮演着重要角色2.1 医疗保健2.2 智能客服2.3 自动驾驶2.4 娱乐和媒体2.5 智能家居 三. AI的未来发展趋势 总结 前言 随着AI技术的进步&#xff0c;新一代的AI技术已经开始尝试摆脱依…

域名系统(DNS)、DNS 服务器和 IP 地址概念解释

​  域名系统、DNS服务器和IP地址是构成互联网基础设施的重要部分。它们共同协作&#xff0c;使得人们能够方便地使用各种网络服务&#xff0c;而无需去记住复杂的数字地址。那么&#xff0c;域名系统、DNS 服务器和 IP 地址又该如何理解?本文主要讲讲关于这几个名词的概念解…

表单设计器开源:助力提质增效的办公利器

在激烈的市场竞争之下&#xff0c;拥有过硬的技术和本领的企业&#xff0c;就能在市场中提升市场竞争力&#xff0c;斩获更多市场份额。作为提质增效的办公利器&#xff0c;低代码技术平台、表单设计器开源拥有理想的优势特点&#xff0c;如操作灵活、易维护、可视化界面等&…

夸克网盘拉新怎么做?分享网盘拉新攻略!

夸克网盘拉新怎么做&#xff1f;如何通过推广夸克网盘来赚佣金&#xff1f;相信大家应该都使用过夸克网盘&#xff0c;现在夸克网盘的拉新赚佣金活动开展的如火如荼&#xff0c;不少朋友通过夸克网盘拉新赚取收益&#xff0c;真的很香。还有一部分想要赚佣金但是不知道如何操作…

OmniReader Pro mac激活版:智慧阅读新选择,开启高效学习之旅

在追求知识的道路上&#xff0c;一款优秀的阅读工具是不可或缺的。OmniReader Pro作为智慧阅读的新选择&#xff0c;以其独特的功能和卓越的性能&#xff0c;为您开启高效学习之旅。 OmniReader Pro具备高效的文本识别和处理技术&#xff0c;能够快速准确地提取文档中的关键信息…

Python 中的 Unit testing 文件写入

在 Python 中进行单元测试时&#xff0c;有时候需要测试文件写入操作。为了模拟文件写入并进行单元测试&#xff0c;你可以使用 Python 的 unittest 模块&#xff0c;并结合 io.StringIO 或 tempfile 模块来模拟文件操作。 1、问题背景 在 Python 中&#xff0c;为 ConfigPars…

关于GitHub仓库建立及提交问题

文章目录 前言GitHub仓库创建token令牌的获取GitHub克隆到本地GitHub上传文件 前言 为了整一个GitHub仓库然后上传文件&#xff0c;笔者看了不下100篇博客&#xff0c;20段教程&#xff0c;最后在两位大佬的帮助下&#xff0c;才整明白了&#x1f62d; 先提前说一嘴从 2021年8月…

Python网络编程 03 实验:FTP详解

文章目录 一、小实验FTP程序需求二、项目文件架构三、服务端1、conf/settings.py2、conf/accounts.cgf3、conf/STATUS_CODE.py4、启动文件 bin/ftp_server.py5、core/main.py6、core/server.py 四、客户端1、conf/STATUS_CODE.py2、bin/ftp_client.py 五、在终端操作示例 一、小…

爬虫学习--5.xpath数据解析

xpath是XML路径语言&#xff0c;它可以用来确定xml文档中的元素位置&#xff0c;通过元素路径来完成对元素的查找。HTML就是XML的一种实现方式&#xff0c;所以xpath是一种非常强大的定位方式。 基本概念 XPath&#xff08;XML Path Language&#xff09;是一种XML的查询语言…

Linux学习笔记3---WSL2交叉编译

ARM 裸机、Uboot 移植、Linux 移植这些都需要在 Ubuntu 下进行编译&#xff0c;编译就需要编译器&#xff0c;在上一章里面已经讲解了如何在 Liux 进行 C 语言开发&#xff0c;里面使用 GCC 编译器进行代码编译&#xff0c;但使用的 gcc 编译器是针对 X86 架构的&#xff01;而…

小程序开发之tdesignUI组件的简易使用教程

文章目录 TDesign简介小程序端使用TDesign一、安装二、使用可能的问题 附&#xff1a;如何使用weui开发参考链接 TDesign简介 TDesign 是腾讯各业务团队在服务业务过程中沉淀的一套企业级设计体系。 该UI框架支持桌面端、移动端、小程序端等全端。 小程序端使用TDesign 开发…