【stable diffusion】保姆级入门课程-Stable diffusion(SD)介绍与安装

目录

0.学前准备

1.什么是AI绘画

2.当前主流的AI绘画工具

3.什么是SD(stable diffusion)

4.SD能做什么

1.文生图

2.图生图

3.AI换模特,背景

5.使用stable diffusion配置要求

6.环境配置与安装

需要注意的地方:

扩展知识:

1.python

2.git

3.控制界面

7.SD的原理

8.结语


不需要了解相关知识的可以直接跳转到第五节安装

0.学前准备

学习本课程需要先下载stable diffusion以及相关模型,觉得网盘下载太慢的也可以去源地址下载,C站(国内404),L站,抱脸网三选一即可

百度网盘地址

夸克网盘地址

C站地址

L站地址

抱脸网地址

stable diffusion

4.2

链接:百度网盘 请输入提取码

提取码:9vzk

链接:夸克网盘分享

提取码:t6J2

X

X

X

anything模型

百度地址
提取码:g5uk

链接:夸克网盘分享

提取码:PWLu

https://civitai.com/models/9409/or-anything-v5ink

万象熔炉 | Anything V5/V3|LiblibAI

Linaqruf/anything-v3.0 · Hugging Face

chilloutmix模型

百度地址
提取码:qup0

链接:夸克网盘分享

提取码:Ny9P

https://civitai.com/models/6424/chilloutmix(需要登陆)

必备模型|ChilloutMix|LiblibAI

swl-models/chilloutmix · Hugging Face

1.什么是AI绘画

ai绘画简单来说 就是利用人工智能技术进行绘画创作,它通过程序和算法模拟人类的绘画过程,从而实现自主创作。但是AI绘画并不是无中生有,而是基于训练模型,进行二次创作,举个容易理解的例子,比如你(模型)想写出 颜真卿风格的字体,就需要对着颜真卿的书法(素材)不停的临摹(训练),等练上成百上千次后,就很容易写出相似的字体(自主创作)。AI绘画正是如此,所以AI绘画出来的图像风格都是基于训练模型(训练模型后面讲)

2.当前主流的AI绘画工具

当前主流的有以下几种 Midjourney,Stable Diffusion,Disco Difusion,Novel AI,因为 我没有使用过Disco Difusion,Novel AI,所以先用Midjourney,Stable Diffusion做对比

优点

缺点

适合人群

是否收费

Midjourney

1.画风多样

2.操作简单

3.出图快质量高

4.电脑要求低

1.需要收费

2.自定义功能少

3.出图结果随机性大

4.图片受平台管控

1.电脑配置低

2.对控图要求低

Stable Diffusion

1.免费开源

2.出图速度快

3.高定制化,可以根据需求安装各种插件定制图片

4.出图高度可控

5.图片不受任何限制

1.对电脑配置要求高

2.有一定的入门门槛

3.容易出现质量极差的图片

1.电脑中高配置

2.对控图要求高,输出结果自由可控

其实 使用 sd最重要的原因是 免费,而且对于输出结果高度可控,由于可控,那么对于后期的变现会更加简单,也不会受到平台的管控,但是 Stable diffusion有一定的操作技巧,并不是傻瓜式操作,所以是通过调节stable diffusion的各个参数去实现自己的需求,而不是单纯的由AI去控制图片的生成。

3.什么是SD(stable diffusion)

当你去学习一个新的东西,你需要先了解这个东西是什么,然后再去学习会更加简单,那什么是SD呢,stable diffusion 是一款基于人工智能技术开发的绘画软件,最原始的stable diffusion 是基于命令行参数进行运行的,类似这样的,对于没有编程基础的小白玩家,学习AI绘画之前还要命令行参数,甚至还要记住各种参数的涵义

stable-diffusion 命令行界面

此时一位名叫 AUTOMATIC1111 的大佬出手了(项目地址AUTOMATIC1111 · GitHub),他建立了一个叫stable-diffusion-webui的开源项目,把所有的命令行参数都以界面的形式展示了,也就是我们后面课程会用到的软件,本质上是在stable diffusion上面的套了个壳,但是却使普通人也可以愉快的进行艺术创作,达到了所见即所得的高度,市面上例如 秋叶的整合包,小李xiaoli的整合包,都是基于stable-webui进行的二次开发

stable-diffusion-web-ui界面

4.SD能做什么

stable diffusion 因为其高度的可定制化和控图能力,可以用于 商品建模,虚拟角色创作,线稿上色,艺术设计,服装设计,建筑设计,原画生成等各个方面

下面举几个常用的例子

1.文生图

根据文字描述生成对应的图片

例如:二次元 穿着衣服的女孩

2.图生图

例如:三次元转二次元

3.AI换模特,背景

图片

5.使用stable diffusion配置要求

        操作系统:所有操作系统都可以,建议使用window10

        磁盘要求:起码 50G以上,越大越好(放在固态硬盘,提升加载速度)

        显卡:4G以上独立显卡(最好是英特尔的独立显卡,AMD显卡支持不足,但是也能用),AMD显卡会报以下错误,需要进行特殊配置,不在本篇进行讨论

        内存:8G以上

        CPU:不做强制要求

如何查看内存,磁盘以及显卡

图片

6.环境配置与安装

    1.先下载整合包

    2.解压sd-webui-aki-v4(解压存放不要在C盘)

    3.如果是第一次安装 先点击 启动器运行依赖-dotnet-6.0.11.exe 下载相关依赖

    4.进入sd-webui-aki-v4.2解压目录点击启动器

4.点击一键启动

5.运行控制台,出现Runing on local url 时,复制后面的地址

6.出现这个界面时,则说明运行成功了

需要注意的地方:

1.解压文件存放地址 不要带有中文,空格,特殊字符(%#&这种)如果带有中文之类的,后期可能会出现各种奇奇怪怪的错误

错误示范

        E:\AI绘画\sd-webui-aki-v4

        E:\(新版)AI 绘画\sd-webui-aki-v4

正确示范

        E:\sd-webui\sd-webui-aki-v4

2.如果控制台出现类似 connection error 这种错误,或者download failed 这种错误,需要使用科学上网,具体操作需要自己研究

扩展知识:

1.python

        stable-diffusion-web-ui 是基于python开发的,一般来说一个软件要运行,要有运行环境

        python就是 stable-diffusion-web-ui 的运行环境,大多数教程需要先配置python的运行环境,而整合包 已经自己配置好相关python环境了,不需要额外配置

2.git

        对于 不是编程的同学,你简单的理解为是一个下载器就行了,可以从一个叫github的开源社区 下载相应的应用插件,或者sd相关补充插件,整合包已经配置好git了,不需要进行额外配置

3.控制界面

        我们浏览器看到的界面并不是实际上的运行系统,而真正的运行系统是控制台,界面无论关闭多少次,只要输入对应的地址,就可以多次打开

        但是如果控制台关闭了,那么界面就无法打开了,而且当出现错误了,控制台会打印错误信息,供同学们排查,核心是在控制台,而不是界面,当界面出现问题的时候,先去查看控制台的信息,控制台包含所有的消息,当向别人提问的时候,务必将控制台界面截图给别人

7.SD的原理

原理涉及到机器学习以及扩散模型的方面,单拿一个知识点,都可以写十几篇论文,对于不是专门研究这方面的,我个人认为倒不用过于深究,我们只是使用者,并不是开发者。如果感兴趣的话可以研究

知乎大佬这篇Stable Diffusion原理详解,以大佬的解释,我个人觉得 最容易理解的是这句

8.结语

第一章我们简单的了解了一下 什么是AI绘画,以及什么是SD,以及SD的快速安装,当完成SD安装,就已经成功了一大步了,下一章我们来学习 如何使用文生图,提示词的使用,以及文生图各个参数的含义。

下一章:【stable diffusion】保姆级入门课程01-Stable diffusion(SD)文生图究竟是怎么一回事

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/42212.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Day57|647. 回文子串 、516.最长回文子序列

647. 回文子串 1.题目: 给你一个字符串 s ,请你统计并返回这个字符串中 回文子串 的数目。 回文字符串 是正着读和倒过来读一样的字符串。 子字符串 是字符串中的由连续字符组成的一个序列。 具有不同开始位置或结束位置的子串,即使是…

日撸java三百行day77-80

文章目录 说明GUI1. GUI 总体布局2. GUI 代码理解2.1 对话框相关控件2.1.1 ApplicationShowdown.java(关闭应用程序)2.1.2 DialogCloser.java(关闭对话框)2.1.3 ErrorDialog.java(显示错误信息)2.1.4 HelpD…

websoket

websoket是html5新特性, 它提供一种基于TCP连接上进行全双工通讯的协议; 全双工通信的意思就是:允许客户端给服务器主动发送信息,也支持服务端给另一个客户端发送信息. Websoket使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。在we…

c++内存映射文件

概念 将一个文件直接映射到进程的进程空间中(“映射”就是建立一种对应关系,这里指硬盘上文件的位置与进程逻辑地址空间中一块相同区域之间一 一对应,这种关系纯属是逻辑上的概念,物理上是不存在的),这样可以通过内存指针用读写内…

【vue】路由的搭建以及嵌套路由

目的:学习搭建vue2项目基础的vue路由和嵌套路由 1.npm 安装 router npm install vue-router3.6.52.src下新建文件夹router文件夹以及文件index.js index.js import Vue from vue import VueRouter from "vue-router" import Home from ../views/Home.…

spring boot 多模块项目非启动模块的bean无法注入(问题记录)

之前有说我搭了一个多模块项目,往微服务升级,注入的依赖在zuodou-bean模块中,入jwt拦截, Knife4j ,分页插件等等,但是启动类在system中,看网上说在启动类上加SpringBootApplication注解默认扫描范围为自己…

《爆肝整理》保姆级系列教程-玩转Charles抓包神器教程(4)-Charles如何设置捕获会话

1.简介 前边几篇宏哥介绍了Charles界面内容以及作用。今天宏哥就讲解和分享如何设置Charles后,我们就可以愉快地捕获会话,进行抓包了。因为上一篇许多小伙伴看到宏哥的Charles可以分开看到request和response,而自己的却看不到,因…

【wifi模块选型指导】数据传输WiFi模块的选型参考_USB/UART接口WiFi模块

数据传输WiFi模块有USB接口和UART接口两大类,为满足行业客户的不同应用需求,SKYLAB研发推出了多款2.4GHz单频,2.4/5GHz双频的USB接口WiFi模块和UART接口WiFi模块,数据传输能力,传输距离各有不同。怎么选才是最适合的呢…

MySql如何卸载干净经验分享

第一步:首先打开注册表:点击电脑的开始按钮,打开找到运行,输入regedit,进入注册表; 第二步:删除mysql再注册表中的信息,以下三个目录: 1.HKEY_LOCAL_MACHINE\SYSTEM\Cont…

论文阅读—2023.7.13:遥感图像语义分割空间全局上下文信息网络(主要为unet网络以及改unet)附加个人理解与代码解析

前期看的文章大部分都是深度学习原理含量多一点,一直在纠结怎么改模型,论文看的很吃力,看一篇忘一篇,总感觉摸不到方向。想到自己是遥感专业,所以还是回归遥感影像去谈深度学习,回归问题,再想着…

CMS垃圾收集器三色标记-JVM(十二)

上篇文章说了CMS垃圾收集器是赋值清除,所以他不可以碎片整理,于是jvm支持两个参数,几次fullGC之后碎片整理压缩空间。Cms他会抢占cpu资源,因为是并行运行,所以会有浮动垃圾。还有执行不确定性,垃圾收集完&a…

企业需要一个数字体验平台(DXP)吗?

数字体验平台是一个软件框架,通过与不同的业务系统喝解决方案集成,帮助企业和机构建立、管理和优化跨渠道的数字体验。帮助企业实现跨网站、电子邮件、移动应用、社交平台、电子商务站点、物联网设备、数字标牌、POS系统等传播内容,除了为其中…

【ArcGIS Pro二次开发】(48):三调土地利用现状分类面积汇总统计

之前做了一个三调三大类面积统计,有小伙伴反映太粗糙,想要一个完整的地类面积汇总表。 【ArcGIS Pro二次开发】(35):三调三大类面积统计 本质上并没有多少难度,之前也做过类似的用地用海汇总表,于是拿出来改一改就好了…

【已解决】天翼电信宽带改桥模式,使用路由器ppoe拨号

运营商在给办理宽带时会默认给宽带设置成光猫ppoe拨号,路由器只需设置为dhcp获取ip,插入到光猫的lan口即可上网。但运营商的光猫路由性能有限,会影响到网络体验。而将光猫设置为桥模式,使用路由器拨号,可以实现路由器进…

【C语言】深剖数据在内存中的存储

👦个人主页:Weraphael ✍🏻作者简介:目前正在回炉重造C语言(2023暑假) ✈️专栏:【C语言航路】 🐋 希望大家多多支持,咱一起进步!😁 如果文章对你…

酷开科技大屏营销,撬动营销新增量

5G、人工智能、元宇宙等技术的发展促使数字营销的内容、渠道、传播方式发生了一系列变化;存量竞争下,增长成为企业更加迫切、更具挑战的课题,品牌营销活动越来越围绕“生意增长”和“提效转化”的目标展开。 如今的市场环境下,产…

Nacos(服务注册与发现)+SpringBoot+openFeign项目集成

📝 学技术、更要掌握学习的方法,一起学习,让进步发生 👩🏻 作者:一只IT攻城狮 ,关注我,不迷路 。 💐学习建议:1、养成习惯,学习java的任何一个技术…

基础语言模型LLaMA

LLaMA包含从7B到65B参数的基础语言模型集合。Meta在数万亿个tokens上训练了模型,LLaMA-13B在大多数基准测试中优于GPT-3(175B)。 来自:LLaMA: Open and Efficient Foundation Language Models 目录 背景概述方法预训练数据架构Op…

openGauss学习笔记-09 openGauss 简单数据管理-创建数据库

文章目录 openGauss学习笔记-09 openGauss 简单数据管理-创建数据库9.1 语法格式9.2 参数说明9.3 示例 openGauss学习笔记-09 openGauss 简单数据管理-创建数据库 数据库安装完成后,默认生成名称为postgres的数据库。您需要自己创建一个新的数据库。 9.1 语法格式…

Appium+python自动化(十一)- 元素定位- 下卷超详解)

1、 List定位 List故名思义就是一个列表,在python里面也有list这一个说法,如果你不是很理解什么是list,这里暂且理解为一个数组或者说一个集合。首先一个list是一个集合,那么他的个数也就成了不确定性,所以这里需要用复…