用ComfyUI安装可图Kolors大模型做手机壁纸

一、Kolors简介

国内科技公司快手在人工智能领域取得了显著进展,特别推出了「可图 Kolors」这一开源模型,它在图像生成质量上超越了SD3,与Midjourney v6模型相媲美,并支持中文提示词识别与生成中文字符,成为国产AI绘画模型的佼佼者。
在这里插入图片描述

Kolors模型亮点:

  • 基于潜在扩散技术:Kolors在数十亿文本-图像对上训练,擅长生成高质量人像图片。
  • 中文提示词理解:Kolors能准确理解中文提示词,包括复杂对象、颜色和位置关系。
  • 中文字符生成:支持生成多种字体的中文字符,包括黑体、手写、书法等,准确度高。
  • 本土化元素呈现:Kolors对中国元素如长城、故宫等有出色表现,满足本土化需求。
  • 性能评估:在FlagEval模型排行榜中位列第二,仅次于DALL·E 3。

使用Kolors模型:

用户可在Huggingface平台免费体验Kolors的图像生成效果,几秒内即可得到结果。

二、ComfyUI集成Kolors模型:

ComfyUI社区迅速响应,提供了ComfyUI-KwaiKolorsWrapper插件,使Kolors模型在本地得以应用。但需注意,Kolors目前限于学术研究使用,商用需注册。

安装步骤简述:

  1. 通过ComfyUI Manager安装KwaiKolorsWrapper插件。
    一般直接git clone 可能下载比较慢,如果使用代理安装可能会出现下面的错误 。

    在这里插入图片描述

    1. 命令行代理配置:如果您的网络需要通过代理访问互联网,您可以在命令行中设置代理。例如:

      export HTTPS_PROXY=http://proxyserver:port
      export HTTP_PROXY=http://proxyserver:port
      git clone https://github.com/kijai/ComfyUI-KwaiKolorsWrapper.git
      

      替换proxyserver和port为您的代理服务器地址和端口。

    2. 使用SSH方式克隆:如果 HTTPS 方式有问题,您可以尝试使用 SSH 方式来克隆仓库:

      git clone git@github.com:kijai/ComfyUI-KwaiKolorsWrapper.git
      

      这需要您在本地配置 SSH 密钥,并将其添加到 GitHub 账户中。

      我这里就直接使用第2种安装了。

  2. 在 ComfyUI文件夹中地址栏输入cmd打开终端,安装依赖项:

    运行 pip install -r requirements.txt

    或者portable安装

    python_embeded\python.exe -m pip install -r ComfyUI\custom_nodes\ComfyUI-KwaiKolorsWrapper\requirements.txt
    

在这里插入图片描述

安装完成运行run_nvidia_gpu.bat即可

  1. 在ComfyUI-KwaiKolorsWrapper\examples文件夹中,导入 kolors_example 工作流到 ComfyUI 中,这个工作流中的节点都是 Kolors 专属的。

  2. 工作流打开后,如果点击生成,后台会自动下载所需的各种模型文件,但是容易出错,推荐从我的网盘下载modes下载diffusers\Kolors和vae模型文件,分别放到根目录的 ComfyUI\models 文件夹中即可。

  3. 根据显存容量选择合适的模型精度:fp16(13G以上)、8bit(8G以上)或4bit(4G以上)。

模型节点功能:

  • **(Down)load Kolors Model 😗*加载Kolors模型,选择对应精度加载Kwai-Kolors/Kolors大模型。默认fp16精度
  • (Down)load ChatGLM3 Model::加载 ChatGLM3 文本编码器。不同的模型需要选择不同的精度,对应关系为:fp16-fp16;quan8-8bit;quna4-4bit。
  • **Kolors Text Encode:**提示词输入框,如果在提示词后加上丨小符号,可以隔离提示词,同时生成多张图像;
  • **Kolors Sampler:**推荐使用 1024 分辨率,其余保持默认即可;
  • Load VAE::可以使用 sdxl vae。。

快手的Kolors模型不仅在技术上取得了突破,更在本土化和用户体验上展现了其独特价值。随着官方对Kolors的持续优化和新应用的开发,包括 ControlNet、IP-Adapter 和 LCM 等,我们有理由期待它在AI绘画领域的更多创新与应用。

  • Kolors模型

  • ComfyUI Kolors插件

  • ChatGLM3模型库 git克隆下载更快

    git clone https://www.modelscope.cn/AI-ModelScope/ChatGLM3-safetensors.git
    

国内网络从以上魔搭社区下载,速度更快。

也可以从我的百度网盘整合包地址下载:下载链接

三、实际使用

方案

用户要用可图大模型生成手机壁纸,最直接的有两种方案。

1、直接固定尺寸576 * 1024

2、生成1024 * 1024,然后裁剪成576 * 1024

下面是用第二种方案生成手机壁纸的绘图效果:

在这里插入图片描述

可以看出用可图来替代MJ基本是可行的,成本更低。

生成手机壁纸中的问题

1、中文理解在两种尺寸下会有差异
在用kolors做手机壁纸时,客户说效果不好,有些会变形,缺少重要元素。我测试了一下,确实用9:16生成的效果跟1:1的默认生成图片是有区别的,我用中文生成座山雕,1:1生成的是鸟,而9:16默认生的座山雕这个人。我又测试了几个,没有1:1效果好,然后我把1:1的图片加一个缩放从中间裁剪的成9:16,这样可能会更好一些吧。所以上图是生成1:1的图后,从中间裁剪成9:16,虽然有时候会把关键的元素裁掉,但是这个效果相对来说是比较好的。
在这里插入图片描述
2、生成图片效果会有差异
再画两条金鱼看一下。9:16下,鱼不在水里了,抽卡其他图片,也会有所差异,大家可以试一下。
在这里插入图片描述
也用过其他方案处理测试,比如放大后插补等,效果都不太好。暂时先用两台服务器分别使用两种方案绘图,过段时间看看大部分客户绘图的要求是什么样的,再来固定方案。不知道大家有什么更好的方案?

总之,可图大模型是具有高生成质量、支持中文提示词和字符的先进AI绘画模型,长远来看国产AI大模型一定会超越国外,更适合国人使用。希望国产越来越强!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/842874.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

经典神经网络(14)T5模型原理详解及其微调(文本摘要)

经典神经网络(14)T5模型原理详解及其微调(文本摘要) 2018 年,谷歌发布基于双向 Transformer 的大规模预训练语言模型 BERT,而后一系列基于 BERT 的研究工作如春笋般涌现,预训练模型也成为了业内解决 NLP 问题的标配。 2019年,谷歌…

Qt开发网络嗅探器03

数据包分析 想要知道如何解析IP数据包,就要知道不同的IP数据包的包头结构,于是我们上⽹查查资料: 以太网数据包 ARP数据包 IPv4 IPv6 TCP UDP ICMP ICMPv6 根据以上数据包头结构,我们就有了我们的protocol.h文件,声明…

node解析Excel中的考试题并实现在线做题功能

1、背景 最近公司安排业务技能考试,下发excel文件的题库,在excel里查看并不是很方便,就想着像学习驾考题目一样,一边看一边做,做完之后可以查看正确答案。 2、开始分析需求 题目格式如下图 需求比较简单,…

配置RIPv2的认证

目录 一、配置IP地址、默认网关、启用端口 1. 路由器R1 2. 路由器R2 3. 路由器R3 4. Server1 5. Server2 二、搭建RIPv2网络 1. R1配置RIPv2 2. R2配置RIPv2 3. Server1 ping Server2 4. Server2 ping Server1 三、模拟网络攻击,为R3配置RIPv2 四、在R…

ExoPlayer架构详解与源码分析(15)——Renderer

系列文章目录 ExoPlayer架构详解与源码分析(1)——前言 ExoPlayer架构详解与源码分析(2)——Player ExoPlayer架构详解与源码分析(3)——Timeline ExoPlayer架构详解与源码分析(4)—…

拖拽上传(预览图片)

需求 点击上传图片&#xff0c;或直接拖拽图片到红色方框里面也可上传图片&#xff0c;上传后预览图片 效果 实现 <!DOCTYPE html> <html lang"zh-cn"><head><meta charset"UTF-8"><meta name"viewport" content&…

【safari】react在safari浏览器中,遇到异步时间差的问题,导致状态没有及时更新到state,引起传参错误。如何解决

在safari浏览器中&#xff0c;可能会遇到异步时间差的问题&#xff0c;导致状态没有及时更新到state&#xff0c;引起传参错误。 PS&#xff1a;由于useState是一个普通的函数&#xff0c; 定义为() > void;因此此处不能用await/async替代setTimeout&#xff0c;只能用在返…

价格较低,功能最强?OpenAI 推出 GPT-4o mini,一个更小、更便宜的人工智能模型

OpenAI美东时间周四推出“GPT-4o mini”&#xff0c;入局“小而精”AI模型竞争&#xff0c;称这款新模型是“功能最强、成本偏低的模型”&#xff0c;计划今后整合图像、视频、音频到这个模型中。 OpenAI表示&#xff0c;GPT-4o mini 相较于 OpenAI 目前最先进的 AI 模型更加便…

51单片机(STC8H8K64U/STC8051U34K64)_RA8889驱动TFT大屏_I2C_HW参考代码(v1.3) 硬件I2C方式

本篇介绍单片机使用硬件I2C方式控制RA8889驱动彩屏。 提供STC8H8K64U和STC8051U34K64的参考代码。 【硬件部份】STC8H8K64U/STC8051U34K64 RA8889开发板 7寸TFT 800x480 1. 实物连接图&#xff1a;STC8H8K64URA8889开发板&#xff0c;使用P2口I2C接口&#xff1a; 2.实物连…

ISP代理和双ISP代理:区别和优势

随着互联网技术的不断发展和普及&#xff0c;网络代理服务成为众多用户保护隐私、提高网络性能、增强安全性的重要工具。其中&#xff0c;ISP代理和双ISP代理是两种常见的网络代理服务形式。本文将详细探讨ISP代理和双ISP代理的区别和优势&#xff0c;以便用户更好地了解并选择…

【LeetCode】填充每个节点的下一个右侧节点指针 II

目录 一、题目二、解法完整代码 一、题目 给定一个二叉树&#xff1a; struct Node { int val; Node *left; Node *right; Node *next; } 填充它的每个 next 指针&#xff0c;让这个指针指向其下一个右侧节点。如果找不到下一个右侧节点&#xff0c;则将 next 指针设置为 NUL…

MySQL学习作业二

作业描述 SQL语言 建库&#xff0c;使用库 mysql> create database mydb8_worker;#新建库mysql> use mydb8_worker; 建表&#xff0c;查看表 #建表 mysql> create table t_worker(department_id int(11) not null comment部门号,worker_id int(11) primary key no…

Flink History Server配置

目录 问题复现 History Server配置 HADOOP_CLASSPATH配置 History Server配置 问题修复 启动flink集群 启动Histroty Server 问题复现 在bigdata111上执行如下命令开启socket&#xff1a; nc -lk 9999 如图&#xff1a; 在bigdata111上执行如下命令运行flink应用程序 …

使用IDEA编写lua脚本并运行

下载lua https://github.com/rjpcomputing/luaforwindows/releases 是否创建桌面快捷方式&#xff1a;我们的目标是使用IDEA编写lua脚本&#xff0c;所以不需要勾选。后面需要的话&#xff0c;可以到安装目录下手动创建快捷方式 环境变量自动配置 安装后会自动配置好环境变量…

影响转化率的多元因素分析及定制开发AI智能名片S2B2C商城系统小程序的应用案例

摘要&#xff1a;在互联网时代&#xff0c;转化率是衡量营销活动成功与否的关键指标。本文首先分析了影响转化率的多种因素&#xff0c;包括活动页面的设计、活动的限时性、主题文案的吸引力、从众心理的运用&#xff0c;以及最核心的产品质量与优惠力度。接着&#xff0c;本文…

PyTorch深度学习实战——使用深度Q学习进行Pong游戏

PyTorch深度学习实战——使用深度Q学习进行Pong游戏 0. 前言1. 结合固定目标网络的深度 Q 学习模型1.1 模型输入1.2 模型策略 2. 实现深度 Q 学习进行 Pong 游戏相关链接 0. 前言 我们已经学习了如何利用深度 Q 学习来进行 Gym 中的 CartPole 游戏。在本节中&#xff0c;我们将…

Redis之List列表

目录 一.列表讲解 二.列表命令 三.内部编码 四.应用场景 Redis的学习专栏&#xff1a;http://t.csdnimg.cn/a8cvV 一.列表讲解 列表类型是用来存储多个有序的字符串&#xff0c;如下所示&#xff0c;a、b、c、d、e五个元素从左到右组成了一个有序的列表&#xff0c;列表中的…

git使用、git与idea结合、gitee、gitlab

本文章基于黑马程序javase模块中的"git"部分 先言:git在集成idea中,不同版本的idea中页面显示不同,操作时更注重基于选项的文字;git基于命令操作参考文档实现即可,idea工具继承使用重点掌握 1.git概述 git是目前世界上最先进的分布式文件版本控制系统 分布式:将…

快手矩阵系统全解析:功能、优势与特点一网打尽

在数字化时代&#xff0c;短视频已成为连接创作者与观众的重要媒介。快手矩阵系统以其独特的功能和优势&#xff0c;为短视频的创作、管理和发布提供了一站式解决方案&#xff0c;极大地提升了内容运营的效率和效果。 功能概览 智能创作&#xff1a;AI技术的应用使得快手矩阵…

ELK日志管理与应用

目录 一.ELK收集nginx日志 二.收集tomcat日志 三.Filebeat 一.ELK收集nginx日志 1.搭建好ELKlogstashkibana架构 2.关闭防火墙和selinux systemctl stop firewalld setenforce 0 3.安装nginx [rootlocalhost ~]# yum install epel-release.noarch -y [rootlocalhost …