ComfyUI EcomID: 阿里开源助力定制化个性图像生成,单图生成高相似度图像

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. ComfyUI EcomID 是基于 SDXL-EcomID 的开源项目,用于生成高度定制化的个性图像。
  2. 该项目结合了 PuLID 和 InstantID 的优点,优化了背景一致性和面部关键点控制。
  3. EcomID 在 200 万张淘宝图像上训练,适用于虚拟现实、影视制作等多个领域。

正文

ComfyUI EcomID 是什么

在这里插入图片描述

ComfyUI EcomID 是阿里妈妈推出的开源项目,通过单个参考图像生成定制的个性图像。它融合了 PuLID 和 InstantID 的优点,优化了背景一致性、面部关键点控制和面部真实性,提高了生成图像的相似度。EcomID 在 200 万张淘宝图像上训练,图像分辨率高,美学评分超过 5.5,能生成与个体身份高度一致的图像。

EcomID 的主要功能

  • 定制化图像生成:根据单个 ID 参考图像生成具有个性化特征的图像。
  • 保持个体身份特征:在图像生成过程中保持个体的独特身份特征。
  • 高质量图像输出:生成的图像具有高质量和语义一致性。
  • 背景一致性:协调背景与前景的一致性,避免突兀的合成效果。
  • 面部关键点控制:精确控制面部关键点,确保生成的面部图像在身份识别上具有高度的准确性。

EcomID 的技术原理

  • 预训练的人脸编码器:提取人脸特征,避免依赖预训练的 CLIP 图像编码器。
  • 轻量级适配模块:基于交叉注意力的轻量级适配模块,支持图像作为提示。
  • IdentityNet:用面部关键点作为条件输入,消除文本提示,用 ID 嵌入作为 ControlNet 中交叉注意力层的条件。
  • 结合 PuLID 和 InstantID:获得更好的背景一致性、面部关键点控制和更高的相似度。
  • 训练数据集:在 200 万张淘宝图像上训练,确保模型的泛化能力和图像质量。

如何运行 ComfyUI EcomID

安装步骤

  1. 升级 ComfyUI 到最新版本
  2. 将仓库克隆到ComfyUI/custom_nodes/目录或使用 Manager。
  3. 安装依赖库insightfaceonnxruntimeonnxruntime-gpu

下载模型

  • PuLID 预训练模型:放置在ComfyUI/models/pulid/
  • EVA CLIP:自动下载到 huggingface 目录。
  • facexlib 依赖:首次使用时下载。
  • InsightFace:放置在ComfyUI/models/insightface/models/antelopev2
  • InstantID 的 ip_adapter 模型:放置在ComfyUI/models/instantid
  • ControlNet:放置在 ComfyUI controlnet 目录。

示例展示

在示例目录中,您将找到基本工作流程和专用换脸工作流程。
在这里插入图片描述
在这里插入图片描述

资源

  1. PuLID 预训练模型:https://huggingface.co/huchenlei/ipadapter_pulid/resolve/main/ip-adapter_pulid_sdxl_fp16.safetensors
  2. InsightFace AntelopeV2:https://huggingface.co/MonsterMMORPG/tools/tree/main
  3. InstantID ip_adapter 模型:https://huggingface.co/InstantX/InstantID/resolve/main/ip-adapter.bin
  4. ControlNet 模型:https://huggingface.co/alimama-creative/SDXL-EcomID/resolve/main/diffusion_pytorch_model.safetensors

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/904649.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LabVIEW涡扇发动机加力泵测试

LabVIEW软件开发的涡扇发动机加力泵测试平台采用高度集成的硬件设备,实现了对涡扇发动机加力泵的全面测试和分析,从而确保其性能满足严格的航空标准。 项目背景 涡扇发动机是现代飞机的重要动力来源之一,其加力泵的性能直接影响飞机的整体动…

关于我的数据库——MySQL——第二篇

(叠甲:如有侵权请联系,内容都是自己学习的总结,一定不全面,仅当互相交流(轻点骂)我也只是站在巨人肩膀上的一个小卡拉米,已老实,求放过)。 表的操作 创建表…

练习LabVIEW第二十八题

学习目标: 刚学了LabVIEW,在网上找了些题,练习一下LabVIEW,有不对不好不足的地方欢迎指正! 第二十八题: 建立一个VI,模拟滚动—个骰子(骰子取值1~6),跟踪骰子滚动后的取值出现次数…

xhr的readyState和status

XMLHttpRequest(XHR)对象中的readyState和status用于监控异步 HTTP 请求的状态。它们分别表示请求的当前阶段和服务器的响应状态。 readyState 用于判断请求所处的阶段,确保数据完全接收。 status 用于判断请求的结果状态(如200表…

计算机网络IP地址分类,子网掩码,子网划分复习资料

IP 地址的概念 IP 地址是独立于硬件地址的逻辑地址,它是由软件提供的地址。 IP 地址是网络层地址。 IP 编址方案和分类 IP 地址由 32 位二进制数构成,分为前缀(网络地址)和后缀(主机地址) 同一网段中每台计算机的 IP 地址是唯一的网络地址的分配全球…

【Stable Diffusion】

1、SD 模型 安装完SD软件后,必须搭配基础模型才能使用。 不同的基础模型,其画风和擅长的领域会有侧重。 Checkpoint大模型 大模型是 SD 的核心,用来控制生成图片的整个画面风格走势。 出图前要选择好合适的大模型,比如有些擅长…

WPF+MVVM案例实战(一)- 设备状态LED灯变化实现

文章目录 1、项目创建2、UI界面布局1. MainWindow.xaml2、颜色转换器实现2.MainViewModel.cs 代码实现3、运行效果4.源代码下载1、项目创建 打开 VS2022 ,新建项目 Wpf_Examples,创建各层级文件夹,安装 CommunityToolkit.Mvvm 和 Microsoft.Extensions.DependencyInjectio …

node集成redis (教学)

文章目录 前言一、安装redis二、可视化界面测试连接1.vscode安装插件 三、node代码编写1.先安装两个库(redis和ioredis)2.测试连接 (前提是你的redis服务器要启动起来) 总结 前言 在Node.js中集成ioredis是一个常见的做法&#x…

Java MySQL-JDBC编程

文章目录 初始JDBCJDBC的工作原理 初始MavenMaven入门简介修改Maven的配置文件在idea中查看当前的maven使用在当前Maven工程中加载数据库驱动 DriverManager连接方案注册一个驱动创建一个连接获取一个操作SQL的对象创建SQL查询获取结果集遍历结果集输出结果关闭资源以及完整代码…

TCP全连接队列与 tcpdump 抓包

🍑个人主页:Jupiter. 🚀 所属专栏:计算机网络高效通关之路 欢迎大家点赞收藏评论😊 目录 listen第二个参数详解 全连接队列与半连接队列半开放连接队列(SYN队列)全连接队列(接受队列…

20241030在荣品PRO-RK3566开发板的适配Rockchip原厂的buildroot的时候配置DTS中的电源域

20241030在荣品PRO-RK3566开发板的适配Rockchip原厂的buildroot的时候配置DTS中的电源域 2024/10/30 17:38 请问 RK3566开发板上的 电源配置 和 DTS文件是如何对应的? 底板原理图 PRO-RK3566-B-20210329原理图.pdf vccio4-supply 是1.8V。 对不上呀? Z:…

【Java】数组的定义与使用

数组的定义与使用 1. 数组的基本概念1.1 为什么要使用数组1.2 什么是数组1.3 数组的创建及初始化1.3.1 数组的创建1.3.2 数组的初始化 1.4 数组的使用1.4.1 数组中元素访问1.4.2 遍历数组 2. 数组是引用类型2.1 初始JVM的内存分布2.2 基本类型变量与引用类型变量的区别2.3 再谈…

活动回顾丨艾体宝《开源软件供应链安全的最佳实践》线下研讨会圆满落幕!

10月,艾体宝联合Mend成功举办了一场主题为“开源软件供应链安全最佳实践”的研讨会。此次活动吸引了众多业内专家、技术领袖和企业代表参与,共同探讨在当今数字化转型浪潮中,企业如何应对开源软件供应链安全的挑战。会议围绕三大核心议题展开…

复现第一周24

1.[SWPUCTF 2021 新生赛]gift_F12 1)打开题目 2)看源码 3)直接ctrl+f搜索flag 2.[SWPUCTF 2021 新生赛]nc签到 1)开题 2)下载附件用记事本打开 3)打开kali使用nc连接代码 输入l\s命令绕过黑名…

如何写出爆款脚本,很多人都忽略了这一项——口语化

不是每次写的视频脚本都绞尽脑汁吗? 你让观众觉得在和你‘聊天’,可一开写就生长硬、平淡、没有吸引力? 其实,只要掌握一些口语化的写作技巧,剧本也能写得像聊天一样轻松自然,让观众从头尾看到&#xff0…

ubuntu 22.04网线连接无ip、网络设置无有线网界面(netplan修复)

目前遇到过树莓派和其他设备安装 ubuntu22.04, 使用有线网络一段时间(可能有其他软件安装导致)造成有线网络未启动无ip分配的问题。 1、动态分配 通过命令行启动dhcpclient实现 网络eth0存在异常,网口灯电源和信号灯均点亮&am…

Machine Learning on the Edge

安装 python3 网址:https://www.python.org/downloads/release/python-3120/ 打开命令行安装esptool包,pip install esptool 下载Node.js 网址:https://nodejs.org/en/download/prebuilt-installer

国产骄傲,华为自研编程语言,新式中文编程拒绝卡脖子

六大模块助力开发 10月30日,华为自研的通用编程语言——仓颉编程语言迎来了重要的里程碑时刻。其官方网站正式上线,并开放了首个公测版本的下载通道。这不仅标志着华为在编程语言领域的又一重大突破,也为开发者们带来了全新的编程选择与体验。…

qt QMainWindow详解

一、概述 QMainWindow继承自QWidget,并提供了一个预定义的布局,将窗口分成了菜单栏、工具栏、状态栏和中央部件区域。这些区域共同构成了一个功能丰富的主窗口,使得应用程序的开发更加简单和高效。 二、QMainWindow的常用组件及功能 菜单栏&…

VUE errolog, vue 错误集

I) installation As to command “npm install” on cmd or powershell, we must execute it under the program folder