AI绘画王者归来!SD恐怖如斯!Facebook最强人体分割大师Sapiens 吊打SAM2,亦可Pose,Depth,Normal,ComfyUI

在AI绘画领域,SD恐怖如斯和Facebook的Sapiens模型一直是业界关注的焦点。而最近,Sapiens模型凭借其强大的人体分割能力,再次成为AI绘画领域的佼佼者。

SD恐怖如斯和Sapiens模型的优势
SD恐怖如斯是一款基于深度学习的AI绘画模型,能够自动识别和绘制人体结构,使绘画过程更加便捷和高效。而Facebook的Sapiens模型则专注于人体分割,能够将人体图像精确地分割成多个部分,为艺术家和设计师提供了更多创作空间。

在这里插入图片描述

简介

Meta Reality Labs (FaceBook 实验室) 推出了 Sapiens,这是一个用于四种基本的以人为中心的视觉任务的模型系列:2D 姿势估计、身体部位分割、深度估计和表面法线预测。

Sapiens 为以人为中心的视觉任务提供了一套全面的套件(例如,2D 姿势(pose)、部分分割(seg)、深度(depth)、法线(normal)等)。该模型系列针对 3 亿张野外人类图像进行了预训练,并对无约束条件表现出出色的泛化能力。

Sapiens 提供了一套全面的套件。模型本身支持 1K 高分辨率推理,并且只需对在超过 3 亿张野外人类图像上预训练的模型进行微调,就可以非常轻松地适应各个任务。
并显示出对不受约束条件的出色泛化。这些模型还设计用于提取高分辨率特征,以 1024 x 1024 图像分辨率和 16 像素的补丁大小进行本机训练。

如下图示例:

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

Sapiens 在ComfyUI的安装和使用

ComfyUI_Sapiens 已经收录到Manager中,可以通过搜索:sapiens 来安装,如下图:

安装项目依赖:

python -m pip install -r requirements.txt  

下载模型:国内可用

• seg 身体部位分割
○ https://hf-mirror.com/facebook/sapiens-seg-0.3b-torchscript
○ https://hf-mirror.com/facebook/sapiens-seg-0.6b-torchscript
○ https://hf-mirror.com/facebook/sapiens-seg-1b-torchscript
• pose 2D 姿势估计
○ https://hf-mirror.com/facebook/sapiens-pose-0.3b-torchscript
○ https://hf-mirror.com/facebook/sapiens-pose-0.6b-torchscript
○ https://hf-mirror.com/facebook/sapiens-pose-1b-torchscript
• depth 深度估计
○ https://hf-mirror.com/facebook/sapiens-depth-0.3b-torchscript
○ https://hf-mirror.com/facebook/sapiens-depth-0.6b-torchscript
○ https://hf-mirror.com/facebook/sapiens-depth-1b-torchscript
○ https://hf-mirror.com/facebook/sapiens-depth-2b-torchscript
• normal 表面法线预测
○ https://hf-mirror.com/facebook/sapiens-normal-0.3b-torchscript
○ https://hf-mirror.com/facebook/sapiens-normal-0.6b-torchscript
○ https://hf-mirror.com/facebook/sapiens-normal-1b-torchscript
○ https://hf-mirror.com/facebook/sapiens-normal-2b-torchscript

注意:按需下载,推荐下载1b、2b 模型,质量会好些,下载完后放到对应目录,注意文件名不要修改,目录结构如下:

├── ComfyUI/models/sapiens/  
|     ├── seg/sapiens_1b_goliath_best_goliath_mIoU_7994_epoch_151_torchscript.pt2  
|     ├── pose/sapiens_1b_goliath_best_goliath_AP_639_torchscript.pt2  
|     ├── normal/sapiens_0.3b_normal_render_people_epoch_66_torchscript.pt2  
|     ├── depth/sapiens_1b_render_people_epoch_88_torchscript.pt2  

下载_yolo8m_ 放到_ComfyUI/models/sapiens_ 目录下,目录结构如下,国内下载地址:https://hf-mirror.com/Ultralytics/YOLOv8/tree/main

├── ComfyUI/models/sapiens/  
|     ├── yolov8m.pt  

Sapiens 节点详解

总共两个节点:

模型加载节点:输出模型

依次选择:seg、depth、normal、pose 的模型,建议每次选择一个,否则会爆显存。其他保持默认即可,对于pose可以勾选:use_yolo

Sapiens 采样节点:

输入接入上个节点输出的模型,和加载图片,输出对应模型的图片和遮罩。

对于seg 人体部位分割,有两个选项:

  • seg_select: 选择单个要切割的部位,必须选择一项,如果有多个部位选择,则填写要切割部位对应的数字,到下面参数中,用英文逗号分开。

  • add_seg_index: 其他要切割部分的index,多个用用英文逗号分开。

可以用到的seg_select切割部位如下:整整27个,后期还会继续增加:

0 "Background", “背景”,  
1 "Apparel", “服饰  
2 "Face_Neck", "脸部"  
3 "Hair", “头发”,  
4 "Left_Foot", “左脚”,  
5 "Left_Hand", “左手”,  
6 "Left_Lower_Arm", “左下臂”,  
7 "Left_Lower_Leg", “左下腿”,  
8 "Left_Shoe", “左鞋”,  
9 "Left_Sock", “左袜子”,  
10 "Left_Upper_Arm", “左上臂”,  
11 "Left_Upper_Leg", “左上腿”,  
12 "Lower_Clothing", “下身衣物”,  
13 "Right_Foot", “右脚”,  
14 "Right_Hand", “右手”,  
15 "Right_Lower_Arm", “右下臂”,  
16 "Right_Lower_Leg", “右下腿”,  
17 "Right_Shoe", “右鞋”,  
18 "Right_Sock", “右袜子”,  
19 "Right_Upper_Arm", “右上臂”,  
20 "Right_Upper_Leg", “右上腿”,  
21 "Torso", “躯干”,  
22 "Upper_Clothing", “上身衣物”,  
23 "Lower_Lip", “下唇”  
24 "Upper_Lip", “上唇”  
25 "Lower_Teeth", “下牙”  
26 "Upper_Teeth", “上牙”  
27"Tongue", “舌头”  

Sapiens seg 身体部位分割

工作流:

切割头发:


切割左右手:

切割左右小臂:

结合左右手+左右小臂

上身衣服:

分割嘴部:

牛,太牛,太准了,就问还有谁

Sapiens Pose 2D 姿势估计

对于需要的同学,可以下载depth,normal 模型,下载使用。

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

在这里插入图片描述

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。
在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述
在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。

在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/905319.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Redis-06 Redis复制

主: 192.168.248.132 6379 从1: 192.168.248.140 6380 从2: 192.168.248.139 6381 1.三大命令 拷贝一个新的redis.conf(出厂默认,没修改的)的文件 2.配置详情 2.1 改为yes 2.2 87行注释掉 2.3 改为no …

什么是成品系统源码,哪里有成品源码,成品源码二次开发需要多久?

成品系统源码指的是已经开发完成、可以立即部署或根据需求进行二次开发的软件系统源代码。这些源码通常包括但医疗信息化软件(如HIS、LIS、PACS等)、智慧工地源码、家政预约上门系统、实验室管理系统、定位系统源码以及生产管理系统等。 1、医疗信息化软…

[OceanBase-不止于记录]:揭秘双引擎战略,共探AI时代数据架构未来

前言 又到了一年一度大家最爱的探会文章,非常荣幸收到OceanBase官方的邀请参加2024 OceanBase 年度发布会,作为一个经常参加线下探会的博主,每一次体验都有所不同,每一次新技术的突破都让人感到无比兴奋。同时,作为数…

ELK之路第三步——日志收集筛选logstash和filebeat

logstash和filebeat(偷懒版) 前言logstash1.下载2.修改配置文件3.测试启动4.文件启动 filebeat1.下载2.配置3.启动 前言 上一篇,我们说到了可视化界面Kibana的安装,这一篇,会简单介绍logstash和filebeat的安装和配置。…

终于完工! ffmpeg 视频滤镜:添加文本-drawtext

滤镜描述 drawtext 官网链接 》 FFmpeg Filters Documentation 这个滤镜可以给视频添加上文本&#xff0c;可以给文本加边框、颜色、阴影。注意不是字幕功能&#xff0c;因为这个滤镜不能精准的控制开始和结束的时间。 滤镜使用 参数 fontfile <string> …

【模型学习之路】手写+分析Transformer

手写分析transformer 目录 前言 positional encoding 注意力机制 多头注意力 高维度乘法 多头注意力机制 多头注意力层的实现 Encoder FeedForwardNet EncoderLayer Encoder Decoder DecoderLayer Decoder 组装Trasformer! 后话 测试一下 mask 前言 Attenti…

Z 检验和 T 检验之间的区别

目录 一、说明 二、什么是假设检验&#xff1f; 三、假设检验基础 3.1 假设检验的基本概念 3.2 、执行假设验证的步骤 3.3 临界值、P 值 3.4 方向假设 3.5 非方向假设检验s 四、什么是 Z 检验统计量&#xff1f; 五、Z 检验示例 5.1 单样本 Z 检验 5.2 双样本 Z 检…

动态规划 —— 路径问题-下降路径最小和

1. 下降路径最小和 题目链接&#xff1a; 931. 下降路径最小和 - 力扣&#xff08;LeetCode&#xff09;https://leetcode.cn/problems/minimum-falling-path-sum/description/ 2. 算法原理 状态表示&#xff1a;以莫一个位置位置为结尾 dp[i&#xff0c;j]表示&#xff1a;到…

大模型是怎么训练的 微调vsRAG

模型训练的关键 在理解提示工程、RAG和微调时&#xff0c;我们首先需明白大模型的训练依托于海量多样数据&#xff0c;使其具备跨领域的综合能力。以一个具体案例为例&#xff0c;当面对问题解答失败的情况时&#xff0c;需从三方面分析&#xff1a;一、提问者表述不清&#x…

SAP ABAP开发学习——第一代增强(包含增强演示)

​​​​​​SAP ABAP开发学习——第二代增强&#xff08;包含增强演示&#xff09;-CSDN博客 SAP ABAP开发学习——第三代增强&#xff08;BADI)-CSDN博客 概念 第一代增强(增强嵌入标准程序中) 第一代出口-User exit 以SD用户出口为例 SD及MM较多的程序都是基于源码控制来…

基础IO -- 标准错误输出stderr

目录 1&#xff09;为什么要有 fd 为 2 的 stderr 2&#xff09;使2和1重定向到一个文件中 这里我们谈一下以前只是了解过的stderr 通过两段代码&#xff0c;显然&#xff0c;我们可以知道两个FILE*都是指向显示器的 对于重定向&#xff0c;只有stdout才会将打印的数据重定向…

Cursor 写一个 Flutter Unsplash 壁纸工具 | 从零开始

Cursor 写一个 Flutter Unsplash 壁纸工具 | 从零开始 视频 https://space.bilibili.com/404904528/channel/collectiondetail?sid4106380 https://www.youtube.com/watch?v-ecvMPs5vN4&listPL274L1n86T835KIPMBSwWMy1At6XCJDVR 前言 原文 用Cursor和Flutter构建动态图…

十分钟Linux中的epoll机制

epoll机制 epoll是Linux内核提供的一种高效I/O事件通知机制&#xff0c;用于处理大量文件描述符的I/O操作。它适合高并发场景&#xff0c;如网络服务器、实时数据处理等&#xff0c;是select和poll的高效替代方案。 1. epoll的工作原理 epoll通过内核中的事件通知接口和文件…

【每日刷题】Day147

【每日刷题】Day147 &#x1f955;个人主页&#xff1a;开敲&#x1f349; &#x1f525;所属专栏&#xff1a;每日刷题&#x1f34d; &#x1f33c;文章目录&#x1f33c; 1. 神奇数_牛客笔试题_牛客网 2. DNA序列__牛客网 3. I-十字爆破_牛客小白月赛25 1. 神奇数_牛客笔…

干部出国境管理系统:规范管理,确保安全

在全球化的时代背景下&#xff0c;干部因工作需要或个人原因出国境的情况日益增多。为了加强对干部出国境的管理&#xff0c;确保干部出国境活动规范、有序、安全&#xff0c;干部出国境管理系统应运而生。 一、干部出国境管理系统的重要性 规范管理流程 干部出国境管理系统…

基于Qt的多线程并行和循序运行实验Demo

致谢&#xff08;Acknowledgement&#xff09;&#xff1a; 感谢Youtube博主Qt With Ketan与KDAB精心录制的Qt多线程处理应用教程&#xff0c;感谢Bilibili博主爱编程的大丙对Qt多线程与线程池内容深入浅出的讲解。 一、计算机线程相关概念 线程概念[1]&#xff1a; 在计算机科…

PyCharm专业版设置远程开发环境

以下是在PyCharm中设置远程开发环境的详细步骤&#xff1a; 没有专业版的在并夕夕上买 准备工作 确保本地已安装PyCharm专业版&#xff0c;因为社区版通常不支持远程开发功能。在远程服务器上安装好所需的Python版本以及相关的开发包和库&#xff0c;并且服务器需要开启SSH服务…

MySQL基础概念——针对实习面试

目录 MySQL基础什么是关系型数据库&#xff1f;什么是SQL&#xff1f;什么是ACID属性&#xff1f;什么是MySQL&#xff1f;MySQL为什么流行&#xff08;它的优点&#xff09;&#xff1f; 30秒读全文 MySQL基础 什么是关系型数据库&#xff1f; 关系型数据库&#xff08;Relat…

深入布局- grid布局

属性使用案例&#xff1a; 一、display 通过给元素设置&#xff1a;display:grid | inline-grid&#xff0c;可以让一个元素变成网格布局元素, display: grid&#xff1a;表示把元素定义为块级网格元素&#xff0c;单独占一行;&#xff08;如下图:&#xff09; display: inlin…

【力扣打卡系列】反转链表

坚持按题型打卡&刷&梳理力扣算法题系列&#xff0c;语言为go&#xff0c;Day12 反转链表 题目描述 解题思路 最开始的头节点为空&#xff0c;可以赋值为nil从前往后依次逆转下一个节点的指向即可 代码参考 /*** Definition for singly-linked list.* type ListNode s…