4个惊艳的AI项目,开源了!

大家好,今天继续聊聊科技圈发生的那些事。

一、Champ

三维参数导引下可控一致的人体图像动画生成项目。只需要一张照片,就能让照片里的人物动起来。

给出一个动作视频,Champ 可以让不同的人像复刻出相同的动作。

我们先来看看真实人物照片的效果:

而在虚拟人物和不同风格的照片下,Champ 也有不错的表现:

项目主要依靠于人体网格恢复模型,从输入视频中提取参数化三维人体网格模型 SMPL 序列,渲染不同的信息控制视频的生成。

项目框架

在项目的框架图中,我们可以看到,Champ 采用了一个多层运动融合模块(MLMF),通过深度、骨骼、蒙版、法线、语义几项信息控制视频的细节生成,使其更加真实灵动。这五项信息,也可以通过 comfy 节点的示例工作流生成。

另外,Champ 利用 SMPL 保持了生成视频中人物体型的一致。通过对齐体型参数,Champ 在保持人物的体态和动作方面超过了其他 SOTA 工作。

效果比较

效果比较

项目提供了体验 demo,如果需要本地部署,会根据所生成的分辨率占用显存,分辨率越高,显存占用越大,需要一定硬件支持,感兴趣的小伙伴也可以试试分段生成。

项目地址:

https://github.com/fudan-generative-vision/champ

二、MuseV

基于视觉条件并行去噪的无限长度和高保真虚拟人视频生成项目。

在这个项目里,我们能看到:

  • 会动的永恩和金克斯

  • 跨越多年眨巴大眼睛的杜甫老师

而作为虚拟人视频生成项目,MuseV 在生成场景的方面也有不错的表现。

MuseV 支持以下几种生成方式:图像到视频、文本到图像到视频、视频到视频。另外,它还能兼容 Stable Diffusion 的生态系统。

并行去噪

并行去噪

对于当前的生成方案,如果不对齐视频和图像的首帧条件,首帧的信息可能会被破坏,所以 MuseV 一般有如下的使用流程:

  1. 确定参考视频

  2. 用参考视频的首帧走图生图、controlnet流程,可以使用 MJ 等各种平台

  3. 拿2中的生成图、参考视频用 MuseV 生成视频

由于训练数据类型有限,MuseV 在较低分辨率下具有更大的动作范围,但视频质量较低;在高分辨率下,画质更好、但动作范围较小。可能还需要使用更多类型的数据进行训练,如高质量、高分辨率的视频数据集。

在近期的更新中,作者团队更新了 Huggingface 的 GUI ,可以在线进行体验。

Huggingface地址:

https://huggingface.co/spaces/AnchorFake/MuseVDemo

作者团队的主页上还说到,他们即将发布的 MuseTalk(一个实时高质量的唇同步模型,在 MuseV 项目的主页也已经给出演示 demo 了)可与 MuseV 配合使用,生成的效果会更好,可以期待一手。

项目地址:

https://github.com/TMElyralab/MuseV

三、BrushNet

一个具有分解双分支扩散的图像修复模型。对于画面上的 Mask 区域(蒙版,存在缺失的部分),BrushNet 可以对其进行修复。此外,BrushNet 对于任何已经预先训练好的扩散模型都可以实现“即插即用”。

效果展示

效果展示

模型在给定蒙版和蒙版图像输入的情况下输出一个未绘制的图像。首先,对掩模进行下采样以适应潜空间的大小,并将掩模图像输入 VAE 编码器以对齐潜在空间的分布。然后,将噪声潜伏、掩码图像潜伏和下采样掩码连接起来作为输入。接下来从模型中提取特征,特征去噪后,生成的图像和蒙版图像与模糊蒙版混合,生成图像。

项目框架

BrushNet 不会修改预训练的扩散模型的权重,可以实现保存尺度调整,也可以进一步自定义非 Mask 区域的保存比例。这使得 BrushNet 具有很强的灵活性,实现即插即用。

作者团队还展示了将 BrushNet 与不同的扩散模型相结合的能力,其中有:

  • DreamShaper (DS)

  • epiCRealism (ER)

  • Henmix_Real (HR)

  • MeinaMix (MM)

  • Realistic Vision (RV)

不同模型下的效果

不同模型下的效果

根据用户个人的需求,可以灵活选用已经训练好的 SD 模型进行集成,只需要选择自己满意的效果即可。

项目地址:

https://github.com/TencentARC/BrushNet

四、MediaCrawler

这是一款开源的爬虫项目,用于爬取小红书、抖音、快手、B站、微博的视频、图片、评论、点赞、转发等信息。

MediaCrawler 基于 playwright 库搭桥,保留登录成功后的上下文浏览器环境,通过执行 JS 表达式获取一些加密参数。通过这样的方式,免去了复现核心加密 JS 代码,逆向难度大大降低。在 Python 环境下搭建项目也使得这个项目的可扩展性大大提升,潜力无限。

该项目有以下三种登录态:

  • QRCode (login_by_qrcode)

  • 手机号 (login_by_mobile)

  • Cookie (login_by_cookies)

作者也对登录的准备工作进行了说明,方便用户使用。

而且,MediaCrawler 具备模块化设计,用户可以根据自己的使用需求,定义爬取的关键词、指定目录等。可以实现抓取策略的“私人定制”。

顺提一句,作者曾将这个在几天之内就获取 10k+ star 数的项目亲手删除。当我们再一次看到它的时候,主页上新增了很多免责声明。想必作者自己也不希望这个功能如此便捷的爬虫项目给自己带来什么麻烦吧。

项目地址:

https://github.com/NanmiCoder/MediaCrawler

好了,本期的内容就是这么多,我们下期再见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/510854.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【PowerDesigner】PGSQL反向工程过程已中断

问题 反向工程过程已中断,原因是某些字符无法通过ANSI–>UTF-16转换进行映射。pg导入sql时报错,一查询是power designer 反向工程过程已中断,某些字符无法通过ANSI–>UTF-16转换进行映射(会导致数据丢失) 处理 注…

生活篇——关于分期贷或信用贷的等额本息、先息后本、月利率、年利率、年利率单利的个人理解

首先我先就年利率的理解问一下各位读者2个问题。 问题1:假设你要借100000元,借一年,月利息0.2%,等额本息,那么你觉得你总共需要还多少利息?它的实际年利率约为多少? A.2400,2.4% …

C语言一维数组及二维数组详解

引言: 小伙伴们,我发现我正文更新的有些慢,但相信我,每一篇文章真的都很用心在写的,哈哈,在本篇博客当中我们将详细讲解一下C语言中的数组知识,方便大家后续的使用,有不会的也可以当…

Java设计之道:色即是空,空即是色

0.引子 我们的这个世界上,存在这么一种东西: 第一:它不占据任何3D之体积,即它没有Volume第二:它也不占据任何2D之面积,即它没有Area第三:它也不占据任何1D之长度,即它没有Length 总…

《QT实用小工具·三》偏3D风格的异型窗体

1、概述 源码放在文章末尾 可以在窗体中点击鼠标左键进行图片切换,项目提供了一些图片素材,整体风格偏向于3D类型,也可以根据需求自己放置不同的图片。 下面是demo演示: 项目部分代码如下所示: 头文件部分&#xff…

NULL与nullptr的区别

NULL是宏定义,如下: 如果用NULL,在函数重载时,NULL的类型被推断为int。这是不好的,所以引入nullptr。nullptr是c11引入的关键字,它就代表空指针。

idea、pycharm、datagrip2023版全家桶安装+激活+性能优化

前序 内容:在windows11环境,以idea为例教大家安装、激活idea、pycharm、datagrip2023最新版本全家桶并性能优化 一、下载安装JDK 1、下载JDK 官网链接:https://www.oracle.com/java/technologies/downloads/archive 下载需要注册账户&…

每日一题:用c语言写(输入n个数(n小于等于100),输出数字2的出现次数)

目录 一、要求 二、代码 三、结果 ​四、注意 一、要求 二、代码 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> int main() {//输入n个数&#xff08;n小于等于100&#xff09;&#xff0c;输出数字2的出现次数;int n[100] ;int num 0;int count 0;/…

【面试HOT200】链表篇

系列综述&#xff1a; &#x1f49e;目的&#xff1a;本系列是个人整理为了秋招面试coding部分的&#xff0c;整理期间苛求每个算法题目&#xff0c;平衡可读性与代码性能&#xff08;leetcode运行复杂度均打败80%以上&#xff09;。 &#x1f970;来源&#xff1a;材料主要源于…

分享几个可以免费使用的GPT网站吧

1. ChatGAI ChatGAI是一个界面简洁的AI平台&#xff0c;提供App和网页版&#xff0c;每日均有免费使用机会。 2. ChatGPT 本网站向大家开放了ChatGPT 3.5和4.0版本的免费体验&#xff0c;特别适合新用户。每天都有免费次数&#xff0c;响应迅速&#xff0c;注册便捷&#xff0…

Java基础核心Map

在Java中&#xff0c;Map是一种用于存储键值对&#xff08;key-value pairs&#xff09;的集合类型。它提供了一种将键映射到值的方式&#xff0c;其中每个键在Map中都是唯一的。Map接口是java.util包中的一部分。 常用实现类&#xff1a; HashMap: 基于哈希表实现的Map&#…

db2 使用jdbc建立连接时,指定schema,schema不存在也会连接成功

使用db2想指定schema&#xff0c;使用语句如下 jdbc:db2://" hostname ":" port "/" databaseName ":currentSchema" this.databaseSchema ";"; 切记&#xff1a;最后的分号一定要有&#xff0c;否则报错。 但是此处有…

C++11---右值引用(深度讲解)

简要介绍 右值引用是C11的新特性,无论左值引用还是右值引用&#xff0c;都是在给对象取别名 什么是左值 什么是右值 1.左值,左值引用 左值是一个数据的表达式(例如变量或者解引用后的指针),我们可以对其进行取地址和修改赋值,左值可以出现在赋值符号的左边,而右值不能出现在…

算法打卡day32|贪心算法篇06|Leetcode 738.单调递增的数字、968.监控二叉树

算法题 Leetcode 738.单调递增的数字 题目链接:738.单调递增的数字 大佬视频讲解&#xff1a;单调递增的数字视频讲解 个人思路 这个题目就是从例子中找规律&#xff0c;例如 332&#xff0c;从后往前遍历&#xff0c;32不是单调递增将2变为9,3减1&#xff0c;变成了329&…

【Django开发】前后端分离美多商城项目第5篇:用户部分,起源【附代码文档】

美多商城项目4.0文档完整教程&#xff08;附代码资料&#xff09;主要内容讲述&#xff1a;美多商城&#xff0c;项目准备1.B2B--企业对企业,2.C2C--个人对个人,3.B2C--企业对个人,4.C2B--个人对企业,5.O2O--线上到线下,6.F2C--工厂到个人。项目准备&#xff0c;配置1. 修改set…

Kubernetes(k8s):部署、使用 metrics-server

Kubernetes&#xff08;k8s&#xff09;&#xff1a;部署、使用 metrics-server 一、metrics-server简介二、部署metrics-server2.1、 下载 Metrics Server 部署文件2.2、修改metrics-server.yaml 文件2.3、 部署 Metrics Server2.4、 检查 Metrics Server 三、使用 Metrics Se…

Boost之Log: (3)、简单封装

设计目标: 1、每个Logging source对应一个目录&#xff0c;可以设置日志文件数&#xff0c;日志大小&#xff0c;目录名&#xff0c;文件名等 2、所有logging source日志目录都在一个根目录下。 3、可以动态创建和删除logging source 4、打印出日期时间和日志严重等级 示例代码…

从python角度解析selenium原理

1、selenium工作流程 2、selenium工作原理 &#xff08;1&#xff09;客户端和服务端之间实际是通过http协议进行通信&#xff0c;服务端的接口文档可参考&#xff1a;https://github.com/SeleniumHQ/selenium/wiki/JsonWireProtocol#sessionsessionidelement &#xff08;2&…

softmax函数的功能及用法

Softmax函数是一种常用的激活函数&#xff0c;通常用于多分类问题的输出层。其功能是将一个具有任意实数值的向量&#xff08;通常称为“logits”&#xff09;转换为一个概率分布&#xff0c;其中每个元素的值表示对应类别的概率。 Softmax函数的公式如下&#xff1a; 给定一…

windows下通过vscode访问ubuntu(绝大部分Linux下开发所采用的方案)

前言 本篇博客是介绍VSCode远程连接Ubuntu进行开发的解决方案&#xff0c;前提是安装好了VMWare&#xff0c;Ubuntu&#xff0c;windows下的VSCode。 嵌入式驱动学习专栏将详细记录博主学习驱动的详细过程&#xff0c;未来预计四个月将高强度更新本专栏&#xff0c;喜欢的可以关…