阿里云大模型「让照片跳舞」刷屏朋友圈,有哪些信息值得关注?

介绍

大家好,我分享聊聊阿里通义千问APP中全民舞王功能。

网络热舞结合AI视频,这是以后不用学习跳舞?

可以尝试下效果,一张图片生成视频。

APP快速使用

搜索下载通义千问APP
在这里插入图片描述
打开APP,选中一张照片来跳舞。
在这里插入图片描述
在这里插入图片描述
这里上传照片原则:身体保持全身站立,挺胸抬头,图像中不要有其他人,背景简单些。
在这里插入图片描述

AI视频一张图片跳科目三

图解原理

虽然一些技术没有开源,我们可以根据阿里通义实验室自研视频生成模型 Animate Anyone,推演原理。

我们通过图讲解下演化,Animate Anyone用于人物动画的图像到视频合成方法,基于扩散模型重构创新所得。

图解扩散模型生成过程

在这里插入图片描述
VAE编码器(输出矩阵)-> UNet (完成当前时间步 t 的噪声预测) -> SD1.x 系列(64x64x4 的向量) -> 采样器 (重复 N 次) 去除噪声 -> VAE解码器 -> 生成图像。

具体可以看我原先的讲解扩散模型

图解Animate Anyone生成过程

https://arxiv.org/pdf/2311.17117.pdf
参考图像和姿态序列输入,经过VAE编码器,创建一个矩阵(潜在的表示),用到CLIP (文本-图像映射)引导角色原始外观,姿态引导与U-Net结合,类似上述过程,在空间和时间中去噪,输出一个合成视频。

该架构强调保持角色的详细特征、运动的连续性和对动画的控制。

该模型解决了图像到视频合成的挑战,如保持详细信息和确保生成动画的时间稳定性。

论文在从静态图像生成角色视频方面呈现了最先进的结果。

总结

阿里云大模型 Animate Anyone就像一个超级导演。

与过去那些导演只会让演员在视频里面变来变去、动作不连贯不同,这个模型导演出来的视频,无论演员的样子还是动作都非常逼真流畅,就像真人一样。

朋友们可以一块讨论下还适合在什么领域?

我是李孟,独立开源软件开发者,SolidUI作者,对于新技术非常感兴趣,专注AI和数据领域,如果对我的文章内容感兴趣,请帮忙关注点赞收藏,谢谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/294900.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

css单位介绍

当我们在编写网页或应用程序时,选择合适的单位来描述元素的尺寸是非常重要的。在CSS中,我们常常会使用像素(px)、相对像素(rpx)、字号单位(em)、根元素字号单位(rem)、百分比(%)和视口百分比(vh、vw)等单位来描述元素的大小。 像素(px)是最常见的单位&a…

Unity中Shader序列帧动画(U、V方向的走格)

文章目录 前言一、U方向的走格1、 要实现移动的效果,我们就会想到使用_Time2、使用floor向下取整3、把x、y缩小为原函数的 Column倍4、使用_Sequence的z控制帧动画U方向上的速度 二、U方向的走格三、最终效果1、亚丝娜2、小蓝帽3、火4、最终代码 前言 在上一篇文章…

没有一家车企能绕开「数据闭环」

作者 |张祥威 编辑 |德新 2023年,在比亚迪那次公布智驾数据规模后,智能化下半场的战斗就正式打响了。 如今,自动驾驶正在沿着特斯拉提出的「BEVTransformer」急速推进,这条技术路线短短几年就得到了验证,随着智驾起较…

软件测试|弄懂GROUP BY看这一篇文章就够了

简介 在SQL(结构化查询语言)中,GROUP BY子句是一个强大的工具,用于对查询结果进行分组和聚合操作。通过使用GROUP BY子句,可以根据指定的列或表达式对数据进行分组,并对每个分组应用聚合函数,从…

VSCode安装 PlatformIO 插件指南

公众号阅读: 前言 在前几次发的文章中多次提到PlatformIO这个VSCode插件,很多同学私信我说非常难安装,希望我继续分享如何在国内快速安装PlatformIO。其实PlatformIO官网提供了详细的安装文档和PIO的使用手册。大家可以参考官网文档。本文将…

第十课:计算机心理学、教育科技及奇点,天网,计算机的未来

第十课:计算机心理学、教育科技及奇点,天网,计算机的未来 第三十八章:计算机心理学0、计算机中用到的心理学原理1、易用度2、颜色强度排序和颜色排序3、分组更好记4、直观功能5、认出VS回想6、让机器有一定的情商以及Facebook的研…

案例094:基于微信小程序的图书馆自习室座位预约管理系统

文末获取源码 开发语言:Java 框架:SSM JDK版本:JDK1.8 数据库:mysql 5.7 开发软件:eclipse/myeclipse/idea Maven包:Maven3.5.4 小程序框架:uniapp 小程序开发软件:HBuilder X 小程序…

Unraid APP下载慢解决方法

1.首先你的APP商城能够打开 这里我已下载Jellyfin为例 使用APP查找镜像,是为了获取下面的配置模板 2.修改地址 默认的地址是 lscr.io/linuxserver/jellyfin服务器在国外,被墙了.下载具慢 我们需要把这个下载源修改成国内的 有很多国内的源,但是我觉得阿里的比较快 3.获…

低代码UI构件程序设计基础实训一

步骤一 低代码在线调试工具 网址 低代码在线调试工具 步骤二 D盘建一个文件夹,文件夹下建两个文件夹ico和js 网上找一些图片,后缀.png,编号从0开始,图片另存到ico文件夹下 下载(右键另存为)以下四个页面…

discard long time none received connection

使用DruidDataSource 做数据源时,如果创建的连接在长时间得不到调用后会报如题所示的错误 discard long time none received connection. ,jdbcUrl : jdbc:mysql://localhost:3306/test?autoReconnecttrue&useUnicodetrue&characterEncodingutf8&serverTimezoneC…

C语言编译器(C语言编程软件)完全攻略(第三部分:Windows下的编译器有哪些?如何选择?)

介绍常用C语言编译器的安装、配置和使用。 三、Windows下的编译器有哪些?如何选择? 安装编译器或者 IDE(集成开发环境),也叫搭建开发环境。Windows 下的C语言 IDE 众多,多如牛毛,初学者往往不…

信号强度功能 界面、逻辑和图标(免费)

信号强度 需求 vue项目,需要实时监控系统信号,要求: 1.共五格信号; 2.信号0-100为满值,信号100-500为四格,信号500-1000为三格,信号1000-5000为两格,信号5000-20000为一格&#x…

Python学习笔记(五)函数、异常处理

目录 函数 函数的参数与传递方式 异常处理 函数 函数是将代码封装起来,实现代码复用的目的 函数的命名规则——同变量命名规则: 不能中文、数字不能开头、不能使用空格、不能使用关键字 #最简单的定义函数 user_list[] def fun(): #定义一个函数&…

微软 Power Platform 使用Power Automate发送邮件以Dataverse作为数据源的附件File Column

微软Power Platform使用Power Automate发送邮件添加Power Apps以Dataverse作为数据源的附件File Column方式 目录 微软Power Platform使用Power Automate发送邮件添加Power Apps以Dataverse作为数据源的附件File Column方式1、需求背景介绍2、附件列File Column介绍3、如何在Po…

华焰天下隆重推出华火智能电燃灶产品,引领绿色科技新潮流!

近日,以“慧聚英雄南昌,论道策划科技——畅展华焰未来,迈向财富新时代”为主题的华火新能源产品发布会于江西南昌盛大举办。 各级领导、全国各地的企业家、家电行业优秀从业者、新能源应用领域专家、策划行业名人大咖及广大媒体朋友莅临活动…

小心JDK20 ZipOutputStream

Oracle 團隊竟然這麽粗心,編譯JDK 20 時ZipOutputStream沒有編譯成功就發佈了。 所以這個20版本不可以使用ZipOutputStream。 GZIPInputStream 只能做最後的壓縮,不能添加多個附件ZipEntry。 下一個版本21不存在這個問題。 try(var zipOut new ZipOu…

LabVIEW开发智能水泵监测系统

LabVIEW开发智能水泵监测系统 水泵作为水利、石化、农业等领域的重要设备,其能效与健康状态直接关系到提灌泵站的运行效率。尽管水泵机组在全球能源消耗中占有显著比例,但实际运行效率常因设备老化和维护不当而远低于预期。这一状况需要更高效的监测手段…

Spring Boot 整合 Knife4j(快速上手)

关于 Knife4j 官方文档:https://doc.xiaominfo.com/ Knife4j是一个基于Swagger的API文档生成工具,它提供了一种方便的方式来为Spring Boot项目生成在线API文档。Knife4j的特点包括: 自动化生成:通过Swagger注解,Kn…