通义千问免费新功能:EMO,让照片和视频“活”起来

🧙‍♂️ 诸位好,吾乃斜杠君,编程界之翘楚,代码之大师。算法如流水,逻辑如棋局。

📜 吾之笔记,内含诸般技术之秘诀。吾欲以此笔记,传授编程之道,助汝解技术难题。

📄 吾之文章,不以繁复之言,惑汝耳目;但以浅显之语,引汝入胜

🚀 若此文对阁下有所裨益,敬请👍🏻-点赞 ⭐ - 收藏 👀 - 关注,不胜感激。

什么是EMO

EMO(Emote Portrait Alive)是由阿里巴巴集团智能计算研究院开发的一个音频驱动的AI肖像视频生成系统,它能够通过单一的参考图像和语音音频,生成具有表现力的面部表情和各种头部姿势的视频。这一技术的核心在于其高度的表现力和逼真度,能够捕捉并再现人类面部表情的细微差别,包括微妙的微表情,以及与音频节奏相匹配的头部运动。

EMO的主要特点包括:

1.音频驱动的视频生成:无需依赖预先录制的视频片段或3D面部模型,直接根据输入的音频生成视频。

2.高表现力和逼真度:视频生成质量高,能够再现人类表情的细微差别。

3.无缝帧过渡:确保视频帧之间的过渡自然流畅。

4.身份保持:通过FrameEncoding模块保持角色外观与输入图像的一致性。

5.稳定的控制机制:采用速度控制器和面部区域控制器增强稳定性。

6.灵活的视频时长:根据输入音频长度生成任意时长的视频。

7.跨语言和跨风格:适应多种语言和艺术风格,包括中文、英文以及现实主义、动漫和3D风格。

技术报告地址:https://arxiv.org/abs/2402.17485

EMO的使用方法

在手机的软件平台下载通义千问APP,在选择“频道”->“全民舞台”,即可进入使用。

EMO的使用方法简单直观,用户可以通过通义App体验这一前沿技术。首批上线了80多个EMO模板,包括热门歌曲和网络热梗等。用户可以在歌曲、热梗、表情包中任选一款模板,上传一张肖像照片,EMO随即合成演戏唱歌视频。

就是生成时间有些漫长,大概需要15-20分钟左右。

EMO的使用场景

EMO技术的潜力巨大,未来有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。它将为内容创作者提供更多的可能性,使得创意表达不再受限于传统的视频制作方式。随着技术的不断进步和优化,EMO有望成为AI领域的一个重要里程碑。

好了,关于阿里EMO的项目就为大家分享到这里。我为大家整理了关于阿里EMO项目的相关网址,大家可以到这里了解更详细的信息,可以亲自体验一下哦 :)

官方主页:https://humanaigc.github.io/emote-portrait-alive/

研究论文:https://arxiv.org/abs/2402.17485

GitHub地址:https://github.com/HumanAIGC/EMO

🧙‍♂️ 诸位好,我是斜杠君。全栈技术,正在从事AI应用领域的研究,如果您有关于 AI 或 AI工作流 的特别需求或问题,可以通过 爱发电 向我提问。

爱发电 · 连接创作者与粉丝的会员制平台

👑 阁下若觉此文有益,恳请👍🏻-点赞 ⭐ - 收藏 👀 - 关注,以资鼓励。倘若有疑问或建言,亦请在评论区💬评论 赐教,吾将感激不尽。

 欢迎关注我的公众号 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/601972.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Git克隆仓库报错:HTTP/2 stream 1 was not closed

报错及原因 fatal: unable to access ‘https://github.com/xxx/’: HTTP/2 stream 1 was not closed cleanly before end of the underlying stream http/2 和 http/1.1之间有个区别是“HTTP2 基于 SPDY,专注于性能,最大的一个目标是在用户和网站间只…

国际数字影像产业园专场招聘会暨四川城市职业学院双选会成功举办

为了进一步强化校企合作,链接企业与高素质人才,促进毕业生实现高质量就业,2024年5月7日,“成就梦想 职通未来”国际数字影像产业园专场招聘会暨四川城市职业学院2024届毕业生校园双选会成功举行。 当天,国际数字影像产…

【建网护网三十载】 守护不息创新不止,C3安全AI未来!

30年,中国互联网从起步探索到领先全球。1994年4月20日,中国正式开通首条64K的国际专线,标志着我国成功实现与国际互联网的全功能接轨,展开互联网快速发展的三十载。 回望30年,亲历建网,投身建设&#xff0c…

yolov8任务之目标检测

对象检测 对象检测是一项涉及识别图像或视频流中对象的位置和类别的任务。对象检测器的输出是一组包围图像中对象的边界框,以及每个框的类标签和置信度分数。当您需要识别场景中感兴趣的对象,但不需要确切知道对象在哪里或其确切形状时,对象检…

RAG系统进阶

文本分割的粒度 缺陷 粒度太大可能导致检索不精准,粒度太小可能导致信息不全面问题的答案可能跨越两个片段 改进: 按一定粒度,部分重叠式的切割文本,使上下文更完整 from nltk.tokenize import sent_tokenize import jsondef split_text(…

Oracle-一次TX行锁堵塞事件

问题背景: 接用户问题报障,应用服务出现大量会话堆积现象,数据库锁堵塞严重,需要协助进行问题定位和排除。 问题分析: 登录到数据库服务器上,首先查看一下数据库当前的等待事件情况,通过gv$ses…

大学物理实验 期末复习笔记整理(个人复习笔记/侵删/有不足之处欢迎斧正)

一、误差和数据处理 1. 系统误差是指在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。它通常是由于测量设备、测量方法或测量环境等因素引起的,具有重复性、单向性和可测性。而随机误差则是由于测量过程中一系列有关因…

WRT1900ACS搭建openwrt服务器小记

参考链接 wrt1900acs openwrt wrt1900acs openwrt 刷机 wrt1900acs原生固件刷openwrt-23.05.3-mvebu-cortexa9-linksys_wrt1900acs-squashfs-factory.img wrt1900acs openwrt更新刷openwrt-23.05.3-mvebu-cortexa9-linksys_wrt1900acs-squashfs-sysupgrade.bin 通过WEB UI来…

醛固酮(Aldosterone)/Aldosterone ELISA kit--比色竞争法酶免疫检测试剂盒

醛固酮(Aldosterone)是一种由肾上腺皮质中的胆固醇合成的类固醇激素。醛固酮在肾脏和肝脏中代谢,并作为控制钠钾平衡的关键盐皮质激素发挥作用。肾上腺合成和释放醛固酮主要受肾素-血管紧张素-醛固酮系统(RAAS)的调节&…

call, apply , bind 区别详解 及 实现购物车业务开发实例

call 方法: 原理 call 方法允许一个对象借用另一个对象的方法。通过 call,你可以指定某个函数运行时 this 指向的上下文。本质上,call 改变了函数运行时的作用域,它可以让我们借用一个已存 在的函数,而将函数体内的 th…

ISIS学习第一部分——isis基本概念

目录 一.ISIS与OSI模型 1.IS-IS,中间系统到中间系统 2.ES-IS,终端系统到中间系统 二.NET——ISIS中的“IP地址” (1)NET有3个部分: 1.Area ID 2.System ID 3.SEL (2).前面是可变长的,如何进行区分…

前端开发攻略---使用Sass调整颜色亮度,实现Element组件库同款按钮

目录 1、演示 2、实现原理 3、实现代码 1、演示 2、实现原理 改变颜色亮度的原理是通过调整颜色的 RGB 值中的亮度部分来实现的。在 Sass 中,可以使用颜色函数来操作颜色的 RGB 值,从而实现亮度的调整。 具体来说,亮度调整函数通常会改变颜…

使用 Docker 部署 TaleBook 私人书籍管理系统

1)项目介绍 GitHub:https://github.com/talebook/talebook Talebook 是一个简洁但强大的私人书籍管理系统。它基于 Calibre 项目构建,具备书籍管理、在线阅读与推送、用户管理、SSO 登录、从百度/豆瓣拉取书籍信息等功能。 友情提醒&#x…

ansible------inventory 主机清单

目录 inventory 中的变量 2)组变量[webservers:vars] #表示为 webservers 组内所有主机定义变量,所有组内成 员都有效 ansible_userrootansible_passwordabc1234 3) [all:vars…

前置知识储备

基本认知 什么是模式 在一定环境中解决一些问题的方案(通俗来说:特定环境中用固定的套路解决问题) 什么是设计模式 设计模式是一套反复被人使用,多数人知晓的,经过分类编目的代码设计经验的总结 设计模式最终的目…

[笔试训练](十五)

目录 043:平方数 044:分组 045:拓扑排序 043:平方数 平方数 (nowcoder.com) 题目&#xff1a; 题解&#xff1a; 简单题&#xff0c;开根号之后判断左右两个数哪个离得近。 #include <iostream> #include <cmath> using namespace std; typedef long long…

电脑文件批量重命名不求人:快速操作,高效技巧让你轻松搞定

在数字化时代&#xff0c;电脑文件的管理与整理显得尤为重要。当面对大量需要重命名的文件时&#xff0c;一个个手动修改不仅耗时&#xff0c;还容易出错。那么&#xff0c;有没有一种方法可以快速、高效地完成这一任务呢&#xff1f;答案是肯定的&#xff0c;下面就来介绍几种…

温暖家居新风尚,能率壁挂炉——设计新风尚,体验再升级

随着家居品质要求的提升&#xff0c;现代人对家居的舒适性和设计感有了更高的追求。壁挂炉&#xff0c;作为现代家居中不可或缺的一部分&#xff0c;其重要性日益凸显。中国国际供热通风空调、卫浴及舒适家居系统展览会&#xff08;ISH China & CIHE&#xff09;将于2024年…

测评工作室的养号成本,效率,纯净度,便捷性等问题怎么解决?

大家好&#xff0c;我是南哥聊跨境&#xff0c;最近有很多做测评工作室的朋友找到南哥&#xff0c;问我有什么新的测评养号系统可以解决成本&#xff0c;效率&#xff0c;纯净度&#xff0c;便捷性等问题 测评养号系统从最早的模拟器、虚拟机到911、VPS、手机设备等&#xff0…

【深度学习实战(33)】训练之model.train()和model.eval()

一、model.train()&#xff0c;model.eval()作用&#xff1f; model.train() 和 model.eval() 是 PyTorch 中的两个方法&#xff0c;用于设置模型的训练模式和评估模式。 model.train() 方法将模型设置为训练模式。在训练模式下&#xff0c;模型会启用 dropout 和 batch norm…