3D数字人视频合成用户指南

数字人开放平台3D互动数字人如何接入_虚拟数字人(DVH)-阿里云帮助中心3D互动数字人(对应开放平台的“智能客服”场景)是虚拟数字人开放平台提供能够支持用户与3D数字人进行实时语音交互的数字人产品能力,需要配合智能对话机器人产品使用。本篇文档将介绍如何接入3D互动数字人。icon-default.png?t=N7T8https://help.aliyun.com/zh/avatar/avatar/developer-reference/integrate-3d-interactive-dvh

1 进入视频合成页面

进入数字人开放平台控制台,点击视频合成-新建视频,选择3D形象进入视频合成页面。

image.png

image.png

2 视频设置

2.1 数字人

点击数字人,可在此重新选择数字人形象。

image

鼠标悬浮在某一形象上方,显示【形象配置】按钮,此时点击将前往资产中心-3D数字人资产,可在此页面对数字人形象进行配置,如发型、妆容、服装、声音等。

2.2 声音

点击声音,可选择数字人播报的音色并调整音色对应的音量、语速和音调,目前平台提供四个类别的音色:男声、女声、童声以及方言;多情感音色支持在文本编辑器中针对文本进行情绪化的编辑,详见3.1节语音编辑;带星号的音色为使用频率较高的音色。

image

2.3 背景图

点击背景图,可选择平台内置的背景,包括透明背景;同时可上传自定义背景,上传时请注意背景图大小要求。

image

2.4 字幕

点击字幕,根据需要打开或者关闭字幕开关,可调整字幕样式,如字体、字号、字体颜色、描边颜色。

image

2.5 尺寸

在预览画面上方,可选择尺寸,目前平台支持两种尺寸:16:9、9:16。

2.6 调整数字人在画面中的大小以及位置

在左侧的预览画面中,通过鼠标拖拽数字人,可移动数字人,调整其在画面中位置;另外平台提供了远景、近景和特写三种景别以及正面、左侧30°和右侧30°三种机位,用户可在预览画面中看到相应的效果并选择适合的组合。

image.png

image

image

3 播报内容输入

3.1 文本输入

选择文本输入,您可在文本框中输入希望数字人播报的文本来制作视频。

3.1.1 语音合成的编辑功能
  1. 文本输入框集成了语音合成的编辑器功能,可在该编辑器中对语音合成进行人工的调整,例如标注多音字、标注文本读法、标注数值读法等,详见下表。

  2. 同时文本输入框集成了情绪化音色的编辑能力,可在编辑器中选中某段文本并选择需要的情绪,详见下表。注意:该功能需要在声音设置中选择多情感音色。

功能

子功能

备注

操作方法

多音

/

/

弹出浮层高亮多音字,逐一标注

文本

人名

姓氏自动匹配、连续

划选文字后选择读法

地址

示例:2单元301读作二单元三零幺

标点符号

读标点本身发音

ID

读字母和数值

日期

示例:2019/10/21读作二零一九年十月二十一日

时间

示例:01:13:43读作一点十三分四十三秒

计量单位

示例:mm读作毫秒(在阿里云语音合成服务中会将mm读作毫秒)

数值

读数值

示例:123读作一百二十三

划选数字文本后选择读法

读数字

示例:123读作一二三

读手机号

示例:13900001111

读作幺三九<停顿0.5s>零零零零<停顿0.5s>幺幺幺幺

英文

读字母

每个字母分开发音

划选英文文本后选择读法

连续

/

选中的文本连续发音

划选需要调整的文本

停顿

0.5s

停顿0.5s

在光标位置插入停顿

1s

停顿1s

2s

停顿2s

情绪

生气

/

划选文字后选择情绪,默认为自然情绪

害怕

开心

厌恶

悲伤

惊讶

插入日期

/

/

在光标位置插入当前日期

插入时间

/

/

在光标位置插入当前时间

试听

/

/

划选需要试听的文本进行试听(需完成声音设置)

3.1.2 动作编辑

文本输入框也集成了动作编辑的功能,可在文本中插入数字人动作。目前支持两种形式的插入:(1)自定义动作,用户可以选择该数字人的动作进行自主插入。在自定义动作时,也可以点击"推荐插入",此时系统将会自动将推荐的动作插入文本中,用户可以在此基础上再次对动作进行修改;(2)智能动作,点击后不会在编辑器中显示动作标签,算法将会根据语义,在合成过程中匹配合适的动作。

image.png

3.2 音频输入

选择音频输入,您可上传本地的音频文件,为保证效果,请上传在安静环境下录制的播报人声。此时生成视频中的声音即为上传的音频。

4 生成视频

4.1 生成视频

点击生成视频,将根据输入的文本生成数字人播报的视频;视频生成时间根据输入的文本长度而定。生成好的视频会在视频管理中展示,可在该页面下进行视频的下载;平台支持生成MOV和MP4格式的视频,其中选择透明背景,生成的MOV视频可以直接在第三方剪辑软件中二次加工;而选择MP4格式将同时导出两个视频,一个为带黑灰色背景的视频,另一个为alpha通道视频,可在专业剪辑软件中通过遮罩功能去除原视频中的背景以获得透明背景的效果。需要注意的是,不管背景是否透明,选择生成MOV格式将会需要较长的渲染时间,且生成的视频也会较大。

4.2 存为草稿

点击存为草稿可将目前的设置和输入的文本存为草稿,草稿将在视频管理中展示,可以继续进入原草稿进行编辑。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/748747.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

白鲸开源中标人保集团2024年数据调度工具软件产品及服务采购项目

近日&#xff0c;北京白鲸开源科技有限公司成功中标中国人民保险集团&#xff08;以下简称“中国人保”&#xff09;2024年数据调度工具软件产品及服务采购项目。此举将为中国人保提供高性能、高可用性、高扩展性和高安全性的一站式数据调度管理方案&#xff0c;大力推进中国人…

《数据结构与算法基础 by王卓老师》学习笔记——1.4算法与算法分析

一、算法 1.1算法的研究内容 1.2算法的定义 1.3算法的描述 以下是算法的自然语言描述 以下是算法的传统流程图表示 以下是NS流程图表示 1.4算法和程序的区别与联系 1.5算法的五个特性 1.6算法设计的要求 Robustness也称为鲁棒性 二、算法分析 2.1算法时间效率的度量 2.1.1事…

爬虫-Python基础

一、Python环境的安装 1. 下载Python 访问Python官网: Welcome to Python.org点击downloads按钮&#xff0c;在下拉框中选择系统类型(windows/Mac OS/Linux等)选择下载最新版本的Python 2. 安装Python 双击下载好的Python安装包勾选左下角 Add Python 3.7 to PATH 选项&…

机器人控制系列教程之动力学建模(2)

接昨天的推文&#xff1a;https://editor.csdn.net/md/?articleId139991958 &#xff0c;动力学的求解通常是个相对比较复杂的过程&#xff0c;但现在基本上不用人工来推算求解各种公式和求解过程了&#xff0c;大家只需要知道其中的步骤即可&#xff0c;现代对于动力学问题的…

uni-app (通过HBuilderX 和 VS Code 开发)详细连接过程教学。

使用 HBuilderX 创建 uni-app 项目 并编译到微信开发者工具。 uni-app 支持两种方式创建项目&#xff1a; 通过 HBuilderX 创建 通过命令行创建 首先我们需要先下载HBuilderX 下载链接地址&#xff1a;DCloud - HBuilder、HBuilderX、uni-app、uniapp、5、5plus、mui、wap2…

postman忘记密码发邮件,久久收不到怎么办?

根本原因是需要FQ&#xff01;&#xff01;&#xff01; 重置密码的链接&#xff1a; https://identity.getpostman.com/trouble-signing-in 找个平台或者软件&#xff0c;访问这个链接即可完成修改密码后续操作&#xff0c;不用再傻傻等着验证码了。 有需要协助的朋友也可私信…

uniapp标题水平对齐微信小程序胶囊按钮及适配

uniapp标题水平对齐微信小程序胶囊按钮及适配 状态栏高度胶囊按钮的信息计算顶部边距模板样式 标签加样式加动态计算实现效果 t是胶囊按钮距离的top h是胶囊按钮的高度 s是状态栏高度 大概是这样 状态栏高度 获取系统信息里的状态栏高度 const statusBarHeight uni.getSy…

开源“卖货主播”AI大模型——拳打李佳琦、脚踢小杨哥、人人都能当销冠?

开源“卖货主播”AI大模型——拳打李佳琦、脚踢小杨哥、人人都能当销冠&#xff1f; 刚刚在知名同性交友平台发现了一个或许能让你致富的开源项目——“Streamer-Sales 销冠”。 正如其名字所言&#xff0c;这是一个卖货主播LLM大模型&#xff0c;旨在让你成为销冠。 https:/…

换新手机了,旧手机的微信聊天记录怎么办?两个方法,轻松迁移

618买的新手机终于到手&#xff0c;但你是否在为旧手机上的微信聊天记录感到困扰&#xff1f;不用担心&#xff0c;迁移过程其实非常便捷&#xff01; 在本文中&#xff0c;我将为你展示2个简单的步骤&#xff0c;让你轻松迁移微信聊天记录。无论你更换新手机的原因是什么&…

财务RPA案例研究——分析成功的财务RPA实施案例

现代社会正加速向数字时代转型&#xff0c;数字技术以崭新的模式全面融入各行业领域。为顺应新一轮科技革命和产业变革趋势&#xff0c;越来越多的企业不断深化应用大数据、云计算、人工智能等新一代信息技术&#xff0c;积极迎接数字化转型&#xff0c;而RPA技术由于能够以自动…

SuperMap GIS基础产品FAQ集锦(20240627)

一、SuperMap iDesktopX 问题1&#xff1a;请问桌面端二三维数据对接处理&#xff0c;尤其是三维数据&#xff0c;处理自动化有没有已有的模型或者是效果示例&#xff1f; 11.2.0 【解决办法】【三维数据】-【流程操作】里有三维数据处理自动化的算子 问题2&#xff1a;请问…

LSTM理解

目录 一、LSTM的本质 二、LSTM的原理 三、LSTM的应用 本文将从LSTM的本质、LSTM的原理、LSTM的应用三个方面&#xff0c;带您一文搞懂长短期记忆网络Long Short Term Memory | LSTM。 一、LSTM的本质 RNN 面临问题&#xff1a;RNN&#xff08;递归神经网络&#xff09;在处理…

【网络安全的神秘世界】SQL注入漏洞(上)

&#x1f31d;博客主页&#xff1a;泥菩萨 &#x1f496;专栏&#xff1a;Linux探索之旅 | 网络安全的神秘世界 | 专接本 | 每天学会一个渗透测试工具 本章知识使用的靶场&#xff1a;DVWA 一、漏洞简介 SQL&#xff1a;结构化查询语言&#xff0c;是一种特殊的编程语言&#…

项目经理必读:三步走实现项目高效管理

一个项目的成功往往取决于项目管理能力的高低。若管理不当&#xff0c;易导致团队成员间的推诿和抱怨&#xff0c;且项目团队还可能面临成员对目标不明确、信息不透明、进度难以跟踪等问题。作为项目经理&#xff0c;掌握有效的项目管理策略至关重要。 一、精细化的目标拆解 …

瑶池数据库SQL-问题二的解决方案

瑶池数据库SQL-问题二的解决方案 为什么选问题二问题二准备工作解决方案第一步第二步初步尝试再次尝试主表自关联查询满足条件数据 解题感受 为什么选问题二 个人没有详细的看三个题目的具体内容&#xff0c;只是看了三个题目的题目名称&#xff0c; 最后觉得问题二比较有意思…

本安防爆手机为什么能在石油化工行业使用

本安防爆手机专为石油化工行业等易燃易爆环境设计&#xff0c;具备严格的防爆安全标准和环境适应性&#xff0c;确保在石油化工厂的作业安全使用。这些手机不仅具备普通手机的通讯功能&#xff0c;更能有效防止电火花等潜在点火源的产生&#xff0c;为石油化工工作人员提供可靠…

阿里1688商家数据采集软件

大镜山阿里1688商家数据采集一款采集阿里巴巴1688.com商家数据的软件&#xff0c;采集的数据包括店铺名称、联系人姓名、手机号码等。 一、大镜山阿里1688商家数据采集特色 — 大镜山阿里1688商家数据采集一款采集阿里巴巴1688.com商家数据的软件&#xff0c;采集的数据包括店…

【JavaScript】一键入门

目录 一、JS起源 二、JS特点 三、JS组成部分 四、JS引入方式 一、JS起源 Java Script是由网景公司的Live Script发展而来的一种运行在客户端浏览器上的脚本语言&#xff0c;可以实现网页如文本内容、数据动态变化和动画特效等即浏览器与用户交互的这种体验。 二、JS特点 …

强化学习详解:理论基础与核心算法解析

本文详细介绍了强化学习的基础知识和基本算法&#xff0c;包括动态规划、蒙特卡洛方法和时序差分学习&#xff0c;解析了其核心概念、算法步骤及实现细节。 关注TechLead&#xff0c;复旦AI博士&#xff0c;分享AI领域全维度知识与研究。拥有10年AI领域研究经验、复旦机器人智能…

MySQL的安装与配置

MySQL提供安装包和压缩包两种安装方式&#xff0c;安装包是以.msi作为后缀名的二进制分发文件&#xff0c;压缩包是以.zip为后缀的压缩文件。安装包的安装只要双击安装文件&#xff0c;然后按照提示一步步安装就可以了&#xff0c;属于“傻瓜”式安装&#xff1b;压缩包的安装需…