AI数字人克隆采集规范分享!

数字人直播的时代已经来临,使用青否数字人SaaS系统数字人源码:zhibo175)去生成数字人,那如何能得到自己想要的效果呢?需要注意一下几点:

一.摄影棚灯光方案

中型(15m²左右)摄影棚​

适用于美妆/珠宝等直播,近距离细节展示,高色彩还原度​

大型(20m²左右)站播适用​

适用于服装鞋帽/家居等,主播站立演示穿搭/使用效果的场景​

二.数字人克隆 - 视频采集规范

训练素材录制要求

1、视频时长:训练素材要求5-10分钟;

2、拍摄要求:推荐直接用剪映录制,如果用相机更好;分辨率要求 >= 1080*1920(推荐分辨率为4K),fps不能低于25帧;拍摄主要影响因素是噪音,其次是灯光。

3、噪音:录制时要求环境安静不能有噪音,爆音,回音,最好选择安静的环境拍摄,有降噪麦克风。

4、灯光:灯光要求保证人物脸部,嘴巴,牙齿等五官细节清晰可见,光线均匀,无阴影。

5、视频画面:人物头像不能超过屏幕1/3,人脸尺寸大于300*300px;录制时推荐绿幕背景,后期可以更换各种背景;绿幕平整无褶皱,人距离绿幕2米远。

6、口播内容:内容不限,推荐选模特熟悉的内容,准备6000字文稿;讲的过程说错也没关系,继续讲就可以;千万不要一直说重复的内容。

7、服饰妆造注意事项:避免反光材质衣物;避免半透丝纱材质衣物;避免蕾丝材质的衣物;避免与绿幕相近的衣物以及绿色元素;

首饰:避免佩戴宽松易滑动晃动的首饰,比如项链、容易晃动的耳环(耳钉是可以的)、带链子的眼镜;

妆发:妆容自然得体,头发整理好避免出现散发碎发以及发缝;

8、人物动作:动作自然,与应用场景匹配;动作尽量通用,避免指向性动作;手不挡脸,抬手不过肩;表情动作自然,避免大角度侧脸;避免身体晃动,避免大幅度和迅速的动作;口播时,嘴巴注意张开,口齿清晰,发音标准,说话速度不能太快;避免舔嘴,吞咽,撅嘴,皱眉,摸头,摸脸等小动作。

9、其他注意事项:人物面部不能有遮挡,灯光要求脸部轮廓,牙齿嘴唇清晰可见;人物不能过分瘦脸,美白,可能造成轮廓不清晰。

推理素材录制要求:

  1. 拍摄要求同训练视频一致;
  2. 素材要求20-30s;
  3. 录制过程中全程静默,不说话,前5s不动,中间做通用手势,肢体动作,表情动作自然,后5s不动。

三.声音克隆 - 音频采集规范

1、音频时长:有效音频时长20分钟,如果带口音,音频建议不少于30分钟;

2、录音准备

根据不同使用需求,准备5000字左右的文本内容,内容和应用场景(朗读、直播、日常讲话等)语境相符;

3、录音环境:录音环境安静,环境底噪小于40dB,可使用“分贝仪”APP测试录音环境底噪;

录制时保持无回音、无混响、无噪声等;

4、录音设备及录音参数:录音设备推荐降噪麦克风/小蜜蜂,条件允许建议使用防风棉衣或防喷罩;推荐使用48kHz采样率录制音频;推荐无损音质格式保存音频,如: wav、 fiv、m4a,不能使用压缩格式保存音频,如:mp3;

5、录音人:录音人不宜离麦太近,防止喷麦和录入呼吸声连贯说完一句话;发音清晰、吐字清楚,句与句之间断句清楚;

句与句之间停顿1~2秒;保持语境风格一致,避免多种情绪混杂。

按照以上要求去拍摄和录制,上传到青否数字人SaaS系统后台,生成数字人即可。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/241600.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

照片如何抠图换背景?分享三个一键抠图的方法

照片如何抠图换背景?通过使用一键抠图工具,您可以将图片中的主体从原始背景中分离出来,并将其放置在新的背景中。这种技术可以用于各种情况,例如在照片编辑中增加创意效果、改变照片的氛围或者为产品展示添加专业外观。通过抠图并…

如何本地搭建WampServer并结合cpolar内网穿透实现远程访问

文章目录 前言1.WampServer下载安装2.WampServer启动3.安装cpolar内网穿透3.1 注册账号3.2 下载cpolar客户端3.3 登录cpolar web ui管理界面3.4 创建公网地址 4.固定公网地址访问 前言 Wamp 是一个 Windows系统下的 Apache PHP Mysql 集成安装环境,是一组常用来…

自助式可视化开发,ETLCloud的集成之路

自助式可视化开发 自助式可视化开发是指利用可视化工具和平台,使非技术人员能够自主创建、定制和部署数据分析和应用程序的过程。 传统上,数据分析和应用程序开发需要专业的编程和开发技能。但是,自助式可视化开发工具的出现,使…

喜讯 | 同立海源生物入选2023年国创中心细胞疗法“揭榜挂帅”技术攻关项目

近日,2023年国家生物药技术创新中心细胞疗法“揭榜挂帅”技术攻关拟立项目名单公示,北京同立海源生物科技有限公司(简称“同立海源生物”)参评的 “细胞分选激活磁珠研发项目” 凭借公司多年在细胞分选磁珠领域的技术沉淀和创新性…

对比SPI、UART、I2C通信的区别与应用

SPI、UART、I2C通信是常用的数字通信协议,它们在不同的场景下有不同的应用。下面,我将分别介绍它们的特点、区别与应用。 SPI通信 SPI通信是一种串行同步通信协议,它的全称为“Serial Peripheral Interface”。SPI通信是一种单主多从的通信方…

k8s如何部署seata(分布式事务)?(第一篇)

k8s如何部署seata(分布式事务)? 官方传送门https://seata.io/zh-cn/ 快速入门SEATA Seata 是一款开源的分布式事务解决方案,致力于提供高性能和简单易用的分布式事务服务。Seata 将为用户提供了 AT、TCC、SAGA 和 XA 事务模式,为用户打造一站…

智谱AI副总裁郑叔亮:交付情感价值是大模型的重要发展趋势

“ 提供情绪价值是大模型下一步要走的路,这条路会逐渐开阔 ” 整理 | 梦婕 编辑 | 云舒 出品|极新 2023年11月28日上午,在极新AIGC行业峰会现场,智谱AI总裁郑叔亮围绕国内外大模型发展现状与未来方向做了一场主题为《大…

Mistral AI 推出高质量的稀疏专家混合AI人工智能模型——SMoE,有望超越ChatGPT3.5

Mistral AI(“Mistral AI”是一家由前DeepMind和Meta Platforms(META.US)的研究人员组建的新公司。)继续履行为开发者社区提供最佳开放模型的使命。他们发布了 Mixtral 8x7B,这是一个高质量的稀疏专家混合模型&#xf…

【数据结构与算法】JavaScript实现图结构

文章目录 一、图论1.1.图的简介1.2.图的表示邻接矩阵邻接表 二、封装图结构2.1.添加字典类和队列类2.2.创建图类2.3.添加顶点与边2.4.转换为字符串输出2.5.图的遍历广度优先搜索深度优先搜索 2.6.完整实现 一、图论 1.1.图的简介 什么是图? 图结构是一种与树结构…

stateflow 之图函数、simulink函数和matlab函数使用及案例分析

目录 前言 1. 图函数graph function 2.simulink function 3.matlab function 4.调用stateflow中的几种函数方式 前言 对于stateflow实际上可以做simulink和matlab的所有任务,可以有matlab的m语言,也可以有simulink的模块,关于几种函数在…

Ansible中执行流控制

1.ansible中的迭代循环 创建目录和文件 vim createfile.yaml - name: create file playbook hosts: all tasks: - name: create file file: path: "/mnt/{{item[name]}}" state: …

小新Air-14 Plus 2021款AMD ACN版(82L7)原装出厂Win11系统镜像

LENOVO联想笔记本开箱状态原厂Windows11系统包 链接:https://pan.baidu.com/s/1D_sYCJAtOeUu9RbTIXgI3A?pwd96af 提取码:96af 联想小新AIR14笔记本电脑原厂系统自带所有驱动、出厂主题壁纸、Office办公软件、联想电脑管家等预装程序 所需要工具&am…

【C语言】RDMACM、Verbs API与epoll一起使用的示例

一、epoll介绍 epoll是Linux内核为处理大批量文件描述符而作了改进的poll,是Linux下多路复用IO接口select/poll的增强版本,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率。 以下是epoll的主要使用方法和优点: epo…

【python】多任务编程

python多任务编程 有哪些编程提速的方法 单线程串行:不加改造的程序 多线程并发:利用CPU和IO可以同时执行的原理,让CPU不会干巴巴等待IO完成 多CPU并行/多进程:利用多核CPU的能力,真正的并行执行任务 多机器并行&#…

快速学习Java Agent

1.1 java agent原理 我们知道,要使用Skywalking去监控服务,需要在其 VM 参数中添加 “- javaagent:/usr/local/skywalking/apache-skywalking-apm-bin/agent/skywalking-agent.jar"。这里就 使用到了java agent技术。 Java agent 是什么&#xff…

python tkiinter中滑块的使用

需求:需要在Canvas组件上添加滑块功能 解决:使用tkinter提供的Scrollbar组件,由于没发现直接在画布上显示滑块功能的方法,所以后面采用在显示画布的容器上显示滑块,并绑定到画布上。 具体案例demo: from t…

视频滤波驱动器电路D1671 D1675的性能描述和分析

D1671四阶标清视频滤波器驱动,1CH,工作电压2.8V~5.5V,转换速率40V/s D1675六阶高清视频滤波器驱动,1CH,工作电压2.5V~5.5V,转换速率400V/s

02鸿蒙APP真机运行及证书签名打包

目录 1、真机运行1.1、运行安装错误1.2、解决方案:第一步:安装兼容真机的sdk版本2.2.0(API6),如下图所示:第二步:新建一个API6的工程项目第三步:运行API6创建的工程项目第四步&#…

如何提高嵌入式软件工程师的技术深度?

今日话题,如何提高嵌入式软件工程师的技术深度?建立坚实的基础知识是深入研究的关键。只有深入理解基础知识,才能在理论指导下不断深化和扩展自己的技术。没有坚实的基础,深入研究就显得空中楼阁。如果你有兴趣进入嵌入式行业我可…

数据库——安全性

智能2112杨阳 一、目的与要求: 1、设计用户子模式 2、根据实际需要创建用户角色及用户,并授权 3、针对不同级别的用户定义不同的视图,以保证系统的安全性 二、内容: 先创建四类用户角色: 管理员角色Cusm、客户角…