我用AI帮我唱了首“基尼太美”,颠覆了我的认知!太牛逼了

目录

前言

AI唱"基尼太美"是什么感觉

使用so-vits-svc打造自己专属歌手

1.声音素材整理

2.训练模型

3.让AI唱歌​编辑

AI歌手背后的技术

AI歌手会成为主流吗

写到最后


大家好,我是大侠,AI领域的专业博主

前言

在5月份,孙燕姿再次成为了乐坛的顶流,但这一次她火爆的并不是她本人,而是AI孙燕姿。2023乐坛最佳新人奖非她莫属~


AI唱"基尼太美"是什么感觉

大侠看着也手痒啊,于是训练了一个孙燕姿版的篮球战歌

接下来 开始ctrl

原音频
http://image.aidaxia.net/start.mp3

AI唱“鸡你太美”

http://image.aidaxia.net/end.wav

 通过音频可以清晰地听出,咯咯的声音已经完全变成了孙燕姿的声音。而令人惊叹的是,这个声音仅经过不到2000次的训练就已经达到了如此高的仿真度。


使用so-vits-svc打造自己专属歌手

大侠使用的是开源项目 <so-vits-svc> 来训练的AI歌手

项目地址 https://github.com/svc-develop-team/so-vits-svc

 

1.声音素材整理

注意So-VITS-SVC只能识别WAV格式的音频文件。

1.使用UVR来处理音频文件

使用UVR去除背景音、噪音、呼吸声等,只保留纯粹的人声,以保证最佳的语音识别效果。

2.把处理好的音频文件切片

为了避免显卡显存崩溃,建议在使用So-VITS-SVC训练声音素材时,每段音频不要超过30秒

可以使用<Audio Slicer>来将音频文件切分成合适长度的片段。

在So-VITS-SVC的/dataset_raw目录下创建一个文件夹,并将刚才处理好的音频数据放到里面。

2.训练模型

打开So-VITS-SVC根目录下的【启动webui.bat】文件,启动Web UI界面,并切换到训练Tab选项卡。然后点击“选择数据集”按钮,选择你的数据集文件夹,上方会显示数据集文件夹的名称,这也将成为你训练模型的名称。

然后点击“写入配置文件”准备工作就OK了。

接下来点击下面"从头开始训练"就可以丢到一边训练模型了,是不是很简单

3.让AI唱歌

切换到“推理”选项卡,然后刷新页面选择你训练的模型(以G_开头),然后选择配置文件并加载模型。

在页面下方上传你需要转换的音频文件,然后等待转换完成即可。

如果转换后的声音质量不佳,比如听起来不够清晰,带有电流声等问题,你可以返回到训练界面,点击“继续训练”,直到满意为止。


AI歌手背后的技术

So-VITS-SVC是基于深度神经网络的语音转换模型,它主要使用了以下技术:

  1. 声码器:使用WaveNet作为声码器,WaveNet是一种基于卷积神经网络的生成式模型,能够生成高质量的音频信号。

  2. 风格迁移:使用CycleGAN作为风格转换器,CycleGAN是一种基于生成式对抗网络(GAN)的模型,能够将音频的风格转换为目标风格,例如将男性的声音转换为女性的声音。

  3. 语音识别:使用语音识别模型,例如DeepSpeech,来提取语音特征,以便进行音频转换。

  4. 深度学习:使用深度学习技术,如循环神经网络(RNN)和卷积神经网络(CNN),来训练模型进行语音转换。


AI歌手会成为主流吗

随着AI歌手的爆火,我们不时会想到AI歌手真的会取代歌手,全面进入AI娱乐时代吗,

我们先来看看AI歌手的优缺点

它的优点很明显:

  1. 声音非常纯净,几乎听不到换气的声音。

  2. 拥有无限的歌曲库(AI歌手不需要休息时间,只要有电就能创作)。

  3. 效率非常高(转换一首歌只需要2分钟,可以在短时间内创作大量的歌曲)。

当然,它的缺点也很明显:

  1. 情感方面不如人类歌手,AI歌手的声音听起来缺乏感染力。

  2. 创作性方面也还不够,AI发展还处于初级阶段。

  3. 道德和安全问题是最致命的问题,AI歌手不仅可以用来唱歌,还可以被不法分子用来模仿人的声音进行诈骗等危险行为,这已经发生了多起事件,涉及金额高达数百万。此外,还涉及到著作权、知识产权等问题。

“AI娱乐”在大侠看来以后肯定会成为主流,但从技术层面和管控方面来看,仍需要进一步提升和加强。我们期待AI娱乐的发展能够更好地保障道德和安全问题,同时也期待这个时代早日到来。


写到最后

AI歌手已经为我们打开了一扇通往音乐世界的新窗口。

未来,还有更多的AI文化创意产业值得我们去探索和期待,例如AI艺术、AI影视等领域。

这些新兴领域不仅将为我们带来全新的艺术体验,也将为创作者和文化产业带来更多的机遇和挑战。

AI是一个充满机遇和挑战的领域,

AI时代已经到来,AI真的会取代我们吗?

你还不主动了解AI?

你还在为跟同事聊AI插不上话吗?

那请关注大侠,带你了解AI行业第一动态。

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/23979.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue2_模版语法

目录 模版语法 react用jsx语法编译后的null作用 插值表达式{{}} v-bind和{{}} 关于国内谷歌自带翻译停用如何解决&#xff08;额外&#xff09; 会一点的插值表达式&#xff0c;也有限制 模版语法 更接近原生js的写法jsx语法 jsx是react提出的&#xff1b;后很多前端框架…

说说你对slot的理解?slot使用场景有哪些?

vue的slot的理解&#xff1f;slot使用场景有哪些&#xff1f; 定义 在Vue.js中&#xff0c;slot&#xff08;插槽&#xff09;是一种用于组件之间内容分发的机制。它允许你在父组件中编写子组件的内容&#xff0c;从而增加了组件的灵活性和可重用性。 Slot 艺名插槽&#xf…

汇编寄存器之内存访问

1.内存中字的存储: 在CPU中用一个16位寄存器来存储一个字, 高8位存高字节,低8位存低字节 如AX寄存器存在一个字,那么AH存高字节,AL存低字节 在内存中存储字时是用两个连续的字节来存储字的, 这个字的低字节存在低单元,高字节存在高单元. 如下表示: 内存单元编号 单元中…

【微博-计算Cell子控件的frame Objective-C语言】

一、计算Cell子控件的frame 1.来,看一下,刚才我们已经做到把这个模型设置给自定义的cell了吧, 那么,在这个自定义Cell里面呢,我们是不是要开始设置数据了, 设置数据,我们,设置数据,其实很简单,就是把我们这里边的每一个控件,对应的值,从模型里面取出来,给了它,…

【独立版】智慧城市同城V4_2.2.7全开源全插件VUE版,修复房产信息组件商户发布二手房房源信息未和商户关联的问题

源码介绍 【独立版】智慧城市同城V4 查看更多关于 智慧城市同城V4 的文章 _2.2.7全开源全插件VUE版&#xff0c;修复房产信息组件商户发布二手房房源信息未和商户关联的问题&#xff01; 智慧城市同城是一套专注于多城市生活服务同城技术解决方案,全面覆盖同堿信息、商家联盟、…

【Linux】搭建SFTP文件服务器

一、协议介绍1.1 FTP 协议1.11 特点1.12 基本工作原理 1.2 SFTP协议1.21 特点1.22 基本工作原理 1.3 ssh协议1.31 特点1.32 基本工作原理 1.4 其他常见文件传输协议 二、搭建Linux的SFTP文件服务器三、连接测试3.1 电脑连接3.2 手机连接 一、协议介绍 1.1 FTP 协议 1.11 特点…

AI落地:高效学习指南

高效学习中有一个共识&#xff1a;学习最小可用知识&#xff0c;然后立马开始实践&#xff0c;做中学&#xff0c;不断获得反馈&#xff0c;不断在实践中改进。 现实生活中&#xff0c;如果我们想实现这种高效学习&#xff0c;基本上只能找一个老师1对1指导&#xff0c;费用贵…

【开发者指南】如何在MyEclipse中使用 XML编辑器

XML编辑器包括高级XML编辑功能。通过本文&#xff0c;你将了解其编辑功能和网页XML编辑&#xff0c;一起来看看吧~ 1. Web XML编辑器 MyEclipse Web XML编辑器包括高级XML编辑功能&#xff0c;如: 语法高亮显示标签和属性内容辅助实时验证(在您输入时)文档内容的源视图、设计…

160743-62-4,DMG PEG2000,1,2-二肉豆蔻酰-rac-甘油-3-甲氧基聚乙二醇2000

DMG PEG2000&#xff0c;DMG-mPEG2000&#xff0c;1,2-二肉豆蔻酰-rac-甘油-3-甲氧基聚乙二醇2000 Product structure&#xff1a; Product specifications&#xff1a; 1.CAS No&#xff1a;160743-62-4 2.Molecular formula&#xff1a; C34H66O 3.Molecular weight&#xff…

Java内部类(成员内部类、静态嵌套类、方法内部类、匿名内部类)

文章目录 一、内部类的共性二、为什么需要内部类三、静态内部类&#xff08;静态嵌套类&#xff09;四、成员内部类五、局部内部类&#xff08;方法内部类&#xff09;六、匿名内部类 Java 类中不仅可以定义变量和方法&#xff0c;还可以定义类&#xff0c;这样定义在类内部的类…

挂耳式耳机品牌排行榜,看看谁被推荐上榜

下班路上就想放空自己刷会儿视频&#xff0c;但是马路、地铁还有公交上都会有嘈杂的声音影响&#xff0c;如果佩戴入耳式耳机放大声音不仅会过度屏蔽外界&#xff0c;同时还会损伤我们的耳朵&#xff0c;所以新近流行的开放式耳机很好的解决了这些问题&#xff0c;但也有很多小…

【Linux】深入了解冯诺依曼体系结构与操作系统

目录 导读 &#x1f31e;专栏导读 &#x1f31e;冯诺依曼 &#x1f31e;冯诺依曼体系结构 &#x1f31b;木桶效应 &#x1f31e;操作系统(Operator System) &#x1f31b;概念 &#x1f31b;设计OS的目的 &#x1f31b;系统调用和库函数概念 导读 六一儿童节快到了&…

杜绝开源依赖风险,许可证扫描让高效合规「两不误」

目录 开源许可证及其常见类型 开源许可证扫描是软件研发过程中&#xff0c;不可或缺的工具 极狐GitLab 开源许可证扫描的优势与应用 Step 1&#xff1a;启用及设置许可证策略 Step 2&#xff1a;自动创建策略文件存放项目 Step 3&#xff1a;查看许可证合规情况 Step 4&…

实训可视化项目小结 --- 开启Python初始之旅

Python初试感悟 语言之间是相通的&#xff0c;大多数时候&#xff0c;百分之八十的问题&#xff0c;都可以用常用的容器以及内置函数来辅助解决。之前从未认真接触过Python&#xff0c;但此次学校实训要求使用Python做一个可视化&#xff0c;东西不难&#xff0c;我个人负责爬…

Hadoop学习---8、Hadoop数据压缩

1、Hadoop数据压缩 1.1 概述 1、压缩的好处和坏处 &#xff08;1&#xff09;优点&#xff1a;减少磁盘IO、减少磁盘储存空间 &#xff08;2&#xff09;缺点&#xff1a;增加CPU开销 2、压缩原则 &#xff08;1&#xff09;运算密集型的Job&#xff0c;少用压缩 &#xff08…

【2023 · CANN训练营第一季】应用开发(初级)第四章——模型推理

AscendCL运行资源管理 申请运行管理资源时&#xff0c;需按顺序依次申请: Device、Context、Stream&#xff0c;然后根据实际需求调用aclrtGetRunMode接口获取软件栈的运行模型(当同一个应用既支持在Host运行&#xff0c;也支持在Device运行时&#xff0c;在编程时需要就需要根…

Shap-E:3D资产的生成式AI大模型

OpenAI 刚刚发布了 Shap-E&#xff0c;这是一种基于文本提示和图像创建 3D 资产的生成模型&#xff0c;能够生成带纹理的网格和神经辐射场 &#xff0c;从而实现各种 3D 输出。 推荐&#xff1a;用 NSDT设计器 快速搭建可编程3D场景。 在本教程中&#xff0c;我们将引导你在 Go…

嵌入式软件测试笔记2 |TEmb方法概述

2 |TEmb方法概述 1 TEmb简介2 TEmb工作原理3 系统特性4 TEmb通用元素4.1 生命周期4.2 技术4.3 基础设施4.3.1 测试环境4.3.2 工具和测试自动化4.3.3 办公环境 4.4 组织 5 组合专用测试方法的机制5.1 常用系统特性5.2 特定方法5.3 LITO矩阵 1 TEmb简介 TEmb是一种方法&#xff…

Rocksdb相关学习

1 Basic Operations 先介绍一些 RocksDB 的基本操作和基本架构。 1.1 LSM 与 WriteBatch 参考文档5提到RocksDB 是一个快速存储系统&#xff0c;它会充分挖掘 Flash or RAM 硬件的读写特性&#xff0c;支持单个 KV 的读写以及批量读写。RocksDB 自身采用的一些数据结构如 LSM/…

picoctf_2018_rop chain

小白垃圾笔记&#xff0c;不建议阅读。 这道题目其实我是瞎做的. 本地调试需要写一个文件名为flag.txt的文件。 先检查下保护&#xff1a;&#xff08;我把文件名改成pwn了&#xff09;&#xff0c;32位仅仅开启了nx 然后放到32位ida里&#xff1a; main函数如下&#xff1a…