仅需5元，手把手教你训练纳西妲GPT-SoVITS模型

仅需5元，手把手教你训练纳西妲GPT-SoVITS模型

article2025/2/22 12:27:05/文章来源:https://blog.csdn.net/skyhhjmk/article/details/136141378

资源下载及音频试听：

仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛 (biliwind.com)

购买服务器

首先，我们需要买一台显卡云服务器

极度推荐使用雨云，优惠码：wp-admin

账户注册成功后，前往：购买地址

选择宿迁显卡云

图片[1]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

若只是短期使用，建议选择最高配置，如果是长期使用，建议按需选择（主要关注显存）

图片[2]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

系统选择Windows Server 2022 数据中心版

此系统已默认安装NVIDIA显卡驱动，CUDA已启用，版本如下：

NVIDIA-SMI 537.70, Driver Version: 537.70, CUDA Version: 12.2

之后点击右下角的试用即可5元获得一天的使用时长

图片[3]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

如果GPU资源不足，则可使用更低显存的版本

图片[4]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

部署GPT-SoVITS

连接服务器

服务器创建完成后，点击管理进入管理面板

图片[5]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

找到首页的NAT端口映射，复制默认生成的地址

图片[6]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

之后在你自己的电脑上搜索rdp，找到远程桌面连接并打开

图片[7]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

将复制的内容填入“计算机”输入框中，点击“显示选项”

图片[8]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

将此处的用户名填入

图片[9]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

点击连接后会弹出输入密码

图片[10]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

复制并填入“远程密码”

遇到下图提示直接点击是即可

图片[12]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

下载

进入桌面后，打开浏览器

图片[13]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

之后打开我转存在123Pan的一键包

如果你希望获得最新版的，可以用魔法去抱脸上下载：预打包文件 (huggingface.co)

之后还需要下载纳西妲的语音数据集，这里有大佬打好标的：AI-hobbyist

之后在服务器上下一个解压软件（请勿使用360、好压等流氓软件），可选的有：

Bandizip：Windows 版本的 Bandizip · 业内领先的压缩文件解决方案 (bandisoft.com)
7-Zip：Download (7-zip.org)

下载时进度卡在100% 0KB/s：

图片[14]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

打开edge的设置-隐私、搜索和服务

关闭Microsoft Defender Smartscreen即可（它会在下载后扫描文件导致卡在100% 0KB/s）

解压

解压GPT-SoVITS一键包

图片[15]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

如果你还有其他事要做（如准备数据集）则可以勾选低优先级模式

等待GPT-SoVITS解压完成即可

训练纳西妲声音模型

生成nahida.list

在GPT-SoVITS目录中新建一个raw_audio文件夹用于放置数据集

将先前下载的数据集解压进里面，并且建议将其放置在单独的文件夹中（即新建一个叫nahida的文件夹，再将*.wav和*.lab解压进去）

最终的目录结构看起来是这样的：

GPT-SoVITS\raw_audio\nahida\*.wav

GPT-SoVITS\raw_audio\nahida\*.lab

说明
.wav后缀为角色语音
.lab后缀为打标好的文件

之后打开GPT-SoVITS目录下的go-webui.bat打开web界面

进入webui后直接修改下图所指的位置

将其替换为你数据集（*.wav）所在的文件夹，如果你按照本教程操作，那么改为：

C:\Users\Administrator\Desktop\GPT-SoVITS-beta0128\raw_audio\nahida

点击批量ASR后等待即可，当ASR进程输出信息中显示完成时进行下一步

若你还是不确定是否完成，可以前往output\asr_opt目录，打开nahida.list文件

图片[18]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

上图即为完成后的效果

准备训练

之后打开上方的第二个tab，修改红框中的内容

图片[19]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

图片[20]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

如果你按照本教程操作，下图三个框中的内容应该为

nahida
C:\Users\Administrator\Desktop\GPT-SoVITS-beta0128\output\asr_opt\nahida.list
C:\Users\Administrator\Desktop\GPT-SoVITS-beta0128\raw_audio\nahida

图片[21]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

之后按顺序进行以下8步操作

图片[22]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

例：点击1的按钮后等待，直到2中提示任务完成，之后继续点击3观察4，如此往复

SoVITS与GPT训练

之后打开这个tab的第二个tab

图片[23]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

batch_size根据显存大小和模型数据量调整若使用8G显存的套餐，则所有保持默认即可

你需要分别进行SoVITS训练和GPT训练，都训练完成后才能进行推理

TTS音频推理

图片[24]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

TTS推理WebUI进程输出信息中提示进程已开启后需要稍等1分钟左右加载模型

模型加载完成后会自动打开TTS推理webui，以下是主要功能区的介绍

图片[25]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

放置参考音频的地方（会影响最终推理出音频的语气与情绪）
参考音频中说了什么内容
你要把什么文本转换成语音
把3中的内容转换为语音
点击4后输出的音频

图片[26]-仅需5元，手把手教你训练纳西妲GPT-SoVITS模型 - 风屿岛-风屿岛

参考音频可以在数据集中随便找一些略长的音频

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/391978.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

机试复习-4

机试复习-4

1.string类 string类型和数值的转换 ※数值→字符串 to_string函数 //具体做法 int i1234; string gto_string(i);//这样就转成字符串1234了 //下面就是字符串转为数字，类似下面还有stof,stoi,stod string d "1289347647"; int j stoi(d); cout <…

阅读更多...

2024.2.17 作业

2024.2.17 作业

1.终端输入一个字符，判断是大写字母小写字母还是数字字符代码： #! /bin/bash read var case $var in [0-9]) echo 数字 ;; [[:lower:]]) echo 小写字母 ;; [[:upper:]]) echo 大写字母 …

阅读更多...

在 Geoserver 中添加自定义的室内坐标系

在 Geoserver 中添加自定义的室内坐标系

要在 Geoserver 中添加自定义的室内坐标系，您需要在数据目录中的 user_projections 文件夹下创建或编辑一个 epsg.properties 文件，然后在文件末尾添加您的坐标系的定义，使用 WKT（Well-Known Text）格式。您还需要为您的…

阅读更多...

一些配置问题记录

一些配置问题记录

真的很感慨为什么一开始的下载的软件还能用卸载或重装后的软件总是存在各种各样的错误真令人心烦 GNURADIO运行简单的采集信号程序报错， 其实不太理解为什么会出现这类错误，解决方法为安装 jackd2 软件包，然后尝试手动启动 Jack 服务器…

阅读更多...

第四节笔记：XTuner 大模型单卡低成本微调实战

第四节笔记：XTuner 大模型单卡低成本微调实战

视频链接：https://www.bilibili.com/video/BV1yK4y1B75J/?spm_id_from333.788&vd_source3bbd0d74033e31cbca9ee35e111ed3d1 课程笔记： 1.Finetune简介指令微调： 开始的大模型可能不知道问的是问题这三种角色的划分只有在微调训练阶…

阅读更多...

自动化测试-RIDE编写自动化脚本

自动化测试-RIDE编写自动化脚本

自动化脚本是软件测试的必修内容，是自动化测试的核心，脚本的逻辑严谨性、可维护性非常重要，优秀的自动化脚本需要能兼顾用例的正确有效性和自动化测试的效率，本篇文章将介绍如何用RIDE写自动化脚本。我们将深入探讨RIDE的具体用法…

阅读更多...

对待不合理需求，前端工程师如何优雅的say no!

对待不合理需求，前端工程师如何优雅的say no!

曾经有位老板， 每次给前端提需求，前端都说实现不了，后来他搜索了一下，发现网上都有答案。他就在招聘要求上加了条：麻烦你在说不行的时候，搜索一下。上面是一个段子，说的有点极端了，…

阅读更多...

【AIGC】Stable Diffusion的插件入门

【AIGC】Stable Diffusion的插件入门

一、上文中作者使用插件包的方式下安装插件，用户也可以从Stable Diffusion的界面安装插件，如下图所示，在相应的插件后面点安装按钮。二、介绍一些比较好用的插件 “adetailer” 插件是 Stable Diffusion 中的一个增强功能，旨在提…

阅读更多...

Practical User Research for Enterprise UX

Practical User Research for Enterprise UX

2.1 Why It’s Hard to Get Support for Research in Enterprises 2.1.1 Time and Budget Instead of answering the question “What dowe gain if we do this research?”, ask instead “What do we stand to lose if we don’t do the research?” 2.1.2 Legacy Thinkin…

阅读更多...

Flink理论—Flink架构设计

Flink理论—Flink架构设计

Flink架构设计 Flink 是一个分布式系统，需要有效分配和管理计算资源才能执行流应用程序。它集成了所有常见的集群资源管理器，例如Hadoop YARN，但也可以设置作为独立集群甚至库运行,例如Spark 的 Standalone Mode 本节概述了 Flink 架构&…

阅读更多...

QT 信号和槽机制

QT 信号和槽机制

信号：各种事件槽： 响应信号的动作当某个事件发生后，如某个按钮被点击了一下，它就会发出一个被点击的信号（signal）。某个对象接收到这个信号之后，就会做一些相关的处理动作（称为槽…

阅读更多...

LeetCode刷题计划---day3

LeetCode刷题计划---day3

卡码网练习ACM模式 https://kamacoder.com/ 11 可用静态链表存储树，最后求某个结点到共同树根的长度。 #include <iostream> #include <vector> using namespace std;int main() {int n;int a,b;vector<int> nums vector<int>(30,0);wh…

阅读更多...

Java IO详解

Java IO详解

一、流的概念与作用流(Stream)： 在Java IO中，流是一个核心的概念。流从概念上来说是一个连续的数据传输过程。人们根据数据传输特性将流抽象为各种类，方便更直观的进行数据操作。你既可以从流中读取数据，也可以往流中写数据。流的…

阅读更多...

STM32——OLED菜单

STM32——OLED菜单

文章目录一.补充二. 二级菜单代码简介：首先在我的51 I2C里面有OLED详细讲解，本期代码从51OLED基础上移植过来的，可以先看完那篇文章，在看这个，然后按键我是用的定时器扫描不会堵塞程序,可以翻开我的文章有单独的定时…

阅读更多...

代码随想录day23--回溯的应用2

代码随想录day23--回溯的应用2

LeetCode39.组合总和题目描述： 给你一个无重复元素的整数数组 candidates 和一个目标整数 target ，找出 candidates 中可以使数字和为目标数 target 的所有不同组合 ，并以列表形式返回。你可以按任意顺序返回这些组合。 candidates…

阅读更多...

RCS系统之：基础算法

RCS系统之：基础算法

设计仓库机器人的控制管理系统涉及到路径规划、任务分配、库存管理、通信系统等方面。以下是一个基本的仓库机器人控制管理系统方案的概述： 路径规划：设计一个路径规划系统，用于确定机器人在仓库内的最佳行驶路径，以最大程度地提…

阅读更多...

optee TA文件签名

optee TA文件签名

TA的签名在optee_os目录下，存放着签名的私钥和签名脚本。工程目录 optee_os/keys/default_ta.pem 工程目录 optee_os/scripts/sign_encrypt.py 编译TA时会先将TA编译为elf文件。此时执行签名脚本，对elf文件签名并生成.ta文件。签名使用了RSA2048的私…

阅读更多...

及其详细的Markdown基础-学习笔记（附有使用案例）

及其详细的Markdown基础-学习笔记（附有使用案例）

Markdown 基础语法查看更多学习笔记：GitHub：LoveEmiliaForever 标题创建标题语法格式在文字前添加一至六个#即可创建标题标题是有等级的，具体等级根据#个数决定由于标题等级参与构建整篇文章的架构，编写时应该遵循如下规…

阅读更多...

【C++航海王：追寻罗杰的编程之路】string类

【C++航海王：追寻罗杰的编程之路】string类

目录 1 -> 为什么学习string类？ 1.1 -> C语言中的字符串 2 -> 标准库中的string类 2.1 -> string类 2.2 -> string类的常用接口 3 -> string类的模拟实现 3.1 -> 经典的string类问题 3.2 -> 浅拷贝 3.3 -> 深拷贝 3.3.1 ->…

阅读更多...

51_蓝桥杯_led流水灯

51_蓝桥杯_led流水灯

一原理图分析二三八译码器工作原理三八译码器：3个输入控制8路互斥的低电平有效输出。 C B A 输出 0 0 0 Y0 0 0 1 Y1 0 1 0 Y2 0 1 1 Y3 1 0 0 Y4 1 0 1 Y5 1 1 0 Y6 1 1 1 Y7 三锁存器工作原理锁存器：当使…

阅读更多...

最新文章