前言
最近,24-05-27号,github上出现了一个新项目,ChatTTS。该项目提供了一个文本转语音(Text To Speech)的开源方案,同时支持中文和英文。在官网的演示视频中,可以看到合成效果高度接近真人。
到目前(06-04)为止,已经有18.3k的star。
那我们就来看看这个模型的基本部署和使用方法吧。
环境说明
Ubuntu22.04,python版本为默认的3.8.10
安装pip和换清华源
sudo apt install pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
安装mpv
用于音频播放
sudo apt install mpv
本地安装
💫下载modelscope和SDK模型
pip install modelscope
from modelscope import snapshot_