还记得今年OpenAI 刚推出 gpt4o 不久,开源界就出现了 ChatTTS 和 FishSpeech 这些不错的 TTS 项目。
而 Fish Speech V1.4 是一个领先的文本到语音(TTS)模型,它是在 700,000 小时的多语言音频数据基础上训练出来的。 该模型支持八种语言,包括英语、汉语、德语、日语、法语、西班牙语、韩语和阿拉伯语,是多语言文本到语音转换的强大工具。
github
https://github.com/fishaudio/fish-speech
huggingface
fishaudio/fish-speech-1.4
支持的语言:
- 英语 (en) ~300k 小时
- 汉语 (zh) ~300k 小时
- 德语 (de) ~20k 小时
- 日语 (ja) ~20k 小时
- 法语 (fr) ~20k 小时
- 西班牙语 (es) ~20k 小时
- 韩语 (ko) ~20k 小时
- 阿拉伯语 (ar) ~20k 小时