一.人声分离项目说明
人声分离是将音频录音分离为各个源的任务。该存储库是音乐源分离的 PyTorch 实现。用户可以通过安装此存储库将自己喜欢的歌曲分成不同的来源。用户还可以训练自己的源分离系统。该存储库还可用于训练语音增强、乐器分离和任何分离系统。
2.1 环境配置
Python的版本必须用3.7,(尝试过更高的版本都会报错)
Python升级方法如下,把3.7.17版本的下载地址:
https://www.python.org/ftp/python/3.7.17/Python-3.8.3.tgz
CentOS 7.X 升级 Python 3.8.X_./configure --prefix=/usr/local/python3 --with-ssl-CSDN博客CentOS 7.X 升级 Python 3.8.X_./configure --prefix=/usr/local/python3 --with-ssl-CSDN博客
2.2 安装配置
安装ffmpeg,参考:
Linux(Centos7)安装Ffmpeg-腾讯云开发者社区-腾讯云
pip install bytesep==0.1.1
下载依赖的人声伴奏配置
从github上下载,然后存放到指定文件夹下:/root/bytesep_data/train_scripts/musdb18
下载文件为:vocals-accompaniment,resunet_subbandtime.yaml
https://github.com/bytedance/music_source_separation/blob/master/scripts/4_train/musdb18/configs/vocals-accompaniment%2Cresunet_subbandtime.yaml
从zenodo上下载文件resunet143_subbtandtime_accompaniment_16.4dB_500k_steps_v2.pth
存放到目录:/root/bytesep_data 下
python -m bytesep separate \ --source_type="vocals" \ --audio_path="./resources/vocals_accompaniment_10s.mp3" \ --output_path="separated_results/output.mp3"
用户还可以将多个音频文件放入一个目录中并将它们全部分开。
python -m bytesep separate \ --source_type="vocals" \ --audio_path="audios_directory" \ --output_path="outputs_directory"
执行以上,可分离出人声,若效果不理想需要进行微调操作。
三.引荐来自字节开源项目
项目:https://github.com/bytedance/music_source_separation