GitHub的一位博主整理了上百篇语音活动检测(VAD)的论文,按照其中使用的特征方法以及适用的环境进行了分类整理,时间跨度为从198*年至2019年。此外,还提供了几个VAD代码,它们的性能表现较好。需要的同学可以自行获取使用。
有相关领域的同学可以添加collaborators一起整理,欢迎添加大家新的参考文献~
https://github.com/linan2/Voice-activity-detection-VAD-paper.git
Code
-
My modified MATLAB code:
https://github.com/linan2/VAD_MATLAB.git
-
A effective VAD code when I am writing paper (rVAD):
https://github.com/zhenghuatan/rVAD.git
-
Sohn VAD:
https://github.com/eesungkim/Voice_Activity_Detector
-
Alibaba modelscope (my friend told me it is effective):
https://www.modelscope.cn/models/damo/speech_fsmn_vad_zh-cn-16k-common-pytorch/summary
-
Speech brain:
https://github.com/speechbrain/speechbrain/tree/develop/recipes/LibriParty/VAD
-
I like its MRCG feature to do experiments (this code is too old). :
https://github.com/jtkim-kaist/VAD.git