最近收集了一大波关于各类声音的数据集,包含乐器、车辆、鸟鸣、蜜蜂声音、歌曲、喇叭、人类声音不同等类型的声音数据集,废话不多说,给大家逐一介绍!!
1、吉他和弦大调、小调数据集
吉他和弦大调、小调数据集,此数据集包含500多个wav格式的音频文件。每个音频代表一个大调或小调的和弦。你可能知道,大和弦的声音更“快乐”,而小和弦的声音更“悲伤”。
数据查看地址:https://www.dilitanxianjia.com/2305/
2、紧急车辆警报器声音数据集
紧急车辆警报器声音数据集,该数据集由长度为3秒的波形音频文件组成。它们包含紧急车辆-救护车和消防车的警报声。第三个类别叫做Traffic,它包含3秒的.wav格式的纯交通声音音频文件。每个类别包含200个声音文件,每个音频文件的200个声谱图图像,以及用于将每个音频文件转换为声谱图的python脚本。
数据查看地址:https://www.dilitanxianjia.com/2302/
3、基于康奈尔鸟叫声识别数据集的Mel光谱图训练的ResNet-34模型
该数据集包含一个基于康奈尔鸟叫声识别数据集的Mel光谱图训练的ResNet-34模型。它可以用于从音频剪辑中识别鸟类的种类,具有很高的准确性(在未看的剪辑中约55%),涵盖了264个不同的物种声音。
数据查看地址:https://www.dilitanxianjia.com/2299/
4、蜂窝声音识别的注释数据集
蜂窝声音识别的注释数据集,每个音频文件都与相应的注释文件相关联,注释文件由相同的名称和扩展名.lab标识。共45个蜜蜂声音数据集,每个9分钟左右。
数据查看地址:https://www.dilitanxianjia.com/2296/
5、钢琴和吉他的大调或小调分类数据集
钢琴和吉他的大调或小调分类数据集,该数据集包含吉他和钢琴两种乐器的音频文件。这些数据是从各种来源搜集来的。音乐是关于模式的。每类有400左右个音频数据。
数据查看地址:https://www.dilitanxianjia.com/2293/
6、俄罗斯全音阶按钮手风琴音乐样本数据集
俄罗斯全音阶按钮手风琴音乐样本数据集,此数据集包含wav格式的音频文件。每个文件包含一个garmon khromka按钮播放的声音记录。
数据查看地址:https://www.dilitanxianjia.com/2290/
7、多种语言歌词分类数据集
多种语言歌词分类数据集,超过290.000个标签歌词数据样本。
数据查看地址:https://www.dilitanxianjia.com/2287/
8、多体裁NLI语料库
多体裁NLI语料库,这是the Multi-genre NLI(多流派NLI)语料库的1.0发行版。许可信息和语料库的详细描述包含在附带的PDF中。
数据查看地址:https://www.dilitanxianjia.com/2283/
9、8732个带有标签的城市声音数据集
8732个带有标签的城市声音数据集,10个类别空调、喇叭、儿童玩耍、狗吠、钻井、发动机空转、枪响、手提钻、汽笛和街头音乐。
数据查看地址:https://www.dilitanxianjia.com/2280/
10、电风扇噪音检测数据集
电风扇噪音检测数据集(有噪音和无噪音各300个音频文件)本数据集可以用于对风扇噪音异常检测相关的项目,使用本数据集实现对语音分类方面项目的熟悉与掌握。
数据查看地址:https://www.dilitanxianjia.com/2277/
11、1000个女性声音样本的HND, ENG和GU语言
1000个女性声音样本的HND, ENG和GU语言。语音样本的长度为3至8秒。该数据集用于语音性别识别系统。
数据查看地址:https://www.dilitanxianjia.com/2274/
12、30类乐器-图像分类数据集
30类乐器-图像分类数据集,4793个训练,150个测试,150个验证图像224 X 224 X3 jpg格式。
数据查看地址:https://www.dilitanxianjia.com/2271/
13、高兴、伤心、生气、放松四类音乐数据集
高兴、伤心、生气、放松四类音乐数据集。数据库中的每个类总共确定100首音乐作品,使每个类的样本数量相等。原始数据集中有400个样本,每个样本间隔30秒。
数据查看地址:https://www.dilitanxianjia.com/2268/