声音 深度学习数据集 紧急车辆警报器声音数据集,该数据集由长度为3秒的波形音频文件组成。它们包含紧急车辆-救护车和消防车的警报声。第三个类别叫做Traffic,它包含3秒的.wav格式的纯交通声音音频文件。每个类别包含200个声音文件,每个音频文件的200个声谱图图像,以及用于将每个音频文件转换为声谱图的python脚本。
声音 深度学习数据集 该数据集包含一个基于康奈尔鸟叫声识别数据集的Mel光谱图训练的ResNet-34模型。它可以用于从音频剪辑中识别鸟类的种类,具有很高的准确性(在未看的剪辑中约55%),涵盖了264个不同的物种声音