In [11]:
import librosa
import pandas as pd
import numpy as np
import os
import glob


def amplitude(y):
    target_db = -40  # 目标分贝值
    db = librosa.amplitude_to_db(y)
    gain = librosa.db_to_amplitude(target_db - db.mean())  # 计算增益系数
    y_agc = y * gain
    return y_agc


def extract_mfcc(wav_path, sr=44100):
    """
    从给定路径的音频文件中提取MFCC特征

    Args:
        wav_path (str): 音频文件的路径
        sr (int): 音频采样率，默认为44100

    Returns:
        numpy.ndarray: 提取的MFCC特征矩阵，维度为(n_mfcc, t)
    """
    # 设置参数
    # n_mfcc = 20  # MFCC系数的数量
    # hop_length = 512  # 每帧的时间长度
    # n_fft = 2048  # FFT窗口大小
    # y, sr = librosa.load(wav_path, sr=None)
    y, sr = librosa.load(wav_path, sr=sr)
    # 都增益为相同大小的分贝
    y = amplitude(y)
    mfcc = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=20)
    return mfcc.T


def mfcc_to_csv(file_path, output_path):
    mfcc_T = extract_mfcc(file_path)
    pd.DataFrame(mfcc_T).to_csv(output_path)

In [12]:
if __name__ == '__main__':

    # 遍历所有子文件夹
    for subdir in glob.glob('./input/audio/*'):
        # 如果当前路径是一个文件夹
        if os.path.isdir(subdir):
            print(f"处理文件夹: {subdir}")
            # 遍历文件夹中的所有音频文件
            for filepath in glob.glob(subdir + '/*.wav'):
                print(f"处理音频: {filepath}")
                subdir_name = os.path.basename(subdir)
                output_subdir = os.path.join('./output', subdir_name)
                output_path = os.path.join(output_subdir, os.path.basename(os.path.splitext(filepath)[0]) + '.csv')
                mfcc_to_csv(file_path=filepath, output_path=output_path)

处理文件夹: ./input/audio\200
处理音频: ./input/audio\200\001-143-L-11.wav
处理音频: ./input/audio\200\002-127-L-11.wav
处理音频: ./input/audio\200\003-154-L-11.wav
处理音频: ./input/audio\200\004-131-L-3.wav
处理音频: ./input/audio\200\005-2023-04-09_05h17m42s.wav
处理音频: ./input/audio\200\006-163-L-2.wav
处理音频: ./input/audio\200\007-158-L-1.wav
处理音频: ./input/audio\200\008-94-L-1.wav
处理音频: ./input/audio\200\009-20-L-2.wav
处理音频: ./input/audio\200\010-M606-0829 交通声鸟叫声_26.wav
处理音频: ./input/audio\200\011-M606-0829 交通声鸟叫声_14.wav
处理音频: ./input/audio\200\012-88-L-2.wav
处理音频: ./input/audio\200\013-2023-04-08_17h33m32s.wav
处理音频: ./input/audio\200\014-131-L-7.wav
处理音频: ./input/audio\200\015-48-L-1.wav
处理音频: ./input/audio\200\016-鸟鸣小雨_03.wav
处理音频: ./input/audio\200\017-145-L-7.wav
处理音频: ./input/audio\200\018-50-L-1.wav
处理音频: ./input/audio\200\019-鸟鸣小雨_25.wav
处理音频: ./input/audio\200\020-148-L-11.wav
处理音频: ./input/audio\200\021-鸟鸣机械声_6.wav
处理音频: ./input/audio\200\022-23-L-2.wav
处理音频: ./input/audio\200\023-140-L-7.wav
处理音频: .