In [28]:
import os
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np

# Load Data

In [31]:
dataset_path = '../dataset/'

audio_data = []
labels = []

for folder in os.listdir(dataset_path):
    folder_path = os.path.join(dataset_path, folder)
    if os.path.isdir(folder_path):  # Is a direcotry
        for file in os.listdir(folder_path):
            if file.endswith('.wav'):  # Is audio file .wav
                file_path = os.path.join(folder_path, file)
                
                # Load audio file
                y, sr = librosa.load(file_path, sr=None)  # sr=None to keep the original sample rate
                
                audio_data.append(y)
                labels.append(file.split('.')[0])

                print(f"Chargé {file} avec taux d'échantillonnage {sr}")

Chargé 03-01-01-01-01-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-01-01-01-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-01-01-02-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-01-01-02-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-01-01-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-01-01-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-01-02-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-01-02-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-02-01-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-02-01-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-02-02-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-02-02-02-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-03-01-01-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-03-01-01-02-01.wav avec taux d'échantillonnage 48000
Chargé 03-01-03-01-02-01-01.wav avec taux d'échantillonnage 48000
Chargé 03-

# Changing the way audio files are represented

In [41]:
# Create a folder to save audio representations
spectrograms_dir = 'audio_representations/spectrograms'
os.makedirs(spectrograms_dir, exist_ok=True)

# Create a folder to save MFCCs images
MFCC_dir = 'audio_representations/MFCCs'
os.makedirs(MFCC_dir, exist_ok=True)

## Spectrograms

In [42]:
def generate_spectrogram(y, sr, output_file):
    # Compute spectrogram with short-time Fourier transform (STFT)
    D = librosa.amplitude_to_db(np.abs(librosa.stft(y)), ref=np.max)

    # Generate and save
    plt.figure(figsize=(2.56, 2.56))
    plt.axis('off')
    librosa.display.specshow(D, sr=sr, x_axis='time', y_axis='log')
    plt.savefig(output_file, bbox_inches='tight', pad_inches=0)
    plt.close()

In [43]:
for (y, label) in zip(audio_data, labels):
    output_file = os.path.join(spectrograms_dir, f'{label}.png')
    generate_spectrogram(y, sr, output_file)
    print(f"Spectrogramme sauvegardé sous {output_file}")
    

Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-01-01-01-01-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-01-01-01-02-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-01-01-02-01-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-01-01-02-02-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-01-01-01-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-01-01-02-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-01-02-01-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-01-02-02-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-02-01-01-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-02-01-02-01.png
Spectrogramme sauvegardé sous audio_representations/spectrograms\03-01-02-02-02-01-01.png
Spectrogra

## MFCCs

In [44]:
def generate_mfcc(y, sr, output_file, n_mfcc=13):
    # Compute MFCCs
    mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=n_mfcc)

    # Generate and save
    plt.figure(figsize=(2.56, 2.56))
    plt.axis('off')
    librosa.display.specshow(mfccs, sr=sr, x_axis='time')
    plt.savefig(output_file, bbox_inches='tight', pad_inches=0)
    plt.close()

In [45]:
for (y, label) in zip(audio_data, labels):
    output_file = os.path.join(MFCC_dir, f'{label}.png')
    generate_mfcc(y, sr, output_file)
    print(f"MFCCs sauvegardé sous {output_file}")

MFCCs sauvegardé sous audio_representations/MFCCs\03-01-01-01-01-01-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-01-01-01-02-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-01-01-02-01-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-01-01-02-02-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-01-01-01-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-01-01-02-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-01-02-01-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-01-02-02-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-02-01-01-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-02-01-02-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-02-02-01-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-02-02-02-02-01.png
MFCCs sauvegardé sous audio_representations/MFCCs\03-01-03-01-01-01-01.png
MFCCs sauvegardé sous aud