In [7]:
#!/usr/bin/env python3

import os

# Dossier contenant les fichiers
dataset_dir = "ALL"

# Dictionnaire pour mapper les lettres d'émotion à des labels
emotion_labels = {
    "sa": "sadness",
    "su": "surprise"
}

# Fonction pour extraire et filtrer les fichiers par émotions "sadness" et "surprise"
def filter_emotion_files(dataset_dir):
    filtered_files = []
    for file_name in os.listdir(dataset_dir):
        if file_name.endswith(".wav"):  # Traite uniquement les fichiers .wav
            try:
                # Extraire la partie après l'underscore pour identifier l'émotion
                emotion_code = file_name.split("_")[1][:2]  # Prend les 2 premières lettres après "_"
                if emotion_code in emotion_labels:
                    filtered_files.append(file_name)
                else:
                    # Supprime les fichiers qui ne correspondent pas
                    os.remove(os.path.join(dataset_dir, file_name))
            except (IndexError, ValueError):
                print(f"Nom de fichier invalide : {file_name}")
                # Supprime les fichiers mal formatés
                os.remove(os.path.join(dataset_dir, file_name))
    return filtered_files

# Filtrage et nettoyage du dossier
filtered_files = filter_emotion_files(dataset_dir)

# Affichage des résultats
print("Fichiers restants :", filtered_files)


Fichiers restants : ['DC_sa01.wav', 'DC_sa02.wav', 'DC_sa03.wav', 'DC_sa04.wav', 'DC_sa05.wav', 'DC_sa06.wav', 'DC_sa07.wav', 'DC_sa08.wav', 'DC_sa09.wav', 'DC_sa10.wav', 'DC_sa11.wav', 'DC_sa12.wav', 'DC_sa13.wav', 'DC_sa14.wav', 'DC_sa15.wav', 'DC_su01.wav', 'DC_su02.wav', 'DC_su03.wav', 'DC_su04.wav', 'DC_su05.wav', 'DC_su06.wav', 'DC_su07.wav', 'DC_su08.wav', 'DC_su09.wav', 'DC_su10.wav', 'DC_su11.wav', 'DC_su12.wav', 'DC_su13.wav', 'DC_su14.wav', 'DC_su15.wav', 'JE_sa01.wav', 'JE_sa02.wav', 'JE_sa03.wav', 'JE_sa04.wav', 'JE_sa05.wav', 'JE_sa06.wav', 'JE_sa07.wav', 'JE_sa08.wav', 'JE_sa09.wav', 'JE_sa10.wav', 'JE_sa11.wav', 'JE_sa12.wav', 'JE_sa13.wav', 'JE_sa14.wav', 'JE_sa15.wav', 'JE_su01.wav', 'JE_su02.wav', 'JE_su03.wav', 'JE_su04.wav', 'JE_su05.wav', 'JE_su06.wav', 'JE_su07.wav', 'JE_su08.wav', 'JE_su09.wav', 'JE_su10.wav', 'JE_su11.wav', 'JE_su12.wav', 'JE_su13.wav', 'JE_su14.wav', 'JE_su15.wav', 'JK_sa01.wav', 'JK_sa02.wav', 'JK_sa03.wav', 'JK_sa04.wav', 'JK_sa05.wav', 'JK_

In [11]:
import os
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np

# Dossier contenant les fichiers audio
dataset_path = 'ALL'  # Répertoire source
output_dir = 'audio_representations/audio_representations_savee/'  # Répertoire de sortie

# Créer les sous-dossiers pour les spectrogrammes et les MFCCs
spectrograms_dir = os.path.join(output_dir, 'spectrograms')
mfccs_dir = os.path.join(output_dir, 'MFCCs')
os.makedirs(spectrograms_dir, exist_ok=True)
os.makedirs(mfccs_dir, exist_ok=True)

# Mapper les émotions SAVEE vers les codes numériques
emotion_mapping = {
    "sa": "04",  # Sad
    "su": "08",  # Surprised
}

# Fonction pour extraire et filtrer les fichiers par émotions "sadness" et "surprise"
def filter_emotion_files(dataset_dir):
    filtered_files = []
    for file_name in os.listdir(dataset_dir):
        if file_name.endswith(".wav"):  # Traite uniquement les fichiers .wav
            try:
                # Extraire l'émotion du nom du fichier (par exemple, DC_sa01.wav -> "sa")
                emotion_code = file_name.split("_")[1][:2]  # Prend les 2 premières lettres après "_"
                if emotion_code in emotion_mapping:
                    filtered_files.append(file_name)
                else:
                    # Supprime les fichiers qui ne correspondent pas
                    os.remove(os.path.join(dataset_dir, file_name))
            except (IndexError, ValueError):
                print(f"Nom de fichier invalide : {file_name}")
                # Supprime les fichiers mal formatés
                os.remove(os.path.join(dataset_dir, file_name))
    return filtered_files

# Fonction pour générer des spectrogrammes
def generate_spectrogram(y, sr, output_file):
    D = librosa.amplitude_to_db(np.abs(librosa.stft(y)), ref=np.max)
    plt.figure(figsize=(2.56, 2.56))
    plt.axis('off')
    librosa.display.specshow(D, sr=sr, x_axis='time', y_axis='log')
    plt.savefig(output_file, bbox_inches='tight', pad_inches=0)
    plt.close()

# Fonction pour générer des MFCCs
def generate_mfcc(y, sr, output_file, n_mfcc=13):
    mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=n_mfcc)
    plt.figure(figsize=(2.56, 2.56))
    plt.axis('off')
    librosa.display.specshow(mfccs, sr=sr, x_axis='time')
    plt.savefig(output_file, bbox_inches='tight', pad_inches=0)
    plt.close()

# Filtrer les fichiers audio
filtered_files = filter_emotion_files(dataset_path)

# Charger et traiter les fichiers audio
file_id = 100  # Commence à 100

for file in filtered_files:
    file_path = os.path.join(dataset_path, file)
    
    # Charger l'audio
    y, sr = librosa.load(file_path, sr=None)
    
    # Extraire l'émotion du nom du fichier (par exemple, DC_sa01.wav -> "sa")
    emotion_code = file.split("_")[1][:2]  # Prend les 2 premières lettres après "_"
    
    # Mapper l'émotion vers son code numérique
    base_filename = f"02-01-{emotion_mapping.get(emotion_code, '00')}-01-01-01-{file_id:03d}"
    
    # Générer les chemins de sortie
    spectrogram_output = os.path.join(spectrograms_dir, f"{base_filename}_spectrogram.png")
    mfcc_output = os.path.join(mfccs_dir, f"{base_filename}_mfcc.png")
    
    # Générer et sauvegarder les représentations
    generate_spectrogram(y, sr, spectrogram_output)
    generate_mfcc(y, sr, mfcc_output)
    
    print(f"Représentations générées pour {file}:")
    print(f"  - Spectrogramme: {spectrogram_output}")
    print(f"  - MFCCs: {mfcc_output}")
    
    # Incrémenter l'ID pour le prochain fichier
    file_id += 1


Représentations générées pour DC_sa01.wav:
  - Spectrogramme: audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-100_spectrogram.png
  - MFCCs: audio_representations/audio_representations_savee/MFCCs\02-01-04-01-01-01-100_mfcc.png
Représentations générées pour DC_sa02.wav:
  - Spectrogramme: audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-101_spectrogram.png
  - MFCCs: audio_representations/audio_representations_savee/MFCCs\02-01-04-01-01-01-101_mfcc.png
Représentations générées pour DC_sa03.wav:
  - Spectrogramme: audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-102_spectrogram.png
  - MFCCs: audio_representations/audio_representations_savee/MFCCs\02-01-04-01-01-01-102_mfcc.png
Représentations générées pour DC_sa04.wav:
  - Spectrogramme: audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-103_spectrogram.png
  - MFCCs: audio_representations/audio_representations

In [12]:
import os

# Dossiers contenant les spectrogrammes et les MFCCs
spectrograms_dir = 'audio_representations/audio_representations_savee/spectrograms'
mfccs_dir = 'audio_representations/audio_representations_savee/MFCCs'

# Fonction pour supprimer les suffixes "_spectrogram" et "_mfcc"
def rename_files(directory, suffix_to_remove):
    for file_name in os.listdir(directory):
        if file_name.endswith(".png") and suffix_to_remove in file_name:
            old_path = os.path.join(directory, file_name)
            new_name = file_name.replace(suffix_to_remove, "")  # Supprime le suffixe
            new_path = os.path.join(directory, new_name)
            os.rename(old_path, new_path)
            print(f"Renommé : {old_path} -> {new_path}")

# Renommer les fichiers
rename_files(spectrograms_dir, "_spectrogram")
rename_files(mfccs_dir, "_mfcc")


Renommé : audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-100_spectrogram.png -> audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-100.png
Renommé : audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-101_spectrogram.png -> audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-101.png
Renommé : audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-102_spectrogram.png -> audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-102.png
Renommé : audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-103_spectrogram.png -> audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-103.png
Renommé : audio_representations/audio_representations_savee/spectrograms\02-01-04-01-01-01-104_spectrogram.png -> audio_representations/audio_representations_savee/spectrograms\02-01-04-01