# **Instalation de la bibliothèque "pydub" :**

In [1]:
!pip install pydub



# **Converter les fichiers .ogg en des fichiers .wav :**

In [2]:
import os
from pydub import AudioSegment

def convert_folder_ogg_to_wav(input_folder, output_folder):
    # Create the output directory if it doesn't exist
    os.makedirs(output_folder, exist_ok=True)

    # Parcourir tous les dossiers dans le répertoire principal
    for folder_name in os.listdir(input_folder):
        folder_path = os.path.join(input_folder, folder_name)
        
        # Ignorer les fichiers non-dossiers
        if not os.path.isdir(folder_path):
            continue
        
        # Parcourir tous les fichiers dans le dossier
        for filename in os.listdir(folder_path):
            file_path = os.path.join(folder_path, filename)
            
            # Ignorer les fichiers qui ne sont pas au format OGG
            if not filename.lower().endswith(".ogg"):
                continue
            
            # Charger le fichier audio OGG
            sound = AudioSegment.from_ogg(file_path)
            
            # Créer le chemin de sortie pour le fichier WAV
            wav_filename = os.path.splitext(filename)[0] + ".wav"
            output_path = os.path.join(output_folder, folder_name, wav_filename)
            
            # Créer le dossier de sortie s'il n'existe pas
            os.makedirs(os.path.dirname(output_path), exist_ok=True)
            
            # Exporter le fichier audio en format WAV
            sound.export(output_path, format="wav")
            print(f"Conversion terminée. Fichier enregistré sous : {output_path}")

# Spécifiez le chemin d'accès correct en fonction de la structure des fichiers de Kaggle
input_folder_data_ESC10 = "/kaggle/input/tp-02-audio/Data (ESC-10)/Data (ESC-10)"
output_folder_data_ESC10 = "/kaggle/working/Data (ESC-10) (en wav)"

# Appeler la fonction de conversion
convert_folder_ogg_to_wav(input_folder_data_ESC10, output_folder_data_ESC10)

# Spécifiez le chemin d'accès correct en fonction de la structure des fichiers de Kaggle
input_folder_data = "/kaggle/input/tp-02-audio/Data/Data"
output_folder_data = "/kaggle/working/Data (en wav)"

# Appeler la fonction de conversion
convert_folder_ogg_to_wav(input_folder_data, output_folder_data)

Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/4-167642-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/1-59324-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/2-130978-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/3-144692-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/1-47273-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/5-194533-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/2-119102-A.wav
Conversion terminée. Fichier enregistré sous : /kaggle/working/Data (ESC-10) (en wav)/006 - Person sneeze/5-220027-A.wav
Conversion terminée. Fichier enreg

In [3]:
import os
import shutil
from sklearn.model_selection import train_test_split

def partition_train_test(output_folder):
    # Créer les dossiers Train et Test dans le dossier Data (en wav)
    train_folder = os.path.join(output_folder, "Train")
    test_folder = os.path.join(output_folder, "Test")
    os.makedirs(train_folder, exist_ok=True)
    os.makedirs(test_folder, exist_ok=True)

    # Récupérer la liste des dossiers dans le dossier Data (en wav)
    audio_folders = [f for f in os.listdir(output_folder) if os.path.isdir(os.path.join(output_folder, f))]

    # Vérifier s'il y a des dossiers audio à diviser
    if len(audio_folders) == 0:
        print("Aucun dossier audio trouvé dans le répertoire spécifié.")
    else:
        for folder in audio_folders:
            # Récupérer la liste des fichiers WAV dans le dossier
            wav_files = [f for f in os.listdir(os.path.join(output_folder, folder)) if f.lower().endswith(".wav")]

            # Vérifier si la liste des fichiers n'est pas vide
            if len(wav_files) > 0:
                # Diviser la liste des fichiers en ensembles d'entraînement et de test
                train_files, test_files = train_test_split(wav_files, test_size=0.2, random_state=42)

                # Créer les dossiers Train et Test pour chaque dossier
                train_folder_path = os.path.join(train_folder, folder)
                test_folder_path = os.path.join(test_folder, folder)
                os.makedirs(train_folder_path, exist_ok=True)
                os.makedirs(test_folder_path, exist_ok=True)

                # Déplacer les fichiers d'entraînement vers le dossier Train
                for file in train_files:
                    src_path = os.path.join(output_folder, folder, file)
                    dest_path = os.path.join(train_folder_path, file)
                    shutil.move(src_path, dest_path)

                # Déplacer les fichiers de test vers le dossier Test
                for file in test_files:
                    src_path = os.path.join(output_folder, folder, file)
                    dest_path = os.path.join(test_folder_path, file)
                    shutil.move(src_path, dest_path)

                # Supprimer le dossier d'origine
                shutil.rmtree(os.path.join(output_folder, folder))

                print(f"Partitionnement des fichiers pour {folder} terminé.")
            else:
                print(f"Aucun fichier WAV trouvé dans le dossier {folder}. Aucune action effectuée.")

# Appeler la fonction de partition pour dataset "Data"
partition_train_test(output_folder_data)

# Appeler la fonction de partition pour dataset "Data ESC-10"
partition_train_test(output_folder_data_ESC10)

Partitionnement des fichiers pour 103 - Pig terminé.
Aucun fichier WAV trouvé dans le dossier Train. Aucune action effectuée.
Aucun fichier WAV trouvé dans le dossier Test. Aucune action effectuée.
Partitionnement des fichiers pour 102 - Rooster terminé.
Partitionnement des fichiers pour 105 - Frog terminé.
Partitionnement des fichiers pour 104 - Cow terminé.
Partitionnement des fichiers pour 101 - Dog terminé.
Partitionnement des fichiers pour 010 - Fire crackling terminé.
Partitionnement des fichiers pour 001 - Dog bark terminé.
Partitionnement des fichiers pour 004 - Baby cry terminé.
Partitionnement des fichiers pour 007 - Helicopter terminé.
Partitionnement des fichiers pour 003 - Sea waves terminé.
Partitionnement des fichiers pour 005 - Clock tick terminé.
Aucun fichier WAV trouvé dans le dossier Train. Aucune action effectuée.
Aucun fichier WAV trouvé dans le dossier Test. Aucune action effectuée.
Partitionnement des fichiers pour 008 - Chainsaw terminé.
Partitionnement des fic