# Projet1 
# Extraction de l'audio depuis des vidéos locales

Ce notebook extrait l'audio de toutes les vidéos présentes dans un dossier `../dataset/videos` et sauvegarde les fichiers audio dans `../dataset/audio` au format WAV.


In [None]:
# Installation automatique des librairies nécessaires
!pip install ffmpeg-python

import os
import shutil
import ffmpeg
import ffmpeg._run as ffmpeg_run
from pathlib import Path

: 

In [None]:
# Vérification de la présence de l'exécutable système FFmpeg
import shutil

if shutil.which("ffmpeg") is None:
    raise EnvironmentError("FFmpeg n'est pas installé sur votre système.\n\n"\
                         "Sur Ubuntu/Debian : sudo apt-get install ffmpeg\n"\
                         "Sur Mac (Homebrew) : brew install ffmpeg\n"\
                         "Sur Windows (Chocolatey) : choco install ffmpeg, ou télécharger sur le site officiel.")
else:
    print("FFmpeg est disponible.")

In [None]:
# Définition des dossiers de travail
import os

video_dir = 'dataset/videos'
audio_dir = 'dataset/audio'

# Création des dossiers si besoin
if not os.path.exists(video_dir):
    raise FileNotFoundError(f"Le répertoire des vidéos '{video_dir}' n'existe pas.")
if not os.path.exists(audio_dir):
    os.makedirs(audio_dir)
    print(f"Création du dossier audio : {audio_dir}")

In [None]:
# Fonction pour extraire l'audio d'une vidéo en utilisant FFmpeg
def extract_audio(video_path, audio_output_path):
    """
    Extrait l'audio d'un fichier vidéo et le sauvegarde au format WAV.
    Paramètres :
        video_path (str): chemin vers le fichier vidéo
        audio_output_path (str): chemin de sortie du fichier audio
    """
    # Option -y pour écraser sans confirmation
    result = os.system(f'ffmpeg -y -i "{video_path}" -ab 160k -ac 2 -ar 44100 -vn "{audio_output_path}"')
    if result != 0:
        raise RuntimeError(f"Erreur lors de l'extraction audio pour {video_path}")
    print(f'Extraction audio terminée pour {video_path}')

In [None]:
# Parcours des fichiers vidéo et extraction de l'audio
video_files = [f for f in os.listdir(video_dir) if not f.startswith('.') and os.path.isfile(os.path.join(video_dir, f))]

if not video_files:
    raise FileNotFoundError(f"Aucun fichier vidéo trouvé dans le répertoire '{video_dir}'.")

for i, video_file in enumerate(video_files):
    video_path = os.path.join(video_dir, video_file)
    # Génère un nom d'audio unique (WAV)
    audio_output_path = os.path.join(audio_dir, f'audio_{i+1}.wav')
    try:
        extract_audio(video_path, audio_output_path)
    except Exception as e:
        print(f"Erreur lors du traitement de {video_file}: {e}")

## Vérification :

Vous pouvez lister les fichiers audio extraits pour vérifier le résultat.

In [None]:
# Affichage de la liste des fichiers audio extraits
print("Fichiers audio extraits :")
for audio_file in os.listdir(audio_dir):
    print(audio_file)