In [4]:
import os
import librosa
import pandas as pd
import numpy as np

# Fonction pour extraire les caractéristiques d'un fichier audio
def extract_features(audio_file):
    y, sr = librosa.load(audio_file)
    
    # Extraction des caractéristiques spécifiques
    chroma_stft = librosa.feature.chroma_stft(y=y, sr=sr)
    rms = librosa.feature.rms(y=y)
    spectral_centroid = librosa.feature.spectral_centroid(y=y, sr=sr)
    spectral_bandwidth = librosa.feature.spectral_bandwidth(y=y, sr=sr)
    rolloff = librosa.feature.spectral_rolloff(y=y, sr=sr)
    zero_crossing_rate = librosa.feature.zero_crossing_rate(y=y)
    
    # Extraction de l'harmonie sans déballer en deux valeurs
    harmony = librosa.effects.harmonic(y)
    
    # Détection du tempo
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)
    
    # Extraction des MFCC
    mfcc = librosa.feature.mfcc(y=y, sr=sr)
    
    # Calcul de la moyenne et de la variance des caractéristiques
    features = {
        'filename': audio_file,
        'length': len(y),
        'chroma_stft_mean': np.mean(chroma_stft),
        'chroma_stft_var': np.var(chroma_stft),
        'rms_mean': np.mean(rms),
        'rms_var': np.var(rms),
        'spectral_centroid_mean': np.mean(spectral_centroid),
        'spectral_centroid_var': np.var(spectral_centroid),
        'spectral_bandwidth_mean': np.mean(spectral_bandwidth),
        'spectral_bandwidth_var': np.var(spectral_bandwidth),
        'rolloff_mean': np.mean(rolloff),
        'rolloff_var': np.var(rolloff),
        'zero_crossing_rate_mean': np.mean(zero_crossing_rate),
        'zero_crossing_rate_var': np.var(zero_crossing_rate),
        'harmony_mean': np.mean(harmony),
        'harmony_var': np.var(harmony),
        'tempo': tempo,
    }
    
    # Calcul des MFCC
    for i in range(1, 21):  # MFCC1 à MFCC20
        features[f'mfcc{i}_mean'] = np.mean(mfcc[i-1])
        features[f'mfcc{i}_var'] = np.var(mfcc[i-1])
    
    return features

# Dossier contenant les fichiers audio .wav
audio_folder = './data/wav_songs'

# Liste des fichiers .wav dans le dossier
audio_files = [f for f in os.listdir(audio_folder) if f.endswith('.wav')]

# Liste pour stocker les caractéristiques extraites
all_features = []

# Traitement de chaque fichier audio
for audio_file in audio_files:
    audio_path = os.path.join(audio_folder, audio_file)
    
    # Extraction des caractéristiques
    features = extract_features(audio_path)
    
    # Ajouter les caractéristiques à la liste
    all_features.append(features)

# Conversion en DataFrame et sauvegarde au format CSV
df = pd.DataFrame(all_features)
df.to_csv('audio_features_all.csv', index=False)

print("Features extracted for all files and saved to audio_features_all.csv.")


KeyboardInterrupt: 

In [3]:
import os
import ffmpeg
import librosa
import pandas as pd
import numpy as np

# Fonction pour extraire les caractéristiques d'un fichier audio
def extract_features(audio_file):
    y, sr = librosa.load(audio_file)
    
    # Extraction des caractéristiques spécifiques
    chroma_stft = librosa.feature.chroma_stft(y=y, sr=sr)
    rms = librosa.feature.rms(y=y)
    spectral_centroid = librosa.feature.spectral_centroid(y=y, sr=sr)
    spectral_bandwidth = librosa.feature.spectral_bandwidth(y=y, sr=sr)
    rolloff = librosa.feature.spectral_rolloff(y=y, sr=sr)
    zero_crossing_rate = librosa.feature.zero_crossing_rate(y=y)
    
    # Extraction de l'harmonie sans déballer en deux valeurs
    harmony = librosa.effects.harmonic(y)
    
    # Détection du tempo
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)
    
    # Extraction des MFCC
    mfcc = librosa.feature.mfcc(y=y, sr=sr)
    
    # Calcul de la moyenne et de la variance des caractéristiques
    features = {
        'filename': audio_file,
        'length': len(y),
        'chroma_stft_mean': np.mean(chroma_stft),
        'chroma_stft_var': np.var(chroma_stft),
        'rms_mean': np.mean(rms),
        'rms_var': np.var(rms),
        'spectral_centroid_mean': np.mean(spectral_centroid),
        'spectral_centroid_var': np.var(spectral_centroid),
        'spectral_bandwidth_mean': np.mean(spectral_bandwidth),
        'spectral_bandwidth_var': np.var(spectral_bandwidth),
        'rolloff_mean': np.mean(rolloff),
        'rolloff_var': np.var(rolloff),
        'zero_crossing_rate_mean': np.mean(zero_crossing_rate),
        'zero_crossing_rate_var': np.var(zero_crossing_rate),
        'harmony_mean': np.mean(harmony),
        'harmony_var': np.var(harmony),
        'tempo': tempo,
    }
    
    # Calcul des MFCC
    for i in range(1, 21):  # MFCC1 à MFCC20
        features[f'mfcc{i}_mean'] = np.mean(mfcc[i-1])
        features[f'mfcc{i}_var'] = np.var(mfcc[i-1])
    
    return features

# Fonction pour extraire l'audio à partir d'une vidéo
def extract_audio_from_video(video_file, output_audio_file):
    try:
        # Utilisation de ffmpeg pour extraire l'audio
        ffmpeg.input(video_file).output(output_audio_file).run()
        print(f"Audio extrait et sauvegardé sous {output_audio_file}")
    except ffmpeg.Error as e:
        print(f"Erreur lors de l'extraction de l'audio: {e}")

# Dossier contenant les vidéos
video_folder = r'C:\Users\pc\Documents\asri_non_structured\data\top_songs_database'

# Liste des fichiers vidéo dans le dossier
video_files = [f for f in os.listdir(video_folder) if f.endswith('.mp4')]  # Modifier l'extension si nécessaire

# Liste pour stocker les caractéristiques extraites
all_features = []

# Traitement de chaque fichier vidéo
for video_file in video_files:
    video_path = os.path.join(video_folder, video_file)
    
    # Nom du fichier audio de sortie (wav)
    audio_file = os.path.splitext(video_file)[0] + '.wav'
    audio_path = os.path.join(video_folder, audio_file)
    
    # Extraire l'audio du fichier vidéo
    extract_audio_from_video(video_path, audio_path)
    
    # Extraire les caractéristiques de l'audio
    features = extract_features(audio_path)
    
    # Ajouter les caractéristiques à la liste
    all_features.append(features)

# Sauvegarder les caractéristiques dans un fichier CSV
df = pd.DataFrame(all_features)
df.to_csv('audio_features.csv', index=False)

print("Caractéristiques extraites et sauvegardées dans audio_features.csv.")


Audio extrait et sauvegardé sous C:\Users\pc\Documents\asri_non_structured\data\top_songs_database\001 - ROSÉ & Bruno Mars - APT. (Official Music Video).wav
Audio extrait et sauvegardé sous C:\Users\pc\Documents\asri_non_structured\data\top_songs_database\002 - MANIAC (Official Video)： YO YO HONEY SINGH ｜ ESHA GUPTA ｜ GLORY ｜ BHUSHAN KUMAR.wav
Audio extrait et sauvegardé sous C:\Users\pc\Documents\asri_non_structured\data\top_songs_database\003 - Lady Gaga, Bruno Mars - Die With A Smile (Official Music Video).wav
Audio extrait et sauvegardé sous C:\Users\pc\Documents\asri_non_structured\data\top_songs_database\004 - Aaj Ki Raat -Full Song ｜Stree 2｜Tamannaah Bhatia｜Rajkummar Rao｜Sachin-Jigar｜Madhubanti｜Divya｜Amitabh.wav
Audio extrait et sauvegardé sous C:\Users\pc\Documents\asri_non_structured\data\top_songs_database\005 - Sanam Teri Kasam, (Lyrical Video) - Harshvardhan, Mawra ｜ Ankit Tiwari ｜ Palak M ｜ Himesh Reshammiya.wav
Audio extrait et sauvegardé sous C:\Users\pc\Documents\asri_