In [17]:
import os
import numpy as np
import librosa
from sklearn.model_selection import train_test_split
import glob

# Chemins vers les dossiers pop et techno
pop_dir = "./Data/genres_original/classical/"
techno_dir = "./Data/genres_original/metal/"

# Taille fixe pour les spectrogrammes (à ajuster selon vos besoins)
input_shape = (128, 128)

# Fonction pour charger les spectrogrammes à partir des fichiers audio
def load_spectrogram(file_path, input_shape):
    y, sr = librosa.load(file_path, sr=None)  # Charge le fichier audio
    spectrogram = librosa.feature.melspectrogram(y=y, sr=sr)  # Convertit en spectrogramme
    spectrogram = librosa.power_to_db(spectrogram, ref=np.max)  # Normalise les valeurs
    # Redimensionne le spectrogramme pour correspondre à la taille fixe
    spectrogram = spectrogram[:input_shape[0], :input_shape[1]]
    # Redimensionne pour avoir les dimensions attendues par le modèle
    spectrogram = np.expand_dims(spectrogram, axis=-1)
    return spectrogram

# Fonction pour charger toutes les données d'un répertoire
def load_data_from_directory(directory, label, input_shape):
    data = []
    for filename in glob.glob(os.path.join(directory, '*.wav')):
        spectrogram = load_spectrogram(filename, input_shape)
        data.append((spectrogram, label))
    return data

# Chargement des données pour le genre pop
pop_data = load_data_from_directory(pop_dir, label=0, input_shape=input_shape)
# Chargement des données pour le genre techno
techno_data = load_data_from_directory(techno_dir, label=1, input_shape=input_shape)

# Fusion des données
all_data = pop_data + techno_data

# Séparation des données en ensembles d'entraînement et de test
train_data, test_data = train_test_split(all_data, test_size=0.2, random_state=42)

# Séparation des données d'entraînement en données et étiquettes
train_data, train_labels = zip(*train_data)
train_data = np.array(train_data)
train_labels = np.array(train_labels)

# Séparation des données de test en données et étiquettes
test_data, test_labels = zip(*test_data)
test_data = np.array(test_data)
test_labels = np.array(test_labels)

print("Données d'entraînement:", train_data.shape)
print("Étiquettes d'entraînement:", train_labels.shape)
print("Données de test:", test_data.shape)
print("Étiquettes de test:", test_labels.shape)


Données d'entraînement: (160, 128, 128, 1)
Étiquettes d'entraînement: (160,)
Données de test: (40, 128, 128, 1)
Étiquettes de test: (40,)


In [18]:
import tensorflow as tf
from tensorflow.keras import layers, models

# Définition des dimensions des spectrogrammes
input_shape = train_data.shape[1:]  # Shape de chaque spectrogramme (sans le nombre d'échantillons)

# Création du modèle CNN
def create_model(input_shape):
    model = models.Sequential([
        layers.Conv2D(32, (3, 3), activation='relu', input_shape=input_shape),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(64, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(128, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),
        layers.Flatten(),
        layers.Dense(128, activation='relu'),
        layers.Dense(128, activation='relu'),
        layers.Dense(1, activation='sigmoid')  # Couche de sortie avec activation sigmoid pour la classification binaire
    ])
    return model

# Création du modèle
model = create_model(input_shape)

# Compilation du modèle
model.compile(optimizer='adam',
              loss='binary_crossentropy',  # Binary Crossentropy pour la classification binaire
              metrics=['accuracy'])

# Entraînement du modèle
model.fit(train_data, train_labels, epochs=10, batch_size=32, validation_split=0.2)

# Évaluation du modèle
test_loss, test_acc = model.evaluate(test_data, test_labels)
print('Test accuracy:', test_acc)


Epoch 1/10


Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10
Test accuracy: 0.949999988079071


In [19]:
import os
import librosa
import glob

classical_music_dir = "./Data/genres_original/classical/"
metal_music_dir = "./Data/genres_original/metal/"

# Charger les données musicales classiques
classical_music_files = glob.glob(classical_music_dir +'*.wav')

# Charger les données musicales metal
metal_music_files = glob.glob(metal_music_dir+ '*.wav')


In [None]:
!pip install magenta

In [None]:
import magenta.models.music_vae as music_vae

music_vae_model = music_vae.MusicVAE("cat-mel_2bar_big")


In [None]:
def generate_metal_music(classical_music_input):
    # Charger la musique classique en utilisant le modèle de Magenta
    sequence = music_vae_model.improvise(classical_music_input)
    # Convertir la séquence MIDI en audio
    audio = sequence.to_note_sequence().to_audio()
    return audio

# Exemple d'utilisation
classical_music_input = librosa.load(classical_music_files[0], sr=None)
metal_music_output = generate_metal_music(classical_music_input)


In [None]:
import soundfile as sf

# Spécifiez le chemin de destination où vous souhaitez enregistrer le fichier audio généré
destination_path = "./metal_music_generated.wav"

# Enregistrez le fichier audio généré
sf.write(destination_path, metal_music_output, sample_rate)
