In [None]:
import os

import torch
import scipy.io.wavfile

from transformers import pipeline
from tqdm import tqdm

In [None]:
import sys
from pathlib import Path

# Detectar la ra칤z del proyecto autom치ticamente
PROJECT_ROOT = Path.cwd()
for parent in [PROJECT_ROOT, *PROJECT_ROOT.parents]:
    if (parent / "models" / "scripts" / "types.py").exists():
        PROJECT_ROOT = parent
        break

# Agregar la ra칤z al sys.path si no est치
if str(PROJECT_ROOT) not in sys.path:
    sys.path.append(str(PROJECT_ROOT))

print("游댌 Ra칤z del proyecto:", PROJECT_ROOT)

In [None]:
from models.scripts.types import MusicGenCLAPResult, MusicGenData
from config import load_config, setup_project_paths, PROJECT_ROOT

In [None]:
base_prompts = [
    "sweet music, ambient for fine restaurant",
    "bitter music, ambient for fine restaurant",
    "sour music, ambient for fine restaurant",
    "salty music, ambient for fine restaurant",
]

variations_per_prompt = 25

In [None]:
def generate_music_from_prompts(
    synthesiser,
    base_prompts,
    variations_per_prompt=25,
    output_dir="generated_music",
    sample_rate=32000,
) -> list[MusicGenData]:
    """
    Genera archivos de audio a partir de descripciones de texto usando el modelo tasty-musicgen-small.

    Parameters:
        synthesiser: Pipeline de Hugging Face para text-to-audio.
        base_prompts: Lista de prompts para generar m칰sica.
        variations_per_prompt: N칰mero de variaciones por prompt.
        output_dir: Carpeta donde guardar los .wav generados.
        sample_rate: Frecuencia de muestreo para los archivos de salida.

    Returns:
        list[MusicGenData]: Lista con datos de cada generaci칩n.
    """
    os.makedirs(output_dir, exist_ok=True)
    results: list[MusicGenData] = []

    print(
        f"Generando m칰sica para {len(base_prompts)} prompts con una variaci칩n de {variations_per_prompt} para cada uno.\n"
    )

    for taste_prompt in base_prompts:
        taste_name = taste_prompt.split()[0]
        print(f"Sabor: {taste_name}")
        for i in tqdm(
            range(variations_per_prompt), desc="Generando variaciones", ncols=80
        ):
            file_id = f"{taste_name}_{i + 1:02d}"
            output_path = os.path.join(output_dir, f"{file_id}.wav")

            try:
                # 1. Generar la m칰sica con el modelo.
                # output es un diccionario: audio(array NumPy con la se침al de audio) y sampling_rate (frecuencia de muestreo del modelo).
                output = synthesiser(taste_prompt, forward_params={"do_sample": True})

                # 2. Extraer datos del audio.
                audio_data = output[
                    "audio"
                ]  # La onda de sonido (las muestras del audio).
                sr = output.get(
                    "sampling_rate", sample_rate
                )  # La frecuencia de muestreo reportada por el modelo.

                # 3. Guardar el audio generado.
                output_path = os.path.join(output_dir, f"{file_id}.wav")
                scipy.io.wavfile.write(
                    output_path, rate=sr, data=audio_data
                )  # Escribir el archivo .wav con la se침al y la frecuencia.

                # 4. Registrar los resultados.
                results.append(
                    MusicGenData(
                        id=file_id,
                        prompt=taste_prompt,
                        audio_path=output_path,
                    )
                )
            except Exception as e:
                print(f" Error generando {file_id}: {e}")
                continue

    print(f"\n {len(results)} archivos de audio generados en: {output_dir}")
    return results

In [None]:
# Pipeline.
if __name__ == "__main__":
    # Variables y constantes.
    device = "cuda" if torch.cuda.is_available() else "cpu"
    print(f"Dispositivo: {device}")

    print("Configurando las rutas del proyecto...")
    setup_project_paths()

    print("Cargando configuraci칩n...")
    config = load_config()

    model_musicgen_path = PROJECT_ROOT / config.model.model_musicgen_path
    tracks_base_data_path = PROJECT_ROOT / config.data.tracks_base_data_path

    base_prompts = [
        "sweet music, ambient for fine restaurant",
        "bitter music, ambient for fine restaurant",
        "sour music, ambient for fine restaurant",
        "salty music, ambient for fine restaurant",
    ]

    variations_per_prompt = 25

    synthesiser = pipeline(
        "text-to-audio",
        model=model_musicgen_path,
        device=device,
        trust_remote_code=True,
    )

    results = generate_music_from_prompts(
        synthesiser,
        base_prompts,
        variations_per_prompt,
        tracks_base_data_path,
    )
