# Pré Processamento
Este arquivo está relacionado ao pré-processamento dos arquivos de audio em espectogramas.

In [None]:
#!pip install librosa

import os
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np
import matplotlib
matplotlib.use('Agg')

# Caminho dos diretórios de áudio e espectrogramas
audio_dir = "./data/train_audio/"
spectrogram_dir = "./data/espectogramas"

# Se não existir o diretorio ./train_espectogramas, cria
if not os.path.exists(spectrogram_dir):
    os.mkdir(spectrogram_dir)



In [None]:

# Função para criar espectrograma e salvar a imagem
def create_spectrogram(audio_path, output_path):
    # Carrega o arquivo de áudio utilizando a biblioteca librosa
    y, sr = librosa.load(audio_path)
    # Calcula a Transformada de Fourier de Curto Prazo (STFT) do sinal de áudio com n_fft=2048, hop_length=1024
    D = librosa.amplitude_to_db(np.abs(librosa.stft(y, n_fft=2048, hop_length=1024)), ref=np.max)
    
    # Calcula o tamanho proporcional da figura com base na duração do áudio
    duration = librosa.get_duration(y=y, sr=sr)
    figsize = (duration, 4)  # Ajuste o valor multiplicativo para controlar a largura
    
    # Cria a figura com o tamanho proporcional
    plt.figure(figsize=figsize)

    # Plota o espectrograma
    librosa.display.specshow(D, sr=sr, hop_length=1024, x_axis='time', y_axis='linear') 

    # Remove os eixos
    plt.axis('off')

    # Salva a figura no diretório de espectrogramas
    plt.savefig(output_path, bbox_inches='tight', pad_inches=0.0)

    # Fecha a figura para liberar recursos de memória
    plt.close()


In [None]:
# Percorrendo os diretórios de áudio
for key in os.listdir(audio_dir):
    key_dir = os.path.join(audio_dir, key)
    if os.path.isdir(key_dir):
        spectrogram_key_dir = os.path.join(spectrogram_dir, key)
        os.makedirs(spectrogram_key_dir, exist_ok=True)
        
        for audio_name in os.listdir(key_dir):
            if audio_name.endswith(".ogg"):
                audio_path = os.path.join(key_dir, audio_name)
                spectrogram_path = os.path.join(spectrogram_key_dir, audio_name.replace(".ogg", ".png"))
                create_spectrogram(audio_path, spectrogram_path)
                print(f"Espectrograma criado para {audio_name}")