# Pré Processamento
Este arquivo está relacionado ao pré-processamento dos arquivos de audio em espectogramas.

In [1]:
#!pip install librosa

import os
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np
import matplotlib
matplotlib.use('Agg')

# Caminho dos diretórios de áudio e espectrogramas
audio_dir = "./data/train_audio/"
spectrogram_dir = "./data/espectogramas"

# Se não existir o diretorio ./train_espectogramas, cria
if not os.path.exists(spectrogram_dir):
    os.mkdir(spectrogram_dir)



In [2]:

# Função para criar espectrograma e salvar a imagem
def create_spectrogram(audio_path, output_path):
    # Carrega o arquivo de áudio utilizando a biblioteca librosa
    y, sr = librosa.load(audio_path, sr=None)

    # Calcula a Transformada de Fourier de Curto Prazo (STFT) do sinal de áudio com n_fft=2048, hop_length=1024
    D = librosa.amplitude_to_db(np.abs(librosa.stft(y, n_fft=2048, hop_length=1024)), ref=np.max)
    
    # Calcula o tamanho proporcional da figura com base na duração do áudio
    duration = librosa.get_duration(y=y, sr=sr)
    figsize = (duration, 4)
    
    # Cria a figura com o tamanho proporcional
    try:
        plt.figure(figsize=figsize)

        # Plota o espectrograma
        librosa.display.specshow(D, sr=sr, hop_length=1024, x_axis='time', y_axis='linear') 

        # Remove os eixos
        plt.axis('off')

        # Salva a figura no diretório de espectrogramas
        plt.savefig(output_path, bbox_inches='tight', pad_inches=0.0)

        # Fecha a figura para liberar recursos de memória
        plt.close()

        return True
    
    except(ValueError):
        
        print("******************************************************")
        print("Erro ao criar espectrograma para o arquivo: " + audio_path)
        print("Número de amostras no arquivo: " + str(len(y)))
        print("******************************************************")

        return False


In [3]:
espec_created = 0
espec_not_created = 0

# Percorrendo os diretórios de áudio
for key in os.listdir(audio_dir):
    key_dir = os.path.join(audio_dir, key)
    if os.path.isdir(key_dir):
        spectrogram_key_dir = os.path.join(spectrogram_dir, key)
        os.makedirs(spectrogram_key_dir, exist_ok=True)
        
        for audio_name in os.listdir(key_dir):
            if audio_name.endswith(".ogg"):
                audio_path = os.path.join(key_dir, audio_name)
                spectrogram_path = os.path.join(spectrogram_key_dir, audio_name.replace(".ogg", ".png"))
                created = create_spectrogram(audio_path, spectrogram_path)
                if created:
                    espec_created += 1
                else:
                    espec_not_created += 1
                print(f"Espectrograma criado para {audio_name}")

print(f"Espectrogramas criados: {espec_created}")
print(f"Espectrogramas não criados: {espec_not_created}")

Espectrograma criado para XC128013.ogg
Espectrograma criado para XC363501.ogg
Espectrograma criado para XC363502.ogg
Espectrograma criado para XC363503.ogg
Espectrograma criado para XC363504.ogg
Espectrograma criado para XC379322.ogg
Espectrograma criado para XC432639.ogg
Espectrograma criado para XC467121.ogg
Espectrograma criado para XC467122.ogg
Espectrograma criado para XC531557.ogg
Espectrograma criado para XC585802.ogg
Espectrograma criado para XC606253.ogg
Espectrograma criado para XC616997.ogg
Espectrograma criado para XC639039.ogg
Espectrograma criado para XC756300.ogg
Espectrograma criado para XC120250.ogg
Espectrograma criado para XC120251.ogg
Espectrograma criado para XC127317.ogg
Espectrograma criado para XC127318.ogg
Espectrograma criado para XC128202.ogg
Espectrograma criado para XC132733.ogg
Espectrograma criado para XC138433.ogg
Espectrograma criado para XC153687.ogg
Espectrograma criado para XC153688.ogg
Espectrograma criado para XC153689.ogg
Espectrograma criado para

  plt.figure(figsize=figsize)


Espectrograma criado para XC318439.ogg
Espectrograma criado para XC320136.ogg
Espectrograma criado para XC325170.ogg
Espectrograma criado para XC325173.ogg
Espectrograma criado para XC325178.ogg
Espectrograma criado para XC327766.ogg
Espectrograma criado para XC327769.ogg
Espectrograma criado para XC329918.ogg
Espectrograma criado para XC334282.ogg
Espectrograma criado para XC334321.ogg
Espectrograma criado para XC337010.ogg
Espectrograma criado para XC343651.ogg
Espectrograma criado para XC349675.ogg
Espectrograma criado para XC357489.ogg
Espectrograma criado para XC358155.ogg
Espectrograma criado para XC362842.ogg
Espectrograma criado para XC363903.ogg
Espectrograma criado para XC365028.ogg
Espectrograma criado para XC365144.ogg
Espectrograma criado para XC365529.ogg
Espectrograma criado para XC365530.ogg
Espectrograma criado para XC367786.ogg
Espectrograma criado para XC367872.ogg
Espectrograma criado para XC367873.ogg
Espectrograma criado para XC367977.ogg
Espectrograma criado para