# Data Augmentation para o SESA Dataset usando ruído branco

A ideia é aumentar a quantidade de dados de treinamento usando ruído branco. Todos os áudios deverão ter ruído branco adicionado com SNRs de -10 dB até 30 dB, passo 5. Ou seja, cada áudio será replicado 9 vezes + o original. A pasta de treinamento passará de 480 para 4800 áudios.

O objetivo disso é verificar se é possível melhorar o desempenho do Beamforming, já que ele foi tão mal nos testes anteriores.

In [1]:
import librosa
import numpy as np
import math
import matplotlib.pyplot as plt
import os
from IPython.display import Audio

#### Abrindo um áudio aleatório para testar as funções que eu for implementando

In [None]:
caminhoSinal = '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/train/casual_066.wav'
sinalOriginal, freqAmostragem = librosa.load(caminhoSinal, sr=None, mono=True)

#### Função para gerar ruído branco com energia definida

In [2]:
def gerarRuidoBranco(qtdAmostras, energia):
    
    media        = 0
    desvioPadrao = 1
    
    return np.random.normal(media, desvioPadrao, size=qtdAmostras) * energia**(1/2)

In [None]:
ruido = gerarRuidoBranco(len(sinalOriginal), 1)
Audio(data=ruido, rate=freqAmostragem)

In [None]:
print("Energia do sinal:", np.var(sinalOriginal))
print("Energia do ruido:", np.var(ruido))

plt.plot(ruido, label="Ruido")
plt.plot(sinalOriginal, label="Sinal")
plt.legend()

#### Função para calcular qual deve ser a energia do ruído dada a SNR desejada

In [3]:
def calcularEnerigaRuidoDadoSNR(snrDesejada, energiaSinal):
    return energiaSinal/(10**(snrDesejada/10))

In [None]:
energiaRuido = calcularEnerigaRuidoDadoSNR(-5, 1)
energiaRuido

#### Função para calcular a SNR 

In [4]:
def calcularSNR(sinal, ruido):
    return 10 * math.log((np.var(sinal)/np.var(ruido)), 10)

In [None]:
ruido = gerarRuidoBranco(len(sinalOriginal), energiaRuido)
calcularSNR(sinalOriginal, ruido)

## Finalmente...

In [5]:
# PASTAS DE ORIGEM E DESTINO DOS AUDIOS WAV
dirOrigem  = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/"
dirDestino = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test_augmentation/"

# RANGE DE SNRS QUE EU QUERO USAR PARA FAZER O DATA AUGMENTATION
rangeSNRs = a = np.arange(-10, 31, 5)

# PARA CADA AUDIO NA PASTA DE ORIGEM
arrayArquivos = os.listdir(dirOrigem)
for i, arquivoAtual in enumerate(arrayArquivos):
    
    # ABRO O AUDIO ATUAL
    caminho = dirOrigem + arquivoAtual
    audioOriginalAtual, freqAmostragem = librosa.core.load(caminho, sr=None, mono=True)
    
    # COPIO O ORIGINAL PARA A PASTA DE DESTINO
    caminho = dirDestino + arquivoAtual
    librosa.output.write_wav(caminho, audioOriginalAtual, sr=freqAmostragem)
    
    # PARA CADA SNR DESEJADA
    for SNRAtual in rangeSNRs:
    
        # EU CRIO O RUIDO COM A ENERGIA CORRETA PARA ESSA SNR
        energiaRuido = calcularEnerigaRuidoDadoSNR(SNRAtual, 1)
        ruido        = gerarRuidoBranco(len(audioOriginalAtual), energiaRuido)
        
        # SOMO O SINAL DESEJADO COM O RUIDOSO
        somaSinais = audioOriginalAtual + ruido
        
        # SALVO NO DESTINO
        caminho = dirDestino + arquivoAtual[:-4] + "_SNR_" + str(SNRAtual) + "dB.wav"
        librosa.output.write_wav(caminho, somaSinais, sr=freqAmostragem)
        
    print("Progresso: " + str(100*((i+1)/len(arrayArquivos))) + "%")

Progresso: 0.9523809523809524%
Progresso: 1.9047619047619049%
Progresso: 2.857142857142857%
Progresso: 3.8095238095238098%
Progresso: 4.761904761904762%
Progresso: 5.714285714285714%
Progresso: 6.666666666666667%
Progresso: 7.6190476190476195%
Progresso: 8.571428571428571%
Progresso: 9.523809523809524%
Progresso: 10.476190476190476%
Progresso: 11.428571428571429%
Progresso: 12.380952380952381%
Progresso: 13.333333333333334%
Progresso: 14.285714285714285%
Progresso: 15.238095238095239%
Progresso: 16.19047619047619%
Progresso: 17.142857142857142%
Progresso: 18.095238095238095%
Progresso: 19.047619047619047%
Progresso: 20.0%
Progresso: 20.952380952380953%
Progresso: 21.904761904761905%
Progresso: 22.857142857142858%
Progresso: 23.809523809523807%
Progresso: 24.761904761904763%
Progresso: 25.71428571428571%
Progresso: 26.666666666666668%
Progresso: 27.61904761904762%
Progresso: 28.57142857142857%
Progresso: 29.523809523809526%
Progresso: 30.476190476190478%
Progresso: 31.428571428571427%
P