# Implementação de algoritmo para usar as classes de simulação de array de microfones e GSC para o SESA Dataset

A ideia desse jupyter é criar um algoritmo que, dadas a pasta de origem e as de destino, simule um array de microfones com os áudios da pasta de origem e salve os sinais sem beamforming, com beamforming e com GSC nas pastas de destino.

In [1]:
import os
import librosa
import math
import shutil
import time
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from IPython.display import Audio

#### Importando as classes criadas

In [2]:
import sys
sys.path.append('/home/dimi/Programming/IC2019/DOA/Python')

from GeneralizedSidelobeCancellerClass import GeneralizedSidelobeCanceller
from SimularArrayMicrofonesClass import SimularArrayMicrofones

## Definindo uma boa amplitude para o ruído

Pela definição, se a média do sinal for 0, pode-se aproximar a energia do sinal pela variância. A SNR pode ser definida como 10 * log_10 (var(sinal)/var(ruído)).

"Engineers consider a SNR of 2 (3 dB) to be the boundary between low and high SNRs".

http://www.scholarpedia.org/article/Signal-to-noise_ratio

In [3]:
def calcularSNR(sinal, ruido):
    return 10 * math.log((np.var(sinal)/np.var(ruido)), 10)

In [4]:
def calcularEnerigaRuidoDadoSNR(snrDesejada, energiaSinal):
    return energiaSinal/(10**(snrDesejada/10))

A função abaixo é exatamente a mesma que está sendo usada na classe SimularArrayMicrofones. Essa parte do jupyter vai servir apenas para achar uma boa SNR para realizar os testes.

In [None]:
def gerarRuidoBranco(qtdAmostras, energiaRuido):

    media        = 0
    desvioPadrao = 1

    return np.random.normal(media, desvioPadrao, size=qtdAmostras) * energiaRuido**(1/2)

O sinal que será aberto para fazer o teste **JÁ DEVE ESTAR NORMALIZADO PELA ENERGIA**, assim, fica muito mais fácil calcular a SNR.

In [None]:
caminho = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/casual_000.wav"
sinalOriginal, freqAmostragem = librosa.load(caminho, sr=None, mono=True)

snrDesejada  = 20
energiaRuido = calcularEnerigaRuidoDadoSNR(snrDesejada, 1) 

ruido = gerarRuidoBranco(len(sinalOriginal), energiaRuido)

plt.plot(sinalOriginal, label="Sinal")
plt.plot(ruido, label="Ruído")
plt.legend()
plt.show()

In [None]:
print("Energia do sinal:", np.var(sinalOriginal))
print("Energia do ruído:", energiaRuido)
print("SNR:\t\t ", calcularSNR(sinalOriginal, ruido))

In [None]:
print("Original")
Audio(data=sinalOriginal, rate=freqAmostragem)

In [None]:
print("Com ruído")
sinalComRuido = sinalOriginal + ruido
Audio(data=sinalComRuido, rate=freqAmostragem)

## Rodando o algoritmo para várias SNRs diferentes na pasta de teste do SESA

In [7]:
# DEFININDO PARAMETROS INICIAIS
pastaOrigem  = '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/'
pastaDestino = '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros/'

# LISTANDO OS ARQUIVOS NO DIRETORIO DE ORIGEM
arrayArquivos = os.listdir(pastaOrigem)
totalArquivos = len(arrayArquivos)

# CRIANDO UM ARRAY PARA GUARDAR O TEMPO MEDIO PARA PROCESSAR CADA ARQUIVO PARA CADA SNR DIFERENTE
arrayTempoGSCCadaSNR = []

# PARA VARIOS SNRs
for snrAtual in range(-20, 51):
    
    print("\nINICIANDO A SIMULAÇÃO COM SNR", snrAtual)
    
    # TENHO QUE CRIAR A PASTA PARA ESSA SNR
    pastaDestinoSNRAtual = pastaDestino + "SNR_" + str(snrAtual) + "dB/"
    
    # SE ELA JA EXISTIR EU EXCLUO TUDO
    if os.path.isdir(pastaDestinoSNRAtual) == True:
        shutil.rmtree(pastaDestinoSNRAtual)
        print("Já havia uma pasta para os arquivos com essa SNR e portanto ela foi excluída")
        
    # AGORA SIM EU CRIO AS PASTAS E SUBPASTAS
    os.mkdir(pastaDestinoSNRAtual)
    os.mkdir(pastaDestinoSNRAtual + "testeSemBeamforming/")
    os.mkdir(pastaDestinoSNRAtual + "testeBeamforming/")
    os.mkdir(pastaDestinoSNRAtual + "testeGSC/")
    
    # PRECISO CALCULAR QUAL VAI SER A ENERGIA DO RUIDO PARA ESSA SNR
    energiaRuido = calcularEnerigaRuidoDadoSNR(snrAtual, 1)
    
    # ARRAY PARA GUARDAR O TEMPO PARA PROCESSAR O GSC DE CADA ARQUIVO
    arrayTempoGSCCadaArquivoSNRAtual = []
        
    # PARA CADA ARQUIVO NA PASTA DE ORIGEM
    for i, arquivoAtual in enumerate(arrayArquivos):

        print("\nArquivo " + str(i+1) + " de " + str(totalArquivos) + " -> " + str(100*((i+1)/totalArquivos)) + "%")

        # EU SIMULO UM ARRAY DE MICROFONES
        caminhoArquivo = pastaOrigem + arquivoAtual
        objSimularArrayMics = SimularArrayMicrofones(caminhoArquivo, energiaRuido=energiaRuido)
        arraySinaisSimulados, arrayDelays, freqAmostragem = objSimularArrayMics.obterResultado()

        # APLICO O BEAMFORMING E GSC (SEM QUE A CLASSE SAIBA QUAIS SAO OS DELAYS)
        objGSC = GeneralizedSidelobeCanceller(arraySinaisSimulados)
        sinalSemBeamforming, sinalBeamformado, sinalFinalGSC = objGSC.obterSinaisResultantes()
        arrayTempoGSCCadaArquivoSNRAtual.append(objGSC.tempoProcessamentoGSC)

        # E POR FIM SALVO NAS PASTAS DE DESTINO
        librosa.output.write_wav(pastaDestinoSNRAtual + "testeSemBeamforming/" + arquivoAtual, sinalSemBeamforming, freqAmostragem)
        librosa.output.write_wav(pastaDestinoSNRAtual + "testeBeamforming/" + arquivoAtual, sinalBeamformado, freqAmostragem)
        librosa.output.write_wav(pastaDestinoSNRAtual + "testeGSC/" + arquivoAtual, sinalFinalGSC, freqAmostragem)
    
    # DEPOIS DE PROCESSAR TODOS OS ARQUIVOS PARA A SNR ATUAL, EU COLOCO O TEMPO DE PROCESSAMENTO MEDIO NO ARRAY DE TEMPOS DE CADA SNR
    mediaTempoGSCSNRAtual = np.mean(arrayTempoGSCCadaArquivoSNRAtual)
    arrayTempoGSCCadaSNR.append([snrAtual, mediaTempoGSCSNRAtual])
    print("\nTempo médio para processar o GSC em cada arquivo com SNR " + str(snrAtual) + ": " + str(mediaTempoGSCSNRAtual))
    
# DEPOIS QUE ACABAR TUDO, EU PRECISO SALVAR AS INFORMACOES DE TEMPO DE PROCESSAMENTO
dataframe = pd.DataFrame(data=arrayTempoGSCCadaSNR, columns=["SNR", "Tempo médio para processar o GSC em cada arquivo"])
dataframe.to_csv(pastaDestino + "tempoProcessamentoGSC" + str(time.time()) + ".csv", index=False)


INICIANDO A SIMULAÇÃO COM SNR 30

Arquivo 1 de 105 -> 0.9523809523809524%
Iniciando a filtragem adaptativa com LMS
Tempo total gasto para processar o GSC completo (segundos): 0.9862973690032959

Arquivo 2 de 105 -> 1.9047619047619049%
Iniciando a filtragem adaptativa com LMS
Tempo total gasto para processar o GSC completo (segundos): 2.1475257873535156

Arquivo 3 de 105 -> 2.857142857142857%
Iniciando a filtragem adaptativa com LMS
Tempo total gasto para processar o GSC completo (segundos): 1.1950628757476807

Arquivo 4 de 105 -> 3.8095238095238098%
Iniciando a filtragem adaptativa com LMS
Tempo total gasto para processar o GSC completo (segundos): 2.125600576400757

Arquivo 5 de 105 -> 4.761904761904762%
Iniciando a filtragem adaptativa com LMS
Tempo total gasto para processar o GSC completo (segundos): 0.5611011981964111

Arquivo 6 de 105 -> 5.714285714285714%
Iniciando a filtragem adaptativa com LMS
Tempo total gasto para processar o GSC completo (segundos): 1.2507350444793701

Arq

FileNotFoundError: [Errno 2] No such file or directory: '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros/SNR_30dB/testeSemBeamforming/explosion_113.wav'