# Testando a classe de extração de features

Esse jupyter tem o objetivo de testar a classe de extração de features. Ela foi totalmente implementada no jupyter "Implementação de classe para extração de features - SESA Dataset", mas aqui nós vamos testar o arquivo .py que contém a classe.

Para usar a classe é muito simples. Basta ter uma pasta com os arquivos wav que se deseja extrair as features (essa pasta só deve ter arquivos wav, nada mais), e definir os parâmetros iniciais, que são:

1) Frequência de amostragem dos áudios da pasta;

2) O tamanho do janelamento e da sobreposição que se deseja (em qtd de frames, não em segundos);

3) Se deve ser feito o escalonamento das features após a extração (default True);

4) Quantidade de componentes principais do PCA para fazer a redução de dimensinalidade (default None)

Depois disso, basta instânciar um objeto da classe com esses parâmetros que o construtor se encarregará de fazer todo o trabalho. Ao final, haverá um arquivo CSV dentro da pasta em questão.

In [1]:
import sys
sys.path.append('/home/dimi/Programming/IC2019/ML/python')
from extrairFeaturesClass import ExtrairFeatures

In [7]:
import librosa
import os
import warnings
warnings.filterwarnings("ignore")

## Definindo parâmetros iniciais

In [10]:
arrayDuracoes = []

diretorio = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/train/"
for arquivo in os.listdir(diretorio):
    arrayDuracoes.append(librosa.get_duration(filename=diretorio + arquivo))

diretorio = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/"
for arquivo in os.listdir(diretorio):
    arrayDuracoes.append(librosa.get_duration(filename=diretorio + arquivo))

In [11]:
print("Duração mínima:", min(arrayDuracoes))
print("Duração máxima:", max(arrayDuracoes))

Duração mínima: 1.0715625
Duração máxima: 33.030375


In [13]:
audioTesteDir = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/casual_000.wav" 
audioTeste, freqAmostragem = librosa.load(audioTesteDir, sr=None, mono=True)

frameTime     = min(arrayDuracoes)
overlapTime   = frameTime / 2

frameLength   = int(freqAmostragem * frameTime)
overlapLength = int(freqAmostragem * overlapTime)

print("Frequência de amostragem do dataset:\t", freqAmostragem)
print("Tamanho do janelamento (segundos):\t", frameTime)
print("Tamanho do janelamento (amostras):\t", frameLength)
print("Tamanho da sobreposição (amostras):\t", overlapLength)

Frequência de amostragem do dataset:	 16000
Tamanho do janelamento (segundos):	 1.0715625
Tamanho do janelamento (amostras):	 17145
Tamanho da sobreposição (amostras):	 8572


## Rodando a extração de features

Como definido no momento em que a classes estava sendo criada, frameLength é o tamanho do menor áudio do dataset, overlapLength é a metade do frameLength.

In [15]:
# DEFININDO PARAMETROS INICIAIS
pastaRaiz      = '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros/'
freqAmostragem = 16000
frameLength    = 17145
overlapLength  = 8572
escalonamento  = True
nDimensoes     = None

# EXTRAINDO DE TODAS AS PASTAS DE SNR
for snrAtual in range(30, -1, -1):
    
    # CRIANDO O CAMINHO PARA A PASTA DE SNR ATUAL
    pastaSNRAtual = pastaRaiz + "SNR_" + str(snrAtual) + "dB/"

    # EXTRAINDO SEM BEAMFORMING, COM BEAMFORMING E GSC
    ExtrairFeatures(pastaSNRAtual + "testeSemBeamforming/", freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)
    ExtrairFeatures(pastaSNRAtual + "testeBeamforming/", freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)
    ExtrairFeatures(pastaSNRAtual + "testeGSC/", freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)

Extraindo features do arquivo 1 de 3 -> 33.33333333333333%
Extraindo features do arquivo 2 de 3 -> 66.66666666666666%
Extraindo features do arquivo 3 de 3 -> 100.0%
Escalonando features
Escrevendo CSV: /home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros_aaa/SNR_30dB/testeSemBeamforming/1581542273.5953774.csv
Operação finalizada
Extraindo features do arquivo 1 de 3 -> 33.33333333333333%
Extraindo features do arquivo 2 de 3 -> 66.66666666666666%
Extraindo features do arquivo 3 de 3 -> 100.0%
Escalonando features
Escrevendo CSV: /home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros_aaa/SNR_30dB/testeBeamforming/1581542278.2009938.csv
Operação finalizada
Extraindo features do arquivo 1 de 3 -> 33.33333333333333%
Extraindo features do arquivo 2 de 3 -> 66.66666666666666%
Extraindo features do arquivo 3 de 3 -> 100.0%
Escalonando features
Escrevendo CSV: /home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros_aaa/SNR_30dB/testeGSC/1581542282.7730138.csv
Operação finalizada
Ext

FileNotFoundError: [Errno 2] No such file or directory: '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros_aaa/SNR_27dB/testeSemBeamforming/'