# Testando a classe de extração de features

Esse jupyter tem o objetivo de testar a classe de extração de features. Ela foi totalmente implementada no jupyter "Implementação de classe para extração de features - SESA Dataset", mas aqui nós vamos testar o arquivo .py que contém a classe.

Para usar a classe é muito simples. Basta ter uma pasta com os arquivos wav que se deseja extrair as features (essa pasta só deve ter arquivos wav, nada mais), e definir os parâmetros iniciais, que são:

1) Frequência de amostragem dos áudios da pasta;

2) O tamanho do janelamento e da sobreposição que se deseja (em qtd de frames, não em segundos);

3) Se deve ser feito o escalonamento das features após a extração (default True);

4) Quantidade de componentes principais do PCA para fazer a redução de dimensinalidade (default None)

Depois disso, basta instânciar um objeto da classe com esses parâmetros que o construtor se encarregará de fazer todo o trabalho. Ao final, haverá um arquivo CSV dentro da pasta em questão.

In [1]:
import sys
sys.path.append('/home/dimi/Programming/IC2019/ML/python')
from extrairFeaturesClass import ExtrairFeatures

In [2]:
import librosa
import os
import time
import warnings
warnings.filterwarnings("ignore")

## Definindo parâmetros iniciais

In [3]:
arrayDuracoes = []

diretorio = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/train/"
for arquivo in os.listdir(diretorio):
    arrayDuracoes.append(librosa.get_duration(filename=diretorio + arquivo))

diretorio = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/"
for arquivo in os.listdir(diretorio):
    arrayDuracoes.append(librosa.get_duration(filename=diretorio + arquivo))

In [4]:
print("Duração mínima:", min(arrayDuracoes))
print("Duração máxima:", max(arrayDuracoes))

Duração mínima: 1.0715625
Duração máxima: 33.030375


In [5]:
audioTesteDir = "/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test/casual_000.wav" 
audioTeste, freqAmostragem = librosa.load(audioTesteDir, sr=None, mono=True)

frameTime     = min(arrayDuracoes)
overlapTime   = frameTime / 2

frameLength   = int(freqAmostragem * frameTime)
overlapLength = int(freqAmostragem * overlapTime)

print("Frequência de amostragem do dataset:\t", freqAmostragem)
print("Tamanho do janelamento (segundos):\t", frameTime)
print("Tamanho do janelamento (amostras):\t", frameLength)
print("Tamanho da sobreposição (amostras):\t", overlapLength)

Frequência de amostragem do dataset:	 16000
Tamanho do janelamento (segundos):	 1.0715625
Tamanho do janelamento (amostras):	 17145
Tamanho da sobreposição (amostras):	 8572


## Rodando a extração de features

Como definido no momento em que a classes estava sendo criada, frameLength é o tamanho do menor áudio do dataset, overlapLength é a metade do frameLength.

In [6]:
# ## DEFININDO PARAMETROS INICIAIS
# pastaRaiz      = '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/outros/'
# freqAmostragem = 16000
# frameLength    = 17145
# overlapLength  = 8572
# escalonamento  = True
# nDimensoes     = None

# # EXTRAINDO DE TODAS AS PASTAS DE SNR
# for snrAtual in range(-10, 0):
    
#     print("\n\nINICIANDO A EXTRAÇÃO SNR", snrAtual)
    
#     # CRIANDO O CAMINHO PARA A PASTA DE SNR ATUAL
#     pastaSNRAtual = pastaRaiz + "SNR_" + str(snrAtual) + "dB/"

#     # EXTRAINDO SEM BEAMFORMING, COM BEAMFORMING E GSC
#     ExtrairFeatures(pastaSNRAtual + "testeSemBeamforming/", freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)
#     ExtrairFeatures(pastaSNRAtual + "testeBeamforming/", freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)
#     ExtrairFeatures(pastaSNRAtual + "testeGSC/", freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)

Extraindo features da pasta de treino com data augmentation

In [3]:
%%time

## DEFININDO PARAMETROS INICIAIS
pastaRaiz      = '/home/dimi/Downloads/Datasets/SESA/SESA_Normalizado/test_augmentation/'
freqAmostragem = 16000
frameLength    = 17145
overlapLength  = 8572
escalonamento  = True
nDimensoes     = None

ExtrairFeatures(pastaRaiz, freqAmostragem, frameLength, overlapLength, escalonamento, nDimensoes)

Extraindo features do arquivo 1 de 1050 -> 0.09523809523809523%
Extraindo features do arquivo 2 de 1050 -> 0.19047619047619047%
Extraindo features do arquivo 3 de 1050 -> 0.2857142857142857%
Extraindo features do arquivo 4 de 1050 -> 0.38095238095238093%
Extraindo features do arquivo 5 de 1050 -> 0.4761904761904762%
Extraindo features do arquivo 6 de 1050 -> 0.5714285714285714%
Extraindo features do arquivo 7 de 1050 -> 0.6666666666666667%
Extraindo features do arquivo 8 de 1050 -> 0.7619047619047619%
Extraindo features do arquivo 9 de 1050 -> 0.8571428571428572%
Extraindo features do arquivo 10 de 1050 -> 0.9523809523809524%
Extraindo features do arquivo 11 de 1050 -> 1.0476190476190477%
Extraindo features do arquivo 12 de 1050 -> 1.1428571428571428%
Extraindo features do arquivo 13 de 1050 -> 1.2380952380952381%
Extraindo features do arquivo 14 de 1050 -> 1.3333333333333335%
Extraindo features do arquivo 15 de 1050 -> 1.4285714285714286%
Extraindo features do arquivo 16 de 1050 -> 1.

Extraindo features do arquivo 131 de 1050 -> 12.476190476190476%
Extraindo features do arquivo 132 de 1050 -> 12.571428571428573%
Extraindo features do arquivo 133 de 1050 -> 12.666666666666668%
Extraindo features do arquivo 134 de 1050 -> 12.761904761904763%
Extraindo features do arquivo 135 de 1050 -> 12.857142857142856%
Extraindo features do arquivo 136 de 1050 -> 12.95238095238095%
Extraindo features do arquivo 137 de 1050 -> 13.047619047619047%
Extraindo features do arquivo 138 de 1050 -> 13.142857142857142%
Extraindo features do arquivo 139 de 1050 -> 13.238095238095237%
Extraindo features do arquivo 140 de 1050 -> 13.333333333333334%
Extraindo features do arquivo 141 de 1050 -> 13.428571428571429%
Extraindo features do arquivo 142 de 1050 -> 13.523809523809524%
Extraindo features do arquivo 143 de 1050 -> 13.61904761904762%
Extraindo features do arquivo 144 de 1050 -> 13.714285714285715%
Extraindo features do arquivo 145 de 1050 -> 13.80952380952381%
Extraindo features do arquiv

Extraindo features do arquivo 259 de 1050 -> 24.666666666666668%
Extraindo features do arquivo 260 de 1050 -> 24.761904761904763%
Extraindo features do arquivo 261 de 1050 -> 24.857142857142858%
Extraindo features do arquivo 262 de 1050 -> 24.952380952380953%
Extraindo features do arquivo 263 de 1050 -> 25.047619047619047%
Extraindo features do arquivo 264 de 1050 -> 25.142857142857146%
Extraindo features do arquivo 265 de 1050 -> 25.238095238095237%
Extraindo features do arquivo 266 de 1050 -> 25.333333333333336%
Extraindo features do arquivo 267 de 1050 -> 25.428571428571427%
Extraindo features do arquivo 268 de 1050 -> 25.523809523809526%
Extraindo features do arquivo 269 de 1050 -> 25.61904761904762%
Extraindo features do arquivo 270 de 1050 -> 25.71428571428571%
Extraindo features do arquivo 271 de 1050 -> 25.80952380952381%
Extraindo features do arquivo 272 de 1050 -> 25.9047619047619%
Extraindo features do arquivo 273 de 1050 -> 26.0%
Extraindo features do arquivo 274 de 1050 ->

Extraindo features do arquivo 387 de 1050 -> 36.857142857142854%
Extraindo features do arquivo 388 de 1050 -> 36.952380952380956%
Extraindo features do arquivo 389 de 1050 -> 37.047619047619044%
Extraindo features do arquivo 390 de 1050 -> 37.142857142857146%
Extraindo features do arquivo 391 de 1050 -> 37.238095238095234%
Extraindo features do arquivo 392 de 1050 -> 37.333333333333336%
Extraindo features do arquivo 393 de 1050 -> 37.42857142857143%
Extraindo features do arquivo 394 de 1050 -> 37.523809523809526%
Extraindo features do arquivo 395 de 1050 -> 37.61904761904762%
Extraindo features do arquivo 396 de 1050 -> 37.714285714285715%
Extraindo features do arquivo 397 de 1050 -> 37.80952380952381%
Extraindo features do arquivo 398 de 1050 -> 37.904761904761905%
Extraindo features do arquivo 399 de 1050 -> 38.0%
Extraindo features do arquivo 400 de 1050 -> 38.095238095238095%
Extraindo features do arquivo 401 de 1050 -> 38.19047619047619%
Extraindo features do arquivo 402 de 1050 -

Extraindo features do arquivo 516 de 1050 -> 49.142857142857146%
Extraindo features do arquivo 517 de 1050 -> 49.238095238095234%
Extraindo features do arquivo 518 de 1050 -> 49.333333333333336%
Extraindo features do arquivo 519 de 1050 -> 49.42857142857143%
Extraindo features do arquivo 520 de 1050 -> 49.523809523809526%
Extraindo features do arquivo 521 de 1050 -> 49.61904761904762%
Extraindo features do arquivo 522 de 1050 -> 49.714285714285715%
Extraindo features do arquivo 523 de 1050 -> 49.80952380952381%
Extraindo features do arquivo 524 de 1050 -> 49.904761904761905%
Extraindo features do arquivo 525 de 1050 -> 50.0%
Extraindo features do arquivo 526 de 1050 -> 50.095238095238095%
Extraindo features do arquivo 527 de 1050 -> 50.19047619047618%
Extraindo features do arquivo 528 de 1050 -> 50.28571428571429%
Extraindo features do arquivo 529 de 1050 -> 50.38095238095238%
Extraindo features do arquivo 530 de 1050 -> 50.476190476190474%
Extraindo features do arquivo 531 de 1050 -> 

Extraindo features do arquivo 645 de 1050 -> 61.42857142857143%
Extraindo features do arquivo 646 de 1050 -> 61.523809523809526%
Extraindo features do arquivo 647 de 1050 -> 61.61904761904762%
Extraindo features do arquivo 648 de 1050 -> 61.71428571428571%
Extraindo features do arquivo 649 de 1050 -> 61.80952380952382%
Extraindo features do arquivo 650 de 1050 -> 61.904761904761905%
Extraindo features do arquivo 651 de 1050 -> 62.0%
Extraindo features do arquivo 652 de 1050 -> 62.095238095238095%
Extraindo features do arquivo 653 de 1050 -> 62.1904761904762%
Extraindo features do arquivo 654 de 1050 -> 62.28571428571429%
Extraindo features do arquivo 655 de 1050 -> 62.38095238095238%
Extraindo features do arquivo 656 de 1050 -> 62.476190476190474%
Extraindo features do arquivo 657 de 1050 -> 62.57142857142857%
Extraindo features do arquivo 658 de 1050 -> 62.66666666666667%
Extraindo features do arquivo 659 de 1050 -> 62.761904761904766%
Extraindo features do arquivo 660 de 1050 -> 62.8

Extraindo features do arquivo 775 de 1050 -> 73.80952380952381%
Extraindo features do arquivo 776 de 1050 -> 73.90476190476191%
Extraindo features do arquivo 777 de 1050 -> 74.0%
Extraindo features do arquivo 778 de 1050 -> 74.09523809523809%
Extraindo features do arquivo 779 de 1050 -> 74.19047619047619%
Extraindo features do arquivo 780 de 1050 -> 74.28571428571429%
Extraindo features do arquivo 781 de 1050 -> 74.38095238095238%
Extraindo features do arquivo 782 de 1050 -> 74.47619047619047%
Extraindo features do arquivo 783 de 1050 -> 74.57142857142857%
Extraindo features do arquivo 784 de 1050 -> 74.66666666666667%
Extraindo features do arquivo 785 de 1050 -> 74.76190476190476%
Extraindo features do arquivo 786 de 1050 -> 74.85714285714286%
Extraindo features do arquivo 787 de 1050 -> 74.95238095238095%
Extraindo features do arquivo 788 de 1050 -> 75.04761904761905%
Extraindo features do arquivo 789 de 1050 -> 75.14285714285714%
Extraindo features do arquivo 790 de 1050 -> 75.23809

Extraindo features do arquivo 905 de 1050 -> 86.19047619047619%
Extraindo features do arquivo 906 de 1050 -> 86.28571428571429%
Extraindo features do arquivo 907 de 1050 -> 86.38095238095238%
Extraindo features do arquivo 908 de 1050 -> 86.47619047619047%
Extraindo features do arquivo 909 de 1050 -> 86.57142857142858%
Extraindo features do arquivo 910 de 1050 -> 86.66666666666667%
Extraindo features do arquivo 911 de 1050 -> 86.76190476190476%
Extraindo features do arquivo 912 de 1050 -> 86.85714285714286%
Extraindo features do arquivo 913 de 1050 -> 86.95238095238095%
Extraindo features do arquivo 914 de 1050 -> 87.04761904761905%
Extraindo features do arquivo 915 de 1050 -> 87.14285714285714%
Extraindo features do arquivo 916 de 1050 -> 87.23809523809524%
Extraindo features do arquivo 917 de 1050 -> 87.33333333333333%
Extraindo features do arquivo 918 de 1050 -> 87.42857142857143%
Extraindo features do arquivo 919 de 1050 -> 87.52380952380953%
Extraindo features do arquivo 920 de 105

Extraindo features do arquivo 1034 de 1050 -> 98.47619047619047%
Extraindo features do arquivo 1035 de 1050 -> 98.57142857142858%
Extraindo features do arquivo 1036 de 1050 -> 98.66666666666667%
Extraindo features do arquivo 1037 de 1050 -> 98.76190476190476%
Extraindo features do arquivo 1038 de 1050 -> 98.85714285714286%
Extraindo features do arquivo 1039 de 1050 -> 98.95238095238095%
Extraindo features do arquivo 1040 de 1050 -> 99.04761904761905%
Extraindo features do arquivo 1041 de 1050 -> 99.14285714285714%
Extraindo features do arquivo 1042 de 1050 -> 99.23809523809524%
Extraindo features do arquivo 1043 de 1050 -> 99.33333333333333%
Extraindo features do arquivo 1044 de 1050 -> 99.42857142857143%
Extraindo features do arquivo 1045 de 1050 -> 99.52380952380952%
Extraindo features do arquivo 1046 de 1050 -> 99.61904761904762%
Extraindo features do arquivo 1047 de 1050 -> 99.71428571428571%
Extraindo features do arquivo 1048 de 1050 -> 99.80952380952381%
Extraindo features do arq