## Testes Iniciais

In [2]:
import csv
import os
import librosa
import numpy
import soundfile
from IPython.display import Audio
from scipy.stats import skew, kurtosis

In [3]:
y, sr = librosa.load("conversoes/8bits/8k/fold1/102106-3-0-0.wav")

In [4]:
Audio(data=y, rate=sr)

### Extração de Features

- Coeficientes Mel-Cepstrais (MFCC)

- Potência Eficaz (RMS)

- Centroide Espectral

- Largura Espectral

- Contraste Espectral

- Planicidade Espectral

- Rolloff Espectral

- Taxa de Cruzamentos por Zero

In [5]:
def melGibson(y, sr):
    melGibson = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13)
    mfcc = []

    for linha in melGibson:
        mfcc.append(numpy.mean(linha))

    return mfcc

In [6]:
def mediaRMS(y):
    return numpy.mean(librosa.feature.rms(y=y))

In [7]:
def centroideEspectral(y, sr):
    return numpy.mean(librosa.feature.spectral_centroid(y=y, sr=sr))

In [8]:
def larguraEspectral(y, sr):
    return numpy.mean(librosa.feature.spectral_bandwidth(y=y, sr=sr))

In [9]:
def contrasteEspectral(y, sr):
    array_contrastes = []
    fmin = 0.5 * sr * 2**(-6)
    
    S = numpy.abs(librosa.stft(y))
    spectral_contrast = librosa.feature.spectral_contrast(S=S, sr=sr, fmin=fmin)
    
    for linha in spectral_contrast:
        array_contrastes.append(numpy.mean(linha))
        
    return array_contrastes

In [10]:
def planicidadeEspectral(y): 
    return numpy.mean(librosa.feature.spectral_flatness(y=y))

In [11]:
def rolloff(y, sr):
    return numpy.mean( librosa.feature.spectral_rolloff(y=y, sr=sr))

In [12]:
def cruzamentosZero(y):
    return numpy.mean(librosa.feature.zero_crossing_rate(y))

In [14]:
def assimetria(y):
    return skew(y)

In [16]:
def curtose(y):
    return kurtosis(y)

In [18]:
def variancia(y):
    return numpy.var(y)

In [13]:
# DEFININDO ONDE SERA FEITA A EXTRACAO DE FEATURES
profundidadeBits = "8bits"
freqAmostragem = 8

# ABRINDO O CSV COM OS NOMES DOS AUDIOS
with open("metadata/UrbanSound8K.csv") as metadata:
    objReadCSV = csv.reader(metadata, delimiter=',')
    next(objReadCSV)
    
    # ABRINDO O CSV ONDE FICARAO AS FEATURES
    caminhoCSV = "conversoes/"
    caminhoCSV += profundidadeBits
    caminhoCSV += "/"
    caminhoCSV += str(freqAmostragem) + "k"
    caminhoCSV += "/features_"
    caminhoCSV += profundidadeBits
    caminhoCSV += "_"
    caminhoCSV += str(freqAmostragem) + "k"
    caminhoCSV += ".csv"
    
    os.remove(caminhoCSV)
    
    with open(caminhoCSV, 'a') as csvFeatures:
        objWriteCSV = csv.writer(csvFeatures)
        
        # ESCREVENDO O CABEÇALHO DO CSV
        cabecalho = []
        cabecalho.append("pasta")
        cabecalho.append("arquivo")
        cabecalho.append("mfcc0")
        cabecalho.append("mfcc1")
        cabecalho.append("mfcc2")
        cabecalho.append("mfcc3")
        cabecalho.append("mfcc4")
        cabecalho.append("mfcc5")
        cabecalho.append("mfcc6")
        cabecalho.append("mfcc7")
        cabecalho.append("mfcc8")
        cabecalho.append("mfcc9")
        cabecalho.append("mfcc10")
        cabecalho.append("mfcc11")
        cabecalho.append("mfcc12")
        cabecalho.append("rms")
        cabecalho.append("centroide")
        cabecalho.append("largura")
        cabecalho.append("contraste0")
        cabecalho.append("contraste1")
        cabecalho.append("contraste2")
        cabecalho.append("contraste3")
        cabecalho.append("contraste4")
        cabecalho.append("contraste5")
        cabecalho.append("contraste6")
        cabecalho.append("planicidade")
        cabecalho.append("rolloff")
        cabecalho.append("zcr")
        cabecalho.append("classe")
        
        objWriteCSV.writerow(cabecalho)
    
        # PRA CADA AUDIO EU VERIFICO SE E DA PASTA QUE EU QUERO
        for audio in objReadCSV:
            if audio[6] != '0' and audio[6] != '2':

                # PEGANDO O NOME DO ARQUIVO E A CLASSE ATRIBUIDA
                arquivo = "conversoes/"
                arquivo += profundidadeBits
                arquivo += "/"
                arquivo += str(freqAmostragem) + "k"
                arquivo += "/"
                arquivo += "fold"
                arquivo += audio[5]
                arquivo += "/"
                arquivo += audio[0]
                
                classe = audio[6]
                
                print("Abrindo o arquivo", arquivo)
                
                # ABRINDO O AUDIO ATUAL
                y, sr = librosa.load(arquivo, sr=freqAmostragem*1000)

                # EXTRAINDO AS FEATURES
                arrayFeatures = []
                
                arrayFeatures.append(audio[5])
                arrayFeatures.append(audio[0])
                arrayFeatures += melGibson(y, sr)
                arrayFeatures.append(mediaRMS(y))
                arrayFeatures.append(centroideEspectral(y, sr))
                arrayFeatures.append(larguraEspectral(y, sr))
                arrayFeatures += contrasteEspectral(y, sr)
                arrayFeatures.append(planicidadeEspectral(y))
                arrayFeatures.append(rolloff(y, sr))
                arrayFeatures.append(cruzamentosZero(y))
                arrayFeatures.append(classe)
                
                arrayFeatures = numpy.array(arrayFeatures)
                
                objWriteCSV.writerow(arrayFeatures)

Abrindo o arquivo conversoes/8bits/8k/fold5/100032-3-0-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100648-1-0-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100648-1-1-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100648-1-2-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100648-1-3-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100648-1-4-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold2/100652-3-0-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold2/100652-3-0-1.wav
Abrindo o arquivo conversoes/8bits/8k/fold2/100652-3-0-2.wav
Abrindo o arquivo conversoes/8bits/8k/fold2/100652-3-0-3.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100795-3-0-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100795-3-1-0.wav
Abrindo o arquivo conversoes/8bits/8k/fold10/100795-3-1-1.wav


KeyboardInterrupt: 