# LINEAR DISCRIMINANT ANALYSIS

##### EXPERIMENTO I (TESTE ORIGINAL)

treinamento original       / teste original

treinamento original+ruido / teste original

treinamento original+pitch / teste original

treinamento original+tempo / teste original

treinamento original+veloc / teste original

treinamento completo       / teste original

##### EXPERIMENTO II (TESTE COM EFEITO IDENTICO AO TREINAMENTO)

treinamento original       / teste original

treinamento original+ruido / teste original+ruido

treinamento original+pitch / teste original+pitch

treinamento original+tempo / teste original+tempo

treinamento original+veloc / teste original+veloc

treinamento completo       / teste completo

##### EXPERIMENTO III (TESTE COMPLETO)

treinamento original       / teste completo

treinamento original+ruido / teste completo

treinamento original+pitch / teste completo

treinamento original+tempo / teste completo

treinamento original+veloc / teste completo

treinamento completo       / teste completo

## Importações

In [None]:
import pandas as pd
import numpy as np
import os
import matplotlib.pyplot as plt
from sklearn.utils import shuffle
from sklearn.model_selection import GridSearchCV, GroupKFold
from sklearn.metrics import accuracy_score
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

In [None]:
%matplotlib inline
%config InlineBackend.figure_format = 'svg'
params = {
    'figure.figsize': [11, 5.5], 
    'axes.labelsize': 18,
    'axes.titlesize': 20, 
    'font.size': 18,
    'legend.fontsize': 14, 
    'xtick.labelsize': 12, 
    'ytick.labelsize': 12,
    'axes.axisbelow': True
}
plt.rcParams.update(params)

## Parâmetros Iniciais

In [None]:
# NOME DO CLASSIFICADOR (APENAS PARA FINS DE NOMEACAO DE ARQUIVOS)
nomeClassificador = "LDA"

# VAMOS FAZER UM BOOTSTRAP COM qtdIteracoesCV HOLDOUTS NO TESTE E UM KFOLD NO TREINAMENTO COM qtdIteracoesCV PASTAS
qtdIteracoesCV = 5

# PERCENTUAL DE DADOS DO DATASET DE TESTE PRA USAR EM CADA ITERACAO NA ETAPA DE TESTEEEE
percentualTeste = 2/3

# PARAMETROS PRA TESTAR NO GRIDSEARCH
parametrosGrid = [{
    'solver': ['svd', 'lsqr', 'eigen'],
    'tol': [1e-5, 1e-4, 1e-3]
}]

# # RODAR AS LINHAS ABAIXO APENAS PARA TESTES RAPIDOS
# parametrosGrid = [{ # apenas testes rapidos
#     'solver': ['svd'], # apenas testes rapidos
#     'tol': [1e-4] # apenas testes rapidos
# }] # apenas testes rapidos

## Função para ajustar os CSVs

Os únicos CSVs que a gnt vai abrir são os completaços, que tem todos os áudios originais e efeitos juntos. Eventualmente a gnt vai preceisar separar pra ficar apenas com os efeitos que a gnt quer. 

Essa função recebe um dataframe pandas e retorna o que é data, target e tal...

In [None]:
def ajustarDataset(dataframe, efeitosDesejados):
    
    if not efeitosDesejados in ["original", "original+ruido", "original+pitch", "original+tempo", "original+velocidade", "completo"]:
        print("Escolha dentre os seguintes efeitos: original, original+ruido, original+pitch, original+tempo, original+velocidade ou completo!")
        return None, None, None
    
    else:
        if efeitosDesejados == "original":
            dataframeAjustado = dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)]
        elif efeitosDesejados == "original+ruido":
            dataframeAjustado = pd.concat([dataframe.loc[(dataframe['ruido']==1)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)], dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)]], ignore_index=True)
        elif efeitosDesejados == "original+pitch":
            dataframeAjustado = pd.concat([dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==1)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)], dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)]], ignore_index=True)
        elif efeitosDesejados == "original+tempo":
            dataframeAjustado = pd.concat([dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==1)&(dataframe['velocidade']==0)], dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)]], ignore_index=True)
        elif efeitosDesejados == "original+velocidade":
            dataframeAjustado = pd.concat([dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==1)], dataframe.loc[(dataframe['ruido']==0)&(dataframe['pitch']==0)&(dataframe['tempo']==0)&(dataframe['velocidade']==0)]], ignore_index=True)
        else:
            dataframeAjustado = dataframe
            
        # SEPARO O QUE E O QUE
        data   = dataframeAjustado.iloc[:, 5:-1].to_numpy()
        target = dataframeAjustado.iloc[:, -1].to_numpy()
        groups = dataframeAjustado.iloc[:, 0].to_numpy()
        
        # VAMS DAR UMA EMBARALHADINHA E TAL
        data, target, groups = shuffle(data, target, groups)
        
        return data, target, groups

## Abrindo os CSV completos

Vamos abrir o CSV de treinamento completo e o de teste completo, os que já contém todos os efeitos.

In [None]:
dfTreinamento = pd.read_csv("datasets/dataset_treinamento_completo.csv")
dfTeste       = pd.read_csv("datasets/dataset_teste_completo.csv")

print(dfTreinamento.shape)
print(dfTeste.shape)

## Gridsearch para cada dataset de treinamento

##### GRIDSEARCHS:
	treinamento original
	treinamento original+ruido
	treinamento original+pitch
	treinamento original+tempo
	treinamento original+veloc
	treinamento original+ruido+pitch+tempo+veloc

In [None]:
arrayEfeitosDesejados = ["original", "original+ruido", "original+pitch", "original+tempo", "original+velocidade", "completo"]

# ARRAYS DE RESULTADOS PARA CADA DATASET
arrayAcuraciaMediaCadaDatasetTreinamento = []
arrayDesvioPadraoCadaDatasetTreinamento  = [] 
arrayMelhorModeloCadaDatasetTreinamento  = []

# PRA CADA DATASET
for efeitosDesejados in arrayEfeitosDesejados:
    
    print("TESTANDO COM O DATASET DE TREINAMENTO", efeitosDesejados.upper())
    
    # SEPARANDO DATA, TARGET E GRUPOS (grupos eh pras janelas de um mesmo audio sempre cairem na mesma pasta do kfold)
    data, target, groups = ajustarDataset(dfTreinamento, efeitosDesejados)
    
    # AJUSTANDO O GRIDSEARCH
    objGS = GridSearchCV(
        LinearDiscriminantAnalysis(),
        parametrosGrid,
        verbose=10,
        cv=GroupKFold(n_splits=qtdIteracoesCV+1).split(data, target, groups),
        n_jobs=-1,
        scoring='accuracy'
    )
    
    # RODANDO O GRIDSEARCH
    objGS.fit(X=data, y=target, groups=groups)
    
    # OBTENDO OS RESULTADOS
    arrayAcuraciaMediaCadaDatasetTreinamento.append(objGS.cv_results_["mean_test_score"][objGS.best_index_])
    arrayDesvioPadraoCadaDatasetTreinamento.append(objGS.cv_results_["std_test_score"][objGS.best_index_])
    arrayMelhorModeloCadaDatasetTreinamento.append(objGS.best_estimator_)
    
print("TODOS OS TESTES FORAM FINALIZADOS")

## Salvando o resultado dos gridsearchs

In [None]:
# ABRINDO O ARQUIVO TXT
arquivoResultados = "resultados/" + nomeClassificador + "_Resultados.txt"
if os.path.exists(arquivoResultados):
    os.remove(arquivoResultados)
objFile = open(arquivoResultados, "a")

# ESCREVENDO O CABECALHO
objFile.write("RESULTADOS DO GRIDSEARCH PARA O CLASSIFICADOR " + nomeClassificador + "\n")

# ESCREVENDO O RESULTADO DE CADA COMBINACAO DE EFEITOS
for efeitos, acuraciaMediaMelhorModelo, desvioPadraoMelhorModelo, melhorModelo in zip(arrayEfeitosDesejados, arrayAcuraciaMediaCadaDatasetTreinamento, arrayDesvioPadraoCadaDatasetTreinamento, arrayMelhorModeloCadaDatasetTreinamento):
    string  = "-----------------------------------------------------------------------------------\n"
    string += "GRIDSEARCH PARA O DATASET DE TREINAMENTO " + efeitos.upper() + ":\n"    
    string += "MELHOR MODELO: " + str(melhorModelo).replace("\n", "").replace(" ", "") + "\n"
    string += "ACURÁCIA MÉDIA DO MELHOR MODELO: " + str(acuraciaMediaMelhorModelo) + " +- " + str(desvioPadraoMelhorModelo) + "\n"
    objFile.write(string)
objFile.write("-----------------------------------------------------------------------------------\n\n\n\n")

# FECHANDO
objFile.close()    

In [None]:
paleta = ["#99ddff", "#80d4ff", "#66ccff", "#4dc3ff", "#33bbff", "#1ab2ff"]
ticksEfeitos = []

for i, (efeitos, acuraciaAtual, desvioAtual, corAtual) in enumerate(zip(arrayEfeitosDesejados, arrayAcuraciaMediaCadaDatasetTreinamento, arrayDesvioPadraoCadaDatasetTreinamento, paleta)):
    
    plt.bar(i+1, acuraciaAtual, color=corAtual)
    plt.errorbar(i+1, acuraciaAtual, yerr=desvioAtual, capsize=2, color="#ff0066")
    
    if efeitos == "original":
        ticksEfeitos.append("Original")
    elif efeitos == "original+ruido":
        ticksEfeitos.append("Original +\nRuído Branco")
    elif efeitos == "original+pitch":
        ticksEfeitos.append("Original +\nPitch Shift")
    elif efeitos == "original+tempo":
        ticksEfeitos.append("Original +\nDesl. Temp.")
    elif efeitos == "original+velocidade":
        ticksEfeitos.append("Original +\nVeloc. Repro.")
    else:
        ticksEfeitos.append("Completo")
    

plt.title(nomeClassificador + " - Gridsearch")
plt.ylabel("Acurácia de Treinamento")
plt.xlabel("Dataset de Treinamento")
plt.ylim(min(arrayAcuraciaMediaCadaDatasetTreinamento)-max(arrayDesvioPadraoCadaDatasetTreinamento)-0.02, max(arrayAcuraciaMediaCadaDatasetTreinamento)+max(arrayDesvioPadraoCadaDatasetTreinamento)+0.02)
plt.xticks(range(1, len(ticksEfeitos)+1), ticksEfeitos)
plt.grid(alpha=0.5)

plt.savefig("resultados/"+nomeClassificador+"_Gridsearch.pdf", format='pdf', bbox_inches = 'tight')
plt.show()

# EXPERIMENTO I (TESTE ORIGINAL)

treinamento original       / teste original

treinamento original+ruido / teste original

treinamento original+pitch / teste original

treinamento original+tempo / teste original

treinamento original+veloc / teste original

treinamento completo       / teste original

In [None]:
matrizAcuraciasExpI = [] # CADA LINHA UM EFEITO DIFERENTE, CADA COLUNA UM HOLDOUT

# DATASET DE TESTE SEMPRE ORIGINAL NESSE EXPERIMENTO
xTest, yTest, __   = ajustarDataset(dfTeste, "original")

for i, efeitoAtual in enumerate(arrayEfeitosDesejados):
    
    print("\nINICIANDO O TESTE COM O EFEITO", efeitoAtual.upper())

    # ABRINDO O DATASET DE TREINAMENTO PARA SEPARAR X E Y
    xTrain, yTrain, __ = ajustarDataset(dfTreinamento, efeitoAtual)

    # SELECIONANDO O MELHOR MODELO DE TREINAMENTO DE ACORDO COM OS RESULTADOS DO GRIDSEARCH
    modeloTop = arrayMelhorModeloCadaDatasetTreinamento[i]

    # AJUSTANDO A STRING DO MODELO ATUAL
    modeloTop = str(modeloTop).replace("\n", "").replace(" ", "")

    # SE DER PRA POR N_JOBS=-1 A GNT BOTA
    parametrosModeloTop = modeloTop.split(",")
    for j, parametroAtual in enumerate(parametrosModeloTop):
        if "n_jobs" in parametroAtual:
            parametrosModeloTop[j] = "n_jobs=-1"
    modeloTop = ','.join(parametrosModeloTop)

    # CRIANDO OS ARRAY DE ACURACIAS QUE VAI GUARDAR CADA ACURACIA DO CROSS VALIDATION
    arrayAcuraciasExpI = []

    # ITERANDO O CROSS VALIDATION
    for i in range(1, qtdIteracoesCV + 1):

        # DANDO UM SHUFFLE NOS DADOS DE TESTE
        xTest, yTest = shuffle(xTest, yTest)
        xTestAtual = xTest[:int(percentualTeste*len(xTest))]
        yTestAtual = yTest[:int(percentualTeste*len(yTest))]

        # CRIANDO, TREINANDO E PREDIZENDO O MODELO       
        objClassificador = eval(modeloTop)
        objClassificador.fit(xTrain, yTrain)
        yPred  = objClassificador.predict(xTestAtual)
        arrayAcuraciasExpI.append(accuracy_score(yTestAtual, yPred))

        # PRINTANDO O PROGRESSO
        print(str(100*(i/qtdIteracoesCV))+"%", end=" ")
        
    # COLOCANDO A LINHA NOVA NA MATRIZ
    matrizAcuraciasExpI.append(arrayAcuraciasExpI)

print("\nTODOS OS TESTES FORAM FINALIZADOS")
print(matrizAcuraciasExpI)

#### Salvando os resultados

In [None]:
# ABRINDO O ARQUIVO TXT
objFile = open(arquivoResultados, "a")

# ESCREVENDO
objFile.write("-----------------------------------------------------------------------------------\n")
objFile.write("RESULTADOS DO EXPERIMENTO I (TESTE ORIGINAL)\n")
for efeitoAtual, acuraciasEfeitoAtual in zip(arrayEfeitosDesejados, matrizAcuraciasExpI):
    objFile.write("ACURÁCIA MÉDIA (TREINAMENTO " + efeitoAtual.upper() + "): " + str(np.mean(acuraciasEfeitoAtual)) + " +- " + str(np.std(acuraciasEfeitoAtual))+ "\n")
objFile.write("-----------------------------------------------------------------------------------\n\n\n\n")

# FECHANDO
objFile.close()    

In [None]:
paleta = ["#99ddff", "#80d4ff", "#66ccff", "#4dc3ff", "#33bbff", "#1ab2ff"]
ticksEfeitos = []

for i, (efeitos, arrayAcuraciasEfeitoAtual, corAtual) in enumerate(zip(arrayEfeitosDesejados, matrizAcuraciasExpI, paleta)):
    
    plt.bar(i+1, np.mean(arrayAcuraciasEfeitoAtual), color=corAtual)
    plt.errorbar(i+1, np.mean(arrayAcuraciasEfeitoAtual), yerr=np.std(arrayAcuraciasEfeitoAtual), capsize=2, color="#ff0066")
    
    if efeitos == "original":
        ticksEfeitos.append("Original")
    elif efeitos == "original+ruido":
        ticksEfeitos.append("Original +\nRuído Branco")
    elif efeitos == "original+pitch":
        ticksEfeitos.append("Original +\nPitch Shift")
    elif efeitos == "original+tempo":
        ticksEfeitos.append("Original +\nDesl. Temp.")
    elif efeitos == "original+velocidade":
        ticksEfeitos.append("Original +\nVeloc. Repro.")
    else:
        ticksEfeitos.append("Completo")
    

plt.title(nomeClassificador + " - Experimento I")
plt.ylabel("Acurácia de Teste")
plt.xlabel("Dataset de Treinamento")
plt.ylim(np.amin(matrizAcuraciasExpI)-0.025, np.amax(matrizAcuraciasExpI)+0.025)
plt.xticks(range(1, len(ticksEfeitos)+1), ticksEfeitos)
plt.grid(alpha=0.5)

plt.savefig("resultados/"+nomeClassificador+"_Experimento_I.pdf", format='pdf', bbox_inches = 'tight')
plt.show()

# EXPERIMENTO II (TESTE COM EFEITO IDENTICO AO TREINAMENTO)

treinamento original       / teste original

treinamento original+ruido / teste original+ruido

treinamento original+pitch / teste original+pitch

treinamento original+tempo / teste original+tempo

treinamento original+veloc / teste original+veloc

treinamento completo       / teste completo

In [None]:
matrizAcuraciasExpII = [] # CADA LINHA UM EFEITO DIFERENTE, CADA COLUNA UM HOLDOUT

for i, efeitoAtual in enumerate(arrayEfeitosDesejados):
    
    print("\nINICIANDO O TESTE COM O EFEITO", efeitoAtual.upper())
    
    if i == 0:
        print("O treinamento original com teste original já foi realizado no Experimento I. Pulando essa etapa")
        arrayAcuraciasExpII = matrizAcuraciasExpI[0]
    else:
        # ABRINDO O DATASET DE TREINAMENTO E TESTE PARA SEPARAR X E Y
        xTrain, yTrain, __ = ajustarDataset(dfTreinamento, efeitoAtual)
        xTest, yTest, __   = ajustarDataset(dfTeste, efeitoAtual)

        # SELECIONANDO O MELHOR MODELO DE TREINAMENTO DE ACORDO COM OS RESULTADOS DO GRIDSEARCH
        modeloTop = arrayMelhorModeloCadaDatasetTreinamento[i]

        # AJUSTANDO A STRING DO MODELO ATUAL
        modeloTop = str(modeloTop).replace("\n", "").replace(" ", "")

        # SE DER PRA POR N_JOBS=-1 A GNT BOTA
        parametrosModeloTop = modeloTop.split(",")
        for j, parametroAtual in enumerate(parametrosModeloTop):
            if "n_jobs" in parametroAtual:
                parametrosModeloTop[j] = "n_jobs=-1"
        modeloTop = ','.join(parametrosModeloTop)

        # CRIANDO OS ARRAY DE ACURACIAS QUE VAI GUARDAR CADA ACURACIA DO CROSS VALIDATION
        arrayAcuraciasExpII = []

        # ITERANDO O CROSS VALIDATION
        for i in range(1, qtdIteracoesCV + 1):

            # DANDO UM SHUFFLE NOS DADOS DE TESTE
            xTest, yTest = shuffle(xTest, yTest)
            xTestAtual = xTest[:int(percentualTeste*len(xTest))]
            yTestAtual = yTest[:int(percentualTeste*len(yTest))]

            # CRIANDO, TREINANDO E PREDIZENDO O MODELO       
            objClassificador = eval(modeloTop)
            objClassificador.fit(xTrain, yTrain)
            yPred  = objClassificador.predict(xTestAtual)
            arrayAcuraciasExpII.append(accuracy_score(yTestAtual, yPred))

            # PRINTANDO O PROGRESSO
            print(str(100*(i/qtdIteracoesCV))+"%", end=" ")

    # COLOCANDO A LINHA NOVA NA MATRIZ
    matrizAcuraciasExpII.append(arrayAcuraciasExpII)

print("\nTODOS OS TESTES FORAM FINALIZADOS")
print(matrizAcuraciasExpII)

#### Salvando os resultados

In [None]:
# ABRINDO O ARQUIVO TXT
objFile = open(arquivoResultados, "a")

# ESCREVENDO
objFile.write("-----------------------------------------------------------------------------------\n")
objFile.write("RESULTADOS DO EXPERIMENTO II (TESTE COM EFEITO IDENTICO AO TREINAMENTO)\n")
for efeitoAtual, acuraciasEfeitoAtual in zip(arrayEfeitosDesejados, matrizAcuraciasExpII):
    objFile.write("ACURÁCIA MÉDIA (TREINAMENTO E TESTE " + efeitoAtual.upper() + "): " + str(np.mean(acuraciasEfeitoAtual)) + " +- " + str(np.std(acuraciasEfeitoAtual))+ "\n")
objFile.write("-----------------------------------------------------------------------------------\n\n\n\n")

# FECHANDO
objFile.close()    

In [None]:
paleta = ["#99ddff", "#80d4ff", "#66ccff", "#4dc3ff", "#33bbff", "#1ab2ff"]
ticksEfeitos = []

for i, (efeitos, arrayAcuraciasEfeitoAtual, corAtual) in enumerate(zip(arrayEfeitosDesejados, matrizAcuraciasExpII, paleta)):
    
    plt.bar(i+1, np.mean(arrayAcuraciasEfeitoAtual), color=corAtual)
    plt.errorbar(i+1, np.mean(arrayAcuraciasEfeitoAtual), yerr=np.std(arrayAcuraciasEfeitoAtual), capsize=2, color="#ff0066")
    
    if efeitos == "original":
        ticksEfeitos.append("Original")
    elif efeitos == "original+ruido":
        ticksEfeitos.append("Original +\nRuído Branco")
    elif efeitos == "original+pitch":
        ticksEfeitos.append("Original +\nPitch Shift")
    elif efeitos == "original+tempo":
        ticksEfeitos.append("Original +\nDesl. Temp.")
    elif efeitos == "original+velocidade":
        ticksEfeitos.append("Original +\nVeloc. Repro.")
    else:
        ticksEfeitos.append("Completo")
    

plt.title(nomeClassificador + " - Experimento II")
plt.ylabel("Acurácia de Teste")
plt.xlabel("Dataset de Treinamento")
plt.ylim(np.amin(matrizAcuraciasExpII)-0.025, np.amax(matrizAcuraciasExpII)+0.025)
plt.xticks(range(1, len(ticksEfeitos)+1), ticksEfeitos)
plt.grid(alpha=0.5)

plt.savefig("resultados/"+nomeClassificador+"_Experimento_II.pdf", format='pdf', bbox_inches = 'tight')
plt.show()

# EXPERIMENTO III (TESTE COMPLETO)

treinamento original       / teste completo

treinamento original+ruido / teste completo

treinamento original+pitch / teste completo

treinamento original+tempo / teste completo

treinamento original+veloc / teste completo

treinamento completo       / teste completo

In [None]:
matrizAcuraciasExpIII = [] # CADA LINHA UM EFEITO DIFERENTE, CADA COLUNA UM HOLDOUT

# DATASET DE TESTE SEMPRE COMPLETO NESSE EXPERIMENTO
xTest, yTest, __   = ajustarDataset(dfTeste, "completo")

for i, efeitoAtual in enumerate(arrayEfeitosDesejados):
    
    print("\nINICIANDO O TESTE COM O EFEITO", efeitoAtual.upper())
    
    if i == len(arrayEfeitosDesejados)-1:
        print("O treinamento completo com teste completo já foi realizado no Experimento II. Pulando essa etapa")
        arrayAcuraciasExpIII = matrizAcuraciasExpII[-1]
    else:

        # ABRINDO O DATASET DE TREINAMENTO PARA SEPARAR X E Y
        xTrain, yTrain, __ = ajustarDataset(dfTreinamento, efeitoAtual)

        # SELECIONANDO O MELHOR MODELO DE TREINAMENTO DE ACORDO COM OS RESULTADOS DO GRIDSEARCH
        modeloTop = arrayMelhorModeloCadaDatasetTreinamento[i]

        # AJUSTANDO A STRING DO MODELO ATUAL
        modeloTop = str(modeloTop).replace("\n", "").replace(" ", "")

        # SE DER PRA POR N_JOBS=-1 A GNT BOTA
        parametrosModeloTop = modeloTop.split(",")
        for j, parametroAtual in enumerate(parametrosModeloTop):
            if "n_jobs" in parametroAtual:
                parametrosModeloTop[j] = "n_jobs=-1"
        modeloTop = ','.join(parametrosModeloTop)

        # CRIANDO OS ARRAY DE ACURACIAS QUE VAI GUARDAR CADA ACURACIA DO CROSS VALIDATION
        arrayAcuraciasExpIII = []

        # ITERANDO O CROSS VALIDATION
        for i in range(1, qtdIteracoesCV + 1):

            # DANDO UM SHUFFLE NOS DADOS DE TESTE
            xTest, yTest = shuffle(xTest, yTest)
            xTestAtual = xTest[:int(percentualTeste*len(xTest))]
            yTestAtual = yTest[:int(percentualTeste*len(yTest))]

            # CRIANDO, TREINANDO E PREDIZENDO O MODELO       
            objClassificador = eval(modeloTop)
            objClassificador.fit(xTrain, yTrain)
            yPred  = objClassificador.predict(xTestAtual)
            arrayAcuraciasExpIII.append(accuracy_score(yTestAtual, yPred))

            # PRINTANDO O PROGRESSO
            print(str(100*(i/qtdIteracoesCV))+"%", end=" ")
        
    # COLOCANDO A LINHA NOVA NA MATRIZ
    matrizAcuraciasExpIII.append(arrayAcuraciasExpIII)

print("\nTODOS OS TESTES FORAM FINALIZADOS")
print(matrizAcuraciasExpIII)

#### Salvando os resultados

In [None]:
# ABRINDO O ARQUIVO TXT
objFile = open(arquivoResultados, "a")

# ESCREVENDO
objFile.write("-----------------------------------------------------------------------------------\n")
objFile.write("RESULTADOS DO EXPERIMENTO III (TESTE COMPLETO)\n")
for efeitoAtual, acuraciasEfeitoAtual in zip(arrayEfeitosDesejados, matrizAcuraciasExpIII):
    objFile.write("ACURÁCIA MÉDIA (TREINAMENTO " + efeitoAtual.upper() + "): " + str(np.mean(acuraciasEfeitoAtual)) + " +- " + str(np.std(acuraciasEfeitoAtual))+ "\n")
objFile.write("-----------------------------------------------------------------------------------\n\n\n\n")

# FECHANDO
objFile.close()    

In [None]:
paleta = ["#99ddff", "#80d4ff", "#66ccff", "#4dc3ff", "#33bbff", "#1ab2ff"]
ticksEfeitos = []

for i, (efeitos, arrayAcuraciasEfeitoAtual, corAtual) in enumerate(zip(arrayEfeitosDesejados, matrizAcuraciasExpIII, paleta)):
    
    plt.bar(i+1, np.mean(arrayAcuraciasEfeitoAtual), color=corAtual)
    plt.errorbar(i+1, np.mean(arrayAcuraciasEfeitoAtual), yerr=np.std(arrayAcuraciasEfeitoAtual), capsize=2, color="#ff0066")
    
    if efeitos == "original":
        ticksEfeitos.append("Original")
    elif efeitos == "original+ruido":
        ticksEfeitos.append("Original +\nRuído Branco")
    elif efeitos == "original+pitch":
        ticksEfeitos.append("Original +\nPitch Shift")
    elif efeitos == "original+tempo":
        ticksEfeitos.append("Original +\nDesl. Temp.")
    elif efeitos == "original+velocidade":
        ticksEfeitos.append("Original +\nVeloc. Repro.")
    else:
        ticksEfeitos.append("Completo")
    

plt.title(nomeClassificador + " - Experimento III")
plt.ylabel("Acurácia de Teste")
plt.xlabel("Dataset de Treinamento")
plt.ylim(np.amin(matrizAcuraciasExpIII)-0.025, np.amax(matrizAcuraciasExpIII)+0.025)
plt.xticks(range(1, len(ticksEfeitos)+1), ticksEfeitos)
plt.grid(alpha=0.5)

plt.savefig("resultados/"+nomeClassificador+"_Experimento_III.pdf", format='pdf', bbox_inches = 'tight')
plt.show()