In [1]:
# Loading data from steps notebooks
%store -r step1_stats_acc_df
%store -r step1_stats_f1_df
%store -r step2_stats_acc_df
%store -r step2_stats_f1_df
%store -r step3_stats_acc_df
%store -r step3_stats_f1_df

In [2]:
# Functions needed
import pandas as pd
import numpy as np

#score = 'acc' or score = 'f1'
def step1_merge_step2(score, step1_df, step2_df):
    
    # selecting series from step1_df
    s1_normal_score = step1_df['Normal_{0}'.format(score.title())].tolist()
    s1_unbiased_score = step1_df['Unbiased_{0}'.format(score.title())].tolist()

    # selecting series from step2_df
    s2_normal_score = step2_df['Normal_Nested_{0}'.format(score.title())].tolist()
    s2_unbaised_score = step2_df['Unbiased_Nested_{0}'.format(score.title())].tolist()

    # creating the merged dataframe
    ss_index = ['KNN / Grid_KNN', 'RandomForest / Grid_RandomForest','SVM / Grid_SVM']
    df_index = ['{0}_{1}_{2}'.format('Step1', 'Normal', score.title()),
                '{0}_{1}_{2}'.format('Step2', 'Normal', score.title()),
                '{0}_{1}_{2}'.format('Step1', 'Unbiased', score.title()),
                '{0}_{1}_{2}'.format('Step2', 'Unbiased', score.title())]
    s1s2_df = pd.DataFrame([pd.Series(s1_normal_score, index=ss_index),
                            pd.Series(s2_normal_score, index=ss_index),
                            pd.Series(s1_unbiased_score, index=ss_index),
                            pd.Series(s2_unbaised_score, index=ss_index)], index=df_index).round(4)
    
    return s1s2_df.T

def merge_all_steps(score, step1_df, step2_df, step3_df):
   
    # selecting the series from step3_df
    s3_normal_score = step3_df['Normal_Nested_{0}'.format(score.title())].tolist()
    s3_unbaised_score = step3_df['Unbiased_Nested_{0}'.format(score.title())].tolist()
    # 
    s1s2_df = step1_merge_step2(score, step1_df, step2_df)
    #df.insert(loc=idx, column='A', value=new_col)
    s1s2_df.insert(loc=2, column='Step3_Normal_{0}'.format(score.title()), value=s3_normal_score)
    s1s2_df.insert(loc=5, column='Step3_Unbiased_{0}'.format(score.title()), value=s3_unbaised_score)
    return s1s2_df.round(4)

def step2_vs_step1(score,step1_df, step2_df):
  
    s2s1_stats_normal= step2_df['Normal_Nested_{0}'.format(score.title())].values \
                       / step1_df['Normal_{0}'.format(score.title())].values
    s2s1_stats_unbiased= step2_df['Unbiased_Nested_{0}'.format(score.title())].values \
                        / step1_df['Unbiased_{0}'.format(score.title())].values
    
    
    # creating the merged dataframe
    ss_index = ['KNN / Grid_KNN', 'RandomForest / Grid_RandomForest','SVM / Grid_SVM']
    df_index = ['{0} {1}_{2} {3} {4}'.format('Step2 / Step1', 'Stats', score.title(),'Normal','(%)'), 
                '{0} {1}_{2} {3} {4}'.format('Step2 / Step1', 'Stats', score.title(),'Unbiased','(%)')] 
                #EMD_Acc Normal
    s2s1_df = pd.DataFrame([pd.Series((s2s1_stats_normal-1)*100, index=ss_index),
                            pd.Series((s2s1_stats_unbiased-1)*100, index=ss_index)], index=df_index).round(2)
    return s2s1_df.T

def step3_vs_step2(score,step2_df, step3_df):
    #
    s3s2_stats_normal= step3_df['Normal_Nested_{0}'.format(score.title())].values \
                        / step2_df['Normal_Nested_{0}'.format(score.title())].values
    s3s2_stats_unbiased= step3_df['Unbiased_Nested_{0}'.format(score.title())].values \
                        / step2_df['Unbiased_Nested_{0}'.format(score.title())].values
    
    
    # creating the merged dataframe
    ss_index = ['KNN / Grid_KNN', 'RandomForest / Grid_RandomForest','SVM / Grid_SVM']
    df_index = ['{0} {1}_{2} {3} {4}'.format('Step3 / Step2', 'Stats', score.title(),'Normal','(%)'), 
                '{0} {1}_{2} {3} {4}'.format('Step3 / Step2', 'Stats', score.title(),'Unbiased','(%)')]
                #EMD_Acc Normal
    s3s2_df = pd.DataFrame([pd.Series((s3s2_stats_normal-1)*100, index=ss_index),
                            pd.Series((s3s2_stats_unbiased-1)*100, index=ss_index)], index=df_index).round(2)
    return s3s2_df.T

def all_steps(score, step1_df, step2_df, step3_df):
    s1_normal_score= step1_df['Normal_{0}'.format(score.title())].values
    s1_unbiased_score= step1_df['Unbiased_{0}'.format(score.title())].values
    # Step1 Stats_Acc Normal
    # Step1 Stats_Acc Unbiased
    s2s1_df = step2_vs_step1(score, step1_df, step2_df)
    s3s2_df = step3_vs_step2(score, step2_df, step3_df)
    
    merged_df = s2s1_df.merge(s3s2_df, left_index=True, right_index=True, how='inner')
    merged_df.insert(loc=0, column='Step1 Stats_{0} Normal'.format(score.title()),
                     value = s1_normal_score)
    merged_df.insert(loc=1, column='Step1 Stats_{0} Unbiased'.format(score.title()),
                     value = s1_unbiased_score)
    return merged_df
    
def all_steps_normal_vs_unbiased(score,step1_df, step2_df, step3_df):
    
    s1_stats_ss = step1_df['Stats Normal_{0} / Unbiased_{0} (%)'.format(score.title())].values
    # selecting series from step23_df
    s2_stats_normal_ss= step2_df['Normal_Nested_{0}'.format(score.title())].values
    s2_stats_unbaised_ss = step2_df['Unbiased_Nested_{0}'.format(score.title())].values
    s2_stats_ss = np.round((s2_stats_normal_ss/s2_stats_unbaised_ss-1)*100,2)
    #
    s3_stats_normal_ss= step3_df['Normal_Nested_{0}'.format(score.title())].values
    s3_stats_unbaised_ss = step3_df['Unbiased_Nested_{0}'.format(score.title())].values
    s3_stats_ss = np.round((s3_stats_normal_ss/s3_stats_unbaised_ss-1)*100,2)

    
    # creating the merged dataframe
    ss_index = ['KNN / Grid_KNN', 'RandomForest / Grid_RandomForest','SVM / Grid_SVM']
    df_index = ['{0} {1}_{2} {3} {4}'.format('Step1', 'Stats', score.title(),'Normal / Unbiased','(%)'), 
                '{0} {1}_{2} {3} {4}'.format('Step2', 'Stats', score.title(),'Normal / Unbiased','(%)'),
                '{0} {1}_{2} {3} {4}'.format('Step3', 'Stats', score.title(),'Normal / Unbiased','(%)')]
                #EMD_Acc Normal
    df = pd.DataFrame([pd.Series(s1_stats_ss, index=ss_index),
                            pd.Series(s2_stats_ss, index=ss_index),
                            pd.Series(s3_stats_ss, index=ss_index)], index=df_index).round(2)
    
    
    
    return df.T

def simple_vs_nested(score, step2_df):

    normal_simple_ss = step2_df['Normal_Simple_{0}'.format(score.title())].values 
    normal_nested_ss= step2_df['Normal_Nested_{0}'.format(score.title())].values
    normal_ss = np.round((normal_simple_ss/normal_nested_ss-1)*100,2)

    unbiased_simple_ss = step2_df['Unbiased_Simple_{0}'.format(score.title())].values
    unbiased_nested_ss = step2_df['Unbiased_Nested_{0}'.format(score.title())].values
    unbiased_ss = np.round((unbiased_simple_ss/unbiased_nested_ss-1)*100,2)
    
    df = step2_df.copy()
    df.insert(loc=2, column='Normal_{0} Simple/Nested (%)'.format(score.title()),
              value=normal_ss)
    df.insert(loc=5, column='Unbiased_{0} Simple/Nested (%)'.format(score.title()),
              value=unbiased_ss)
    
    return df

# step1

In [3]:
step1_stats_acc_df

Unnamed: 0,Normal_Acc,Unbiased_Acc,Stats Normal_Acc / Unbiased_Acc (%)
KNeighborsClassifier(n_neighbors=1),0.794,0.5288,50.16
RandomForestClassifier(random_state=1010),0.9722,0.8081,20.3
SVC(random_state=1010),0.1844,0.0438,320.97


<div style="text-align: justify">
Os resultados exibidos na tabela acima evidenciam que a nossa hipótese de que exemplos originados de uma mesma leitura quando usados indiscriminadamente no treino e no teste facilitam o aprendizado dos classificadores é válida, uma vez que o desempenho de todos os classficadores foi superior em ao menos 20.30% do que quando foi restringido o uso dos exemplos de uma mesma leitura.
</div></p>

<div style="text-align: justify">
Vale destacar o bom desempenho do RandomForest em ambas configurações e quando submetido a restrição no uso dos exemplos, apresentou um desempenho superior ao KNN sem restrição que foi o segundo melhor classficador em ambos experimentos. Já a SVM foi o destaque negativo, sendo o classficador com a pior performance em ambos experimentos e aquele que mais sofreu com a restrição no uso de exemplos.
</div></p>


In [4]:
step1_stats_f1_df

Unnamed: 0,Normal_F1,Unbiased_F1,Stats Normal_F1 / Unbiased_F1 (%)
KNeighborsClassifier(n_neighbors=1),0.7584,0.2937,158.27
RandomForestClassifier(random_state=1010),0.965,0.5507,75.24
SVC(random_state=1010),0.0706,0.0205,243.77


<div style="text-align: justify">
Assim como no experimento utilizando a acurácia como métrica, o desempenho dos classficadores quando avaliados pela métrica f1_macro foi inferior quando submetidos a exemplos com restrição quanto a origem de leitura. O desempenho dos classficadores, a exceção da SVM, no experimento 'Normal_F1', foi similar ao experimento 'Normal_Acc'. Isto não ocorre no segundo experimento, por conta de uma queda de performance em 'Unbiased_F1' muito superior a observada em 'Unbiased_Acc'.
</div></p>

# step2

### acc

In [5]:
simple_vs_nested('acc', step2_stats_acc_df)

Unnamed: 0,Normal_Simple_Acc,Normal_Nested_Acc,Normal_Acc Simple/Nested (%),Unbiased_Simple_Acc,Unbiased_Nested_Acc,Unbiased_Acc Simple/Nested (%)
Grid_KNN,0.831,0.8197,1.38,0.5757,0.5582,3.14
Grid_RandomForest,0.9831,0.98,0.32,0.841,0.8109,3.71
Grid_SVM,0.1308,0.1304,0.31,0.0332,0.0326,1.84


<div style="text-align: justify">
Ao compararmos os pares de experimentos (Normal_Simple_Acc, Normal_Nested_Acc) e 
(Unbiased_Simple_Acc e Unbiased_Nested), fica evidente que a metodologia de avaliação 'Simple' que envolve apenas os conjuntos de treino e teste é menos rigorosa que a avaliação 'Nested' que possui as etapas de treino, validação e teste. Por isso o desempenho dos experimentos 'Nested' possuem um desempenho inferior ao 'Simple'.
</div></p>
<div style="text-align: justify">
Para efeito de comparação dos Grids realizados nesta etapa com  o desempenho dos classficadores na etapa anterior, utilizaremos os experiementos 'Nested', que como já dissemos são mais rigorosos. Da tabela conjunta abaixo, vemos que a exceção da SVM, na segunda etapa com o uso do GridSearch de parâmetros nos classificadores, houve uma melhora no desempenho em realação aos classficadores simples da primeira etapa para ambas formas de tratamento dos exemplos. No entanto, a performance dos classificadores subemtidos ao experimento na forma 'Unbiased', restrtitiva quanto ao uso de exemplos, ainda é bem inferior ao experimento na forma 'Normal',permissiva quanto ao uso de exemplos, assim como oberservada na 1ª etapa.
</div></p>

In [6]:
step1_merge_step2('acc',step1_stats_acc_df,step2_stats_acc_df)

Unnamed: 0,Step1_Normal_Acc,Step2_Normal_Acc,Step1_Unbiased_Acc,Step2_Unbiased_Acc
KNN / Grid_KNN,0.794,0.8197,0.5288,0.5582
RandomForest / Grid_RandomForest,0.9722,0.98,0.8081,0.8109
SVM / Grid_SVM,0.1844,0.1304,0.0438,0.0326


### f1

In [7]:
simple_vs_nested('f1', step2_stats_f1_df)

Unnamed: 0,Normal_Simple_F1,Normal_Nested_F1,Normal_F1 Simple/Nested (%),Unbiased_Simple_F1,Unbiased_Nested_F1,Unbiased_F1 Simple/Nested (%)
Grid_KNN,0.7987,0.7857,1.65,0.3327,0.3144,5.82
Grid_RandomForest,0.9787,0.9746,0.42,0.624,0.5686,9.74
Grid_SVM,0.0156,0.015,4.0,0.0089,0.0079,12.66


In [8]:
step1_merge_step2('f1',step1_stats_f1_df,step2_stats_f1_df)

Unnamed: 0,Step1_Normal_F1,Step2_Normal_F1,Step1_Unbiased_F1,Step2_Unbiased_F1
KNN / Grid_KNN,0.7584,0.7857,0.2937,0.3144
RandomForest / Grid_RandomForest,0.965,0.9746,0.5507,0.5686
SVM / Grid_SVM,0.0706,0.015,0.0205,0.0079


<div style="text-align: justify">
O compartamento dos classificadores submetidos a métrica de avaliação 'f1_macro', foi semelhante ao que acabamos de apresentar para a métrica 'acurácia'. A exceção da SVM, que foi o único classificador que piorou sua performace com o GridSearch. O desempenho dos classifcadores dos experimentos permissivos continuam muito inferiores ao experimentos restritivos. Vale ressaltar também a diferença da metodologia de validação de experimentos adotada, particularmente ao olharmos os para os experimentos restrititvos ('Unbiased'), neles a metodologia com uso de conjuntos de treino e teste ('Simple') chegou a ser 12.66% superior em termos de 'f1_macro' que seu experimento equivalente utilizando a metodologia de treino, validação e teste ('Nested).
</div></p>

# step3

### acc

In [9]:
step3_stats_acc_df

Unnamed: 0,Normal_Nested_Acc,Unbiased_Nested_Acc
Grid_KNN,0.9474,0.8055
Grid_RandomForest,0.9801,0.8109
Grid_SVM,0.9373,0.7275


<div style="text-align: justify">
Nessa 3ª etapa do experimento repetimos os experimentos da etapa 2, com a metodologia de avaliação dos resultados com treino, validação e teste, junto com a técnica de pré-processamento 'Standardization'. Como podemos ver dos resultados apresentados na tabela acima, a SVM/Grid_SVM que desde da 1ª etapa apresentava resultados ruins, apresentou um resultado comparável ao os demais classificadores. Na tabela abaixo tem-se o resumo das três etapas.
</div></p>

In [10]:
merge_all_steps('acc', step1_stats_acc_df, step2_stats_acc_df,step3_stats_acc_df)

Unnamed: 0,Step1_Normal_Acc,Step2_Normal_Acc,Step3_Normal_Acc,Step1_Unbiased_Acc,Step2_Unbiased_Acc,Step3_Unbiased_Acc
KNN / Grid_KNN,0.794,0.8197,0.9474,0.5288,0.5582,0.8055
RandomForest / Grid_RandomForest,0.9722,0.98,0.9801,0.8081,0.8109,0.8109
SVM / Grid_SVM,0.1844,0.1304,0.9373,0.0438,0.0326,0.7275


<div style="text-align: justify">
De fato, como pode-se obersevar o uso do Standarization foi muito benéfico para a melhora de desempenho não apenas da SVM/Grid_SVM, mas também para o KNN/Grid_KNN. Tal melhora fez com que a diferença de desempenho inicial entre os experimentos na forma permissiva e restritiva, fosse drasticamente reduzida para estes dois classificadores. Já o classficador RandomForest se mostrou quase que insensível a técnica empregada.
</div></p>

### f1

In [11]:
step3_stats_f1_df

Unnamed: 0,Normal_Nested_F1,Unbiased_Nested_F1
Grid_KNN,0.9349,0.5223
Grid_RandomForest,0.9747,0.5683
Grid_SVM,0.9296,0.4459


In [12]:
merge_all_steps('f1', step1_stats_f1_df, step2_stats_f1_df,step3_stats_f1_df)

Unnamed: 0,Step1_Normal_F1,Step2_Normal_F1,Step3_Normal_F1,Step1_Unbiased_F1,Step2_Unbiased_F1,Step3_Unbiased_F1
KNN / Grid_KNN,0.7584,0.7857,0.9349,0.2937,0.3144,0.5223
RandomForest / Grid_RandomForest,0.965,0.9746,0.9747,0.5507,0.5686,0.5683
SVM / Grid_SVM,0.0706,0.015,0.9296,0.0205,0.0079,0.4459


Idem, 'acc'.

# Conlusão

<div style="text-align: justify">
Uma questão central neste estudo é a análise do desempenho dos classificadores quando submetidos a exemplos provenientes de uma mesma aquisição de dados são usados simultâneamente nas etapas de treino, validação (quando presente) e teste em comparação com a proposição deste estudo de restrição do uso dos exemplos de uma mesma aquisição a apenas uma das etapas de avaliação dos classificadores. A nossa hipótese é que o uso permissivo de tais exemplos, que embora sejam tratados como indenpendentes, na realidade não são e por isso facilitariam o apresendizado dos classificadores. Portanto, era de se esperar um desempenho inferior dos classifcadores nos experimentos em que o uso dos exemplos foi restringindo quanto a sua origem, o que foi observado em todas as etapas deste estudo, independentemente da métrica de avalição empregada ou do classifcador utilizado. As tabalas abaixo evidenciam este fato.
</div></p>

In [13]:
all_steps_normal_vs_unbiased('acc',step1_stats_acc_df, step2_stats_acc_df, step3_stats_acc_df)

Unnamed: 0,Step1 Stats_Acc Normal / Unbiased (%),Step2 Stats_Acc Normal / Unbiased (%),Step3 Stats_Acc Normal / Unbiased (%)
KNN / Grid_KNN,50.16,46.85,17.62
RandomForest / Grid_RandomForest,20.3,20.85,20.87
SVM / Grid_SVM,320.97,300.0,28.84


In [14]:
all_steps_normal_vs_unbiased('f1',step1_stats_f1_df, step2_stats_f1_df, step3_stats_f1_df)

Unnamed: 0,Step1 Stats_F1 Normal / Unbiased (%),Step2 Stats_F1 Normal / Unbiased (%),Step3 Stats_F1 Normal / Unbiased (%)
KNN / Grid_KNN,158.27,149.9,79.0
RandomForest / Grid_RandomForest,75.24,71.4,71.51
SVM / Grid_SVM,243.77,89.87,108.48


<div style="text-align: justify">
A outra questão que se impõe neste trabalho é, uma vez compravado o viés pelo uso permissivo de exemplos, como melhorar o desempenho dos classificadores quando submetidos aos experimentos restritivos, sem viés. Das tabelas abaixo vemos que as técnicas empregadas surtiram efeito de formas diferentes para cada classificador utilizado. Independente da métrica de avaliação, o KNN tem seu melhor desempenho quando seu Grid é realizado em conjunto da técnica Standardization. No entanto, esta mesma técnica não é recomendável para o RandomForest, o classifcador que obteve o melhor desempenho, nesse caso o Standardization é irrelevante, sendo melhor o uso apenas de seu Grid. Já para a SVM é fundamental o uso do Standardization e de seu Grid, posto que, sem uma dessas técnicas seu desempenho é muito inferior aos outros dois classifcadores.
</div></p>

In [15]:
all_steps('acc', step1_stats_acc_df, step2_stats_acc_df, step3_stats_acc_df)

Unnamed: 0,Step1 Stats_Acc Normal,Step1 Stats_Acc Unbiased,Step2 / Step1 Stats_Acc Normal (%),Step2 / Step1 Stats_Acc Unbiased (%),Step3 / Step2 Stats_Acc Normal (%),Step3 / Step2 Stats_Acc Unbiased (%)
KNN / Grid_KNN,0.794,0.5288,3.24,5.56,15.58,44.3
RandomForest / Grid_RandomForest,0.9722,0.8081,0.8,0.35,0.01,0.0
SVM / Grid_SVM,0.1844,0.0438,-29.28,-25.57,618.79,2131.6


In [16]:
all_steps('f1', step1_stats_f1_df, step2_stats_f1_df, step3_stats_f1_df)

Unnamed: 0,Step1 Stats_F1 Normal,Step1 Stats_F1 Unbiased,Step2 / Step1 Stats_F1 Normal (%),Step2 / Step1 Stats_F1 Unbiased (%),Step3 / Step2 Stats_F1 Normal (%),Step3 / Step2 Stats_F1 Unbiased (%)
KNN / Grid_KNN,0.7584,0.2937,3.6,7.05,18.99,66.13
RandomForest / Grid_RandomForest,0.965,0.5507,0.99,3.25,0.01,-0.05
SVM / Grid_SVM,0.0706,0.0205,-78.75,-61.46,6097.33,5544.3
