In [51]:
import pandas as pd
from scipy import stats
from scipy.stats import levene
from scipy.stats import f_oneway
from scipy.stats import wilcoxon

In [52]:
# Carregando dados

cnn_metrics = pd.read_excel(r'metrics/cnn/cnn.xlsx')
rnn_metrics = pd.read_excel(r'metrics/rnn/rnn.xlsx')

# Acurácias
resultAccuracyCnn = list(cnn_metrics["Acurácia"])
resultAccuracyRnn = list(rnn_metrics["Acurácia"])

# F1
resultF1Cnn = list(cnn_metrics["F1"])
resultF1Rnn = list(rnn_metrics["F1"])

# Recall
resultRecallCnn = list(cnn_metrics["Recall"])
resultRecallRnn = list(rnn_metrics["Recall"])

# Precision
resultPrecisionCnn = list(cnn_metrics["Precisão"])
resultPrecisionRnn = list(rnn_metrics["Precisão"])

# Training Time
resultTrainingTimeCnn = list(cnn_metrics["Tempo de treinamento"])
resultTrainingTimeRnn = list(rnn_metrics["Tempo de treinamento"])


# Classification Time
resultClassificationTimeCnn = list(cnn_metrics["Tempo de classificação"])
resultClassificationTimeRnn = list(rnn_metrics["Tempo de classificação"])

#### - Tendo os resultados das métricas para cada um dos modelos salvos, iremos validar as hipoteses utilizando o teste de anova caso não seja rejeitado o resultado do teste de shapiro e levene. Caso contrário iremos aplicar o teste de wilcoxon.

#### - Para utilização do teste, será necessário validar inicialmente se a distribuição de dados é normal de acordo com o **teste de shapiro** e se a distribuição dos dados é homogenia com o **teste de levene**. Somente com o resultado desses testes, será possivel realizar o teste de anova.

#### - A análise de acordo com os resultados dos testes, será feita levando em consideração um alfa de 0,05, sendo que os valores obtidos para o p-value terão de ser maior que o valor de alfa, caso contrário será rejeitada a hipotese nula.

#### - A descrição das hipostese nula e alternativa para o teste de **anova** são demonstradas abaixo:

H0 - As médias do grupo são todas iguais<br>
HA - Nem todas as médias do grupo são iguais.<br>

#### - A descrição das hipostese nula e alternativa para o teste de **wilcoxon** são demonstradas abaixo:

H0 = Os dados seguem a mesma distribuição<br>
HA = Os dados são de distribuições distintas


## Análise para acurácia

#### Shapiro para o modelo cnn

In [53]:
shapiro_test_cnn = stats.shapiro(resultAccuracyCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9017525315284729
p-value = 0.009272380731999874


#### Shapiro para o modelo de rnn

In [54]:
shapiro_test_rnn = stats.shapiro(resultAccuracyRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.968392014503479
p-value = 0.4961685240268707


#### Teste de levene para os modelos de CNN e RNN

In [55]:
stat, p_levene = levene(resultAccuracyCnn, resultAccuracyRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 3.0258706175153343
p-value = 0.08725109046671349


In [56]:
result_wilcoxon = wilcoxon(resultAccuracyCnn, resultAccuracyRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.7333066441991056e-06


## Análise para F1

#### Shapiro para o modelo cnn

In [57]:
shapiro_test_cnn = stats.shapiro(resultF1Cnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.8881731033325195
p-value = 0.0043675778433680534


#### Shapiro para o modelo de rnn

In [58]:
shapiro_test_rnn = stats.shapiro(resultF1Rnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9661397933959961
p-value = 0.4396226406097412


#### Teste de levene para os modelos de CNN e RNN

In [59]:
stat, p_levene = levene(resultF1Cnn, resultF1Rnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 1.827931309241456
p-value = 0.1816208855204623


In [60]:
result_wilcoxon = wilcoxon(resultF1Cnn, resultF1Rnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.7343976283205784e-06


## Análise para Recall

#### Shapiro para o modelo cnn

In [61]:
shapiro_test_cnn = stats.shapiro(resultRecallCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9017525315284729
p-value = 0.009272380731999874


#### Shapiro para o modelo de rnn

In [62]:
shapiro_test_rnn = stats.shapiro(resultRecallRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.968392014503479
p-value = 0.4961685240268707


#### Teste de levene para os modelos de CNN e RNN

In [63]:
stat, p_levene = levene(resultRecallCnn, resultRecallRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 3.0258706175153343
p-value = 0.08725109046671349


In [64]:
result_wilcoxon = wilcoxon(resultRecallCnn, resultRecallRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.7333066441991056e-06


## Análise para Precision

#### Shapiro para o modelo cnn

In [65]:
shapiro_test_cnn = stats.shapiro(resultPrecisionCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.8818951845169067
p-value = 0.0031172260642051697


#### Shapiro para o modelo de rnn

In [66]:
shapiro_test_rnn = stats.shapiro(resultPrecisionRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9533449411392212
p-value = 0.20761819183826447


#### Teste de levene para os modelos de CNN e RNN

In [67]:
stat, p_levene = levene(resultPrecisionCnn, resultPrecisionRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 0.0010013581223918121
p-value = 0.9748644042742942


In [68]:
result_wilcoxon = wilcoxon(resultPrecisionCnn, resultPrecisionRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.7343976283205784e-06


## Análise para tempo de treinamento

#### Shapiro para o modelo cnn

In [69]:
shapiro_test_cnn = stats.shapiro(resultTrainingTimeCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9313627481460571
p-value = 0.053376201540231705


#### Shapiro para o modelo de rnn

In [70]:
shapiro_test_rnn = stats.shapiro(resultTrainingTimeRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.984703004360199
p-value = 0.9320247769355774


#### Teste de levene para os modelos de CNN e RNN

In [71]:
stat, p_levene = levene(resultTrainingTimeCnn, resultTrainingTimeRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 31.47877546237997
p-value = 5.919258041174611e-07


## Análise para tempo de classificação

#### Shapiro para o modelo cnn

In [72]:
shapiro_test_cnn = stats.shapiro(resultClassificationTimeCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9588926434516907
p-value = 0.2901481091976166


#### Shapiro para o modelo de rnn

In [73]:
shapiro_test_rnn = stats.shapiro(resultClassificationTimeRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.8261364698410034
p-value = 0.00020406529074534774


#### Teste de levene para os modelos de CNN e RNN

In [74]:
stat, p_levene = levene(resultClassificationTimeCnn, resultClassificationTimeRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 0.10234936590720602
p-value = 0.750177936619755


In [75]:
result_wilcoxon = wilcoxon(resultClassificationTimeCnn, resultClassificationTimeRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.7343976283205784e-06
