In [1]:
import pandas as pd
from scipy import stats
from scipy.stats import levene
from scipy.stats import f_oneway
from scipy.stats import wilcoxon

In [2]:
# Carregando dados

cnn_metrics = pd.read_excel(r'metrics/cnn/cnn.xlsx')
rnn_metrics = pd.read_excel(r'metrics/rnn/rnn.xlsx')

# Acurácias
resultAccuracyCnn = list(cnn_metrics["Acurácia"])
resultAccuracyRnn = list(rnn_metrics["Acurácia"])

# F1
resultF1Cnn = list(cnn_metrics["F1"])
resultF1Rnn = list(rnn_metrics["F1"])

# Recall
resultRecallCnn = list(cnn_metrics["Recall"])
resultRecallRnn = list(rnn_metrics["Recall"])

# Precision
resultPrecisionCnn = list(cnn_metrics["Precisão"])
resultPrecisionRnn = list(rnn_metrics["Precisão"])

# Training Time
resultTrainingTimeCnn = list(cnn_metrics["Tempo de treinamento"])
resultTrainingTimeRnn = list(rnn_metrics["Tempo de treinamento"])


# Classification Time
resultClassificationTimeCnn = list(cnn_metrics["Tempo de classificação"])
resultClassificationTimeRnn = list(rnn_metrics["Tempo de classificação"])

#### - Tendo os resultados das métricas para cada um dos modelos salvos, iremos validar as hipoteses utilizando o teste de anova caso não seja rejeitado o resultado do teste de shapiro e levene. Caso contrário iremos aplicar o teste de wilcoxon.

#### - Para utilização do teste, será necessário validar inicialmente se a distribuição de dados é normal de acordo com o **teste de shapiro** e se a distribuição dos dados é homogenia com o **teste de levene**. Somente com o resultado desses testes, será possivel realizar o teste de anova.

#### - A análise de acordo com os resultados dos testes, será feita levando em consideração um alfa de 0,05, sendo que os valores obtidos para o p-value terão de ser maior que o valor de alfa, caso contrário será rejeitada a hipotese nula.

#### - A descrição das hipostese nula e alternativa para o teste de **anova** são demonstradas abaixo:

H0 - As médias do grupo são todas iguais<br>
HA - Nem todas as médias do grupo são iguais.<br>

#### - A descrição das hipostese nula e alternativa para o teste de **wilcoxon** são demonstradas abaixo:

H0 = Os dados seguem a mesma distribuição<br>
HA = Os dados são de distribuições distintas


## Análise para acurácia

#### Shapiro para o modelo cnn

In [3]:
shapiro_test_cnn = stats.shapiro(resultAccuracyCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9098297953605652
p-value = 0.012796293944120407


#### Shapiro para o modelo de rnn

In [4]:
shapiro_test_rnn = stats.shapiro(resultAccuracyRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9700627326965332
p-value = 0.5207948088645935


#### Teste de levene para os modelos de CNN e RNN

In [5]:
stat, p_levene = levene(resultAccuracyCnn, resultAccuracyRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 3.3571830356289873
p-value = 0.07187645402657077


In [6]:
result_wilcoxon = wilcoxon(resultAccuracyCnn, resultAccuracyRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.1735028812661596e-06


## Análise para F1

#### Shapiro para o modelo cnn

In [7]:
shapiro_test_cnn = stats.shapiro(resultF1Cnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.8963639140129089
p-value = 0.00585570652037859


#### Shapiro para o modelo de rnn

In [8]:
shapiro_test_rnn = stats.shapiro(resultF1Rnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9686749577522278
p-value = 0.4833540916442871


#### Teste de levene para os modelos de CNN e RNN

In [9]:
stat, p_levene = levene(resultF1Cnn, resultF1Rnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 2.110295118816628
p-value = 0.15152107494524486


In [10]:
result_wilcoxon = wilcoxon(resultF1Cnn, resultF1Rnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.1741945398998534e-06


## Análise para Recall

#### Shapiro para o modelo cnn

In [11]:
shapiro_test_cnn = stats.shapiro(resultRecallCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9098297953605652
p-value = 0.012796293944120407


#### Shapiro para o modelo de rnn

In [12]:
shapiro_test_rnn = stats.shapiro(resultRecallRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9700627326965332
p-value = 0.5207948088645935


#### Teste de levene para os modelos de CNN e RNN

In [13]:
stat, p_levene = levene(resultRecallCnn, resultRecallRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 3.3571830356289873
p-value = 0.07187645402657077


In [14]:
result_wilcoxon = wilcoxon(resultRecallCnn, resultRecallRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.1735028812661596e-06


## Análise para Precisão

#### Shapiro para o modelo cnn

In [15]:
shapiro_test_cnn = stats.shapiro(resultPrecisionCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.8921672701835632
p-value = 0.004621029365807772


#### Shapiro para o modelo de rnn

In [16]:
shapiro_test_rnn = stats.shapiro(resultPrecisionRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9564507603645325
p-value = 0.23441541194915771


#### Teste de levene para os modelos de CNN e RNN

In [17]:
stat, p_levene = levene(resultPrecisionCnn, resultPrecisionRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 0.002409395057919297
p-value = 0.9610141220257272


In [18]:
result_wilcoxon = wilcoxon(resultPrecisionCnn, resultPrecisionRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.1741945398998534e-06


## Análise para tempo de treinamento

#### Shapiro para o modelo cnn

In [19]:
shapiro_test_cnn = stats.shapiro(resultTrainingTimeCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9333476424217224
p-value = 0.054116494953632355


#### Shapiro para o modelo de rnn

In [20]:
shapiro_test_rnn = stats.shapiro(resultTrainingTimeRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.9859024286270142
p-value = 0.9465751647949219


#### Teste de levene para os modelos de CNN e RNN

In [21]:
stat, p_levene = levene(resultTrainingTimeCnn, resultTrainingTimeRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 31.704188227983273
p-value = 5.036813431856532e-07


In [22]:
result_wilcoxon = wilcoxon(resultTrainingTimeCnn, resultTrainingTimeRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.1741945398998534e-06


## Análise para tempo de classificação

#### Shapiro para o modelo cnn

In [23]:
shapiro_test_cnn = stats.shapiro(resultClassificationTimeCnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_cnn[0], shapiro_test_cnn[1]))

estatistica = 0.9605585336685181
p-value = 0.30184251070022583


#### Shapiro para o modelo de rnn

In [24]:
shapiro_test_rnn = stats.shapiro(resultClassificationTimeRnn)

print("estatistica = {}\np-value = {}".format(shapiro_test_rnn[0], shapiro_test_rnn[1]))

estatistica = 0.8301595449447632
p-value = 0.00019690555927809328


#### Teste de levene para os modelos de CNN e RNN

In [25]:
stat, p_levene = levene(resultClassificationTimeCnn, resultClassificationTimeRnn)

print("estatistica = {}\np-value = {}".format(stat, p_levene))

estatistica = 0.14971072719784742
p-value = 0.700180924181567


In [26]:
result_wilcoxon = wilcoxon(resultClassificationTimeCnn, resultClassificationTimeRnn)

print("estatistica = {}\np-value = {}".format(result_wilcoxon[0], result_wilcoxon[1]))

estatistica = 0.0
p-value = 1.1741945398998534e-06
