# Analyse des resultats des test de différentes structures de MLP sur le dataset Cifar-10

### Informations 

Dans ce notebook, nous allons analyser les resultats obtenus sur la première vague de tests de différentes structures et hyperparametres de MLP. Pour chaque un des tests menés, entre 10 et 20 modèles on été testés. 2tant donné la grande quantité d'architectures testées, nous allons mettre seulement un ou deux examples de nos méthodes d'analyse des résutat, et Présenter les résultat définitifs, pour ne pas surcharger le notebook.

## Preparation des outils

In [13]:
import pandas as pd
from IPython.display import display
import numpy as np
from tensorflow_log_loader import *

## MLP 10 à 15 couches - 64 neurones par couche - Dropout - 200 epochs

In [9]:
history_csv_file = ".\\trained_models\\mlp\\tested_mlp_dropout_10_15_64_history.csv"
logs_dir = ".\\logs\\mlp_dropout_10_15_64\\20200122\\"
tests_history = pd.read_csv(history_csv_file, sep=";")

nb_epochs = 200

filtered_history = tests_history[tests_history.epochs == nb_epochs]

### Extraction des informations interessantes :
- Pire résultat sur le train
- Pire résultat sur la val
- Meilleur résultat sur le train
- Meilleur résultat sur la val 
- Moyenne des résultats sur le train 
- Moyenne des résultats sur la val 
- Mediane des résultat sur le train 
- Mediane des résultat sur la val
- Meilleur model sur le train 
- Meilleur model sur la val 

In [3]:
sorted_train_accuracy = np.sort(filtered_history.train_accuracy)
sorted_val_accuracy = np.sort(filtered_history.val_accuracy)

max_val_accuracy = sorted_val_accuracy[-1]
second_max_val_accuracy = sorted_val_accuracy[-2]
min_val_accuracy = filtered_history.val_accuracy.min()
mean_val_accuracy = filtered_history.val_accuracy.mean()
median_val_accuracy = filtered_history.val_accuracy.median()

max_train_accuracy = sorted_train_accuracy[-1]
second_max_train_accuracy = sorted_train_accuracy[-2]
min_train_accuracy = filtered_history.train_accuracy.min()
mean_train_accuracy = filtered_history.train_accuracy.mean()
median_train_accuracy = filtered_history.train_accuracy.median()

best_validation_models = []
best_validation_models.append(filtered_history[filtered_history.val_accuracy == max_val_accuracy])
best_validation_models.append(filtered_history[filtered_history.val_accuracy == second_max_val_accuracy])

best_train_models = []
best_train_models.append(filtered_history[filtered_history.train_accuracy == max_train_accuracy])
best_train_models.append(filtered_history[filtered_history.train_accuracy == second_max_train_accuracy])

In [4]:
print("Pire résultat sur le train : ", min_train_accuracy)
print("Pire Résultat sur la val : ", min_val_accuracy)

print("Meilleur résultat sur le train : ", max_train_accuracy)
print("Meilleur résultat sur la val : ", max_val_accuracy)

print("Moyenne des résultats sur le train : ", mean_train_accuracy)
print("Moyenne des résultats sur la val : ", mean_val_accuracy)

print("Mediane des résultat sur le train : ", median_train_accuracy)
print("Mediane des résultat sur la val : ", median_val_accuracy)

print("Meilleur model sur le train : ")
display(best_train_models[0])
display(best_train_models[1])

print("Meilleur model sur la val : ")
display(best_validation_models[0])
display(best_validation_models[1])

Pire résultat sur le train :  0.1
Pire Résultat sur la val :  0.1
Meilleur résultat sur le train :  0.48486
Meilleur résultat sur la val :  0.4515
Moyenne des résultats sur le train :  0.27663499999999996
Moyenne des résultats sur la val :  0.2678416666666667
Mediane des résultat sur le train :  0.32115
Mediane des résultat sur la val :  0.312
Meilleur model sur le train : 


Unnamed: 0,nb_couches,profondeurs_couches,activation_couches,activation_output,dropout,nb_dropout,indexes_dropout,valeur_dropout,l1l2_couches,l1l2_output,...,nb_l1l2,indexes_l1l2,loss,optimizer,metrics,epochs,model_id,train_accuracy,val_accuracy,dossier
9,12,64 64 64 64 64 64 64 64 64 64 64 64,softplus,softmax,True,9,2 12 11 2 7 10 2 7 2,0.1,False,False,...,0,,sparse_categorical_crossentropy,Adam,sparse_categorical_accuracy,200,369242,0.48486,0.4515,20200122


Unnamed: 0,nb_couches,profondeurs_couches,activation_couches,activation_output,dropout,nb_dropout,indexes_dropout,valeur_dropout,l1l2_couches,l1l2_output,...,nb_l1l2,indexes_l1l2,loss,optimizer,metrics,epochs,model_id,train_accuracy,val_accuracy,dossier
8,14,64 64 64 64 64 64 64 64 64 64 64 64 64 64,selu,softmax,True,12,4 2 7 8 5 12 13 4 10 9 10 8,0.1,False,False,...,0,,sparse_categorical_crossentropy,Adam,sparse_categorical_accuracy,200,8604306,0.45608,0.4325,20200122


Meilleur model sur la val : 


Unnamed: 0,nb_couches,profondeurs_couches,activation_couches,activation_output,dropout,nb_dropout,indexes_dropout,valeur_dropout,l1l2_couches,l1l2_output,...,nb_l1l2,indexes_l1l2,loss,optimizer,metrics,epochs,model_id,train_accuracy,val_accuracy,dossier
9,12,64 64 64 64 64 64 64 64 64 64 64 64,softplus,softmax,True,9,2 12 11 2 7 10 2 7 2,0.1,False,False,...,0,,sparse_categorical_crossentropy,Adam,sparse_categorical_accuracy,200,369242,0.48486,0.4515,20200122


Unnamed: 0,nb_couches,profondeurs_couches,activation_couches,activation_output,dropout,nb_dropout,indexes_dropout,valeur_dropout,l1l2_couches,l1l2_output,...,nb_l1l2,indexes_l1l2,loss,optimizer,metrics,epochs,model_id,train_accuracy,val_accuracy,dossier
8,14,64 64 64 64 64 64 64 64 64 64 64 64 64 64,selu,softmax,True,12,4 2 7 8 5 12 13 4 10 9 10 8,0.1,False,False,...,0,,sparse_categorical_crossentropy,Adam,sparse_categorical_accuracy,200,8604306,0.45608,0.4325,20200122


##### Nous avons donc repéré les deux modèles les plus performants. Nous allons maintenant vérifier les logs pour voir si on peut en tirer quelque chose en augmentant le nombre d'épochs (si les modèles n'overfit pas et n'underfit pas)

In [14]:
model_1_id = best_validation_models[0].model_id
train_log_model_1 = "./logs/mlp_dropout_10_15_64/20200122/mlp_dropout_10_15_64_8604306.log/train/events.out.tfevents.1579700315.DESKTOP-EKB11M1.12576.168729.v2"
val_log_model_1 = "./logs/mlp_dropout_10_15_64/20200122/mlp_dropout_10_15_64_8604306.log/validation/events.out.tfevents.1579700322.DESKTOP-EKB11M1.12576.171640.v2"

model_2_id = best_validation_models[1].model_id
train_log_model_2 = "./logs/mlp_dropout_10_15_64/20200122/mlp_dropout_10_15_64_0369242.log/train/events.out.tfevents.1579700540.DESKTOP-EKB11M1.12576.190464.v2"
val_log_model_2 = "./logs/mlp_dropout_10_15_64/20200122/mlp_dropout_10_15_64_0369242.log/validation/events.out.tfevents.1579700546.DESKTOP-EKB11M1.12576.192243.v2"

plot_tensorflow_log(train_log_model_1)

KeyError: 'Key training-accuracy was not found in Reservoir'

# ---------------------------------------------------------------------------------------------------------------

## MLP 10 à 15 couches - 128 neurones par couche - Dropout - 200 epochs

In [None]:
history_csv_file = ".\\trained_models\\mlp\\tested_mlp_dropout_10_15_128_history.csv"
tests_history = pd.read_csv(history_csv_file, sep=";")

nb_epochs = 200

filtered_history = tests_history[tests_history.epochs == nb_epochs]

### Extraction des informations interessantes :
- Pire résultat sur le train
- Pire résultat sur la val
- Meilleur résultat sur le train
- Meilleur résultat sur la val 
- Moyenne des résultats sur le train 
- Moyenne des résultats sur la val 
- Mediane des résultat sur le train 
- Mediane des résultat sur la val
- Meilleur model sur le train 
- Meilleur model sur la val 

In [None]:
sorted_train_accuracy = np.sort(filtered_history.train_accuracy)
sorted_val_accuracy = np.sort(filtered_history.val_accuracy)

max_val_accuracy = sorted_val_accuracy[-1]
second_max_val_accuracy = sorted_val_accuracy[-2]
min_val_accuracy = filtered_history.val_accuracy.min()
mean_val_accuracy = filtered_history.val_accuracy.mean()
median_val_accuracy = filtered_history.val_accuracy.median()

max_train_accuracy = sorted_train_accuracy[-1]
second_max_train_accuracy = sorted_train_accuracy[-2]
min_train_accuracy = filtered_history.train_accuracy.min()
mean_train_accuracy = filtered_history.train_accuracy.mean()
median_train_accuracy = filtered_history.train_accuracy.median()

best_validation_models = []
best_validation_models.append(filtered_history[filtered_history.val_accuracy == max_val_accuracy])
best_validation_models.append(filtered_history[filtered_history.val_accuracy == second_max_val_accuracy])

best_train_models = []
best_train_models.append(filtered_history[filtered_history.train_accuracy == max_train_accuracy])
best_train_models.append(filtered_history[filtered_history.train_accuracy == second_max_train_accuracy])

In [None]:
print("Pire résultat sur le train : ", min_train_accuracy)
print("Pire Résultat sur la val : ", min_val_accuracy)

print("Meilleur résultat sur le train : ", max_train_accuracy)
print("Meilleur résultat sur la val : ", max_val_accuracy)

print("Moyenne des résultats sur le train : ", mean_train_accuracy)
print("Moyenne des résultats sur la val : ", mean_val_accuracy)

print("Mediane des résultat sur le train : ", median_train_accuracy)
print("Mediane des résultat sur la val : ", median_val_accuracy)

print("Meilleur model sur le train : ")
display(best_train_models[0])
display(best_train_models[1])

print("Meilleur model sur la val : ")
display(best_validation_models[0])
display(best_validation_models[1])