# Exercice:  Améliorer l'apprentissage d'un algorithme de Deep Learning avec Keras

Nous allons voir à l'aide d'un exercice comment améliorer l'apprentissage d'un modèle de Deep Learning avec Keras
## Chargement des données 
Executez la cellule et choisir le fichier *"classification-ionosphere.csv"* contenant les données

In [0]:
from google.colab import files
dataset = files.upload()

## 1) Chargement des données

In [0]:
#           CLASSIFICATION
#           IONOSPHERE DATA SET

# This radar data was collected by a system in Goose Bay, Labrador. 
#This system consists of a phased array of 16 high-frequency antennas with a total transmitted power on the order of 6.4 kilowatts. 
#See the paper for more details. 
#The targets were free electrons in the ionosphere. 

#"Good" radar returns are those showing evidence of some type of structure in the ionosphere. 
#"Bad" returns are those that do not; their signals pass through the ionosphere.

# https://archive.ics.uci.edu/ml/datasets/ionosphere    

import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import SGD
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split

# reproducibility
seed = 12345
np.random.seed(seed)

# load dataset
dataframe = pd.read_csv("classification-ionosphere.csv", header=None)
dataset = dataframe.values
# split input vs output
X = dataset[:,:-1].astype(float)
y = dataset[:,-1]

### Exercice :
Afficher les 10 premières lignes de `y`


In [0]:
#@title
# 10 premières lignes de 'y'
y[:10]

## Preparation des données
* transformation de la colonne ``` output y ```.

 'g' : good et 'b' : bad en **chiffres**

Notez qu'il y a une erreur si on ne fait pas cette transformation (l'algorithme n'accepte **pas** les lettres) 

**Aide :**

utiliser un `LabelEncoder` de l'API `sklearn`

[doc LabelEncoder](https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html)

In [0]:
#@title
X_train, X_test, y_train, y_test = train_test_split(X, y , test_size = 0.33 , random_state = seed)

# encode 'g', 'b' binary label into numeric
encoder = LabelEncoder()

encoder.fit(y)
y = encoder.transform(y)

## Définition du modèle de Deep Learning

### Exercice : compléter le modèle 
* `input_dim = a_completer_sinon_erreur`

Fixer l'erreur en indiquant la dimension du dataset *input* (la matrice `X`) 

Pour connaître la dimension, appeler la fonction `shape`de l'API `numpy`. Appliquez cette fonction à `X`.

La fonction `shape` renvoie un couple (`nb_ligne , nb_colonne`).

Ici, on cherche le nombre de colonne. Il faut extraire ce nombre qui se trouve en 2ème position dans le couple (`nb_ligne , nb_colonne`).

**Aide :**

`shape[1]`

 

In [0]:
model = Sequential()

# completer le code avec la dimension attendue pour les inputs
# (input_dim)
model.add(Dense(64, input_dim = a_completer_sinon_erreur , activation= 'relu' ))

model.add(Dense(1 , activation= 'sigmoid'))

### Correction :

In [0]:
#@title
model = Sequential()

input_dim_X = X.shape[1]

model.add(Dense(64, input_dim = input_dim_X , activation= 'relu' ))

model.add(Dense(1 , activation= 'sigmoid'))

In [0]:

epochs = 64
learning_rate = 0.01
momentum = 0.1
batch_size = 32

sgd = SGD(lr = learning_rate, momentum = momentum, nesterov = False)
model.compile(loss= 'binary_crossentropy' , optimizer = sgd, metrics=['accuracy'])

## Apprentissage du modèle de Deep Learning

In [0]:
model.fit(X, 
          y, 
          validation_split  =0.33, 
          epochs = epochs, 
          batch_size = batch_size, 
          verbose = 2)

## Evaluation du modèle de Deep Learning
Comme on peut le constater dans le reporting d'apprentissage ci-dessus, le pourcentage de bonnes prédictions sur l'ensemble de validation (données non-vues) est de l'ordre de 96%


## Exercice : implémenter la méthode *time based decay*  

### Aide et instructions 
* fixer un taux d'apprentissage initial élevé (par exemple : 0.9)

In [0]:
#@title
# =================================== time based decay
learning_rate = 0.9


### Aide et instructions
Définir le *decay_rate*

Exemple :

decay_rate = learning_rate / epochs

In [0]:
#@title
decay_rate = learning_rate / epochs

### Aide et instructions
Définir l'optimizer des poids afin qu'il utilise le *decay_rate* définit précédemment

In [0]:
#@title
sgd = SGD(lr = learning_rate, momentum = momentum, decay = decay_rate, nesterov = False)

### Aide et instructions
Compiler le modèle à l'aide de :


```
# model.compile()
```



In [0]:
#@title
model.compile(loss= 'binary_crossentropy' , optimizer = sgd, metrics=[ 'accuracy' ])

### Apprentissage du modèle sur les données

In [0]:
# Fit the model
model.fit(X, 
          y, 
          validation_split =0.33,
          epochs = epochs, 
          batch_size = batch_size, 
          verbose = 2)

### Conclusion ?

Normalement, vous pouvez constater une amélioration de la précision ('*val_accuracy*') de la prédiction sur l'ensemble de validation (les données *non-vue* durant l'apprentissage).

Notez, que l'initialisation aléatoire des poids peut changer les résultats. Si c'est le cas, il faut re-calculer les cellules.