In [1]:
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:90% !important; }</style>"))

from IPython.display import Image

# Structure d'un script/notebook simple avec Keras

-------------------------------
-------------------------------
- Charger les données
- Traiter les données (augmentation ? réduction ?)
- Gérer les labels (one-hot encoding)
- Découpage train/test
-------------------------------
-------------------------------
- Construire le modèle 
- Choisir la fonction de coût, des métriques, un algorithme d'optimisation 
- Compiler le modèle 
- Configurer l'entrainement (`batch_size`, `nb_epoch`, ...)
- Lancer l'entraînement 
-------------------------------
-------------------------------
- Lancer l'inférence sur les nouvelles données à labeliser 
- [Générer le fichier .csv de résultats à envoyer sur Kaggle] 
-------------------------------
-------------------------------

# Les données : Digit-Recognizer de Kaggle 

Reconnaissance de caractères manuscrits (0 à 9)

- Application aux chèques bancaires 
- Yann LeCun a créé le modèle LeNet-5 dans les années 90 sur ce type de problème ! 
- Benchmark en Deep Learning

Données déjà préparées : 
- découpage train/test 
- normalisation des données (preprocessing) 

Reste à faire : `one-hot encoding`

In [None]:
import numpy as np

import matplotlib.pyplot as plt
from matplotlib import cm

%matplotlib inline

In [None]:
X_train = np.load('../data/digit-recognizer/X_train.npy')
X_test = np.load('../data/digit-recognizer/X_test.npy')

y_train = np.load('../data/digit-recognizer/y_train.npy')
y_test = np.load('../data/digit-recognizer/y_test.npy')

In [None]:
print("X_train shape : {}".format(X_train.shape))
print("X_test shape : {}".format(X_test.shape))
print("y_train shape : {}".format(y_train.shape))
print("y_test shape : {}".format(y_test.shape))

In [None]:
# Afficher quelques exemples 
for i in range(9):
    plt.subplot(331+i)
    #Les images sont sous forme de vecteurs, de taille 784=28x28
    plt.imshow(X_train[i].reshape(28,28), cmap=cm.binary)
plt.show()
print(y_train[:9])

 # Prendre en main Keras : régression logistique 

2 API pour construire un modèle avec Keras 
- **Sequential**
    - Empiler les couches, 1 entrée et 1 sortie 
- **Functional**
    - Plusieurs entrées et sorties ! 
 
Ce soir : `Sequential` uniquement !  
 
    
### Première étape :  construire le modèle

Caisse à outils : 

In [None]:
Image(filename='../ressources/regression_logistique.png')

- modèle non profond (aucune couche cachée)

In [None]:
#On charge l'API voulue
from keras.models import Sequential

#et les couches nécessaires 
from keras.layers import Dense, Activation

from keras.regularizers import l2

## La couche `Dense`

Couche 'full-connected' classique 

```python
keras.layers.core.Dense(output_dim, 
                        init='glorot_uniform',
                        activation=None,
                        weights=None,
                        W_regularizer=None,
                        b_regularizer=None,
                        activity_regularizer=None,
                        W_constraint=None,
                        b_constraint=None,
                        bias=True,
                        input_dim=None)
```

- **output_dim**: int > 0.
- **init**: nom de la règle d'initialisation des poids. (uniform, normal, identity, orthogonal, zero, one, glorot_normal, glorot_uniform, he_normal, he_uniform, ...)
- **activation**: nom de la fonction d'activation (pour l'instant `softmax`)
- **W_regularizer**: instance d'un `WeightRegularizer` (eg. L1 or L2 regularization), appliqué aux poids de la matrice.
- **b_regularizer**: instance d'un `WeightRegularizer`, appliqué au vecteur de biais.
- **input_dim**: dimension du vecteur d'entrée, à spécifier uniquement pour la première couche. 

-------------------------------------------------------

Comment ajouter la régularisation L2 ? 


```python 
from keras.regularizers import l2
model.add(Dense(64, input_dim=64, W_regularizer=l2(0.01)))
```


(ici uniquement sur la matrice W)

In [None]:
# On peut ensuite construire le modèle 
# En ajoutant les couches dans 'model'
model = Sequential()

# Dans la première couche, il faut toujours spécifier la dimension d'entrée ! Ici un vecteur de taille 784
model.add(Dense(10, input_dim=784, W_regularizer=l2(0.01)))
model.add(Activation('softmax'))

In [None]:
model.summary()

### Seconde étape : fonction de coût ? métriques ? algorithme d'optimisation ?

Métriques :
    - uniquement indicatives 
    - calculées sur chaque batch et pour les données de test (ou validation_data dans Keras)

Fonction de coût :
    - fonction à minimiser 
    - Cas de la classification multi-classes  : `categorical_crossentropy`


Pour aller plus loin: écrire ses propres métriques !

In [None]:
# Il existe beaucoup de méthodes d'optimisation : ce soir uniquement SGD 
from keras.optimizers import SGD

In [None]:
# choix du `learning rate` (il existe d'autres paramètres pour SGD)
sgd = SGD(lr=0.0001)

model.compile(optimizer=sgd,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

### Troisième étape : entraînement

On indique : 
- les données d'entraînement (X_train,y_train)
- la taille des batch 
- le nombre d'epoch
- les données de test (ou validation) 

```python
model.fit(X_train, y_train,
          batch_size=32, nb_epoch=10, verbose=1,
          validation_split=0.0, validation_data=None,
          shuffle=True,
          class_weight=None, sample_weight=None,
          initial_epoch=0,
          callbacks=None)
```



In [None]:
# one-hot encoding à ne pas oublier !
from keras.utils.np_utils import to_categorical

In [None]:
batch_size = 32
nb_epoch = 30

history = model.fit(X_train, to_categorical(y_train,nb_classes=10),
                    batch_size = batch_size,
                    nb_epoch = nb_epoch,
                    verbose=1,
                    validation_data=(X_test, to_categorical(y_test,nb_classes=10)))


In [None]:
plt.plot(history.history['val_acc'])
plt.ylabel('Accuracy %')
plt.xlabel('Training iterations')
plt.legend(['Testing'], loc='upper left')
plt.show()

## Appliquer le modèle à de nouvelles données 

**3 façon de lancer l'inférence :** 

```python
# Calcule l'erreur et les métriques 
model.evaluate(self, x, y, batch_size=32, verbose=1)

# Renvoie pour chaque exemple un vecteur de probabilité 
model.predict(self, x, batch_size=32, verbose=0)

# Renvoie pour chaque exemple la classe prédite 
model.predict_classes(self, x, batch_size=32, verbose=0)
```

In [None]:
test_data = np.load('../data/digit-recognizer/test_data.npy')
print(test_data.shape)

In [None]:
predictions = model.predict_classes(test_data,batch_size=128,verbose=1)

In [None]:
predictions

In [None]:
# Afficher quelques exemples 
for i in range(9):
    plt.subplot(331+i)
    #Les images sont sous forme de vecteurs, de taille 784=28x28
    plt.imshow(test_data[i].reshape(28,28), cmap=cm.binary)
plt.show()
print(predictions[:9])

In [None]:
# A faire chez soi : envoyerrésultats sur Kaggle
import pandas as pd

pd.DataFrame({"ImageId": list(range(1,len(test_data)+1)), 
              "Label": predictions}).to_csv('DIGIT-RECOGNIZER-submission.csv', index=False,header=True)

# Enregistrer son modèle

#### Uniquement l'architecture du modèle dans un fichier json

In [None]:
import json

json_string = model.to_json()

with open('model.json', 'w') as outfile:
    json.dump(json_string, outfile)

In [None]:
cat model.json

In [None]:
# Pour instacier un modèle depuis un fichier JSON : 
from keras.models import model_from_json

with open("model.json") as json_file:
    json_string = json.load(json_file)

model2 = model_from_json(json_string)
#Le modèle model2 a la même architecture, mais des poids différents (poids initiaux aléatoires)

#### Uniquement les poids entraînés dans un fichier hdf5

In [None]:
model.save_weights('weights.h5')

In [None]:
model2.load_weights('weights.h5')

#### Achitecture + poids entraînés dans un fichier hdf5

In [None]:
model.save('model_weights.h5')

In [None]:
from keras.models import load_model
model3 = load_model('model_weights.h5')