In [1]:
from IPython.core.display import display, HTML
display(HTML("<style>.container { width:90% !important; }</style>"))

from IPython.display import Image

# Les données : Digit-Recognizer de Kaggle 

In [2]:
import numpy as np

import matplotlib.pyplot as plt
from matplotlib import cm

%matplotlib inline



In [3]:
X_train = np.load('../data/digit-recognizer/X_train.npy')
X_test = np.load('../data/digit-recognizer/X_test.npy')

y_train = np.load('../data/digit-recognizer/y_train.npy')
y_test = np.load('../data/digit-recognizer/y_test.npy')

In [None]:
print("X_train shape : {}".format(X_train.shape))
print("X_test shape : {}".format(X_test.shape))
print("y_train shape : {}".format(y_train.shape))
print("y_test shape : {}".format(y_test.shape))

# Résaux de neurones profonds - DNN

In [None]:
Image(filename='../ressources/DNN.png') 

- modèle profond : plusieurs non-linéarités
- données déjà préparées : liste de vecteurs de dimension 784 (image noir et blanc) 
- découpage train/test déjà fait ! (voir script de préparation)

### La caisse à outils : 

In [None]:
# Point de départ
from keras.models import Sequential

# Couches nécessaires
from keras.layers import Dense, Activation

# Régularisation ? 
from keras.regularizers import l2

# Algorithme d'optimisation 
from keras.optimizers import SGD

# Pour le one-hot encoding
from keras.utils.np_utils import to_categorical

# Callbacks de Keras : outils avancés de gestion ou de contrôle ! 
from keras.callbacks import ModelCheckpoint, EarlyStopping

# Construire le modèle 

Fonctions d'activation:
- softmax
- softplus
- softsign
- relu
- tanh
- sigmoid
- hard_sigmoid
- linear

In [None]:
model = Sequential()

# 4 Couches cachées 
model.add(Dense(...,input_shape=(784,), activation=..., W_regularizer=...))
model.add(Dense(.....))
model.add(...)
....

In [None]:
model.summary()

# Compiler le modèle

In [None]:
sgd = SGD(lr=0.01)

model.compile(optimizer=sgd,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Callbacks avec Keras 

Ce sont des fonctions de monitoring !

- faire de sauvegardes régulières des paramètres
- ajuster le learning rate (prochain notebook)
- stopper l'entraînement pour éviter l'overfitting
- dashboard dans un navigateur avec l'avancement de l'entraînement (github : **jakebian/hera**)

- faire ses propres callbacks : pour envoyer données vers un téléphone portable et contrôler l'entraînement à distance ! 



In [None]:
!ls

In [None]:
checkpoint = ModelCheckpoint('checkpoints/weights.{epoch:02d}-{val_loss:.4f}.hdf5', verbose=0,
                             save_best_only=True,
                             save_weights_only=True,
                             period=1)

In [None]:
earlyStop = EarlyStopping(monitor='val_loss', patience=5, verbose=0)

In [None]:
batch_size = ...
nb_epoch = ...

history = model.fit(...,
                    ...,
                    ...,
                    callbacks=[earlyStop, checkpoint])

In [None]:
!ls checkpoints/

In [None]:
plt.plot(history.history['val_acc'])
plt.ylabel('Accuracy %')
plt.xlabel('Training iterations')
plt.legend(['Testing'], loc='upper left')
plt.show()

## Appliquer le modèle à de nouvelles données 

In [None]:
test_data = np.load('../data/digit-recognizer/test_data.npy')
print(test_data.shape)

In [None]:
predictions = model.predict_classes(test_data,batch_size=128,verbose=1)

In [None]:
# Afficher quelques exemples 
for i in range(9):
    plt.subplot(331+i)
    #Les images sont sous forme de vecteurs, de taille 784=28x28
    plt.imshow(test_data[i].reshape(28,28), cmap=cm.binary)
plt.show()
print(predictions[:9])

In [None]:
# A faire chez soi : envoyerrésultats sur Kaggle
import pandas as pd

pd.DataFrame({"ImageId": list(range(1,len(test_data)+1)), 
              "Label": predictions}).to_csv('DIGIT-RECOGNIZER-submission.csv', index=False,header=True)