## Structure d'un script simple 

-------------------------------
-------------------------------
- Charger les données
- Traiter les données (augmentation ? réduction ?)
- Gérer les labels (one-hot encoding)
- Découpage train/test
-------------------------------
-------------------------------
- Construire le modèle 
- Choisir la fonction de coût, des métriques, un algorithme d'optimisation 
- Compiler le modèle 
- Configurer l'entrainement (`batch_size`, `nb_epoch`, ...)
- Lancer l'entraînement 
-------------------------------
-------------------------------
- Lancer l'inférence sur les nouvelles données à labeliser 
- Générer le fichier .csv de résultats à envoyer sur Kaggle 
-------------------------------
-------------------------------

## Construire un modèle avec Keras

2 API
- **Sequential**
    - Ajouter les couches, 1 entrée et 1 sortie 
- **Functional**
    - Plusieurs entrées et sorties ! 

In [4]:
#On charle l'API voulue
from keras.models import Sequential

#Les couches 
from keras.layers import Dense, Activation

#Les algorithmes d'optimisation
from keras.optimizers import SGD

In [2]:
# On peut ensuite construire le modèle 
# En ajoutant les couches dans 'model'

model = Sequential()

# Dans la première couche, il faut toujours spécifier la dimension d'entrée ! Ici un vecteur de taille 784
model.add(Dense(32, input_dim=784))
model.add(Activation('relu'))

# ... 

In [5]:
# On coisit un algorithme d'optimisation 
# Ici un SGD classique, avec un pas d'apprentissage constant 
sgd = SGD(lr=0.001)

# On choisit 
# - une fonction de coût sur laquelle va s'effectuer la minimisation
# - on peut aussi ajoute des métriques, qui sont calculées pour chaque batch et sur les données 
#   de validation à la fin d'un epoch, ici la précision 
model.compile(optimizer=sgd,
              loss='categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
# On lanc ensuite l'entrainement ! 
# On indique les données d'entrainement (X_train et y_train)
# les paramètres batch_size et nb_epoch
# les données validations 

# y_train et y_val doivent être les labels encodés selon 'one-hot encoding'. 

history = model.fit(X_train, y_train
                    batch_size = 128,
                    nb_epoch = 10,
                    verbose=1,
                    validation_data=(X_val, y_val))

# model.fit() retourne un objet History qui contient les informations et scores calculés lors de l'entraînement. 
# avec verbose=1, pas besoin de fouiller dans history pour l'instant. 

In [None]:
# On applique ensuite notre model à de nouvelles données 
# On récupère une liste de vecteurs (un pour chaque exemple) qui correspondent aux probabilités d'appartenance à chaque classe. 
predictions = model.predict(X_test, batch_size = 128, verbose=1)

In [None]:
# Pour récupérer l'id de la classe qui l'emporte pour chaque exemple 
pred = predictions.argmax(axis=1)