# Le Titanic : Deep Learning

## Réseaux denses avec Sklearn

<img src="http://scikit-learn.org/stable/_images/multilayerperceptron_network.png">

Détails sur les paramètres :  
http://scikit-learn.org/stable/modules/neural_networks_supervised.html

In [1]:
# Directive pour afficher les graphiques dans Jupyter
%matplotlib inline
# Pandas : librairie de manipulation de données
# NumPy : librairie de calcul scientifique
# MatPlotLib : librairie de visualisation et graphiques
# SeaBorn : librairie de graphiques avancés
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns
from sklearn import metrics

In [2]:
# Lecture des datasets
data_train = pd.read_csv('titanic_train0.csv')
data_test = pd.read_csv('titanic_test0.csv')
data_train.head()

Unnamed: 0,survived,sex,age,sibsp,parch,fare,pclass_1,pclass_2,pclass_3,embarked_C,embarked_Q,embarked_S
0,0,0,-0.642116,0,0,-0.490691,0,0,1,0,0,1
1,0,0,0.140274,0,0,-0.493509,0,0,1,0,1,0
2,1,1,-0.428737,3,2,4.441355,1,0,0,0,0,1
3,0,0,0.175837,0,0,3.445682,1,0,0,1,0,0
4,1,1,-1.566759,1,1,-0.140674,0,1,0,0,0,1


In [3]:
X_train = data_train.drop(['survived'], axis=1)
Y_train = data_train.survived
X_test = data_test.drop(['survived'], axis=1)
Y_test = data_test.survived

In [4]:
# Importation de la librairie "neural networks" de sklearn
from sklearn.neural_network import MLPClassifier

In [6]:
# Création d'un réseau dense avec 2 couches cachées de 5 et 3 neurones
mlp =  MLPClassifier(hidden_layer_sizes=(5,3))

In [7]:
mlp.fit(X_train, Y_train)

MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(5, 3), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=None,
       shuffle=True, solver='adam', tol=0.0001, validation_fraction=0.1,
       verbose=False, warm_start=False)

In [8]:
Y_mlp = mlp.predict(X_test)

In [9]:
mlp_score = metrics.accuracy_score(Y_test, Y_mlp)
print(mlp_score)

0.820610687023


In [10]:
cm = metrics.confusion_matrix(Y_test, Y_mlp)
print(cm)

[[134  26]
 [ 21  81]]


### Exercice : tester plusieurs possibilités de couches cachées

### Exercice : tester les réseaux de neurones sur le dataset pour la prédiction du diabète


## Deep learning avec Keras

Pour installer keras dans Anaconda, dans un terminal lancer :  
conda install -c conda-forge keras
(environnement Theano par defaut)

Pour un environnement Tensorflow :  
http://inmachineswetrust.com/posts/deep-learning-setup/

Avec GPU sous windows :  
http://www.heatonresearch.com/2017/01/01/tensorflow-windows-gpu.html

In [None]:
# Importation des modèles standard (dense) sous Keras
from keras.models import Sequential
from keras.layers import Dense
import numpy as np

In [None]:
X_train = X_train.as_matrix()
X_test = X_test.as_matrix()

In [None]:
# Création du modèle

model = Sequential()
model.add(Dense(5, input_dim=X_train.shape[1], activation='relu'))
model.add(Dense(3, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

In [None]:
# Compilation du modèle
# Erreur quadratique
# Descente de gradient stochastique

model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

In [None]:
# Apprentissage
# 150 itérations (epoch)
# mini-batch de 10

model.fit(X_train, Y_train, nb_epoch=200, batch_size=10)

In [None]:
# Performance du modèle

scores = model.evaluate(X_test, Y_test)
print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

### Exercice : Tester différents paramètres (initialisation, optimizer, couches, ...)

### Exercice : tester Keras sur le dataset du diabete