# Régression


## Enoncé


## Procédé

L'exercice consiste à procéder à toutes les étapes canoniiques d'unprojet d'apprentissage automatique :


1. Carger les données.
2. Définir le modèle Keras.
3. Compiler le modèle.
4. Entraîner le modèle.
5. Evaluer le modèle.
6. Faire des prédictions



### 1. Charger les données

Dans un premier temps, il faut récupérer les données. Pour ce qui nous intéresse, il existe deux jeux possibles :

* [Patients diabétiques à l'hôpital de Saint-Louis, Missouri](https://archive.ics.uci.edu/ml/datasets/Diabetes)
* [Enquête sur le diabête chez les indiens Pima](https://3wadata01.slack.com/archives/CR41KLYUS/p1582488678000100)

Pour l'instant nous sommes dans l'univers Python/Pandas bien connu.

In [None]:
import numpy as np
import pandas as pd

# load the dataset
dataset = pd.read_csv('pima-indians-diabetes.csv', delimiter=',')


### 2. Définir le modèle Keras

Pour définir le modèle, nous allons devoir indiquer le nombre et l'ordre des couches,ainsi que le type d'architecture de réseau.

Nous autons besoin de des sous-modules `models`et `layers` de Keras.

Nous voulons un modèle séquentiel avec :

* une couche d'entrée (**Input**)
    * la couche d'entrée n'est définit que par sa dimension : `shape`
* une couche cachée (**Dense**)
    * on peut éviter de déclarer explicitement la couche d'entrée en ajoutant le paramètre `input_dims`à la couche suivante
* une couche de sortie (**Dense**)
    * les couches autres que la couche d'entrée sont définies par leur nombre de neurones et leur fonction d'activation `activation`


In [None]:
# define the keras model
model = Sequential()
model.add(Dense(12, input_dim=8, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(1, activation='sigmoid'))


### 3. Compilation du modèle

Pour que le modèle soit opérationnel, il faut le compiler avec la méthode `compile`.

On lui fournit également trois valeurs :

* **loss** : l'estimateur de perte
* **optimizer** : l'optimiseur qui va guider la descente de gradient
* **metrics** : un ensemble de métriques pour évaluer la performance du réseau


In [None]:
# compile the keras model
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])


### 4. Entraînement du réseau

une fois cela fait, il suffit d'appeler la méthode `fit` pour apprendre au réseau à reconnaître les situations.

Cette methode prend au moins trois arguments :

* un ensemble d'exemples d'apprentissage
* un ensemble d'étiquettes (de même taille que le précédent)
* **epochs** : le nombre d'itérations à effectuer.


In [None]:
# fit the keras model on the dataset
model.fit(X, y, epochs=150, batch_size=10)


### 5.  Evaluation du modèle

Maintenant que le modèle est entraîne, la methode `evaluate` appliquée à un jeu de données de test nous donnera une estimation de la précision du modèle.

Ici, nous allon récupérer la métrique `accuracy` que nous avons indiquée lors de la compilation.


In [None]:
# evaluate the keras model
_, accuracy = model.evaluate(X, y)
print('Accuracy: %.2f' % (accuracy*100))


### 6. Faire des prédictions

Dernière étape du processus, on souhaite soumettre au réseau des cas nouveaux. Pour avoir une réponse, on utilise la méthode `predict`, appliqué à un ensemble d'exemples (pas nécessairement 1 seul).

Comme nous sommes face à unproblèm de classification, le neurone de sortiecontiendra une **probabilité** d'être 0 ou 1. Nous devrons donc arrondir la valeur.

Une autre option consiste à utiliser la méthode `predict_to_classes`


In [None]:
# make probability predictions with the model
predictions = model.predict(X)
# round predictions 
rounded = [round(x[0]) for x in predictions]

# make class predictions with the model
predictions = model.predict_classes(X)