# **Perceptron simple et multicouche avec Keras**

[Tensorflow](https://www.tensorflow.org/) = bibliothèque open-source développée par Google Brain qui implémente des méthodes d'apprentissage automatique basées sur le principe des réseaux de neurones profonds (deep learning). API Python est disponible donc exploitable directement mais moins "directe" que `Keras`.

[Keras](https://keras.io/) =  librairie  Python qui encapsule l'accès aux fonctions proposées par plusieurs librairies  de  machine  learning,  en  particulier  Tensorflow. Keras n'implémente donc pas les  méthodes mais sert d'interface

## **1. Classification binaire sur données simulées**

### **1.1 Génération des données**

1. Générer :
>- un vecteur aléatoire $X_1$ de 2000 observation à valeurs dans $[-0.5, 0.5]$
>- un vecteur aléatoire $X_2$ de 2000 observation à valeurs dans $[0, 1]$

2. Construire la variable label $Y$ de la manière suivante : $Y = 1$ si $0.1*X_2 > X_1²$ et 0 sinon

3. Regrouper les 2 variables prédictives $X_1$ $X_2$ et la variable expliquée $Y$ dans un dataframe puis représenter graphiquement les données

4. Découper les données en échantillons d'entraînement et test (avec 500 observations dans le testset)

5. Calculer la répartition des classes (c'est-à-dire la proportion de labels valant "1") dans les échantillons test et train.  
Est-elle équilibrée ?  
Si ce n'est pas le cas, quel paramètre utiliser lors du `train_test_split` pour y remédier ?

### **1.2 Perceptron simple**

1. Importer les classes `Sequential` et `Dense` depuis la librairie adaptée. C'est quoi ce truc ?

2. Instancier le modèle `perceptron`

3. Ajouter une couche pour spécifier un perceptron simple en spécifiant les bons paramètres (on prendra une fonction d'activation sigmoïde).

4. Récupérer la configuration de votre modèle. À quoi correspond le paramètre `use_bias` ?

5. Ci-dessous une répresentation visuelle de notre réseau. Quelles sont les valeurs (théoriques) en entrée et en sortie du neurone de la couche de sortie ? Que représente la valeur en sortie ?  
<img src="images/perceptron_simple.png">

6. Spécifier les paramètres d'apprentissage avec la méthode `compile`. On utilisera l'entropie croisée binaire comme fonction de perte, Adam comme algorithme d'optimisation et l'accuracy comme métrique.

7. Entraîner le réseau afin d'en estimer les paramètres. Fixer notamment les hyperparamètres `epochs` et `batch_size`. Que sont-ils ?

8. Récupérer les poids estimés et les replacer dans le réseau dessiné au dessus.

9. Calculer les prédictions sur le testset avec `predict`. Que sont ces valeurs ?

10. Récupérer à partir de ces valeurs prédites, la classe prédite

11. Présenter au moins 2 mesures d'évaluation du modèle (adapté au problème traité bien sûr !) en utilisant des fonctions de `sklearn.metrics`

12. La même avec la méthode `evaluate`. Qu'est-ce que vous obtenez ?

### **1.3 Perceptron multicouche**

1. Reprendre toutes les étapes de la partie précédente pour construire et entraîner (partie 1.2, questions 1 à 7) un réseau à 3 couches de la forme suivante :

<img src="images/perceptron_multi.png">

2. Récupérer les poids et les replacer "à la main" dans le schéma du réseau de neurones

3. Et pour finir, on fait quoi ? Y a plus qu'à le faire alors.

## **2. Application à un problème multi-classes**

On va utiliser des données sur le vin disponibles sur le site UCI. Le but est de classifier 3 vignerons d'une même région à partir des caractéristiques des vins qu'ils produisent.

### **2.1 Les données**

1. Récupérer les données WINE [ici](https://archive.ics.uci.edu/ml/datasets/wine). Si vous voulez automatiser la récupération, c'est toujours un bon exo donc allez-y mais c'est pas l'objet du tp donc perdez pas trop de temps là-dessus. Les mettre dans un dataframe tout beau tout propre.

2. Quelques étapes usuelles avant d'aller plus loin : y a quoi dans le dataset, quelle est la variable d'intérêt, quelques stats descriptives, visualisations, etc...  

### **2.2 Preprocessing**

1. Keras  ne  sait  pas  manipuler  directement  une  variable multi-classe. Il faut la transformer en une série d’indicatrices. À vous de jouer (il y a une méthode `to_categorical` quelque part)

2. Découpage en échantillons train et test (avec 40 observations dans le test)

3. Les réseaux de neurones étant très dépendant des échelles des différentes variables, il faut standardiser les données avec un StandardScaler.  
Vérifier les moyennes et écart-types des variables après transformation. Qu'est-ce que vous devez avoir ?

### **2.3 Modélisation et évaluation**

1. Construire et entraîner un perceptron simple adapté au problème

2. Évaluer le modèle

3. Essayer d'améliorer votre modèle en ajoutant une couche cachée. Quel problème se pose lorsqu'on ajoute trop de couches ?