# Devoir  #6 : Le perceptron
---

Dans ce dernier devoir, purement "bonus", vous allez pouvoir explorer la convergence du perceptron en fonction du taux d'apprentissage $\eta$, et quantifier l'erreur faite par la classification en fonction du nombre des données (associations "entrée-sortie") déjà considérés par l'algorithme.


In [1]:
# imports 
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

### E.1 : Création des données d'entraînement

Le but sera d'apprendre de classifier correctement des points situés dans les deux demi-espaces $x_2>0$ vs. et $x_2<0$, séparés par une distance $2a$, tel que 
   - les points de la catégorie "+1" sont situés dans $x_1\in(-1,1),\ x_2\in(a,1)$, et 
   - les points de la catégorie "-1" sont situés dans $x_1\in(-1,1),\ x_2\in(-1,-a)$.

Créez une liste de `n = 1000` points qui sont aléatoirement choisis de l'une ou l'autre catégorie, et stockez leurs catégories respectives. Plottez et colorier les points selon leur catégorie en suivant l'exemple du TD. Choissisez d'abord `a = 0.1`.

**Indice 1 :** Créez d'abord la matrice contenant tous vos points avec `np.zeros`, puis utilisez `np.random.uniform(lower, upper, size)` séparément pour les valeurs de $x_1$ et $x_2$ selon les critères ci-dessus. 

**Indice 2 :** Pour choisir un sous-ensemble des points qui doit être de la catégorie opposée, vous pouvez par ex. utiliser `np.random.choice(n, size=n//2 replace=False)` pour déterminer des indices tirés aléatoirement parmi les `n` points, que vous pouvez utiliser pour attribuer/changer la catégorie pour la moitié des points. (Pour l'utilisation de `np.random.choice`, voir aussi TD5/DM5 .) D'autres manières de faire existent et seront bien sûr également acceptés.

In [1]:
# votre code

### E.2 : Algorithme d'apprentissage du Perceptron

Maintenant, il faut apprendre les poids $w_1, w_2$ et le seuil $b$ du Perceptron pour correctément classifier ces points. Au lieu d'afficher graphiquement l'avancement de l'apprentissage et de la performance, nous allons mesurer la progression en calculant l'erreur $e$ faite dans la classification sur l'ensemble des points déjà présentés, selon la formule
$$e = \frac{1}{2M} \sum_i^M |\hat y^{(M)}_i - y_i|,$$
où $M$ est le nombre des points déjà considérés ($M\leq n$), et où $\hat y^{(M)}_i\in\{-1,1\}$ est la classification faite par le perceptron du point $i$ avec les paramètres actuels, c'est-à-dire après la présentation des $M$ points. Enfin, les $y_i\in\{-1,1\}$ sont les vraies catégories. 

Avec cette définition, une classification correcte de tous les points donnerait $e=0$, et une classification arbitraire (la moitié des points est classifiée correctement) donnerait $e=0.5$

En suivant l'exemple du cours, implémentez l'algorithme d'apprentissage du Perceptron avec un taux d'apprentissage $\eta=0.1$, et suivez la performance en calculant l'erreur rélative définie ci-dessus après chaque itération. Plottez l'erreur rélative $e$ en fonction du temps à la fin de l'apprentissage.

In [2]:
# ... votre code ...

### E.3 : Étude des paramètres : $\eta$

Comparez la performance de l'algorithme pour différentes valeurs de $\eta$, `etas = [0.02, 0.05, 0.1, 0.2, 0.5]` (toujours pour `a = 0.1`). Pour cela, plottez l'évolution de l'erreur rélative ensemble dans un seul plot.

Pour rendre la tâche systématique est comparable, commencez toujours avec les mêmes valeurs initiales pour les paramètres : `w = np.array([1,-1])` et `b = 0`. 

In [3]:
# ... votre code ...

### E.4 : Étude de l'influence de la "séparabilité" des points

Comparez la performance de l'algorithme pour différentes valeurs de $a$, `as = [0, 0.02, 0.05, 0.1, 0.2]`, toujours pour le même taux d'apprentissage `eta = 0.1`.  (Notez que cela vous oblige à générer chaque fois un nouvel ensemble de données d'entraînement.) Pour comparez, plottez l'évolution de l'erreur rélative pour chaque cas ensemble dans un seul plot. 

Pour rendre la tâche systématique est comparable, commencez toujours avec les mêmes valeurs initiales pour les paramètres : `w = np.array([1,-1])` et `b = 0`. 

In [4]:
# ... votre code ...
