# TD 6 : Le perceptron
---

Dans ce dernier TD, nous allons explorer le fonctionnement du perceptron, le véritable précurseur des algorithmes les plus puissants dans l'*apprentissage machine* d'aujourd'hui, tel l'apprentissage profond. 

À la base, il s'agit d'un classificateur binaire qui permet d'apprendre des associations *entrée*--*sortie* arbitraires tant que les entrées appartenant à des catégories différentes sont linéairement séparables. (Ce qui devient moins limitant si l'espace des entrées devient très haut-dimensionnelle.) 

L'équation du perceptron est la suivante :

$\hat y = {\rm sign}(\sum_j w_i x_i + b).$

Ici, $\hat y$ est la classification produite par le perceptron (la *sortie*), les paramètres $w_i$ projetent l'*entrée* $x$ (avec les composantes $x_i$) sur l'axe réelle et correspondent en quelque sorte à des poids synaptiques ; $b$ correspond enfin un paramètre de seuil.  


In [None]:
# imports 
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

Allons créer des entrées avec des catégories distinctes préscrites. Le but sera d'apprendre les poids synaptiques (et la valeur de $b$) qui permettront de faire une classification correcte pour des entrées futures. 

In [None]:
# Distinguer deux catégories de points
# (en 2D) rélatif par rapport à une droite
# séparant l'espace

def category(p, a=0.0, b=1.):
    """Return +1 (-1) for points
    above (below) straight line 
    defined by y = a + b*x"""
    px, py = p
    y = a + b*px
    return 2*(py>y) - 1 

# nombre de points 
n = 20

# choisir des points aléatoires 
ps = np.random.uniform(size=(n,2))

#  sortie souhaitée pour les points
cats = np.array([category(p) for p in ps])

# nous pouvons faciliter l'apprentissage en
# imposant une séparation de taille finie entre
# les points des deux catégories
sep = 0.01

ps[cats==1] *= 1-sep
ps[cats==1,1] += sep

ps[cats==-1] *= 1-sep
ps[cats==-1,0] += sep

# nous colorions les points en fonction de leur 
# catégorie en bleu ou rouge
colors = np.array(['b','r'])[(cats+1)//2]

fig, ax = plt.subplots()
ax.scatter(*ps.T, c=colors)
ax.set_xlabel('$x_1$')
ax.set_ylabel('$x_2$')

Reste l'implémentation de la règle d'apprentissage ! Nous allons commencer avec un seuil et des poids synaptiques aléatoires, puis mettre à jour le paramètres avec chaque nouveau point que nous considérons.

In [None]:
# initialisation des paramètres
w = np.random.uniform(-1,1,2)
b = np.random.uniform(-1,1)

# A chaque étape, nous pouvons plotter 
# comment le perceptron sépare l'espace 
# en deux catégories
x = np.array([0,1])

fig, ax = plt.subplots()
y = -(b+w[0]*x)/w[1]
ax.plot(x, y, 'k')
ax.fill_between(x, y, [max(1,*y),min(0,*y)][int(w[1]>0)], color='r', alpha=0.2)
ax.fill_between(x, y, [max(1,*y),min(0,*y)][int(w[1]<0)], color='b', alpha=0.2)

# --> plotter les points déjà utilisés selon 
# (par ex. pour les 5 premiers points)
i = 5
ax.scatter(ps[:i,0], ps[:i,1], c=colors[:i])

In [None]:
# ... notre code d'apprentissage ...