In [None]:
%%html
<style>
h1 {
  border: 1.5px solid #333;
  padding: 8px 12px;
  background-color:#a0cfc0;
  position: static;
}  
h2 {
  padding: 8px 12px;
  background-color:#f0cfc0;
  position: static;
}   
h3 {
  padding: 4px 8px;
  background-color:#f0cfc0;
  position: static;
}   
</style>

# Introduction à l'Apprentissage Automatique et la Règle d'Apprentissage du Perceptron

## Introduction

Dans ce notebook, nous allons approfondir la notion d'apprentissage automatique en introduisant la règle d'apprentissage du perceptron. Précédemment, nous avons défini les notions de perceptron et de classifieur linéaire. Nous allons maintenant voir comment ces concepts s'inscrivent dans le cadre de l'apprentissage supervisé, en utilisant une règle d'apprentissage spécifique pour ajuster les poids du perceptron en fonction des erreurs commises.

## Rappel : Perceptron et Classifieur Linéaire

Le **perceptron** est un modèle de neurone artificiel simple qui effectue une classification binaire en séparant les données par une frontière linéaire. Il calcule une somme pondérée de ses entrées et applique une fonction d'activation pour produire une sortie.

Le **classifieur linéaire** est un algorithme de classification qui fait des prédictions basées sur la combinaison linéaire des caractéristiques d'entrée. Il cherche à trouver un hyperplan qui sépare les données de différentes classes.

## Introduction à l'Apprentissage Automatique

L'**apprentissage automatique** (ou *machine learning*) est un domaine de l'intelligence artificielle qui permet aux systèmes informatiques d'apprendre et d'améliorer leurs performances à partir de données, sans être explicitement programmés pour chaque tâche. Il s'appuie sur des algorithmes capables de détecter des motifs et de faire des prédictions ou des décisions basées sur des données.

## La Règle d'Apprentissage du Perceptron

La **règle d'apprentissage du perceptron** est un algorithme d'apprentissage supervisé qui ajuste les poids du perceptron en fonction de l'erreur entre la sortie prédite et la sortie désirée. La règle d'apprentissage du perceptron utilise des étiquettes de classe connues pour guider le processus d'apprentissage. C'est un apprentissage _supervisé_.

### Principe de la Règle d'Apprentissage du Perceptron

Pour chaque exemple d'entraînement $(\mathbf{x}, t)$, où $\mathbf{x}$ est le vecteur d'entrée et $t$ la sortie cible (0 ou 1), le perceptron effectue les étapes suivantes :

1. **Calcul de la sortie prédite** :
   $$
   y = H(\mathbf{w} \cdot \mathbf{x})
   $$
   où \(H\) est la fonction de Heaviside (fonction seuil).

2. **Mise à jour des poids** :
   - Si \(t = 1\) et \(y = 0\), alors :
     $$
     \mathbf{w}_{\text{nouveau}} = \mathbf{w}_{\text{ancien}} + \mathbf{x}
     $$
   - Si \(t = 0\) et \(y = 1\), alors :
     $$
     \mathbf{w}_{\text{nouveau}} = \mathbf{w}_{\text{ancien}} - \mathbf{x}
     $$
   - Sinon, les poids restent inchangés.

### Exemple d'Application



#### Learning rule

Cette règle d'apprentissage est un exemple d'apprentissage supervisé. On donne une collection de $(x,t)$ où $x$ est une entrée et $t$ la sortie attentue "target". A chaque calcul, on compare la sortie effective avec la sortie attendue. 

Ensuite, la règle ajuste les paramètres de telle sorte que le perceptron évolue pour être plus proche de la sortie attendue. 

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
# Fonction Heavyside
def H(y):
    if y<0:
        return 0
    else:
        return 1

#### Exemple de problème
Il y a 3  paire d'input/target :
$$x_1 = (1,2) \,;\, t_1 = 1 \qquad x_2 = (-1,2) \,;\, t_2 = 0 \qquad x_3 = (0,-1) \,;\, t_3 = 0$$

Le perceptron doit être défini de $\mathbb{R}^2$ dans $\mathbb{R}$ soit 2 entrées et 1 sortie. Pour simplifier ici, on ne cherche pas de biais donc on cherche deux poids $a_1,a_2$. La fonction d'activation choisie est Heaviside.

In [None]:
x=[];t=[]
x.append(np.array([1,2])) ; t.append(...)
x.append(np.array([-1,2])) ; t.append(...)
x.append(np.array([0,-1])) ; t.append(...)

#### Règles d'apprentissage pas à pas
On prend un vecteur poids $w = (a_1,a_2)$ avec des valeurs arbitraires, par exemple : $w = (1.0, -0.8)$. 

Ensuite on exécute le preceptron avec l'entrée $x_1$ : la sortie $y_1$ est égale à $0 \neq t_1$.



In [None]:
w = np.array([1.0,-0.8])
y = sum(w*x[0])
print(y)
y = H(y)
print(y)
y == t[0] #test if output y_1 is equal to t_1

**Règle** : si $t=1$ et $y=0$ alors $w_{new} := w_{old} + x$.

Alors on exécute le perceptron avec l'entrée $x_2$ et les nouveaux poids :

In [None]:
w = ...
y = H(sum(w*x[1]))
y == t[1]

**Règle** : si $t=0$ et $y=1$ alors $w_{new} := w_{old} - x$.

Alors on exécute le perceptron avec l'entrée $x_3$ et les nouveaux poids :

In [None]:
w = w ...
y = H(sum(w*x[2]))
y == t[2]

In [None]:
y - t[2]

On applique la règle précédente :

In [None]:
w = w ...

Puis on vérifie si la sortie $y$ est égale à la cible $t$ :

In [None]:
for i in range(3):
    y = H(sum(w*x[i]))
    print(y == t[i])

#### Unifier les règles d'apprentissage


Cette règle peut être étendue pour entrainer un biais. 

#### Exercice :
Ecrire un programme qui applique toutes les règles ci-dessus avec différents poids au départ. Vérifier les résultats.

In [None]:
n = len(x)
w = np.array([-0.5,-0.9])
for i in range(n):
    ...
for i in range(3):
    y = H(sum(w*x[i]))
    print(y == t[i])

In [None]:
import numpy as np
import matplotlib.pyplot as plt

#### Définition des Données d'Entrée et des Sorties Cibles

Nous réutilisons le jeu de données suivant :

- **Entrées** :
  $$
  \mathbf{x}_1 = \begin{bmatrix}1 \\ 2\end{bmatrix}, \quad \mathbf{x}_2 = \begin{bmatrix}-1 \\ 2\end{bmatrix}, \quad \mathbf{x}_3 = \begin{bmatrix}0 \\ -1\end{bmatrix}
  $$
- **Sorties cibles** :
  $$
  t_1 = 1, \quad t_2 = 0, \quad t_3 = 0
  $$

In [None]:
# Données d'entrée
X = []
X.append(np.array([1, 2]))
X.append(np.array([-1, 2]))
X.append(np.array([0, -1]))

# Sorties cibles
T = [1, 0, 0]

#### Fonction d'Activation de Heaviside

In [None]:
def H(v):
    return 1 if v >= 0 else 0

#### Initialisation des Poids
Nous initialisons les poids du perceptron avec des valeurs aléatoires.


In [None]:
w = np.array([1.0, -0.8])
print("Poids initiaux :", w)

#### Application de la Règle d'Apprentissage du Perceptron

Nous allons appliquer la règle d'apprentissage du perceptron pour chaque exemple d'entraînement.

In [None]:
# Nombre d'exemples
n = len(X)

# Taux d'apprentissage
eta = 1  # Pour simplifier, nous utilisons un taux d'apprentissage de 1

# Phase d'apprentissage
for i in range(n):
    x_i = ...
    t_i = ...
    y_i = ...
    error = ...
    w = w + eta * ... * ...
    print(f"Après l'exemple {i+1}, poids mis à jour : {w}")

#### Vérification des Résultats

Nous vérifions maintenant si le perceptron classifie correctement tous les exemples après l'apprentissage.

In [None]:
# Phase de test
for i in range(n):
    x_i = ...
    t_i = ...
    y_i = ...
    print(f"Exemple {i+1} : Sortie prédite = {y_i}, Sortie réelle = {t_i}, Correct = {y_i == t_i}")

#### Visualisation de la Frontière de Décision


In [None]:
# Création d'un maillage pour la visualisation
xx, yy = np.meshgrid(np.linspace(-2, 4, 200), np.linspace(-2, 4, 200))
grid = np.c_[xx.ravel(), yy.ravel()]
Z = np.array([H(np.dot(w, point)) for point in grid])
Z = Z.reshape(xx.shape)

# Visualisation
plt.contourf(xx, yy, Z, alpha=0.3)
plt.scatter([X[i][0] for i in range(n)], [X[i][1] for i in range(n)], c=T, edgecolors='k')
plt.xlabel('x1')
plt.ylabel('x2')
plt.title('Frontière de décision du perceptron après apprentissage')
plt.show()

*La figure ci-dessus montre la frontière de décision du perceptron après apprentissage.*


## Exercice

Écrivez un programme qui applique les règles d'apprentissage données ci-dessus avec différents poids initiaux. Vérifiez si le perceptron parvient à classer correctement les exemples après l'apprentissage.

### Solution

In [None]:
# Données d'entrée (inchangées)
X = []
X.append(np.array([1, 2]))
X.append(np.array([-1, 2]))
X.append(np.array([0, -1]))

# Sorties cibles (inchangées)
T = [1, 0, 0]

# Fonction d'activation de Heaviside (inchangée)
def H(v):
    return 1 if v >= 0 else 0

# Poids initiaux différents
w = np.array([-0.5, -0.9])
print("Poids initiaux :", w)

# Nombre d'exemples
n = len(X)

# Phase d'apprentissage
for epoch in range(10):  # Nombre d'époques d'apprentissage
    print(f"\nÉpoque {epoch+1}")
    for i in range(n):
        x_i = X[i]
        t_i = T[i]
        y_i = H(np.dot(w, x_i))
        error = t_i - y_i
        w = w + error * x_i
        print(f"Exemple {i+1}, Erreur = {error}, Poids mis à jour : {w}")


#### Vérification des Résultats


In [None]:
# Phase de test
print("\nPhase de test après apprentissage")
for i in range(n):
    x_i = X[i]
    t_i = T[i]
    y_i = H(np.dot(w, x_i))
    print(f"Exemple {i+1} : Sortie prédite = {y_i}, Sortie réelle = {t_i}, Correct = {y_i == t_i}")

### Bonus : Visualisation de l'Évolution des Poids

Nous pouvons représenter graphiquement l'évolution de la frontière de décision du perceptron au cours des itérations.


In [None]:
# Réinitialisation des poids
w = np.array([-0.5, -0.9])

# Stockage des poids pour la visualisation
weights_history = [w.copy()]

# Phase d'apprentissage avec stockage des poids
for epoch in range(10):
    for i in range(n):
        x_i = X[i]
        t_i = T[i]
        y_i = H(np.dot(w, x_i))
        error = t_i - y_i
        w = w + error * x_i
        weights_history.append(w.copy())

# Visualisation de l'évolution de la frontière de décision
plt.figure(figsize=(10, 6))
for idx, w in enumerate(weights_history):
    if idx % 2 == 0:  # Pour éviter un trop grand nombre de courbes
        # Calcul de la frontière de décision
        x_vals = np.linspace(-2, 4, 100)
        y_vals = -(w[0]/w[1]) * x_vals
        plt.plot(x_vals, y_vals, label=f'Itération {idx}')

# Données
plt.scatter([X[i][0] for i in range(n)], [X[i][1] for i in range(n)], c=T, edgecolors='k')

plt.xlabel('x1')
plt.ylabel('x2')
plt.title("Évolution de la frontière de décision du perceptron")
plt.legend()
plt.show()

*La figure ci-dessus montre l'évolution de la frontière de décision du perceptron au cours des itérations.*

## Conclusion

La règle d'apprentissage du perceptron est un algorithme supervisé simple mais puissant pour l'ajustement des poids dans un réseau neuronal. Elle illustre comment un modèle peut apprendre à partir de données étiquetées en minimisant l'erreur entre la sortie prédite et la sortie désirée. Bien que le perceptron ne puisse résoudre que des problèmes linéairement séparables, il constitue une base importante pour comprendre des réseaux neuronaux plus complexes et des algorithmes d'apprentissage plus avancés.