<a href="https://colab.research.google.com/github/AymanBard/MachineLearningOption/blob/main/%5B01%5D_perceptron.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Le perceptron


## Données `Iris`
On commence par récupérer les données à classifier `Iris`. Les attributs (longueur et largeur de la sépale) seront dans $\mathbb{R}^2$, et pour chaque point $x_i \in \mathbb{R}^2$, il faudra prédire sa classe d'appartenance $y_i \in \{-1, 1\}$, où $-1$ correspond à la fleur `Iris Setosa` et $1$ à `Iris Versicolor`.

In [None]:
from sklearn import datasets

donnees = datasets.load_iris()
filtre = donnees['target'] != 2  # Initialement le jeu de données contient une troisième classe, Iris-Virginica, qu'on ignore
attributs = donnees['data'][filtre, :2]  # Initialement le jeu de données contient deux autres attributs, longueur et largeur de la pétale, qu'on ignore
classes = donnees['target'][filtre]
classes[classes == 0] = -1  # On remplace la classe 0 par -1
pos_class = classes == 1

In [None]:
donnees['target']

In [None]:
donnees['data']

In [None]:
print('nombre de donnes', len(attributs))

In [None]:
print('attributs des donnes', attributs)

In [None]:
print('classes des donnes', classes)

In [None]:
import matplotlib.pyplot as plt
plt.plot(attributs[~pos_class, 0], attributs[~pos_class, 1], '*b')
plt.plot(attributs[pos_class, 0], attributs[pos_class, 1], '*r')
plt.legend(['Iris Setosa', 'Iris Versicolor'])
plt.xlabel('Longueur sépale')
plt.ylabel('Largeur sépale')
plt.show()

## Initialisation et affichage d'un neurone formel

In [None]:
import numpy as np

# On génère des poids d'un neurone formel aléatoirement
w = np.random.randn(2)
b = np.random.randn(1)

In [None]:
# On visualise les données et la ligne séparatrice produite par le neurone formel
plt.plot(attributs[pos_class, 0], attributs[pos_class, 1], '*b')
plt.plot(attributs[~pos_class, 0], attributs[~pos_class, 1], '*r')
o = np.arange(np.min(attributs[:, 0]) - 1, np.max(attributs[:, 0]) + 1, .1)
a = -(w[0] * o + b) / w[1]
plt.plot(o, a, '-g')
plt.legend(['Classe négative', 'Classe positive', 'Neurone formel'])
plt.show()

## Exercices

### 1
Pour une certaine donnée $x_i$, afficher la classe $\hat{y}_i$ prédite par le neurone formel. Pour ce faire vous pouvez utiliser la fonction `np.dot` qui calcule le produit scalaire entre deux vecteurs, et `np.sign` qui retourne le signe d'un réel.




In [None]:
'''             Exemple d'utilisation de np.dot et np.sign           '''

print('x_3', attributs[3])  # La quatrième donnée
print(f'Produit scalaire entre x_3 et x_3 = {np.dot(attributs[3], attributs[3])}')
print('Test de la fonction signe : ', np.sign(-9.34), np.sign(0.25))

In [None]:
i = 5
prediction_xi = 'A REMPLACER PAR DU CODE'
print(f'donnée x_{i} : {attributs[i]}')
print(f'classe y_{i} : {classes[i]}')
print(f'classe prédite : {prediction_xi}')

### 2
Compter le nombre de mauvaises classifications. Est-ce que cela correspond à un décompte visuel sur le graphique plus haut?

### 3
Coder l'algorithme du perceptron puis visualiser le résultat. Augmenter le nombre d'itérations jusqu'à ce que toutes les données soient bien classées.

### 4

Partant de $\theta_0 = (b_0, w_0) = 0$, lancer l'algorithme du perceptron et après chaque mise à jour $k$ où $(x^{k}, y^{k})$ est la donnée mal classée ayant provoqué la mise à jour
- Verifier si $y^{k}(w_{t+1}\cdot x^{k} + b_{t+1}) > y^{k}(w_{t}\cdot x^{k} + b_{t})$.
- Vérifier si $y^{k'}(w_{t+1}\cdot x^{k'} + b_{t+1}) > y^{k'}(w_{t}\cdot x^{k'} + b_{t})$ pour tout $k' \neq k$

### 5

Relancer votre code avec les données ci-dessous, générées aléatoirement. Vérifier que le Perceptron trouve un classifieur pour ces données.

In [None]:
data_per_class = 15  # on génère 15 points par classe
attributs = np.vstack([np.random.randn(data_per_class, 2) + np.array([[0, 3]]), np.random.randn(data_per_class, 2) + np.array([[3, 0]])])
classes = np.hstack([np.ones(data_per_class), -1 * np.ones(data_per_class)])
pos_class = classes == 1

### 6

Modifier les attributs d'une des données de sorte que les données ne soient plus linéairement séparables. Vérifier que la solution retournée par le Perceptron ne classifie plus toutes les données correctement.