# <center> Ajustements des poids </center>

---

**Source :** Aurélien Vannieuwenhuyze, Intelligence artificielle vulgarisée, le Machine Learning et le Deep Learning par la pratique, ENI, Paris, 2019, p.286-294.

---

## Importations

In [7]:
import pandas as pd

## Construction du dataframe

In [29]:
# données
data = {"Réussite à l'examen de mathématiques" : ["Oui", "Oui", "Non", "Non"],
      "Réussite à l'examen d'informatique" : ["Non", "Oui", "Oui", "Non"],
      "Admis" : ["Non", "Oui", "Non", "Non"]}

# conversion df
df = pd.DataFrame(data)

# conversion en csv
df.to_csv("df.csv", index=False)

# chargement du csv
df = pd.read_csv("df.csv")
df

Unnamed: 0,Réussite à l'examen de mathématiques,Réussite à l'examen d'informatique,Admis
0,Oui,Non,Non
1,Oui,Oui,Oui
2,Non,Oui,Non
3,Non,Non,Non


## Initialisation du perceptron

Nous allons initialiser notre perceptron avec une couche de deux neurones en
entrée correspondant chacun à la réussite aux examens et un neurone de sortie
qui permettra de classifier l'étudiant en tant qu'admis ou refusé dans l'université.
En complément des deux neurones d'entrée, nous allons en ajouter un
autre appelé biais (seuil) qui a pour but de contrôler la prédisposition du neurone
à s'activer ou non et qui prendra toujours la valeur 1.

### Les étapes d'apprentissage

#### Étape 1 : initialisation des poids

La première étape consiste à initialiser les poids. Cette initialisation se fait de façon aléatoire dans un intervalle compris entre -1 et 1 sauf pour le biais qui prendra la valeur 0.

- **Weight** (Poids) suivi du numéro du neurone et du numéro de la couche. 

Ainsi :
- **Wll** se lit poids du premier neurone de la première couche,
- **W21** poids du deuxième neurone de la première couche, ainsi de suite. 
- **Wb** signifiant poids (Weight) du biais (*bias* en anglais).

In [32]:
# initialisation des poids

W11 = -0.165955990594852
W21 = 0.4406489868843162
Wb = 0

#### Étape 2 : chargement des données de la première observation

La seconde étape consiste à charger la première observation contenue dans
notre jeu d'observations, venant alors alimenter les neurones Xl, X2.

In [62]:
# numériser les valeurs 
df.replace(["Oui", "Non"], [1, 0], regex=True)

Unnamed: 0,Réussite à l'examen de mathématiques,Réussite à l'examen d'informatique,Admis
0,1,0,0
1,1,1,1
2,0,1,0
3,0,0,0


In [64]:
# valeurs :
X1 = 1
X2 = 0

#### Étape 3: préactivation

Calcul de la somme pondérée des différents poids : 

`sommePonderee = valeur du biais * wb + (wll*Xl + w21 * X2))`

In [71]:
sommePonderee = 1*0 + (- 0.165955990594852 * 1 + 0.4406489868843162 * 0)
print(sommePonderee)

-0.165955990594852

#### Étape 4 : utilisation d'une fonction d'activation

Fonction d'activation = ici sigmoïde.

La fonction d'activation a pour rôle de réaliser la prédiction (nommée y) au niveau
de notre neurone et a pour formule (exp étant l'exponentielle) :

`y= 1 / (1 + exp(-somme_ponderee))`

`Y= 1/(1+exp(-(-0.165955990594852)))`

`Y= 0,45860596`

#### Étape 5 : calcul de l'erreur linéaire commise lors de l'apprentissage

La prédiction réalisée est de 0.363248, alors que nous attendions la valeur 0.
Nous allons donc calculer la différence entre la valeur attendue et la prédiction
réalisée pour déterminer l'erreur linéaire commise lors de l'apprentissage :

`Erreur= 0 - 0.45860596`

`Erreur = - 0.45860596`

#### Étape 6 : ajustement des poids synaptiques

Le perceptron va apprendre de ses erreurs en ajustant
les différents poids de chaque entrée jusqu'à atteindre une convergence. Cet
ajustement se fait en fonction de l'erreur calculée précédemment et en réalisant
la rétropropagation de l'erreur.

Cette rétropropagation s'effectue dans un premier en calculant le gradient se
formulant comme suit :

`Gradient = -1 * ERREUR * PREDICTION * (1-PREDICTION) * VALEUR ENTREE`

Dans notre cas, si l'on souhaite mettre à jour le poids **Wll** reliant l'entrée numéro
1 (Xl) et la sortie du neurone, nous avons besoin des données suivantes :
- L'erreur = - 0.45860596
- La prédiction = 0.45860596
- La valeur d'entrée Xl = 1

In [80]:
Gradient = -1 * - 0.45860596 * 0.45860596 * (1 - 0.45860596) * 1
print(Gradient)

0.11386568402904597


Une fois le gradient déterminé, nous allons utiliser le taux d'apprentissage qui
va nous permettre de progresser un peu plus dans la descente en calculant la
valeur dont devra être ajusté le poids **Wll**. Nous avons choisi de façon arbitraire
un taux d'apprentissage de **0,1**.

In [81]:
Valeur_ajustement_W11 = 0.11386568 * 0.1
print(Valeur_ajustement_W11)

0.011386568


Il ne nous reste plus qu'à mettre à jour le poids Wll en procédant comme suit :

`Nouveau W11 = W11 - Valeur ajustement W11`

In [86]:
Nouveau_W11 = -0.165955990594852 - 0.01138657
print(Nouveau_W11)

-0.177342560594852


#### Ajustement des poids de W21

In [87]:
Gradient = -1 * - 0.45860596 * 0.45860596 * (1 - 0.45860596) * 0
print(Gradient)

0.0


In [90]:
Valeur_ajustement_W21 = Gradient * 0.1
print(Valeur_ajustement_W21)

0.0


In [91]:
Nouveau_W21 = W21 - Valeur_ajustement_W11
print(Nouveau_W21)

0.4406489868843162


#### Ajustement des poids du biais

In [104]:
Gradient = -1 * - 0.45860596 * 0.45860596 * (1 - 0.45860596) * 1
print(Gradient)

0.11386568402904597


In [105]:
Valeur_ajustement_Wb = Gradient * 0.1
print(Valeur_ajustement_Wb)

0.011386568402904598


In [106]:
Nouveau_Wb = Wb - Valeur_ajustement_Wb
print(Nouveau_Wb)

-0.011386568402904598


Une fois les poids ajustés, il faut charger les données de la seconde observation et recommencer le processus jusqu'à ce que la fonction d'erreur soit minimisée.

---