In [None]:
%%html
<style>
h1 {
  border: 1.5px solid #333;
  padding: 8px 12px;
  background-color:#a0cfc0;
  position: static;
}  
h2 {
  padding: 8px 12px;
  background-color:#f0cfc0;
  position: static;
}   
h3 {
  padding: 4px 8px;
  background-color:#f0cfc0;
  position: static;
}   
</style>

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('seaborn-whitegrid')
import numpy as np

In [None]:
from IPython.display import Image, IFrame
from IPython.core.display import HTML
from IPython.display import Latex

# Réseau de neurones

## 1. Couche

Maintenant, étant donné une entrée $(x_1,...,x_n)$, on organise plusieurs perceptrons en **couches**. 

<img src="https://www.researchgate.net/profile/Facundo_Bre/publication/321259051/figure/fig1/AS:614329250496529@1523478915726/Artificial-neural-network-architecture-ANN-i-h-1-h-2-h-n-o.png"> </img>

#### Exemple 0 : un réseau de neurones avec 2 couches : 2 neurones (perceptron linéaire avec fonction d'activation ReLu) sur la 1ère couche, 1 neurone (perceptron affine avec fonction d'activation Heaviside) sur la 2ème couche.

<img src="img/neural_layer_ex1.png"> </img>

**Exercice** : vérifier que la sortie est $1$ si l'entrée est $(4,7)$.

_Conseil_ : nous pouvons utiliser un produit matriciel : en Python, $A \times B$ est calculé avec cette commande : ```np.dot(A,B)```


In [None]:
# Définition des fonctions d'activation
def ReLu(y):
    if y<0:
        return 0
    else:
        return y

def H(y):
    if y<0:
        return 0
    else:
        return 1

In [None]:
X = np.array([4, 7]) #entrée

W1 = np.array([[2, -1],[-3, 2]])
Y1 = ...
Y1 = [ReLu(y) for y in Y1]
W2 = ...
b2 = ...
Y2 = ...
Y2 = H(Y2)
print(Y2)

### Exemple 1
<img src="img/neural_layer_ex2.png"> </img>



#### 1ère couche, 1er neurone :
Est actif si $-x+3y \geq 0$.

In [None]:
x=np.linspace(-6, 6, 300)
y=np.array([t / 3 for t in x])
plt.plot(x, y, 'k--')
plt.fill_between(x, y, np.max(y) + 2, color = "green", alpha = 0.5)

plt.axis('equal')
plt.axis([-5, 5, -3, 3])
plt.show()

#### 1st layer, 2nd neuron :
Is active if $2x+y \geq 0$.

In [None]:
x = np.linspace(-6, 6, 300)
z = np.array([... for t in x])
plt.plot(x, z, 'k--')
plt.fill_between(x, z, np.max(z), color="green", alpha=0.5)

plt.axis('equal')
plt.axis([-5, 5, -3, 3])
plt.show()


#### 2ème couche, un neurone :

Ce perceptron réalise la fonction booléene ```x AND y``` (c.f. voir cours précédent).

#### Résultat des deux couches :

Le réseau de neurones a une sortie égale à $1$ à l'**intersection** des deux demi-plans où les neurones de la première couche sont égaux à $1$.


In [None]:
x = np.linspace(-6, 6, 300)
y = np.array([... for t in x])
z = np.array([... for t in x])
plt.plot(x, y, 'k--')
plt.plot(x, z, 'k--')
plt.fill_between(x, y, np.max(y) + 2, color="green", alpha=0.3)
plt.fill_between(x, z, np.max(z), color="green", alpha=0.3)
plt.fill_between(x, z, np.max(z), where=y < z, color="red", alpha=1)
plt.fill_between(x, y, np.max(z), where=y > z, color="red", alpha=1)
plt.axis('equal')
plt.axis([-5, 5, -3, 3])
plt.show()


### Exemple 2
<img src="img/neural_layer_ex3.png"> </img>



In [None]:
x = np.linspace(-6, 6, 300)
y = np.array([t / 3 for t in x])
z = np.array([-2 * t for t in x])
plt.plot(x, y, 'k--')
plt.plot(x, z, 'k--')
plt.fill_between(x, y, np.max(y) + 2, color="red", alpha=1)
plt.fill_between(x, z, np.max(z), color="red", alpha=1)
# plt.fill_between(x, z, np.max(z), where=y<z, color="red", alpha=0.5)
# plt.fill_between(x, y, np.max(z), where=y>z, color="red", alpha=0.5)
plt.axis('equal')
plt.axis([-5, 5, -3, 3])
plt.show()


Ce réseau de neurones envoie en sortie la valeur $1$ si l'entrée est dans l'__union__ des deux demi plans définis par la première couche. 

### Exercice :
Trouve un réseau de neurones donnant en sortie 1 sur la zone rouge, 0 sinon.
<img src="img/neural_layer_ex4.png"> </img>

In [None]:
# Fonction d'activation
def ...

# Fonction réalisant le réseau de neurones
def nnetwork(x, y):
    X = np.array([x, y])
    W1 = ...
    B1 = ...
    W2 = ...
    B2 = ...
    layer1 = ...
    layer1 = ...
    layer2 = ...
    layer2 = ...
    output = ...
    return output



In [None]:
# Vérification : on réalise nnetwork sur un ensemble de points qui prend la couleur rouge lorsque output = 1
n = 100
xmin = -6
xmax = 5
ymin = -5
ymax = 5
X = np.linspace(xmin, xmax, n)
Y = np.linspace(ymin, ymax, n)
for x in X:
    for y in Y:
        if nnetwork(x, y) == 1:
            plt.plot(x, y, '.r')
plt.axis('equal')
plt.axis([xmin, xmax, ymin, ymax])
xtick = np.linspace(xmin, xmax, xmax - xmin + 1)
ytick = np.linspace(ymin, ymax, ymax - ymin + 1)
plt.xticks(xtick)
plt.yticks(ytick)
plt.show()


## 2. Théorie

### Comment réaliser ```XOR``` ?

#### Exercice :
Nous avons vu qu'un seul neurone n'est pas suffisant pour réaliser l'opération ```XOR```. Trouvez un réseau de neurones à deux couches qui réalise l'opération ```XOR```.


Réponse : 
<img style="display: none" src="img/xor_neuralnetwork.png"></img>

### Ensemble réalisables : définition et propriétés

<div class="alert alert-success" role="alert">
Un ensemble $A$ est NN-réalisable s'il existe un réseau de neurones dont la sortie donne la valeur $1$ sur $A$, $0$ sinon.
   </div>

<div class="alert alert-danger" role="alert">
Tout $n$-polygone de $\mathbb{R}^2$ est NN-réalisable avec $n+1$ neurones. 
   </div>

<div class="alert alert-danger" role="alert">
Si $A$ et $B$ sont deux ensembles NN-réalisables alors :
   <ol> 
       <li> $A \cup B$ est NN-réalisable  ;</li>
    <li> $A \cap B$ est NN-réalisable ;</li>  
    <li> $\overline{A}$ est NN-réalisable ;</li>
    <li> $A \backslash B$ est NN-réalisable.</li>
    </ol>
    </div>

<div class="alert alert-danger" role="alert">
Tout  polygone de $\mathbb{R}^2$ est NN-realizable. Ainsi, tout courbe de Jordan (simple closed curve) peut être approchée par un réseau de neurones. 
   </div>

### Théorème d'approximation universel 
But : approcher toute fonction continue $\mathbb{R} \to \mathbb{R}$ par un réseau de neurones. Plus précisément, soit $f \colon [a;b] \to \mathbb{R}$ : on veut trouver un réseau de neurones dont la sortie $F(x) \approx f(x)$ pour tout $x \in [a;b]$. Pour cela, on suppose que la fonction d'activation de la sortie est l'identité $x \mapsto x$. Les autres neurones sont la fonction Heaviside.

#### Heaviside step functions

Premier cas trivial :
<img src="img/step_function1.png"></img>

On décale vers la gauche :
<img src="img/step_function2.png"></img>

ou à droite :
<img src="img/step_function3.png"></img>

Pour réaliser une marche vers le bas : <img src="img/step_function4.png"></img>
<img src="img/step_function5.png"></img>

#### Fonction rectangulaire
On ajoute simplement deux fonctions marche
<img src="img/rect_function.png"></img>

#### Fonctions en escalier
Il suffit d'ajouter des fonctions rectangulaires.
<img src="img/step_function6.png"></img>

**Exercice :** programmer ce réseau de neurones et afficher le graphe de la fonction ainsi définie.

#### Fonctions continues
On note que toute fonction continue $[a;b] \to \mathbb{R}$ peut être approchée uniformément par une fonction en escalier.

<img src="img/approx_function.png"></img>

### En dimension supérieure

#### Exercice :
Trouver un réseau de neurone qui réalise la fonction de deux variables dont voici une représentation graphique : 

<img src="img/step_function7.png"></img>