# Réseaux de Neurones Profonds  
Ajoutez des couches cachées à votre réseau pour découvrir des relations complexes.  

## Introduction  
Dans cette leçon, nous allons voir comment construire des réseaux de neurones capables d'apprendre les types de relations complexes pour lesquels les réseaux de neurones profonds sont réputés.  

L'idée clé ici est la **modularité**, c'est-à-dire construire un réseau complexe à partir d'unités fonctionnelles plus simples. Nous avons déjà vu comment une unité linéaire calcule une fonction linéaire. Maintenant, nous allons voir comment **combiner et modifier ces unités individuelles** pour modéliser des relations plus complexes.  

#### Couches  
Les réseaux de neurones organisent généralement leurs neurones en couches. Lorsque nous regroupons des unités linéaires partageant un ensemble commun d'entrées, nous obtenons une couche dense.  

- *Représentation visuelle : Une couche d'entrée de trois cercles connectée à une couche dense de deux cercles.*  
- *Une couche dense de deux unités linéaires recevant deux entrées et un biais.*  

Vous pouvez considérer chaque couche d'un réseau de neurones comme effectuant une transformation relativement simple. À travers une pile profonde de couches, un réseau de neurones peut transformer ses entrées de manière de plus en plus complexe. Dans un réseau de neurones bien entraîné, chaque couche est une transformation qui nous rapproche un peu plus de la solution.  

#### Plusieurs Types de Couches  
Une "couche" dans **Keras** est un concept très général. Une couche peut être, essentiellement, n'importe quel type de transformation de données. De nombreuses couches, comme les couches **convolutives et récurrentes**, transforment les données en utilisant des neurones et diffèrent principalement par le schéma de connexions qu'elles forment. D'autres sont utilisées pour l'**ingénierie des caractéristiques** ou simplement pour des **opérations arithmétiques simples**. Il existe tout un monde de couches à découvrir — explorez-les !  


## La Fonction d'Activation  
Cependant, il s'avère que deux couches denses sans rien entre elles ne sont pas meilleures qu'une seule couche dense par elle-même. Les couches denses seules ne peuvent jamais nous faire sortir du monde des lignes et des plans. Nous avons besoin de quelque chose de **non linéaire**. Nous avons besoin de fonctions d'activation.  

Sans **fonctions d'activation**, les réseaux de neurones ne peuvent apprendre que des relations linéaires. Pour modéliser des courbes, nous devons utiliser des fonctions d'activation.  
Une fonction d'activation est simplement une fonction que nous appliquons à chaque sortie d'une couche (ses activations). La plus courante est la **fonction rectifiée (ReLU)** :  
**max(0, x)**  

*Graphique de la fonction ReLU : une ligne y = x pour x > 0 et y = 0 pour x < 0, formant une forme de charnière comme '_/'*  
La fonction ReLU a un graphique qui est une ligne avec la partie négative "rectifiée" à zéro. Appliquer cette fonction aux sorties d'un neurone introduit une courbure dans les données, nous éloignant des simples lignes.  

Lorsque nous attachons **la fonction ReLU** à une unité linéaire, nous obtenons une unité linéaire rectifiée (ReLU). (Pour cette raison, il est courant d'appeler la fonction ReLU "fonction d'activation ReLU".) Appliquer une activation ReLU à une unité linéaire signifie que la sortie devient **max(0, w * x + b)**, que nous pourrions représenter dans un diagramme comme :  

*Diagramme d'une seule ReLU : comme une unité linéaire, mais au lieu d'un symbole '+', nous avons maintenant une charnière '_/'*  
*Une unité linéaire rectifiée.*  

#### Empiler des Couches Denses  
Maintenant que nous avons une certaine non-linéarité, voyons comment empiler des couches pour obtenir des transformations de données complexes.  

*Représentation visuelle : une couche d'entrée, deux couches cachées et une couche linéaire finale.*  
Une pile de couches denses forme un réseau "**entièrement connecté**".  

Les couches avant la couche de sortie sont parfois appelées "**cachées**" car nous ne voyons jamais directement leurs sorties.  

Remarquez que la dernière couche (la couche de sortie) est une unité linéaire (c'est-à-dire sans fonction d'activation). Cela rend ce réseau approprié pour une tâche de **régression**, où nous essayons de prédire une valeur numérique arbitraire. D'autres tâches (comme la **classification**) pourraient nécessiter une fonction d'activation sur la sortie.  

#### Construire des Modèles Séquentiels  
Le modèle séquentiel que nous avons utilisé connecte une liste de couches dans l'ordre, de la première à la dernière : la première couche reçoit l'entrée, la dernière couche produit la sortie. Cela crée le modèle illustré ci-dessus :  


In [15]:
from tensorflow import keras
from tensorflow.keras import layers

model = keras.Sequential([
    # les couches cachées ReLU
    layers.Dense(units=4, activation='relu', input_shape=[2]),
    layers.Dense(units=3, activation='relu'),
    # la couche de sortie linéaire
    layers.Dense(units=1),
])

Assurez-vous de passer toutes les couches ensemble dans une liste, comme `[couche, couche, couche, ...]`, au lieu de les passer comme des arguments séparés. Pour ajouter une fonction d'activation à une couche, il suffit de donner son nom dans l'argument `activation`.  

#### À Vous de Jouer  
Maintenant, créez un réseau de neurones profond pour le jeu de données Concrete.  

Vous avez des questions ou des commentaires ? Visitez le forum de discussion du cours pour discuter avec d'autres apprenants.