<a href="https://colab.research.google.com/github/souadsoo/gitgit/blob/master/DNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Un réseau de neurones profond (DNN, ou Deep Neural Network) est un type de modèle d'apprentissage automatique qui utilise plusieurs couches de neurones pour apprendre des représentations complexes des données. Voici un exemple simple de mise en œuvre d'un DNN pour un débutant, en utilisant Python et la bibliothèque TensorFlow avec Keras. Cet exemple consiste à créer un modèle de classification pour le jeu de données MNIST, qui contient des images de chiffres manuscrits (0 à 9).

In [None]:
import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# Chargement et prétraitement des données MNIST

Ce code permet de charger et de prétraiter les données du jeu de données MNIST, qui est un ensemble de chiffres manuscrits couramment utilisé pour l'apprentissage automatique.

## 1. Charger les données

```python
(x_train, y_train), (x_test, y_test) = mnist.load_data()

In [None]:
# Charger les données
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# Normaliser les valeurs des pixels entre 0 et 1
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

# Redimensionner les images pour qu'elles correspondent à l'entrée du réseau
x_train = x_train.reshape((x_train.shape[0], 28 * 28))  # 28x28 pixels -> 784 neurones en entrée
x_test = x_test.reshape((x_test.shape[0], 28 * 28))

# Encoder les étiquettes en one-hot encoding
y_train = to_categorical(y_train, 10)  # 10 classes (chiffres de 0 à 9)
y_test = to_categorical(y_test, 10)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz
[1m11490434/11490434[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 0us/step


**astype('float32')** : Convertit les valeurs des pixels en type float32 pour permettre des calculs flottants.

***/ 255*** : Normalise les valeurs des pixels entre 0 et 1. Les images MNIST ont des valeurs de pixels comprises entre 0 et 255, donc diviser par 255 ramène ces valeurs à l'intervalle [0, 1].

# Pourquoi les valeurs des pixels sont entre 0 et 255 ?

## Représentation des pixels
Les images en niveaux de gris sont composées de pixels, où chaque pixel représente une intensité de lumière :
- **0** correspond au **noir pur** (absence de lumière).
- **255** correspond au **blanc pur** (intensité maximale).
- Les valeurs entre **0** et **255** représentent des **nuances de gris**.

---

## Codage sur 8 bits
- Les valeurs des pixels sont généralement stockées sur **8 bits** (1 octet).
- Un octet peut représenter \( 2^8 = 256 \) valeurs différentes, allant de **0** à **255**.

---

## Normalisation
Pour faciliter les calculs dans les modèles de machine learning, il est courant de **normaliser** les valeurs des pixels entre 0 et 1.
- Cela se fait en divisant chaque valeur de pixel par **255** :
  \[
  \text{Valeur normalisée} = \frac{\text{Valeur du pixel}}{255}
  \]
- Exemple :
  - Si un pixel a la valeur 128, alors :  
$$
\text{Valeur normalisée} = \frac{128}{255} \approx 0.502
$$


---

## Avantages de la normalisation
1. **Amélioration des calculs** : Les algorithmes de machine learning et deep learning convergent plus rapidement avec des valeurs normalisées.
2. **Consistance** : Permet d'avoir toutes les valeurs sur une échelle uniforme, facilitant l'interprétation et le traitement.
3. **Compatibilité** : Les modèles modernes (comme les réseaux de neurones) fonctionnent mieux avec des données dans la plage [0, 1].

---

En résumé, les pixels sont représentés par des valeurs entre **0 et 255** grâce au codage sur 8 bits, et ces valeurs peuvent être normalisées pour améliorer les performances des modèles.


## Construire le modèle DNN

Nous allons créer un modèle simple avec deux couches cachées.

In [None]:
model = models.Sequential()

# Couche d'entrée : 784 neurones (28x28 pixels)
model.add(layers.Dense(1024, activation='relu', input_shape=(28 * 28,)))  # Première couche cachée
model.add(layers.Dense(512, activation='relu'))  # Deuxième couche cachée
model.add(layers.Dense(256, activation='relu'))  # Troisième couche cachée
model.add(layers.Dense(128, activation='relu'))  # Quatrième couche cachée
model.add(layers.Dense(64, activation='relu'))   # Cinquième couche cachée
model.add(layers.Dense(10, activation='softmax'))  # Couche de sortie (10 classes)

# Afficher un résumé du modèle
model.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


## Compiler le modèle

In [None]:
model.compile(optimizer='adam',  # Optimiseur Adam
              loss='categorical_crossentropy',  # Fonction de perte pour la classification
              metrics=['accuracy'])  # Métrique : précision

## Entraîner le modèle

In [None]:
test_loss, test_acc = model.evaluate(x_test, y_test)
print(f"Précision sur les données de test : {test_acc:.4f}")

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 7ms/step - accuracy: 0.1130 - loss: 2.3081
Précision sur les données de test : 0.1150


## Faire des prédictions

In [None]:
predictions = model.predict(x_test)
# predictions contient les probabilités pour chaque classe

[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step


In [None]:
import tensorflow as tf
from tensorflow.keras import models, layers
from tensorflow.keras.datasets import mnist
from tensorflow.keras.utils import to_categorical

# 1. Charger les données MNIST
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# 2. Prétraitement des données
x_train = x_train.reshape((x_train.shape[0], 28 * 28)) / 255.0  # Normalisation et aplatissement
x_test = x_test.reshape((x_test.shape[0], 28 * 28)) / 255.0

# One-hot encoding des labels
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

# 3. Définir le modèle
model = models.Sequential()

# Couche d'entrée et première couche cachée
model.add(layers.Dense(1024, activation='relu', input_shape=(28 * 28,)))
model.add(layers.Dropout(0.3))  # Ajouter du dropout pour éviter le surapprentissage

# Deuxième couche cachée
model.add(layers.Dense(512, activation='relu'))
model.add(layers.Dropout(0.3))

# Troisième couche cachée
model.add(layers.Dense(256, activation='relu'))

# Couche de sortie (10 classes pour les chiffres de 0 à 9)
model.add(layers.Dense(10, activation='softmax'))

# 4. Compiler le modèle
model.compile(optimizer='adam',  # Optimiseur Adam
              loss='categorical_crossentropy',  # Fonction de perte pour la classification multi-classes
              metrics=['accuracy'])

# 5. Entraîner le modèle
model.fit(x_train, y_train, epochs=10, batch_size=128, validation_split=0.2)

# 6. Évaluer le modèle sur les données de test
test_loss, test_accuracy = model.evaluate(x_test, y_test)
print(f"Précision sur le jeu de test : {test_accuracy:.2f}")


Epoch 1/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m17s[0m 41ms/step - accuracy: 0.8444 - loss: 0.4990 - val_accuracy: 0.9601 - val_loss: 0.1299
Epoch 2/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m16s[0m 42ms/step - accuracy: 0.9609 - loss: 0.1257 - val_accuracy: 0.9697 - val_loss: 0.0953
Epoch 3/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m19s[0m 39ms/step - accuracy: 0.9748 - loss: 0.0823 - val_accuracy: 0.9753 - val_loss: 0.0809
Epoch 4/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m22s[0m 42ms/step - accuracy: 0.9783 - loss: 0.0677 - val_accuracy: 0.9753 - val_loss: 0.0923
Epoch 5/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m19s[0m 38ms/step - accuracy: 0.9822 - loss: 0.0560 - val_accuracy: 0.9762 - val_loss: 0.0881
Epoch 6/10
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m15s[0m 39ms/step - accuracy: 0.9841 - loss: 0.0492 - val_accuracy: 0.9787 - val_loss: 0.0810
Epoch 7/10
[1m3