# 0. Import des librairies et modules

In [2]:
import numpy as np # utilisé pour effectuer des opérations numériques efficaces.
import matplotlib.pyplot as plt # utilisée pour créer des graphiques et des visualisations.
from tensorflow import keras # création de modèles de réseaux neuronaux.
from tensorflow.keras import optimizers # utilisé pour configurer l'optimiseur pour l'entraînement du modèle.
from tensorflow.keras.models import Sequential # permet de créer un modèle de réseau neuronal séquentiel.
from tensorflow.keras.layers import Dense # utilisée pour ajouter des couches denses (entièrement connectées) au réseau neuronal.

from tensorflow.keras.datasets import mnist #
from tensorflow.keras.utils import to_categorical # utilisée pour effectuer un encodage one-hot des étiquettes cibles.

from sklearn.model_selection import train_test_split # permet de diviser le jeu de données en ensembles d'entraînement et de test.
from sklearn.preprocessing import MinMaxScaler # utilisée pour mettre à l'échelle les données d'entrée dans un certain intervalle.
from sklearn.metrics import accuracy_score # permet de calculer la précision d'un modèle de classification par rapport aux étiquettes réelles.

2023-09-04 18:15:20.524196: I tensorflow/tsl/cuda/cudart_stub.cc:28] Could not find cuda drivers on your machine, GPU will not be used.
2023-09-04 18:15:21.214708: I tensorflow/tsl/cuda/cudart_stub.cc:28] Could not find cuda drivers on your machine, GPU will not be used.
2023-09-04 18:15:21.218168: I tensorflow/core/platform/cpu_feature_guard.cc:182] This TensorFlow binary is optimized to use available CPU instructions in performance-critical operations.
To enable the following instructions: AVX2 FMA, in other operations, rebuild TensorFlow with the appropriate compiler flags.


# 1. Import et preparation des données

In [3]:
df = mnist.load_data()

In [4]:
print(df[0][0].shape) # features
print(df[0][1].shape) # target

(60000, 28, 28)
(60000,)


In [7]:
X = df[0][0] # extrait de la première colonne (index 0) de la première ligne (index 0) d'un DataFrame (ou d'une structure de données similaire)
y = df[0][1] # extrait la deuxième colonne (index 1) de la première ligne (index 0)

# Transformation des tableaux (28*28) en vecteur (784*1) -> nos features doivent etre stockees dans des matrices 2
print(f"Dimension de X avant transformation = {X.shape}")
X = np.reshape(X, (X.shape[0], 28*28)) # Cette ligne transforme les images de leur forme matricielle (28x28) en une forme de vecteur (784 éléments par image)
print(f"Dimension de X apres transformation = {X.shape}")

# Transformation pour que chaque sortie soit une liste de probalites d'appartenir a une classe
print(f"Dimension de y avant transformation = {y.shape}")
y = to_categorical(y, num_classes = 10)
print(f"Dimension de y apres transformation = {y.shape}")
 
# Normalisation des features
scaler = MinMaxScaler() # Cette ligne crée une instance de la classe
X = scaler.fit_transform(X) # Cette ligne prend votre ensemble de données initial X (supposons qu'il s'agit d'une matrice de caractéristiques) et l'utilise comme argument pour la méthode fit_transform de l'objet scaler.

# Split entrainement/test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size= 0.2, random_state = 42)

Dimension de X avant transformation = (60000, 28, 28)
Dimension de X apres transformation = (60000, 784)
Dimension de y avant transformation = (60000,)
Dimension de y apres transformation = (60000, 10)


# 2. Réseau de neurones

In [8]:
p = 15
network = Sequential()

# Couche 1 a p avec 784 entrees
network.add(Dense(p, input_dim = 784, activation = "sigmoid"))

# Couche 2 a p neurones
network.add(Dense(p, activation = "sigmoid"))

# Couche 3 a 10 neurones
network.add(Dense(10, activation = "sigmoid"))

# Definition de la methode de descente de gradient et de la fonction cout
network.compile(loss = "categorical_crossentropy", optimizer = "sgd", metrics = "accuracy")

print(network.summary())

  

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 15)                11775     
                                                                 
 dense_1 (Dense)             (None, 15)                240       
                                                                 
 dense_2 (Dense)             (None, 10)                160       
                                                                 
Total params: 12175 (47.56 KB)
Trainable params: 12175 (47.56 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________
None


# 3. Entrainement et predictions du reseau

In [9]:
# calcul des points par descente de gradient
network.fit(X_train, y_train, batch_size= 20, epochs = 40) # avec ce batch_size --> Mini Batch Gradient Descent

Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


<keras.src.callbacks.History at 0x7f001dc5b610>

# 4. Sensibilité de la précision en fonction du nombre de neurones