## Implémentation d’un réseau de neurones pour une classification binaire simple avec TensorFlow/Keras, sur un cas factice.

Vous allez coder un réseau de neurones simple pour effectuer une tâche de classification binaire. Les données utilisées contiendront 2 features, seront générées à la main et suivront une règle simple : le label sera 1 si 𝑥1 > 𝑥2, 0 sinon. Ce TP vous permettra de comprendre les concepts clés liés à la création, l'entraînement, et l'évaluation d'un modèle en Keras.

In [13]:
import numpy as np
from tensorflow.keras import Input
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

### Génération du dataset d'entraînement

Créer un tableau NumPy contenant 1000 points de données d’entraînement avec deux features 𝑥1 et 𝑥2. Assigner le label binaire 𝑦 en suivant la règle (𝑦 = 1) <=> (𝑥1 > 𝑥2).

In [14]:
np.random.seed(10)  # graine pour la reproductibilité
X_train = np.random.rand(1000, 2)
y_train = (X_train[:, 0] > X_train[:, 1]).astype(int)

Afficher les premiers point de données de 𝑋 (features) et 𝑦 (labels). Vérifier manuellement que les labels sont corrects.

In [15]:
print(X_train[:5])
print(y_train[:5])

[[0.77132064 0.02075195]
 [0.63364823 0.74880388]
 [0.49850701 0.22479665]
 [0.19806286 0.76053071]
 [0.16911084 0.08833981]]
[1 0 1 0 1]


### Création du réseau de neurones

Initialiser un modèle séquentiel Keras. Ajouter une première couche avec 4 neurones et une activation ReLU.

In [16]:
model = Sequential()
model.add(Input(shape=(2,)))
model.add(Dense(4, activation="relu"))

Ajouter une couche de sortie avec un seul neurone et une activation sigmoïde pour réaliser la classification binaire.

In [17]:
model.add(Dense(1, activation="sigmoid"))

Afficher la structure du modèle avec la méthode summary().

In [18]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 4)                 12        
                                                                 
 dense_3 (Dense)             (None, 1)                 5         
                                                                 
Total params: 17 (68.00 Byte)
Trainable params: 17 (68.00 Byte)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


### Compilation du modèle

Compiler le modèle en utilisant l’optimiseur Adam, la fonction de perte binary_crossentropy, et la métrique accuracy.

In [19]:
model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["accuracy"])

### Entraînement du modèle

Entraîner le modèle sur le dataset que vous avez généré, pendant 50 epochs, avec une taille de lot (batch size) de 2.

In [None]:
history = model.fit(
    X_train,
    y_train,
    epochs=50,
    batch_size=20,  # batch size de 20 au lieu de 2
    verbose=1,
)

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


### Test du modèle

Créer un tableau contenant 5 nouveaux points de test avec leurs deux features 𝑥1 et 𝑥2. Assurez-vous que ces points couvrent les 2 cas 𝑥1 > 𝑥2 et 𝑥1 < 𝑥2.

In [21]:
X_test = np.array([
    [.2, .3],  # 0
    [.6, .2],  # 1
    [2.18, 2.7],  # 0
    [.41, .42],  # 0
    [.85, 0.47],  # 1
])

Utiliser la méthode predict() pour obtenir les prédictions du modèle sur ces points de test.

In [22]:
predictions = model.predict(X_test)
print(f"Prédictions brutes : {predictions}")

Prédictions brutes : [[0.40087196]
 [0.96151185]
 [0.00221511]
 [0.5226879 ]
 [0.9408648 ]]


Convertir les prédictions en valeurs binaires (0 ou 1) en utilisant un seuil de  votre choix. Afficher les prédictions et les comparer avec la vérité terrain.

In [23]:
binary_predictions = (predictions > 0.5).astype(int)
print(f"Prédictions binaires : {binary_predictions}")

Prédictions binaires : [[0]
 [1]
 [0]
 [1]
 [1]]


### Analyse quantifiée des résultats

Évaluer la performance du modèle (en termes d'accuracy) sur les données de test.

In [None]:
y_test = np.array([0, 1, 0, 0, 1])
accuracy = np.mean(binary_predictions.flatten() == y_test)
print(f"Accuracy sur les données de test : {accuracy:.2f}")

Dans l'hypothèse où votre modèle échoue sur certains points de test, quelles pourraient en être les causes ?

- Notre modèle échoue sur un point très proche de la zone d'incertitude.

De manière générale, un modèle peut être peu performant dans les situations suivantes :
- Le modèle est très simple et peut manquer de capacité pour capturer certaines variations complexes dans les données.
- Les données d'entraînement sont peu nombreuses, ce qui peut limiter la généralisation.
- L'initialisation des poids ou l'entraînement (nombre d'époques, batch size) pourrait ne pas être optimal.