In [4]:
import tensorflow as tf
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelBinarizer
import matplotlib.pyplot as plt


In [7]:

# Charger les données d'entraînement
train_data = pd.read_csv('signlanguagetrain.csv')
test_data = pd.read_csv('signlanguagetest.csv')

# Préparer les données
X_train = train_data.iloc[:, 1:].values
y_train = train_data.iloc[:, 0].values
X_test = test_data.iloc[:, 1:].values
y_test = test_data.iloc[:, 0].values

# Reshape des images 28x28
X_train = X_train.reshape(-1, 28, 28, 1).astype('float32') / 255
X_test = X_test.reshape(-1, 28, 28, 1).astype('float32') / 255


FileNotFoundError: [Errno 2] No such file or directory: 'signlanguagetrain.csv'

In [None]:
# One-hot encoding des labels
lb = LabelBinarizer()
y_train = lb.fit_transform(y_train)
y_test = lb.transform(y_test)


les couches de convolution et de pooling sont essentielles pour extraire les caractéristiques des images et réduire la dimensionnalité tout en conservant les informations importantes.

- Le premier argument de Conv2D spécifie le nombre de filtres (32 et 64 ici), tandis que (3, 3) est la taille du noyau de convolution (3x3 pixels). Ces filtres détectent des motifs locaux dans l'image (comme des bords ou des textures).

- ReLU (Rectified Linear Unit) est appliquée après la convolution pour introduire de la non-linéarité


Le max-pooling est une technique de sous-échantillonnage utilisée après les couches de convolution. Elle réduit la taille des cartes de caractéristiques tout en conservant les informations les plus pertinentes.

- Le pooling avec une taille de fenêtre de 2x2 prend le maximum de chaque région de 2x2 pixels, ce qui diminue la taille de l'image tout en préservant les informations les plus importantes.
- Cela aide à rendre le réseau plus invariant aux petites translations ou déformations dans l'image.


Ici, la classification est un problème multi-classes (26 lettres de l'alphabet). La fonction de coût utilisée est l'entropie croisée catégorielle.

![image.png](attachment:image.png)
Elle compare la probabilité prédite pour chaque classe avec la vraie étiquette et pénalise fortement les mauvaises prédictions.


L'algorithme Adam (Adaptive Moment Estimation) est utilisé pour ajuster les poids du modèle au fil des itérations d'entraînement (combine les avantages de l'AdaGrad (qui adapte le taux d'apprentissage pour chaque paramètre) et de RMSProp (qui maintient un taux d'apprentissage plus stable).)




Techniques pour contrer l'overfitting : 

Le dropout est une technique qui consiste à désactiver aléatoirement une proportion des neurones pendant l'entraînement, forçant le modèle à ne pas trop dépendre de certaines connexions spécifiques. Cela améliore la généralisation du modèle.
cela signifie que la moitié des neurones de cette couche seront ignorés à chaque itération pendant l'entraînement

Une autre technique couramment utilisée pour contrer l'overfitting et améliorer la stabilité du réseau est la normalisation par batch. Elle consiste à normaliser les activations de chaque couche pour accélérer l'apprentissage et stabiliser le modèle.

In [None]:
# Modèle CNN
model = tf.keras.models.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D(pool_size=(2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(26, activation='softmax')
])

# Compiler le modèle
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Entraîner le modèle
history = model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=10, batch_size=64)

# Évaluer le modèle
test_loss, test_acc = model.evaluate(X_test, y_test)


In [None]:

# Afficher les résultats
print(f'Loss sur le test: {test_loss}')
print(f'Accuracy sur le test: {test_acc}')

# Affichage des courbes de loss et accuracy
plt.plot(history.history['loss'], label='Loss d\'entraînement')
plt.plot(history.history['val_loss'], label='Loss de validation')
plt.plot(history.history['accuracy'], label='Accuracy d\'entraînement')
plt.plot(history.history['val_accuracy'], label='Accuracy de validation')
plt.legend()
plt.show()