In [63]:
# Import des librairies
import pandas as pd 
import numpy as np
import matplotlib.pyplot as plt

In [64]:
# import de la data
x_train = pd.read_csv("data/train.csv")
x_test = pd.read_csv("data/test.csv")

In [76]:
# convertion en numpy array
x_train = np.array(x_train) 
x_test  = np.array(x_test) 

In [None]:
x_test

#### Afficher une image

In [78]:
# Afficher une image
def print_picture(data=x_test):
    
    # Sélectionnez un exemple aléatoire
    random_index = np.random.randint(0, len(data))
    example = data[random_index]

    # Les 784 premières valeurs représentent les pixels de l'image
    image = example[:-1].reshape(28, 28)

    # Afficher l'image
    plt.imshow(image, cmap='gray')
    plt.show()

In [79]:
print_picture(data=x_test)

ValueError: cannot reshape array of size 783 into shape (28,28)

### Exemple

In [40]:
# Importation des bibliothèques nécessaires 
import tensorflow as tf
from tensorflow.keras import datasets, layers, models
import matplotlib.pyplot as plt

In [41]:
# chargeons le dataset MNIST qui contient des images de chiffres manuscrits
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

In [42]:
# Nous normalisons les images en les divisant par 255 (valeur maximale d'un pixel) afin d'obtenir des valeurs entre 0 et 1 :
train_images, test_images = train_images / 255.0, test_images / 255.0

In [43]:
# Nous définissons notre modèle CNN en ajoutant des couches. 
# Dans cet exemple, nous utilisons deux couches de convolution (Conv2D) avec une fonction 
# d'activation ReLU, suivies de couches de MaxPooling pour réduire la dimensionnalité, et enfin 
# Une couche Dense pour la classification :
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Flatten())
model.add(layers.Dense(10, activation='softmax'))

In [44]:
# Nous compilons notre modèle en spécifiant la fonction de perte (categorical crossentropy), 
# l'optimiseur (Adam) et la métrique d'évaluation (précision) :
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [45]:
# Nous entraînons notre modèle avec les données d'entraînement :
history = model.fit(train_images, train_labels, epochs=5,
                    validation_data=(test_images, test_labels))

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


In [46]:
# Nous évaluons la précision de notre modèle sur les données de test :
test_loss, test_acc = model.evaluate(test_images, test_labels, verbose=2)
print("Accuracy:", test_acc)

313/313 - 2s - loss: 0.0337 - accuracy: 0.9893 - 2s/epoch - 5ms/step
Accuracy: 0.989300012588501


In [47]:
# Enfin, nous utilisons notre modèle pour prédire des chiffres à partir de nouvelles images :
predictions = model.predict(test_images[:5])
print(predictions)

[[2.25151064e-10 9.77134831e-11 3.45662926e-07 3.15449967e-07
  1.33633534e-12 1.94421302e-11 5.42856426e-18 9.99999166e-01
  1.31035224e-10 1.26574392e-07]
 [1.19289382e-07 6.72940441e-05 9.99929190e-01 4.84577101e-10
  1.98376024e-10 1.93744031e-14 3.20469576e-06 1.13134285e-11
  1.52264690e-07 1.12699086e-10]
 [3.81195377e-08 9.99919534e-01 1.35048413e-06 9.22955667e-09
  4.22414523e-05 9.84429221e-07 1.81156054e-07 2.67636333e-05
  8.70069562e-06 8.86892622e-08]
 [9.99995947e-01 3.03262840e-12 4.13913739e-07 1.70620823e-10
  6.60843047e-10 2.12962643e-08 3.38773634e-06 3.47447804e-09
  7.01260703e-08 1.31010765e-07]
 [1.67687209e-09 2.48626719e-09 5.98118166e-10 2.39521764e-10
  9.99989867e-01 5.45185685e-12 2.36356795e-10 8.34856806e-09
  1.43122829e-08 1.01739170e-05]]
