# Exemples avec Données Réels: Images Digits

# St Cyr Lee J. Vandersar

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
import pandas as pd
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from joblib import dump, load
import tensorflow as tf
import os
import cv2

# Etape numéro 1 : Les données

In [None]:
digits_datasets = load_digits()

# Description des données: Digits

In [None]:
print(digits_datasets.keys())
print(digits_datasets['data'].shape)
print(digits_datasets['images'])

In [None]:
print(digits_datasets['feature_names'])
print(digits_datasets['target_names'])

In [None]:
print(digits_datasets['DESCR'])

# Analyse des données

## Etape un

In [None]:
X_train, X_test, y_train, y_test = train_test_split(digits_datasets['data'], digits_datasets['target'], random_state=0, train_size=0.8)

In [None]:
print(X_train.shape)
print(X_test.shape)

In [None]:
digits_dataframe = pd.DataFrame(X_train, columns=digits_datasets.feature_names)

# Un graphe pour représenter les données

In [None]:
# Créez une figure avec plusieurs sous-graphiques
fig, axes = plt.subplots(2, 5, figsize=(12, 6))
plt.suptitle("Exemples d'images du jeu de données 'digits'", fontsize=16)

for i, ax in enumerate(axes.flat):
    ax.imshow(X_train[i].reshape(8, 8), cmap='gray')
    ax.set_title(f"Chiffre : {y_train[i]}")

# Ajustez les espacements entre les sous-graphiques
plt.tight_layout()
plt.show()

# Entraînez un modèle sur les données d'entraînement (SVM)

In [None]:
model = SVC()
model.fit(X_train, y_train)

# Évaluez les performances du modèle sur l'ensemble de test

In [None]:
y_pred = model.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print(f"Score du modèle : {accuracy * 100:.2f}%")

In [None]:
moyenne = np.mean(y_pred == y_test)
print(f"Niveau d' exatitude =  {moyenne * 100:.2f}%")

# Enregistrez le modèle dans un fichier à l'aide de la bibliothèque joblib

In [None]:
dump(model, 'model_digits.pkl')

# Resize image

In [None]:
def process_path(file_path):
    # Load the raw data from the file as a string
    img = tf.io.read_file(file_path)
    # img = decode_img(img)
    img = tf.io.decode_png(img, channels=1)
    # Resize the image to the desired size
    img = tf.image.resize(img, [8, 8])
    img = np.array(img, dtype='float64')

    img = img.reshape(1, -1)
    img = np.rint(img/16)

    return img

In [None]:
image_path = 'digits\\digit1.png'

In [None]:
image_array = process_path(image_path)

# Chargez le modèle depuis le fichier

In [None]:
loaded_model = load('model_digits.pkl')

# Resultat

In [None]:
# prediction = loaded_model.predict(image_array)
# print(f"Notre image correspond donc au chiffre {digits_datasets['target_names'][prediction]}")

# Notre prediction et un plot pour montrer le chiffre

In [None]:
try:
        img = cv2.imread(image_path)[:, :, 0]
        img = np.invert(np.array([img]))
        prediction = loaded_model.predict(img)
        print(f"Notre image correspond donc au chiffre {digits_datasets['target_names'][prediction]}")
        plt.imshow(img[0], cmap=plt.cm.binary)
        plt.show()
except:
        print("Error!")