## <center> **Livrable n°2 : Traitement d'images** </center>

‎ 

Réalisé par le **groupe n°2** :
- BERTHO Lucien
- BOSACKI Paul
- GAURE Warren
- GRENOUILLET Théo
- VALLEMONT Hugo


‎

---


### **Sommaire**

1. [Mise en contexte](#contexte)
2. [Objectif du livrable](#objectif)
3. [Importation des bibliothèques](#import)
4. [Prétraitement et exploration des données](#pretraitement)
5. [Item #5](#item5)
6. [Item #6](#item6)
7. [Item #7](#item7)
8. [Item #8](#item8)
9. [Item #9](#item9)
10. [Item #10](#item10)

‎ 

---

### 1. <a id='contexte'>Mise en contexte</a>

L’entreprise TouNum est spécialisée dans la numérisation de documents, qu’il s’agisse de textes ou d’images. Ses services sont particulièrement sollicités par des entreprises cherchant à transformer leur base documentaire papier en fichiers numériques exploitables. Aujourd’hui, TouNum souhaite aller plus loin en enrichissant son offre avec des outils basés sur le Machine Learning.

En effet, certains clients disposent d’un volume considérable de documents à numériser et expriment un besoin croissant pour des solutions de catégorisation automatique. Une telle innovation leur permettrait d’optimiser le traitement et l’exploitation de leurs données numérisées. Toutefois, TouNum ne dispose pas en interne des compétences nécessaires pour concevoir et mettre en place ces technologies.

C’est dans ce cadre que notre équipe de spécialistes en Data Science du CESI est sollicitée. Notre mission consiste à développer une première solution intégrant du captioning automatique : un système capable d’analyser des photographies et de générer une légende descriptive de manière autonome.

Heureusement, TouNum possède déjà plusieurs milliers d’images annotées, ce qui constituera une ressource précieuse pour entraîner les modèles de Machine Learning à partir d’un apprentissage supervisé.

---

### 2. <a id='objectif'>Objectif du livrable</a>

Pour cette seconde étape du workflow, il est demandé de traiter les images qui seront destinées à être annotées. Ce livrable propose une méthode de traitement basée sur les auto-encodeurs à convolution afin de débruiter les images fournies et de pouvoir les reconstituer.

---

### 3. <a id='import'>Importation des bibliothèques</a>

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
import os

from concurrent.futures import ThreadPoolExecutor, as_completed
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras.models import Model
from keras.layers import Input, Dense, Flatten, Conv2D, MaxPooling2D, Dropout, UpSampling2D

---

### 4. <a id='pretraitement'>Prétraitement et exploration des données</a>

Une fois les bibliothèques importées, nous pouvons désormais gérer les données qui nous ont été données.

#### 4.1. <a>Vérification des images</a>

À l'instar de la première étape du workflow, nous vérifions le bon état des images.

In [None]:
def is_valid_image(path):
    try:
        img_raw = tf.io.read_file(path)
        _ = tf.image.decode_image(img_raw, channels=3)
        return (path, True)
    except Exception:
        return (path, False)

def clean_corrupted_images(directory, extensions=("jpg", "jpeg", "png"), max_workers=8):
    image_paths = []
    for root, _, files in os.walk(directory):
        for file in files:
            if file.lower().endswith(extensions):
                image_paths.append(os.path.join(root, file))

    print(f"Scan de {len(image_paths)} images dans {directory}")

    corrupted_count = 0
    with ThreadPoolExecutor(max_workers=max_workers) as executor:
        futures = [executor.submit(is_valid_image, path) for path in image_paths]
        for future in as_completed(futures):
            path, is_valid = future.result()
            if not is_valid:
                try:
                    os.remove(path)
                    corrupted_count += 1
                except Exception as e:
                    print(f"Erreur de suppression {path} : {e}")

    print(f"Vérification terminée : {corrupted_count} image(s) corrompue(s) supprimée(s).")
    

clean_corrupted_images(dataset_directory)

Il s'avérait qu'aucune image a été corrompue.

──────────────────────────────────────────────────

#### 4.2. <a>Chargement des données</a>

Après vérification, nous pouvons charger les données.

In [None]:
image_h = 128
image_w = 128
batch_s = 16

dataset = keras.utils.image_dataset_from_directory(
    directory = "dataset_livrable_1/Photo",
    label_mode = None,
    batch_size = batch_s,
    image_size = (image_h, image_w),
    seed = 42
)

dataset_2 = keras.utils.image_dataset_from_directory(
    directory = dataset_directory,
    label_mode = None,
    batch_size = batch_s,
    image_size = (image_h, image_w),
    seed = 42
)



La sortie indique la présence de **148** images en tout, ce qui rendra le traitement de ces dernières plus rapide que durant l'étape précédente !

──────────────────────────────────────────────────

#### 4.3. <a>Prétraitement des données</a>

Étant donné que nous travaillons à nouveau avec des images, c'est-à-dire des ensembles de pixels dont les valeurs sont comprises entre 0 et 255, nous devons les mettre à dans l'intervalle `[0, 1]` afin de mieux les traiter.

In [None]:
dataset = dataset.map(lambda x: tf.cast(x, tf.float32) / 255.0)
dataset_2 = dataset_2.map(lambda x: tf.cast(x, tf.float32) / 255.0)
X = []

for batch in dataset:
    X.append(batch.numpy())

for batch in dataset_2:
    X.append(batch.numpy())
    
dataset = np.concatenate(X)
print(dataset.shape)


──────────────────────────────────────────────────

#### 4.4. <a>Affichage des images</a>

Maintenant que le prétraitement est fait, nous pouvons afficher des images grâce à une fonction.

In [None]:
def display_images():
    plt.figure(figsize=(8, 8))
    for i in range(16):
        plt.subplot(4, 4, i+1)
        plt.imshow(dataset[i])
        plt.axis("off")
    plt.show()

In [None]:
display_images()

In [None]:
noise_factor = 0.5
def add_noise(images):
    noisy_images = images + noise_factor * tf.random.normal(shape=images.shape)
    noisy_images = np.clip(noisy_images, 0., 1.)
    return noisy_images


In [None]:
add_noise_dataset = add_noise(dataset)
def display_noisy_images():
    plt.figure(figsize=(8, 8))
    for i in range(16):
        plt.subplot(4, 4, i+1)
        plt.imshow(add_noise_dataset[i])
        plt.axis("off")
    plt.show()
display_noisy_images()

---

In [None]:
IMG_SIZE          = 128                # taille coté final d'une image en pixel (ici 28x28)
NB_EPOCHS_DENOISE = 100               # nombre epoch alogithme debruiter
BATCH_SIZE        = 16               # taille batch de traitement
SAV_MODEL_DENOISE = "denoiser_livrable2.h5"     # sauvegarde du modele de debruitage

In [None]:
#encoded
imput_img = Input(shape=(IMG_SIZE, IMG_SIZE, 3)) # input image dimensions
x = layers.GaussianNoise(0.1)(imput_img)
x = Conv2D(64, (3, 3), activation='relu', padding='same')(imput_img)
encoded = MaxPooling2D((2, 2),padding='same')(x)
x = MaxPooling2D((2, 2))(x)
x = Conv2D(32, (3, 3), activation='relu', padding='same')(x)
encoded = MaxPooling2D((2, 2),padding='same')(x)

In [None]:
#decoded
x = Conv2D(32, (3, 3), activation='relu', padding='same')(encoded)
x = UpSampling2D((2, 2))(x)

x = Conv2D(64, (3, 3), activation='relu', padding='same')(x)
x = UpSampling2D((2, 2))(x)
decoded = Conv2D(3, (3, 3), activation='sigmoid', padding='same')(x)

In [None]:
autoencoder = Model(imput_img, decoded)
autoencoder.compile(optimizer='adam', loss='mean_squared_error')
autoencoder.summary()

In [None]:
hystory = autoencoder.fit(add_noise_dataset, dataset,
                          epochs=NB_EPOCHS_DENOISE,
                          batch_size=BATCH_SIZE,
                          shuffle=True,
                          validation_split=0.2)

In [None]:
print(hystory.history.keys())

In [None]:
plt.plot(hystory.history['loss'], label='train_loss')
plt.plot(hystory.history['val_loss'], label='val_loss')
plt.title('Loss function')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()
plt.show()

In [None]:
# display the denoised images
def display_denoised_images():
    denoised_images = autoencoder.predict(add_noise_dataset)
    plt.figure(figsize=(8, 8))
    for i in range(16):
        plt.subplot(4, 4, i+1)
        plt.imshow(denoised_images[i])
        plt.axis("off")
    plt.show()

In [None]:
display_denoised_images()

In [None]:
# add a comparison function to show original, noisy and denoised images
def display_comparison_images():
    add_noise_dataset = add_noise(dataset)
    denoised_images = autoencoder.predict(add_noise_dataset)
    plt.figure(figsize=(12, 12))
    plt.suptitle("Comparison of Original, Noisy and Denoised Images")
    plt.subplots_adjust(hspace=0.4, wspace=0.4)
    for i in range(4):
        plt.subplot(4, 4, i+1)
        plt.imshow(dataset[i])
        plt.title("Original")
        plt.axis("off")
        plt.subplot(4, 4, i+5)
        plt.imshow(add_noise_dataset[i])
        plt.title("Noisy")
        plt.axis("off")
        plt.subplot(4, 4, i+9)
        plt.imshow(denoised_images[i])
        plt.title("Denoised")
        plt.axis("off")
    plt.show()

In [None]:
display_comparison_images()

In [None]:
autoencoder.save(SAV_MODEL_DENOISE)

In [None]:
import visualkeras
visualkeras.layered_view(
    autoencoder,
    legend = True,
    show_dimension = True,
    spacing=50,
)
