# Classification de formes à l'aide d'un réseau de convolution : augmentation de données

> Author: Françoise Bouvet (IJCLab, CNRS)  
> Email: <francoise.bouvet@ijclab.in2p3.fr>

1. [Introduction](#Introduction)
2. [Préparation des données](#Préparation-des-données)
3. [Structure du réseau](#Structure-du-réseau)
4. [Apprentissage](#Apprentissage)
5. [Evaluation](#Evaluation)

## Introduction

L'objectif de ce TP est d'essayer d'améliorer les résultats en pratiquant de l'augmentation de données par transformations géométriques.

Les images sont issues de la base de données de la plateforme [kaggle](https://www.kaggle.com/)  

Pour vous aider, vous trouverez des informations complémentaires sur la librairie [keras](https://keras.io/getting_started/)

## Préparation des données

In [None]:
import numpy as np
from utils import lecture_shape_1channel

rep_data = "../datasets/data_shape/"
lst_shape = ['circle', 'ellipse', 'rectangle', 'square', 'triangle']

# Read input data and transform output into one hot encoding
input_train_raw, output_train_raw = lecture_shape_1channel(rep_data + "train/", "*.png", lst_shape)

if input_train_raw is None or not np.any(input_train_raw):
    print(f'Aucun fichier {extension} trouvé dans {dir}')

In [None]:
from keras.utils import to_categorical

# Normalize input data
input_train = input_train_raw.astype('float32') / 255.
# Transform output into one hot encoding
output_train = to_categorical(output_train_raw)

# Shuffle input data
ind = np.arange(0, np.shape(input_train)[0])
np.random.shuffle(ind)

# Apply to data ; 
input_train = input_train[ind]
output_train = output_train[ind]

print(f'Il y a {input_train.shape[0]} échantillons')

### Création d'une couche de transformation
On peut utiliser RandomFlip(...) et RandomZoom(...).  
Utiliser l'option adéquate pour le paramètre fill_mode de RandomZoom().  
Attention,compte tenu des données, RandomRotation() n'est pas approprié car changerait le type de forme ; idem pour les modifications de contraste car les images sont binaires.

In [None]:
from tensorflow import keras
from keras.models import Sequential
from keras.layers import RandomFlip, RandomZoom

# Add flip and zoom ; be careful with the option fill_mode RandomFlip(...) et RandomZoom(...).
data_augmentation = keras.Sequential([
    ...
])

### Vérification sur quelques images 

In [None]:
# Check the result on some images
import matplotlib.pyplot as plt

for i, image in enumerate(input_train[0:9]):
  ax = plt.subplot(3, 3, i + 1)
  plt.imshow(image)
  plt.axis("off")

In [None]:
augmented_image = data_augmentation(input_train)
print(np.shape(augmented_image))

for i, image in enumerate(augmented_image[0:9]):
  ax = plt.subplot(3, 3, i + 1)
  plt.imshow(image)
  plt.axis("off")

## Structure du réseau

In [None]:
from keras.layers import Dense, Conv2D, MaxPooling2D, Flatten

# Network definition : add successive layers
model = Sequential()

# The first layer is the augmentation layer 
model.add(data_augmentation)

# Convolution layers
...

#### Compilation

In [None]:
# Compilation of the model
model.compile(...)

## Apprentissage

In [None]:
from keras.callbacks import ReduceLROnPlateau, TensorBoard

# Decrease the learning rate factor
reduce_lr_cb = ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=3, min_lr=0.0001)

cb = [reduce_lr_cb]

history = model.fit(...)

In [None]:
from utils import draw_history

draw_history(history)

#### Evaluation

In [None]:
# Read test data
input_test, output_test = lecture_shape_1channel(rep_data + "test/", "*.png", lst_shape)
# Normalize test data
input_test = input_test.astype('float32') / 255.
# Transform output into one hot encoding
output_test = to_categorical(output_test)

# Test set shuffle only aims to display samples from all the classes
ind = np.arange(np.shape(input_test)[0])
np.random.shuffle(ind)
input_test = np.array(input_test)[ind]
output_test =np.array(output_test)[ind]

# Evaluate the model ; the two parameters are the input_test array and the output_test array
sum_score = model.evaluate(input_test, output_test)
print("Data test : loss %.3f accuracy %.3f" % (sum_score[0], sum_score[1]))

# Prediction ; the input parameter is the input_test array ; return value is the prediction array
output_predict = model.predict(input_test)

In [None]:
from utils import draw_multiple_images

# Display the test images and the predicted class
n=min(40, np.shape(input_test)[0])
nb_col = 8
draw_multiple_images(input_test[0:n], output_test[0:n], output_predict[0:n], lst_shape, nb_col, np.shape(input_test)[1:])