##### Laboratoire 2
# Discrimination linéaire et réseaux de neurones profonds
## Classification et régression (Datasets FER et FG-NET)

### GTI771 - Apprentissage machine avancé
#### Département de génie logiciel et des technologies de l’information (LogTI)

##### <font color=white> Version 1.0 - février 2020<br>Version 2.0 - février 2020 <br> Version 3.0 - mars 2020<br>Version 4.0 - juin 2020 (Richard Rail)<br>Version 4.1 - février 2021<br></font><br>Version 4.2 - février 2022<br>


##### Prof. Alessandro L. Koerich

| Étudiants             | NOMS - CODE PERMANENT                                   |
|-----------------------|---------------------------------------------------------|
| Session               | SAISON ANNÉE                                            |
| Équipe                | X                                                       |
| Numéro du laboratoire | X                                                       |
| Professeur            | Prof. NOM                                               |
| Chargé de laboratoire | NOM                                                     |
| Date                  | DATE                                                    |

# Introduction

Ce deuxième laboratoire porte sur l'utilisation de trois algorithmes d'apprentissage soit les algorithmes de régression, les réseaux neuronaux et les réseaux neuronaux profonds. Dans ce laboratoire, vous êtes amenés à utiliser de nouvelles approches à l’aide de ces algorithmes aﬁn de résoudre deux problèmes: prédiction de l'âge de personnes à partir de photos du visage (régression); problème de classiﬁcation des expressions faciales (FER) introduit dans le cadre du premier laboratoire de ce cours.

Le problème de régression qui vous est présenté est le problème [Facial Aging Estimation (FAE)](https://yanweifu.github.io/FG_NET_data/index.html), dont le but est de prédire l'âge des personnes à partir du visage. En vous basant sur les concepts vus en classe et l'expérience acquise dans le laboratoire 1, vous êtes invité à reprendre les primitives développées lors du laboratoire 1 ou d'autres primitives que vous jugez pertinentes à extraire sur ces types d’images et effectuer l’extraction de celles-ci sur l’ensemble de données fournies avec cet énoncé. 

##### Description de l'ensemble de données:
* 1002 images faciales de 82 sujets multiraciaux âgés de 0 à 69 ans;
* Déséquilibré: 50% des sujets ont entre 0 et 13 ans;
* Images couleur et niveaux de gris avec une dimension moyenne de 384x487 pixels, et la résolution varie de 200 dpi à 1200 dpi;
* Grande variation d'éclairage, de pose, d'expression faciale, de flou et d'occlusions (par exemple, moustache, barbe, lunettes, etc.).

Voici, en exemple, des images de visages se retrouvant dans l’ensemble de données FG-NET:

![Exemples de FER](https://www.mdpi.com/sensors/sensors-16-00994/article_deploy/html/images/sensors-16-00994-g001.png)

Veuillez noter que les images qui vous sont fournies ne sont pas nécessairement similaires aux images de FER. Plusieurs images comportent du bruit, des artéfacts ou des éléments non pertinents. Le défi de ce laboratoire repose sur cette difficulté qui est chose courante dans des problèmes d’apprentissage machine moderne.

Tout comme le premier travail pratique, vous réaliserez ce deuxième laboratoire avec la technologie Python3 conjointement avec la librairie d’apprentissage machine scikit-learn et TensorFlow et Keras pour la partie réseaux de neurones. Vous êtes invité à reprendre le code développé lors du laboratoire 1 afin de continuer son développement.

<font color=black> L’évaluation de ce laboratoire sera basée sur la qualité des modèles entraînés, la comparaison des performances réalisées par les différents modèles, les réponses aux questions dans cette notebook ainsi que l'organisation de votre code source (SVP, n'oubliez pas des commentaires dans le code!).</font>

* #### Partie 1: Régression
* Régression lineaire
* Régression Ridge
* Régression Lasso et Elastic-Net
* Descente du gradiente stochastique (SGD)<br>
<br>
* #### Partie 2: Classification
* Régression logistique
* Réseaux de neurones MLP <br>
<br>
* #### Partie 3: Classification et régression
* Réseaux convolutionel entraîné "from scratch"
* Réseaux convolutionel + modèles pre-entraînes (transfer learning)
* Réseaux convolutionel adapté à la régression

## Partie 0: Imports

#### (0a) Import de bibliotèques



##### À faire:
1. Ajouter toutes les bibliothèques que vous avez utilisées pour compléter ce notebook dans une cellule avec une petite description.

In [None]:
import numpy as np  # package for scientific computing with Python.
import matplotlib.pyplot as plt # 2D plotting library

# Votre code ici

#### (0b) Fonctions

##### À faire:
Avez-vous créé des fonctions? Si oui, vous devez les mettre ici, avec une description.

In [None]:
# Cette fonction ne fait rien. Elle ne reçoit aucune variable et retourne 1

def fa():
    return 1

# Partie 1: Explorez les algorithmes de régression
## FG-NET dataset (Facial Aging Estimation)

Dans cette partie vous devez explorer les <b> algorithmes de régression linéaire </b> disponibles dans Scikit-learn, comme régression least square, régression Ridge, régression Lasso et Elastic-Net, descente du gradient stochastique (SGD), etc.

Vous devez comparer la performance de ces algorithmes pour l'ensemble de données FG-NET sur:

1. Le vecteur de pixels (images vectorisées)
2. Vecteur de primitives (reprendre l'algorithme d'extraction de primitives que vous avez utilisées dans le Laboratoire 1, p.ex. LBP). Vous pouvez reprendre les primitives "réduits" que vous avez utilisées dans le Laboratoire 1 (p.ex. vecteur LBP après PCA), si vous pensez qu’ils sont plus performants.

### 1a: Charger le fichier de données

In [None]:
# Load data

### 1b: Visualisation des visages

Vous pouvez visualiser les images en utilisant `plt.imshow`.

Il y a différents types de prétraitement que nous pouvons appliquer à des images dans les ensembles de données pour réduire la variabilité, réduire des bruits, etc.

Voici deux sources pour vous aidez à décider:
- http://eprints.qut.edu.au/92300/1/manuscript_Jhony.pdf
- https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7475805

### À faire:
1. Pensez-vous qu’est nécessaire un prétraitement des images? Si oui, vous pouvez choisir différents algorithmes de prétraitement dans [scikit-image](https://scikit-image.org/docs/stable/api/api.html). Il y a aussi autres types de prétraitement plus généraux dans [scikit-learn](https://scikit-learn.org/stable/modules/preprocessing.html#preprocessing).
2. Expliquer et justifier les prétraitements choisis.

#### Code

In [None]:
# Votre code de pre-processing

#### Résultats et résponses

In [None]:
# Votre explication/justification

### 1c: Statistiques sur les sujets et étiquettes

##### À faire:
1. Calculer quelques statistiques (# images par sujet, distribution des âges, etc.) que vous jugez importantes sur les données
2. Faire une analyse des résultats et présenter vos conclusions basées sur ces statistiques.

#### Code:

In [None]:
# Votre code ici

# Code exemple:
# Histogramme des étiquettes
#hist, _ = np.histogram(ytrain, density=False, bins=7, range=(0, 7))

#### Résultats et résponses:

In [None]:
# Vos résultats ici:

# Code exemple:
# Code exemple
# Plot du histogramme
# import matplotlib.pyplot as plt

### 1d: Créer et évaluer des modèles de régression

##### À faire:
1. Choisir au moins trois (3) algorithmes de régression linéaire disponibles dans Scikit-learn (p.ex. régression least square, régression Ridge, régression Lasso, régression Elastic-Net, descente du gradient stochastique (SGD), etc.)
2. Entraîner et optimiser les paramètres des modèles si nécessaire. Utiliser le protocole <font color=blue> "Leave One Subject Out Cross-Validation" </font> (LOSO).
3. Faire une analyse des résultats et présenter vos conclusions sur les modèles de régression.

| Algorithme            | Paramètres    |  MSE  |  MAE  |
|-----------------------|---------------|-------|-------|
| Regr lineaire         | XXX.XX        |XXX.XX |XXX.XX |
| Regr Ridge            | alpha = 0.1   |123.34 | 10.45 |
| Regr Lasso            | XXX.XX        |XXX.XX |XXX.XX |
| Regr ElasticNet       | XXX.XX        |XXX.XX |XXX.XX |
| ...                   | XXX.XX        |XXX.XX |XXX.XX |
| ...                   | XXX.XX        |XXX.XX |XXX.XX |

#### Code:

In [None]:
# Votre code ici

#### Résultats et résponses:

In [None]:
# Vos résultats ici:

# Partie 2: Explorez les algorithmes de classification
## FER dataset ( Facial Expression Recognition )

Vous devez reprendre l'ensemble FER et les primitives que vous avez choisis dans le Laboratoire 1.

Dans cette partie vous devez explorer les algorithmes de classification <b> régression logistique et réseaux de neurones multicouches (MLP) </b>

Vous devez comparer la performance de ces deux algorithmes pour l'ensemble FER sur:
1. Le vecteur de pixels (images vectorisées)
2. Vecteur de primitives (reprendre les primitives ou primitives sélectionnées/transformées du laboratoire 1)

### 2a: Charger le fichier de données

In [1]:
# Load data

### 2b: Créer et évaluer des modèles de classification (Régression logistique)

##### À faire:

1. Utiliser l'algorithme régression logistique disponible dans [Scikit-learn](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html), pour classifier le vecteur de pixels et le vecteur de primitives du laboratoire 1. Vous pouvez regarder aussi [SGDClassifier](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.SGDClassifier.html#sklearn.linear_model.SGDClassifier) et [LogisticRegressionCV](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegressionCV.html#sklearn.linear_model.LogisticRegressionCV)
2. Entraîner et optimiser les paramètres des modèles.
3. Faire une analyse des résultats et présenter vos conclusions sur le modèle logistique.

#### Code:

In [2]:
# Votre code ici

####  Résultats et résponses:

Vos résultats ici:


| Algorithme       | Paramètres    | Precision | %Erreur App | %Erreur Val | %Erreur Tst | 
|------------------|---------------|-----------|-------------|-------------|-------------|
| Regr logistique  | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| MLP 1            | 2403:100:100:7|   123.34  |    10.45    |   XXX.XX    |   XXX.XX    |
| MLP 2            | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| MLP 3            | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| ...              | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| ...              | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |

### 2c: Créer et évaluer des modèles de classification (Réseaux perceptron multi-couche)

##### À faire:

1. Utiliser [Tensorflow et Keras](https://www.tensorflow.org/tutorials/keras/classification) pour construire un réseau de neurones multicouche pour classifier les vecteurs de primitives du laboratoire 1. 
2. Choisir l’architecture appropriée pour chaque vecteur de primitives (nombre et dimension des couches). 
2. Entraîner et optimiser les paramètres des réseaux.
4. Faire une analyse des résultats et présenter vos conclusions sur les réseaux de neurones.

#### Code

In [3]:
# Votre code ici

#### Résultats et résponses:
Vos résultats ici

| Algorithme       | Paramètres    | Precision | %Erreur App | %Erreur Val | %Erreur Tst | 
|------------------|---------------|-----------|-------------|-------------|-------------|
| Regr logistique  | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| MLP 1            | 2403:100:100:7|   123.34  |    10.45    |   XXX.XX    |   XXX.XX    |
| MLP 2            | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| MLP 3            | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| ...              | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |
| ...              | XXX.XX        |   XXX.XX  |   XXX.XX    |   XXX.XX    |   XXX.XX    |

# Partie 3: Explorez l'apprentissage de la représentation et les réseaux neuronaux profonds
## (FER dataset et FG-NET dataset)


##### À faire :
1. Utiliser [Tensorflow et Keras](https://www.tensorflow.org/tutorials/keras/classification) pour construire un réseau de neurones convolutif pour apprendre une représentation directement des images de visage aussi que les discriminantes. 
2. Choisir l’architecture appropriée : nombre de couches convolutifs (CL), dimension des filtres, “stride”, nombre de couches entièrement connectées (FC) et la dimension des couches). 
3. Entraîner et optimiser les paramètres du réseau.
4. Évaluer la pertinence d’utiliser "data augmentation" pour améliorer la généralisation.
5. Récupérer une des architectures CNN pré-entraînes disponibles dans Keras pour faire une “transfert de connaissance (transfer learning). Faire un "fine-tuning" du modèle choisi sur FER.    
7. Choisir le modèle qu’a donné de meilleurs résultats sur FER et adapter ce modèle pour faire la régression sur FG-NET.     
8. Faire une analyse des résultats et présenter vos conclusions sur les réseaux de neurones.

### 3a: Code CNN (FER)
    
##### À faire:
1. Utiliser [Tensorflow et Keras](https://www.tensorflow.org/tutorials/keras/classification) pour construire un réseau de neurones convolutif pour apprendre une représentation directement des images de visage aussi que les discriminantes. 
2. Choisir l’architecture appropriée: nombre de couches convolutifs (CL), dimension des filtres, "stride”, nombre de couches entièrement connectées (FC) et la dimension des couches). 
3. Entraîner et optimiser les paramètres du réseau.
4. Évaluer la pertinence d’utiliser "data augmentation" pour améliorer la généralisation.

In [None]:
# Votre code ici

#### Résultats et résponses:
Vos résultats ici

Exemple

| Ensemble | My CNN   | VGG19 CNN           |                               
|----------|----------|---------------------|
| App      | 99,67%   |     XX,XX%          |                   
| Val      | 89,77%   |     XX,XX%          |                             
| Test     | 77,99%   |     XX,XX%          |       


Q1: Nous avons choisi l'algorithme d'arbre de décision parce que...

Q2: Les taux de classification indiquent que le modèle...

Q3: La performance avec le primitive...

### 3b: Code CNN Pré-entraîné (FER)

##### À faire:
1. Récupérer une des architectures [CNN pré-entraînes disponibles dans Keras](https://keras.io/api/applications/) pour faire un "transfert de connaissance" (transfer learning). Faire un "fine-tuning" du modèle choisi sur FER.    
2. Entraîner et optimiser les paramètres du réseau.
3. Évaluer la pertinence d’utiliser "data augmentation" pour améliorer la généralisation.

In [None]:
# Votre code ici

#### Résultats et résponses:

Vos résultats ici

##### Exemple:
| Ensemble | My CNN   | VGG19 CNN           |                               
|----------|----------|---------------------|
| App      | 99,67%   |     XX,XX%          |                   
| Val      | 89,77%   |     XX,XX%          |                             
| Test     | 77,99%   |     XX,XX%          |       


Q1: Nous avons choisi l'algorithme d'arbre de décision parce que...

Q2: Les taux de classification indiquent que le modèle...

Q3: La performance avec le primitive...

### 3c: Code CNN Pré-entraîné (FG-NET):

##### À faire:
1. Choisir le modèle \ l’architecture qu’a donné de meilleurs résultats sur FER pour faire un “transfert de connaissance (transfer learning).
2. Adapter ce modèle pour FG-NET (couche de sortie classification (7 unités avec softmax) -> régression (1 unité lineaire)).   
3. Entraîner ("fine-tuning" du modèle choisi sur FG-NET) et optimiser les paramètres du réseau pour la régression.
4. Évaluer la pertinence d’utiliser "data augmentation" pour améliorer la généralisation.
5. Faire une analyse des résultats et présenter vos conclusions sur les réseaux de neurones.

In [None]:
# Votre code ici

#### Résultats et résponses:

Vos résultats ici

##### Exemple:
| Ensemble | My CNN   | VGG19 CNN           |                               
|----------|----------|---------------------|
| App      | 99,67%   |     XX,XX%          |                   
| Val      | 89,77%   |     XX,XX%          |                             
| Test     | 77,99%   |     XX,XX%          |       


Q1: Nous avons choisi l'algorithme d'arbre de décision parce que...

Q2: Les taux de classification indiquent que le modèle...

Q3: La performance avec le primitive...

## Partie Final: Conclusion

##### À faire:
1. Résumer et comparer les principaux résultats obtenus pour la classification (FER) et régression (FG-NET).
2. Faire une analyse des résultats obtenus et présenter vos conclusions sur les différents modèles que vous avez entraînés (classification et régression).
3. Comparer les résultats obtenus sur FER avec les résultats du laboratoire 1 (vecteur de pixels, vecteur de primitives). Avez-vous observé une amélioration? Commenter sur les temps d'apprentissage, complexité spatiale et temporelle, etc.

#### Résultats et résponses:
Vos résultats ici

| Algorithme            | MSE           |
|-----------------------|---------------|
| Regr lineaire         | XXX.XX        |
| Regr Ridge            | XXX.XX        |
| Regr Lasso            | XXX.XX        |
| Regr ElasticNet       | XXX.XX        |
| ...                   | XXX.XX        |
| ...                   | XXX.XX        |

## Notebook Ended