# GTI771 - Apprentissage machine avancé
## Département de génie logiciel et des technologies de l’information



## Laboratoire 4 - Réduction de la dimensionnalité de primitives « deep »
#### <font color=black> Version 2 - Été 2024 </font>

##### <font color=grey> Version 1 - Prof. Alessandro L. Koerich.
##### Version 2 - Chargé de lab. Arthur Josi

| NOMS                  | CODE PERMANENT                                   |
|-----------------------|--------------------------------------------------|
| Hugo Rhéaume-Simard   | RHEH93080004                                     |
| Laurent Marleau-Gallant             |  MARL05109800                                            |
| Yulia Bakaleinik             | BAKY30539705                                            |

## Introduction
Les primitives générées par les CNNs peuvent avoir une haute dimensionnalité, des éléments nuls, ainsi que des redondances. En fonction du type sortie choisie (global pooling, flattening, etc.), la dimensionnalité  des vecteurs de primitives en sortie d'un CNNs peut facilement atteindre plusieurs milliers.

Dans ce laboratoire, nous allons explorer les algorithmes de réduction de la dimensionnalité sur les vecteurs de primitives générés par des CNNs préentraînés réutilisés comme extracteurs de primitives dans le Laboratoire 3. Pour ce faire, nous allons réduire la dimensionnalité des vecteurs « deep » et réentraîner les arbres de décision du Laboratoire 3.

L’évaluation de ce laboratoire sera basée sur:
- l'utilisation correcte des algorithmes;
- les réponses aux questions de ce notebook;
- l'organisation de votre code source (SVP, n'oubliez pas de mettre des commentaires dans le code source!)

# Modules et bibliotèques python

### Import de bibliotèques

###  <font color=blue> À faire: </font>
1. Ajouter les bibliothèques que vous avez utilisées pour compléter ce notebook dans une cellule avec une petite description.

In [2]:
import numpy as np  # package for scientific computing with Python.
import matplotlib.pyplot as plt # 2D plotting library

### Définition des fonctions

In [3]:
def fa():
    return 1

# Partie 1 - Ensemble de données

Point de départ: *fer2013-clean-deep.csv* ou *fer2013-clean-pre-deep.csv*

## 1a: Charger le fichier de primitives « deep » du laboratoire 3.

###  <font color=blue> À faire: </font>
1. Reprenez votre ensemble de données nettoyé et composé des vecteurs de primitives obtenus dans le laboratoire 3 via la meilleure approche parmis les deux evaluées. Repérez les trois partitions de données: apprentissage, validation et test.

In [4]:
# Load data - Au choix:

# ferData = np.loadtxt( 'fer2013-clean.csv', delimiter=',', dtype=str )
ferData = np.loadtxt( 'content/fer2013-clean-pre.csv', delimiter=',', dtype=str )

training_data = ferData[ferData[:, 2] == 'Training']
validation_data = ferData[ferData[:, 2] == 'PublicTest']
test_data = ferData[ferData[:, 2] == 'PrivateTest']

def transform_str_float(d):
    return np.array([np.fromstring(row, sep=' ', dtype=float) for row in d])

# Training set
Xtrain = transform_str_float(training_data[:, 1])
ytrain = np.array(training_data[:,0], dtype=np.float32)

# Validation set
Xval = transform_str_float(validation_data[:, 1])
yval = np.array(validation_data[:,0], dtype=np.float32)

# # Test set
Xtest = transform_str_float(test_data[:, 1])
ytest = np.array(test_data[:,0], dtype=np.float32)

print(Xtrain.shape, Xval.shape, Xtest.shape)

(28657, 2304) (3582, 2304) (3580, 2304)


In [None]:
#  Ici on voudrait recevoir les images du fichier CSV des modeles deep

# Partie 2: Réduction de la dimensionnalité

Bibliothèques Python pour la reduction de la dimensionnalité :

* [Transformation algorithms](https://scikit-learn.org/stable/modules/decomposition.html#decompositions)
* [Feature selection algorithms](https://scikit-learn.org/stable/modules/feature_selection.html)

###  <font color=blue> À faire: </font>
1. Choisir un algorithme de `transformation` de primitives et un algorithme de `sélection` des primitives pour réduire la dimensionnalité de vos vecteurs de primitives « deep » pour lesquels vous avez obtenus les meilleurs résultats au laboratoire précédent.
2. Expliquer brièvement les algorithmes et surtout les hyperparamètres qui influencent la réduction de la dimensionnalité, et préciser la dimensionalité attendue des vecteurs de primitives réduits.
3. Utiliser [T-SNE](https://learnopencv.com/t-sne-for-feature-visualization/) ou [UMAP](https://umap-learn.readthedocs.io/en/latest/plotting.html) comme outils de visualisation des vecteurs de primitives de la base de test (pour des fins de comparaison).
4. Générer vos vecteurs « deep » réduits avec ces algorithmes pour l'ensemble de données FER (apprentissage, validation et test).
5. Utiliser le même outil de visualisation que pour la question 3 sur les vecteurs "deep" réduits puis commenter.
6. Sauvegardez vos vecteurs réduits sous la forme d'un fichier 'csv' (p. ex. *fer2013-clean-deepVGG19-chi2.csv* ou *fer2013-clean-pre-deepVGG19-chi2.csv*). Vous n'êtes pas obligé d'utiliser la même structure du fichier original *fer2013.csv*, mais vous devez garder la correspondance (ligne du fichier original et du vecteur de primitives). Vous devez nommer vos fichiers de primitive « deep » réduits en référence au CNN utilisé et à l'algorithme de réduction de la dimensionnalité utilisé, p. ex., *fer2013-clean-deepVGG19-chi2.csv* pour un vecteur CNN VGG19 réduit avec chi2.

#### Résultats et réponses

Vos réponses et résultats ici:

#### Code

In [None]:

# Votre code ici

## 1. Utiliser PCA pour la transformation des données 
    # Utiliser un SVD_solver = 'randomized' pour la PCA


## 2. Utiliser un algo de selection de modèle pour trouver le meilleur modèle



In [None]:
# 3. Utiliser TSNE pour visualiser les données en 2D

# Partie 3: Entraînement de modèles d'apprentissage machine

Vous êtes maintenant prêtes à entraîner / comparer différents modèles permettant la classification à partir des vecteurs de primitives « deep » réduits obtenus en partie 2.

###  <font color=blue> À faire: </font>
1.
  a) Comme pour les précédents laboratoires (2 et 3), entraîner et evaluer un [arbre de décision](https://scikit-learn.org/stable/modules/tree.html#tree-classification) de la bibliothèque `scikit-learn` en utilisant les vecteurs de primitives deep réduits via PCA. Utiliser un *grid search* avec deux hyperparamètres pour trouver les meilleures valeurs de ceux-ci.

  b) Évaluer  la performance de votre modèle sur les trois sets de données en affichant les taux de classification (dans le tableau en bas du notebook) et afficher entre autre la matrice de confusion sur la base de test.

2.
  a) Entrainer et évaluer de la même façon le modèle [quadratic discriminant analysis](https://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.QuadraticDiscriminantAnalysis.html)  (non linéaire). On utilisera un grid search avec les paramètres suivants:
```
param_grid = {
    'reg_param': [0.0, 0.01, 0.1, 1.0],
    'tol': [1e-5, 1e-4, 1e-3, 1e-2]
}
```
  b) Commenter

3.
  a) Choisir, entraîner et évaluer un modèle linéaire tel que [Logistic regression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) ou une des variante de l'algorithme [naive bayes](https://scikit-learn.org/stable/modules/naive_bayes.html) sur les vecteurs de primitives réduits, ou bien (**au choix**) entraîner et évaluer l'algorithme [Linear Discriminant Analysis](https://scikit-learn.org/stable/modules/generated/sklearn.discriminant_analysis.LinearDiscriminantAnalysis.html) sur les vecteurs non réduits obtenus   

  b) Commenter

4.
  a) Entraîner un modèles de classification [K-Nearest-Neighbors](https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html) (modèle non paramétrique) en faisant un grid_search sur deux hyperparamètres du modèle puis évaluer celui-ci.

  b) Commenter.

5. Comparez les différents résultats obtenus via les différents modèles utilisés en présentant vos considérations et conclusions sur les points suivants:

  a) La pertinence / avantages / désavantages d’utiliser la réduction de la dimensionnalité

  b) Impact sur la performances de l'arbre de décision entraîné dans ce lab par rapport à celui entraîné dans le lab précédent.

  c) Comment interprétez-vous les résultats de votre modèle le plus performant entre les différents modèles de classifications utilisés?



Question bonus: Utiliser la [décomposition du biais et de la variance](https://rasbt.github.io/mlxtend/user_guide/evaluate/bias_variance_decomp/) sur les modèles entraînés afin de mieux comprendre les modèles utilisés, le biais et la variance étant corrélés aux phénomènes de sous-entraînement et de sur-entraînement. On parle souvent du compromis biais-variance ("bias-variance tradeoff") lorsque l'on entraîne un modèle de classification (ou de regression), car on cherchera à trouver un juste equilibre entre le biais et la variance afin d'optimiser les performances.


#### Code

In [None]:
# Votre code ici

#1 Entrainement avec decision tree







In [None]:
#2 Entrainement avec QDA




In [None]:
#3 Entrainement avec LDA



In [None]:

#4 Entrainement avec KNN

#### Vos résultats ici:

Taux de bonnes classification (%) - Ajuster les titres selon vos modèles

| Ensemble | modèle TM   |  AD+LBP Global  | AD+LBP Local  | modèle deep 1 + arbre | modèle deep 2 - arbre | modèle deep 1 + PCA + arbre | modèle deep 1 + PCA + QDA | modèle deep 1 + LDA  | modèle deep 1 + PCA + KNN |
|----------|-------------|-----------------|---------------|---------------|---------------|----------|-------------|-----------------|---------------|
| App | 99,67 |  |  |  |  |  |  |  |  | |
| Val      | 89,77       |  |  |  |  |  |  |  |  | |
| Test     | 77,99       |  |  |  |  |  |  |  |  | |

# Fin