# GTI771 - Apprentissage machine avancé
## Département de génie logiciel et des technologies de l’information



## Laboratoire 8 - Machine à vecteurs de support (SVM) et régresseur à vecteurs de support (SVR)
#### <font color=black> Version 2 - Été 2024 </font>

##### <font color=grey> Version 1 - Prof. Alessandro L. Koerich.
##### Version 2 - Chargé de lab. Arthur Josi

| NOMS                  | CODE PERMANENT  |  PARTICIPATION     |
|-----------------------|-----------------|--------------------|
| Hugo Rhéaume-Simard   | RHEH93080004          |    33%            |
| Laurent Marleau-Gallant             |  MARL05109800  |      33%            |
| Yulia Bakaleinik             | BAKY30539705        |     33%            |

# Introduction

Ce troisième laboratoire porte sur l’utilisation des machines à vecteurs de support (SVM) et régresseurs à vecteurs de support (SVR).

Vous devez proposer des modèles de classification (SVM) et régression (SVR) afin de résoudre deux problèmes: prédiction de l'âge de personnes à partir de photos du visage (régression) (dataset FG-NET); prédiction des émotions à partir de photos du visage (classification) introduites dans le cadre des laboratoires précédents.

Vous devrez utiliser les primitives développées aux laboratoires précedents et vous devrez étudier les hyperparamètres des SVMs et SVRs

L’évaluation de ce laboratoire sera basée sur:
- la qualité des SVMs et SVRs proposés et utilisés; (10%)
- utilisation du protocole et mesures de performance appropriées; (10%)
- les réponses aux questions dans ce notebook;(70%)
- l'organisation de votre code source (SVP, n'oubliez pas de mettre des commentaires dans le code source!); (10%)


Votre Jupyter notebook devra contenir les réponses aux questions. Il devra notamment avoir une analyse détaillée des résultats de classification obtenus par les différents modèles et leurs variations d’hyperparamètres.

# Modules et bibliotèques python

### Import de bibliotèques

###  <font color=blue> À faire: </font>
Ajouter les bibliothèques que vous avez utilisées pour compléter ce notebook dans une cellule avec une petite description.

In [None]:
import numpy as np  # package for scientific computing with Python.
import matplotlib.pyplot as plt # 2D plotting library

# Votre code ici

### Définition des fonctions

In [None]:
# Cette fonction ne fait rien. Elle ne reçoit aucune variable et retourne 1
def fa():
    return 1

# Vos fonctions:


# Partie 1: Classification avec machines à vecteurs de support (SVM)
## (FER dataset)

Dans cette partie vous devez explorer les <b> différents noyaux du SVM </b> disponibles dans la librarie LIBSVM ([Scikit-learn LibSVM](https://scikit-learn.org/stable/modules/svm.html)) (tels que linéaire, polynomial et RBF).

Les machines à vecteurs de support (SVM) sont un ensemble de méthodes d'apprentissage supervisé utilisées pour la classification, la régression et la détection des valeurs aberrantes.

Les avantages des machines à vecteurs de support sont:

- Efficace dans les espaces de grande dimension.
- Toujours efficace dans les cas où le nombre de dimensions est supérieur au nombre d'échantillons.
- Utilise un sous-ensemble de points d'apprentissage dans la fonction de décision (appelés vecteurs de support), donc il est également efficace en mémoire.
- Polyvalent: différentes fonctions du noyau peuvent être spécifiées pour la fonction de décision. Des noyaux communs sont fournis, mais il est également possible de spécifier des noyaux personnalisés.

Les inconvénients des machines vectorielles de support incluent:

- Si le nombre de primitives est bien supérieur au nombre d'échantillons, évitez de sur-ajuster dans le choix des fonctions du noyau et le terme de régularisation est crucial.
- Les SVM ne fournissent pas directement d'estimations de probabilité, celles-ci sont calculées à l'aide d'une validation croisée coûteuse en cinq fois (voir scores et probabilités, dans [Scikit-learn LibSVM](https://scikit-learn.org/stable/modules/svm.html))

Vous devez comparer la performance de ces algorithmes pour les ensemble FER (classification)

<b>Attention! Important!</b> N’oubliez pas de normaliser les vecteurs (entrées) entre 0 et 1 ou -1 et +1. Les SVMs sont très sensibles aux données non-normalisées<br><br>

## 1a - Ensemble de données FER

Point de départ: *fer2013-clean-deep.csv* ou *fer2013-clean-pre-deep.csv*

###  <font color=blue> À faire: </font>
1. Reprenez votre ensemble de données nettoyé et repérez les trois partitions de données: apprentissage, validation et test.

In [None]:
# Load data
ferData = np.loadtxt( 'fer2013-clean-pre-deep.csv', delimiter=',', dtype=str )

# Training vecteurs
Xtrain = <à compléter>
ytrain = <à compléter>

# Validation vecteurs
Xval = <à compléter>
yval = <à compléter>

# Test vecteurs
Xtest = <à compléter>
ytest = <à compléter>

print(Xtrain.shape, Xval.shape, Xtest.shape)

2. Utiliser [Scikit-learn LibSVM](https://scikit-learn.org/stable/modules/svm.html) pour construire des SVMs qui vous permettront d'apprendre à partir des vecteurs de primitives. Pour cette question, on construira deux modèles, un SVM linéaire et un deuxième modèle avec un noyau à libre choix (polynomial, RBF, sigmoidal)

3. Comprendre et présenter les différents hyperparamètres qui peuvent affecter l'entraînement, la généralisation et la complexité des modèles définis sur la base de vos lectures.



4. Entraîner et optimiser les paramètres des modèles SVM. Utiliser le protocole <font color=blue> "hold-out" </font>.
- P. ex., pour un SVM linéaire, vous devez optimiser l'hyperparamètre ($C$) avec un grid search. Pour un SVM kernel polynomial vous devez optimiser l'ordre du polynôme ($d$ = 2, 3, etc.) et optimiser l'hyperparamètre ($C$) avec un un grid search ($C$, $d$). Pour un SVM kernel RBF vous devez optimiser les hyperparamètres ($C$ et $\gamma$)<br>
- <b>Astuce </b>: Vous avez déjà un ensemble de validation! Alors, c'est préférable (beaucoup plus rapide!) d’utiliser la librairie [hypopt](https://pypi.org/project/hypopt/) pour faire le réglage des hyperparamètres (grid seach). Comme bon nombre d'entres vous ont eu des problèmes avec la librairie la librairie [hypopt](https://pypi.org/project/hypopt/), n'hésiter pas à faire une validation croisée avec [scikit-Learn GridSearchCV](https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html#sklearn.model_selection.GridSearchCV) qui par défaut fait un 5-CV sur l'ensemble donné (On donnera dans ce cas la base de donnée d'entraitement et de validation en tant qu'une seule base de données).<br><br>



5. Utiliser ces réseaux pour faire la prédiction sur tous les exemples (apprentissage, validation, test) et rapporter les résultats (comme fait dans les TP1 à TP6):<br>
5a. Rapport de classification produit avec *<font color=green>from sklearn.metrics import classification_report</font>*<br>
5b. taux de classification correct sur les trois (3) ensembles de données (sous la forme d'un tableau)<br>
5c. matrice de confusion produite avec *<font color=green> from sklearn.metrics import confusion_matrix</font>* pour les résultats sur l'ensemble de test (matrice 7 $\times$ 7 - étiquéttes $\times$ prédictions)



6. Comparez les résultats avec ceux obtenus avec les CNNs (TP6), MLPs (TP5), primitives « deep » réduits (TP4), les primitives « deep » (TP3), les primitives globales/locales (TP2) et *template matching* (TP1)



| Ensemble |  TM   |  AD+LBP Glo | AD+LBP Loc | deep 1 | deep 2 | deep 1 $\chi^2$ | deep 1 PCA | CNN 1 | CNN 2 | CNN Pré | SVM Lin | SVM RBF |                                  
|----------|-------|-------------|------------|--------|--------|-----------------|------------|-------|-------|---------|----------|---------|
| App      | 99,67 |             |            |        |        |                 |            |       |       |         |        | |             
| Val      | 89,77 |             |            |        |        |                 |            |       |       |         |         | |
| Test     | 77,99 |             |            |        |        |                 |            |       |       |         | | |

7. Faire une brève analyse des résultats et présenter vos considérations et conclusions sur la pertinence / advantages / désavantages des SVMs.

# Partie 2: Régression avec machines à vecteurs de support (SVR)
## (FG-NET dataset)

Dans cette partie vous devez explorer les <b> différents noyaux du SVR </b> disponibles dans la librarie LIBSVM ([Scikit-learn LibSVM](https://scikit-learn.org/stable/modules/svm.html)).
Les régresseurs à vecteurs de support (SVR) sont un ensemble de méthodes d'apprentissage supervisé utilisées pour la régression.

Les avantages des régresseurs à vecteurs de support sont:

- Efficace dans les espaces de grande dimension.
- Toujours efficace dans les cas où le nombre de dimensions est supérieur au nombre d'échantillons.
- Utilise un sous-ensemble de points d'apprentissage dans la fonction de décision (appelés vecteurs de support), donc il est également efficace en mémoire.
- Polyvalent: différentes fonctions du noyau peuvent être spécifiées pour la fonction de décision. Des noyaux communs sont fournis, mais il est également possible de spécifier des noyaux personnalisés.

Les inconvénients des machines vectorielles de support incluent:

- Si le nombre de primitives est bien supérieur au nombre d'échantillons, évitez de sur-ajuster dans le choix des fonctions du noyau et le terme de régularisation est crucial.

Vous devez comparer la performance de ces algorithmes pour l'ensemble FG-NET (régression)

Point de départ: Jeu de primitives produites avec le CNN du TP5, *fg-net-12x12-deepVGG19.csv*.

###  <font color=blue> À faire: </font>
1. Reprenez votre vecteurs de primitives. Vous devez lire ces vecteurs et les représenter sous la forme d’une matrice $X\_data$ aussi que les vecteurs $Y\_data$ avec les âges et $Z\_data$ avec les id des sujets.

In [None]:
# Votre code ici

2. Utiliser [Scikit-learn LibSVM](https://scikit-learn.org/stable/modules/svm.html) pour construire des SVRs qui vous permettront d'apprendre à partir des vecteurs de primitives. Pour cette question, on construira deux modèles, un SVM linéaire et un deuxième modèle avec un noyau que vous souhaitez (polynomial, RBF, sigmoidal)


3. Entraîner et optimiser les paramètres des modèles SVR. Utiliser le protocole <font color=blue> "hold-out" </font> comme lors du laboratoire précédent.


5. Comparez les résultats en les ajoutant au tableau suivant avec ceux obtenus via CNNs (TP7), MLPs (TP6), et régression linéaire (TP5)   

| Algorithme            | Paramètres    |  MSE  |  MAE  | ????? |
|-----------------------|---------------|-------|-------|-------|
| Regr lineaire         | XXX.XX        |XXX.XX |XXX.XX |       |
| Regr Ridge            | alpha = 0.1   |123.34 | 10.45 |       |
| Regr Lasso            | XXX.XX        |XXX.XX |XXX.XX |       |
| Regr ElasticNet       | XXX.XX        |XXX.XX |XXX.XX |       |
| MLP 1                 | 512:100:100:1 |XXX.XX |XXX.XX |       |
| MLP 2                 | 512:50:1      |XXX.XX |XXX.XX |       |
| CNN 1                 | 512:100:100:1 |XXX.XX |XXX.XX |       |
| CNN 2 (DA)            | 512:50:1      |XXX.XX |XXX.XX |       |
| VGG16 (DA)            | 512:50:1      |XXX.XX |XXX.XX |       |
| SVR linéaire       | C=1,e=3          | 10.45 |       |       |
| SVR RBF            | C=256, e=2, g=0.5| XXX.XX| XXX.XX|       |         


6. Faire une brève analyse des résultats et présenter vos considérations et conclusions sur la pertinence / advantages / désavantages des SVRs.

# Fin