# Approximation de la finesse maximale avec un _réseau neuronal convolutif_

#### 
__Auteur__ : _Ilyas Baktache_  
__Année__ : 2023
_Université de Sherbrooke_
 
__Objectif__ :  On cherche à approximer la finesse maximale de profil d'aile d'avion en fonction du nombre de Reynolds et du nombre de Mach à l'aide de modèles de réseau de neurone convolutif.


# Introduction

Dans ce notebook, on cherche à développer un outil qui permet d’approximer les performances aérodynamiques d’un profil pour plusieurs raisons :
* Obtenir quasi-instantanément des données de finesse de profils.
* Éviter d’utiliser les logiciels comme Xfoil qui sont complexes (à faire marcher) et lents.

Dans ce but, on s’intéresse à la notion de réseau neuronal convolutif ou CNN. C’est une classe de réseaux neuronaux artificiels qui sont souvent utilisés pour de l’analyse d’imagerie visuelle comme on peut le voir sur cet article [13] qui compare divers modèle de CNN pour la reconnaissance d’expression faciale. Malgré le fait que les CNN soient principalement utilisés pour de l’analyse d’imagerie , on retrouve diverses applications des CNN pour des problèmes 1D qui se rapprochent du nôtre :
* Reconnaissance d’activité humaine : [9], [3]
* Approximation d’une fonction 1D : [4]

Ainsi, on souhaite étudier la précision de différents modèles de CNN appliqué à notre problème : l’approximation de finesse d’un profil d’aile.

In [1]:
## Librairies

# Data manipulation
import numpy as np
from itertools import combinations_with_replacement
# Plotting
import matplotlib.pyplot as plt
import seaborn as sns
# Custom
from data.pre_process import *

from data.


## Pré-traitement des données

On commence par importer les données de finesse de profils d’aile. Ces données sont issues du logiciel Xfoil et sont disponibles sur le site de l’Université de Sherbrooke [1]. On importe les données dans un dataframe pandas.


### Visualisation des données

On commence par visualiser les données de finesse de profils d’aile en fonction du nombre de Reynolds et du nombre de Mach. On peut voir que les données sont très dispersées et que la finesse maximale est très variable en fonction du nombre de Reynolds et du nombre de Mach.



### Préparation des données



### Etiquetage des données



## Modèles de CNN

On commence par définir les modèles de CNN que l’on va utiliser. On utilise la librairie Keras qui est une librairie de machine learning qui permet de créer des modèles de réseaux de neurones. On utilise la version 2.2.4 de Keras qui est compatible avec TensorFlow 2.0.0. 

### Modèle 1

On commence par définir le premier modèle de CNN. Ce modèle est composé de 3 couches de convolution, 2 couches de pooling et 2 couches de neurones entièrement connectés. On utilise la fonction d’activation ReLU pour les couches de convolution et de pooling et la fonction d’activation softmax pour la couche de sortie. On utilise :
* Pour la fonction de perte : la fonction d’erreur categorical_crossentropy car c'est un problème de classification multiclasse
* l’optimisation des paramètres du modèle : l’optimiseur Adam car il est plus rapide que l’optimiseur SGD et il donne de meilleurs résultats que l’optimiseur RMSprop
* Pour la métrique de performance : la précision car c’est un problème de classification multiclasse

### Modèle 2

On définit le deuxième modèle de CNN. Ce modèle est composé de 4 couches de convolution, 2 couches de pooling et 2 couches de neurones entièrement connectés. On utilise la fonction d’activation ReLU pour les couches de convolution et de pooling et la fonction d’activation softmax pour la couche de sortie. On utilise :
* Pour la fonction de perte : la fonction d’erreur categorical_crossentropy car c'est un problème de classification multiclasse
* l’optimisation des paramètres du modèle : l’optimiseur Adam car il est plus rapide que l’optimiseur SGD et il donne de meilleurs résultats que l’optimiseur RMSprop
* Pour la métrique de performance : la précision car c’est un problème de classification multiclasse

### Modèle 3

On définit le troisième modèle de CNN. Ce modèle est composé de 5 couches de convolution, 2 couches de pooling et 2 couches de neurones entièrement connectés. On utilise la fonction d’activation ReLU pour les couches de convolution et de pooling et la fonction d’activation softmax pour la couche de sortie. On utilise :
* Pour la fonction de perte : la fonction d’erreur categorical_crossentropy car c'est un problème de classification multiclasse
* l’optimisation des paramètres du modèle : l’optimiseur Adam car il est plus rapide que l’optimiseur SGD et il donne de meilleurs résultats que l’optimiseur RMSprop
* Pour la métrique de performance : la précision car c’est un problème de classification multiclasse

### Modèle 4

On définit le quatrième modèle de CNN. Ce modèle est composé de 6 couches de convolution, 2 couches de pooling et 2 couches de neurones entièrement connectés. On utilise la fonction d’activation ReLU pour les couches de convolution et de pooling et la fonction d’activation softmax pour la couche de sortie. On utilise :
* Pour la fonction de perte : la fonction d’erreur categorical_crossentropy car c'est un problème de classification multiclasse
* l’optimisation des paramètres du modèle : l’optimiseur Adam car il est plus rapide que l’optimiseur SGD et il donne de meilleurs résultats que l’optimiseur RMSprop
* Pour la métrique de performance : la précision car c’est un problème de classification multiclasse

### Hyperparamètres

Concernant les hyperparamètres, on cherche à determiner lesquelle permettent d'avoir la meilleur précision possible. Ainsi, on va tester plusieurs combinaisons d'hyperparamètres pour chaque modèle de CNN. On va tester les hyperparamètres suivants :
* Le nombre d'époques
* La taille du batch
* Le nombre de couches de convolution
* Le nombre de noyaux de convolution
* Le nombre de couches de pooling
* Le nombre de couches de neurones entièrement connectés
* La fonction d'activation




## Entraînement des modèles



On entraîne les modèles de CNN sur les données de finesse de profils d’aile. On utilise la fonction fit de Keras qui permet d’entraîner le modèle sur les données d’entraînement. On utilise 10% des données pour la validation croisée. On entraîne les modèles pendant 1000 époques. On utilise les callbacks suivants: 

* EarlyStopping : On utilise la fonction de Keras qui permet d’arrêter l’entraînement du modèle si la précision sur les données de validation n’augmente plus pendant 10 époques. Elle permet d’éviter le sur-apprentissage.
* On utilise la fonction ModelCheckpoint de Keras qui permet de sauvegarder le modèle qui a la meilleure précision sur les données de validation. 
* On utilise la fonction TensorBoard de Keras qui permet de visualiser les courbes de perte et de précision sur les données d’entraînement et de validation pendant l’entraînement du modèle. 
* On utilise la fonction LearningRateScheduler de Keras qui permet de réduire le taux d’apprentissage de 10% à chaque 10 époques. 
* On utilise la fonction ReduceLROnPlateau de Keras qui permet de réduire le taux d’apprentissage de 10% si la précision sur les données de validation n’augmente pas pendant 10 époques. 
* On utilise la fonction CSVLogger de Keras qui permet d’enregistrer les courbes de perte et de précision sur les données d’entraînement et de validation pendant l’entraînement du modèle dans un fichier CSV. 

Ensuite, pour l'analyse des résultats, on va utiliser les fonctions suivantes :
* On utilise la fonction confusion_matrix de scikit-learn qui permet de calculer la matrice de confusion. 
* On utilise la fonction classification_report de scikit-learn qui permet de calculer le rapport de classification. 

### Expérience sur les hyper-paramètres

On va maintenant tester les hyperparamètres pour chaque modèle de CNN comme définis plus haut. On extrait alors les résultats par modèle:

* Modèle 1 :
    * Nombre d'époques : 100
    * Taille du batch : 32
    * Nombre de couches de convolution : 3
    * Nombre de noyaux de convolution : 32
    * Fonction d'activation : ReLU
* Modèle 2 :
    * Nombre d'époques : 100
    * Taille du batch : 32
    * Nombre de couches de convolution : 4
    * Nombre de noyaux de convolution : 32
    * Fonction d'activation : ReLU
* Modèle 3 :
    * Nombre d'époques : 100
    * Taille du batch : 32
    * Nombre de couches de convolution : 5
    * Nombre de noyaux de convolution : 32
    * Fonction d'activation : ReLU
* Modèle 4 :
    * Nombre d'époques : 100
    * Taille du batch : 32
    * Nombre de couches de convolution : 6
    * Nombre de noyaux de convolution : 32
    * Fonction d'activation : ReLU



## Résultats

On affiche alors dans la partie suivante les résultats de ces modèles avec les meilleurs hyperparamètres.

### Modèle 1

On affiche les courbes de perte et de précision sur les données d’entraînement et de validation pendant l’entraînement du modèle. On affiche aussi la matrice de confusion et le rapport de classification.

In [None]:

read_test.show_results(1,0,50000,plot_loss=True)


### Modèle 2

On affiche les courbes de perte et de précision sur les données d’entraînement et de validation pendant l’entraînement du modèle. On affiche aussi la matrice de confusion et le rapport de classification.

In [None]:
read_test.show_results(2,0,50000,plot_loss=True)


### Modèle 3

On affiche les courbes de perte et de précision sur les données d’entraînement et de validation pendant l’entraînement du modèle. On affiche aussi la matrice de confusion et le rapport de classification.

In [None]:
read_test.show_results(3,0,50000,plot_loss=True)


### Modèle 4

On affiche les courbes de perte et de précision sur les données d’entraînement et de validation pendant l’entraînement du modèle. On affiche aussi la matrice de confusion et le rapport de classification.

In [None]:
read_test.show_results(4,0,50000,plot_loss=True)
