# Projet AIOI

https://www.kaggle.com/c/stanford-covid-vaccine

## Les imports

In [1]:
%%capture

from collections import Counter

# Modules
from aioi.data import data
from aioi.files import read_file as rf
import aioi.graphique.plot as plot
from aioi.models import models as mdl

## Charger les données

In [2]:
arn_train = rf.read_json('./Data/train.json')
arn_test = rf.read_json('./Data/test.json')

In [3]:
arn_train.columns, arn_test.columns

(Index(['index', 'id', 'sequence', 'structure', 'predicted_loop_type',
        'signal_to_noise', 'SN_filter', 'seq_length', 'seq_scored',
        'reactivity_error', 'deg_error_Mg_pH10', 'deg_error_pH10',
        'deg_error_Mg_50C', 'deg_error_50C', 'reactivity', 'deg_Mg_pH10',
        'deg_pH10', 'deg_Mg_50C', 'deg_50C'],
       dtype='object'),
 Index(['index', 'id', 'sequence', 'structure', 'predicted_loop_type',
        'seq_length', 'seq_scored'],
       dtype='object'))

## Les données

In [4]:
arn_train.shape, arn_train['id'].nunique(), arn_test.shape

((2400, 19), 2400, (3634, 7))

<div class="alert alert-block alert-warning">
    Nettoyer les données, i.e ne prendre en compte que les ARN qui ont un <bold>SN_filter de 1<bold>
</div>

In [5]:
arn_train = arn_train.query('SN_filter == 1')
arn_train.shape

(1589, 19)

In [6]:
arn_train.head()

Unnamed: 0,index,id,sequence,structure,predicted_loop_type,signal_to_noise,SN_filter,seq_length,seq_scored,reactivity_error,deg_error_Mg_pH10,deg_error_pH10,deg_error_Mg_50C,deg_error_50C,reactivity,deg_Mg_pH10,deg_pH10,deg_Mg_50C,deg_50C
0,0,id_001f94081,GGAAAAGCUCUAAUAACAGGAGACUAGGACUACGUAUUUCUAGGUA...,.....((((((.......)))).)).((.....((..((((((......,EEEEESSSSSSHHHHHHHSSSSBSSXSSIIIIISSIISSSSSSHHH...,6.894,1,107,68,"[0.1359, 0.20700000000000002, 0.1633, 0.1452, ...","[0.26130000000000003, 0.38420000000000004, 0.1...","[0.2631, 0.28600000000000003, 0.0964, 0.1574, ...","[0.1501, 0.275, 0.0947, 0.18660000000000002, 0...","[0.2167, 0.34750000000000003, 0.188, 0.2124, 0...","[0.3297, 1.5693000000000001, 1.1227, 0.8686, 0...","[0.7556, 2.983, 0.2526, 1.3789, 0.637600000000...","[2.3375, 3.5060000000000002, 0.3008, 1.0108, 0...","[0.35810000000000003, 2.9683, 0.2589, 1.4552, ...","[0.6382, 3.4773, 0.9988, 1.3228, 0.78770000000..."
2,2,id_006f36f57,GGAAAGUGCUCAGAUAAGCUAAGCUCGAAUAGCAAUCGAAUAGAAU...,.....((((.((.....((((.(((.....)))..((((......)...,EEEEESSSSISSIIIIISSSSMSSSHHHHHSSSMMSSSSHHHHHHS...,8.8,1,107,68,"[0.0931, 0.13290000000000002, 0.11280000000000...","[0.1365, 0.2237, 0.1812, 0.1333, 0.1148, 0.160...","[0.17020000000000002, 0.178, 0.111, 0.091, 0.0...","[0.1033, 0.1464, 0.1126, 0.09620000000000001, ...","[0.14980000000000002, 0.1761, 0.1517, 0.116700...","[0.44820000000000004, 1.4822, 1.1819, 0.743400...","[0.2504, 1.4021, 0.9804, 0.49670000000000003, ...","[2.243, 2.9361, 1.0553, 0.721, 0.6396000000000...","[0.5163, 1.6823000000000001, 1.0426, 0.7902, 0...","[0.9501000000000001, 1.7974999999999999, 1.499..."
5,5,id_00ab2d761,GGAAAGCGCCGCGGCGGUAGCGGCAGCGAGGAGCGCUACCAAGGCA...,.....(.(((((.(((((((((...........)))))))..(((....,EEEEESISSSSSISSSSSSSSSHHHHHHHHHHHSSSSSSSMMSSSH...,4.136,1,107,68,"[0.1942, 0.2041, 0.1626, 0.1213, 0.10590000000...","[0.2726, 0.2984, 0.21660000000000001, 0.1637, ...","[0.3393, 0.2728, 0.2005, 0.1703, 0.1495, 0.134...","[0.165, 0.20520000000000002, 0.179, 0.1333, 0....","[0.2864, 0.24710000000000001, 0.2222, 0.1903, ...","[0.7642, 1.6641, 1.0622, 0.5008, 0.4107, 0.133...","[0.9559000000000001, 1.9442, 1.0114, 0.5105000...","[1.9554, 2.1298, 1.0403, 0.609, 0.5486, 0.386,...","[0.22460000000000002, 1.7281, 1.381, 0.6623, 0...","[0.5882000000000001, 1.1786, 0.9704, 0.6035, 0..."
6,6,id_00abef1d7,GGAAAACAAUUGCAUCGUUAGUACGACUCCACAGCGUAAGCUGUGG...,.........((((((((......((((((((((((....)))))))...,EEEEEEEEESSSSSSSSIIIIIISSSSSSSSSSSSHHHHSSSSSSS...,2.485,1,107,68,"[0.422, 0.5478000000000001, 0.4749000000000000...","[0.4801, 0.7943, 0.42160000000000003, 0.397300...","[0.9822000000000001, 1.272, 0.6940000000000001...","[0.5827, 0.7555000000000001, 0.5949, 0.4511, 0...","[0.9306000000000001, 1.0496, 0.5844, 0.7796000...","[0.895, 2.3377, 2.2305, 2.003, 1.9006, 1.0373,...","[0.46040000000000003, 3.6695, 0.78550000000000...","[2.7711, 7.365, 1.6924000000000001, 1.43840000...","[1.073, 2.8604000000000003, 1.9936, 1.0273, 1....","[2.0964, 3.3688000000000002, 0.6399, 2.1053, 1..."
7,7,id_00b436dec,GGAAAUCAUCGAGGACGGGUCCGUUCAGCACGCGAAAGCGUCGUGA...,.....(((((((((((..(((((((((..((((....))))..)))...,EEEEESSSSSSSSSSSIISSSSSSSSSIISSSSHHHHSSSSIISSS...,1.727,1,107,68,"[0.4843, 0.5233, 0.4554, 0.43520000000000003, ...","[0.8719, 1.0307, 0.6649, 0.34500000000000003, ...","[0.7045, 0.7775000000000001, 0.5662, 0.4561, 0...","[0.384, 0.723, 0.4766, 0.30260000000000004, 0....","[0.7429, 0.9137000000000001, 0.480400000000000...","[1.1576, 1.5137, 1.3382, 1.5622, 1.2121, 0.295...","[1.6912, 5.2652, 2.3901, 0.45890000000000003, ...","[1.8641, 2.3767, 1.149, 1.0132, 0.9876, 0.0, 0...","[0.49060000000000004, 4.6339, 1.95860000000000...","[1.2852000000000001, 2.5460000000000003, 0.234..."


In [7]:
arn_test.head()

Unnamed: 0,index,id,sequence,structure,predicted_loop_type,seq_length,seq_scored
0,0,id_00073f8be,GGAAAAGUACGACUUGAGUACGGAAAACGUACCAACUCGAUUAAAA...,......((((((((((.(((((.....))))))))((((((((......,EEEEEESSSSSSSSSSBSSSSSHHHHHSSSSSSSSSSSSSSSSHHH...,107,68
1,1,id_000ae4237,GGAAACGGGUUCCGCGGAUUGCUGCUAAUAAGAGUAAUCUCUAAAU...,.....((((..((((((...(((((.....((((....)))).......,EEEEESSSSIISSSSSSIIISSSSSIIIIISSSSHHHHSSSSIIII...,130,91
2,2,id_00131c573,GGAAAACAAAACGGCCUGGAAGACGAAGGAAUUCGGCGCGAAGGCC...,...........((.(((.(.(..((..((..((((...))))..))...,EEEEEEEEEEESSISSSISISIISSIISSIISSSSHHHSSSSIISS...,107,68
3,3,id_00181fd34,GGAAAGGAUCUCUAUCGAAGGAUAGAGAUCGCUCGCGACGGCACGA...,......((((((((((....))))))))))((((((..((.(((.....,EEEEEESSSSSSSSSSHHHHSSSSSSSSSSSSSSSSIISSISSSHH...,107,68
4,4,id_0020473f7,GGAAACCCGCCCGCGCCCGCCCGCGCUGCUGCCGUGCCUCCUCUCC...,.....(((((((((((((((((((((((((((((((((((((((((...,EEEEESSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSS...,130,91


In [8]:
Counter(arn_train['seq_length']), Counter(arn_test['seq_length']), Counter(arn_test['seq_scored'])

(Counter({107: 1589}),
 Counter({107: 629, 130: 3005}),
 Counter({68: 629, 91: 3005}))

<div class="alert alert-block alert-warning">
    Un traitement préalable des arn_train & arn_test va être réalisé :
</div>

> Séquence de taille 107

- Part1: seq[:68]
- Part2: seq[107-68:]

> Séquence de taille 130

- Part1: seq[:68]
- Part2: seq[130-68:]

=> Ce traitement consiste à découper chaque séquence en deux segments (part1 & part2) de taille 68, qui correspond à la taille minimum des séquence scored.

Le but de ce traitement préalable est de prédire les targets sur les 68 premières positions (part1) de chaque séquence, et sur les 68 dernières (part2).

Ensuite, on va reconstituer la séquence complète en combinant les prédictions faites sur part1 & part2 de la manière suivante:

![](./Models/prediction-arn-complet.png)

### Input x

In [9]:
arn_train.shape

(1589, 19)

> Formatage des arn_train

In [10]:
train_data = data.formatage_x(arn_train)
train_data.shape

(3178, 6)

In [11]:
train_data.head()

Unnamed: 0,index,id,sequence,structure,predicted_loop_type,seq_length
0,0,id_001f94081,GGAAAAGCUCUAAUAACAGGAGACUAGGACUACGUAUUUCUAGGUA...,.....((((((.......)))).)).((.....((..((((((......,EEEEESSSSSSHHHHHHHSSSSBSSXSSIIIIISSIISSSSSSHHH...,107
1,0,,CUAGGUAACUGGAAUAACCCAUACCAGCAGUUAGAGUUCGCUCUAA...,((((....))))))..)).....))....(((((((....))))))...,SSSSHHHHSSSSSSIISSIIIIISSXXXXSSSSSSSHHHHSSSSSS...,107
2,2,id_006f36f57,GGAAAGUGCUCAGAUAAGCUAAGCUCGAAUAGCAAUCGAAUAGAAU...,.....((((.((.....((((.(((.....)))..((((......)...,EEEEESSSSISSIIIIISSSSMSSSHHHHHSSSMMSSSSHHHHHHS...,107
3,2,,AUAGAAUCGAAAUAGCAUCGAUGUGUAUAUGGGUGGUUCGCCGCUC...,......))))..)))).....)).)))).(((((((....))))))...,HHHHHHSSSSMMSSSSIIIIISSISSSSXSSSSSSSHHHHSSSSSS...,107
4,5,id_00ab2d761,GGAAAGCGCCGCGGCGGUAGCGGCAGCGAGGAGCGCUACCAAGGCA...,.....(.(((((.(((((((((...........)))))))..(((....,EEEEESISSSSSISSSSSSSSSHHHHHHHHHHHSSSSSSSMMSSSH...,107


Chaque séquence a été divisée en deux segments de taille 68.

> One hot encoding des séquences

In [12]:
x_seq = data.x_sequence(train_data['sequence'])
x_seq.shape

(3178, 68, 4)

> One hot encoding des structures

In [13]:
x_struc = data.x_structure(train_data['structure'])
x_struc.shape

(3178, 68, 3)

> One hot encoding des loops type

In [14]:
x_loops = data.x_predicted_loops(train_data['predicted_loop_type'])
x_loops.shape

(3178, 68, 7)

> Regroupement dans une seul matrice de dimension (3178, 68, 14)

Avec

- 3178: le nombre d'ARN * 2 - chaque séquence a été préalablement divisé en deux segments de taille 68
- 68: la taille des séquences
- 14: le nombre de classes - 4 pour les acides aminés, 3 pour les strucutres & 7 pour les types de boucles prédites

In [15]:
x_train = data.x_concatenation(x_seq, x_struc, x_loops)
x_train.shape

(3178, 68, 14)

### Output y

> Sélection des targets 

In [16]:
col_names = ['reactivity', 'deg_Mg_pH10', 'deg_pH10', 'deg_Mg_50C', 'deg_50C']
Y_output = arn_train[col_names]
Y_output.shape

(1589, 5)

> Formatage Y_output de dimension (3178, 68, 5)

- 3178: le nombre d'ARN * 2 - chaque séquence a été préalablement divisé en deux segments de taille 68
- 68: la partie des arn qui a été scored, soit les 68 premiers acides aminés
- 5: les 5 targets

In [17]:
y_train = data.y_output(Y_output)

Y_train shape: (3178, 68, 5)



## Dataset de test

> Formatage des données de test

Chaque séquence a été séparée en deux segments de taille 68. 

In [18]:
test_data, x_test = data.new_x(arn_test)
test_data.shape, x_test.shape

Data frame arn_test shape: (7268, 6)
Sequences shape: (7268, 68, 4) - 4 classes
Structures shape: (7268, 68, 3) - 3 classes
Loops shape: (7268, 68, 7) - 7 classes
x_new shape: (7268, 68, 14)



((7268, 6), (7268, 68, 14))

# Modèle keras

Pour chaque modèle, les étapes suivantes ont été réalisées:

1. **Optimisation** des performances du réseau de neurones

Le *learning rate* ou taux d'apprentissage en français est un paramètre qui influ directement sur les performances d'un modèle. En effet, il renseigne en quelque sorte la vitesse à laquel un modèle va apprendre. 

- Une valeur trop basse de learnig rate peut augmenter drastiquement le processus d'apprentissage voir le blocker à un certain plateau.
- Une valeur trop élevé de learning rate peut quant-à elle entraîner un processus d'apprentissage trop rapide, qui est caractérisé par un apprentissage trop rapide d'un ensemble de poids sous-optimal

Déterminer pour chaque modèle un learning rate adapté est donc nécessaire.

Dans notre cas l'argument *decay* de la class *SGD* a été utilisé. Cet argument indique avec quel taux le learning rate décroit.

Par défaut le learning rate est initialisé à 0.01 et on évalue les perfomances de chaque modèle pour les valeur **decay** suivante [1E-1, 1E-2, 1E-3, 1E-4, 1E-5, 1E-6, 1E-7, 1E-8].

2. **Validation** par repeated k-fold cross-validation

K-fold cross validation est une méthode qui permet d'estimer les performances des modèles. Elle consiste à:

- Shuffle le jeu de données
- Diviser le jeu de données en k groupe - avec k = 10
- Pour chaque groupe: 
    - Le sélectionner en tant que jeu de données de test - test set
    - Sélectionner les groupes restants en tant que jeu de données d'apprentissage - training set
    - Fit le modèle sur le training set & l'évaluer sur le test set
- Renvoyer une valeur moyenne des scores obtenues pour chaque modèle

Dans notre cas, une repeated k-fold cross-validation a été préférée. Elle consite à:

- Réaliser x k-fold cross validation - avec x = 10
- Renvoyer la valeur moyenne des résultats pour les x k-fold cross validation

On s'attend à obtenir une meilleur évalutation des performances du modèles avec cette méthode.

3. **Apprentissage**

L'apprentissage des modèles ont été réalisés sur les dataset suivant:

- x_train: avec une shape de (3178, 68, 14)
- y_train: avec une shape de (3178, 68, 5)

4. **Prediction** sur le dataset arn_test

Les prédictions des modèles ont été rééalisées sur le dataset suivant:

- x_test: avec une shape de (7268, 68, 14)

In [19]:
keras_models = rf.load_keras_models()

In [27]:
validation = {}
with open("./Models/kfold_validation_scores.txt", "r") as filin:
    for line in filin:
        if not line.startswith('Loss'):
            model = line.split('-')[0].strip().lower()
            data = line.split('-')[1].strip()
            validation[model] = data
validation

{'model_simple': 'Loss: mean=0.196, std=0.040 | Mse: mean=0.196, sd=0.040',
 'model_resnet_10': 'Loss: mean=0.218, std=0.050 | Mse: mean=0.218, sd=0.050',
 'model_compact_data': 'Loss: mean=0.161, std=0.013 | Mse: mean=0.161, sd=0.013',
 'model_scatter_data': 'Loss: mean=0.169, std=0.029 | Mse: mean=0.169, sd=0.029',
 'model_inception': 'Loss: mean=0.158, std=0.017 | Mse: mean=0.158, sd=0.017',
 'model_resnext': 'Loss: mean=0.181, std=0.015 | Mse: mean=0.181, sd=0.015'}

## Modèle simple

Modèle constituer d'une simple succession de couche de convolution.

In [32]:
keras_models['model_simple'].summary()

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         (None, 68, 14)            0         
_________________________________________________________________
conv1d_1 (Conv1D)            (None, 68, 45)            1935      
_________________________________________________________________
conv1d_2 (Conv1D)            (None, 68, 35)            4760      
_________________________________________________________________
conv1d_3 (Conv1D)            (None, 68, 25)            2650      
_________________________________________________________________
conv1d_4 (Conv1D)            (None, 68, 15)            1140      
_________________________________________________________________
conv1d_5 (Conv1D)            (None, 68, 5)             230       
Total params: 10,715
Trainable params: 10,715
Non-trainable params: 0
_______________________________________________________

<img src="./Models/Neural_network/network-model_simple.png" style="width: 300px;"/>

### Optimisation

![](./Models/Optimisation/optimisation-model_simple.png)

Au vu du graphe, un decay rate $\leq$ 1E-4 semble adapté. Un decay rate trop grand ($\geq$ 1E-2) entraîne un apprentissage trop rapide

### Validation

In [28]:
validation['model_simple']

'Loss: mean=0.196, std=0.040 | Mse: mean=0.196, sd=0.040'

Une loss de 0.196 indique que les performances du modèles sont assez moyenne. 

### Apprentissage

![](./Models/Summarize_models/model_simple.png)

Le modèle présente des performances comparable:

1. En **resubstitution** (rouge): performances du modèle sur les données apprises - train dataset
2. En **généralisation** (bleu): performances du modèle sur les données non apprises - test dataset

De plus, au vu des courbes obtenues il ne semble pas nécessaire d'augmenter le nombre d'epochs.

## Modèle resnet

Modèle resnet constituer de 10 blocks resnet.

In [37]:
keras_models['model_resnet_10'].summary()

Model: "model_2"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_2 (InputLayer)            (None, 68, 14)       0                                            
__________________________________________________________________________________________________
conv1d_6 (Conv1D)               (None, 68, 15)       645         input_2[0][0]                    
__________________________________________________________________________________________________
conv1d_7 (Conv1D)               (None, 68, 15)       690         conv1d_6[0][0]                   
__________________________________________________________________________________________________
conv1d_8 (Conv1D)               (None, 68, 15)       690         conv1d_7[0][0]                   
____________________________________________________________________________________________

<img src="./Models/Neural_network/network-model_resnet_10.png" style="width: 300px;"/>

### Optimisation

![](./Models/Optimisation/optimisation-model_resnet_10.png)

Au vu du graphe, un decay rate $\leq$ 1E-7 semble adapté. Un decay rate trop grand ($\geq$ 1E-6) entraîne un apprentissage trop rapide

### Validation

In [38]:
validation['model_resnet_10']

'Loss: mean=0.218, std=0.050 | Mse: mean=0.218, sd=0.050'

Une loss de 0.218 indique que les performances du modèles sont assez moyenne. 

### Apprentissage

![](./Models/Summarize_models/model_resnet_10.png)

Le modèle présente des performances comparable:

1. En **resubstitution** (rouge): performances du modèle sur les données apprises - train dataset
2. En **généralisation** (bleu): performances du modèle sur les données non apprises - test dataset

De plus, au vu des courbes obtenues il ne semble pas nécessaire d'augmenter le nombre d'epochs. L'observation de variation en test, indique même que diminuer le nombre d'epochs pourrait être envisagé pour ce modèle.

## Modèle compact data

Modèle où on cherche à déterminer si compresser les données entraîne une baisse des performances.

In [40]:
keras_models['model_compact_data'].summary()

Model: "model_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_3 (InputLayer)         (None, 68, 14)            0         
_________________________________________________________________
conv1d_30 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_31 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_32 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_33 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_34 (Conv1D)           (None, 68, 11)            473       
_________________________________________________________________
conv1d_35 (Conv1D)           (None, 68, 8)             272 

<img src="./Models/Neural_network/network-model_compact_data.png" style="width: 300px;"/>

### Optimisation

![](./Models/Optimisation/optimisation-model_compact_data.png)

Au vu du graphe, un decay rate de 1E-6 ou 1E-7 semble adapté. Un decay rate trop grand ($\geq$ 1E-5) entraîne un apprentissage trop rapide

### Validation

In [41]:
validation['model_compact_data']

'Loss: mean=0.161, std=0.013 | Mse: mean=0.161, sd=0.013'

Une loss de 0.161 indique que les performances du modèles sont correctes. 

### Apprentissage

![](./Models/Summarize_models/model_compact_data.png)

Le modèle présente des performances comparable:

1. En **resubstitution** (rouge): performances du modèle sur les données apprises - train dataset
2. En **généralisation** (bleu): performances du modèle sur les données non apprises - test dataset

De plus, au vu des courbes obtenues il ne semble pas nécessaire d'augmenter le nombre d'epochs.

## Modèle scatter data

Modèle où on cherche à déterminer si disperser les données entraîne une baisse des performances.

In [43]:
keras_models['model_scatter_data'].summary()

Model: "model_4"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_4 (InputLayer)         (None, 68, 14)            0         
_________________________________________________________________
conv1d_39 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_40 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_41 (Conv1D)           (None, 68, 14)            602       
_________________________________________________________________
conv1d_42 (Conv1D)           (None, 68, 35)            1505      
_________________________________________________________________
conv1d_43 (Conv1D)           (None, 68, 84)            8904      
_________________________________________________________________
conv1d_44 (Conv1D)           (None, 68, 133)           3364

<img src="./Models/Neural_network/network-model_scatter_data.png" style="width: 300px;"/>

### Optimisation

![](./Models/Optimisation/optimisation-model_scatter_data.png)

Au vu du graphe, un decay rate de 1E-4, 1E-5, 1E-6 ou 1E-8 sera favorisé. Ensuite, c'est un decay rate de 1E-4 qui entraine le moins de variation de la val loss et qui sera donc appliqué. 

### Validation

In [44]:
validation['model_scatter_data']

'Loss: mean=0.169, std=0.029 | Mse: mean=0.169, sd=0.029'

Une loss de 0.169 indique que les performances du modèles sont correctes. 

### Apprentissage

![](./Models/Summarize_models/model_scatter_data.png)

Le modèle présente des performances comparable:

1. En **resubstitution** (rouge): performances du modèle sur les données apprises - train dataset
2. En **généralisation** (bleu): performances du modèle sur les données non apprises - test dataset

De plus, au vu des courbes obtenues il ne semble pas nécessaire d'augmenter le nombre d'epochs.

## Modèle inception

## Modèle simple

Modèle constituer d'une simple succession de couche de convolution.

In [45]:
keras_models['model_inception'].summary()

Model: "model_5"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_5 (InputLayer)            (None, 68, 14)       0                                            
__________________________________________________________________________________________________
conv1d_50 (Conv1D)              (None, 68, 14)       602         input_5[0][0]                    
__________________________________________________________________________________________________
conv1d_51 (Conv1D)              (None, 68, 14)       602         conv1d_50[0][0]                  
__________________________________________________________________________________________________
conv1d_52 (Conv1D)              (None, 68, 14)       602         conv1d_51[0][0]                  
____________________________________________________________________________________________

<img src="./Models/Neural_network/network-model_inception.png" style="width: 800px;"/>

### Optimisation

![](./Models/Optimisation/optimisation-model_inception.png)

Au vu du graphe, un decay rate de 1E-3, 1E-4 ou 1E-6 sera appliqué.

### Validation

In [46]:
validation['model_inception']

'Loss: mean=0.158, std=0.017 | Mse: mean=0.158, sd=0.017'

Une loss de 0.158 indique que les performances du modèles sont correctes. 

### Apprentissage

![](./Models/Summarize_models/model_inception.png)

Le modèle présente des performances comparable:

1. En **resubstitution** (rouge): performances du modèle sur les données apprises - train dataset
2. En **généralisation** (bleu): performances du modèle sur les données non apprises - test dataset

De plus, au vu des courbes obtenues il ne semble pas nécessaire d'augmenter le nombre d'epochs.

## Modèle resnext

## Modèle simple

Modèle constituer d'une simple succession de couche de convolution.

In [47]:
keras_models['model_resnext'].summary()

Model: "model_6"
__________________________________________________________________________________________________
Layer (type)                    Output Shape         Param #     Connected to                     
input_6 (InputLayer)            (None, 68, 14)       0                                            
__________________________________________________________________________________________________
conv1d_64 (Conv1D)              (None, 68, 14)       602         input_6[0][0]                    
__________________________________________________________________________________________________
conv1d_65 (Conv1D)              (None, 68, 14)       602         conv1d_64[0][0]                  
__________________________________________________________________________________________________
conv1d_67 (Conv1D)              (None, 68, 14)       602         conv1d_64[0][0]                  
____________________________________________________________________________________________

Pour visualiser le graphe du réseau de neurones: ./Models/Neural_network/network-model_resnext.png

### Optimisation

![](./Models/Optimisation/optimisation-model_resnext.png)

Au vu du graphe, un decay rate $\leq$ 1E-3 semble adapté. Un decay rate trop grand ($\geq$ 1E-2) entraîne un apprentissage trop rapide

### Validation

In [48]:
validation['model_resnext']

'Loss: mean=0.181, std=0.015 | Mse: mean=0.181, sd=0.015'

Une loss de 0.181 indique que les performances du modèles sont assez moyenne. 

### Apprentissage

![](./Models/Summarize_models/model_resnext.png)

Le modèle présente des performances comparable:

1. En **resubstitution** (rouge): performances du modèle sur les données apprises - train dataset
2. En **généralisation** (bleu): performances du modèle sur les données non apprises - test dataset

De plus, au vu des courbes obtenues il ne semble pas nécessaire d'augmenter le nombre d'epochs.

## Conclusion

Pour conclure, quel que soit le type de modèles mis en place, on obtient:

1. Des performances moyennes voir correcte - une loss comprise entre 0.16 & 0.2 selon les modèles
2. Des performances en **resubstitution** & **généralisation** équivalente - ce qui indique une absence de sur/sous-apprentissage
3. Un private & public score sur kaggle équivalent - un public score plutôt bon proche 

![image.png](./Models/kaggle-submission-score.png)