# Mise en situation : 
Nous sommes dans le contexte où des coureurs parcours une certaine distance et reçoivent un certain 
classement en fonction de la distance parcourue. <br>
Entre [0;25] kms -> D <br>
Entre ]25;50] kms -> C <br>
Entre ]50;75] kms -> B <br>
Entre ]75;100] kms -> A 

# Objectif :
Créer un réseau de neurones qui est en capacité de comprendre ce phénomène en faisant de la classification multi-classe correctement pour les coureurs en fonction de leur distance parcourue. Notre modèle devra analyser les données pour faire le lien entre les kilomètres et le classement en conséquence, chose dont il n'a pas connaissance à son initialisation. Nous nous baserons sur la librairie pytorch pour exécuter notre plan.

In [20]:
# import des librairies
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
import random
import numpy as np
import pandas as pd 

# PARTIE 1 : 

# Mise en place du jeu de données

In [3]:
# Génération des kilomètres (kms) aléatoirement
kms = np.random.uniform(1, 100, 10000)
df = pd.DataFrame({'kilometres': kms})
df.head()

Unnamed: 0,kilometres
0,24.00909
1,85.705398
2,10.725875
3,46.847727
4,17.895625


In [4]:
def label_kms(km):
    if 0 <= km <= 25:
        return 4
    elif 25 < km <= 50:
        return 3
    elif 50 < km <= 75:
        return 2
    else :
        return 1

In [5]:
# mise en place des labels 
# 4 -> D / 3 -> C / 2 -> B / 1 -> A
df['label'] = df['kilometres'].apply(label_kms) #la fonction apply prends ce qu'il y a en ammont comme argument de fonction
df.head()

Unnamed: 0,kilometres,label
0,24.00909,4
1,85.705398,1
2,10.725875,4
3,46.847727,3
4,17.895625,4


In [27]:
# Mise en forme sous forme de tableau
# reshape attend en argument (ligne, colonne). Ici le -1 pour reshape signifie que le nb de ligne est calculé automatiquement
entreeCaracteristique = df['kilometres'].values.reshape(-1, 1).astype(np.float32) # feature
# Ici pas besoin de reshape car dans le contexte d'un réseau de neurones PyTorch, la plupart des fonctions de perte 
# et des optimiseurs sont flexibles quant à la forme des étiquettes, et on peut souvent utiliser des étiquettes 
# unidimensionnelles sans problème.
labels = df['label'].values.astype(np.int64)

In [28]:
# Mise en forme sous forme de tenseur
x_entrainement = torch.from_numpy(entreeCaracteristique)
y_entrainement = torch.from_numpy(labels)

# Partie 2 

# Mise en place du réseau de neurones

In [29]:
# DataLoader est une classe de PyTorch qui facilite la gestion des données d'entraînement lors de l'apprentissage d'un modèle
dataset = TensorDataset(x_entrainement, y_entrainement)
dataloader = DataLoader(dataset, batch_size=64) 

In [33]:
# Modèle
class SimpleNN(nn.Module):
    def __init__(self, nb_caracteristique_entree, nb_neurones_couche1, nb_neurones_couche2, nb_neurones_couche3, nbSortiesLabels):
        #super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(nb_caracteristique_entree, nb_neurones_couche1) # couche 1 
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(nb_neurones_couche1, nb_neurones_couche2) # couche 2
        self.sigmoid = nn.Sigmoid()
        self.fc3 = nn.Linear(nb_neurones_couche2, nb_neurones_couche3)
        self.fc3 = nn.ReLU()
        

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu1(x)
        x = self.fc2(x)
        x = self.sigmoid(x)
        x = self.fc3(x)
        x = self.relu2(x)
        return x