<div style="text-align: center;"><h1> üîä Audio MNIST Tutorial - PyTorch üîä </h1></div>

<div style="text-align: center; margin-top: 50px"> <img src="./images/hello-again.gif" width="300"> </div>

        LA SUITE

Maintenant que le traitement des donn√©es a √©t√© effectu√©, nous allons cr√©er, entra√Æner et tester notre futur mod√®le. J'esp√®re que tu as r√©vis√© ton cours sur les CNNs car c'est le m√™me type de mod√®le que nous allons cr√©er.

        LES BIBLIOTH√àQUES

Comme je l'avais pr√©cis√© dans l'intro de la premi√®re partie, nous allons utiliser PyTorch pour cr√©er notre r√©seau de neurones artificiels. De plus, la biblioth√®que va aussi nous permettre de cr√©er la partie convolution de notre r√©seaux.

On va aussi r√©utiliser "matplotlib" en plus de "sklearn" et "intertools" pour tracer et visualiser des donn√©es sous forme de graphiques afin de mieux comprendre comment fonctionne notre mod√®le.

Enfin, on utilise aussi "os" et "numpy" pour charger les donn√©es trait√©es pr√©c√©demment et les utiliser dans le mod√®le.

In [None]:
import torch
from torch import nn
from torch import optim
from torch.utils.data import Dataset

import os
import numpy as np
from numpy import loadtxt

import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix
import itertools

        R√âCUP√âRATION DES DONN√âES
        
Tout d'abord, nous allons charger les donn√©es trait√©es dans des listes afin de pouvoir les utiliser plus tard.

<div style="text-align: center; margin-top: 50px"> <img src="./images/i-have-the-data.gif" width="500"> </div>

In [None]:
parent_dir = './data'

train_dir = parent_dir + '/train'
test_dir = parent_dir + '/test'

list_train_files_names = []
list_test_files_names = []

# R√©cup√©ration des chemins vers tout les fichiers
for i in range(10):
    path = train_dir + '/' + str(i)
    list_train_files_names.append(os.listdir(path))

for i in range(10):
    path = test_dir + '/' + str(i)
    list_test_files_names.append(os.listdir(path))

feature_train = []
label_train = []
feature_test = []
label_test = []

# Chargement des donn√©es dans des tableaux de matrices
for i in range(len(list_train_files_names)):
    for j in range(len(list_train_files_names[i])):
        data = loadtxt(train_dir + '/' + str(i) + '/' + list_train_files_names[i][j], delimiter=',')
        feature_train.append(data)
        label_train.append(i)

for i in range(len(list_test_files_names)):
    for j in range(len(list_test_files_names[i])):
        data = loadtxt(test_dir + '/' + str(i) + '/' + list_test_files_names[i][j], delimiter=',')
        feature_test.append(data)
        label_test.append(i)

        DERNI√àRE MODIFICATION

Comme le titre l'indique, nous n'avons pas totalement fini de modifier les donn√©es avant de les utilis√©es. En effet, il reste trois derniers d√©tails avant que nos donn√©es soit parfaites.

Tout d'abord, il faut normaliser les donn√©es pour ainsi acc√©l√©rer l'entra√Ænement du mod√®le en r√©duisant le d√©calage de covariable interne. Ensuite, nous allons ajouter une dimension aux tenseurs qui va servir d'emplacement pour les futurs "features maps" g√©n√©r√©s par le CNN. Enfin, on modifie le type des donn√©es afin d'√™tre compatible avec celles utilis√©es par PyTorch.

In [None]:
# Normalisation des donn√©es

In [None]:
# Ajout d'une dimension aux tenseurs
feature_train = np.expand_dims(feature_train, 1)
label_train = np.array(label_train)

feature_test = np.expand_dims(feature_test, 1)
label_test = np.array(label_test)

In [None]:
print(len(feature_train))
print(len(feature_test))

print(type(feature_train[0][0][0]))
print(type(label_train[0]))

In [None]:
print(type(feature_train[0][0][0][0]))
print(type(label_train[0]))

In [None]:
# Modification des types de variables utilis√©es
feature_train = np.float32(feature_train)
feature_test = np.float32(feature_test)
label_train = np.int64(label_train)
label_test = np.int64(label_test)

print(type(feature_train[0][0][0][0]))
print(type(label_train[0]))

        CR√âATION DES DATASETS

Le code pour le traitement des √©chantillons de donn√©es peut devenir d√©sordonn√© et difficile √† maintenir. Nous voulons id√©alement que notre code de dataset soit d√©coupl√© de notre code d'entra√Ænement de mod√®le pour une meilleure lisibilit√© et modularit√©. Heuresement, PyTorch fournit deux primitives de donn√©es : "torch.utils.data.DataLoader" et "torch.utils.data.Dataset" qui vous permettent d'utiliser des ensembles de donn√©es pr√©charg√©s ainsi que vos propres donn√©es. Dataset stocke les √©chantillons et leurs √©tiquettes correspondantes, et DataLoader enroule un it√©rable autour du Dataset pour permettre un acc√®s facile aux √©chantillons.

Pour ce tutoriel, nous allons cr√©er des Datasets personnalis√©es. Les classes cr√©√©s doivent h√©riter de la classe Dataset et surcharger 3 fonctions:  __init__, __len__ et __getitem__.

La fonction __init__ est ex√©cut√©e une fois lors de l'instanciation de l'objet Dataset. Souvent, elle permet d'initialis√©e le r√©pertoire contenant les donn√©es, le r√©pertoire des √©tiquettes si l'apprentissage est supervis√©, et des m√©thodes de transformations des donn√©es.

La fonction __len__ renvoie le nombre d'√©chantillons dans notre jeu de donn√©es.

La fonction __getitem__ charge et renvoie un √©chantillon de l'ensemble de donn√©es √† l'indice idx donn√©.

<div style="text-align: center; margin-top: 50px"> <img src="./images/my-data.gif" width="500"> </div>

In [None]:
# Cr√©ation d'une classe AuioMNISTDataset
class AudioMNISTDataset(Dataset):
    
    def __init__(self, features, labels, transform=None, target_transform=None):
        self.features = features
        self.labels = labels
        self.transform = transform
        self.target_transform = target_transform

    def __len__(self):
        return len(self.features)

    def __getitem__(self, idx):
        feature = self.features[idx]
        label = self.labels[idx]
        feature = torch.from_numpy(feature)
        if self.transform:
            feature = self.transform(feature)
        if self.target_transform:
            label = self.target_transform(label)
        return feature, label

In [None]:
# Cr√©ation de deux Datasets : un pour l'entra√Ænement du mod√®le et un pour le test
train_dataset = AudioMNISTDataset(feature_train, label_train, transform=nn.BatchNorm1d(64))
test_dataset = AudioMNISTDataset(feature_test, label_test, transform=nn.BatchNorm1d(64))

print(train_dataset[0])
print(test_dataset[0])

In [None]:
# Cr√©ation des DataLoader qui utilisent les deux Datasets cr√©√©s
# Chaque it√©ration sur les DataLoaders renvoie un lot de train_features et train_labels (contenant respectivement batch_size=64 features et labels).
# Parce que nous avons sp√©cifi√© shuffle=True, les donn√©es sont m√©lang√©es
batch_size = 64;
loaders = {
    'train' : torch.utils.data.DataLoader(train_dataset, 
                                          batch_size=batch_size, 
                                          shuffle=True),
    
    'test'  : torch.utils.data.DataLoader(test_dataset, 
                                          batch_size=batch_size, 
                                          shuffle=True),
}

        CR√âATION DU MOD√àLE

Maintenant que les donn√©es sont pr√™tes √† √™tre utilis√©es, nous allons cr√©er le r√©seau de neurones au c≈ìur de ce tutoriel. Avec PyTorch, les r√©seaux de neurones sont compos√©s de couches/modules qui effectuent des op√©rations sur les donn√©es. L'espace de nom torch.nn fournit tous les √©l√©ments de base dont vous avez besoin pour construire votre propre r√©seau neuronal. Chaque module dans PyTorch sous-classe le module nn.Module. Un r√©seau neuronal est un module en soi qui se compose d'autres modules (couches). Cette structure imbriqu√©e permet de construire et de g√©rer facilement des architectures complexes.

Pour ce tutoriel, nous allons cr√©er un CNN (Convolutional Neural Network) pour tra√Æter nos donn√©es. /* explication de l'utilisation d'un CNN */

<div style="text-align: center; margin-top: 50px"> <img src="./images/confused-travolta.gif" width="500"> </div>

In [None]:
# Cr√©ation de la classe contenant les couches du r√©seau de neurones
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Sequential(         
            nn.Conv2d(
                in_channels=1,              
                out_channels=32,            
                kernel_size=3,              
                stride=1,                   
                padding=1,                  
            ),                              
            nn.ReLU(),                      
            nn.MaxPool2d(kernel_size=2),    
        )
        self.conv2 = nn.Sequential(         
            nn.Conv2d(
                in_channels=32,              
                out_channels=32,            
                kernel_size=3,              
                stride=1,                   
                padding=1,                  
            ),   
            nn.ReLU(),                      
            nn.MaxPool2d(2),                
        )
        # fully connected layer, output 10 classes
        self.out = nn.Linear(32 * 16 * 16, 10)
        
    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)
        # flatten the output of conv2 to (batch_size, 32 * 16 * 16)
        x = x.view(x.size(0), -1)       
        output = self.out(x)
        return output

In [None]:
# Cr√©ation du mod√®le, de la fonction loss et de l'optimizer qui vont √™tre utilis√©s pour entra√Æner le mod√®le
cnn = CNN()
loss_func = nn.CrossEntropyLoss()   
optimizer = optim.Adam(cnn.parameters(), lr = 0.01) 

        L'ENTRAINEMENT DU MOD√àLE

Maintenant que la structure du mod√®le est d√©fini, on va passer √† son entra√Ænement (j'esp√®re que vous avez un GPU sur vous ^^). Pour entra√Æner le r√©seau, nous allons tout simplement cr√©er une fonction train() qui va faire passer un batch du Dataset d'entrainement dans le r√©seau et corriger les param√®tres du mod√®le gr√¢ce √† l'optimizer et la loss d√©finis plut√¥t.

<div style="text-align: center; margin-top: 50px"> <img src="./images/train.gif" width="500"> </div>

In [None]:
# Une √©poque correspond √† un passage complet du Dataset dans le r√©seau.
num_epochs = 3

# Fonction pour entra√Æner le mod√®le
def train(num_epochs, cnn, loaders):
    
    # Indique √† votre mod√®le que vous √™tes en train de le former. Ainsi, les couches comme dropout, batchnorm etc. qui se comportent diff√©remment dans les proc√©dures d'entra√Ænement et de test savent ce qui se passe et peuvent donc se comporter en cons√©quence.
    cnn.train()
    
    total_step = len(loaders['train'])

    for epoch in range(num_epochs):
        for i, (images, labels) in enumerate(loaders['train']):
            
            # R√©cup√©ration de la pr√©diction d'un batch de donn√©e
            output = cnn(images) 
            # Calcul de la fonction co√ªt de la pr√©diction            
            loss = loss_func(output, labels)
            # R√©initialise les gradients 
            optimizer.zero_grad()           
            # Backpropagation et calcul des gradients 
            loss.backward()    
            # Application des gradients pour corriger les param√®tres du mod√®le          
            optimizer.step() 

            if (i+1) % 100 == 0:
                print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch + 1, num_epochs, i + 1, total_step, loss.item()))

        print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch + 1, num_epochs, total_step, total_step, loss.item()))

train(num_epochs, cnn, loaders)

print('Model has been trained {} times with {} datas'.format(num_epochs, len(train_dataset)))

        LE TEST DU MOD√àLE

Et voil√†, nous venons de cr√©er et d'entra√Æner un r√©seau de neurones. Mais maintenant, nous devons tester son efficacit√©. Dans notre cas, le mod√®le r√©soud un probl√®me de classification. Nous pouvons donc simplement calculer le taux de r√©ussite de pr√©diction sur le Dataset de test afin de nous faire une id√©e sur son efficacit√©.

Bien s√ªr, nous pouvons faire d'autres tests afin de v√©rifier d'autres aspects du mod√®le. Par exemple cr√©er une matrice de confusion √† partir des pr√©dictions des donn√©es d'entra√Ænements. Cette matrice peut se r√©v√©ler tr√®s pratique pour conna√Ætre les faiblesses de notre mod√®le, comme la classe que le mod√®le √† le plus de mal √† pr√©dire.

<div style="text-align: center; margin-top: 50px"> <img src="./images/test.gif" width="500"> </div>

In [None]:
# Fonction pour tester le mod√®le
def test():
    all_preds = torch.tensor([])
    all_labels = torch.tensor([])
    cnn.eval()
    accuracy = 0
    with torch.no_grad():
        for images, labels in loaders['test']:
            test_output = cnn(images)
            pred_y = torch.max(test_output, 1)[1].data.squeeze()
            accuracy += (pred_y == labels).sum().item() / float(labels.size(0))

            all_preds = torch.cat((all_preds, pred_y),dim=0)
            all_labels = torch.cat((all_labels, labels),dim=0)

    accuracy /= len(loaders['test'])
    print('Test Accuracy of the model on the {} test : {:.2f}%'.format(len(test_dataset), (accuracy*100)))
    return all_labels, all_preds

all_labels, all_preds = test()

In [None]:
# Fonction pour afficher la matrice de confucion des donn√©es test
def plot_confusion_matrix(cm, classes, normalize=False, title='Confusion matrix', cmap=plt.cm.Blues):
    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
        print("Normalized confusion matrix")
    else:
        print('Confusion matrix, without normalization')

    print(cm)
    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt), horizontalalignment="center", color="white" if cm[i, j] > thresh else "black")

    plt.tight_layout()
    plt.ylabel('True label')
    plt.xlabel('Predicted label')

    
all_labels = all_labels.type(torch.int64)
all_preds = all_preds.type(torch.int64)
confusion_mat = confusion_matrix(all_labels, all_preds)
labels = np.array(['0', '1', '2', '3', '4', '5', '6', '7', '8', '9'])
plt.figure(figsize=(10,10))
plot_confusion_matrix(confusion_mat, labels)

        SAUVEGARDE DU MOD√àLE

Enfin, maintenant que nous avons v√©rifi√© que le mod√®le est tr√®s performant, nous pouvons le sauvegarder afin de l'utiliser plus tard.

<div style="text-align: center; margin-top: 50px"> <img src="./images/victory.gif" width="500"> </div>

In [None]:
# Sauvegarde du mod√®le
torch.save(cnn.state_dict(), "model.pth")
print("Saved PyTorch Model State to model.pth")

In [None]:
# Chargement du mod√®le
saved_cnn = CNN()
saved_cnn.load_state_dict(torch.load("model.pth"))