Cuda_HSP

Implémentation d'un CNN - LeNet-5 sur GPU

LeNet-5

L'objectif à terme de ces 4 séances est d'implémenter l'inférence dun CNN très claissque : LeNet-5. Le travail devra être réalisé en langage C afin de pouvoir utiliser cuda et donc de paralleliser les calculs en travaillant avec le GPU.

Nous avons décider de travailler avec l'IDE VSCode qui nous est tout les deux familière depuis deux ans maintenant.

Partie 1 - Prise en main de Cuda : Multiplication de matrices

Afin de prendre en main toutes les subtilités de CUDA, nous allons commencer par coder quelques opérations simples sur les matrices. Nous avons donc réaliser des additions et des multiplications à la fois en C et en cuda. Ainsi cela nous a permis de voir qu'en parallelisant les opérations on obtenait des temps de calculs plus petits, ce qui est l'effet recherché.

En effet, on constate sur l'image ci-dessus qu'une boucle for n'est pas nécessaire pour parcourir les différents indices de la matrice, c'est en fait chaque cellule du GPU qui va effectuer un seul calcul en même temps que tout les autres cellules, et c'est cela qui rend le calcul plus rapide.

Partie 2 - Premières couches du réseau de neurone LeNet-5 : Convolution 2D et subsampling

Une fois qu'on a pris en main le langage cuda, il fallait s'attaquer aux différentes couches présentes dans le réseau. L'ensemble du travail réalisé dans le langage cuda ce situe dans ce fichier pour la suite des TP.

La difficulté principale pour réaliser les fonctions de convolutions et subsampling était de bien additioner les bons indices entre eux. En effet entre le fait qu'on travaille avec des matrices de matrices et qu'il était plus facile en C de représenter cette matrice de matrice sous la forme d'un unique vecteur, il était très facile d'avoir les mauvais indices.

Ci-dessous vous pouvez voir un exemple de fonction codé en cuda, la concolution2D. On peut notamment observer qu'il y a bien du parallélisme dans les opérations effectués mais qu'une double boucle for est quand même nécessaire pour parcourir l'entiereté des kernels qui eux aussi sont des matrices de matrices.

Enfin il fallait veiller à utiliser les bonnes fonctions d'activation, on peut facilement savoir laquelle il faut utiliser en allant chercher le modèle sur internet.

On a également tester notre travail en permanence pour avoir une idée de ce que le programme faisait. Cela explique la présence de fonction d'initialisations de matrices.

Partie 3 - Un peu de Python

Dans cette partie on passe au langage python afin d'entraîner le modèle est derécupérer les poids associer aux différents kernels. Il est en effet plus aisé de faire cela sur python où des bibliothèques comme tensorflow ou keras nous facilitent grandement le travail.

Une fois le modèle entrainé, nous avons du réordonner les poids (grâce notamment à la fonction reshape), puis nous les avons sauvegarder dans des fichiers .h que nous pourrons facilement récupérer dans notre code cuda plus tard.

Partie 4 - Finalisation du modèle et résultats

Pour finaliser le modèle il manquait deux étapes, créer les dernières couches, ce qui était assez facile vu que ce sont des couches "dense" (c'est à dire tout les neuronnes de sorties sont reliés à tout les neuronnes d'entrées) qui ne nécessitent donc que de simples opérations et multiplications. Et ajouter les bons poids aux kernels initialiser de façon aléatoire jusqu'a maintenant.

Une fois ce travail fait on a pu tester notre modèle, malheureusement celui-ci n'arriver pas à classifier correctement les chiffres présents sur la base de données MNIST. On obtenait des probabilités très proches pour les différents chiffres. On s'est donc interrogé sur d'où pouvait provenir cette erreur et certains points nous paraissent plus probables que d'autres. Tout d'abord la façon dont on a réordonner les poids des kernels pourrait être source de l'erreur et sinon l'erreur proviendrait de nos convolutions où nous pourrions avoir des problèmes d'indice.

Exemple d'erreur de prédiction:

Partie 5 - Utilisation du code

Pour éxécuter le code il suffit de compiler le fichier lenet.cu.

cuda lenet.cu -o lenet && ./lenet

Il est possible de changer d'image de test en modifiant la variable NO_IMG. De plus, le calcul des poids se fait à partir du notebook. Ils sont stockés dans le dossier weights automatiquement.

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.vs		.vs
.vscode		.vscode
lenet_5_model		lenet_5_model
weights		weights
LeNet5.ipynb		LeNet5.ipynb
README.md		README.md
conv		conv
fashionmnist_model.json		fashionmnist_model.json
lenet.cu		lenet.cu
matrix_add.cu		matrix_add.cu
matrix_prod.cu		matrix_prod.cu
train-images.idx3-ubyte		train-images.idx3-ubyte

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cuda_HSP

Implémentation d'un CNN - LeNet-5 sur GPU

LeNet-5

Partie 1 - Prise en main de Cuda : Multiplication de matrices

Partie 2 - Premières couches du réseau de neurone LeNet-5 : Convolution 2D et subsampling

Partie 3 - Un peu de Python

Partie 4 - Finalisation du modèle et résultats

Partie 5 - Utilisation du code

About

Releases

Packages

Contributors 2

Languages

quentinjuarez/cuda_HSP

Folders and files

Latest commit

History

Repository files navigation

Cuda_HSP

Implémentation d'un CNN - LeNet-5 sur GPU

LeNet-5

Partie 1 - Prise en main de Cuda : Multiplication de matrices

Partie 2 - Premières couches du réseau de neurone LeNet-5 : Convolution 2D et subsampling

Partie 3 - Un peu de Python

Partie 4 - Finalisation du modèle et résultats

Partie 5 - Utilisation du code

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages