---
title: "Projet Julia et R-Shiny"
format: pdf
geometry: "left=3cm, right=3cm, top=3cm, bottom=3cm"
---


# Projet Julia et R-Shiny

> **Exploration et Évaluation des Réseaux de Neurones Convolutifs pour la Classification d'Images MNIST**

![Logo Julia](julia-logos.png){fig-align="center" width=80%}

**Réalisé par :**

- **BENCHEIKH El Amira Cerine**
- **BELOUARDA Manal**
- **MEKKAOUI Sara**

**Date :** `r Sys.Date()`

# Table des matières

- [Introduction](#introduction)
- [Le langage Julia](#le-langage-julia)
- [Réseaux de Neurones Convolutifs](#réseaux-de-neurones-convolutifs)

\newpage

# Introduction

## Le langage Julia

Julia est un langage de programmation relativement récent, lancé en 2012. Il a été conçu pour répondre aux besoins de calcul scientifique intensif, combinant la rapidité des langages compilés comme C et Fortran avec la facilité d'utilisation et de prototypage de langages interprétés comme Python. Julia est particulièrement apprécié dans le domaine du calcul numérique, de l'analyse de données et de l'intelligence artificielle. Voici quelques points forts de Julia :

- **Performance :** Julia est un langage compilé avec des performances proches de celles des langages bas-niveau, notamment grâce à son compilateur JIT (Just-In-Time).
- **Syntaxe intuitive :** La syntaxe de Julia est proche de celle de Python, ce qui rend le code plus lisible et accessible.
- **Support des opérations sur matrices et calcul scientifique :** Julia est optimisé pour les calculs sur matrices, les opérations vectorielles et le calcul parallèle, ce qui le rend idéal pour le développement d'algorithmes d'apprentissage automatique et de réseaux de neurones.

Dans ce projet, nous avons utilisé Julia pour la construction d'un modèle de réseau de neurones convolutifs (CNN) avec le package `Flux.jl`, spécialisé dans les applications de machine learning.

## Réseaux de Neurones Convolutifs

Les réseaux de neurones convolutifs, ou CNNs, sont une classe de réseaux de neurones spécialement conçus pour le traitement des données sous forme d'images. Ils sont composés de couches convolutives, qui détectent les caractéristiques des images comme les bords, les textures et les formes, et de couches de pooling qui réduisent la dimensionnalité des données tout en conservant leurs informations essentielles.

---

# Explication des Couches Utilisées dans le Modèle

Voici une brève explication des couches que nous utilisons dans notre modèle :

- **Couches de Convolution :** Ces couches appliquent des filtres sur les images pour détecter des caractéristiques spécifiques (comme des bords ou des textures).
- **Couches de Pooling :** Les couches de pooling réduisent la résolution des images, réduisant ainsi le nombre de paramètres et la complexité computationnelle du modèle.
- **Couches Denses :** Ces couches se trouvent en fin de modèle et permettent de faire une classification en combinant les caractéristiques extraites par les couches précédentes.

L'image ci-dessous montre le fonctionnement de base d'un CNN :

![Schéma d'un réseau de neurones convolutifs](convolutif.png){fig-align="center" width=100%}

Les CNNs sont particulièrement efficaces pour la reconnaissance d'images, car ils apprennent à détecter automatiquement les caractéristiques pertinentes sans nécessiter de prétraitement manuel.

## Contexte et Objectif du Projet

Le projet consiste à utiliser un modèle de réseau de neurones convolutifs pour classifier des images du dataset MNIST, qui est un ensemble d'images de chiffres manuscrits. Le but est de construire et d'entraîner un modèle capable de reconnaître chaque chiffre avec une haute précision.

Dans ce projet, nous avons divisé le code en plusieurs parties :

- **Préparation des données :** Nous avons chargé et pré-traité les données pour qu'elles soient prêtes pour l'apprentissage. Cela inclut la normalisation et le redimensionnement des images ainsi que l'encodage des labels en one-hot.
- **Construction du modèle CNN :** Le modèle utilise des couches convolutives et des couches de pooling pour extraire les caractéristiques des images, suivies de couches denses pour la classification finale.
- **Entraînement et Évaluation :** Nous avons configuré une fonction d'entraînement qui utilise un optimiseur `Adam` pour ajuster les poids du modèle en minimisant la fonction de perte de cross-entropie. Nous avons également calculé des métriques de précision, de rappel et de F1-score pour évaluer les performances du modèle.

Ce projet illustre comment les réseaux de neurones convolutifs peuvent être appliqués pour résoudre des problèmes de classification d'images et comment Julia et `Flux.jl` facilitent leur implémentation.

## Les Bénéfices de Julia dans le Machine Learning

Julia présente plusieurs avantages par rapport à d'autres langages comme Python dans le contexte du Machine Learning :

- **Performance :** Julia est extrêmement rapide, proche du langage C, ce qui permet une exécution plus rapide lors de l'entraînement des modèles de Machine Learning.
- **Facilité d'utilisation :** Julia combine la simplicité de Python avec la performance des langages compilés.
- **Interopérabilité :** Julia peut facilement interagir avec d'autres langages comme Python, ce qui permet de profiter des bibliothèques existantes tout en tirant parti de la rapidité de Julia.

![Graphique comparatif des performances](1_WEijeS2RWVLIGbfYQOlrzw.png){fig-align="center" width=70%}


# Comparaison entre Julia et Python

Bien que Python soit largement utilisé dans le Machine Learning, Julia offre des avantages significatifs :

- **Python** dispose d'un écosystème riche, avec des bibliothèques comme TensorFlow et PyTorch.
- **Julia**, bien qu'ayant un écosystème plus petit, est beaucoup plus rapide, surtout pour les calculs numériques lourds.

![Comparaison des temps d'exécution entre Julia et Python](ok.png)

# Inconvénients de Julia

Bien que Julia offre de nombreux avantages, il existe quelques inconvénients :

- L'écosystème est encore en développement et ne rivalise pas encore avec Python en termes de nombre de bibliothèques disponibles.
- La communauté est plus petite, ce qui signifie moins de ressources et d'exemples disponibles.

# Préparation des Données

## Décortiquer les Données

Avant de pouvoir entraîner notre modèle, nous devons charger et examiner les données pour comprendre leur structure, comme indiqué ci-dessous :

```julia
X_train, y_train = load_data("train_data.csv")
X_test, y_test = load_data("test_data.csv")

## Normalisation des Données

La normalisation consiste à ajuster les valeurs des pixels (qui sont souvent entre 0 et 255 dans le cas des images) pour qu'elles soient dans une gamme plus petite, typiquement entre 0 et 1. Cela permet de stabiliser l'entraînement en réduisant les fluctuations importantes des gradients.

La normalisation doit être effectuée avant de passer les données dans le réseau de neurones, car les modèles de Machine Learning, et en particulier les réseaux de neurones, fonctionnent mieux lorsque les données sont sur une échelle comparable. Typiquement, cela se fait juste après le chargement des données et avant la phase d'entraînement.

## Pourquoi la normalisation est importante ?

- **Stabilité du Gradient** : Lors de l'entraînement du réseau de neurones, des valeurs de pixels très élevées (comme 255 pour les images) peuvent entraîner une explosion des gradients pendant la rétropropagation. Normaliser ces valeurs à une échelle plus petite comme [0, 1] permet de maintenir les gradients plus stables et favorise une convergence plus rapide.
- **Performance de l'Optimiseur** : Les optimiseurs comme Adam dans notre cas fonctionnent mieux lorsque les entrées sont sur des échelles similaires, ce qui accélère l'entraînement et peut conduire à de meilleures performances.

## Canaux des Données

Dans le contexte des réseaux de neurones pour la reconnaissance d'images, les canaux (ou channels) font référence aux différentes couches de couleurs d'une image. Prenons l'exemple des images RGB (Rouge, Vert, Bleu), qui sont les plus courantes pour les images colorées.

## Qu'est-ce que les canaux d'une image ?

- **Image en niveaux de gris** : Une image en noir et blanc a un seul canal, car chaque pixel est décrit par une seule valeur représentant l'intensité lumineuse (de noir à blanc).
- **Image RGB** : Une image en couleur est souvent composée de trois canaux : Rouge (R), Vert (G) et Bleu (B). Chaque pixel dans une image RGB a donc trois valeurs, une pour chaque couleur. Chaque couleur est représentée par une intensité (souvent entre 0 et 255, où 0 est l'absence de couleur et 255 est la couleur maximale).

![Comprendre le réseau CNN](1_UN1oMSV2qWdDzjoZILKCRg.png){fig-align="center" width=40%}

Dans notre projet, notre modèle de réseau de neurones convolutifs (CNN) travaille avec des images en RGB. Chaque couche de convolution traitera les trois canaux de l'image. Lorsqu'on passe les images dans le modèle, il est crucial que les dimensions des données (en particulier le nombre de canaux) soient correctement prises en compte, car chaque couche de convolution appliquera des filtres à chacun des canaux (R, G, B) pour extraire des caractéristiques.

```{figure}
  ![How channels (RGB) effect convolutional neural network](CNN_Fundamentals.png)
  :width: 60%
  :caption: "How channels (RGB) effect convolutional neural network"

\newpage

## Encodage des Labels
Le terme "labels" fait référence aux étiquettes de classe pour chaque image dans les ensembles de données d'entraînement et de test. Ces étiquettes sont essentielles pour la classification d'images, car elles représentent la classe correcte à laquelle une image appartient. Par exemple, dans le cas du dataset MNIST, chaque image représente un chiffre (0 à 9), et l'étiquette correspond à ce chiffre.

## Chargement des labels :
Lorsque vous chargez les données MNIST avec la fonction MNIST.traindata() et MNIST.testdata(), vous obtenez à la fois les images (train_X et test_X) et leurs labels correspondants (train_y et test_y). Ces labels indiquent quel chiffre est représenté sur chaque image. \ Par exemple, si une image correspond au chiffre "3", alors l'étiquette pour cette image sera "3".

  ![Labels des images](0_9jCey4wywZ4Os7hF.png)
  :width: 90%
  :caption: "Labels des images"