In [None]:
# Classification d'images avec CNN

In [None]:
# Les CNN sont globalement de meilleurs réseaux pour les
# traitements nécessitant beaucoup de paramètres (surtout
# pour les images) car ils apprennent les motifs.

In [None]:
# Noyaux

In [None]:
# Les noyaux de convolution, sont de petites matrices de poids
# apprenables servant à détecter les motifs dans l'image.
# Ils permettent de détecter :
# - Contours
# - Textures
# - Formes
# - Caractéristiques complexes

# Ils s'organisent de manière hiérarchique :
# - Premières couches : détection de caractéristiques simples 
# - Couches intermédiaires : combinent les caractéristiques pour
# détecter les formes
# - Couches profondes : détectent les objets complexes (comme :
# visages, voitures, animaux...)

# L'entraînement détermine la spécialisation du noyau :
# Initialisation aléatoire : noyaux avec valeurs proches de 0
# Apprentissage automatique : descente de gradient ajuste les poids
# Spécialisation émergente : apprend à détecter les motifs les plus
# utiles pour la tâche.
# Pas de programmation manuelle : le réseau découvre lui-même quels
# motifs sont importants.

# Les convolutions ont plusieurs avantages :
# - Partage de poids : Le même filtre est appliqué sur l'image, 
# permettant de réduire le # de paramètres
# - Invariance par translation : un motif appris peut être repéré
# partout sur l'image.
# - Préservation de la structure spatiale : les convolutions
# traitent des régions locales, préservant les relations entre
# pixels voisins.

# Avec PyTorch :
# Voir chapitre 4, exercice 4

# Calcul de la taille de sortie
# H_out = ⌊ (H_in + 2 × padding - kernel_size) ÷ stride ⌋ + 1
# Si en entrée j'ai une image de 224 × 224, il faut que (par exemple):
# padding = 1, kernel_size = 3, stride = 1.
# Il faut que la taille de l'image en sortie soit la même que la taille
# de l'image en entrée.

In [None]:
# Pooling

In [None]:
# Les couches de pooling permettent de réduire progressivement la 
# taille spaciale des représentations :
# Permet de diminuer le nombre de paramètres et le temps de calcul
# Apporte une invariance aux petites translations
# Augmente le champ réceptif.

# Le max pooling garde la valeur max d'une région d'une image (la 
# région étant de dimensions hauteur_image / 2 par largeur_image / 2)

# L'average pooling calcule la moyenne de chaque région

In [None]:
# Mini-batchs

In [None]:
# L'entraînement par mini-batchs est fondamental en DL, combinant
# les avantages de deux techniques extrêmes.

# Trois approches :
# Batch Gradient Descent, calcule le gradient sur toutes les données
# mise à jour lente et nécessitant beaucoup de mémoire.
# Stochastic Gradient Descent (SGD), calcule le gradient d'un seul
# exemple, donc gradient bruité et converge erratiquement.
# Mini-Batch Gradient Descent, calcule le gradient pour un petit
# groupe de d'exemples, rapide et plutôt stable, exploite le GPU.

# Choix de la taille :
# Petits batchs (16-32), + de bruit, convergence plus exploratrice.
# Grands batchs (128-256), + stables, convergence plus directe.
# Compromis courants : 32 ou 64

# Avec PyTorch :
# Voir chapitres 3 & 4, exercices 1 & 2 et exercice 4 respectivement

In [None]:
# Sauvegarder les poids d'un modèle

In [None]:
# Après avoir entraîné son modèle (ce qui peut prendre des heures),
# il est important de le sauvegarder pour pouvoir le réutiliser sans
# avoir à r'entraîner.

# Avec PyTorch :
from torch import save, load

# Remplacer model par son modèle à enregistrer
save(model, 'model_complet.pth')

# Charger le modèle
model = load('model_complet.pth')
model.eval()

# Cette méthode de sauvegarde peut poser problème si vous changez la 
# définition de la classe après l'avoir sauvegardé.

# Sauvegarder uniquement les poids :
save(model.state_dict(), 'model_poids.pth')

# Avantages : on peut modifier légèrement le modèle après l'avoir 
# enregistré.
state_dict = load('model_poids.pth')
del state_dict['fc2.weight'], state_dict['fc2.bias'] # Suppression des
# poids incompatibles.
model.state_dict(state_dict, strict=False) # strict=False permet
# d'ignorer les couches manquantes.

In [None]:
# Exercice 1