# Resnet

ResNet, ou Residual Network, est un modèle de réseau neuronal convolutif profond qui a été introduit par Kaiming He et al. en 2015. Il a été développé pour résoudre le problème de la disparition du gradient, qui est un problème courant lors de l’entraînement de réseaux neuronaux profonds.

L’idée principale derrière ResNet est d’introduire ce qu’on appelle des “connexions résiduelles” ou des “sauts de connexion” pour résoudre le problème de la disparition du gradient lors de l’entraînement de réseaux de neurones profonds



## Caracteristique

- *Connexions résiduelles* : Les connexions résiduelles permettent au signal d’information de contourner une ou plusieurs couches et de se propager directement à des couches ultérieures. Cela est réalisé en ajoutant l’entrée de la couche à sa sortie.


- *Résolution du problème de disparition du gradient* : L’un des principaux avantages des connexions résiduelles est qu’elles aident à résoudre le problème de la disparition du gradient. Lors de la rétropropagation, le gradient peut devenir extrêmement petit, ce qui rend difficile l’apprentissage des poids des couches précédentes. Les connexions résiduelles aident à atténuer ce problème en permettant au gradient de se propager directement à travers les sauts de connexion.


- *Profondeur du réseau* : Les ResNets sont généralement très profonds. Par exemple, ResNet-50, ResNet-101 et ResNet-152 sont des variantes courantes de ResNet, où le nombre indique la profondeur du réseau.


- *Highwaynets et Densenets* : Les modèles qui utilisent une matrice de poids supplémentaire pour apprendre les poids de saut sont appelés “Highwaynets”. Les modèles constitués de plusieurs sauts parallèles sont appelés "Densenets".


- *Simplicité et efficacité* : Les ResNets sont plus simples et plus efficaces que les réseaux neuronaux traditionnels. Ils accélèrent l’apprentissage en minimisant l’effet des gradients qui disparaissent.


### Les connexions residuelles

Les connexions résiduelles permettent de résoudre le probleme de propagation du gradient. Voici comment fonctionne la formule:

$ y = F(x) + x $

ou 
- x: l'entré du bloc
- F(x): la transformation effectué par le bloc
- y: la sortie du bloc 


Cette formule simple permet au gradient de se propager directement à travers les sauts de connexion lors de la rétropropagation, ce qui aide à résoudre le problème de la disparition du gradient.

## Exemples

### Pytorch

In [1]:
import torch
from torchvision import models, transforms
from PIL import Image

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# Charger le modèle pré-entraîné
model = models.resnet50(pretrained=True)

# Mettre le modèle en mode d'évaluation
model.eval()


Downloading: "https://download.pytorch.org/models/resnet50-0676ba61.pth" to /Users/ben/.cache/torch/hub/checkpoints/resnet50-0676ba61.pth
100%|██████████| 97.8M/97.8M [00:12<00:00, 8.24MB/s]


ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): Bottleneck(
      (conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (downsample): Sequential(
        (0): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 

In [4]:
# Charger une image
image = Image.open("../assets/car.jpg")

# Définir les transformations
preprocess = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# Prétraiter l'image
input_tensor = preprocess(image)
input_batch = input_tensor.unsqueeze(0)



In [7]:
# Faire une prédiction
with torch.no_grad():
    output = model(input_batch)

_, predicted_idx = torch.max(output, 1)

with open('../assets/imagenet_classes.txt') as f:
    classes = [line.strip() for line in f.readlines()]

print('Prédiction:', classes[predicted_idx.item()])

Prédiction: sports car


## Tensorflow

In [8]:
import tensorflow as tf
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.resnet50 import preprocess_input, decode_predictions
import numpy as np


In [9]:
# Charger le modèle pré-entraîné
model = ResNet50(weights='imagenet')

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/resnet/resnet50_weights_tf_dim_ordering_tf_kernels.h5
[1m102967424/102967424[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 0us/step


In [10]:
# Charger une image
img_path = '../assets/car.jpg'
img = image.load_img(img_path, target_size=(224, 224))



In [11]:
# Prétraiter l'image
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)



In [14]:
# Faire une prédiction
preds = model.predict(x)

# Décoder les résultats en une liste de tuples (classe, description, probabilité)
print('Predicted:', decode_predictions(preds, top=2)[0])

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 61ms/step
Predicted: [('n03459775', 'grille', 0.5067527), ('n04285008', 'sports_car', 0.1820804)]


Note: La classes choisie en top 1 par le modele préentrainé de tensorflow est erroné. Néanmoins, on retrouve bonne classe en second

## Quand l'utiliser ?

- *Problèmes de classification d’images* : ResNet est très efficace pour la classification d’images, en particulier lorsqu’il y a un grand nombre de classes.


- *Grandes quantités de données d’images* : ResNet est capable de gérer de grandes quantités de données d’images, ce qui le rend utile pour les tâches de vision par ordinateur à grande échelle.


- *Capture de caractéristiques complexes* : Grâce à son architecture profonde et à ses connexions résiduelles, ResNet est capable de capturer des caractéristiques complexes et hiérarchiques dans les données.


- *Problèmes de vision par ordinateur nécessitant une grande précision* : ResNet a été utilisé avec succès dans de nombreux domaines de la vision par ordinateur, notamment la détection d’objets et la segmentation sémantique.
Entraînement de réseaux profonds : ResNet est particulièrement efficace pour l’entraînement de réseaux neuronaux profonds, car il atténue le problème de la disparition du gradient.

Si vous travaillez sur un problème de vision par ordinateur qui nécessite une compréhension profonde et une grande précision, ResNet est un excellent choix. Il est largement utilisé dans la communauté de l’apprentissage en profondeur en raison de sa capacité à former efficacement des réseaux profonds.