# AlexNet


AlexNet est un modèle de réseau neuronal convolutionnel classique, qui c'est illustré en 2012 lors du concours ImageNet de reconnaissance d'images

AlexNet a remporté le défi de reconnaissance visuelle à grande échelle ImageNet (ILSVRC) en 2012 avec un taux d’erreur top-5 de 15,3%


AlexNet est généralement utilisé pour la classification d’images. Le réseau pré-entraîné peut classer les images en 1000 catégories d’objets. Il a été formé sur plus d’un million d’images de la base de données ImageNet.


## Caractéristique

- *Architecture* : AlexNet est composé de 8 couches avec des paramètres apprenables1. Il comprend 5 couches de convolution, chacune suivie d’une couche de max pooling, puis 3 couches entièrement connectées.


- *Fonction d’activation* : AlexNet utilise la fonction d’activation ReLU au lieu de tanh ou sigmoid, ce qui a permis d’accélérer le temps d’entraînement jusqu’à 6 fois tout en conservant la même précision.


- *Prévention du surajustement* : Comme le modèle devait être formé sur 60 millions de paramètres, il était sujet au surajustement. L’utilisation de Dropout et de l’augmentation des données a considérablement aidé à réduire le surajustement.


- *Convolution groupée* : Les convolutions groupées sont utilisées pour adapter le modèle sur deux GPU4.


- *Normalisation de la réponse locale* : AlexNet utilise la normalisation de la réponse locale, qui est une technique de normalisation appliquée après la fonction d’activation2.




## Exemple

Seul un exemple avec pytorch sera présenté ici. Tensorflow n'a pas de modele préentrainé pour AlexNet, parce que l'architecture est trés similaire a celle de VGGNet (que vous pouvez retrouver [**ici**](./vggnet.ipynb)

In [1]:
import torch
from torchvision import models, transforms
from PIL import Image

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
model = models.alexnet(pretrained=True)
model.eval()

Downloading: "https://download.pytorch.org/models/alexnet-owt-7be5be79.pth" to /Users/ben/.cache/torch/hub/checkpoints/alexnet-owt-7be5be79.pth
100%|██████████| 233M/233M [00:30<00:00, 8.15MB/s] 


AlexNet(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(11, 11), stride=(4, 4), padding=(2, 2))
    (1): ReLU(inplace=True)
    (2): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
    (3): Conv2d(64, 192, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (4): ReLU(inplace=True)
    (5): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
    (6): Conv2d(192, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (7): ReLU(inplace=True)
    (8): Conv2d(384, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (9): ReLU(inplace=True)
    (10): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): MaxPool2d(kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (avgpool): AdaptiveAvgPool2d(output_size=(6, 6))
  (classifier): Sequential(
    (0): Dropout(p=0.5, inplace=False)
    (1): Linear(in_features=9216, out_features=4096, bias=True)
 

In [3]:
img_path = '../assets/car.jpg'
img = Image.open(img_path)

preprocess = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

input_tensor = preprocess(img)
input_batch = input_tensor.unsqueeze(0)

In [4]:
if torch.cuda.is_available():
    input_batch = input_batch.to('cuda')
    model.to('cuda')

with torch.no_grad():
    output = model(input_batch)

_, predicted_idx = torch.max(output, 1)

with open('../assets/imagenet_classes.txt') as f:
    classes = [line.strip() for line in f.readlines()]

print('Prédiction:', classes[predicted_idx.item()])

Prédiction: sports car


## Quand utiliser AlexNet

AlexNet est particulièrement utile lorsque vous devez former un modèle sur un grand nombre de paramètres. Par exemple, le modèle AlexNet a dû être formé sur 60 millions de paramètres. Cependant, il était sujet au surajustement. Selon son article de recherche, l’utilisation de Dropout et de l’augmentation des données a considérablement aidé à réduire le surajustement.

Il est utilisé pour:

- Vous travaillez sur un problème de classification d’images.
- Vous avez une grande quantité de données et de nombreux paramètres à entraîner.
- Vous pouvez gérer le risque de surajustement avec des techniques comme le dropout et l’augmentation des données.


Il est important de noter que bien qu’AlexNet ait été une avancée significative dans le domaine de l’apprentissage profond, de nombreux modèles plus récents et plus performants ont été développés depuis. Par conséquent, bien qu’AlexNet puisse toujours être utilisé pour certaines tâches, il existe souvent de meilleures options disponibles pour la plupart des applications modernes de vision par ordinateur.