In [1]:
import torch
from torchvision import datasets, transforms
from torchvision.models import resnet50, ResNet50_Weights
from torch.utils.data import DataLoader
from tqdm import tqdm

In [2]:
# Set device
DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [3]:
root = '..\data\ImageNet_2012'
split = 'val'
transform = transforms.Compose([
    transforms.Resize(256), # met la taille du plus petit côté de l'image à 256 (l'autre reste proportionnel par rapport au rapport initial)
    transforms.CenterCrop(224), # sélectionne le carré de côté 224 à partir du centre de l'image
    transforms.ToTensor(), # convertir image PIL en tenseur avec des valeurs comprises dans [0,1]
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]), # normalise les valeurs du tenseur
])

In [4]:
# Instanciation de la classe imagenet avec une transformation spécifique
dataset = datasets.ImageNet(root, split=split, transform=transform)

In [5]:
# Instanciation du modèle
model = resnet50(weights=ResNet50_Weights.DEFAULT)
model = model.to(DEVICE)

In [6]:
model.eval()
dataloader = DataLoader(dataset, batch_size=256, num_workers=4, pin_memory=True) # dépend des specs de la machine
correct_predictions = 0
with torch.no_grad():
    for images, labels in tqdm(dataloader, desc="Evaluation"):
        # Copie des images/labels sur le GPU
        images = images.to(DEVICE)
        labels = labels.to(DEVICE)

        # On récupère les préictions du programme
        outputs = model(images)

        # Obtention des classes prédites (pour chaque prédiction)
        _, predicted = torch.max(outputs, 1)

        # Ajout des prédictions correctes au total
        correct_predictions += (predicted == labels).sum().item()


Evaluation: 100%|████████████████████████████████████████████████████████████████████| 196/196 [01:59<00:00,  1.64it/s]


In [7]:
# Calcul du pourcentage de bonnes classifications
accuracy = 100 * correct_predictions / len(dataset)

print(f'Accuracy: {accuracy}%')

Accuracy: 80.342%


In [4]:
torch.tensor([[1, 2, 3], [4, 15, 6], [7, 8, 9]]).argmax(dim=0)

tensor([2, 1, 2])

In [6]:
torch.tensor([2,4,2])/torch.tensor([2,2,2])

tensor([1., 2., 1.])