In [4]:
import torch
from torchvision import datasets, transforms
from torchvision.models import resnet50, ResNet50_Weights
from torch.utils.data import DataLoader
from tqdm import tqdm
import json

In [5]:
# Set device
DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [6]:
# root = '..\data\ImageNet_2012'
root = "../../../../../../Documents/ImageNet_2012"

split = 'train'
transform = transforms.Compose([
    transforms.Resize(256), # Met la taille du plus petit côté de l'image à 256 (l'autre reste proportionnel par rapport au rapport initial).
    transforms.CenterCrop(224), # Sélectionne le carré de côté 224 à partir du centre de l'image
    transforms.ToTensor(), # Convertir image PIL en tenseur avec des valeurs comprises dans [0,1]
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]), # normalise les valeurs du tenseur
])

In [7]:
# Instanciation de la classe imagenet avec une transformation spécifique
dataset = datasets.ImageNet(root, split=split, transform=transform)
avgpool_list = torch.tensor([]).to(DEVICE)
# on enregistre les labels 
labels_list = torch.tensor(dataset.targets)
torch.save(labels_list, '../data/saved_outputs/penultimate_layer_labels.pt')

In [8]:
model = resnet50(weights=ResNet50_Weights.DEFAULT)
model = model.to(DEVICE)

In [9]:
activation = {}
# Fonction pour obtenir les sorties d'une couche spécifique
def getActivation(name):
  # the hook signature
  def hook(model, input, output):
    activation[name] = output.detach()
  return hook


In [10]:
batch_size = 256
num_workers = 4
pin_memory = True
number_batch_size_segmentation = 200
segmentation_index = 0
min_size_segmentation = number_batch_size_segmentation*batch_size

In [11]:
h = model.avgpool.register_forward_hook(getActivation('avgpool'))
dataloader = DataLoader(dataset, batch_size=batch_size, num_workers=num_workers, pin_memory=pin_memory) # dépend des specs de la machine

In [None]:
model.eval()
correct_predictions=0
with torch.no_grad():
    for images, labels in tqdm(dataloader, desc="Evaluation"):

        if avgpool_list.shape[0] >= min_size_segmentation:
            # on sauvegarde le tenseur dans un format optimisé pytorch
            torch.save(avgpool_list, f'../data/saved_outputs/penultimate_layer_outputs/penultimate_layer_outputs_{segmentation_index}.pt')
            avgpool_list = torch.tensor([]).to(DEVICE)
            segmentation_index+=1
            
        # Copie des images/labels sur le GPU
        images = images.to(DEVICE)
        labels = labels.to(DEVICE)
        
        # On récupère les prédictions du programme et on diminue la précision
        outputs = model(images)
        
        # on enlève les dimensions de taille 1, on concatène le résultat dans avgpool_list 
        avgpool_list = torch.cat([avgpool_list, activation['avgpool'].squeeze()],dim=0) 

        _, predicted = torch.max(outputs, 1)

        # Ajout des prédictions correctes au total
        correct_predictions += (predicted == labels).sum().item()
         
torch.save(avgpool_list, f'../data/saved_outputs/penultimate_layer_outputs/penultimate_layer_outputs_{segmentation_index}.pt')
del avgpool_list, outputs, images, labels

Evaluation:   0%|                                                                             | 0/5005 [00:00<?, ?it/s]

In [12]:
accuracy = 100 * correct_predictions / len(dataset)
print(f'Accuracy: {accuracy}%')

Accuracy: 91.30519284371202%


In [13]:
# Enregistrer les données sous forme de JSON pour mieux traiter les fichiers quels que soient les paramètres donnés.
# Création du dictionnaire
data = {
    "last_file_indice" : segmentation_index,
    "min_size_segmentation" : min_size_segmentation
}
# Écriture dans un fichier JSON
with open('../data/saved_outputs/penultimate_layer_outputs/data.json', 'w') as js:
    json.dump(data, js)
