In [None]:
########CELLA 1###############
from google.colab import drive
import zipfile
import os

# 1. Monta Google Drive
drive.mount('/content/drive')

# 2. Configurazione Percorsi
# Assumiamo che il file sia nella root del tuo Drive.
# Se √® in una sottocartella, modifica in: '/content/drive/MyDrive/NOME_CARTELLA/dataset.zip'
zip_path = '/content/drive/MyDrive/dataset.zip'
extract_to = '/content/dataset_unzipped'

# 3. Estrazione
if os.path.exists(zip_path):
    print(f"Trovato {zip_path}. Inizio estrazione...")
    with zipfile.ZipFile(zip_path, 'r') as zip_ref:
        zip_ref.extractall(extract_to)
    print("‚úÖ Estrazione completata!")
else:
    print(f"‚ùå ERRORE: Non trovo il file '{zip_path}'.")
    print("Controlla di averlo caricato su Drive e che il nome sia esattamente 'dataset.zip' (tutto minuscolo).")

Mounted at /content/drive
Trovato /content/drive/MyDrive/dataset.zip. Inizio estrazione...
‚úÖ Estrazione completata!


In [None]:
############CELLA 2#################
import os
import pandas as pd
import torch
from torch.utils.data import Dataset
from PIL import Image
from torchvision import transforms

class BookCoverDataset(Dataset):
    def __init__(self, csv_file, root_dir, transform=None, class_to_idx=None):
        """
        Args:
            csv_file (string): Percorso al file CSV.
            root_dir (string): Directory che contiene le immagini (224x224).
            transform (callable, optional): Trasformazioni (Tensor, Normalize).
        """
        # Lettura CSV con i parametri corretti scoperti prima (sep=; encoding=ISO...)
        self.df = pd.read_csv(csv_file, sep=';', encoding='ISO-8859-1', header=0, on_bad_lines='warn')

        self.root_dir = root_dir
        self.transform = transform

        # Ordina le classi per garantire coerenza
        self.classes = sorted(self.df['Category'].unique())

        # Mappa Stringa -> Intero
        if class_to_idx is None:
            self.class_to_idx = {cls_name: i for i, cls_name in enumerate(self.classes)}
        else:
            self.class_to_idx = class_to_idx

    def __len__(self):
        return len(self.df)

    def __getitem__(self, idx):
        if torch.is_tensor(idx):
            idx = idx.tolist()

        # Recupera nome file e costruisce percorso
        img_name = str(self.df.iloc[idx]['Filename'])
        img_path = os.path.join(self.root_dir, img_name)

        # Caricamento Immagine
        try:
            image = Image.open(img_path).convert('RGB')
        except (OSError, FileNotFoundError):
            # Gestione immagine mancante (crea immagine nera)
            image = Image.new('RGB', (224, 224), (0, 0, 0))

        # Label
        label_str = self.df.iloc[idx]['Category']
        label = self.class_to_idx[label_str]

        # Trasformazioni
        if self.transform:
            image = self.transform(image)

        return image, label

# --- CONFIGURAZIONE TRASFORMAZIONI ---
mean = [0.485, 0.456, 0.406]
std = [0.229, 0.224, 0.225]

data_transforms = {
    'train': transforms.Compose([

        transforms.RandomResizedCrop(224, scale=(0.8, 1.0)),
        transforms.RandomHorizontalFlip(),
        transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2),
        transforms.RandomRotation(15),
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ]),
    'val': transforms.Compose([
        transforms.Resize((224, 224)), # Nel validation NON facciamo augmentation
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ]),
}

In [None]:
#################CELLA 3####################
# Cerchiamo i percorsi corretti navigando tra le cartelle estratte
base_search_path = '/content/dataset_unzipped'
csv_path = None
img_dir = None

print("üîç Scansione cartelle in corso...")

for root, dirs, files in os.walk(base_search_path):
    # Cerchiamo il CSV di training
    if "book30-listing-train.csv" in files:
        csv_path = os.path.join(root, "book30-listing-train.csv")
        print(f"   -> CSV Trovato: {csv_path}")

    # Cerchiamo la cartella specifica delle immagini
    if "224x224" in dirs:
        img_dir = os.path.join(root, "224x224")
        print(f"   -> Cartella Immagini Trovata: {img_dir}")

# --- VERIFICA E CREAZIONE DATASET ---
if csv_path and img_dir:
    print("\n‚úÖ File trovati! Creazione Dataset in corso...")

    # Creiamo il dataset
    train_dataset = BookCoverDataset(
        csv_file=csv_path,
        root_dir=img_dir,
        transform=data_transforms['train']
    )

    # TEST RAPIDO
    print(f"Dataset caricato correttamente con {len(train_dataset)} libri.")
    print(f"Numero di classi (Generi): {len(train_dataset.classes)}")

    # Verifica GPU
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    print(f"\nüñ•Ô∏è Device attivo: {device}")
    if device.type == 'cuda':
        print("üöÄ Perfetto! La GPU NVIDIA T4 √® pronta a spingere.")
    else:
        print("‚ö†Ô∏è ATTENZIONE: Stai usando la CPU. Vai su Modifica -> Impostazioni Notebook -> Hardware Accelerator -> T4 GPU")

    # Test estrazione di un elemento
    img, label = train_dataset[0]
    print(f"\nTest Shape Tensore: {img.shape} (Deve essere 3, 224, 224)")

else:
    print("\n‚ùå ERRORE CRITICO: Non ho trovato i file necessari.")
    print("Controlla il contenuto dello zip. Cerco 'book30-listing-train.csv' e una cartella '224x224'.")

üîç Scansione cartelle in corso...
   -> CSV Trovato: /content/dataset_unzipped/dataset/book30-listing-train.csv
   -> Cartella Immagini Trovata: /content/dataset_unzipped/dataset/title30cat/224x224

‚úÖ File trovati! Creazione Dataset in corso...
Dataset caricato correttamente con 51300 libri.
Numero di classi (Generi): 30

üñ•Ô∏è Device attivo: cuda
üöÄ Perfetto! La GPU NVIDIA T4 √® pronta a spingere.

Test Shape Tensore: torch.Size([3, 224, 224]) (Deve essere 3, 224, 224)


In [None]:
###############CELLA 4##############
from torch.utils.data import DataLoader, random_split

# 1. Divisione Train / Validation (80% / 20%)
total_size = len(train_dataset)
train_len = int(0.8 * total_size)
val_len = total_size - train_len

# random_split mischia gli indici e crea due sotto-dataset
train_subset, val_subset = random_split(train_dataset, [train_len, val_len])

print(f"üìä Split completato:")
print(f"   -> Training Set: {len(train_subset)} immagini")
print(f"   -> Validation Set: {len(val_subset)} immagini")

# 2. Creazione dei DataLoader (I 'nastri trasportatori' per la GPU)
# Batch Size 64 √® ottimale per la GPU T4 di Colab (usa bene la memoria senza esaurirla)
BATCH_SIZE = 64

train_loader = DataLoader(train_subset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2)
val_loader = DataLoader(val_subset, batch_size=BATCH_SIZE, shuffle=False, num_workers=2)

print(f"‚úÖ Dataloaders pronti (Batch size: {BATCH_SIZE})")

üìä Split completato:
   -> Training Set: 41040 immagini
   -> Validation Set: 10260 immagini
‚úÖ Dataloaders pronti (Batch size: 64)


In [None]:
###############CELLA 5###################
from torchvision import models
import torch.nn as nn

def get_model(num_classes=30):
    print("Scaricamento pesi ResNet50 (ImageNet)...")
    # Scarichiamo la versione pi√π aggiornata dei pesi
    model = models.resnet50(weights=models.ResNet50_Weights.DEFAULT)

    # 1. FREEZING: Congeliamo tutti i parametri
    # Questo impedisce che durante il training modifichiamo i filtri che sanno gi√† "vedere"
    for param in model.parameters():
        param.requires_grad = False

    # 2. Sostituzione dell'ultimo layer (Fully Connected)
    # ResNet50 ha 2048 feature in ingresso all'ultimo layer
    num_ftrs = model.fc.in_features

    # Creiamo il nuovo layer classificatore.
    # Nota: Di default, i nuovi layer hanno requires_grad=True, quindi QUESTI verranno addestrati.
    model.fc = nn.Sequential(
        nn.Linear(num_ftrs, 512), # Strato intermedio per imparare combinazioni complesse
        nn.ReLU(),
        nn.Dropout(0.5),          # Dropout per evitare overfitting (tecnica standard)
        nn.Linear(512, num_classes) # Output finale: 30 probabilit√†
    )

    return model

# Istanziamo il modello e lo spostiamo sulla GPU
model = get_model(num_classes=len(train_dataset.classes))
model = model.to(device) # Sposta tutto sulla GPU T4

print("\nü§ñ Modello ResNet50 caricato e modificato per 30 classi.")
print("   -> Backbone (corpo): Congelato ‚ùÑÔ∏è")
print("   -> Head (testa): Pronta per l'addestramento üî•")

Scaricamento pesi ResNet50 (ImageNet)...
Downloading: "https://download.pytorch.org/models/resnet50-11ad3fa6.pth" to /root/.cache/torch/hub/checkpoints/resnet50-11ad3fa6.pth


100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 97.8M/97.8M [00:00<00:00, 229MB/s]



ü§ñ Modello ResNet50 caricato e modificato per 30 classi.
   -> Backbone (corpo): Congelato ‚ùÑÔ∏è
   -> Head (testa): Pronta per l'addestramento üî•


In [None]:
################## CELLA 6 (TRAINING + SALVATAGGIO SU DRIVE) #################
import torch.optim as optim
import time
import torch.nn as nn
import copy
from torchvision import models
import os

# --- 0. CONFIGURAZIONE SALVATAGGIO ---
# Definiamo dove salvare il modello su Google Drive
# Assicurati che questa cartella esista o il codice la creer√†
SAVE_PATH = '/content/drive/MyDrive/Modelli_BookCover'
os.makedirs(SAVE_PATH, exist_ok=True)
MODEL_NAME = 'best_resnet50_finetuned.pth'
FULL_MODEL_PATH = os.path.join(SAVE_PATH, MODEL_NAME)

print(f"üíæ Il modello migliore verr√† salvato in: {FULL_MODEL_PATH}")

# Scongelamento Selettivo
print("\nüîí Congelamento preventivo di tutta la rete...")
for param in model.parameters():
    param.requires_grad = False

print("üîì Scongelamento della Testa (FC) e dell'Ultimo Blocco (Layer4)...")
for param in model.fc.parameters():
    param.requires_grad = True
for param in model.layer4.parameters():
    param.requires_grad = True

# Parametri da aggiornare
params_to_update = [p for p in model.parameters() if p.requires_grad]
print(f"üî• Parametri pronti per l'addestramento: {sum(p.numel() for p in params_to_update):,}")

# Loss e Optimizer
criterion = nn.CrossEntropyLoss()

# Optimizer con LR differenziato
optimizer = optim.Adam([
    {'params': model.layer4.parameters(), 'lr': 1e-5},
    {'params': model.fc.parameters(), 'lr': 1e-4}
], weight_decay=1e-4)

# Scheduler
scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.1, patience=3)

# Parametri Epoche
NUM_EPOCHS = 30
ES_PATIENCE = 6

# --- 3. FUNZIONE DI TRAINING CON SALVATAGGIO ---
def train_model(model, train_loader, val_loader, criterion, optimizer, scheduler, num_epochs=20, es_patience=6):
    start_time = time.time()

    # Inizializziamo con i pesi attuali
    best_model_wts = copy.deepcopy(model.state_dict())
    best_val_loss = float('inf')
    patience_counter = 0

    history = {'train_loss': [], 'val_loss': [], 'train_acc': [], 'val_acc': []}

    for epoch in range(num_epochs):
        print(f'\nEpoch {epoch+1}/{num_epochs}')
        print('-' * 10)

        lr_backbone = optimizer.param_groups[0]['lr']
        lr_head = optimizer.param_groups[1]['lr']
        print(f"üìâ LR attuale -> Backbone: {lr_backbone:.1e} | Head: {lr_head:.1e}")

        for phase in ['train', 'val']:
            if phase == 'train':
                model.train()
                dataloader = train_loader
            else:
                model.eval()
                dataloader = val_loader

            running_loss = 0.0
            running_corrects = 0
            total_samples = 0

            for inputs, labels in dataloader:
                inputs = inputs.to(device)
                labels = labels.to(device)

                optimizer.zero_grad()

                with torch.set_grad_enabled(phase == 'train'):
                    outputs = model(inputs)
                    _, preds = torch.max(outputs, 1)
                    loss = criterion(outputs, labels)

                    if phase == 'train':
                        loss.backward()
                        optimizer.step()

                running_loss += loss.item() * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)
                total_samples += inputs.size(0)

            epoch_loss = running_loss / total_samples
            epoch_acc = running_corrects.double() / total_samples

            if phase == 'train':
                history['train_loss'].append(epoch_loss)
                history['train_acc'].append(epoch_acc.item())
            else:
                history['val_loss'].append(epoch_loss)
                history['val_acc'].append(epoch_acc.item())
                scheduler.step(epoch_loss)

            print(f'{phase} Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f}')

            # --- LOGICA SALVATAGGIO MIGLIOR MODELLO ---
            if phase == 'val':
                if epoch_loss < best_val_loss:
                    best_val_loss = epoch_loss
                    best_model_wts = copy.deepcopy(model.state_dict())
                    patience_counter = 0

                    # SALVATAGGIO SU DISCO (DRIVE)
                    print(f"‚úÖ Miglioramento! Salvataggio modello in {FULL_MODEL_PATH}...")
                    torch.save(model.state_dict(), FULL_MODEL_PATH)

                else:
                    patience_counter += 1
                    print(f"‚ö†Ô∏è Nessun miglioramento. Patience: {patience_counter}/{es_patience}")

        if patience_counter >= es_patience:
            print(f"\n‚èπÔ∏è Early Stopping attivato! Stop training.")
            break

    time_elapsed = time.time() - start_time
    print(f'\nAddestramento completato in {time_elapsed // 60:.0f}m {time_elapsed % 60:.0f}s')
    print(f'Miglior Val Loss: {best_val_loss:.4f}')

    # Ricarichiamo i pesi migliori (sia in memoria che da file per sicurezza)
    print("üîÑ Caricamento dei pesi migliori per la valutazione finale...")
    model.load_state_dict(torch.load(FULL_MODEL_PATH))
    return model

# --- AVVIO ---
print("üöÄ Avvio Training con Salvataggio su Drive...")
trained_model = train_model(model, train_loader, val_loader, criterion, optimizer, scheduler, num_epochs=NUM_EPOCHS, es_patience=ES_PATIENCE)

üíæ Il modello migliore verr√† salvato in: /content/drive/MyDrive/Modelli_BookCover/best_resnet50_finetuned.pth

üîí Congelamento preventivo di tutta la rete...
üîì Scongelamento della Testa (FC) e dell'Ultimo Blocco (Layer4)...
üî• Parametri pronti per l'addestramento: 16,029,214
üöÄ Avvio Training con Salvataggio su Drive...

Epoch 1/30
----------
üìâ LR attuale -> Backbone: 1.0e-05 | Head: 1.0e-04
train Loss: 3.0169 Acc: 0.1749
val Loss: 2.7909 Acc: 0.2244
‚úÖ Miglioramento! Salvataggio modello in /content/drive/MyDrive/Modelli_BookCover/best_resnet50_finetuned.pth...

Epoch 2/30
----------
üìâ LR attuale -> Backbone: 1.0e-05 | Head: 1.0e-04
train Loss: 2.7463 Acc: 0.2366
val Loss: 2.6784 Acc: 0.2509
‚úÖ Miglioramento! Salvataggio modello in /content/drive/MyDrive/Modelli_BookCover/best_resnet50_finetuned.pth...

Epoch 3/30
----------
üìâ LR attuale -> Backbone: 1.0e-05 | Head: 1.0e-04
train Loss: 2.6426 Acc: 0.2582
val Loss: 2.6170 Acc: 0.2646
‚úÖ Miglioramento! Salvataggio

In [None]:
################## CELLA DI CARICAMENTO (NO TRAINING) #################
#######NEL CASO IN CUI TU VOGLIA CARICARE UN MODELLO SALVATO IN PRECEDENZA NEL DRIVE
import torch
import os

# 1. Definizione Percorso (Lo stesso usato per il salvataggio)
SAVE_PATH = '/content/drive/MyDrive/Modelli_BookCover'
MODEL_NAME = 'best_resnet50_finetuned.pth'
FULL_MODEL_PATH = os.path.join(SAVE_PATH, MODEL_NAME)

# 2. Verifica esistenza file
if os.path.exists(FULL_MODEL_PATH):
    print(f"üìÇ Trovato modello salvato: {FULL_MODEL_PATH}")

    # 3. Caricamento dei pesi nello scheletro creato nella Cella 5
    # map_location assicura che funzioni sia su CPU che GPU
    state_dict = torch.load(FULL_MODEL_PATH, map_location=device)
    model.load_state_dict(state_dict)

    # Spostiamo il modello sulla GPU (se disponibile)
    model = model.to(device)

    # Mettiamo il modello in modalit√† valutazione (blocca dropout, batchnorm, etc.)
    model.eval()

    print("‚úÖ Pesi caricati con successo! Il modello √® pronto per la valutazione.")
    print("‚è≠Ô∏è Ora puoi eseguire direttamente le celle 7 e 8.")
else:
    print(f"‚ùå ERRORE: Non trovo il file in {FULL_MODEL_PATH}")
    print("Assicurati di aver fatto almeno un training completo in precedenza.")

In [None]:
##################CELLA 7#################
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.metrics import confusion_matrix
import numpy as np

def plot_confusion_matrix(model, dataloader, classes):
    model.eval() # Modalit√† valutazione
    y_true = []
    y_pred = []

    print("üìä Calcolo delle predizioni sul Validation Set...")
    with torch.no_grad(): # Disabilita il calcolo dei gradienti (risparmia memoria)
        for inputs, labels in dataloader:
            inputs = inputs.to(device)
            labels = labels.to(device)

            outputs = model(inputs)
            _, preds = torch.max(outputs, 1)

            # Spostiamo su CPU e convertiamo in numpy
            y_true.extend(labels.cpu().numpy())
            y_pred.extend(preds.cpu().numpy())

    # Calcolo della matrice
    cm = confusion_matrix(y_true, y_pred)

    # Normalizzazione (opzionale, per vedere le % invece dei numeri assoluti)
    # cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]

    # Plotting
    plt.figure(figsize=(20, 16)) # Dimensioni grandi per farci stare 30 classi
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
                xticklabels=classes, yticklabels=classes)

    plt.ylabel('Vero Genere (True Label)', fontsize=14)
    plt.xlabel('Genere Predetto (Predicted Label)', fontsize=14)
    plt.title('Matrice di Confusione - Generi Letterari', fontsize=18)
    plt.xticks(rotation=90) # Ruota le etichette per leggerle meglio
    plt.yticks(rotation=0)
    plt.show()

# Eseguiamo la funzione usando il modello addestrato
# Assicurati che 'trained_model' sia disponibile (dopo la Cella 6)
print("Generazione grafico in corso...")
plot_confusion_matrix(model, val_loader, train_dataset.classes) #cambiato (vedi se "model" funziona comunque anche se traini il modello da capo, altrimenti rimetti "trained_model")

In [None]:
################## CELLA 8#################
#METRICHE PAPER (TOP-1, TOP-2, TOP-3)
def evaluate_paper_metrics(model, dataloader):
    model.eval()

    correct_top1 = 0
    correct_top2 = 0
    correct_top3 = 0
    total = 0

    print("üìè Calcolo metriche Top-k (Come nel Paper)...")

    with torch.no_grad():
        for inputs, labels in dataloader:
            inputs = inputs.to(device)
            labels = labels.to(device)

            # 1. Calcoliamo l'output del modello
            outputs = model(inputs)

            # 2. Prendiamo le prime 3 predizioni pi√π alte (Top-3)
            # k=3 perch√© ci servono Top-1, Top-2 e Top-3
            _, max_k_preds = torch.topk(outputs, k=3, dim=1)

            # 3. Trasponiamo la matrice per facilitare il confronto
            # Ora max_k_preds ha shape [3, batch_size]
            max_k_preds = max_k_preds.t()

            # 4. Creiamo una matrice di etichette ripetute per confrontarle
            target_expanded = labels.view(1, -1).expand_as(max_k_preds)

            # 5. Confronto: Otteniamo una matrice di True/False
            # Se la cella (k, i) √® True, vuol dire che la k-esima predizione per l'immagine i √® corretta
            correct = max_k_preds.eq(target_expanded)

            # --- AGGIORNAMENTO CONTATORI ---

            # Top-1: Controlliamo solo la prima riga (la predizione #1)
            correct_top1 += correct[:1].reshape(-1).float().sum(0, keepdim=True)

            # Top-2: Controlliamo le prime due righe (predizione #1 O predizione #2)
            correct_top2 += correct[:2].reshape(-1).float().sum(0, keepdim=True)

            # Top-3: Controlliamo le prime tre righe
            correct_top3 += correct[:3].reshape(-1).float().sum(0, keepdim=True)

            total += labels.size(0)

    # Calcolo percentuali finali
    acc_top1 = correct_top1.item() / total * 100
    acc_top2 = correct_top2.item() / total * 100
    acc_top3 = correct_top3.item() / total * 100

    print(f"\nüìä RISULTATI DEL PAPER (su {total} immagini di test):")
    print("-" * 40)
    print(f"üîπ Top-1 Accuracy: {acc_top1:.2f}%  (Paper AlexNet: 24.7%)")
    print(f"üîπ Top-2 Accuracy: {acc_top2:.2f}%  (Paper AlexNet: 33.1%)")
    print(f"üîπ Top-3 Accuracy: {acc_top3:.2f}%  (Paper AlexNet: 40.3%)")
    print("-" * 40)
    return acc_top1, acc_top2, acc_top3

# Esegui la valutazione
evaluate_paper_metrics(model, val_loader) #cambiato (vedi se "model" funziona comunque anche se traini il modello da capo, altrimenti rimetti "trained_model")