In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader, WeightedRandomSampler
from torchvision import models
from torch.optim.lr_scheduler import CosineAnnealingWarmRestarts
from torchinfo import summary
from torch.cuda.amp import GradScaler

from albumentations.pytorch import ToTensorV2
from sklearn.metrics import precision_score, recall_score, f1_score, confusion_matrix, roc_auc_score

import os
import cv2
import numpy as np
import albumentations as A
from tqdm import tqdm
import warnings

warnings.filterwarnings("ignore")


In [100]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

cuda


### Definizione del Dataset e Caricamento dei Dati

In questa sezione, prepariamo il nostro dataset per l'addestramento e la valutazione del modello. Le operazioni principali sono:

1.  **Configurazione Iniziale**: Vengono definiti i percorsi (`root_color_train`, `root_depth_test`, ecc.) alle directory contenenti le immagini a colori e le mappe di profondit√†. Vengono inoltre impostati gli iperparametri fondamentali come la dimensione delle immagini (`img_size`), la grandezza dei batch (`batch_size`) e i parametri per l'ottimizzatore (`lr`, `weight_decay`).

2.  **Creazione della Classe `AntiSpoofDataset`**: Poich√© il nostro modello utilizza un input multimodale (**immagini RGB** e **mappe di profondit√†**), creiamo una classe `Dataset` personalizzata. Questa classe gestisce:
    *   Il caricamento simultaneo di un'immagine a colori e della sua corrispondente mappa di profondit√†.
    *   Il ridimensionamento di entrambe le immagini a una dimensione uniforme (`img_size`).
    *   L'applicazione di trasformazioni e data augmentation (definite in una cella successiva).
    *   La conversione delle immagini in tensori PyTorch pronti per essere inviati al modello.

3.  **Funzione `load_paths` e Caricamento**: La funzione `load_paths` esamina le directory specificate, identifica i campioni come `real` (etichetta 0) o `fake` (etichetta 1) in base al nome del file e crea le liste di percorsi e etichette. Infine, questa funzione viene eseguita per caricare i dati di training e test, stampando un riepilogo del numero di campioni per ogni set e per ogni classe.

In [101]:
root_color_train = "/content/drive/MyDrive/fr_gans/dataset_casia/train_img/color"
root_depth_train = "/content/drive/MyDrive/fr_gans/dataset_casia/train_img/depth_midas_train"

root_color_test = "/content/drive/MyDrive/fr_gans/dataset_casia/test_img/color"
root_depth_test = "/content/drive/MyDrive/fr_gans/dataset_casia/test_img/depth_midas_test"

img_size = 224
batch_size = 24
lr = 1e-4
weight_decay = 5e-4
patience = 15
use_mixed_precision = True

In [None]:
class AntiSpoofDataset(Dataset):
    def __init__(self, color_paths, depth_paths, labels, transform=None):
        self.color_paths = color_paths
        self.depth_paths = depth_paths
        self.labels = labels
        self.transform = transform

    def __len__(self):
        return len(self.color_paths)

    def __getitem__(self, idx):
        # Carica immagini
        img = cv2.imread(self.color_paths[idx])
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
        depth = cv2.imread(self.depth_paths[idx], cv2.IMREAD_GRAYSCALE)
        label = torch.tensor(self.labels[idx], dtype=torch.long)

        # Resize
        img = cv2.resize(img, (img_size, img_size))
        depth = cv2.resize(depth, (img_size, img_size))

        if self.transform:
            # Augmentation
            augmented = self.transform(image=img, mask=depth)
            img = augmented["image"]    # Tensor [3, H, W]
            depth = augmented["mask"]   # Numpy [H, W] uint8 [0-255]

            # Converti NUMPY ‚Üí Tensor normalizzato
            if isinstance(depth, np.ndarray):
                depth = torch.from_numpy(depth).float() / 255.0
            else:
                # Se albumentations gi√† converte (versioni diverse)
                depth = depth.float() / 255.0

            depth = depth.unsqueeze(0)  # [1, H, W]
        else:
            # Senza augmentation
            img = torch.from_numpy(img.transpose(2, 0, 1)).float() / 255.0
            depth = torch.from_numpy(depth).float() / 255.0
            depth = depth.unsqueeze(0)

        return img, depth, label


def load_paths(root_color, root_depth):
    color_paths, depth_paths, labels = [], [], []

    for f in os.listdir(root_color):
        if not f.lower().endswith((".jpg", ".png")):
            continue
        f_lower = f.lower()

        if "real" in f_lower:
            label = 0
        elif "fake" in f_lower:
            label = 1
        else:
            continue

        color_path = os.path.join(root_color, f)
        depth_path = os.path.join(root_depth, f)

        if os.path.exists(depth_path):
            color_paths.append(color_path)
            depth_paths.append(depth_path)
            labels.append(label)

    print(f"‚úÖ Caricati {len(color_paths)} campioni da {root_color}")
    print(f"   Real: {labels.count(0)} | Fake: {labels.count(1)}")
    return color_paths, depth_paths, labels


train_color, train_depth, train_labels = load_paths(root_color_train, root_depth_train)
test_color, test_depth, test_labels = load_paths(root_color_test, root_depth_test)

print(f"\nTrain: {len(train_color)} | Test: {len(test_color)}")

‚úÖ Caricati 2408 campioni da /content/drive/MyDrive/fr_gans/dataset_casia/train_img/color
   Real: 591 | Fake: 1817
‚úÖ Caricati 1655 campioni da /content/drive/MyDrive/fr_gans/dataset_casia/test_img/color
   Real: 404 | Fake: 1251

üìä Train: 2408 | Test: 1655


### Data Augmentation e Creazione dei DataLoader

Questa cella si occupa di due compiti fondamentali: definire le strategie di data augmentation e creare i `DataLoader` di PyTorch, che preparano i dati in lotti (batch) per l'addestramento e la valutazione.

#### Data Augmentation con Albumentations
Per rendere il modello pi√π robusto e capace di generalizzare a condizioni del mondo reale, viene applicata una pipeline di **data augmentation** molto ricca al solo set di addestramento, utilizzando la libreria `Albumentations`. Le trasformazioni sono state scelte per simulare scenari di attacco comuni:

-   **Variazioni di Illuminazione**: `RandomBrightnessContrast`, `RandomGamma` e `HueSaturationValue` per simulare diverse condizioni di luce ambientale.
-   **Artefatti di Display/Stampa**: `GaussNoise`, `ISONoise`, `MotionBlur` e `GaussianBlur` per imitare il rumore e le sfocature introdotte da schermi, proiettori o stampe di bassa qualit√†.
-   **Diverse Angolazioni e Prospettive**: `ShiftScaleRotate` e `Perspective` per simulare riprese del volto da diverse angolazioni.
-   **Qualit√† del Sensore**: `CLAHE` e `Sharpen` per simulare l'effetto di diverse fotocamere.

L'argomento `additional_targets={'mask': 'mask'}` √® cruciale: garantisce che le trasformazioni geometriche (come rotazioni o ritagli) vengano applicate in modo identico sia all'immagine RGB sia alla mappa di profondit√†, mantenendole perfettamente allineate.

Il set di test, invece, subisce solo la normalizzazione e la conversione in tensore per garantire una valutazione oggettiva e riproducibile delle performance del modello.

#### Gestione dello Sbilanciamento delle Classi
Come osservato in precedenza, il dataset √® sbilanciato, con un numero maggiore di campioni "fake". Per evitare che il modello diventi "pigro" e prediliga la classe maggioritaria, viene utilizzato un `WeightedRandomSampler`. Questo campionatore assegna un peso maggiore ai campioni della classe meno rappresentata (in questo caso, "real"), assicurando che durante l'addestramento il modello veda un numero pi√π bilanciato di esempi per ogni classe.

#### Creazione dei DataLoader
Infine, vengono creati i `DataLoader` per i set di training e test. Questi oggetti gestiscono il caricamento efficiente dei dati in batch, sfruttando il campionatore pesato per il training e mantenendo l'ordine sequenziale per il testing (`shuffle=False`). L'opzione `pin_memory=True` viene usata per velocizzare il trasferimento dei dati sulla GPU.

In [103]:
train_tf = A.Compose([
    # Simula diverse condizioni di illuminazione
    A.RandomBrightnessContrast(brightness_limit=0.4, contrast_limit=0.4, p=0.7),
    A.RandomGamma(gamma_limit=(70, 130), p=0.5),
    A.HueSaturationValue(hue_shift_limit=20, sat_shift_limit=30, val_shift_limit=20, p=0.6),

    # Simula artefatti di stampa/display
    A.GaussNoise(var_limit=(10.0, 50.0), p=0.4),
    A.ISONoise(color_shift=(0.01, 0.05), intensity=(0.1, 0.5), p=0.3),
    A.MotionBlur(blur_limit=7, p=0.4),
    A.GaussianBlur(blur_limit=(3, 7), p=0.3),

    # Simula diverse angolazioni
    A.ShiftScaleRotate(shift_limit=0.1, scale_limit=0.2, rotate_limit=20, p=0.6),
    A.Perspective(scale=(0.05, 0.1), p=0.4),

    # Simula diversi dispositivi di cattura
    A.CLAHE(clip_limit=2.0, p=0.3),
    A.Sharpen(alpha=(0.2, 0.5), lightness=(0.5, 1.0), p=0.3),

    # Augmentazioni base
    A.HorizontalFlip(p=0.5),
    A.CoarseDropout(max_holes=8, max_height=32, max_width=32, p=0.3),

    A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
    ToTensorV2()
], additional_targets={'mask': 'mask'})


test_tf = A.Compose([
    A.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225)),
    ToTensorV2()
], additional_targets={'mask': 'mask'})

train_dataset = AntiSpoofDataset(train_color,train_depth,train_labels,train_tf)
test_dataset = AntiSpoofDataset(test_color,test_depth,test_labels,test_tf)

class_counts = [train_labels.count(0), train_labels.count(1)]
class_weights = [1.0 / c for c in class_counts]
sample_weights = [class_weights[label] for label in train_labels]
sampler = WeightedRandomSampler(sample_weights, len(sample_weights))

train_loader = DataLoader(train_dataset, batch_size=batch_size, sampler=sampler, num_workers=2,pin_memory=True)
test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False, num_workers=2,pin_memory=True)


### Architettura del Modello Anti-Spoofing

Questa sezione definisce l'architettura completa del nostro modello di classificazione. Il design si basa su un approccio **multimodale** che sfrutta sia le informazioni cromatiche (RGB) sia quelle di profondit√† per massimizzare l'accuratezza. L'architettura √® composta da diversi moduli chiave:

#### `RGBEncoder`
Questo modulo √® responsabile dell'elaborazione delle immagini a colori. La sua architettura √® cos√¨ strutturata:
-   **Backbone**: Utilizza le feature convoluzionali di **EfficientNet-B0**, pre-addestrato su ImageNet. Questa scelta fornisce un potente estrattore di feature senza un costo computazionale eccessivo.
-   **`ChannelAttention`**: Dopo l'estrazione delle feature, viene applicato un meccanismo di attenzione sui canali. Questo modulo, ispirato a CBAM (Convolutional Block Attention Module), impara a pesare dinamicamente i canali delle feature map, permettendo al modello di concentrarsi sulle informazioni pi√π rilevanti e sopprimere quelle meno utili.
-   **Head di Proiezione**: Le feature raffinate vengono poi processate da un blocco di classificazione (head) composto da strati lineari, normalizzazione e dropout, che le proietta in uno spazio latente a 128 dimensioni.

#### `DepthEncoder`
Questo modulo, progettato su misura, elabora le mappe di profondit√† in scala di grigi. La sua architettura √® pensata per catturare informazioni a diverse scale:
-   **Feature Extractor Multi-Scala**: Consiste in una serie di blocchi convoluzionali che estraggono feature a risoluzioni decrescenti (`f1`, `f2`, `f3`).
-   **Fusione Multi-Scala**: Le feature map estratte a diverse profondit√† vengono ridimensionate alla stessa risoluzione spaziale e concatenate. Questo permette al modello di combinare dettagli fini (da feature map a risoluzione pi√π alta) con informazioni contestuali pi√π ampie (da feature map a risoluzione pi√π bassa).
-   **Head di Proiezione**: Similmente all'encoder RGB, un blocco finale proietta le feature di profondit√† fuse in uno spazio latente a 128 dimensioni.

#### `CrossModalAttention`
Questo √® il cuore dell'interazione tra le due modalit√†. Vengono utilizzati due moduli di attenzione incrociata:
1.  **`rgb_to_depth`**: Usa le feature RGB come *query* e le feature di profondit√† come *key* e *value*. In pratica, "chiede" alle feature di profondit√† quali siano le pi√π rilevanti per contestualizzare le informazioni RGB.
2.  **`depth_to_rgb`**: Fa l'opposto, usando la profondit√† come *query* per pesare le feature RGB.

Questo meccanismo permette a ciascuna modalit√† di arricchirsi con le informazioni complementari fornite dall'altra.

#### `AntiSpoofingModel` (Modello Principale)
Il modello finale assembla i componenti precedenti:
1.  **Estrazione Indipendente**: Le immagini RGB e di profondit√† vengono processate dai rispettivi encoder per ottenere i vettori di feature iniziali (`rgb_feat`, `depth_feat`).
2.  **Arricchimento Incrociato**: Vengono calcolate le feature "attese" (`rgb_attended`, `depth_attended`) tramite i moduli di `CrossModalAttention`.
3.  **Concatenazione e Fusione**: I quattro vettori di feature (originali e attesi) vengono concatenati in un unico vettore di dimensione 512.
4.  **Classificazione Finale**: Un blocco di fusione, composto da strati densi con dropout e normalizzazione, processa il vettore combinato per produrre le feature finali a 128 dimensioni. Infine, un classificatore lineare produce i *logit* per le due classi ("real" e "fake").

Il modello pu√≤ restituire opzionalmente anche le feature finali, utili per funzioni di loss pi√π complesse come la loss contrastiva.

In [104]:
class ChannelAttention(nn.Module):
  def __init__(self,channels,reduction=16):
    super().__init__()

    self.avg_pool = nn.AdaptiveAvgPool2d(1) # pool medio globale
    self.max_pool = nn.AdaptiveMaxPool2d(1) # pool max globale

    #Bottleneck
    self.fc = nn.Sequential(
        nn.Linear(channels,channels//reduction,bias=False),
        nn.ReLU(inplace=True),
        nn.Linear(channels//reduction,channels,bias=False)
    )
    self.sigmoid = nn.Sigmoid()

  def forward(self,x):
    b, c, _, _ = x.size()
    avg_out = self.avg_pool(x).view(b, c)  # [B, 1280, 7, 7] ‚Üí [B, 1280, 1, 1] ‚Üí [B, 1280]
    max_out = self.max_pool(x).view(b, c)  # [B, 1280, 7, 7] ‚Üí [B, 1280, 1, 1] ‚Üí [B, 1280]
    avg_out = self.fc(avg_out)  # [B, 1280] ‚Üí [B, 80] ‚Üí [B, 1280]
    max_out = self.fc(max_out)  # [B, 1280] ‚Üí [B, 80] ‚Üí [B, 1280]
    out = self.sigmoid(avg_out + max_out)  # [B, 1280] ‚Üí somma ‚Üí sigmoid
    out = out.view(b, c, 1, 1)              # [B, 1280, 1, 1]
    return x * out  # [B, 1280, 7, 7] * [B, 1280, 1, 1] ‚Üí [B, 1280, 7, 7]


class RGBEncoder(nn.Module):
  def __init__(self,output_dim=128):
    super().__init__()

    base = models.efficientnet_b0(weights=models.EfficientNet_B0_Weights.IMAGENET1K_V1)

    #backbone dell'encoder RGB --> EfficentNet-B0 net addestrato su ImageNet ([B,3,224,224] --> [B,1280,7,7])
    self.feature_extractor = base.features
    #([B,1280,7,7] --> [B,1280,7,7])
    self.attention = ChannelAttention(1280)
    # ([B,1280],[B120])
    self.head = nn.Sequential(
        nn.Linear(1280, 256),
        nn.BatchNorm1d(256),
        nn.ReLU(inplace=True),
        nn.Dropout(0.3),
        nn.Linear(256, 128)
    )

    self.output_dim = output_dim

  def forward(self,x):
    x = self.feature_extractor(x)
    x = self.attention(x)
    x = F.adaptive_avg_pool2d(x,1).flatten(1) #([B,1280,7,7] --> [B,1280])
    return self.head(x)

class DepthEncoder(nn.Module):
  def __init__(self,output_dim=128):
    super().__init__()

    # [B,1,224,224] ‚Üí [B,32,112,112]
    self.depth1 = nn.Sequential(
        nn.Conv2d(1,32,3,2,1),
        nn.BatchNorm2d(32),
        nn.ReLU(),
        nn.Conv2d(32,32,3,1,1),
        nn.BatchNorm2d(32),
        nn.ReLU()
    )

    # [B,32,112,112] --> [B,64,56,56]
    self.depth2 = nn.Sequential(
        nn.Conv2d(32,64,3,2,1),
        nn.BatchNorm2d(64),
        nn.ReLU(),
        nn.Conv2d(64,64,3,1,1),
        nn.BatchNorm2d(64),
        nn.ReLU()
    )

    # [B,64,56,56] --> [B,128,28,28]
    self.depth3 = nn.Sequential(
        nn.Conv2d(64,128,3,2,1),
        nn.BatchNorm2d(128),
        nn.ReLU()
    )

    self.fusion = nn.Sequential(
        nn.Conv2d(224,128,1),
        nn.BatchNorm2d(128),
        nn.ReLU()
    )

    self.upsample1 = nn.Upsample(scale_factor=4,mode='bilinear',align_corners=False)
    self.upsample2 = nn.Upsample(scale_factor=2,mode='bilinear',align_corners=False)

    self.global_pool = nn.AdaptiveAvgPool2d(1)

    self.fc = nn.Sequential(
        nn.Linear(128,128)
    )

    self.output_dim = output_dim

  def forward(self,x):
    f1 = self.depth1(x)   # [B,1,224,224] ‚Üí [B,32,112,112]
    f2 = self.depth2(f1)  # ‚úÖ Usa f1 (32 canali)
    f3 = self.depth3(f2)  # ‚úÖ Usa f2 (64 canali)

    f1_up = self.upsample1(f1) # [B,32,112,112] --> [B,32,448,448]
    f2_up = self.upsample2(f2) # [B,64,56,56] --> [B,64,112,112]

    target_size = f3.shape[2:] # (28,28)
    f1_up = F.interpolate(f1_up,size=target_size,mode='bilinear',align_corners=False) # [B,32,448,448] --> [b,32,64,64]
    f2_up = F.interpolate(f2_up,size=target_size,mode='bilinear',align_corners=False) # [B,64,112,112] --> [B,64,28,28]

    #concatenazione multi-scala
    multi_scale = torch.cat([f1_up,f2_up,f3],dim=1) # [B,32,28,28] + [B,64,28,28] + [B,128,28,28] = [B,224,28,28]

    fused = self.fusion(multi_scale) # [B,224,28,28] --> [B,128,28,28]

    x = F.adaptive_avg_pool2d(fused, 1).flatten(1)  # [B,128,28,28] ‚Üí [B,128]
    return self.fc(x)  # [B,128]


class CrossModalAttention(nn.Module):
  def __init__(self,dim):
    super().__init__()

    self.query = nn.Linear(dim,dim)
    self.key = nn.Linear(dim,dim)
    self.value = nn.Linear(dim,dim)
    self.scale = dim ** -0.5
    self.out_proj = nn.Linear(dim, dim)

  def forward(self,rgb_x,depth_x):
    q = self.query(rgb_x).unsqueeze(1) # [B, 128] ‚Üí [B, 1, 128]
    k = self.key(depth_x).unsqueeze(1) # [B, 128] ‚Üí [B, 1, 128]
    v = self.value(depth_x).unsqueeze(1) # [B, 128] ‚Üí [B, 1, 128]

    attn = (q @ k.transpose(-2,-1)) * self.scale
    attn = F.softmax(attn,dim=-1) # normalizzo in [0,1]
    out = (attn @ v).squeeze(1)  # [B, 1, 1] @ [B, 1, 128] ‚Üí [B, 128]
    return self.out_proj(out)


class AntiSpoofingModel(nn.Module):
  def __init__(self,rgb_encoder,depth_encoder):
    super().__init__()
    self.rgb_encoder = rgb_encoder
    self.depth_encoder = depth_encoder

    self.rgb_to_depth = CrossModalAttention(rgb_encoder.output_dim)
    self.depth_to_rgb = CrossModalAttention(depth_encoder.output_dim)

    fusion_dim = rgb_encoder.output_dim * 2 + depth_encoder.output_dim * 2
    self.fusion = nn.Sequential(
        nn.Linear(fusion_dim, 512),
        nn.BatchNorm1d(512),
        nn.ReLU(),
        nn.Dropout(0.5),
        nn.Linear(512, 256),
        nn.BatchNorm1d(256),
        nn.ReLU(),
        nn.Dropout(0.4),
        nn.Linear(256, 128),
        nn.BatchNorm1d(128),
        nn.ReLU(),
        nn.Dropout(0.3),
    )

    self.classifier = nn.Linear(128,2)

  def forward(self,rgb_x,depth_x,return_features=False):
    rgb_feat = self.rgb_encoder(rgb_x)
    depth_feat = self.depth_encoder(depth_x)

    rgb_attended = self.rgb_to_depth(rgb_feat,depth_feat)
    depth_attended = self.depth_to_rgb(depth_feat,rgb_feat)

    x = torch.cat(
        [
            rgb_feat,rgb_attended,
            depth_feat,depth_attended
        ],
        dim=1
    )

    features = self.fusion(x)
    logits = self.classifier(features)

    if return_features:
            return logits, features
    return logits

In [None]:
model = AntiSpoofingModel(
    RGBEncoder(),
    DepthEncoder()
).to(device)

# ‚úÖ CORRETTO: specifica input_data con tuple di tensors
summary(
    model,
    input_data=[
        torch.randn(1, 3, 224, 224).to(device),   # RGB input
        torch.randn(1, 1, 224, 224).to(device)    # Depth input
    ],
    col_names=["input_size", "output_size", "num_params", "trainable"],
    depth=3,
    verbose=0
)

Layer (type:depth-idx)                                       Input Shape               Output Shape              Param #                   Trainable
AntiSpoofingModel                                            [1, 3, 224, 224]          [1, 2]                    --                        True
‚îú‚îÄRGBEncoder: 1-1                                            [1, 3, 224, 224]          [1, 128]                  --                        True
‚îÇ    ‚îî‚îÄSequential: 2-1                                       [1, 3, 224, 224]          [1, 1280, 7, 7]           --                        True
‚îÇ    ‚îÇ    ‚îî‚îÄConv2dNormActivation: 3-1                        [1, 3, 224, 224]          [1, 32, 112, 112]         928                       True
‚îÇ    ‚îÇ    ‚îî‚îÄSequential: 3-2                                  [1, 32, 112, 112]         [1, 16, 112, 112]         1,448                     True
‚îÇ    ‚îÇ    ‚îî‚îÄSequential: 3-3                                  [1, 16, 112, 112]         [1, 24, 56

Layer (type:depth-idx)                                       Input Shape               Output Shape              Param #                   Trainable
AntiSpoofingModel                                            [1, 3, 224, 224]          [1, 2]                    --                        True
‚îú‚îÄRGBEncoder: 1-1                                            [1, 3, 224, 224]          [1, 128]                  --                        True
‚îÇ    ‚îî‚îÄSequential: 2-1                                       [1, 3, 224, 224]          [1, 1280, 7, 7]           --                        True
‚îÇ    ‚îÇ    ‚îî‚îÄConv2dNormActivation: 3-1                        [1, 3, 224, 224]          [1, 32, 112, 112]         928                       True
‚îÇ    ‚îÇ    ‚îî‚îÄSequential: 3-2                                  [1, 32, 112, 112]         [1, 16, 112, 112]         1,448                     True
‚îÇ    ‚îÇ    ‚îî‚îÄSequential: 3-3                                  [1, 16, 112, 112]         [1, 24, 56

### Funzione di Loss Ibrida: `ContrastativeFocalLoss`

Per addestrare efficacemente il nostro modello, non ci affidiamo a una semplice Cross-Entropy, ma implementiamo una **funzione di loss ibrida** personalizzata che combina due potenti concetti: la **Focal Loss** e la **Contrastive Loss**. Questa scelta √® motivata dalla necessit√† di affrontare due sfide comuni: lo sbilanciamento delle classi e la difficolt√† nel distinguere esempi "difficili".

#### Focal Loss
La componente `focal_loss` affronta il problema dello sbilanciamento delle classi e la presenza di esempi "facili" e "difficili". A differenza della Cross-Entropy standard, la Focal Loss riduce dinamicamente il peso degli esempi che il modello classifica gi√† correttamente (quelli "facili"). Questo permette all'ottimizzatore di **concentrarsi sugli esempi pi√π difficili e informativi**, che sono spesso quelli al confine tra le classi "real" e "fake". I parametri chiave sono:
-   `alpha`: Pesa l'importanza delle classi positive/negative.
-   `gamma`: Modula la focalizzazione; un `gamma` pi√π alto aumenta l'effetto di down-weighting sugli esempi facili.

#### Contrastive Loss (Supervised)
La componente `contrastive_loss` opera non sui *logit* finali, ma direttamente sullo **spazio delle feature** a 128 dimensioni prodotte dal modello. L'obiettivo √® quello di strutturare questo spazio latente in modo che sia semanticamente significativo. In particolare, questa loss:
-   **Avvicina** le feature di campioni appartenenti alla stessa classe (es. due volti "real" diversi).
-   **Allontana** le feature di campioni appartenenti a classi diverse (es. un volto "real" e uno "fake").

Questo approccio, noto come *Supervised Contrastive Learning*, aiuta il modello a imparare rappresentazioni pi√π robuste e discriminative, migliorando la sua capacit√† di generalizzazione. Il parametro `temperature` controlla la separazione tra le classi nello spazio latente.

#### Combinazione
La loss finale √® una somma pesata delle due componenti:
`Total Loss = focal_loss + contrast_weight * contrastive_loss`

Durante l'**addestramento**, vengono utilizzate entrambe le componenti per ottimizzare sia la classificazione sia la struttura dello spazio delle feature. Durante la **valutazione**, viene usata solo la `focal_loss` per calcolare una metrica di performance coerente, poich√© la componente contrastiva dipende dalla composizione del batch.

In [None]:
class ContrastativeFocalLoss(nn.Module):
    def __init__(self, alpha=0.25, gamma=2.0, contrast_weight=0.3, temperature=0.5):
        super().__init__()
        self.alpha = alpha
        self.gamma = gamma
        self.contrast_weight = contrast_weight
        self.temperature = temperature

    def focal_loss(self, inputs, targets):
        ce_loss = F.cross_entropy(inputs, targets, reduction='none')
        pt = torch.exp(-ce_loss)
        focal_loss = self.alpha * (1 - pt) ** self.gamma * ce_loss
        return focal_loss.mean()

    def contrastive_loss(self, features, labels):
        # Normalizza features per calcolare similarit√†
        features = F.normalize(features, dim=1)

        # Matrice di similarit√† (cosine similarity)
        sim_matrix = torch.matmul(features, features.T) / self.temperature

        # Maschera per positive pairs (stessa classe)
        labels = labels.view(-1, 1)
        mask = torch.eq(labels, labels.T).float().to(features.device)

        # Rimuovi diagonale (non confrontare sample con se stesso)
        mask = mask - torch.eye(mask.size(0)).to(features.device)

        # Contrastive loss: avvicina same-class, allontana different-class
        exp_sim = torch.exp(sim_matrix)
        log_prob = sim_matrix - torch.log(exp_sim.sum(1, keepdim=True) + 1e-8)

        # Media solo sui positive pairs
        mean_log_prob_pos = (mask * log_prob).sum(1) / (mask.sum(1) + 1e-8)
        loss = -mean_log_prob_pos.mean()
        return loss

    def forward(self, logits, features=None, targets=None):
        # Caso: criterion(out, y)
        if targets is None and features is not None and features.dtype == torch.long:
            targets = features
            features = None

        # Solo focal loss (test)
        if features is None:
            return self.focal_loss(logits, targets)

        # Focal + contrastive (train)
        focal = self.focal_loss(logits, targets)
        contrastive = self.contrastive_loss(features, targets)
        return focal + self.contrast_weight * contrastive

### Ottimizzatore, Scheduler e Early Stopping

In questa sezione, configuriamo tutti gli strumenti necessari per il processo di addestramento: l'ottimizzatore che aggiorna i pesi del modello, lo scheduler che gestisce il learning rate e un meccanismo di early stopping per prevenire l'overfitting e salvare il modello migliore.

#### Ottimizzatore e Funzione di Loss
-   **Ottimizzatore `AdamW`**: √à stata scelta una variante dell'ottimizzatore Adam, nota come AdamW. A differenza di Adam classico, AdamW disaccoppia il meccanismo di weight decay dalla gradiente, portando spesso a una migliore generalizzazione e performance pi√π stabili. L'opzione `amsgrad` √® attivata per migliorare ulteriormente la convergenza.
-   **Istanza della Loss**: Viene creata un'istanza della nostra funzione di loss personalizzata, `ContrastativeFocalLoss`, con i parametri `alpha`, `gamma` e `contrast_weight` specificati.

#### Scheduler del Learning Rate: `CosineAnnealingWarmRestarts`
Per evitare di rimanere bloccati in minimi locali e per esplorare meglio lo spazio della loss, viene utilizzato uno scheduler avanzato. Il `CosineAnnealingWarmRestarts` varia ciclicamente il learning rate (LR) seguendo un andamento cosinusoidale:
-   **Decadimento Coseno**: L'LR diminuisce gradualmente da un valore massimo a un valore minimo (`eta_min`) in un certo numero di epoche (`T_0`).
-   **Warm Restarts**: Al termine di ogni ciclo, l'LR viene "resettato" al suo valore iniziale. Questo "calcio" aiuta il modello a uscire da eventuali plateau e a convergere verso soluzioni migliori.
-   **Cicli Crescenti**: Il parametro `T_mult=2` fa s√¨ che la durata di ogni ciclo successivo raddoppi, permettendo al modello di affinare la sua convergenza man mano che l'addestramento procede.

#### Classe `EarlyStopping`
Per evitare di addestrare il modello pi√π del necessario (rischiando overfitting e spreco di tempo), viene implementata una classe `EarlyStopping`. Questa utility monitora una metrica di performance sul set di validazione (nel nostro caso, l'F1-score) e interrompe l'addestramento se non si osservano miglioramenti per un numero specificato di epoche (`patience`).

Le sue responsabilit√† principali sono:
-   **Monitorare lo Score**: Confronta lo score dell'epoca corrente con il miglior score ottenuto finora.
-   **Salvare il Modello Migliore**: Se viene raggiunto un nuovo score migliore, salva un checkpoint del modello, dello stato dell'ottimizzatore e delle metriche correnti.
-   **Interrompere l'Addestramento**: Se non ci sono miglioramenti per `patience` epoche consecutive, imposta un flag per terminare il ciclo di training.

In [None]:
class EarlyStopping:
    def __init__(self, patience=15, min_delta=0, mode='max', save_path='best_model.pth'):
        self.patience = patience
        self.min_delta = min_delta
        self.mode = mode
        self.save_path = save_path
        self.counter = 0
        self.best_score = None
        self.early_stop = False

    def __call__(self, score, model, optimizer, epoch, **kwargs):  #  Aggiunto **kwargs
        if self.best_score is None:
            self.best_score = score
            self.save_checkpoint(model, optimizer, epoch, score, **kwargs)
            return False

        # Fix logica improved
        if self.mode == "max":
            improved = score > (self.best_score + self.min_delta)
        else:  # mode == "min"
            improved = score < (self.best_score - self.min_delta)  #  Corretto

        if improved:
            self.best_score = score
            self.counter = 0
            self.save_checkpoint(model, optimizer, epoch, score, **kwargs)
            return False
        else:
            self.counter += 1  # Aggiunto self.
            print(f"   ‚è≥ Nessun miglioramento (counter {self.counter}/{self.patience})")
            if self.counter >= self.patience:
                self.early_stop = True
                return True
            return False

    def save_checkpoint(self, model, optimizer, epoch, score, **kwargs):
        checkpoint = {
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'score': score,
            **kwargs
        }
        torch.save(checkpoint, self.save_path)
        print(f"   üíæ Checkpoint salvato! Score: {score:.4f}")

In [108]:
optimizer = optim.AdamW(
  model.parameters(),
  lr,
  betas=(0.9, 0.999),
  weight_decay=weight_decay,
  amsgrad=True
)

scheduler = CosineAnnealingWarmRestarts(
    optimizer,
    T_0=10,  # Restart ogni 10 epochs
    T_mult=2,
    eta_min=1e-6
)

criterion = ContrastativeFocalLoss(
    alpha=0.25,
    gamma=2.0,
    contrast_weight=0.3
)

### Ciclo di Addestramento e Valutazione

Questa sezione finale contiene il cuore pulsante del progetto: le funzioni che definiscono il ciclo di addestramento e valutazione del modello. Il codice √® strutturato in tre parti principali per garantire chiarezza e modularit√†.

#### Funzione di Addestramento per Epoca (`train_one_epoch`)
Questa funzione incapsula tutta la logica necessaria per eseguire una singola epoca di addestramento. Le sue responsabilit√† includono:
-   **Iterazione sui Dati**: Scorre attraverso i batch forniti dal `train_loader`.
-   **Passaggio Forward e Calcolo della Loss**: Esegue il passaggio forward del modello per ottenere sia i *logit* sia le *feature*, che vengono poi usati per calcolare la nostra `ContrastativeFocalLoss` ibrida.
-   **Mixed Precision Training**: Per accelerare l'addestramento e ridurre l'uso di memoria della GPU, viene utilizzata la precisione mista (`torch.autocast`). Il `GradScaler` gestisce in modo sicuro il calcolo dei gradienti per prevenire problemi di underflow numerico.
-   **Backpropagation e Ottimizzazione**: Calcola i gradienti, applica il **Gradient Clipping** (con `max_norm=1.0`) per prevenire gradienti esplosivi e stabilizzare l'addestramento, e infine aggiorna i pesi del modello.
-   **Calcolo delle Metriche**: Restituisce la loss media e l'accuracy per l'epoca di addestramento.

#### Funzione di Valutazione (`testing`)
Questa funzione √® dedicata a valutare le performance del modello sul set di test (o validazione) al termine di ogni epoca. √à decorata con `@torch.no_grad()` per disattivare il calcolo dei gradienti, rendendo l'inferenza pi√π veloce e sicura.
-   **Modalit√† di Valutazione**: Imposta il modello in `model.eval()` per disattivare strati come Dropout e BatchNorm.
-   **Calcolo di Metriche Complete**: Oltre alla loss e all'accuracy, calcola un set completo di metriche di classificazione utilizzando `scikit-learn`:
    -   **Precision, Recall, F1-Score**: Per una valutazione approfondita dell'equilibrio del classificatore.
    -   **AUC (Area Under the Curve)**: Per misurare la capacit√† del modello di distinguere tra le classi.
    -   **Matrice di Confusione**: Per visualizzare in dettaglio gli errori di classificazione (veri positivi, falsi negativi, ecc.).
-   **Output Strutturato**: Restituisce un dizionario contenente tutte le metriche calcolate e l'oggetto della matrice di confusione.

#### Ciclo Principale di Addestramento (`train_model`)
Questa √® la funzione orchestratrice che esegue l'intero processo di addestramento per un numero specificato di epoche.
-   **Inizializzazione**: Prepara il `GradScaler` e l'istanza della classe `EarlyStopping`.
-   **Loop sulle Epoche**: Per ogni epoca, esegue in sequenza `train_one_epoch` e `testing`.
-   **Aggiornamento dello Scheduler**: Dopo ogni epoca di valutazione, aggiorna il learning rate secondo la strategia del `CosineAnnealingWarmRestarts`.
-   **Logging e Monitoraggio**: Stampa un riepilogo dettagliato delle performance di training e test, inclusi F1-score, AUC e il learning rate corrente. Mostra anche la matrice di confusione.
-   **Controllo Early Stopping**: Utilizza l'**F1-score** sul set di test come metrica chiave per decidere se l'addestramento deve continuare. Se non ci sono miglioramenti per un numero di epoche pari a `patience`, il ciclo viene interrotto e il modello con le migliori performance viene conservato.

In [None]:
def train_one_epoch(model, loader, criterion, optimizer, scaler, device, use_mixed_precision):
  model.train()

  total_loss = 0.0
  correct,total = 0,0

  for rgb,depth,label in tqdm(loader,desc="Training",leave=False):
    rgb, depth, label = rgb.to(device), depth.to(device), label.to(device)
    optimizer.zero_grad()

    if use_mixed_precision and scaler is not None:
        with torch.autocast(device_type='cuda'):
            out, features = model(rgb, depth, return_features=True)
            loss = criterion(out, features, label)
        scaler.scale(loss).backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
        scaler.step(optimizer)
        scaler.update()

        # ‚úÖ FIX: Calcola accuracy FUORI dal context autocast
        with torch.no_grad():
            # Ricalcola forward in float32 per accuracy stabile
            out_eval = model(rgb, depth, return_features=False)
            preds = out_eval.argmax(1)
            correct += (preds == label).sum().item()
    else:
        out, features = model(rgb, depth, return_features=True)
        loss = criterion(out, features, label)
        loss.backward()
        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)
        optimizer.step()

        # Accuracy calculation
        preds = out.argmax(1)
        correct += (preds == label).sum().item()

    total_loss += loss.item()
    total += label.size(0)

  avg_loss = total_loss / len(loader)
  accuracy = 100 * correct / total
  return avg_loss, accuracy

@torch.no_grad()
def testing(model, loader, criterion, device):
    model.eval()
    total_loss = 0
    correct, total = 0, 0
    all_preds, all_labels, all_probs = [], [], []

    for rgb, depth, label in tqdm(loader, desc="Evaluating", leave=False):
        rgb, depth, label = rgb.to(device), depth.to(device), label.to(device)

        out = model(rgb, depth, return_features=False)
        loss = criterion(out, label)
        total_loss += loss.item()

        probs = F.softmax(out, dim=1)
        preds = out.argmax(1)

        correct += (preds == label).sum().item()
        total += label.size(0)

        all_preds.extend(preds.cpu().numpy())
        all_labels.extend(label.cpu().numpy())
        # ‚úÖ FIX: Prendi SOLO la probabilit√† della classe 1 (fake)
        all_probs.extend(probs[:, 1].cpu().numpy())  # Non probs.cpu().numpy()

    metrics = {
        'loss': total_loss / len(loader),
        'accuracy': 100 * correct / total,
        'precision': precision_score(all_labels, all_preds, zero_division=0),
        'recall': recall_score(all_labels, all_preds, zero_division=0),
        'f1': f1_score(all_labels, all_preds, zero_division=0),
        'auc': roc_auc_score(all_labels, all_probs) if len(set(all_labels)) > 1 else 0.0,
        'predictions': all_preds,
        'labels': all_labels
    }

    cm = confusion_matrix(all_labels, all_preds)

    return metrics, cm


def train_model(model, train_loader, test_loader, criterion, optimizer, scheduler,
                device, epochs=100, patience=15, use_mixed_precision=True, save_path='best_model.pth'):

  scaler = GradScaler() if use_mixed_precision else None
  best_loss = float('inf')
  early_stopping = EarlyStopping()

  for epoch in range(epochs):
      print(f"\nüìä Epoch {epoch+1}/{epochs}")
      print("-" * 40)

      train_loss,train_acc = train_one_epoch(model, train_loader, criterion, optimizer, scaler, device, use_mixed_precision)
      test_metrics, cm = testing(model, test_loader, criterion, device)

      scheduler.step()

      # Stampa metriche
      print(f"   Train ‚Üí Loss: {train_loss:.4f} | Acc: {train_acc:.2f}%")
      print(f"   Test  ‚Üí Loss: {test_metrics['loss']:.4f} | Acc: {test_metrics['accuracy']:.2f}%")
      print(f"   Metrics ‚Üí P: {test_metrics['precision']:.3f} | R: {test_metrics['recall']:.3f} | F1: {test_metrics['f1']:.3f} | AUC: {test_metrics['auc']:.3f}")
      print(f"   LR: {optimizer.param_groups[0]['lr']:.6f}")
      print(f"\nConfusion matrix: \n{cm}\n")

      # Early stopping (usa F1 come metrica principale)
      should_stop = early_stopping(
          test_metrics['f1'],
          model,
          optimizer,
          epoch,
          test_acc=test_metrics['accuracy'],
          f1=test_metrics['f1']
      )

      if not should_stop:
          print(f"   ‚è≥ No improvement: {early_stopping.counter}/{patience}")

      if should_stop:
          print(f"\n‚ö†Ô∏è Early stopping triggered at epoch {epoch+1}")
          break

  print(f"\n{'='*60}")
  print(f"‚úÖ Training completato!")
  print(f"{'='*60}\n")

  return early_stopping.best_score


In [110]:
best_f1 = train_model(
    model=model,
    train_loader=train_loader,
    test_loader=test_loader,
    criterion=criterion,
    optimizer=optimizer,
    scheduler=scheduler,
    device=device,
    epochs=100,
    patience=15,
    use_mixed_precision=use_mixed_precision,
    save_path="best_antispoofing_improved.pth"
)


üìä Epoch 1/100
----------------------------------------




   Train ‚Üí Loss: 1.0576 | Acc: 51.41%
   Test  ‚Üí Loss: 0.0571 | Acc: 29.18%
   Metrics ‚Üí P: 0.755 | R: 0.094 | F1: 0.166 | AUC: 0.506
   LR: 0.000098

Confusion matrix: 
[[ 366   38]
 [1134  117]]

   üíæ Checkpoint salvato! Score: 0.1664
   ‚è≥ No improvement: 0/15

üìä Epoch 2/100
----------------------------------------




   Train ‚Üí Loss: 1.0512 | Acc: 52.53%
   Test  ‚Üí Loss: 0.0528 | Acc: 33.53%
   Metrics ‚Üí P: 0.952 | R: 0.127 | F1: 0.224 | AUC: 0.721
   LR: 0.000091

Confusion matrix: 
[[ 396    8]
 [1092  159]]

   üíæ Checkpoint salvato! Score: 0.2243
   ‚è≥ No improvement: 0/15

üìä Epoch 3/100
----------------------------------------




   Train ‚Üí Loss: 1.0499 | Acc: 54.44%
   Test  ‚Üí Loss: 0.0459 | Acc: 49.97%
   Metrics ‚Üí P: 0.988 | R: 0.342 | F1: 0.508 | AUC: 0.829
   LR: 0.000080

Confusion matrix: 
[[399   5]
 [823 428]]

   üíæ Checkpoint salvato! Score: 0.5083
   ‚è≥ No improvement: 0/15

üìä Epoch 4/100
----------------------------------------




   Train ‚Üí Loss: 1.0468 | Acc: 56.40%
   Test  ‚Üí Loss: 0.0484 | Acc: 49.55%
   Metrics ‚Üí P: 0.986 | R: 0.337 | F1: 0.503 | AUC: 0.887
   LR: 0.000066

Confusion matrix: 
[[398   6]
 [829 422]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 5/100
----------------------------------------




   Train ‚Üí Loss: 1.0451 | Acc: 58.89%
   Test  ‚Üí Loss: 0.0401 | Acc: 65.74%
   Metrics ‚Üí P: 0.997 | R: 0.548 | F1: 0.708 | AUC: 0.932
   LR: 0.000051

Confusion matrix: 
[[402   2]
 [565 686]]

   üíæ Checkpoint salvato! Score: 0.7076
   ‚è≥ No improvement: 0/15

üìä Epoch 6/100
----------------------------------------




   Train ‚Üí Loss: 1.0410 | Acc: 63.54%
   Test  ‚Üí Loss: 0.0523 | Acc: 56.07%
   Metrics ‚Üí P: 1.000 | R: 0.419 | F1: 0.590 | AUC: 0.942
   LR: 0.000035

Confusion matrix: 
[[404   0]
 [727 524]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 7/100
----------------------------------------




   Train ‚Üí Loss: 1.0386 | Acc: 63.04%
   Test  ‚Üí Loss: 0.0424 | Acc: 66.77%
   Metrics ‚Üí P: 1.000 | R: 0.560 | F1: 0.718 | AUC: 0.955
   LR: 0.000021

Confusion matrix: 
[[404   0]
 [550 701]]

   üíæ Checkpoint salvato! Score: 0.7182
   ‚è≥ No improvement: 0/15

üìä Epoch 8/100
----------------------------------------




   Train ‚Üí Loss: 1.0373 | Acc: 64.45%
   Test  ‚Üí Loss: 0.0523 | Acc: 61.27%
   Metrics ‚Üí P: 1.000 | R: 0.488 | F1: 0.656 | AUC: 0.946
   LR: 0.000010

Confusion matrix: 
[[404   0]
 [641 610]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 9/100
----------------------------------------




   Train ‚Üí Loss: 1.0350 | Acc: 66.32%
   Test  ‚Üí Loss: 0.0318 | Acc: 77.34%
   Metrics ‚Üí P: 1.000 | R: 0.700 | F1: 0.824 | AUC: 0.967
   LR: 0.000003

Confusion matrix: 
[[404   0]
 [375 876]]

   üíæ Checkpoint salvato! Score: 0.8237
   ‚è≥ No improvement: 0/15

üìä Epoch 10/100
----------------------------------------




   Train ‚Üí Loss: 1.0345 | Acc: 69.14%
   Test  ‚Üí Loss: 0.0479 | Acc: 64.41%
   Metrics ‚Üí P: 1.000 | R: 0.529 | F1: 0.692 | AUC: 0.956
   LR: 0.000100

Confusion matrix: 
[[404   0]
 [589 662]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 11/100
----------------------------------------




   Train ‚Üí Loss: 1.0326 | Acc: 69.81%
   Test  ‚Üí Loss: 0.0309 | Acc: 78.55%
   Metrics ‚Üí P: 1.000 | R: 0.716 | F1: 0.835 | AUC: 0.978
   LR: 0.000099

Confusion matrix: 
[[404   0]
 [355 896]]

   üíæ Checkpoint salvato! Score: 0.8347
   ‚è≥ No improvement: 0/15

üìä Epoch 12/100
----------------------------------------




   Train ‚Üí Loss: 1.0237 | Acc: 73.63%
   Test  ‚Üí Loss: 0.0236 | Acc: 83.87%
   Metrics ‚Üí P: 1.000 | R: 0.787 | F1: 0.881 | AUC: 0.990
   LR: 0.000098

Confusion matrix: 
[[404   0]
 [267 984]]

   üíæ Checkpoint salvato! Score: 0.8805
   ‚è≥ No improvement: 0/15

üìä Epoch 13/100
----------------------------------------




   Train ‚Üí Loss: 1.0180 | Acc: 75.21%
   Test  ‚Üí Loss: 0.0156 | Acc: 87.43%
   Metrics ‚Üí P: 1.000 | R: 0.834 | F1: 0.909 | AUC: 0.998
   LR: 0.000095

Confusion matrix: 
[[ 404    0]
 [ 208 1043]]

   üíæ Checkpoint salvato! Score: 0.9093
   ‚è≥ No improvement: 0/15

üìä Epoch 14/100
----------------------------------------




   Train ‚Üí Loss: 1.0036 | Acc: 79.73%
   Test  ‚Üí Loss: 0.0162 | Acc: 87.92%
   Metrics ‚Üí P: 1.000 | R: 0.840 | F1: 0.913 | AUC: 0.999
   LR: 0.000091

Confusion matrix: 
[[ 404    0]
 [ 200 1051]]

   üíæ Checkpoint salvato! Score: 0.9131
   ‚è≥ No improvement: 0/15

üìä Epoch 15/100
----------------------------------------




   Train ‚Üí Loss: 0.9906 | Acc: 82.81%
   Test  ‚Üí Loss: 0.0096 | Acc: 93.96%
   Metrics ‚Üí P: 1.000 | R: 0.920 | F1: 0.958 | AUC: 1.000
   LR: 0.000086

Confusion matrix: 
[[ 404    0]
 [ 100 1151]]

   üíæ Checkpoint salvato! Score: 0.9584
   ‚è≥ No improvement: 0/15

üìä Epoch 16/100
----------------------------------------




   Train ‚Üí Loss: 0.9715 | Acc: 85.30%
   Test  ‚Üí Loss: 0.0049 | Acc: 97.58%
   Metrics ‚Üí P: 1.000 | R: 0.968 | F1: 0.984 | AUC: 1.000
   LR: 0.000080

Confusion matrix: 
[[ 404    0]
 [  40 1211]]

   üíæ Checkpoint salvato! Score: 0.9838
   ‚è≥ No improvement: 0/15

üìä Epoch 17/100
----------------------------------------




   Train ‚Üí Loss: 0.9541 | Acc: 87.67%
   Test  ‚Üí Loss: 0.0037 | Acc: 98.49%
   Metrics ‚Üí P: 0.999 | R: 0.981 | F1: 0.990 | AUC: 1.000
   LR: 0.000073

Confusion matrix: 
[[ 403    1]
 [  24 1227]]

   üíæ Checkpoint salvato! Score: 0.9899
   ‚è≥ No improvement: 0/15

üìä Epoch 18/100
----------------------------------------




   Train ‚Üí Loss: 0.9470 | Acc: 88.66%
   Test  ‚Üí Loss: 0.0059 | Acc: 97.16%
   Metrics ‚Üí P: 1.000 | R: 0.962 | F1: 0.981 | AUC: 1.000
   LR: 0.000066

Confusion matrix: 
[[ 404    0]
 [  47 1204]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 19/100
----------------------------------------




   Train ‚Üí Loss: 0.9327 | Acc: 90.28%
   Test  ‚Üí Loss: 0.0037 | Acc: 98.55%
   Metrics ‚Üí P: 0.998 | R: 0.982 | F1: 0.990 | AUC: 1.000
   LR: 0.000058

Confusion matrix: 
[[ 402    2]
 [  22 1229]]

   üíæ Checkpoint salvato! Score: 0.9903
   ‚è≥ No improvement: 0/15

üìä Epoch 20/100
----------------------------------------




   Train ‚Üí Loss: 0.9264 | Acc: 90.74%
   Test  ‚Üí Loss: 0.0028 | Acc: 99.15%
   Metrics ‚Üí P: 1.000 | R: 0.989 | F1: 0.994 | AUC: 1.000
   LR: 0.000051

Confusion matrix: 
[[ 404    0]
 [  14 1237]]

   üíæ Checkpoint salvato! Score: 0.9944
   ‚è≥ No improvement: 0/15

üìä Epoch 21/100
----------------------------------------




   Train ‚Üí Loss: 0.9209 | Acc: 91.07%
   Test  ‚Üí Loss: 0.0022 | Acc: 99.27%
   Metrics ‚Üí P: 0.998 | R: 0.992 | F1: 0.995 | AUC: 1.000
   LR: 0.000043

Confusion matrix: 
[[ 402    2]
 [  10 1241]]

   üíæ Checkpoint salvato! Score: 0.9952
   ‚è≥ No improvement: 0/15

üìä Epoch 22/100
----------------------------------------




   Train ‚Üí Loss: 0.9113 | Acc: 92.03%
   Test  ‚Üí Loss: 0.0043 | Acc: 98.13%
   Metrics ‚Üí P: 0.999 | R: 0.976 | F1: 0.987 | AUC: 1.000
   LR: 0.000035

Confusion matrix: 
[[ 403    1]
 [  30 1221]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 23/100
----------------------------------------




   Train ‚Üí Loss: 0.9117 | Acc: 91.40%
   Test  ‚Üí Loss: 0.0026 | Acc: 99.21%
   Metrics ‚Üí P: 0.999 | R: 0.990 | F1: 0.995 | AUC: 1.000
   LR: 0.000028

Confusion matrix: 
[[ 403    1]
 [  12 1239]]

   ‚è≥ Nessun miglioramento (counter 2/15)
   ‚è≥ No improvement: 2/15

üìä Epoch 24/100
----------------------------------------




   Train ‚Üí Loss: 0.9008 | Acc: 92.77%
   Test  ‚Üí Loss: 0.0022 | Acc: 99.34%
   Metrics ‚Üí P: 0.998 | R: 0.993 | F1: 0.996 | AUC: 1.000
   LR: 0.000021

Confusion matrix: 
[[ 402    2]
 [   9 1242]]

   üíæ Checkpoint salvato! Score: 0.9956
   ‚è≥ No improvement: 0/15

üìä Epoch 25/100
----------------------------------------




   Train ‚Üí Loss: 0.8978 | Acc: 93.15%
   Test  ‚Üí Loss: 0.0025 | Acc: 99.15%
   Metrics ‚Üí P: 0.999 | R: 0.990 | F1: 0.994 | AUC: 1.000
   LR: 0.000015

Confusion matrix: 
[[ 403    1]
 [  13 1238]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 26/100
----------------------------------------




   Train ‚Üí Loss: 0.8915 | Acc: 93.44%
   Test  ‚Üí Loss: 0.0013 | Acc: 99.64%
   Metrics ‚Üí P: 0.999 | R: 0.996 | F1: 0.998 | AUC: 1.000
   LR: 0.000010

Confusion matrix: 
[[ 403    1]
 [   5 1246]]

   üíæ Checkpoint salvato! Score: 0.9976
   ‚è≥ No improvement: 0/15

üìä Epoch 27/100
----------------------------------------




   Train ‚Üí Loss: 0.9008 | Acc: 92.07%
   Test  ‚Üí Loss: 0.0014 | Acc: 99.70%
   Metrics ‚Üí P: 0.998 | R: 0.998 | F1: 0.998 | AUC: 1.000
   LR: 0.000006

Confusion matrix: 
[[ 402    2]
 [   3 1248]]

   üíæ Checkpoint salvato! Score: 0.9980
   ‚è≥ No improvement: 0/15

üìä Epoch 28/100
----------------------------------------




   Train ‚Üí Loss: 0.8943 | Acc: 93.98%
   Test  ‚Üí Loss: 0.0014 | Acc: 99.46%
   Metrics ‚Üí P: 0.999 | R: 0.994 | F1: 0.996 | AUC: 1.000
   LR: 0.000003

Confusion matrix: 
[[ 403    1]
 [   8 1243]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 29/100
----------------------------------------




   Train ‚Üí Loss: 0.8944 | Acc: 93.02%
   Test  ‚Üí Loss: 0.0013 | Acc: 99.70%
   Metrics ‚Üí P: 0.998 | R: 0.998 | F1: 0.998 | AUC: 1.000
   LR: 0.000002

Confusion matrix: 
[[ 402    2]
 [   3 1248]]

   ‚è≥ Nessun miglioramento (counter 2/15)
   ‚è≥ No improvement: 2/15

üìä Epoch 30/100
----------------------------------------




   Train ‚Üí Loss: 0.8891 | Acc: 93.36%
   Test  ‚Üí Loss: 0.0018 | Acc: 99.40%
   Metrics ‚Üí P: 0.999 | R: 0.993 | F1: 0.996 | AUC: 1.000
   LR: 0.000100

Confusion matrix: 
[[ 403    1]
 [   9 1242]]

   ‚è≥ Nessun miglioramento (counter 3/15)
   ‚è≥ No improvement: 3/15

üìä Epoch 31/100
----------------------------------------




   Train ‚Üí Loss: 0.8953 | Acc: 94.06%
   Test  ‚Üí Loss: 0.0020 | Acc: 99.03%
   Metrics ‚Üí P: 0.999 | R: 0.988 | F1: 0.994 | AUC: 1.000
   LR: 0.000100

Confusion matrix: 
[[ 403    1]
 [  15 1236]]

   ‚è≥ Nessun miglioramento (counter 4/15)
   ‚è≥ No improvement: 4/15

üìä Epoch 32/100
----------------------------------------




   Train ‚Üí Loss: 0.9115 | Acc: 92.61%
   Test  ‚Üí Loss: 0.0039 | Acc: 98.55%
   Metrics ‚Üí P: 0.999 | R: 0.982 | F1: 0.990 | AUC: 1.000
   LR: 0.000099

Confusion matrix: 
[[ 403    1]
 [  23 1228]]

   ‚è≥ Nessun miglioramento (counter 5/15)
   ‚è≥ No improvement: 5/15

üìä Epoch 33/100
----------------------------------------




   Train ‚Üí Loss: 0.8960 | Acc: 94.27%
   Test  ‚Üí Loss: 0.0013 | Acc: 99.46%
   Metrics ‚Üí P: 0.999 | R: 0.994 | F1: 0.996 | AUC: 1.000
   LR: 0.000099

Confusion matrix: 
[[ 403    1]
 [   8 1243]]

   ‚è≥ Nessun miglioramento (counter 6/15)
   ‚è≥ No improvement: 6/15

üìä Epoch 34/100
----------------------------------------




   Train ‚Üí Loss: 0.8917 | Acc: 94.44%
   Test  ‚Üí Loss: 0.0045 | Acc: 98.19%
   Metrics ‚Üí P: 0.999 | R: 0.977 | F1: 0.988 | AUC: 1.000
   LR: 0.000098

Confusion matrix: 
[[ 403    1]
 [  29 1222]]

   ‚è≥ Nessun miglioramento (counter 7/15)
   ‚è≥ No improvement: 7/15

üìä Epoch 35/100
----------------------------------------




   Train ‚Üí Loss: 0.8893 | Acc: 94.35%
   Test  ‚Üí Loss: 0.0015 | Acc: 99.70%
   Metrics ‚Üí P: 0.999 | R: 0.997 | F1: 0.998 | AUC: 1.000
   LR: 0.000096

Confusion matrix: 
[[ 403    1]
 [   4 1247]]

   ‚è≥ Nessun miglioramento (counter 8/15)
   ‚è≥ No improvement: 8/15

üìä Epoch 36/100
----------------------------------------




   Train ‚Üí Loss: 0.8943 | Acc: 93.90%
   Test  ‚Üí Loss: 0.0018 | Acc: 99.34%
   Metrics ‚Üí P: 0.999 | R: 0.992 | F1: 0.996 | AUC: 1.000
   LR: 0.000095

Confusion matrix: 
[[ 403    1]
 [  10 1241]]

   ‚è≥ Nessun miglioramento (counter 9/15)
   ‚è≥ No improvement: 9/15

üìä Epoch 37/100
----------------------------------------




   Train ‚Üí Loss: 0.8791 | Acc: 95.43%
   Test  ‚Üí Loss: 0.0007 | Acc: 99.88%
   Metrics ‚Üí P: 0.998 | R: 1.000 | F1: 0.999 | AUC: 1.000
   LR: 0.000093

Confusion matrix: 
[[ 402    2]
 [   0 1251]]

   üíæ Checkpoint salvato! Score: 0.9992
   ‚è≥ No improvement: 0/15

üìä Epoch 38/100
----------------------------------------




   Train ‚Üí Loss: 0.8822 | Acc: 94.85%
   Test  ‚Üí Loss: 0.0016 | Acc: 99.34%
   Metrics ‚Üí P: 0.999 | R: 0.992 | F1: 0.996 | AUC: 1.000
   LR: 0.000091

Confusion matrix: 
[[ 403    1]
 [  10 1241]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 39/100
----------------------------------------




   Train ‚Üí Loss: 0.8790 | Acc: 95.14%
   Test  ‚Üí Loss: 0.0006 | Acc: 99.94%
   Metrics ‚Üí P: 0.999 | R: 1.000 | F1: 1.000 | AUC: 1.000
   LR: 0.000088

Confusion matrix: 
[[ 403    1]
 [   0 1251]]

   üíæ Checkpoint salvato! Score: 0.9996
   ‚è≥ No improvement: 0/15

üìä Epoch 40/100
----------------------------------------




   Train ‚Üí Loss: 0.8749 | Acc: 95.43%
   Test  ‚Üí Loss: 0.0006 | Acc: 99.88%
   Metrics ‚Üí P: 0.999 | R: 0.999 | F1: 0.999 | AUC: 1.000
   LR: 0.000086

Confusion matrix: 
[[ 403    1]
 [   1 1250]]

   ‚è≥ Nessun miglioramento (counter 1/15)
   ‚è≥ No improvement: 1/15

üìä Epoch 41/100
----------------------------------------




   Train ‚Üí Loss: 0.8751 | Acc: 96.01%
   Test  ‚Üí Loss: 0.0010 | Acc: 99.58%
   Metrics ‚Üí P: 0.999 | R: 0.995 | F1: 0.997 | AUC: 1.000
   LR: 0.000083

Confusion matrix: 
[[ 403    1]
 [   6 1245]]

   ‚è≥ Nessun miglioramento (counter 2/15)
   ‚è≥ No improvement: 2/15

üìä Epoch 42/100
----------------------------------------




   Train ‚Üí Loss: 0.8776 | Acc: 96.30%
   Test  ‚Üí Loss: 0.0010 | Acc: 99.70%
   Metrics ‚Üí P: 0.999 | R: 0.997 | F1: 0.998 | AUC: 1.000
   LR: 0.000080

Confusion matrix: 
[[ 403    1]
 [   4 1247]]

   ‚è≥ Nessun miglioramento (counter 3/15)
   ‚è≥ No improvement: 3/15

üìä Epoch 43/100
----------------------------------------




   Train ‚Üí Loss: 0.8811 | Acc: 96.10%
   Test  ‚Üí Loss: 0.0004 | Acc: 99.94%
   Metrics ‚Üí P: 0.999 | R: 1.000 | F1: 1.000 | AUC: 1.000
   LR: 0.000076

Confusion matrix: 
[[ 403    1]
 [   0 1251]]

   ‚è≥ Nessun miglioramento (counter 4/15)
   ‚è≥ No improvement: 4/15

üìä Epoch 44/100
----------------------------------------




   Train ‚Üí Loss: 0.8886 | Acc: 95.02%
   Test  ‚Üí Loss: 0.0013 | Acc: 99.40%
   Metrics ‚Üí P: 0.999 | R: 0.993 | F1: 0.996 | AUC: 1.000
   LR: 0.000073

Confusion matrix: 
[[ 403    1]
 [   9 1242]]

   ‚è≥ Nessun miglioramento (counter 5/15)
   ‚è≥ No improvement: 5/15

üìä Epoch 45/100
----------------------------------------




   Train ‚Üí Loss: 0.8677 | Acc: 96.55%
   Test  ‚Üí Loss: 0.0030 | Acc: 98.31%
   Metrics ‚Üí P: 0.999 | R: 0.978 | F1: 0.989 | AUC: 1.000
   LR: 0.000069

Confusion matrix: 
[[ 403    1]
 [  27 1224]]

   ‚è≥ Nessun miglioramento (counter 6/15)
   ‚è≥ No improvement: 6/15

üìä Epoch 46/100
----------------------------------------




   Train ‚Üí Loss: 0.8632 | Acc: 97.05%
   Test  ‚Üí Loss: 0.0005 | Acc: 99.64%
   Metrics ‚Üí P: 0.999 | R: 0.996 | F1: 0.998 | AUC: 1.000
   LR: 0.000066

Confusion matrix: 
[[ 403    1]
 [   5 1246]]

   ‚è≥ Nessun miglioramento (counter 7/15)
   ‚è≥ No improvement: 7/15

üìä Epoch 47/100
----------------------------------------




   Train ‚Üí Loss: 0.8673 | Acc: 97.30%
   Test  ‚Üí Loss: 0.0028 | Acc: 98.85%
   Metrics ‚Üí P: 0.999 | R: 0.986 | F1: 0.992 | AUC: 1.000
   LR: 0.000062

Confusion matrix: 
[[ 403    1]
 [  18 1233]]

   ‚è≥ Nessun miglioramento (counter 8/15)
   ‚è≥ No improvement: 8/15

üìä Epoch 48/100
----------------------------------------




   Train ‚Üí Loss: 0.8714 | Acc: 96.55%
   Test  ‚Üí Loss: 0.0008 | Acc: 99.58%
   Metrics ‚Üí P: 0.999 | R: 0.995 | F1: 0.997 | AUC: 1.000
   LR: 0.000058

Confusion matrix: 
[[ 403    1]
 [   6 1245]]

   ‚è≥ Nessun miglioramento (counter 9/15)
   ‚è≥ No improvement: 9/15

üìä Epoch 49/100
----------------------------------------




   Train ‚Üí Loss: 0.8711 | Acc: 96.55%
   Test  ‚Üí Loss: 0.0010 | Acc: 99.46%
   Metrics ‚Üí P: 0.999 | R: 0.994 | F1: 0.996 | AUC: 1.000
   LR: 0.000054

Confusion matrix: 
[[ 403    1]
 [   8 1243]]

   ‚è≥ Nessun miglioramento (counter 10/15)
   ‚è≥ No improvement: 10/15

üìä Epoch 50/100
----------------------------------------




   Train ‚Üí Loss: 0.8670 | Acc: 96.64%
   Test  ‚Üí Loss: 0.0004 | Acc: 99.88%
   Metrics ‚Üí P: 0.999 | R: 0.999 | F1: 0.999 | AUC: 1.000
   LR: 0.000051

Confusion matrix: 
[[ 403    1]
 [   1 1250]]

   ‚è≥ Nessun miglioramento (counter 11/15)
   ‚è≥ No improvement: 11/15

üìä Epoch 51/100
----------------------------------------




   Train ‚Üí Loss: 0.8685 | Acc: 96.59%
   Test  ‚Üí Loss: 0.0007 | Acc: 99.82%
   Metrics ‚Üí P: 0.998 | R: 0.999 | F1: 0.999 | AUC: 1.000
   LR: 0.000047

Confusion matrix: 
[[ 402    2]
 [   1 1250]]

   ‚è≥ Nessun miglioramento (counter 12/15)
   ‚è≥ No improvement: 12/15

üìä Epoch 52/100
----------------------------------------




   Train ‚Üí Loss: 0.8636 | Acc: 97.18%
   Test  ‚Üí Loss: 0.0006 | Acc: 99.82%
   Metrics ‚Üí P: 0.999 | R: 0.998 | F1: 0.999 | AUC: 1.000
   LR: 0.000043

Confusion matrix: 
[[ 403    1]
 [   2 1249]]

   ‚è≥ Nessun miglioramento (counter 13/15)
   ‚è≥ No improvement: 13/15

üìä Epoch 53/100
----------------------------------------




   Train ‚Üí Loss: 0.8675 | Acc: 96.68%
   Test  ‚Üí Loss: 0.0004 | Acc: 99.94%
   Metrics ‚Üí P: 0.999 | R: 1.000 | F1: 1.000 | AUC: 1.000
   LR: 0.000039

Confusion matrix: 
[[ 403    1]
 [   0 1251]]

   ‚è≥ Nessun miglioramento (counter 14/15)
   ‚è≥ No improvement: 14/15

üìä Epoch 54/100
----------------------------------------


                                                           

   Train ‚Üí Loss: 0.8625 | Acc: 96.93%
   Test  ‚Üí Loss: 0.0006 | Acc: 99.88%
   Metrics ‚Üí P: 0.999 | R: 0.999 | F1: 0.999 | AUC: 1.000
   LR: 0.000035

Confusion matrix: 
[[ 403    1]
 [   1 1250]]

   ‚è≥ Nessun miglioramento (counter 15/15)

‚ö†Ô∏è Early stopping triggered at epoch 54

‚úÖ Training completato!



