## PyTorch

+ si tratta di una libreria per la gestione di tensori ottimizzata per applicazioni di deep learning eseguite su GPU o CPU
+ altra definizione: framework open source per il machine learning
    + piattaforma che consente di creare ed addestrare modelli di deep learning in maniera semplice
+ molto utilizzato nella ricerca universitaria e non e nell'industria
+ fornisce supporto ad un ampio insieme di casi di uso
    + elaborazione del linguaggio naturale, computer vision, IA generativa ...
+ è fortemente ottimizzato al fine di ottenere le migliori prestazioni possibili su CPU, GPU ed acceleratori harware dedicati
+ rende possibile il deployment sia anche su dispositivi mobili o con risorse limitate
+ supporta il training distribuito   

+ in PyTorch esistono due primitive per lavorare con i dati torch.utils.data.DataLoader e torch.utils.data.Dataset.
    + Dataset memorizza i vari campioni e le etichette corrispondenti
    + Dataloader ritorna un oggetto iterabile che wrappa al suo interno il Dataset
+ PyTorch consente di scaricare direttamente dalla rete alcuni dataset di riferimento
    + possono essere scaricati separatamente l'insieme di training e l'insieme di test attraverso il parametro **train** della funzione factory utilizzata per ottenere un dataset specifico
        + è un parametro boolean: se true otteniamo un dataset di training, se false otteniamo un dataset per il test del modello
+ una volta ottenuti i due insiemi di training e di test possiamo creare due oggetti DataLoader

In [1]:
pip install torch torchvision

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 25.0.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


In [2]:
import torch
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor

training_data = datasets.FashionMNIST(root='data', train='true', download='true', transform=ToTensor())
test_data = datasets.FashionMNIST(root='data', train='false', download='false', transform=ToTensor())


In [3]:
batch_size = 100

training_dataloader = DataLoader(training_data, batch_size=batch_size)
test_dataloader = DataLoader(test_data, batch_size=batch_size)

print(f"Training dataloader =  {len(training_dataloader)}")
print(f"Test dataloader = {test_dataloader}")

Training dataloader =  600
Test dataloader = <torch.utils.data.dataloader.DataLoader object at 0x000001E31DD87550>


+ una rete neurale può essere creata a partire dalla classe Module del package nn
    + all'interno del costruttore __init__ si definisce la struttura della rete
    + all'interno del metodo forward si deve descrivere come l'input deve attraversare la rete
        + cioò come l'input deve essere elaborato dalla rete
    + è possibile sfruttare degli acceleratori hardware (tipo cuda) se disponibili
        + in loro mancanza si utilizzerà la CPU per eseguire i vari calcoli 

In [4]:
# controlliamo se ci sono acceleratori presenti
torch.accelerator.is_available()

False

In [5]:
# possiamo chiedere a torch di restituirci l'acceleratore disponibile sotto forma di oggetto Device
aDevice = torch.accelerator.current_accelerator()
print(f"Device: {aDevice}")

Device: None


+ per l'addestramento di un modello abbiamo bisogno di una loss function e di un optimizer
+ il modello viene addestrato usando mini batches
    + un mini batches è un piccolo insieme di elementi del dataset di training
    + quindi il dataset di training iniziale viene suddiviso in più mini batches
    + ad ogni iterazione vengono valutati tutti gli elementi nel mini batch, calcolata la loss funcion e poi aggiornati i pesi utilizzando la backpropagation utilizzando il gradiente della funzione di perdita
    + l'elaborazione di tutti i mini batches costituisce un'epoca (epoch)
+ conclusa la fase di addestramento si verifica, attraverso l'insieme di test, se il modello abbia effettivamente appreso dai dati
    + si possono utilizzare diverse metriche come ad esempio l'accuratezza (accuracy)
        + dipende anche dal tipo di problema di learning ovvero classificazione, regressione ecc...
        + l'accuracy per problemi di classificazione è definita come $Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$
            + dove TP = true positive, TN = true negativi, FP = false positive, FN = false negative
            + in pratica la frazione delle previsioni corrette sul totale dei dati elaborati
+ generalmente l'addestramento considera diverse epoche e quindi il dataset di addestramento viene ripassato più volte
    + ci si aspetta un aumento dell'accuratezza ed una diminuzione dell'errore medio alla fine di ogni epoca
+ un modello, una volta addestrato, può essere salvato
    + vengono salvati tutti i suoi parametri e non la sua struttura
    + viene salvato soltanto il suo stato post addestramento
+ i parametri salvati, ovvero lo stato di un modello, possono essere ricaricati dopo aver ricreato la struttura del modello
    + esiste il metodo load_state_dict() della classe base Module usata per costruire la struttura del modello 