# Insegnare a un computer a riconoscere immagini

## Ma prima di tutto...

Esegui la cella qui sotto, senza preoccuparti più di tanto di che cosa succede: serve solo a rendere disponibile del codice che abbiamo scritto.

In [None]:
try:
    import ice
except ModuleNotFoundError:
    import sys
    if "google.colab" in sys.modules:
        !python -m pip install -qqq --upgrade -- uv && python -m uv pip install --system --quiet -- https://github.com/baggiponte/aiss-2024.git

# MNIST: un dataset fatto di cifre scritte a mano

In [1]:
from ice.utils import load_mnist, display

train, test = load_mnist(path="../data")

display(train)

interactive(children=(IntSlider(value=30000, description='index', max=60000, min=1), Output()), _dom_classes=(…

# La struttura di una rete neurale

In [2]:
import torch.nn as nn

class MLP(nn.Module):

    def __init__(self):
        super().__init__()
        self.flatten = nn.Flatten()
        self.stack = nn.Sequential(
            nn.Linear(28 * 28, 512),
            nn.ReLU(),
            nn.Linear(512, 256),
            nn.ReLU(),
            nn.Linear(256, 128),
            nn.ReLU(),
            nn.Linear(128, 10)
        )

    def forward(self, x):
        x_flat = self.flatten(x)
        logits = self.stack(x_flat)
        return logits

model = MLP()

# Allenare un modello

Eccoci nella parte complicata - per il computer, però. Abbiamo scritto per te due oggetti, un `TrainerConfig` e un `Trainer`, per semplificarti il lavoro.

* `Trainer` è un oggetto che si occupa di allenare il modello per te e di dirti come sta procedendo l'allenamento.
* `TrainerConfig` contiene le configurazioni del `Trainer`.

Per cominciare, esegui il codice qui sotto. Quando il `trainer` ha finito di allenare il modello, qual è l'accuratezza media? Forse è il caso di fare di più: pensi di potercela fare? Qualche consiglio:

1. Puoi cambiare la struttura del modello. Attenzione, però: non cambiare mai il numero di dimensioni iniziale (`28 * 28`) e finale (`10`), altrimenti il modello non potrà più prendere in input le immagini di MNIST, o assegnare loro la categoria.
2. Alterna sempre un `nn.Linear(...)` con `nn.ReLU()`, `nn.Softmax()` o `nn.Tanh()`.
3. Cambia i parametri del `Trainer`: allena per più epoche, usa una `batch_size` più grande, oppure un learning rate `learning_rate` più alto, o basso. Attenzione: un learning rate più basso significa che il modello potrebbe avere bisogno di un allenamento più lungo.

In [7]:
from ice.trainer import TrainerConfig, Trainer

config = TrainerConfig(
    epochs=5,
    batch_size=16,
    seed=42
)

In [6]:
trainer = Trainer(model=model, config=config, dataset=train)

In [5]:
trainer.fit()

Epoch 1
-------------------------------
loss: 3.794145  [   16/42000]
loss: 1.258176  [ 1616/42000]
loss: 0.779137  [ 3216/42000]
loss: 0.352297  [ 4816/42000]
loss: 0.230708  [ 6416/42000]
loss: 0.202113  [ 8016/42000]
loss: 0.040552  [ 9616/42000]
loss: 0.223809  [11216/42000]
loss: 0.300570  [12816/42000]
loss: 0.004270  [14416/42000]
loss: 0.152963  [16016/42000]
loss: 0.024903  [17616/42000]
loss: 0.013416  [19216/42000]
loss: 0.328030  [20816/42000]
loss: 0.483866  [22416/42000]
loss: 0.035327  [24016/42000]
loss: 0.119425  [25616/42000]
loss: 0.006094  [27216/42000]
loss: 0.055328  [28816/42000]
loss: 0.634638  [30416/42000]
loss: 0.031572  [32016/42000]
loss: 0.095923  [33616/42000]
loss: 0.073970  [35216/42000]
loss: 0.269234  [36816/42000]
loss: 0.357170  [38416/42000]
loss: 0.073978  [40016/42000]
loss: 0.438383  [41616/42000]
Validation Error: 
 Accuracy: 94.5%, Avg loss: 0.179265 

Epoch 2
-------------------------------
loss: 0.057522  [   16/42000]
loss: 0.046391  [ 1616