# **Reti Neurali** 

## **Esercizio 1: Download e pre-processamento dei dati.**

Scaricare e pre-processare i dati per il successivo addestramento del modello. 

Il dataset che utilizzeremo sarà CIFAR10, scaricabile dalla libreria `tensorflow.keras.datasets`

In [3]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10

# Download dataset
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

y_train = y_train.ravel()
y_test = y_test.ravel()

# Stampare le shape dei dati
print("x_train:", x_train.shape, "y_train:", y_train.shape)
print("x_test:", x_test.shape, "y_test:", y_test.shape)

x_train: (50000, 32, 32, 3) y_train: (50000,)
x_test: (10000, 32, 32, 3) y_test: (10000,)


In [5]:
from sklearn.preprocessing import StandardScaler

# Pre-processamento dei dati

# Reshape
x_train_flat = x_train.reshape(x_train.shape[0], -1)
x_test_flat = x_test.reshape(x_test.shape[0], -1)

# Standardizzazione
scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train_flat)
x_test_scaled = scaler.transform(x_test_flat)

# Ripristino forma originale
x_train = x_train_scaled.reshape(-1, 32, 32, 3)
x_test = x_test_scaled.reshape(-1, 32, 32, 3)

# Stampa
print("Dati preprocessati:")
print("x_train:", x_train.shape, "x_test:", x_test.shape)


Dati pre-processati con StandardScaler:
x_train: (50000, 32, 32, 3) x_test: (10000, 32, 32, 3)


## **Esercizio 2: Creare modello MLP**

Per creare il modello MLP utilizziamo l' oggetto `MLPClassifier` dal modulo `sklearn.neural_networks`. Questo è un oggetto molto complesso che prevede la possibilità di specificare tanti parametri, permettendoci una personalizzazione molto dettagliata. Vediamo di seguito gli argomenti principali:

- `hidden_layer_sizes`: rappresenta la struttura dell' MLP, sotto forma di una tupla. La tupla deve essere composta da numeri interi, ogni numero indica il numero di neuroni presenti nel rispettivo layer.

Esempio: 

`hidden_layer_sizes` = `(100)`

creerà un solo layer con 100 neuroni

`hidden_layer_sizes` = `(100, 50)`

creerà due layer, il primo con 100 neuroni, il secondo invece con 50.

- `max_iter`: massimo numero di iterazioni per raggiungere la convergenza. 

- `activation`: indica quale funzione di attivazione utilizzare, valori possibili sono `'relu'`, `'logistic'`, `'tanh'` and `'identity'`.

- `solver`: indica quale algoritmo di ottimizzazione utilizzare, valori possibili sono `'adam'`, `'sgd'` and `'lbfgs'`.

- `learning_rate_init`: valore iniziale del learning rate.

- `verbose`: valore booleano che, se impostato su `True`, stampa l' output di ogni iterazione di training. Molto utile per monitorare il training.

- `random_state`: fissa il seed della randomizzazione.


Per iniziare creiamo un MLP molto basilare, alleniamolo e testiamone le performance. Come parametri utilizzeremo:

- `hidden_layer_sizes` = `(100)`

- `max_iter` = `20`

- `random_state` = `42`

In [6]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score


# Creare MLP 
mlp = MLPClassifier(hidden_layer_sizes=(100), max_iter=20, random_state=42)

# Allenare MLP
mlp.fit(x_train.reshape(x_train.shape[0], -1), y_train)

# Valutare MLP
y_pred = mlp.predict(x_test.reshape(x_test.shape[0], -1))

# Stampare l' accuratezza
print("Accuratezza:", accuracy_score(y_test, y_pred))

Accuratezza: 0.5077




## **Esercizio 2.1: Aumentiamo i parametri del nostro modello**

Proviamo adesso ad aumentare i dettagli del nostro modello, modificando o aggiungendo i parametri sopra specificati. 

In [10]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Creare MLP con più strati e altre specifiche
mlp = MLPClassifier(hidden_layer_sizes=(200, 100, 50), max_iter=50, activation='logistic', solver='sgd', verbose=True, random_state=60)

# Allenare MLP
mlp.fit(x_train.reshape(x_train.shape[0], -1), y_train)

# Valutare MLP
y_pred = mlp.predict(x_test.reshape(x_test.shape[0], -1))

# Stampare l' accuratezza
print("Accuratezza:", accuracy_score(y_test, y_pred))

Iteration 1, loss = 2.31422618
Iteration 2, loss = 2.30116524
Iteration 3, loss = 2.30001451
Iteration 4, loss = 2.29874048
Iteration 5, loss = 2.29734724
Iteration 6, loss = 2.29590036
Iteration 7, loss = 2.29416895
Iteration 8, loss = 2.29230980
Iteration 9, loss = 2.29002882
Iteration 10, loss = 2.28735432
Iteration 11, loss = 2.28417075
Iteration 12, loss = 2.28004127
Iteration 13, loss = 2.27502034
Iteration 14, loss = 2.26864648
Iteration 15, loss = 2.26063049
Iteration 16, loss = 2.25051319
Iteration 17, loss = 2.23807553
Iteration 18, loss = 2.22306932
Iteration 19, loss = 2.20577865
Iteration 20, loss = 2.18690723
Iteration 21, loss = 2.16730848
Iteration 22, loss = 2.14820191
Iteration 23, loss = 2.13036585
Iteration 24, loss = 2.11420292
Iteration 25, loss = 2.10003190
Iteration 26, loss = 2.08771964
Iteration 27, loss = 2.07727551
Iteration 28, loss = 2.06848718
Iteration 29, loss = 2.06126690
Iteration 30, loss = 2.05537129
Iteration 31, loss = 2.05038621
Iteration 32, los



## **Esercizio 3: Implementare manualmente l' algoritmo di early stopping.**

L' algoritmo di early stopping ci permette di terminare anticipatamente l' allenamento di un modello nel caso in cui questo raggiunga la convergenza. Supponiamo infatti che il nostro modello raggiunga un certo livello di accuratezza e che non riesca a migliorare oltre quel livello. Questo significa che il modello, da quel momento in poi, non sta più apprendendo nuove informazioni, per cui le successive iterazioni sono superflue, ed inoltre rischiano di essere dannose, spingendo il modello verso l' overfitting. 

L' early stopping verifica ad ogni iterazione che l' accuratezza del modello sia incrementata di una certa tolleranza. Se questa tolleranza non viene superata per un certo numero di epoche, allora possiamo decidere di stoppare l' allenamento in quanto il modello ha raggiunto la convergenza.

**N.B: per applicare early stopping è necessario specificare i seguenti parametri dell' MLP:**

- `warm_start`=`True` in modo che il training proceda dallo stato attuale del modello e non dall' inizializzazione.

- `max_iter`=`1` in modo che il modello venga allenato per una sola epoca. Per l' early stopping infatti dovremo gestire manualmente il numero di iterazioni.

In [17]:
import numpy as np
from sklearn.neural_network import MLPClassifier 
from sklearn.metrics import accuracy_score 
from sklearn.model_selection import train_test_split

x_train_partial, x_val, y_train_partial, y_val = train_test_split(x_train_scaled, y_train, test_size=0.2, random_state=42)

n_total_epochs = 100
patience = 10
tolerance = 1e-4

best_val_accuracy = 0.0
epochs_without_improvement = 0

mlp = MLPClassifier(
    hidden_layer_sizes=(100),
    warm_start=True,
    max_iter=1,
    random_state=42
)

for epoch in range(n_total_epochs):
    mlp.fit(x_train_partial, y_train_partial)

    y_val_pred = mlp.predict(x_val)
    val_accuracy = accuracy_score(y_val, y_val_pred)
    print(f"Epoch {epoch+1}, Validation Accuracy: {val_accuracy:.4f}")

    if val_accuracy > best_val_accuracy + tolerance:
        best_val_accuracy = val_accuracy
        epochs_without_improvement = 0
    else:
        epochs_without_improvement += 1

    if epochs_without_improvement >= patience:
        print(f"Epoca dell'early stopping {epoch+1}")
        break

y_test_pred = mlp.predict(x_test_scaled)
final_test_accuracy = accuracy_score(y_test, y_test_pred)
print(f"Accuratezza finale sul test set: {final_test_accuracy:.4f}")




Epoch 1, Validation Accuracy: 0.4290
Epoch 2, Validation Accuracy: 0.4511
Epoch 3, Validation Accuracy: 0.4581
Epoch 4, Validation Accuracy: 0.4633
Epoch 5, Validation Accuracy: 0.4688
Epoch 6, Validation Accuracy: 0.4700
Epoch 7, Validation Accuracy: 0.4777
Epoch 8, Validation Accuracy: 0.4823
Epoch 9, Validation Accuracy: 0.4789
Epoch 10, Validation Accuracy: 0.4785
Epoch 11, Validation Accuracy: 0.4801
Epoch 12, Validation Accuracy: 0.4768
Epoch 13, Validation Accuracy: 0.4765
Epoch 14, Validation Accuracy: 0.4778
Epoch 15, Validation Accuracy: 0.4741
Epoch 16, Validation Accuracy: 0.4750
Epoch 17, Validation Accuracy: 0.4703
Epoch 18, Validation Accuracy: 0.4700
Epoca dell'early stopping 18
Accuratezza finale sul test set: 0.4676
