# **Reti Neurali** 

## **Esercizio 1: Download e pre-processamento dei dati.**

Scaricare e pre-processare i dati per il successivo addestramento del modello. 

Il dataset che utilizzeremo sarà CIFAR10, scaricabile dalla libreria `tensorflow.keras.datasets`

In [1]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10

# Download dataset
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

y_train = y_train.ravel()
y_test = y_test.ravel()

# Stampare le shape dei dati
print(f"x_Training set: {x_train.shape}")
print(f"x_Test set: {x_test.shape}")
print(f"y_Training set: {y_train.shape}")
print(f"y_Test set: {y_test.shape}")


2025-05-27 13:38:05.489374: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1748353085.754849      35 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1748353085.827457      35 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered


Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 0us/step
x_Training set: (50000, 32, 32, 3)
x_Test set: (10000, 32, 32, 3)
y_Training set: (50000,)
y_Test set: (10000,)


In [2]:
from sklearn.preprocessing import StandardScaler

# Pre-processamento dei dati

# svolgimento...

x_train = x_train.reshape(x_train.shape[0], -1)  # Flatten the images
x_test = x_test.reshape(x_test.shape[0], -1)  # Flatten the images
scaler = StandardScaler()
x_train= scaler.fit_transform(x_train)
x_test= scaler.transform(x_test)

print(f"x_Training_scaler: {x_train.shape}")
print(f"x_Test_scaler: {x_test.shape}")

x_Training_scaler: (50000, 3072)
x_Test_scaler: (10000, 3072)


## **Esercizio 2: Creare modello MLP**

Per creare il modello MLP utilizziamo l' oggetto `MLPClassifier` dal modulo `sklearn.neural_networks`. Questo è un oggetto molto complesso che prevede la possibilità di specificare tanti parametri, permettendoci una personalizzazione molto dettagliata. Vediamo di seguito gli argomenti principali:

- `hidden_layer_sizes`: rappresenta la struttura dell' MLP, sotto forma di una tupla. La tupla deve essere composta da numeri interi, ogni numero indica il numero di neuroni presenti nel rispettivo layer.

Esempio: 

`hidden_layer_sizes` = `(100)`

creerà un solo layer con 100 neuroni

`hidden_layer_sizes` = `(100, 50)`

creerà due layer, il primo con 100 neuroni, il secondo invece con 50.

- `max_iter`: massimo numero di iterazioni per raggiungere la convergenza. 

- `activation`: indica quale funzione di attivazione utilizzare, valori possibili sono `'relu'`, `'logistic'`, `'tanh'` and `'identity'`.

- `solver`: indica quale algoritmo di ottimizzazione utilizzare, valori possibili sono `'adam'`, `'sgd'` and `'lbfgs'`.

- `learning_rate_init`: valore iniziale del learning rate.

- `verbose`: valore booleano che, se impostato su `True`, stampa l' output di ogni iterazione di training. Molto utile per monitorare il training.

- `random_state`: fissa il seed della randomizzazione.


Per iniziare creiamo un MLP molto basilare, alleniamolo e testiamone le performance. Come parametri utilizzeremo:

- `hidden_layer_sizes` = `(100)`

- `max_iter` = `20`

- `random_state` = `42`

In [3]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Creare MLP 

# svolgimento...
MLP = MLPClassifier(hidden_layer_sizes = (100), max_iter = 20, random_state = 42)

# Allenare MLP

# svolgimento...
MLP.fit(x_train, y_train)


# Valutare MLP

# svolgimento...
prediction = MLP.predict(x_test)


# Stampare l' accuratezza

# svolgimento...
accuracy_test = accuracy_score(y_test, prediction)
print(f"Accuracy test {accuracy_test}")

Accuracy test 0.5057




## **Esercizio 2.1: Aumentiamo i parametri del nostro modello**

Proviamo adesso ad aumentare i dettagli del nostro modello, modificando o aggiungendo i parametri sopra specificati. 

In [4]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Creare MLP con più strati e altre specifiche

# svolgimento...

MLP = MLPClassifier(hidden_layer_sizes = (100,50), max_iter = 100, random_state = 42, verbose = True, activation = 'logistic', solver = 'sgd')

MLP.fit(x_train, y_train)

prediction = MLP.predict(x_test)

accuracy_test = accuracy_score(y_test, prediction)
print(f"Accuracy test {accuracy_test}")


Iteration 1, loss = 2.29411142
Iteration 2, loss = 2.25892467
Iteration 3, loss = 2.23094289
Iteration 4, loss = 2.19986364
Iteration 5, loss = 2.16612044
Iteration 6, loss = 2.13210478
Iteration 7, loss = 2.10018741
Iteration 8, loss = 2.07131360
Iteration 9, loss = 2.04606504
Iteration 10, loss = 2.02407949
Iteration 11, loss = 2.00496407
Iteration 12, loss = 1.98816671
Iteration 13, loss = 1.97316024
Iteration 14, loss = 1.95958031
Iteration 15, loss = 1.94734572
Iteration 16, loss = 1.93607822
Iteration 17, loss = 1.92569921
Iteration 18, loss = 1.91603717
Iteration 19, loss = 1.90735138
Iteration 20, loss = 1.89893509
Iteration 21, loss = 1.89115769
Iteration 22, loss = 1.88351279
Iteration 23, loss = 1.87622130
Iteration 24, loss = 1.86914419
Iteration 25, loss = 1.86214122
Iteration 26, loss = 1.85527961
Iteration 27, loss = 1.84859691
Iteration 28, loss = 1.84205296
Iteration 29, loss = 1.83552843
Iteration 30, loss = 1.82920156
Iteration 31, loss = 1.82298501
Iteration 32, los



## **Esercizio 3: Implementare manualmente l' algoritmo di early stopping.**

L' algoritmo di early stopping ci permette di terminare anticipatamente l' allenamento di un modello nel caso in cui questo raggiunga la convergenza. Supponiamo infatti che il nostro modello raggiunga un certo livello di accuratezza e che non riesca a migliorare oltre quel livello. Questo significa che il modello, da quel momento in poi, non sta più apprendendo nuove informazioni, per cui le successive iterazioni sono superflue, ed inoltre rischiano di essere dannose, spingendo il modello verso l' overfitting. 

L' early stopping verifica ad ogni iterazione che l' accuratezza del modello sia incrementata di una certa tolleranza. Se questa tolleranza non viene superata per un certo numero di epoche, allora possiamo decidere di stoppare l' allenamento in quanto il modello ha raggiunto la convergenza.

**N.B: per applicare early stopping è necessario specificare i seguenti parametri dell' MLP:**

- `warm_start`=`True` in modo che il training proceda dallo stato attuale del modello e non dall' inizializzazione.

- `max_iter`=`1` in modo che il modello venga allenato per una sola epoca. Per l' early stopping infatti dovremo gestire manualmente il numero di iterazioni.

In [5]:
train_fraction = 0.8  
val_fraction = 0.2

num_train = int(train_fraction * x_train.shape[0])
x_train_1 = x_train[:num_train]
y_train_1 = y_train[:num_train]

x_val = x_train[num_train:]
y_val = y_train[num_train:]

print(f"Training set: {x_train_1.shape}, {y_train_1.shape}")
print(f"Validation set: {x_val.shape}, {y_val.shape}")



Training set: (40000, 3072), (40000,)
Validation set: (10000, 3072), (10000,)


In [6]:
import numpy as np
from sklearn.neural_network import MLPClassifier 
from sklearn.metrics import accuracy_score 


n_total_epochs = 100  
patience = 10         
tolerance = 1e-4      

best_val_accuracy = 0.0
epochs_without_improvement = 0



In [7]:
MLP = MLPClassifier(hidden_layer_sizes = (100,50), max_iter = 1, random_state = 42, verbose = True, warm_start=True)

for e in range(n_total_epochs):
   
    MLP.fit(x_train_1, y_train_1)

   
    val_preds = MLP.predict(x_val)
    
    val_accuracy = accuracy_score(y_val, val_preds)
    print(f"Epoch {e+1}: Validation Accuracy = {val_accuracy:.4f}")

    if val_accuracy > best_val_accuracy + tolerance:
        best_val_accuracy = val_accuracy
        epochs_without_improvement = 0
        
        best_weights = (MLP.coefs_.copy(), MLP.intercepts_.copy())
    else:
        epochs_without_improvement += 1

    if epochs_without_improvement >= patience:
        print(f"Early stopping at epoch {e+1}")
        break

MLP.coefs_, MLP.intercepts_ = best_weights

# Valutazione finale sul test set
test_preds = MLP.predict(x_test)
test_accuracy = accuracy_score(y_test, test_preds)
print(f"Test Accuracy: {test_accuracy:.4f}")

Iteration 1, loss = 1.79120314
Epoch 1: Validation Accuracy = 0.4142




Iteration 2, loss = 1.58212764
Epoch 2: Validation Accuracy = 0.4381
Iteration 3, loss = 1.46620522
Epoch 3: Validation Accuracy = 0.4542
Iteration 4, loss = 1.38285380
Epoch 4: Validation Accuracy = 0.4557
Iteration 5, loss = 1.31646689
Epoch 5: Validation Accuracy = 0.4659
Iteration 6, loss = 1.26045658
Epoch 6: Validation Accuracy = 0.4693
Iteration 7, loss = 1.21279117
Epoch 7: Validation Accuracy = 0.4786
Iteration 8, loss = 1.17302869
Epoch 8: Validation Accuracy = 0.4697
Iteration 9, loss = 1.13636410
Epoch 9: Validation Accuracy = 0.4712
Iteration 10, loss = 1.10059932
Epoch 10: Validation Accuracy = 0.4699
Iteration 11, loss = 1.06994370
Epoch 11: Validation Accuracy = 0.4715
Iteration 12, loss = 1.04334986
Epoch 12: Validation Accuracy = 0.4725
Iteration 13, loss = 1.01476875
Epoch 13: Validation Accuracy = 0.4727
Iteration 14, loss = 0.98730309
Epoch 14: Validation Accuracy = 0.4675
Iteration 15, loss = 0.96576066
Epoch 15: Validation Accuracy = 0.4658
Iteration 16, loss = 0