# **Reti Neurali** 

## **Esercizio 1: Download e pre-processamento dei dati.**

Scaricare e pre-processare i dati per il successivo addestramento del modello. 

Il dataset che utilizzeremo sarà CIFAR10, scaricabile dalla libreria `tensorflow.keras.datasets`

In [1]:
!pip install tensorflow



In [2]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10

# Download dataset
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

y_train = y_train.ravel()
y_test = y_test.ravel()

print(x_train.shape)
print(y_train.shape)
print(x_test.shape)
print(y_test.shape)

2025-05-27 06:53:40.966499: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:477] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1748328821.252358      35 cuda_dnn.cc:8310] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1748328821.334349      35 cuda_blas.cc:1418] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered


Downloading data from https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz
[1m170498071/170498071[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 0us/step
(50000, 32, 32, 3)
(50000,)


In [6]:
from sklearn.preprocessing import StandardScaler

# Pre-processamento dei dati

x_train_flat = x_train.reshape((x_train.shape[0], -1))
x_test_flat = x_test.reshape((x_test.shape[0], -1))

scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train_flat)
x_test_scaled = scaler.fit_transform(x_test_flat)

print("train", x_train_scaled.shape)
print("test", x_test_scaled.shape)

train (50000, 3072)
test (10000, 3072)


## **Esercizio 2: Creare modello MLP**

Per creare il modello MLP utilizziamo l' oggetto `MLPClassifier` dal modulo `sklearn.neural_networks`. Questo è un oggetto molto complesso che prevede la possibilità di specificare tanti parametri, permettendoci una personalizzazione molto dettagliata. Vediamo di seguito gli argomenti principali:

- `hidden_layer_sizes`: rappresenta la struttura dell' MLP, sotto forma di una tupla. La tupla deve essere composta da numeri interi, ogni numero indica il numero di neuroni presenti nel rispettivo layer.

Esempio: 

`hidden_layer_sizes` = `(100)`

creerà un solo layer con 100 neuroni

`hidden_layer_sizes` = `(100, 50)`

creerà due layer, il primo con 100 neuroni, il secondo invece con 50.

- `max_iter`: massimo numero di iterazioni per raggiungere la convergenza. 

- `activation`: indica quale funzione di attivazione utilizzare, valori possibili sono `'relu'`, `'logistic'`, `'tanh'` and `'identity'`.

- `solver`: indica quale algoritmo di ottimizzazione utilizzare, valori possibili sono `'adam'`, `'sgd'` and `'lbfgs'`.

- `learning_rate_init`: valore iniziale del learning rate.

- `verbose`: valore booleano che, se impostato su `True`, stampa l' output di ogni iterazione di training. Molto utile per monitorare il training.

- `random_state`: fissa il seed della randomizzazione.


Per iniziare creiamo un MLP molto basilare, alleniamolo e testiamone le performance. Come parametri utilizzeremo:

- `hidden_layer_sizes` = `(100)`

- `max_iter` = `20`

- `random_state` = `42`

In [9]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Creare MLP 

mlp = MLPClassifier(
    hidden_layer_sizes=(100),
    max_iter=20, 
    activation = 'relu' ,
    random_state=42 ,
    )


# Allenare MLP

mlp.fit(x_train_scaled, y_train)


# Valutare MLP
accuracy = accuracy_score(y_test, y_pred)
print("Accuratezza:", accuracy)



# Stampare l' accuratezza

print("Accuratezza:", accuracy)

Iteration 1, loss = 1.84922213
Iteration 2, loss = 1.52410225
Iteration 3, loss = 1.40419682
Iteration 4, loss = 1.33204438
Iteration 5, loss = 1.27721092
Iteration 6, loss = 1.24043705
Iteration 7, loss = 1.20071293
Iteration 8, loss = 1.16975351
Iteration 9, loss = 1.14043570
Iteration 10, loss = 1.11965949
Iteration 11, loss = 1.09338560
Iteration 12, loss = 1.07412903
Iteration 13, loss = 1.05735050
Iteration 14, loss = 1.03938088
Iteration 15, loss = 1.02135505
Iteration 16, loss = 0.99397657
Iteration 17, loss = 0.97903139
Iteration 18, loss = 0.96303503
Iteration 19, loss = 0.95288051
Iteration 20, loss = 0.92579253




## **Esercizio 2.1: Aumentiamo i parametri del nostro modello**

Proviamo adesso ad aumentare i dettagli del nostro modello, modificando o aggiungendo i parametri sopra specificati. 

In [None]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Creare MLP con più strati e altre specifiche

mlp = MLPClassifier(
    hidden_layer_sizes=(100),
    max_iter=20, 
    activation = 'relu' ,
    solver = 'adam' , 
    learning_rate_init = 0.001 , 
    verbose = True , 
    random_state=42 ,
    )


# Allenare MLP

mlp.fit(x_train_scaled, y_train)


# Valutare MLP
accuracy = accuracy_score(y_test, y_pred)
print("Accuratezza:", accuracy)



# Stampare l' accuratezza

print("Accuratezza:", accuracy)


## **Esercizio 3: Implementare manualmente l' algoritmo di early stopping.**

L' algoritmo di early stopping ci permette di terminare anticipatamente l' allenamento di un modello nel caso in cui questo raggiunga la convergenza. Supponiamo infatti che il nostro modello raggiunga un certo livello di accuratezza e che non riesca a migliorare oltre quel livello. Questo significa che il modello, da quel momento in poi, non sta più apprendendo nuove informazioni, per cui le successive iterazioni sono superflue, ed inoltre rischiano di essere dannose, spingendo il modello verso l' overfitting. 

L' early stopping verifica ad ogni iterazione che l' accuratezza del modello sia incrementata di una certa tolleranza. Se questa tolleranza non viene superata per un certo numero di epoche, allora possiamo decidere di stoppare l' allenamento in quanto il modello ha raggiunto la convergenza.

**N.B: per applicare early stopping è necessario specificare i seguenti parametri dell' MLP:**

- `warm_start`=`True` in modo che il training proceda dallo stato attuale del modello e non dall' inizializzazione.

- `max_iter`=`1` in modo che il modello venga allenato per una sola epoca. Per l' early stopping infatti dovremo gestire manualmente il numero di iterazioni.

In [16]:
import numpy as np
from sklearn.neural_network import MLPClassifier 
from sklearn.metrics import accuracy_score 
from sklearn.model_selection import train_test_split

x_train_partial, x_val, y_train_partial, y_val = train_test_split(x_train_scaled, y_train, test_size = 0.2, random_state = 42)
n_total_epochs = 100  
patience = 10         
tolerance = 1e-4      

best_test_accuracy = 0.0
epochs_without_improvement = 0

mlp = MLPClassifier(
    hidden_layer_sizes=(100),
    max_iter=1,
    warm_start=True,
    random_state=42
)
val_accuracies = []

for epoch in range(n_total_epochs):
    mlp.fit(x_train_partial, y_train_partial)
    
    y_val_pred = mlp.predict(x_val)
    val_accuracy = accuracy_score(y_val, y_val_pred)
    val_accuracies.append(val_accuracy)

    print(f"Epoca {epoch + 1}, Accuratezza validazione: {val_accuracy:.4f}")

    if val_accuracy > best_test_accuracy + tolerance:
        best_test_accuracy = val_accuracy
        epochs_without_improvement = 0
    else:
        epochs_without_improvement += 1

    if epochs_without_improvement >= patience:
        print(f"Early stopping attivato dopo {epoch + 1} epoche. Migliore accuratezza validazione: {best_test_accuracy:.4f}")
        break

y_test_pred = mlp.predict(x_test_scaled)
test_accuracy= accuracy_score(y_test, y_test_pred)
print(f"Accuratezza finale sul test set: {test_accuracy:.4f}")





Epoca 1, Accuratezza validazione: 0.4290
Epoca 2, Accuratezza validazione: 0.4517
Epoca 3, Accuratezza validazione: 0.4555
Epoca 4, Accuratezza validazione: 0.4604
Epoca 5, Accuratezza validazione: 0.4681
Epoca 6, Accuratezza validazione: 0.4732
Epoca 7, Accuratezza validazione: 0.4734
Epoca 8, Accuratezza validazione: 0.4735
Epoca 9, Accuratezza validazione: 0.4774
Epoca 10, Accuratezza validazione: 0.4781
Epoca 11, Accuratezza validazione: 0.4783
Epoca 12, Accuratezza validazione: 0.4772
Epoca 13, Accuratezza validazione: 0.4781
Epoca 14, Accuratezza validazione: 0.4757
Epoca 15, Accuratezza validazione: 0.4786
Epoca 16, Accuratezza validazione: 0.4766
Epoca 17, Accuratezza validazione: 0.4743
Epoca 18, Accuratezza validazione: 0.4742
Epoca 19, Accuratezza validazione: 0.4696
Epoca 20, Accuratezza validazione: 0.4685
Epoca 21, Accuratezza validazione: 0.4672
Epoca 22, Accuratezza validazione: 0.4659
Epoca 23, Accuratezza validazione: 0.4621
Epoca 24, Accuratezza validazione: 0.4620
E