# Allenare una rete neurale su MNIST tramite Keras

Questa volta tocca a voi. Il task è quello di implementare una rete neurale per un noto task di classificazione della computer vision.

## Caso d'uso

Il caso d'uso di questo task deriva dal dataset **MNIST**, uno dei benchmark ad oggi più diffusi nella computer vision. In questo dataset sono presenti 70000 immagini (60000 per il training e 10000 per la validazione) in grayscale di dimensione `26x26` rappresentanti cifre da 0 a 9. 

L'**obiettivo** è quello di costruire e allenare una rete neurale che, data un'immagine, discrimini correttamente quale delle 10 cifre è rappresentata in essa.

## Modalità
Nel notebook troverete parti già completate e parti dove è presente il tag ***@TODO*** seguito da una breve descrizione. Il compito sarà quello di completare correttamente le parti dove è presente il tag.

In [None]:
import tensorflow as tf

%pylab inline

# Dataset
Anche qui, cominciamo con la definizione di alcune costanti 

In [None]:
IMG_SHAPE = (28, 28)
MAX_PIXEL_VALUE = 255
NUM_CLASSES = 10

## Data Loading

Considerando la popolarità di questo dataset, Keras fornisce già una funzione per importarlo.

In [None]:
(x_train, y_train), (x_eval, y_eval) = tf.keras.datasets.mnist.load_data()

In [None]:
figsize(20, 5)
for i in range(16):
  subplot(2, 8, i+1)
  imshow(x_train[i], cmap="binary")

## Preprocessing

### Rescaling

***@TODO***: riscalare sia `x_train` che `x_eval` in modo che assumano solo valori tra 0 e 1.

In [None]:
def normalize(dataset):
  pass
  return dataset

In [None]:
x_train, x_eval = normalize(x_train), normalize(x_eval)

# Training pipeline

##`input_fn`

In [None]:
def input_fn(features, labels, shuffle, num_epochs, batch_size):
    """Genera una funzione di input per il modello Keras.
    Args:
      features: numpy array delle features utilizzate per training o inferenza
      labels: numpy array delle etichette di ciascun esempio
      shuffle: booleano che determina se bisogna fare uno shuffle dei dati (True 
        per il training, False per la validazione)
      num_epochs: numero di epoche di training
      batch_size: batch size in fase di training
    Returns:
      tf.data.Dataset che può fornite i dati al Keras model per training o 
        inferenza
    """
    if labels is None:
        inputs = features
    else:
        inputs = (features, labels)
    dataset = tf.data.Dataset.from_tensor_slices(inputs)

    if shuffle:
        dataset = dataset.shuffle(buffer_size=len(features))

    # Utilizziamo la repeat dopo lo shuffle per evitare che epoche separate si 
    # mischino.
    dataset = dataset.repeat(num_epochs)
    dataset = dataset.batch(batch_size)
    return dataset

***@TODO***: creare un training dataset in modo che iteri per 10 epoche, con batch di 128 elementi e faccia shuffle.

***@TODO***: creare un validation dataset in modo che iteri per 10 epoche, con batch pari alla dimensione del validation set e non faccia shuffle.

In [None]:
training_dataset = None

validation_dataset = None

## `create_keras_model`


***@TODO***: creare un Keras sequential model dove

* Il primo layer fa il [flattening](https://keras.io/api/layers/reshaping_layers/flatten/) dell'input per riportarlo in forma vettoriale (la rete neurale non può prendere matrici in input). Si noti che il layer di flattening prende in input la `shape` dei dati;
* Il secondo layer è un layer da 128 unità e ha come funzione di attivazione la `relu`;
* L'ultimo layer ha un numero di unità pari al numero di classi, e non ha funzione di attivazione (layer lineare).

In [None]:
def create_keras_model(input_shape):
    """Crea un modello Keras per classificazione binaria.
    Args:
      input_shape: la tupla che rappresenta la dimensione dell'immagine
    Returns:
      Keras model
    """
    model = tf.keras.models.Sequential([
      tf.keras.layers.Flatten(input_shape=input_shape),
      tf.keras.layers.Dense(128, activation='relu'),
      tf.keras.layers.Dense(10)
    ])

    return model

In [None]:
model = create_keras_model(#TODO: assegnare la image shape corretta)

##```link_optimizer```
***TODO***: compilare il modello in modo che
* L'ottimizzatore sia [adam](https://keras.io/api/optimizers/adam/) con learning rate uguale a 0.001;
* La funzione di loss sia la [Sparse Categorical Cross-Entropy](https://www.tensorflow.org/api_docs/python/tf/keras/metrics/sparse_categorical_crossentropy) con parametro `from_logits=True`;
* L'unica metrica utilizzata sia la [Sparse Categorical Accuracy](https://www.tensorflow.org/api_docs/python/tf/keras/metrics/SparseCategoricalAccuracy).

In [None]:
def link_optimizer(model, learning_rate):
    '''
    Crea un ottimizzatore e compila il modello.
    Args:
      model: il Keras model a cui dobbiamo linkare l'ottimizzatore
      learning_rate: il learning rate dell'ottimizzatore
    Returns:
      il Keras model compilato
    '''
    pass
    return model

In [None]:
model = link_optimizer(model, #TODO: assegnare il learning rate corretto)

##`fit`

***@TODO***: allenare il modello tramite il metodo `fit`
1. per 10 epoche;
2. `steps_per_epoch` definito correttamente (ricordare che Keras conta in batch, quindi un'epoca deve essere costituita da tutti i batch che possiamo creare dal dataset); 
3. Uno step di validazione come abbiamo visto nel tutorial precedente
4. `verbose=1`.

In [None]:
history = model.fit(
    #TODO: assegnare i parametri corretti
)

# Visualizzazione dei risultati

In [None]:
from matplotlib import pyplot as plt

In [None]:
plt.title('Keras model loss')
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.ylabel('loss')
plt.xlabel('epoch')
plt.legend(['training', 'validation'], loc='upper right')
plt.show()

In [None]:
plt.title('Keras model accuracy')
plt.ylabel('accuracy')
plt.xlabel('epoch')
plt.plot(history.history['sparse_categorical_accuracy'])
plt.plot(history.history['val_sparse_categorical_accuracy'])
plt.legend(['training', 'validation'], loc='lower right')
plt.show()