
L'obiettivo del progetto è apprendere mediante una rete neurale la trasformazione da punti del piano espressi in coordinate polari ad una rappresentazione basata su di una griglia discreta di dimensione 10x10, dove la cella della griglia ha valore 1 se contiene il punto, e 0 altrimenti.

Il dataset supervisionato è fornito in questo notebook nella forma di una generatore. Il generatore deve essere considerato come una "scatola nera" il cui comportamento deve essere appreso. 

Dovete progettare una rete neurale in grado di raggiungere una accuratezza del 95%. Questa è una condizione necessaria per superare l'esame, ma l'accuratezza non influisce in altro modo sulla valutazione.  

I modelli che raggiungono l'accuratezza attesa saranno invece valutati in modo inversamente proporzionale al numero dei loro parametri: **più il modello è piccolo, meglio è.**


**Attenzione**: Qualunque soluzione che tragga vantaggio, diretto o indiretto, da meta-conoscenza relativa al generatore sarà automaticamente bocciato.


Veniamo al generatore. Questo restituisce delle triple della forma
((theta,rho),out) dove (theta,rho) sono le coordinate polari di un punto nel primo quadrante del piano, e out è una mappa 10x10 con "1" in correspondenza alla cella che contiene il punto, e "0" altrimenti.

Settando  flat=True, la mappa 10x10 viene appiattita ad un vettore di dimensione 100. Potete utilizzare questa variante, se preferite. Nessuna altra modifica del generatore è ammessa. 

Creiamo una istanza del generatore con una griglia di dimensione 3x4

... e osserviamo qualche esempio

In [1]:
import keras
from keras import layers
from keras import activations
import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Reshape, concatenate
from tensorflow.keras.models import Model
from sklearn.model_selection import train_test_split

def polar_generator(batchsize,grid=(10,10),noise=.002,flat=False):
  while True:
    x = np.random.rand(batchsize)
    y = np.random.rand(batchsize)
    out = np.zeros((batchsize,grid[0],grid[1]))
    xc = (x*grid[0]).astype(int)
    yc = (y*grid[1]).astype(int)
    for b in range(batchsize):
      out[b,xc[b],yc[b]] = 1
    #compute rho and theta and add some noise
    rho = np.sqrt(x**2+y**2) + np.random.normal(scale=noise)
    theta = np.arctan(y/np.maximum(x,.00001)) + np.random.normal(scale=noise)
    if flat:
      out = np.reshape(out,(batchsize,grid[0]*grid[1]))
    yield ((theta,rho),out)

n_train = 4000000
n_test = 20000
batch_size = 2048

g1,g2 = 10,10
gen = polar_generator(n_train+n_test,grid=(g1,g2),noise=0.002,flat=True)
# (theta,rho),y = next(gen)
(theta,rho),y = next(gen)

x=np.array([i for i in zip(theta,rho)])

# def xy(i):
#   (theta,rho),y = i
#   x=np.array([i for i in zip(theta,rho)])
#   return (x,y)

# gcd = np.gcd(n_train, n_test)
# gen = pol.ipynbar_generator(gcd,grid=(size,size),noise=0.02)

# x_train, y_train = xy(next(gen))
# for i in range(int(n_train/gcd)-1):
#   x,y = xy(next(gen))
#   x_train = np.concatenate((x, x_train), axis=0)
#   y_train = np.concatenate((y, y_train), axis=0)

# x_test, y_test = xy(next(gen))
# for i in range(int(n_train/gcd)-1):
#   x,y = xy(next(gen))
#   x_test = np.concatenate((x, x_test), axis=0)
#   y_test = np.concatenate((y, y_test), axis=0)

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=n_test/(n_train+n_test), shuffle=True, random_state=1)


def discretized_accuracy(true_maps: tf.Tensor, my_maps: tf.Tensor) -> float:
  equals = tf.equal(tf.argmax(true_maps, axis=1), tf.argmax(my_maps, axis=1))
  return tf.cast(tf.math.count_nonzero(equals), tf.float64) / tf.cast(len(true_maps), tf.float64)

2023-01-11 17:46:20.764659: I tensorflow/core/platform/cpu_feature_guard.cc:193] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.


In [2]:
network = keras.Sequential([
layers.Flatten(),
# layers.Dense(20, activation=keras.activations.relu),
# layers.Dense(20, activation=keras.activations.tanh),
# layers.Dropout(0.1), # Spegni il 10% dei neuroni a caso
layers.Dense(6, activation=keras.activations.softsign),
layers.Dense(12, activation=keras.activations.swish),
# layers.BatchNormalization(),
# layers.Dropout(0.5), # Spegni il 10% dei neuroni a caso
layers.Dense(6, activation=keras.activations.relu),
layers.Dense(6, activation=keras.activations.swish),
# layers.Dropout(0.5), # Spegni il 10% dei neuroni a caso
# layers.LayerNormalization(),
# layers.BatchNormalization(),
layers.Dense(100, activation=activations.softmax)
])

# Prima di poter usare il modello dobbiamo dire a Keras la dimensione dei nostri input
# "None" vuol dire che il numero è ignoto/può cambiare (perché quante immagini alla volta g# può cambiare)
network.build((None, 2))
network.summary()

network.compile(
optimizer=keras.optimizers.Adam(learning_rate=1e-3), # Impostiamo SGD come ottimizzatore
loss=keras.losses.CategoricalCrossentropy(),
# loss=customLoss,
metrics=['accuracy', discretized_accuracy]
)


Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 2)                 0         
                                                                 
 dense (Dense)               (None, 6)                 18        
                                                                 
 dense_1 (Dense)             (None, 12)                84        
                                                                 
 dense_2 (Dense)             (None, 6)                 78        
                                                                 
 dense_3 (Dense)             (None, 6)                 42        
                                                                 
 dense_4 (Dense)             (None, 100)               700       
                                                                 
Total params: 922
Trainable params: 922
Non-trainable pa

2023-01-11 17:46:28.675499: I tensorflow/core/platform/cpu_feature_guard.cc:193] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2023-01-11 17:46:28.676996: I tensorflow/core/common_runtime/process_util.cc:146] Creating new thread pool with default inter op setting: 2. Tune using inter_op_parallelism_threads for best performance.


In [3]:
network = keras.models.load_model("mymodel")

ValueError: ignored

In [None]:
history = network.fit(
x=x_train,
y=y_train,
epochs=15, # Addestriamo per 100 epoche
batch_size=batch_size, # Usiamo una batch size di 128
validation_data=(x_test, y_test),
callbacks=[keras.callbacks.EarlyStopping(monitor='val_loss', patience=5)]
)

Epoch 1/15
Epoch 2/15
 110/1954 [>.............................] - ETA: 35s - loss: 0.0671 - accuracy: 0.9745 - discretized_accuracy: 0.9745

In [12]:
score, _, acc  = network.evaluate(x_test, y_test,
                            batch_size=batch_size)
print('Test score:', score)
print('Accuracy: {:.1f}%'.format(acc*100))

Test score: 0.06646084785461426
Accuracy: 97.6%


In [13]:
network.save("mymodel_2048")
network.summary()

INFO:tensorflow:Assets written to: mymodel_2048/assets
Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 2)                 0         
                                                                 
 dense (Dense)               (None, 6)                 18        
                                                                 
 dense_1 (Dense)             (None, 12)                84        
                                                                 
 dense_2 (Dense)             (None, 6)                 78        
                                                                 
 dense_3 (Dense)             (None, 6)                 42        
                                                                 
 dense_4 (Dense)             (None, 100)               700       
                                                                 
T

In [17]:
gen = polar_generator(20000,grid=(g1,g2),noise=0.002,flat=True)

accs = 0.0
iters = 100
for x in range(iters):
  (theta,rho),y = next(gen)
  x=np.array([i for i in zip(theta,rho)])

  score, _, acc = network.evaluate(x, y, batch_size=batch_size)
  accs += acc

print('Accuracy: {:.1f}%'.format(accs/iters*100))

Accuracy: 94.9%


Utile esercizio: aggiungete rumore al generatore e verificate l'effetto sulla
"ground truth".

# Cosa consegnare

Ai fini del progetto dovete lavorare con la **griglia di default di dimensione 10x10, e con il rumore di default .002**

il generatore deve essere trattato come una scatola nera: non modificatelo e non sfruttate la sua semantica, che si suppone ignota. Potete lavorare in modlaità "flat", se preferite.

Dovete:

1.   definire una funzione per il calcolo della accuratezza (potete prendere ispirazione dal cocice della cella precedente) 
2.   definire una rete neurale che prende in input theta e rho e restituisce out
3.  misurare l'accuratezza della rete, che deve essere maggiore o uguale del 95%; l'accuratezza deve essere misurata su almeno 20000 dati
4. perfezionare il modello cercando di diminuire il più possibile il numero dei parametri mantenendo una accuratezza superiore al 95%. Solo la vostra rete migliore deve essere consegnata.

Dovete consegnare un UNICO notebook eseguibile su colab, che contenga il codice della rete, il suo sommario con il numero dei parametri, la storia di training, il codice per il calcolo della accuratezza e la sua valutazione sulla vostra rete.

**N.B.** L'accuratezza deve essere superiore o uguale a 95%, ma non influisce in altro modo sulla valutazione. Il vostro punteggio dipenderà unicamente dal numero dei parametri: più è piccolo e più la vostra vaalutazione sarà elevata.  

#Buon lavoro!



