
L'obiettivo del progetto è apprendere mediante una rete neurale la trasformazione da punti del piano espressi in coordinate polari ad una rappresentazione basata su di una griglia discreta di dimensione 10x10, dove la cella della griglia ha valore 1 se contiene il punto, e 0 altrimenti.

Il dataset supervisionato è fornito in questo notebook nella forma di una generatore. Il generatore deve essere considerato come una "scatola nera" il cui comportamento deve essere appreso. 

Dovete progettare una rete neurale in grado di raggiungere una accuratezza del 95%. Questa è una condizione necessaria per superare l'esame, ma l'accuratezza non influisce in altro modo sulla valutazione.  

I modelli che raggiungono l'accuratezza attesa saranno invece valutati in modo inversamente proporzionale al numero dei loro parametri: **più il modello è piccolo, meglio è.**


**Attenzione**: Qualunque soluzione che tragga vantaggio, diretto o indiretto, da meta-conoscenza relativa al generatore sarà automaticamente bocciato.


In [1]:
import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Reshape, concatenate
from tensorflow.keras.models import Model

2023-01-10 15:04:18.176927: I tensorflow/core/platform/cpu_feature_guard.cc:193] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  SSE3 SSE4.1 SSE4.2 AVX AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.


Veniamo al generatore. Questo restituisce delle triple della forma
((theta,rho),out) dove (theta,rho) sono le coordinate polari di un punto nel primo quadrante del piano, e out è una mappa 10x10 con "1" in correspondenza alla cella che contiene il punto, e "0" altrimenti.

Settando  flat=True, la mappa 10x10 viene appiattita ad un vettore di dimensione 100. Potete utilizzare questa variante, se preferite. Nessuna altra modifica del generatore è ammessa. 

In [2]:
def polar_generator(batchsize,grid=(10,10),noise=.002,flat=False):
  while True:
    x = np.random.rand(batchsize)
    y = np.random.rand(batchsize)
    out = np.zeros((batchsize,grid[0],grid[1]))
    xc = (x*grid[0]).astype(int)
    yc = (y*grid[1]).astype(int)
    for b in range(batchsize):
      out[b,xc[b],yc[b]] = 1
    #compute rho and theta and add some noise
    rho = np.sqrt(x**2+y**2) + np.random.normal(scale=noise)
    theta = np.arctan(y/np.maximum(x,.00001)) + np.random.normal(scale=noise)
    if flat:
      out = np.reshape(out,(batchsize,grid[0]*grid[1]))
    yield ((theta,rho),out)

Creiamo una istanza del generatore con una griglia di dimensione 3x4

In [3]:
g1,g2 = 3,4
gen = polar_generator(1,grid=(g1,g2),noise=0.0)

... e osserviamo qualche esempio

In [5]:
# (theta,rho),maps = next(gen)
# for i,map in enumerate(maps):
#   #let us compute the cartesian coordinates
#   x = np.cos(theta[i])*rho[i]
#   y = np.sin(theta[i])*rho[i]
#   print("x coordinate (row): {}".format(int(x*g1)))
#   print("y coordinate (col): {}".format(int(y*g2)))
#   print("map:")
#   print(np.reshape(map,(g1,g2)))

x coordinate (row): 1
y coordinate (col): 3
map:
[[0. 0. 0. 0.]
 [0. 0. 0. 1.]
 [0. 0. 0. 0.]]


Utile esercizio: aggiungete rumore al generatore e verificate l'effetto sulla
"ground truth".

# Cosa consegnare

Ai fini del progetto dovete lavorare con la **griglia di default di dimensione 10x10, e con il rumore di default .002**

il generatore deve essere trattato come una scatola nera: non modificatelo e non sfruttate la sua semantica, che si suppone ignota. Potete lavorare in modlaità "flat", se preferite.

Dovete:

1.   definire una funzione per il calcolo della accuratezza (potete prendere ispirazione dal cocice della cella precedente) 
2.   definire una rete neurale che prende in input theta e rho e restituisce out
3.  misurare l'accuratezza della rete, che deve essere maggiore o uguale del 95%; l'accuratezza deve essere misurata su almeno 20000 dati
4. perfezionare il modello cercando di diminuire il più possibile il numero dei parametri mantenendo una accuratezza superiore al 95%. Solo la vostra rete migliore deve essere consegnata.

Dovete consegnare un UNICO notebook eseguibile su colab, che contenga il codice della rete, il suo sommario con il numero dei parametri, la storia di training, il codice per il calcolo della accuratezza e la sua valutazione sulla vostra rete.

**N.B.** L'accuratezza deve essere superiore o uguale a 95%, ma non influisce in altro modo sulla valutazione. Il vostro punteggio dipenderà unicamente dal numero dei parametri: più è piccolo e più la vostra vaalutazione sarà elevata.  

#Buon lavoro!





In [4]:
import keras
import numpy as np
from keras import layers
from keras import activations
from keras import losses
from sklearn.model_selection import train_test_split
import keras.backend as K

size = 10

In [5]:
# def map_map(map: np.ndarray) -> np.ndarray:
#   out = np.zeros(size * 2)
#   point = np.argwhere(map==1)[0]
#   out[point[0]] = 1
#   out[size + point[1]] = 1
#   return out

def map_map(map: np.ndarray) -> np.ndarray:
  out = np.zeros(size * 2)
  point = np.argwhere(map==1)[0]
  return point

In [16]:
batch_size = 256

In [17]:
n_train = 200000
n_test = 20000

def xy(i):
  (theta,rho),y = i
  res = map(map_map, y)
  y = np.array(list(res))
  x=np.array([i for i in zip(theta,rho)])
  return (x,y)

gcd = np.gcd(n_train, n_test)
gen = polar_generator(gcd,grid=(size,size),noise=0.02)

x_train, y_train = xy(next(gen))
for i in range(int(n_train/gcd)-1):
  x,y = xy(next(gen))
  x_trian = np.concatenate((x, x_train), axis=0)
  y_trian = np.concatenate((y, y_train), axis=0)

x_test, y_test = xy(next(gen))
for i in range(int(n_train/gcd)-1):
  x,y = xy(next(gen))
  x_trian = np.concatenate((x, x_test), axis=0)
  y_trian = np.concatenate((y, y_test), axis=0)

# x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=n_test/(n_train+n_test), shuffle=True, random_state=1)

In [18]:
def loss_fn(y_true, y_pred):
  point = np.array(y_true).argwhere(x==1)[1]

  x = K.mult(K.cos(y_true[:1]), y_true[:2])
  #x = np.cos(theta[i])*rho[i]
  #y = np.sin(theta[i])*rho[1,164
def my_categorical_accuracy(y_true: tf.Tensor, y_pred: tf.Tensor) -> float:
  equal = tf.equal(tf.math.argmax(y_true, 1), tf.math.argmax(y_pred , 1))
  n_correct = tf.reduce_sum(tf.cast(equal, tf.int32))
  return tf.cast(n_correct/len(y_true), tf.keras.backend.floatx())

In [19]:
model = keras.Sequential([
    layers.Flatten(),
    layers.Dense(12, activation=activations.relu),
    layers.Dense(6, activation=activations.relu),
    layers.Dense(3, activation=activations.relu),

    layers.Dense(2, activation=activations.relu)
])
model.build((None, 2))
model.summary()
model.compile(
    optimizer=keras.optimizers.SGD(learning_rate=5e-4), #Adam(learning_rate=1e-3),
    loss=losses.MeanSquaredError(),
    metrics=['accuracy']
)

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten_3 (Flatten)         (None, 2)                 0         
                                                                 
 dense_12 (Dense)            (None, 12)                36        
                                                                 
 dense_13 (Dense)            (None, 6)                 78        
                                                                 
 dense_14 (Dense)            (None, 3)                 21        
                                                                 
 dense_15 (Dense)            (None, 2)                 8         
                                                                 
Total params: 143
Trainable params: 143
Non-trainable params: 0
_________________________________________________________________


In [20]:
history = model.fit(
    x_train,
    y_train,
    epochs=300,# 300,
    batch_size=batch_size
)

Epoch 1/300
Epoch 2/300
Epoch 3/300
Epoch 4/300
Epoch 5/300
Epoch 6/300
Epoch 7/300
Epoch 8/300
Epoch 9/300
Epoch 10/300
Epoch 11/300
Epoch 12/300
Epoch 13/300
Epoch 14/300
Epoch 15/300
Epoch 16/300
Epoch 17/300
Epoch 18/300
Epoch 19/300
Epoch 20/300
Epoch 21/300
Epoch 22/300
Epoch 23/300
Epoch 24/300
Epoch 25/300
Epoch 26/300
Epoch 27/300
Epoch 28/300
Epoch 29/300
Epoch 30/300
Epoch 31/300
Epoch 32/300
Epoch 33/300
Epoch 34/300
Epoch 35/300
Epoch 36/300
Epoch 37/300
Epoch 38/300
Epoch 39/300
Epoch 40/300
Epoch 41/300
Epoch 42/300
Epoch 43/300
Epoch 44/300
Epoch 45/300
Epoch 46/300
Epoch 47/300
Epoch 48/300
Epoch 49/300
Epoch 50/300
Epoch 51/300
Epoch 52/300
Epoch 53/300
Epoch 54/300
Epoch 55/300
Epoch 56/300
Epoch 57/300
Epoch 58/300
Epoch 59/300
Epoch 60/300
Epoch 61/300
Epoch 62/300
Epoch 63/300
Epoch 64/300
Epoch 65/300
Epoch 66/300
Epoch 67/300
Epoch 68/300
Epoch 69/300
Epoch 70/300
Epoch 71/300
Epoch 72/300
Epoch 73/300
Epoch 74/300
Epoch 75/300
Epoch 76/300
Epoch 77/300
Epoch 78

In [21]:
score, acc = model.evaluate(x_test, y_test,
                            batch_size=batch_size)
print(x_test.shape, y_test.shape)
print('Test score:', score)
print('Accuracy: {:.1f}%'.format(acc*100))

accs = []
for x in range(50):
  (theta,rho),y = next(gen)
  x=np.array([i for i in zip(theta,rho)])
  y = np.array(list(map(map_map, y)))

  score, acc = model.evaluate(x, y, batch_size=batch_size)
  accs.append(acc)


acc = np.mean(accs)
print('Accuracy: {:.1f}%'.format(acc*100))

(20000, 2) (20000, 2)
Test score: 0.20565004646778107
Accuracy: 96.5%
Accuracy: 96.3%


In [25]:
x,y = xy(next(gen))
y_pred = model.predict(x[:1])
print(y[0], y_pred)

[4 4] [[3.7242045 4.4185762]]
