# Esempio RNN base con sequenza di Fibonacci

In questo esempio si genera una sequenza di fibonacci (una lista di numeri) lunga n, si divide in finestre di lunghezza fissa e si usa la RNN per prevedere il prossimo numero della sequenza a partire dalla finestra data.

 Generato da ProfAI - https://prof.profession.ai/

In [18]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, SimpleRNN, InputLayer
from keras.backend import clear_session

In [2]:
# Generare la sequenza di Fibonacci
def fibonacci_sequence(n):
    seq = [0, 1]
    for i in range(2, n):
        seq.append(seq[i-1] + seq[i-2])
    return seq

In [7]:
# Preparare i dati
sequence_length = 100
sequence = fibonacci_sequence(sequence_length)

X = []
y = []
window_size = 5

for i in range(len(sequence) - window_size):
    X.append(sequence[i:i+window_size]) #finestra della sequenza
    y.append(sequence[i+window_size]) #prossimo numero dopo finestra presa

X = np.array(X)
y = np.array(y)


In [8]:
print(X.shape)
print(y.shape)

(95, 5)
(95,)


In [9]:
X[0]

array([0, 1, 1, 2, 3], dtype=object)

Arrivati qui, X è la matrice di input, che contiene le sequenze. 
Cioè ogni riga è una sequenza lunga window campioni.

Ad es. se X ha forma (95,5) significa che è composta da 95 sequenze (cioè 95 osservazioni/record) ognunga lunga 5 campioni. 

y è il vettore di ouput ed ha una sola dimensione, pari al numero di osservazioni in X (in modo classico). Qui però y non contiene la classe corrispondente alla sequenza, ma il suo valore numerico (qui il task è più di regressione che di classificazione)

In [10]:
# Rimodellare i dati per l'input dell'RNN
X = X.reshape((X.shape[0], X.shape[1], 1))
print(X.shape)

(95, 5, 1)


In [11]:
X[0]

array([[0],
       [1],
       [1],
       [2],
       [3]], dtype=object)

Bisogna fare reshape per quanto si aspetta la RNN in input.
Dalla doc di keras:
> sequence: A 3D tensor, with shape [batch, timesteps, feature].

Quindi l'input deve avere per forza 3 dimensioni (altrimenti c'è errore al momento del fit/costruzione modello):
1. La prima dimensione si riferisce al batch (numero di osservazioni);
1. La seconda dimensione si riferisce ai campioni temporali (lunghezza sequenza);
1. La terza dimensione sono le features associate ad ogni record.

Nel caso più semplice (es. con segnali numerici, come in questo esempio), si ha una sola feature, che è il valore numerico a quell'istante temporale, quindi la terza dimensione vale 1.

NB: in questo caso particolare la terza dimensione è superflua di fatto, poichè posso mettere il valore del segnale già alla seconda dimensione (essendo tale valore uno scalare); però la RNN è utilizzabile anche con segnali "multidimensionali", es con il testo, dove ogni parola (che si può pensare come un campione temporale vero e proprio) viene mappata su N dimensioni, cioè ha N features e in quel caso il tensore prodotto da embedding avrà le tre dimensioni diverse da 1.

### Modello

In [32]:
clear_session()
# Creare il modello RNN
model = Sequential()
# NB: window_size vale 5
model.add(InputLayer(shape=(window_size,1)))
# model.add(SimpleRNN(10, input_shape=(window_size, 1)))
model.add(SimpleRNN(2, activation='tanh'))
model.add(Dense(1, activation='linear'))

model.summary()

In [35]:
# ((feature + 1)* num_neuroni)    *     num_neuroni
# | per singolo istante temporale |  * | ricorrente|
#si moltiplica alla fine per il numero di neuroni poichè nella formula
#generale h_t dipende da h_t-1 che ha stessa dimensione di h_t, cioè
# numero di neuroni.
print((1+1)*10*5)
print((1+1)*1*1)

100
2


In [22]:
model.compile(optimizer='adam', 
              loss='mean_squared_error')

# Addestrare il modello
model.fit(X, y, epochs=100)

ValueError: Failed to convert a NumPy array to a Tensor (Unsupported object type int).

In [None]:
# Prevedere il prossimo numero nella sequenza
test_input = np.array([sequence[-window_size:]])
test_input = test_input.reshape((1, window_size, 1))
predicted_number = model.predict(test_input, verbose=0)

print(f"Il prossimo numero previsto nella sequenza è: {predicted_number[0][0]}")

