<a href="https://colab.research.google.com/github/ProfAI/tf00/blob/master/1%20-%20Le%20Basi%20di%20Tensorflow/classe_di_matematica_profonda.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Chi passerà matematica V2 ?
In questo notebook proveremo a migliorare il modello per classificare se uno studente verrà rimandato in matematica, con più informazioni e utilizzandole per addestrare una **Rete Neurale Profonda (DNN - Deep Neural Network)**.

## Importiamo i moduli

In [0]:
import numpy as np
import tensorflow as tf
from tensorflow import keras
import pandas as pd
from sklearn.preprocessing import OneHotEncoder

## Creiamo il Dataset
Importiamo il nuovo dataset, direttamente dal file csv, all'interno di un DataFrame.

In [0]:
csv_url = "https://raw.githubusercontent.com/ProfAI/tf00/master/datasets/math_class/math_class_deep.csv"
df = pd.read_csv(csv_url)
df.head()

Unnamed: 0,student_id,sex,age,traveltime,studytime,failures,Medu,Fedu,paid,higher,internet,romantic,freetime,promoted
0,0,F,18,2,2,0,4,4,no,yes,no,no,3,0
1,1,F,17,1,2,0,1,1,no,yes,yes,no,3,0
2,2,F,15,1,2,3,1,1,yes,yes,yes,no,3,1
3,3,F,15,1,3,0,4,2,yes,yes,yes,yes,2,1
4,4,F,16,1,2,0,3,3,yes,yes,no,no,3,1


Questa volta abbiamo molte più features:
* **student_id**: codice identificativo dello studente.
* **sex**: sesso dello studente (F=Femmina, M=Maschio).
* **age**: età dello studente.
* **traveltime**: ore di viaggio per andare e tornare da scuola.
* **studytime**: ore di studio al giorno.
* **failures**: numero di volte che lo studene è stato rimandato in matematica in passato.
* **Medu e Fedu**: rispettivamente grado di istruzione della madre e del padre (0=nessuna, 1=scuola elementare, 2=licenza media, 3=diploma, 4=laurea).
* **paid**: indica se lo studente prende ripetizioni a pagamento.
* **higher**: indica se lo studente intende andare all'università.
* **internet**: indica se lo studente ha accesso ad internet a casa.
* **romatic**: indica se lo studente è in una relazione amorosa.
* **freetime**: numero di ore libere a settimana.
* **absences**: ore di assenze nella classe di matematica per il quadrimestre corrente.
* **promoted**: variabile booleana (True=1,False=0) che indica se lo studente è stato promosso.

Alcune di queste informazioni sono in formato testuale e ciò non va bene dato che un computer comprende solo numeri. Utilizziamo il *One Hot Encoding* per codificare queste features utilizzando delle variabili dummies.

In [0]:
to_encode = ["sex", "paid", "higher", "internet", "romantic"]
df[to_encode] = pd.get_dummies(df[to_encode], drop_first=True)
df.head()

Unnamed: 0,student_id,sex,age,traveltime,studytime,failures,Medu,Fedu,paid,higher,internet,romantic,freetime,promoted
0,0,0,18,2,2,0,4,4,0,1,0,0,3,0
1,1,0,17,1,2,0,1,1,0,1,1,0,3,0
2,2,0,15,1,2,3,1,1,1,1,1,0,3,1
3,3,0,15,1,3,0,4,2,1,1,1,1,2,1
4,4,0,16,1,2,0,3,3,1,1,0,0,3,1


Adesso, esattamente come prima, creiamo gli array con features e target.

In [0]:
X = df.drop(["student_id","promoted"], axis=1).values
y = df["promoted"].values

## Creiamo il Modello 
Creiamo la nostra prima Rete Neurale Profonda, per farlo basta aggiungere più strati all'oggett Sequential:
* Il primo strato è lo strato di input.
* L'ultimo strato è lo strato di output.
* Tutti gli strati intermedi sono gli strati nascosti del modello.

Anche per gli strati nascosti dobbiamo specificare una funzione di attivazione, la più
 comune è la *ReLu*, parleremo approfonditamente delle funzioni di attivazione nella prossima sezione.

In [0]:
model = keras.models.Sequential([
    keras.layers.Dense(128, input_shape=[X.shape[1]], activation="relu"),
    keras.layers.Dense(128, activation="relu"),
    keras.layers.Dense(1, activation="sigmoid"),
])

Utilizzando il metodo *summary* possiamo vedere quanti sono i parametri (pesi e bias) del modello e quanti di questi il modello deve ottimizzare durante la fase di apprendimento.

In [0]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_6 (Dense)              (None, 128)               1664      
_________________________________________________________________
dense_7 (Dense)              (None, 128)               16512     
_________________________________________________________________
dense_8 (Dense)              (None, 1)                 129       
Total params: 18,305
Trainable params: 18,305
Non-trainable params: 0
_________________________________________________________________


Dato il numero di strati nascosti che abbiamo inserito, e il numero di neuroni (o nodi) per strato, il nostro modello dovrà apprendere un numero totale di 18.305 parametri. Configuriamo la fase di addestramento, questa volta usiamo **Adam** come algoritmo di ottimizzazione, parleremo approfonditamente degli algoritmi di ottimizzazione nella sezione apposita.

In [0]:
model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["accuracy"])

Ora avviamo l'addestramento per 200 epoche.

In [0]:
model.fit(X, y, epochs=200)

Epoch 1/200
Epoch 2/200
Epoch 3/200
Epoch 4/200
Epoch 5/200
Epoch 6/200
Epoch 7/200
Epoch 8/200
Epoch 9/200
Epoch 10/200
Epoch 11/200
Epoch 12/200
Epoch 13/200
Epoch 14/200
Epoch 15/200
Epoch 16/200
Epoch 17/200
Epoch 18/200
Epoch 19/200
Epoch 20/200
Epoch 21/200
Epoch 22/200
Epoch 23/200
Epoch 24/200
Epoch 25/200
Epoch 26/200
Epoch 27/200
Epoch 28/200
Epoch 29/200
Epoch 30/200
Epoch 31/200
Epoch 32/200
Epoch 33/200
Epoch 34/200
Epoch 35/200
Epoch 36/200
Epoch 37/200
Epoch 38/200
Epoch 39/200
Epoch 40/200
Epoch 41/200
Epoch 42/200
Epoch 43/200
Epoch 44/200
Epoch 45/200
Epoch 46/200
Epoch 47/200
Epoch 48/200
Epoch 49/200
Epoch 50/200
Epoch 51/200
Epoch 52/200
Epoch 53/200
Epoch 54/200
Epoch 55/200
Epoch 56/200
Epoch 57/200
Epoch 58/200
Epoch 59/200
Epoch 60/200
Epoch 61/200
Epoch 62/200
Epoch 63/200
Epoch 64/200
Epoch 65/200
Epoch 66/200
Epoch 67/200
Epoch 68/200
Epoch 69/200
Epoch 70/200
Epoch 71/200
Epoch 72/200
Epoch 73/200
Epoch 74/200
Epoch 75/200
Epoch 76/200
Epoch 77/200
Epoch 78

<tensorflow.python.keras.callbacks.History at 0x7fef58cf82b0>

Come vedi, utilizzando più strati e soprattutto più informazioni, il nostro modello ha ottenuto dei risultati decisamente superiori rispetto a quello precedente.

## Testiamo la Rete


Mettiamo all'opera la rete per predire se 3 studenti verranno promossi in matematica, organizziamo le informazioni degli studenti su 3 liste python, che verranno a loro volta inserite in un'altra lista, ricordiamoci di rispettare l'ordine delle colonne (primo valore=sex, secondo valore=age, terzo valore=traveltime ecc...)

In [0]:
X_test = [[0, 21, 0, 0, 3, 1, 1, 0, 0, 1, 1, 4],
          [1, 18, 1, 4, 0, 4, 4, 1, 1, 1, 0, 2,],
          [0, 19, 2, 2, 0, 2, 2, 1, 0, 1, 1, 0]]

y_pred = model.predict(X_test)
np.round(y_pred, 3)

array([[0.008],
       [0.916],
       [0.86 ]], dtype=float32)

# Qual è la nuova "Formula della Promozione" ?
In questo caso la risposta è "BOH". E' difficile, se non impossibile, interpretare i risultati di una rete neurale, a causa di ciò che avviene negli strati nascosti e nel numero esorbitante di parametri.

In [0]:
model.weights

[<tf.Variable 'dense_12/kernel:0' shape=(12, 128) dtype=float32, numpy=
 array([[ 0.07672337, -0.28676888, -0.15104017, ...,  0.06728674,
          0.15673201,  0.4058646 ],
        [-0.04943388,  0.10861004, -0.1478334 , ..., -0.2062072 ,
         -0.15300967,  0.02394319],
        [ 0.00332548,  0.05084516, -0.1545011 , ..., -0.09929556,
         -0.18580717, -0.06273209],
        ...,
        [ 0.11875733,  0.10600074, -0.10660829, ...,  0.19594844,
          0.05514739, -0.00068989],
        [-0.19464466, -0.13861948, -0.1894843 , ...,  0.1728139 ,
         -0.0346299 , -0.22514176],
        [ 0.00552238, -0.18611164, -0.06503865, ..., -0.08583117,
          0.0103102 ,  0.00725064]], dtype=float32)>,
 <tf.Variable 'dense_12/bias:0' shape=(128,) dtype=float32, numpy=
 array([-0.00734606, -0.01670447,  0.        , -0.03219748, -0.1126217 ,
        -0.05214282, -0.07429194,  0.        , -0.06180031, -0.02649617,
        -0.07283823, -0.00515311,  0.        ,  0.        ,  0.        ,