# Fondamenti di PyTorch

## Effettuiamo l'import delle librerie utilizzate nell'esercitazione.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

from sklearn.metrics import confusion_matrix 
from sklearn.metrics import ConfusionMatrixDisplay 
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report
from sklearn.metrics import roc_curve 
from sklearn.metrics import auc, average_precision_score
from sklearn.metrics import precision_recall_curve

%matplotlib inline

Di seguito i riferimenti alle pagine di documentazione, sempre utiliti:

* Rif: [numpy](https://numpy.org/doc/)
* Rif: [pandas](https://pandas.pydata.org/docs/user_guide/index.html)
* Rif: [matplotlib](https://matplotlib.org/stable/index.html)
* Rif: [scikit](https://scikit-learn.org/stable/)

## _Controllare la causalita'._

Per prima cosa, prima di procedere all'utilizzo di dati 'casuali' per l'esercitazione, impostiamo un seed per la libreria _numpy_.

In [None]:
np.random.seed(42)

Da questo momento in poi, ogni esecuzione dello script dara' sempre gli stessi risultati...a meno di cambiare nuovamente il seed o rimuovere la riga di codice.

## _Definiamo N classi, etichette, da associare ai dati._

Per procedere al calcolo di metriche, abbiamo bisogno di simulare dati casuali.
Per le metriche che saranno calcolate, questi dati dovranno essere associati a delle etichette, o classi, o labels...

In [None]:
classes = ['circle', 'square', 'triangle']

## _Creaiamo dei dati casuali._

Immaginiamo di avere dei dati reali su cui un modello di deep learning deve fare inferenza.
Immaginiamo di avere già eseguito l'inferenza su questi dati e di avere ottenuto i risultati.

In [None]:
num_data = 20

In [None]:
real_labels = np.random.randint(0, len(classes), size=(num_data))
pred_labels = np.random.randint(0, len(classes), size=(num_data))

Dei dati avremo quindi:
* Le previsioni **reali** attese.
* Le previsioni, realmente, **predette**.

In [None]:
real_labels

In [None]:
pred_labels

## _La matrice di confusione._

Con la matrice di confusione e' possibile mettere a confronto tutte le predizioni fatte da un modello, di classificazione, rispetto alle previsioni reali/attese. _Scikit_ possiede un metodo apposito per il calcolo e per l'utilizzo e' necessario solamente fornire le etichette reali e le etichette predette.

* Rif: [confusion_matrix](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.confusion_matrix.html)

In [None]:
cm = confusion_matrix(real_labels, pred_labels)
print('Confusion matrix:')
print(f'|__Type:{type(cm)}')
print(f'\n{cm}')

La matrice e' a tutti gli effetti un array _numpy_. Si puo' visualizzare con una print e se ne possono utilizzare i metodi classici.
Oltre questo, _scikit_ da' la possibilita' di visualizzarla in stile grafico.

* Rif: [ConfusionMatrixDisplay](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.ConfusionMatrixDisplay.html)

In [None]:
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=classes)
disp.plot()

## _L'accuratezza della matrice._

Della matrice di confusione ci si puo' chiedere..._Quanto accurate sono state le previsioni complessive?_. Nella diagonale si trovano tutte le previsioni fatte dalla rete e che coincidono con il valore atteso. Sommare la diagonale e confrontarla con la totalita' delle previsioni e' il modo di calcolare l'accuratezza.

In [None]:
accuracy_score(real_labels, pred_labels)

In automatico, _scikit_ puo' fornire lo stesso risultato con il metodo _accuracy_score_. Come in precedenza, sono richieste solamente le previsioni reali e predette.

* Rif: [accuracy_score](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html)

## _Un report globale._

Moltissime altre sono le metriche che _scikit_ permette di calcolare, sopratutto quelle legate e derivanti dalla matrice di confusione. L'accesso a queste metriche puo' essere fatto singolarmente con appositi metodi:

Rif: [sklearn.metrics](https://scikit-learn.org/stable/modules/classes.html#module-sklearn.metrics)

E' pero' piu' rapido, avendo una matrice di confusione calcolata, chiedere un report complessivo che mostri informazioni sulle singole etichette/classi predette e sull'intera matrice.

Per farlo, il metodo _classification_report_ richiedera' solamente etichette reali, predizioni ed eventualmente i nomi da associare alle etichette numeriche.

Rif: [classification_report](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.classification_report.html)

In [None]:
print(classification_report(real_labels, pred_labels, target_names=classes))

* Dal report si ha un riassunto delle principali metriche per classe: recall, precision, f1-score...per ognuna delle classi di dati.
* Dal report si hanno informazioni complessive, prima fra tutte l'accuratezza.

## _La curva ROC e la curva Precision-Recall._

### _Curva ROC._

Nel caso di classificazioni **binarie**, _scikit_ fornisce due metodi per il calcolo delle curve ROC e Precision-Recall.
Predisponiamo quindi i dati simulati per una classificazione binaria.

In [None]:
classes = ['Malato', 'Sano']

num_data = 100

real_labels = np.random.randint(0, len(classes), size=(num_data))
pred_labels = np.random.randint(0, len(classes), size=(num_data))

Date due classi, abbiamo un vettore di etichette e un vettore di previsioni fatte. Vi aggiungiamo quindi un vettore di 'confidenze' sul fatto che una etichetta predetta appartenza alla classe positiva. La classe positiva sara' per convenzione la 1.

In [None]:
conf_labels = np.random.rand(num_data)

Visualizziamo quindi i vettori.

In [None]:
real_labels[:5]

In [None]:
pred_labels[:5]

In [None]:
conf_labels[:5]

Per utilizzare il metodo _roc_curve_, sara' necessario fornire le previsioni attese e la confidenza sul fatto che queste siano positive o meno. Per specificare l'etichetta positiva, si utilizza il parametro _pos_label_.

* Rif: [roc_curve](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.roc_curve.html)

In [None]:
fpr, tpr, thresholds = roc_curve(real_labels, conf_labels, pos_label=1)

Per il calcolo della curva ROC, si calcolano diversi 'valori di soglia', _thresholds_.
Questi valori sono utilizzati come discriminanti per dire quali fra le 'confidenze' saranno da associare alla classe positiva e quali alla negativa.
Di seguito le soglie utilizzate:

In [None]:
thresholds

Le soglie, confrontate di volta in volta con le confidenze, permettono di calcolare ad ogni passo il valore di TPR ed FPR.

In [None]:
for i, values in enumerate(zip(thresholds, tpr, fpr)):
    if i >= 5:
        break
    else:
        print(f'Soglia {values[0]:.5f} --> Tpf: {values[1]:.5f} - Fpr: {values[2]:.5f}')

Graficando questi risultati, si ha una stima di quanto e' buono il modello di classificazione dal valore di area sotteso dalla curva. Nel caso ottimo, pari ad 1.
Il calcolo, lo fornisce il metodo _auc_ che richiede solamente di avere la liste dei valori di TPR ed FPR.

* Rif: [auc](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.auc.html)

In [None]:
roc_auc = auc(fpr, tpr)

Grafichiamo il tutto.

In [None]:
plt.figure()
plt.plot(fpr, tpr, color='darkorange', lw=2, label='ROC curve (area = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic (ROC) Curve')
plt.legend(loc="lower right")

### _Curva Precision-Recall._

Quanto visto per la curva ROC, si applica per la curva Precision-Recall. Il metodo in questo caso e' _precision_recall_curve_.

* Rif: [precision_recall_curve](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.precision_recall_curve.html)

In [None]:
precision, recall, thresholds = precision_recall_curve(real_labels, conf_labels)

Anche in questo caso viene fatta muovere una soglia e con questa si calcola il variare di precision e recall.

In [None]:
thresholds

Di seguito, alcuni dei valori ottenuti:

In [None]:
for i, values in enumerate(zip(thresholds, precision, recall)):
    if i >= 5:
        break
    else:
        print(f'Soglia {values[0]:.5f} --> Precision: {values[1]:.5f} - Recall: {values[2]:.5f}')

Anche in questo caso, il calcolo dell'area sottesa indichera' la bonta' del modello. L'ottimo si raggiunge in 1.
Per il calcolo e' possibile utilizzare due metodi: _auc_ e _average_precision_score_.

* Rif: [average_precision_score](https://scikit-learn.org/stable/modules/generated/sklearn.metrics.average_precision_score.html#sklearn.metrics.average_precision_score) 

All'aumentare dei punti della curva, i risultati tendono ad assomigliarsi sempre piu'. La principale differenza nel calcolo e' il modo in cui i punti del grafico vengono interpolati per eseguire il calcolo.

In [None]:
pr_auc_1 = auc(recall, precision)
pr_auc_2 = average_precision_score(real_labels, conf_labels)

Grafichiamo il tutto.

In [None]:
plt.figure()
plt.plot(recall, precision, color='blue', lw=2, label=f'Precision-Recall curve (area = {pr_auc_1:0.3f} | {pr_auc_2:0.3f})')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('Recall')
plt.ylabel('Precision')
plt.title('Precision-Recall Curve')
plt.legend(loc="lower left")
plt.show()