# Valutazione del Modello
Sommario per metriche  che si utilizzano per valutare un modello:

<img src="https://drive.google.com/uc?id=184NgFeVKI2uLD5eyKessu4TmopKk-q9w">

## Accuratezza:

É la metrica più comune e rappresenta la frazione dei campioni predetti correttamente:

$$
accuracy(y_i, \hat{y_i}) = \frac{1}{n_{samples}} \sum_{i=0}^{n_{samples}-1} 1(y_i = \hat{y_i})
$$

In [1]:
from sklearn.metrics import accuracy_score
y_pred = [0, 2, 1, 3]
y_true = [0, 1, 2, 3]
print(accuracy_score(y_true, y_pred)) # y vero rispetto a quello predetto
print(accuracy_score(y_true, y_pred, normalize=False)) #  numero di istanze che non sono corrette

0.5
2


Ma l’accuratezza non é tutto , si deve tenere conto anche in certi casi della precision e della recall anche essere avranno la loro metrica

In [2]:
from sklearn.metrics import precision_score
y_pred = [0, 1, 1, 0]
y_true = [0, 1, 0, 1]
print(precision_score(y_true, y_pred))

0.5


# Metriche per la regressione:

In modelli di regressione non si può utilizzare l’accuratezza,  é necessario utilizzare altre metriche “matematiche” per poter calcolare la precisione di un modello nel predire correttamente un numero, quello che succede si solito é una misura della differenza tra il valore aspettato ( 100K euro di casa ) e il valore predetto ( 170K euro di casa predetta ).

Ci sono diversi tipi di metriche e tutte si trovano importandole da sklearn, la differenza é poco importante per il corso in questione:

- `explained_variance_score`
- `max_error`
- `mean_absolute_error`
- `mean_squared_error`
- `Root_squared_error`
- `mean_squared_log_error`
- `median_absolute_error`
- `r2_score`

Di questa lista  una nota importante c’é l’ha il  **Root_squared_error(RMSE)**:

É la metrica più utilizzata nei modelli regressivi e   rappresenta la radice quadrata della media dei valori quadrati:

$$
 RMSE(y, \hat{y}) = \sqrt{\frac{1}{n_{samples}} \sum_{i=0}^{n_{samples}} (y_{i}-\hat{y_{i}})^2}
$$

e viene implementata in questo modo:

In [3]:
from sklearn.metrics import mean_squared_error
from math import sqrt

y_true = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]
sqrt(mean_squared_error(y_true, y_pred))

0.6123724356957945

# Cross Validation:

la cross validation testa il modello **k**  dividendo il dataset in **k** parti.
Se prendiamo per esempio un modello diviso e allenato con il `train_test_split`:

In [7]:
from sklearn.datasets import load_wine as wine
from sklearn.model_selection import train_test_split
from sklearn import svm
wines = wine()

X_train, X_test, y_train, y_test = train_test_split(
    wines.data, wines.target, test_size=0.4, random_state=0)

model = svm.SVC(kernel="linear",C=1).fit(X_train,y_train)
model.score(X_test,y_test)

0.9583333333333334

Differenti iperparametri per gli estimatori, come per esempio il `C` per il `svc` hanno comunque   un forte rischio di fare overfitting sul test perché i parametri possono modificarsi finché l’estimatore non performa in modo ottimo.

La conosce del test può essere perduta.

per questo si utilizzano le **CV:**

In [8]:
from sklearn.model_selection import cross_val_score
scores = cross_val_score(model,wines.data,wines.target, cv=5)
scores

array([0.88888889, 0.94444444, 0.97222222, 1.        , 1.        ])

In [9]:
scores.mean()

0.961111111111111

## Cross  validate:

la `cross_validate` si differenzia con la `cross_val_score` per due motivi:

1. Permette di specificare più metriche per la stessa valutazione
2. ritorna un dict che contiene i tempi di fit e dello score, oltre al test score

In [10]:
from sklearn.model_selection import cross_validate
scoring = ['precision_macro', 'recall_macro','accuracy']
scores = cross_validate(model, wines.data, wines.target, scoring= scoring,cv=5)
sorted(scores.keys())

['fit_time',
 'score_time',
 'test_accuracy',
 'test_precision_macro',
 'test_recall_macro']

In [11]:
scores['test_precision_macro']

array([0.8974359 , 0.94405594, 0.97777778, 1.        , 1.        ])

In [12]:
scores['fit_time']

array([0.04588008, 0.038975  , 0.04626799, 0.04268789, 0.03834915])

In [13]:
scores

{'fit_time': array([0.04588008, 0.038975  , 0.04626799, 0.04268789, 0.03834915]),
 'score_time': array([0.0010941 , 0.00078416, 0.00075316, 0.00066495, 0.00067091]),
 'test_precision_macro': array([0.8974359 , 0.94405594, 0.97777778, 1.        , 1.        ]),
 'test_recall_macro': array([0.9047619 , 0.95238095, 0.97222222, 1.        , 1.        ]),
 'test_accuracy': array([0.88888889, 0.94444444, 0.97222222, 1.        , 1.        ])}

## Cross validation iterators

questa sezione non é obbligatoria ma é doveroso fare un piccolo sunto perché potrebbe comunque arrivare all’esame. Si tratta di una lista di strumenti che generano indici che possono essere utilizzati per dividere un dataset  a seconda di diverse strategie di cross validation.

Si possono assumere corrette queste tecniche di cross validation se possiamo assumere  che i dati sono indipendenti gli uni dagli altri e identicamente distribuiti (i.i.d)

- **K-fold**
- **Repeated K-fold**
- **Leave One Out(LOO)**
- **Leave P Out(LPO)**
- **Shuffle & Split**

# Dummy estimators:

Si tratta di un classificatore “*********stupido”********* che serve unicamente per fare il confronto:
il classificatore ha un parametro `strategy`:

- `"most_frequent"`: predice sempre con la classe più frequente osservata
- `“stratified”`: ritorna sempre la classe che ha probabilità 1 nel vettore one-hot nel metodo `predict_proba`
- `“uniform”`: genera le predizione in modo uniformemente random
- `“constant”`: predice sempre un unica label che viene fornita dall'utente

In [15]:
from sklearn.dummy import DummyClassifier

print(model.score(X_test,y_test))

dummy_model = DummyClassifier(strategy="most_frequent",random_state=0)
dummy_model.fit(X_train,y_train)
result = dummy_model.predict(X_test)

accuracy_score(result,y_test)

0.9583333333333334


0.4305555555555556

# GridSearch:

Permette di organizzare batterie di test con dei parametri che noi selezioniamo:

In [16]:
from sklearn.model_selection import GridSearchCV

# specifichiamo i parametri
params = {'kernel':('linear','rbf','poly'), 'C':[0.1,1,10]} # due parametri  -> farà 9 *  5 = 45 tester -> sono molti per numero molto grandi
model = svm.SVC(gamma="scale")
grid_model = GridSearchCV(model,params,cv=5)
grid_model.fit(wines.data,wines.target)

GridSearchCV(cv=5, estimator=SVC(),
             param_grid={'C': [0.1, 1, 10],
                         'kernel': ('linear', 'rbf', 'poly')})

In [18]:
grid_model.get_params() # dice i parametri utilizzati

{'cv': 5,
 'error_score': nan,
 'estimator__C': 1.0,
 'estimator__break_ties': False,
 'estimator__cache_size': 200,
 'estimator__class_weight': None,
 'estimator__coef0': 0.0,
 'estimator__decision_function_shape': 'ovr',
 'estimator__degree': 3,
 'estimator__gamma': 'scale',
 'estimator__kernel': 'rbf',
 'estimator__max_iter': -1,
 'estimator__probability': False,
 'estimator__random_state': None,
 'estimator__shrinking': True,
 'estimator__tol': 0.001,
 'estimator__verbose': False,
 'estimator': SVC(),
 'n_jobs': None,
 'param_grid': {'kernel': ('linear', 'rbf', 'poly'), 'C': [0.1, 1, 10]},
 'pre_dispatch': '2*n_jobs',
 'refit': True,
 'return_train_score': False,
 'scoring': None,
 'verbose': 0}

In [20]:
grid_model.cv_results_

{'mean_fit_time': array([0.03493199, 0.00134368, 0.00074987, 0.04230094, 0.00107145,
        0.00075331, 0.09673796, 0.00091724, 0.00071335]),
 'std_fit_time': array([1.17424002e-02, 7.01978799e-05, 2.48364881e-05, 4.65304560e-03,
        3.82386536e-05, 4.24638415e-05, 2.73313969e-02, 5.24675607e-05,
        6.83698689e-05]),
 'mean_score_time': array([0.00028195, 0.0003911 , 0.00022244, 0.00020466, 0.00041075,
        0.00026903, 0.00027466, 0.0003458 , 0.00021272]),
 'std_score_time': array([7.07235833e-05, 1.12027306e-05, 7.74034647e-06, 5.91542585e-05,
        6.65317543e-05, 5.08894055e-05, 5.10552108e-05, 1.57548325e-05,
        1.22811259e-05]),
 'param_C': masked_array(data=[0.1, 0.1, 0.1, 1, 1, 1, 10, 10, 10],
              mask=[False, False, False, False, False, False, False, False,
                    False],
        fill_value='?',
             dtype=object),
 'param_kernel': masked_array(data=['linear', 'rbf', 'poly', 'linear', 'rbf', 'poly',
                    'linear'

In [21]:
grid_model.best_estimator_

SVC(C=0.1, kernel='linear')

In [24]:
grid_model.best_score_

0.961111111111111