## Validação do modelo preditivo

**Revisão:**

1. Treinando e testando com os mesmos dados
2. Divisão de treinamento e teste
3. Validação cruzada (k-fold)

**Problema:**

Imagine um problema de classificação onde temos 990 amostras de uma classe 'A' e 10 amostras da classe 'B'

* Note que um classificador que estima sempre a classe 'A' obterá uma acurácia de 99%.
* Acurácia não nos dá informações sobre a distribuição das classes;
* Não informa também onde (em que classes) ocorreram os erros;

### Matrix de confusão

* É uma matriz que descreve o desempenho de um modelo de classificação
* Quantifica o número de Verdadeiros Positivos (VP), Verdadeiros Negativos (VN), Falsos Positivos (FP) e Falsos Negativos (FN);

### Exemplo:

* Valor Real (VR) - linhas
* Valor Real (VP) - colunas
      
|VR/VP|  0  |  1  |
|-----|-----|-----|
|  0  |  VN |  FP |
|  1  |  FN |  VP |

Iremos exemplificá-la com o uso do benchemark de classificação de cancer de mama.
<br>
http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html#sklearn.datasets.load_breast_cancer
<br>
Note que no contexto do dataset *breast_cancer*, temos:

* VN: a predição de que a instância não estava com cancer foi correta.
* VP: a predição de que a instância estava com cancer foi correta.
* FN: a predição de que a instância não estava com cancer foi incorreta. Na verdade, ela tinha cancer (Erro Tipo II).
* FP: a predição de que a instância estava com cancer foi incorreta. Na verdade, ela não tinha cancer (Erro Tipo I).

In [19]:
from sklearn.datasets import load_breast_cancer

data = load_breast_cancer()

print(data.target_names)
print(data.feature_names)

X = data.data
y = data.target

['malignant' 'benign']
['mean radius' 'mean texture' 'mean perimeter' 'mean area'
 'mean smoothness' 'mean compactness' 'mean concavity'
 'mean concave points' 'mean symmetry' 'mean fractal dimension'
 'radius error' 'texture error' 'perimeter error' 'area error'
 'smoothness error' 'compactness error' 'concavity error'
 'concave points error' 'symmetry error' 'fractal dimension error'
 'worst radius' 'worst texture' 'worst perimeter' 'worst area'
 'worst smoothness' 'worst compactness' 'worst concavity'
 'worst concave points' 'worst symmetry' 'worst fractal dimension']


In [40]:
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3,random_state=42)

gb = GradientBoostingClassifier()
dt = DecisionTreeClassifier()

gb.fit(X_train, y_train)
y_pred_gb = gb.predict(X_test)

dt.fit(X_train, y_train)
y_pred_dt = dt.predict(X_test)

print('GradientBoostingClassifier: ',accuracy_score(y_test, y_pred_gb))
print('DecisionTreeClassifier: ',accuracy_score(y_test, y_pred_dt))

GradientBoostingClassifier:  0.959064327485
DecisionTreeClassifier:  0.918128654971


### Matriz de confusão no sklearn

* Importante mencionar que o primeiro parâmetro são os valores verdadeiros e o segundo os valores que foram estimados

In [43]:
from sklearn.metrics import confusion_matrix
print('Matriz de Confusão GradientBoostingClassifier:')
print(confusion_matrix(y_test, y_pred_gb))

print('Matriz de Confusão DecisionTreeClassifier:')
print(confusion_matrix(y_test, y_pred_dt))

Matriz de Confusão GradientBoostingClassifier:
[[ 59   4]
 [  3 105]]
Matriz de Confusão DecisionTreeClassifier:
[[59  4]
 [10 98]]


## Outras Métricas de Validação

Existem muitas métricas que usam a matriz de confusão para validação do modelo preditivo.
<br>
Exemplo: True Positive Rate (TPR), True Negative Rate (TNR), Precision, ROC curves, F1 score, Matthews correlation coefficient, etc.
<br>
Obs.: 
* TPR também é conhecido como Sensitivity ou Recall (positivo).
* TNR também é conhecido como Specificity ou Recall (negativo).

## Materiais para estudo:

* [Model evaluation](http://scikit-learn.org/stable/modules/model_evaluation.html)
* [Statistical Measures - Wikipedia](https://en.wikipedia.org/wiki/Sensitivity_and_specificity)