# Méticas.
* KS (Classificação)
* Gini (Classificação)
* AUC (Classificação)
* RMSE (Regressão)
* MAE (Regressão)
* F1 (Classificação)
* Recall (Classificação)
* Precision (Classificação)
* R2 (Regressão)

# 3.1.1Métricas
Durante o processo de criação de um modelo de machine learning nós precisamos medir a qualidade dele de acordo com o objetivo da tarefa. Existem funções matemáticas que nos ajudam a avaliar a capacidade de erro e acerto dos nossos modelos, e agora você conhecerá algumas das mais utilizadas. Na pesquisa, usarei a palavra métrica para me referir a essas funções.

Tão importante quanto saber escolher um bom modelo, é saber escolher a métrica correta para decidir qual é o melhor entre eles.

Existem métricas mais simples, outras mais complexas, algumas que funcionam melhor para datasets com determinadas características, ou outras personalizadas de acordo com o objetivo final do modelo.
* Exemplos de métricas usadas:
    * Registro de defeitos: quantidade de defeitos descobertos em relação aos resolvidos, por iteração;
    * Cobertura de caso de teste: quantidade de casos de teste executados em relação à quantidade total de casos de teste;
    * Cobertura de código: percentual do código que foi testando.

# 3.1.2 Váriaveis.
* TP - True positive - significa uma classificação correta da classe positiva, exemplo a classe real é possitivo e o modelo classificou como possitivo.
* TN - True negative - significa uma classificação correta da classe negative, exemplo a classe real é negativo e o modelo classificou como negativo.
* FP - False positive - significa uma classificação errada da classe possitivo, exemplo a classe real é negativo e o modelo classificou como positivo.
* FN - False negative - significa uma classificação errada da classe negativo, por exemplo, a classe real é positivo e o modelo classificou como negativo.
### Calculando.
* TPR = $\frac{TP}{Actual Positive} = \frac{TP}{TP+FN}$

* TNR = $\frac{FN}{Actual Positive} = \frac{FN}{TP+FN}$

* FPR = $\frac{TN}{Actual Negative} = \frac{TN}{TN+FP}$

* FNR = $\frac{FP}{Actual Negative} = \frac{FP}{TN+FP}$

# 3.1.3 Confusion Matrix.
Em análise preditiva, a matriz de confusão conhecida também por matriz erro, é uma tabela de duas linhas e duas colunas que relata o número de falsos possitivos, falsos negativos, verdadeiros possitivos e verdadeiro negativos. Isso permite a análise mais detalhada de classificações corretas.
$\newline$ A precisão produzirá resultados enganosos se o conjunto de dados estiver desequilibrado, isto é, quando o número de observações em diferêntes classes variam muito.
* Exemplo:
Se houver $95$ gatos e apenas $5$ cachorros nos dados, um determinado classificador pode classificar todas as observações como gatos. A precisão geral seria de 95%, mas com mais detalhes o classificador teria uma taxa de reconhecimento de 100% para a classe de gatos, mas uma taxa de reconhecimento de 0% para a classe de cães.

# Pratica.

In [92]:
import pandas as pd

data = {'y_Actual':    [0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0],
        'y_Predicted': [1, 1, 0, 0, 0, 1, 1, 0, 1, 0, 1, 0]
        }

df = pd.DataFrame(data, columns=['y_Actual','y_Predicted'])

confusion_matrix = pd.crosstab(df['y_Actual'], df['y_Predicted'], rownames=['Actual'], colnames=['Predicted'])
print (confusion_matrix)

Predicted  0  1
Actual         
0          4  2
1          2  4


In [93]:
from sklearn.metrics import confusion_matrix

y_true = [1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0]
y_pred =  [1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0]
confusion_m = confusion_matrix(y_true, y_pred)
print(confusion_m)

[[5 2]
 [1 4]]


In [95]:
print("\nTP (True Positive) = {}\nFP (False Positive) = {} \nFN (False Negative) = {}\nTN (True Negative) = {}".format(confusion_m[0][0], confusion_m[0][1],confusion_m[1][0], confusion_m[1][1]))


TP (True Positive) = 5
FP (False Positive) = 2 
FN (False Negative) = 1
TN (True Negative) = 4


In [96]:
import pandas as pd

data = {'y_Actual':    [1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 1, 0],
        'y_Predicted': [1, 1, 0, 1, 0, 1, 1, 0, 1, 0, 0, 0]
        }

df = pd.DataFrame(data, columns=['y_Actual','y_Predicted'])

confusion_matrix = pd.crosstab(df['y_Actual'], df['y_Predicted'], rownames=['Actual'], colnames=['Predicted'])
print (confusion_matrix)

Predicted  0  1
Actual         
0          5  2
1          1  4
