# Métricas de Avaliação

## Classificação

### Matriz de Confusão

Matriz de Confusão é uma tabela composta por **n linhas** e **n colunas**, no qual, nas linhas tem-se seu valor real e nas colunas seu valor predito

A imagem abaixo exemplifica uma matriz de confusão com apenas 2 classes.

<img src="imagens_metricas/Matriz_de_Confusão.jpg">

Supondo que temos que classificar um dataset com as classes *gato* e *não gato* e obtivemos a seguinte matriz de confusão:


Matriz de Confusão (1)

Real\Predito | Gato | Não Gato 
:----|:----:|:----:
Gato | 24 | 6 
Não Gato | 4 | 16 


Na primeira linha, tem-se os valores reais da classe 1 (Gato) pelo seu valor predito, onde podemos observar que:

- 24 valores foram preditos de maneira correta (VP)
- 6 de Maneira errada (FN)
- obtendo um total de 30 amostras dessas classe

Po sua vez, na segunda linha, temos os valores da classe 2 (não gato), ou seja:

- 16 valores foram preditos de maneira correta (VN)
- 4 de Maneira errada (FP)
- obtendo um total de 20 amostras dessas classe

Por fim, conseguimos saber que o total de amostras desse dataset foi de 50 amostras


### Acurácia

Acurácia é basicamente a quantidade de acertos pela quantidade total de amostras, ou seja, 

$$
accuracy = \frac{VP + VF}{qtd Amostras}
$$

No exemplo acima temos que a acurácia foi de 

$$
\frac{24 + 16}{50} = 0.8
$$




### Precisão


Precisão é, basicamente, a quantidade de verdadeiros positivos dividido por ele mesmo, somado pela quantidade de falsos positivos. Ou seja, temos:

$$
precision = \frac{VP}{VP + FP}
$$

Nesse caso temos:

$$
precision = \frac{24}{24 + 4} = 0.857
$$

### Revocação

**Quanto maior Recall, menor a chance de Falsos Negativos**

Quantidade de verdadeiros positivos, dividido pela quantidade total de exemplos que pertencem a esta classe, mesmo que sejam classificados em outra. Ou seja, verdadeiros positivos divididos por total de positivos.

$$
recall = \frac{VP}{VP + FN}
$$

Nesse caso temos:

$$
recall = \frac{24}{24 + 6} = 0.8
$$


### Pontuação F1

F1 Score é a média harmônica entre Precision e Recall e é **muito boa para datasets desbalanceados**, uma vez que é uma relação entre precisão e recall

$$
F1 score = \frac{2}{\frac{1}{Precision} + \frac{1}{Recall}}
$$

Nesse caso temos:

$$
F1 score = \frac{2*0.857*0.8}{0.857 + 0.8} = 0,827
$$



### ROC - AUC
*Area Under the ROC Curve*

É a área da curva formada pelo gráfico entre VP e FP

<img src="imagens_metricas\AUC_ROC.png">

Quanto maior a AUC, melhor será o modelo em prever 0s como 0s e 1s como 1s. 

- Um modelo excelente tem AUC próximo de 1, o que significa que tem uma boa medida de separabilidade. 
- Um modelo pobre tem AUC próximo de 0, o que significa que ele tem a pior medida de separabilidade. Na verdade, significa que está retribuindo o resultado. Ele está prevendo 0s como 1s e 1s como 0s. 
- E quando AUC é 0,5, significa que o modelo não tem capacidade de separação de classes de qualquer espécie.

Uma das vantagens em relação ao F1 Score, é que ela mede o desempenho do modelo em vários pontos de corte, **não necessariamente atribuindo exemplos com probabilidade maior que 50% para a classe positiva, e menor, para a classe negativa**.

Abaixo tem-se os exemplos de medições de AUC.

AUC = 1

<img src="imagens_metricas/AUC_1.png"> 
<img src="imagens_metricas/ROC_1.png">
                    
AUC = 0.7

<img src="imagens_metricas/AUC_07.png">
<img src="imagens_metricas/ROC_07.png">

AUC = 0.5

<img src="imagens_metricas/AUC_05.png">
<img src="imagens_metricas/ROC_05.png">

AUC = 0
<img src="imagens_metricas/AUC_0.png">
<img src="imagens_metricas/ROC_0.png">

## Log Loss

Log Loss penaliza os modelos com classificações falsas que erraram bastante a probabilidade de pertencer à certa classe, ou seja, quanto menor o Log Loss, melhor.

Para calcular o Log Loss é necessário ter a probabilidade de cada classe, ao invés de apenas o resultado da classe final (aquela com maior probabilidade). A fórmula é dada por:


<img src="imagens_metricas/logloss.png">


Onde:
- N é o número de observações
- M é o número de classes
- Yij indica se a classe j é a classe correta para a observação i
- Pij é a probabilidade dada pelo modelo de atribuir a classe j para a observação i.

Quando existem apenas duas classes, a fórmula pode ser simplificada para:

<img src="imagens_metricas/logloss2.png">

ou seja, supondo que temos a tabela a seguir


y | y_predito | prob
:----:|:----: | :----:
1 | 1 | 0.8 
1 | 1 | 0.9 
1 | 0 | 0.3 


$$
Log Loss = \frac{-1}{3}*{[1*log0.8 + 0*log(0.2)] + [1*log0.9 + 0*log(0.1)] + [1*log0.8 + 1*log(0.7)]}
$$

$$
Log Loss = \frac{-1}{3}*{[-0.096910013] + [-0.04575749056] + [-0.25181197299]}
$$

$$
Log Loss = \frac{-1}{3}*{[-0.096910013] + [-0.04575749056] + [-0.25181197299]}
$$

$$
Log Loss = 0.1312
$$

**notice que a terceira amostra acarretou em um almento muito significativo ao erro**
 

