# Métricas de Avaliação

## Regressão

### Mean Error (ME)

Basicamente é a média da diferença entre o y e o y_predito, o qual acabando não sendo uma boa métrica de avaliação, uma vez que valores positivos e negativos podem se anular, dando a falsa impressão que o algorítimo teve melhores resultados do que realmente pode ter tido.

Suponha que temos o exemplo abaixo:

y | y_predito | Erro 
:----|:----:|:----:
3 | 3,1| +0,1 
3 | 4,8| +1,8 
3 | 2,2| -0,8 
3 | 2,0| -1,0 
3 | 2,9| -0,1 

Como ME é o erro médio, teremos que

$$
ME =  \frac{0,1 + 1,8 - 0,8 - 1 - 0,1}{5}
$$

$$
ME =  0
$$

Ou seja, segundo essa métrica, o algorítimo acertou 100% dos resultados, porém nota-se que em todas as predições, houve-se um erro


**obs: essa métrica é dependente de escala**

### Mean Absolute Error (MAE)

A ideia do MAE é bem parecida com a ME, porém ao invés de calcularmos o erro médio, usa-se o módulo do erro, ou seja, a distância do y com o y_predito.

Utilizamos o mesmo exemplo acima, teremos que:

$$
MAE =  \frac{0,1 + 1,8 + 0,8 + 1 + 0,1}{5}
$$

$$
MAE =  0.76
$$

Ou seja, com essa metrica, sabemos que esse algorítimo preve os resultados com erro médio de 0,76 para cima ou para baixo do valor esperado


**obs: essa métrica é dependente de escala**

### Mean Square Error (MSE)

O MSE é, basicamente a média das distância quadráticas de y para y_predito, ou seja, nesse casos, para erros maiores do que 1, penaliza muito mais do que o MAE.

Nesse mesmo exemplo teremos que:

$$
MSE =  \frac{0,1^2 + 1,8^2 + 0,8^2 + 1^2 + 0,1^2}{5}
$$

$$
MSE =  0.98
$$

**obs: essa métrica é dependente de escala**

### Root Mean Square Error (RMSE)

A ideia do RMSE é a mesma que o MSE, porém é a raiz da média das distância quadráticas de y para y_predito. Portanto seria o 'desvio padrão'.

$$
RMSE =  \sqrt{MSE}
$$

$$
RMSE =  0.9899
$$

**obs: essa métrica é dependente de escala**

### Mean Percentage Error (MPE)

Uma vantagem do MPE em relação ao ME é que essa métrica é o erro médio em porcentagem, ou seja, **não é dependente de escala.**

Para calcularmos o MPE basta sabermos a relação percentual de cada y_predito em relação ao seu y.

Usando a mesmo exemplo, teremos:

y | y_predito | Erro 
:----|:----:|:----:
3 | 3,1| +3,3% 
3 | 4,8| +60,0% 
3 | 2,2| -26,6% 
3 | 2,0| -33,3% 
3 | 2,9| -4,0% 

Portanto:

$$
ME =  \frac{3,3 + 60 - 26,6 - 33,3 - 3,3}{5}
$$

$$
ME =  0\%
$$




### Mean Average Percentage Error (MPAE)

A ideia do MPAE é, basicamente a mesma que o MAE, porém, assim como o MPE, seu valor é dado em porcentagem, **não sendo dependente de escala**

Utilizando o mesmo exemplo que o MPE, teremos que:

$$
ME =  \frac{3,3 + 60 + 26,6 + 33,3 + 3,3}{5}
$$

$$
ME =  25.4\%
$$


### Coeficiente de determinação (R²)

O coeficiente de determinação, também chamado de R², **determina o quanto a variabilidade do valor y_predito está em relação ao seu y**. Ou seja, quanto maior o R², mais explicativo é o modelo linear, em outras palavras, melhor ele se ajusta à amostra. 

**Supondo que obtivemos um R² = 0,8234 significa que o modelo linear explica 82,34%.**

Para calcular o R², temos que:

$$
R² =  \frac{somatorio (y Predito - y Medio)}{somatorio (y - y Medio)}
$$


A imagem abaixo exemplifica melhor essa relação


<img src="imagens_metricas/R2.png" width="400" 
     height="500" > 




