# Métricas de Desempenho - Regressão

Como medir o desempenho de modelos de regressão?

## O Erro Absoluto Médio (*Mean Absolute Error*)

O MAE é uma medida de erro que computa a média arimética dos erros absolutos.

$$
MAE(y, \hat{y}) = \frac{1}{n}\sum_{i=1}^{n} |y_{i} - \hat{y_{i}}|
$$

In [1]:
from metricas import mae

In [32]:
y = [13, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

mae(y, y_pred)

3.0

**QUESTÕES PARA REFLEXÃO**

**[01]** Em que situações o MAE é útil?
    Quando outliers não são muito relevantes e quando o valor precisa ter uma interpretabilidade maior

**[02]** Como se dá a interpretação dos resultados no MAE?
    Pode ser interpretado como o erro esperado do seu modelo

**[03]** O MAE pode ser considerado análogo a alguma medida de tendência central?
    Sim, ele é análogo a média

**[04]** Como o MAE se comporta com *outliers*?
    Tem uma pequena variação em relação aos outliers

## O Percentual do Erro Médio Absoluto (*Mean Absolute Percentage Error*)

$$
MAPE(y, \hat{y}) = \frac{1}{n}\sum_{i=1}^{n}  \frac{|{y_{i} - \hat{y}}|}{max(\epsilon, |y_{i}|)}
$$

In [33]:
from metricas import mape

y = [1, 2, 3, 1]
y_pred = [1, 2, 3, 8]

mape(y, y_pred)

1.75

**QUESTÕES PARA REFLEXÃO**

**[05]** Em que situações o MAPE seria útil?
    Quando se quer análisar a acurácia do modelo em valores percentuais

**[06]** Como é a interpretação dos resultados no MAPE?
    Ele é interpretado como um percentual do erro, porém se o valor for muito alto, significa que o y predito era 0, ai nesse caso a divisão por 0 é evitada

**[07]** Como o MAPE se comporta com *outliers*?
    Ele é muito sensível a outliers, pois pode crescer ou diminuir exponencialmente caso o y real seja muito alto ou muito baixo

## O Erro Quadrático Médio (*Mean Squared Error*)

O MSE é uma medida de erro que computa a média dos quadrados dos erros.

$$
MSE(y, \hat{y}) = \frac{1}{n}\sum_{i=1}^{n} (y_{i} - \hat{y_{i}})^2
$$

In [34]:
from metricas import mse

In [35]:
y = [13, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

mse(y, y_pred)

27.875

**QUESTÕES PARA REFLEXÃO**

**[08]** Em que situações o MSE é útil?
    O MSE penaliza mais poucos grandes erros do que varios pequenos erros. Portanto, é útil quando precisamos de um modelo com pouca variação

**[09]** Como é a interpretação dos resultados no MSE?
    Quanto maior o MSE, maior o erro do modelo. É uma medida de erro quadrática

**[10]** O MSE pode ser análogo a alguma medida de variabilidade?
    Ele é análogo a variância

**[11]** Como o MSE se comporta com *outliers*?
    Essa métrica penaliza mais os outliers, pois eleva o erro ao quadrado


## A Raiz Quadrada do Erro Quadrático Médio (*Root Mean Squared Error*)

O RMSE é computado pela raiz quadrada do MSE. Representa uma medida de variabilidade dos acertos de um modelo.

$$
RMSE(y, \hat{y}) = \sqrt{MSE(y, \hat{y})}
$$

**QUESTÕES PARA REFLEXÃO**

**[12]** Em que situações o RMSE é útil?
    Quando se quer uma medida de variabilidade dos erros

**[13]** Como é a interpretação dos resultados no RMSE?
    Quanto maior o RMSE, maior a variabilidade dos erros. Quanto maior for mais dispersos os erros estão em torno da média

**[14]** O RMSE pode ser análogo a alguma medida de variabilidade?
    É análogo ao desvio padrão

**[15]** Como o RMSE se comporta com *outliers*?
    Ele tambem é sensível a outliers, apenas tira a raiz quadrada do MSE


## O Coeficiente de Determinação: $R^2$

O coeficiente de determinação representa a proporção da variância (de $y$) que é explicada pelas variáveis independentes do modelo. O $R^2$ fornece uma indicação da qualidade do ajuste e portanto uma medida do quão bem instâncias não vistas serão previstas pelo modelo.

$$
R^2(y, \hat{y}) = 1 - \frac{\sum_{i=1}^{n} (y_{i} - \hat{y_{i}})^2}{\sum_{i=1}^{n} (y_{i} - \bar{y})^2}
$$

In [36]:
from metricas import r2

In [37]:
# Predição perfeita
# ==============================================================================

y =      [1,2,3,4]
y_pred = [1,2,3,4]

r2(y, y_pred)

1.0

In [38]:
# Predição imperfeita
# ==============================================================================
y = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

r2(y, y_pred)

0.9486081370449679

O $R^2$ é muito sensível a *outliers*.

In [39]:
# Outliers
# ==============================================================================
from metricas import variancia


y =      [0.5, 2, 7, 13] # 3 => 13 
y_pred = [0.0, 2, 8, 3]

r2(y, y_pred), mse(y, y_pred), variancia(y), mse(y, y_pred)/variancia(y)

(-0.058131939908556474, 25.3125, 23.921875, 1.0581319399085565)

**QUESTÕES PARA REFLEXÃO**

**[16]** Em que situações o $R^2$ é útil?
    Em situações onde se quer saber a proporção da variância que é explicada pelas variáveis independentes do modelo

**[17]** Como é a interpretação dos resultados no $R^2$?
    Quanto maior o $R^2$, maior a proporção da variância que é explicada pelas variáveis independentes do modelo

**[18]** Como o $R^2$ se comporta com *outliers*?
    Ele é muito sensível, uma vez que o MSE também é. Quando houverem outliers, a variância será alta, aproximando o $R^2$ de 0


## O Erro Absoluto Mediano (*Median Absolute Error*)

O MedAE é calculado ao obter a mediana das diferenças absolutas entre o alvo e a predição.

$$
MedAE(y, \hat{y}) = mediana(|y_{1} - \hat{y_{1}}|, ..., |y_{n} - \hat{y_{n}}|)
$$

In [40]:
from metricas import medae

y = [13, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

medae(y, y_pred)

0.75

**[19]** Em que situações o MedAE é útil?
    Por ser uma métrica robusta, é útil quando se tem outliers, ou quando a media não é uma boa medida de tendência central

**[20]** Como se dá a interpretação dos resultados no MedAE?
    Ela representa a mediana dos erros absolutos

**[21]** O MedAE pode ser considerado análogo a alguma medida de tendência central?
    Sim, é análogo a mediana

**[22]** Como o MedAE se comporta com *outliers*?
    Ele é menos sensível a outliers do que o MAE, pois ele usa a mediana, que é menos sensível a outliers do que a média

