# Métricas de Desempenho - Regressão

Como medir o desempenho de modelos de regressão?

## O Erro Absoluto Médio (*Mean Absolute Error*)

O MAE é uma medida de erro que computa a média arimética dos erros absolutos.

$$
MAE(y, \hat{y}) = \frac{1}{n}\sum_{i=1}^{n} |y_{i} - \hat{y_{i}}|
$$

In [1]:
from metricas import mae

In [2]:
y = [13, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

mae(y, y_pred)

3.0

**QUESTÕES PARA REFLEXÃO**

**[01]** Em que situações o MAE é útil?

1. Quando precisamos de uma métrica que seja representativa para os dados que estamos avaliando (ex.: quando prevendo o preço de uma casa, um MAE de 10.000 pode significar que em média nós erramos 10 mil reais)

2. Quando queremos uma métrica para medir o quanto estamos errando (no intervalo [0, $\infty$[ )

**[02]** Como se dá a interpretação dos resultados no MAE?

> O MAE dá a nós a diferença média entre as observações (valores verdadeiro) e os resultados do nosso modelo (valores preditos). Um ponto positivo do MAE é que o seu resultado sempre está na mesma escala de medida que da amostra, então se estamos tentando prevendo o preço de uma casa, um MAE de 10.000 pode significar que em média nós erramos 10 mil reais - repare que a unidade de medida é a mesma que o preço de uma casa.

**[03]** O MAE pode ser considerado análogo a alguma medida de tendência central?

> O MAE assemelha-se a variância, pois nos diz o quão longe em média estamos da medida correta. Uma diferença é que a variância é calculada a partir do quadrado dos resíduos, e o MAE é calculado a partir do módulo dos resíduos.

**[04]** Como o MAE se comporta com *outliers*?

> O MAE dá o mesmo peso para os outliers do que para todos os outros exemplos da amostra.

## O Percentual do Erro Médio Absoluto (*Mean Absolute Percentage Error*)

$$
MAPE(y, \hat{y}) = \frac{1}{n}\sum_{i=1}^{n}  \frac{|{y_{i} - \hat{y}}|}{max(\epsilon, |y_{i}|)}
$$

In [1]:
from metricas import mape

y = [0, 2, 3, 4]
y_pred = [1, 2, 3, 8]

mape(y, y_pred)

2.5000000000000003e+23

**QUESTÕES PARA REFLEXÃO**

**[05]** Em que situações o MAPE seria útil?

> Quando queremos analisar o quanto erramos em percentual em relação ao valor que estamos tentando prever.\
Exemplo: Se estamos tentando prever o valor de uma casa que custa 10.000 (true value) e prevemos 12.000 (predicted value), o nosso MAPE é 0.2 (ou 20%).\
\
Essa análise é especialmente útil no mundo dos negócios, onde é de muito valor compararmos sempre um resultado em relação a um baseline (patamar base)

**[06]** Como é a interpretação dos resultados no MAPE?

| MAPE | Interpretation |
| -- | -- |
| < 10 % | Muito bom |
| 10 % - 20 % | Bom |
| 20 % - 50 % | Razoável |
| > 50 % | Ruim |

Fonte: https://stephenallwright.com/good-mape-score/

**[07]** Como o MAPE se comporta com *outliers*?

## O Erro Quadrático Médio (*Mean Squared Error*)

O MSE é uma medida de erro que computa a média dos quadrados dos erros.

$$
MSE(y, \hat{y}) = \frac{1}{n}\sum_{i=1}^{n} (y_{i} - \hat{y_{i}})^2
$$

In [4]:
from metricas import mse

In [5]:
y = [13, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

mse(y, y_pred)

27.875

**QUESTÕES PARA REFLEXÃO**

**[08]** Em que situações o MSE é útil?

**[09]** Como é a interpretação dos resultados no MSE?

**[10]** O MSE pode ser análogo a alguma medida de variabilidade?

**[11]** Como o MSE se comporta com *outliers*?


## A Raiz Quadrada do Erro Quadrático Médio (*Root Mean Squared Error*)

O RMSE é computado pela raiz quadrada do MSE. Representa uma medida de variabilidade dos acertos de um modelo.

$$
RMSE(y, \hat{y}) = \sqrt{MSE(y, \hat{y})}
$$

**QUESTÕES PARA REFLEXÃO**

**[12]** Em que situações o MSE é útil?

**[13]** Como é a interpretação dos resultados no MSE?

**[14]** O MSE pode ser análogo a alguma medida de variabilidade?

**[15]** Como o MSE se comporta com *outliers*?


## O Coeficiente de Determinação: $R^2$

O coeficiente de determinação representa a proporção da variância (de $y$) que é explicada pelas variáveis independentes do modelo. O $R^2$ fornece uma indicação da qualidade do ajuste e portanto uma medida do quão bem instâncias não vistas serão previstas pelo modelo.

$$
R^2(y, \hat{y}) = 1 - \frac{\sum_{i=1}^{n} (y_{i} - \hat{y_{i}})^2}{\sum_{i=1}^{n} (y_{i} - \bar{y})^2}
$$

In [6]:
from metricas import r2

In [7]:
# Predição perfeita
# ==============================================================================

y =      [1,2,3,4]
y_pred = [1,2,3,4]

r2(y, y_pred)

1.0

In [8]:
# Predição imperfeita
# ==============================================================================
y = [3, -0.5, 2, 7]
y_pred = [2.5, 0.0, 2, 8]

r2(y, y_pred)

0.9486081370449679

O $R^2$ é muito sensível a *outliers*.

In [9]:
# Outliers
# ==============================================================================

y = [13, -0.5, 2, 7] # 3 => 13 
y_pred = [2.5, 0.0, 2, 8]

r2(y, y_pred)

-0.04510837727006445

**QUESTÕES PARA REFLEXÃO**

**[16]** Em que situações o $R^2$ é útil?

**[17]** Como é a interpretação dos resultados no $R^2$?

**[18]** Como o $R^2$ se comporta com *outliers*?


## O Erro Absoluto Mediano (*Median Absolute Error*)

O MedAE é calculado ao obter a mediana das diferenças absolutas entre o alvo e a predição.

$$
MedAE(y, \hat{y}) = mediana(|y_{1} - \hat{y_{1}}|, ..., |y_{n} - \hat{y_{n}}|)
$$

In [10]:
from metricas import medae

y = [13, -0.5, 2, 7, 10]
y_pred = [2.5, 0.0, 2, 8, 12]

medae(y, y_pred)

1.0

**[19]** Em que situações o MedAE é útil?

**[20]** Como se dá a interpretação dos resultados no MedAE?

**[21]** O MedAE pode ser considerado análogo a alguma medida de tendência central?

**[22]** Como o MedAE se comporta com *outliers*?



```python
def mape(y, y_hat, e=1e-24):
    """
    Calcula o MAPE (Percentual do Erro Médio Absoluto)
    
    Parameters
    ----------
    y: list
        Target true value
    
    y_hat: list
        Target predicted value
    e: float
        Arbitrary value to be used in case of division by zero
        
    Returns
    -------
    mape: float
        Value of Mean Absolute Percentage Error
    """
    
    n = len(y)
    
    soma = 0
    for i in range(n):
        soma += abs(y[i] - y_hat[i]) / max(abs(y[i]), e)
    
    return soma / n
```

In [2]:
y= [1,2,3]
y_pred = [1,2,6]

In [3]:
mape(y, y_pred)

0.3333333333333333