# Avaliação de Modelos - Métricas de Regressão

Quando queremos avaliar um aluno no ENEM, por exemplo, comparamos o gabarito oficial do ENEM com o gabarito do aluno. De forma semelhante avaliamos os algoritmos de aprendizado supervisionado, ou seja, comparando o label verdadeiro (y_true) com o label estimado/predito pelo algoritmo (y_pred).

In [4]:
import numpy as np
from sklearn import datasets
from sklearn import metrics
from sklearn.model_selection import train_test_split
from sklearn import linear_model

### Carregue o dataset de diabetes

O label é uma medida quantitativa da progressão da doença um ano após os dados iniciais (features).

In [5]:
X, y = datasets.load_diabetes(return_X_y=True)

In [6]:
X.shape, y.shape

((442, 10), (442,))

### Divida o dataset em 75% para treino e 25% para teste.

In [7]:
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42)

### Crie um y_test_mean contendo a média de y_test em todos os seus valores

In [32]:
y_test_mean = np.full(y_test.shape, np.mean(y_test))

### Mostre os primeiros 5 elementos de y_test_mean

In [34]:
print(y_test_mean[:5])

[145.54054054 145.54054054 145.54054054 145.54054054 145.54054054]


### Crie um y_test_max contendo o maior valor de y_test em todos os seus valores

In [47]:
y_test_max = np.full(y_test.shape, np.max(y_test))

### Treine o modelo usando o conjunto de dados de treino e o algoritmo de regressão linear

In [8]:
model_lr = linear_model.LinearRegression()

In [9]:
model_lr.fit(X_train, y_train)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

### Use o modelo treinado para realizar predições sobre o conjunto de teste

In [54]:
y_pred = model_lr.predict(X_test)

## Métrica MAE - Mean Absolute Error

$$ MAE = \frac{1}{n} \sum_{i=0}^{n-1}{ \vert y_i - \hat{y}_i \vert } $$

### Calcule o MAE comparando y_test com y_pred de forma manual, usando apenas os recursos do numpy

In [65]:
diff = y_test - y_pred
print('diff', diff[:5])

diff_abs = np.abs(diff)
print('diff_abs', diff_abs[:5])

soma = diff_abs.sum()
print('soma', soma)

media_soma = soma / y_test.shape[0]
print('media_soma', media_soma)

diff [  81.05020111 -112.53621462   72.14445951  -62.55738727  -13.86559124]
diff_abs [ 81.05020111 112.53621462  72.14445951  62.55738727  13.86559124]
soma 4611.868324440979
media_soma 41.548363283252066


### Calcule o MAE comparando y_test com y_pred usando a métrica mean_absolute_error do scikit.

In [63]:
metrics.mean_absolute_error(y_test, y_pred)

41.548363283252066

### Calcule o MAE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [66]:
metrics.mean_absolute_error(y_test, y_pred)

41.548363283252066

In [67]:
metrics.mean_absolute_error(y_test, y_test)

0.0

In [68]:
metrics.mean_absolute_error(y_test, y_test_mean)

64.33357682006331

In [69]:
metrics.mean_absolute_error(y_test, y_test_max)

164.45945945945945

### Implemente a métrica MAE

### Use sua implementação para calcular MAE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

## Métrica MSE - Mean Squared Error

$$ MSE = \frac{1}{n} \sum_{i=0}^{n-1}{ (y_i - \hat{y_i})^2 } $$

### Calcule o MSE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [15]:
metrics.mean_squared_error(y_test, y_pred)

2848.2953079329427

In [37]:
metrics.mean_squared_error(y_test, y_test)

0.0

In [38]:
metrics.mean_squared_error(y_test, y_test_mean)

5529.689797906013

In [50]:
metrics.mean_squared_error(y_test, y_test_max)

32576.603603603602

### Implemente o MSE

### Use sua implementação para calcular MSE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

## Métrica RMSE - Root Mean Squared Error

$$ RMSE = \sqrt{ MSE } $$

### Calcule o RMSE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [21]:
metrics.mean_squared_error(y_test, y_pred) ** 0.5

53.36942296795931

In [22]:
metrics.mean_squared_error(y_test, y_pred) ** (1/2)

53.36942296795931

In [16]:
np.sqrt(metrics.mean_squared_error(y_test, y_pred))

53.36942296795931

In [39]:
metrics.mean_squared_error(y_test, y_test) ** 0.5

0.0

In [40]:
metrics.mean_squared_error(y_test, y_test_mean) ** 0.5

74.36188403951323

In [51]:
metrics.mean_squared_error(y_test, y_test_max) ** 0.5

180.4898988963194

### Implemente o RMSE

### Use sua implementação para calcular RMSE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

## Métrica MSLE - Mean squared logarithmic error

Usando quando não queremos que grandes erros sejam significativamente mais penalizados do que os pequenos, nos casos em que há valores com ordens de grandeza diferentes no rótulo.

Exemplo: Você deseja prever os preços futuros do imóvel e seu conjunto de dados inclui residências com ordens de magnitude diferentes no preço.

$$ MSLE = \frac{1}{n} \sum_{i=0}^{n-1} { ( \log{(y_i + 1)} - \log{(\hat{y}_i + 1)} )^2 } $$

### Calcule o MSE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [42]:
metrics.mean_squared_log_error(y_test, y_pred)

0.17473101967410773

In [29]:
metrics.mean_squared_log_error(y_test, y_test)

0.0

In [31]:
metrics.mean_squared_log_error(y_test, y_test)

0.0

In [41]:
metrics.mean_squared_log_error(y_test, y_test_mean)

0.3068324571041929

In [52]:
metrics.mean_squared_log_error(y_test, y_test_max)

1.0795016775788726

### Implemente o MSLE

In [27]:
def msle(y_true, y_pred):
    return ((np.log(y_true+1) - np.log(y_pred+1))**2).sum() / y_true.shape[0]

### Use sua implementação para calcular o MSLE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

## Métrica RMSLE - Root Mean squared logarithmic error

$$ RMSLE = \sqrt{ MSLE } $$

### Calcule o RMSLE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [43]:
metrics.mean_squared_log_error(y_test, y_pred) ** 0.5

0.4180083966550286

In [44]:
metrics.mean_squared_log_error(y_test, y_test) ** 0.5

0.0

In [45]:
metrics.mean_squared_log_error(y_test, y_test_mean) ** 0.5

0.5539245951428704

In [53]:
metrics.mean_squared_log_error(y_test, y_test_max) ** 0.5

1.0389907013919193

### Implemente o RMSLE

### Use sua implementação para calcular o RMSLE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

## Métrica $R^2$ - Coeficiente de Determinação

### Avalie o modelo usando o conjunto de dados de teste e a métrica padrão

In [10]:
model_lr.score(X_test, y_test)

0.4849086635905802

### Que resultado é esse?

É o resultado da avaliação do modelo usando a métrica $R^2$, que também é chamada de coeficiente de determinação.

### Calcule $R^2$ comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [12]:
metrics.r2_score(y_test, y_pred)

0.48490866359058016

In [35]:
metrics.r2_score(y_test, y_test)

1.0

In [36]:
metrics.r2_score(y_test, y_test_mean)

0.0

In [48]:
metrics.r2_score(y_test, y_test_max)

-4.891217191955277

### Cálculo do coeficiente de determinação ($R^2$) 

$$ R^2 = 1 - \frac{SS_{res}}{SS_{tot}} $$

$SS_{res}$ é a soma dos quadrados residuais:

$$ SS_{res} = \sum_{i}{ (y_i - \hat{y_i})^2 } $$

$SS_{tot}$ é a soma total dos quadrados:

$$ SS_{tot} = \sum_{i}{ (y_i - \bar{y})^2 } $$

O melhor score possível é 1.0. Ele pode ser negativo em modelos muito ruins. 

Um modelo constante que sempre prediz o valor esperado de y, independente das features de entrada, obteria um score de 0.0.

### Implemente $R^2$

In [13]:
def r2(y_true, y_pred):
    ss_res = ((y_true - y_pred) ** 2).sum()
    ss_tot = ((y_true - y_true.mean()) ** 2).sum()
    return 1 - ss_res / ss_tot 

### Use sua implementação para calcular $R^2$ comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)