# Avaliação de Modelos - Métricas de Regressão
### Letícia Saraiva Chaves, 402120

Quando queremos avaliar um aluno no ENEM, por exemplo, comparamos o gabarito oficial do ENEM com o gabarito do aluno. De forma semelhante avaliamos os algoritmos de aprendizado supervisionado, ou seja, comparando o label verdadeiro (y_true) com o label estimado/predito pelo algoritmo (y_pred).

In [1]:
import numpy as np
from sklearn import datasets
from sklearn import metrics
from sklearn import model_selection
from sklearn import linear_model

### Carregue o dataset de diabetes

O label é uma medida quantitativa da progressão da doença um ano após os dados iniciais (features).

In [2]:
X, y = datasets.load_diabetes(return_X_y=True)

In [3]:
X.shape, y.shape

((442, 10), (442,))

In [4]:
y[:5]

array([151.,  75., 141., 206., 135.])

### Divida o dataset em 75% para treino e 25% para teste.

In [5]:
X_train, X_test, y_train, y_test = model_selection.train_test_split(X, y, random_state=42)

### Crie um y_test_mean contendo a média de y_test em todos os seus valores

In [6]:
y_train_mean = np.full(y_test.shape, np.mean(y_train))

### Mostre os primeiros 5 elementos de y_test_mean

In [7]:
print(y_train_mean[:5])

[154.34441088 154.34441088 154.34441088 154.34441088 154.34441088]


### Crie um y_train_max contendo o maior valor de y_train em todos os seus valores

In [8]:
y_train_max = np.full(y_test.shape, np.max(y_train))

### Treine o modelo usando o conjunto de dados de treino e o algoritmo de regressão linear

In [9]:
model_lr = linear_model.LinearRegression()

In [10]:
model_lr.fit(X_train, y_train)

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

In [11]:
import joblib

In [12]:
joblib.dump(model_lr, 'modelo_lr.dump')

['modelo_lr.dump']

In [13]:
model_lr.intercept_

151.66516982689936

In [14]:
model_lr.coef_

array([  47.74657117, -241.99180361,  531.96856896,  381.56529922,
       -918.49020552,  508.25147385,  116.94040498,  269.48508571,
        695.8062205 ,   26.32343144])

In [15]:
model_lr.predict([[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]])

array([10794.60667249])

### Use o modelo treinado para realizar predições sobre o conjunto de teste

In [16]:
y_pred = model_lr.predict(X_test)

## Métrica MAE - Mean Absolute Error

$$ MAE = \frac{1}{n} \sum_{i=0}^{n-1}{ \vert y_i - \hat{y}_i \vert } $$

### Calcule o MAE comparando y_test com y_pred de forma manual, usando apenas os recursos do numpy

In [17]:
# Código
soma_y = 0
for i, j in enumerate(y_test):
    soma_y += abs(j - y_pred[i])

mae = soma_y / (i+1)
print (mae)

41.548363283252066


### Calcule o MAE comparando y_test com y_pred usando a métrica mean_absolute_error do scikit.

In [18]:
metrics.mean_absolute_error(y_test, y_pred)

41.548363283252066

### Calcule o MAE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [19]:
metrics.mean_absolute_error(y_test, y_pred)

41.548363283252066

In [20]:
metrics.mean_absolute_error(y_test, y_test)

0.0

In [21]:
metrics.mean_absolute_error(y_test, y_train_mean)

65.52742168150024

In [22]:
metrics.mean_absolute_error(y_test, y_train_max)

200.45945945945945

### Implemente a métrica MAE

In [23]:
#Código
def mae2(y_test, y_pred):
    soma_y = 0
    for i, j in enumerate(y_test):
        soma_y += abs(j - y_pred[i])

    mae = soma_y / (i+1)
    
    return mae

In [24]:
from mylibs import metricas

In [25]:
metricas.mae(y_test, y_pred)

41.548363283252066

### Use sua implementação para calcular MAE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

In [26]:
#Código

result = mae2(y_test, y_pred)
print("Mean Absolute Error: ", result)


Mean Absolute Error:  41.548363283252066


## Métrica MSE - Mean Squared Error

$$ MSE = \frac{1}{n} \sum_{i=0}^{n-1}{ (y_i - \hat{y_i})^2 } $$

### Calcule o MSE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_train_mean) e valor máximo (y_train_max).

In [27]:
metrics.mean_squared_error(y_test, y_pred)

2848.2953079329427

In [28]:
metrics.mean_squared_error(y_test, y_test)

0.0

In [29]:
metrics.mean_squared_error(y_test, y_train_mean)

5607.197930791938

In [30]:
metrics.mean_squared_error(y_test, y_train_max)

45713.68468468468

### Implemente o MSE

In [31]:
#Código
def mse2(y_test, y_pred):
    soma_y = 0
    for i, j in enumerate(y_test):
        soma_y += (j - y_pred[i])**2

    mse = soma_y / (i+1)
    
    return mse

### Use sua implementação para calcular MSE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

In [32]:
#Código
result = mse2(y_test, y_pred)

print("Mean Squared Error: ", result)

Mean Squared Error:  2848.2953079329423


## Métrica RMSE - Root Mean Squared Error

$$ RMSE = \sqrt{ MSE } $$

### Calcule o RMSE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [33]:
metrics.mean_squared_error(y_test, y_pred) ** 0.5

53.36942296795931

In [34]:
metrics.mean_squared_error(y_test, y_pred) ** (1/2)

53.36942296795931

In [35]:
np.std(y_test), np.mean(y_test)

(74.36188403951323, 145.54054054054055)

In [36]:
np.sqrt(metrics.mean_squared_error(y_test, y_pred))

53.36942296795931

In [37]:
metrics.mean_squared_error(y_test, y_test) ** 0.5

0.0

In [38]:
metrics.mean_squared_error(y_test, y_train_mean) ** 0.5

74.88122548938378

In [39]:
metrics.mean_squared_error(y_test, y_train_max) ** 0.5

213.8075879960407

### Implemente o RMSE

In [40]:
#Código
def rmse2(y_test, y_pred):
    mse = mse2(y_test, y_pred)
    
    rmse = np.sqrt(mse)
    return rmse

### Use sua implementação para calcular RMSE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

In [41]:
#Código

result = rmse2(y_test, y_pred)

print("Root Mean Squared Error: ", result)

Root Mean Squared Error:  53.3694229679593


## Métrica MSLE - Mean squared logarithmic error

Usando quando não queremos que grandes erros sejam significativamente mais penalizados do que os pequenos, nos casos em que há valores com ordens de grandeza diferentes no rótulo.

Exemplo: Você deseja prever os preços futuros do imóvel e seu conjunto de dados inclui residências com ordens de magnitude diferentes no preço.

$$ MSLE = \frac{1}{n} \sum_{i=0}^{n-1} { ( \log{(y_i + 1)} - \log{(\hat{y}_i + 1)} )^2 } $$

### Calcule o MSE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [42]:
metrics.mean_squared_log_error(y_test, y_pred)

0.17473101967410778

In [43]:
metrics.mean_squared_log_error(y_test, y_test)

0.0

In [44]:
metrics.mean_squared_log_error(y_test, y_train_mean)

0.3262411099085772

In [45]:
metrics.mean_squared_log_error(y_test, y_train_max)

1.2863896507131534

### Implemente o MSLE

In [46]:
#Código
def msle2(y_test, y_pred):
    soma_y = 0
    for i, j in enumerate(y_test):
        soma_y += (np.log(j+1) - np.log(y_pred[i] + 1))**2

    msle = soma_y / (i+1)
    
    return msle

In [47]:
metricas.mae(y_test, y_pred)

41.548363283252066

In [63]:
metricas.msle(y_test, y_pred)

0.17473101967410773

### Use sua implementação para calcular o MSLE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

In [49]:
#Código
result = msle2(y_test, y_pred)

print("Mean squared logarithmic error: ", result)

Mean squared logarithmic error:  0.17473101967410773


## Métrica RMSLE - Root Mean squared logarithmic error

$$ RMSLE = \sqrt{ MSLE } $$

### Calcule o RMSLE comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [50]:
metrics.mean_squared_log_error(y_test, y_pred) ** 0.5

0.41800839665502865

In [51]:
metrics.mean_squared_log_error(y_test, y_test) ** 0.5

0.0

### Implemente o RMSLE

In [52]:
def rmsle2(y_test, y_pred):
    msle = msle2(y_test, y_pred)
    
    rmsle = np.sqrt(msle)
    return rmsle

### Use sua implementação para calcular o RMSLE comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

In [53]:
#Código
result = rmsle2(y_test, y_pred)

print("Root Mean squared logarithmic error: ", result)

Root Mean squared logarithmic error:  0.4180083966550286


## Métrica $R^2$ - Coeficiente de Determinação

### Avalie o modelo usando o conjunto de dados de teste e a métrica padrão

In [54]:
model_lr.score(X_test, y_test)

0.4849086635905802

### Que resultado é esse?

É o resultado da avaliação do modelo usando a métrica $R^2$, que também é chamada de coeficiente de determinação.

### Calcule $R^2$ comparando o valor do conjunto de teste (y_test) com: valor predito (y_pred), valor do label (y_test), valor da média (y_test_mean) e valor máximo (y_test_max).

In [55]:
metrics.r2_score(y_test, y_pred)

0.48490866359058016

In [56]:
metrics.r2_score(y_test, y_test)

1.0

In [57]:
metrics.r2_score(y_test, y_train_mean)

-0.014016723490579253

In [58]:
metrics.r2_score(y_test, y_train_max)

-7.266952822922468

### Cálculo do coeficiente de determinação ($R^2$) 

$$ R^2 = 1 - \frac{SS_{res}}{SS_{tot}} $$

$SS_{res}$ é a soma dos quadrados residuais:

$$ SS_{res} = \sum_{i}{ (y_i - \hat{y_i})^2 } $$

$SS_{tot}$ é a soma total dos quadrados da diferença em relação à média dos valores observados:

$$ SS_{tot} = \sum_{i}{ (y_i - \bar{y})^2 } $$


O melhor score possível é 1.0. Ele pode ser negativo em modelos muito ruins. 

Um modelo constante que sempre prediz o valor esperado de y, independente das features de entrada, obteria um score de 0.0.

### Implemente $R^2$

In [59]:
def ss_res(y_test, y_pred):
    soma = 0
    for i, j in enumerate(y_test):
        soma += (j - y_pred[i])**2
    
    return soma

In [60]:
def ss_tot(y_test, y_mean):
    soma = 0
    for i in y_test:
        soma += (i - y_mean)**2
    
    return soma

In [61]:
def r2(y_test, y_pred):
    y_mean = np.mean(y_test)
    
    var_ss_res = ss_res(y_test, y_pred)
    var_ss_tot = ss_tot(y_test, y_mean)
    
    r2 = 1 - (var_ss_res/var_ss_tot)
    return r2

### Use sua implementação para calcular $R^2$ comparando o valor do conjunto de teste (y_test) com o valor predito (y_pred)

In [62]:
#Código
result = r2(y_test, y_pred)

print("Métrica  𝑅² - Coeficiente de Determinação: ", result)

Métrica  𝑅² - Coeficiente de Determinação:  0.48490866359058016
