# Aula Avaliando modelos de regressão

In [1]:
from sklearn import metrics
import numpy as np

## Leitura dos dados

In [2]:
y_test = np.array([1,2,3,4])
ỹ = np.array([1,2,3,5])

### 1. MAE

- Calcula o erro absoluto médio entre valores preditos e reais
- Interpretação mais intuitiva
- Não pune severamente os outliers do modelo
- Medida não ideal para lidar com problemas delicados 


In [3]:
print('MAE:', metrics.mean_absolute_error(y_test, ỹ))

MAE: 0.25


### 2. MSE
- Calcula o erro das previsões ao quadrado
- Valores muitos distantes do real, aumenta o valor da medida muito facilmente
- Dificuldade para interpretação direta


In [4]:
print('MSE:', metrics.mean_squared_error(y_test, ỹ))

MSE: 0.25


### 3. RMSE
- Calcula a raiz do erro média quadrático:
- Interpretabilidade melhorada em relação ao MSE 
- Penaliza predições muito distante do real

In [5]:
print('RMSE:', np.sqrt(metrics.mean_squared_error(y_test, ỹ)))

RMSE: 0.5


### 4. MAPE
- Calcula um erro absoluto em porcentagem
- Intuitiva para a interpretação do programador 
- Pode ser ruim quando o problema possui um grande alcance de número onde a variável predita varia de 0 a 20000, por exemplo.


In [6]:
def mean_absolute_percentage_error(y_true, y_pred): 
    y_true, y_pred = np.array(y_true), np.array(y_pred)
    return np.mean(np.abs((y_true - y_pred) / y_true)) * 100

In [7]:
mean_absolute_percentage_error(y_test, ỹ)

6.25

### 4. R Quadrado
- Mede o quão próximo as medidas reais estão do nosso modelo
- Se aplica apenas a modelo univariados (X == 1)
- Pode ser enviado por que utilizamos a correlação dos dados
- Muito utilizada na área de financias


In [8]:
print('R:', metrics.r2_score(y_test,ỹ))

R: 0.8


### 5. R Quadrado ajustado
- Representa a porcentagem da variância  sem viés devido ao acréscimo de novas features:
- Avalia modelos com mais precisão e segurança
- Pode ser utilizada em modelos com mais de uma feature (X > 1)
- Usado para modelos mais simples que considera os valores encontrados pelo modelo a soma de um erro residual.


In [9]:
def adjusted_R(y, ỹ, N):
    adj_r = (1 - ((1 - metrics.r2_score(y, ỹ)) * (len(y) - 1)) / (len(y) - N - 1))   
    return adj_r
print('R-adjust:', adjusted_R(y_test, ỹ, 1))

R-adjust: 0.7000000000000001
