<a href="https://colab.research.google.com/github/AndreSVasconcelos/regressao_linear_simples/blob/main/exercicio_regressao_linear.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### **Exercício:** Criar um modelo e fazer a comparação da performance obtida entre os conjuntos de treinamento e de teste

In [2]:
# Importar Libs
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import cross_val_score
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

In [3]:
# Gerar dados aleatórios
np.random.seed(42)
x = np.random.rand(100, 1)
y = 2 + 3 * x + np.random.randn(100, 1)

In [4]:
# Dividir dados em conjunto de treinamento e teste
x_treinamento, x_teste, y_treinamento, y_teste = train_test_split(x, y, test_size=0.2, random_state=0)

In [5]:
# Criando e treinando o modelo de regressão linear
modelo = LinearRegression()
modelo.fit(x_treinamento, y_treinamento)

In [14]:
# Fazer previsões do modelo normal
y_teste_pred_normal = modelo.predict(x_teste)
y_treinamento_pred_normal = modelo.predict(x_treinamento)

In [15]:
# Fazendo a validação cruzada
cv_scores = cross_val_score(modelo, x, y, cv=5)
print(f'Scores de validação cruzada: {cv_scores}')
print(f'Média dos scores: {cv_scores.mean()}')

Scores de validação cruzada: [0.27063245 0.14615562 0.27220857 0.56496434 0.38890332]
Média dos scores: 0.3285728596911465


In [16]:
# Fazer previsões do modelo por validação cruzada
y_teste_pred_cv = modelo.predict(x_teste)
y_treinamento_pred_cv = modelo.predict(x_treinamento)

In [17]:
# Coletando as métricas de avaliação
# Mean Absolute Error
mae_treinamento_normal = mean_absolute_error(y_treinamento, y_treinamento_pred_normal)
mae_teste_normal = mean_absolute_error(y_teste, y_teste_pred_normal)
mae_treinamento_cv = mean_absolute_error(y_treinamento, y_treinamento_pred_cv)
mae_teste_cv = mean_absolute_error(y_teste, y_teste_pred_cv)

# Mean Squared Error
mse_treinamento_normal = mean_squared_error(y_treinamento, y_treinamento_pred_normal)
mse_teste_normal = mean_squared_error(y_teste, y_teste_pred_normal)
mse_treinamento_cv = mean_squared_error(y_treinamento, y_treinamento_pred_cv)
mse_teste_cv = mean_squared_error(y_teste, y_teste_pred_cv)

# R2
r2_treinamento_normal = r2_score(y_treinamento, y_treinamento_pred_normal)
r2_teste_normal = r2_score(y_teste, y_teste_pred_normal)
r2_treinamento_cv = r2_score(y_treinamento, y_treinamento_pred_cv)
r2_teste_cv = r2_score(y_teste, y_teste_pred_cv)

In [18]:
# Visualizar resultados
print("Resultados do modelo normal:")
print(f"MAE treinamento: {mae_treinamento_normal:.2f}")
print(f"MAE teste: {mae_teste_normal:.2f}")
print(f"MSE treinamento: {mse_treinamento_normal:.2f}")
print(f"MSE teste: {mse_teste_normal:.2f}")
print(f"R2 treinamento: {r2_treinamento_normal:.2f}")
print(f"R2 teste: {r2_teste_normal:.2f}")
print('==================================================================')
print("Resultados do modelo por validação cruzada:")
print(f"MAE treinamento: {mae_treinamento_cv:.2f}")
print(f"MAE teste: {mae_teste_cv:.2f}")
print(f"MSE treinamento: {mse_treinamento_cv:.2f}")
print(f"MSE teste: {mse_teste_cv:.2f}")
print(f"R2 treinamento: {r2_treinamento_cv:.2f}")
print(f"R2 teste: {r2_teste_cv:.2f}")

Resultados do modelo normal:
MAE treinamento: 0.71
MAE teste: 0.64
MSE treinamento: 0.84
MSE teste: 0.67
R2 treinamento: 0.39
R2 teste: 0.45
Resultados do modelo por validação cruzada:
MAE treinamento: 0.71
MAE teste: 0.64
MSE treinamento: 0.84
MSE teste: 0.67
R2 treinamento: 0.39
R2 teste: 0.45
