# Modelos de Regressão para Previsão de Preços de Casas

Neste notebook, daremos continuidade ao pré-processamento realizado anteriormente e implementaremos três modelos de regressão: Regressão Linear, Árvore de Decisão e Redes Neurais. Após treinar os modelos, iremos avaliar e comparar o desempenho de cada um utilizando métricas de erro.


In [None]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score
from sklearn.model_selection import train_test_split
import os
from pathlib import Path

# Carregar o dataset pré-processado
current_dir = Path().resolve()
data_path = os.path.join(current_dir, '..', 'data', 'regression', 'house-prices-advanced-regression-techniques', 'train.csv')
data = pd.read_csv(data_path)

X = data.drop(['SalePrice'], axis=1)
y = data['SalePrice']

# Dividir os dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## 1. Modelo de Regressão Linear
O modelo de Regressão Linear será o primeiro modelo a ser implementado. Este é um modelo simples, mas pode fornecer bons resultados quando as variáveis têm relação linear com o valor-alvo.

In [None]:
# Implementar o modelo de Regressão Linear
linear_model = LinearRegression()
linear_model.fit(X_train, y_train)

# Prever os preços no conjunto de teste
y_pred_linear = linear_model.predict(X_test)

# Avaliar o desempenho
mae_linear = mean_absolute_error(y_test, y_pred_linear)
mse_linear = mean_squared_error(y_test, y_pred_linear)
rmse_linear = np.sqrt(mse_linear)
r2_linear = r2_score(y_test, y_pred_linear)

print("\nDesempenho da Regressão Linear:")
print(f"MAE: {mae_linear}")
print(f"RMSE: {rmse_linear}")
print(f"R2: {r2_linear}")

## 2. Modelo de Árvore de Decisão
A Árvore de Decisão pode capturar padrões mais complexos nos dados ao dividir o espaço de decisão em nós. Vamos implementá-la e avaliar seu desempenho.

In [None]:
# Implementar o modelo de Árvore de Decisão
tree_model = DecisionTreeRegressor(random_state=42)
tree_model.fit(X_train, y_train)

# Prever os preços no conjunto de teste
y_pred_tree = tree_model.predict(X_test)

# Avaliar o desempenho
mae_tree = mean_absolute_error(y_test, y_pred_tree)
mse_tree = mean_squared_error(y_test, y_pred_tree)
rmse_tree = np.sqrt(mse_tree)
r2_tree = r2_score(y_test, y_pred_tree)

print("\nDesempenho da Árvore de Decisão:")
print(f"MAE: {mae_tree}")
print(f"RMSE: {rmse_tree}")
print(f"R2: {r2_tree}")

## 3. Modelo de Redes Neurais
As Redes Neurais são modelos mais complexos e podem capturar relações não-lineares nos dados. Vamos implementar uma Rede Neural Multilayer Perceptron e avaliar seu desempenho.

In [None]:
# Implementar o modelo de Rede Neural
mlp_model = MLPRegressor(hidden_layer_sizes=(64, 64), max_iter=1000, random_state=42)
mlp_model.fit(X_train, y_train)

# Prever os preços no conjunto de teste
y_pred_mlp = mlp_model.predict(X_test)

# Avaliar o desempenho
mae_mlp = mean_absolute_error(y_test, y_pred_mlp)
mse_mlp = mean_squared_error(y_test, y_pred_mlp)
rmse_mlp = np.sqrt(mse_mlp)
r2_mlp = r2_score(y_test, y_pred_mlp)

print("\nDesempenho da Rede Neural:")
print(f"MAE: {mae_mlp}")
print(f"RMSE: {rmse_mlp}")
print(f"R2: {r2_mlp}")

## 4. Comparação dos Modelos
Comparamos os resultados de cada modelo com base nas métricas MAE, RMSE e R² para identificar qual deles teve o melhor desempenho em prever os preços das casas.

| Modelo                | MAE         | RMSE        | R²          |
|----------------------|-------------|-------------|-------------|
| Regressão Linear     | {mae_linear}  | {rmse_linear}  | {r2_linear}  |
| Árvore de Decisão    | {mae_tree}   | {rmse_tree}   | {r2_tree}   |
| Rede Neural          | {mae_mlp}    | {rmse_mlp}    | {r2_mlp}    |

### Conclusões
Ao final, analisamos qual modelo é mais adequado para essa tarefa, levando em conta as características dos dados e o desempenho das abordagens.