# 🏠 Treinamento de Modelo para Previsão de Preços de Casas

Este notebook carrega dados do Kaggle (House Prices), treina um modelo de regressão linear e salva os arquivos `modelo_lr.pkl` e `scaler.pkl` para uso em uma aplicação Streamlit.

In [None]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import StandardScaler
import joblib

print('✅ Bibliotecas importadas com sucesso.')

## 📥 Carregar os Dados
Certifique-se de que o arquivo `train.csv` está no mesmo diretório deste notebook.

In [None]:
dados = pd.read_csv('train.csv')
dados.head()

## 🧹 Selecionar e Preparar os Dados

In [None]:
colunas_modelo = ['LotArea', 'YrSold', 'MoSold', 'MiscVal', 'EnclosedPorch']
X = dados[colunas_modelo]
y = dados['SalePrice']

# Tratar valores ausentes
X = X.fillna(0)
y = y.fillna(y.mean())

## ⚖️ Normalizar os Dados

In [None]:
scaler = StandardScaler()
X_norm = scaler.fit_transform(X)

## 🤖 Treinar o Modelo

In [None]:
modelo = LinearRegression()
modelo.fit(X_norm, y)
print('✅ Modelo treinado com sucesso!')

## 💾 Salvar Modelo e Scaler

In [None]:
joblib.dump(modelo, 'modelo_lr.pkl')
joblib.dump(scaler, 'scaler.pkl')
print('✅ Arquivos modelo_lr.pkl e scaler.pkl salvos com sucesso!')