# Avaliação de Modelos – Housing Califórnia

Avaliação da performance dos modelos treinados na previsão do preço médio das casas usando o conjunto de teste.

In [174]:
import joblib
import numpy as np
import pandas as pd

## 1. Carregamento dos Modelos
Importação dos modelos finais treinados (`Linear Regression`, `Decision Tree`, `Random Forest`) salvos anteriormente.

In [175]:
lin_reg_model = joblib.load("models/linear_regression_model.pkl")
tree_model = joblib.load("models/decision_tree_model.pkl")
rf_model = joblib.load("models/random_forest_model.pkl")

## 2. Carregamento do Conjunto de Teste
Importação do conjunto de teste transformado (`X_test`) e do alvo (`y_test`) processados nos notebooks anteriores.

In [176]:
X_test = np.load("data/processed/X_test.npy")
y_test = pd.read_csv("data/processed/y_test.csv").values.ravel()

## 3. Previsão com os Modelos
Geração das previsões para o conjunto de teste com cada modelo.

In [177]:
y_pred_lin = lin_reg_model.predict(X_test)
y_pred_tree = tree_model.predict(X_test)
y_pred_rf = rf_model.predict(X_test)

## 4. Cálculo do RMSE
Cálculo do RMSE para comparar a performance dos modelos no conjunto de teste.

In [178]:
from sklearn.metrics import mean_squared_error
import numpy as np

def rmse(y_true, y_pred):
    return np.sqrt(mean_squared_error(y_true, y_pred))


## 5. Resultados
Exibição dos valores de RMSE obtidos para cada modelo:
- `Linear Regression`
- `Decision Tree`
- `Random Forest`

In [179]:
print("RMSE Linear Regression:", rmse(y_test, y_pred_lin))
print("RMSE Decision Tree:", rmse(y_test, y_pred_tree))
print("RMSE Random Forest:", rmse(y_test, y_pred_rf))

RMSE Linear Regression: 66913.4419132093
RMSE Decision Tree: 58772.103556837006
RMSE Random Forest: 47873.26095812988
