<a href="https://colab.research.google.com/github/AdriAIMeco/1-Repo/blob/main/TFM_Predicci%C3%B3n_de_Consumo_Energ%C3%A9tico_en_un_Edificio_model_pkl.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
import joblib

# ------------------------
# 1. Creación o carga del dataset
# ------------------------
# En este ejemplo, generamos datos sintéticos de consumo energético.
# En un proyecto real, cargarías tu dataset real (por ejemplo, con pd.read_csv("tus_datos.csv")).

np.random.seed(42)
data_size = 1000

df = pd.DataFrame({
    'temp_in':    np.random.uniform(15, 25, data_size),   # Temperatura interior
    'temp_out':   np.random.uniform(-5, 35, data_size),   # Temperatura exterior
    'hum_in':     np.random.uniform(30, 60, data_size),   # Humedad interior
    'hum_out':    np.random.uniform(20, 80, data_size),   # Humedad exterior
    'hour':       np.random.randint(0, 24, data_size),    # Hora del día (0-23)
    'day_of_week':np.random.randint(0, 7, data_size),     # Día de la semana (0=Lunes,...,6=Domingo)
    'occupants':  np.random.randint(1, 5, data_size)      # Número de ocupantes
})

# Suponemos que el consumo energético es una función de las anteriores variables + ruido
df['energy_consumption'] = (
    df['temp_in'] * 0.5 +
    (35 - df['temp_out']) * 0.2 +
    df['hum_in'] * 0.3 +
    df['hum_out'] * 0.1 +
    df['hour'] * 0.7 +
    df['day_of_week'] * 0.8 +
    df['occupants'] * 5 +
    np.random.normal(0, 10, data_size)  # ruido
)

# ------------------------
# 2. Separación en features y target
# ------------------------
X = df.drop('energy_consumption', axis=1)
y = df['energy_consumption']

# ------------------------
# 3. División en train/test
# ------------------------
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# ------------------------
# 4. Entrenamiento de un modelo de regresión (RandomForest)
# ------------------------
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# (Opcional) Puedes imprimir la métrica en el conjunto de test
score = model.score(X_test, y_test)
print(f"R² en test: {score:.3f}")

# ------------------------
# 5. Guardar el modelo con joblib
# ------------------------
joblib.dump(model, "model.pkl")
print("Modelo entrenado y guardado en 'model.pkl'")


R² en test: 0.316
Modelo entrenado y guardado en 'model.pkl'
