In [3]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.multioutput import MultiOutputRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error
import time

# Загрузка данных
file_path = "ENB2012_data.xlsx"  # Укажите правильный путь к файлу
df = pd.read_excel(file_path)

# Переименование столбцов
columns = [
    'Relative_Compactness', 'Surface_Area', 'Wall_Area', 'Roof_Area',
    'Overall_Height', 'Orientation', 'Glazing_Area', 'Glazing_Area_Distribution',
    'Heating_Load', 'Cooling_Load'
]
df.columns = columns

# Разделение на признаки и целевую переменную
X = df.iloc[:, :8]
y = df.iloc[:, 8:]

# Разделение на тренировочную и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# Инициализация модели
start_time = time.time()
model = MultiOutputRegressor(RandomForestRegressor(
    n_estimators=100,
    random_state=42
))

# Обучение модели
model.fit(X_train, y_train)
train_time = time.time() - start_time

# Предсказание
start_pred = time.time()
y_pred = model.predict(X_test)
pred_time = time.time() - start_pred

# Расчет метрик
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)

# Вывод результатов
print(f"Время обучения: {train_time:.2f} сек")
print(f"MSE: {mse:.4f}")
print(f"MAE: {mae:.4f}")

Время обучения: 0.93 сек
MSE: 1.5875
MAE: 0.7076
