In [None]:
# Q1_0129. 주어진 data에 대하여 회귀 모델을 사용하여 에너지 사용량을 예측하는 모델을 xgbregressor, lightgbmregressor 모델을 이용하여 모델링 및 평가 mae, mse, rmse 를 수행하세요

# # 가상의 데이터 생성
# np.random.seed(42)
# data_size = 1000
# data = {
#     'area': np.random.uniform(1000, 3000, data_size),
#     'type': np.random.randint(0, 2, data_size),
#     'location': np.random.randint(0, 3, data_size),
#     'energy_usage': np.random.uniform(200, 600, data_size)  # kWh
# }

import numpy as np
import pandas as pd
from xgboost import XGBRegressor
from lightgbm import LGBMRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error, mean_squared_error

# 데이터 생성
np.random.seed(42)
data_size = 1000
data = {
    'area': np.random.uniform(1000, 3000, data_size),
    'type': np.random.randint(0, 2, data_size),
    'location': np.random.randint(0, 3, data_size),
    'energy_usage': np.random.uniform(200, 600, data_size)  # kWh
}

df = pd.DataFrame(data)

# 데이터 분할
X = df.drop('energy_usage', axis=1)
y = df['energy_usage']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 모델 생성 및 학습
#xgboost 모델 훈련에 있어 objective 매개변수는 모델이 최소화하려는 손실함수나 최적화할 목표
# XGBRegressor(objective='reg:squarederror, n_estimators=100, learning_rate=0.1') 이 디폴트값
# LGBMRegressor(n_estimators=100, learning_rate=0.1) 이 디폴트값

models = [XGBRegressor(random_state=42), LGBMRegressor(random_state=42, verbose=-1)]
for model in models:
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)

    # 모델 평가
    mae = mean_absolute_error(y_test, y_pred)
    mse = mean_squared_error(y_test, y_pred)
    rmse = np.sqrt(mse)

    print(f'{model.__class__.__name__} 모델 성능:')
    print(f'MAE: {mae:.3f}, MSE: {mse:.3f}, RMSE: {rmse:.3f}\n')



XGBRegressor 모델 성능:
MAE: 107.876, MSE: 17248.822, RMSE: 131.335

LGBMRegressor 모델 성능:
MAE: 97.313, MSE: 13658.107, RMSE: 116.868

