In [1]:
from ucimlrepo import fetch_ucirepo 
  
# fetch dataset 
appliances_energy_prediction = fetch_ucirepo(id=374) 
  
# data (as pandas dataframes) 
X = appliances_energy_prediction.data.features 
y = appliances_energy_prediction.data.targets 
  


In [2]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from keras.models import Sequential
from keras.layers import Dense, LSTM, GRU, SimpleRNN
from keras.optimizers import RMSprop
from keras.metrics import MeanSquaredError

In [3]:
# 1. 데이터 로드
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/00374/energydata_complete.csv'
data = pd.read_csv(url)

# 2. 데이터 전처리
# 'date' 열을 제거 (이 열이 문제를 일으킴)
data = data.drop(['date'], axis=1)

# 특성 값과 타겟 값 분리
X = data.drop('Appliances', axis=1).values
y = data['Appliances'].values

# 데이터를 0과 1 사이로 스케일링
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

# y를 Numpy 배열로 변환
y = y.values

# 시계열 데이터로 변환하기 위해 시퀀스 생성
time_steps = 10

def create_sequences(X, y, time_steps):
    Xs, ys = [], []
    for i in range(len(X) - time_steps):
        Xs.append(X[i:(i + time_steps), :])
        ys.append(y[i + time_steps])
    return np.array(Xs), np.array(ys)

X_seq, y_seq = create_sequences(X_scaled, y, time_steps)

# 데이터셋을 훈련, 검증, 테스트 세트로 분할
X_seq, y_seq = create_sequences(X_scaled, y, time_steps)
X_train, X_test, y_train, y_test = train_test_split(X_seq, y_seq, test_size=0.2, random_state=42, shuffle=False)

# 3. LSTM 모델 정의
def build_lstm_model(input_shape):
    model = Sequential()
    model.add(LSTM(50, activation='relu', input_shape=input_shape))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model

# 4. GRU 모델 정의
def build_gru_model(input_shape):
    model = Sequential()
    model.add(GRU(50, activation='relu', input_shape=input_shape))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model
    
# 5. RNN 모델 정의
def build_rnn_model(input_shape):
    model = Sequential()
    model.add(SimpleRNN(50, activation='relu', input_shape=input_shape))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model

# 6. 모델 훈련
lstm_model = build_lstm_model((X_train.shape[1], X_train.shape[2]))
gru_model = build_gru_model((X_train.shape[1], X_train.shape[2]))
rnn_model = build_rnn_model((X_train.shape[1], X_train.shape[2]))

lstm_history = lstm_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)
gru_history = gru_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)
rnn_history = rnn_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)

# 7. 모델 평가
lstm_loss, lstm_mse = lstm_model.evaluate(X_test, y_test, verbose=0)
gru_loss, gru_mse = gru_model.evaluate(X_test, y_test, verbose=0)
rnn_loss, rnn_mse = rnn_model.evaluate(X_test, y_test, verbose=0)

print(f"LSTM Model - Test Loss: {lstm_loss}, Test MSE: {lstm_mse}")
print(f"GRU Model - Test Loss: {gru_loss}, Test MSE: {gru_mse}")
print(f"RNN Model - Test Loss: {rnn_loss}, Test MSE: {rnn_mse}")
# 8. 학습 과정 시각화
import matplotlib.pyplot as plt

def plot_history(history, title):
    plt.plot(history.history['loss'], label='train')
    plt.plot(history.history['val_loss'], label='test')
    plt.title(title)
    plt.xlabel('Epochs')
    plt.ylabel('Loss')
    plt.legend()
    plt.show()

plot_history(lstm_history, "LSTM Model Loss")
plot_history(gru_history, "GRU Model Loss")
plot_history(rnn_history, "RNN Model Loss")

AttributeError: 'numpy.ndarray' object has no attribute 'values'

In [None]:
from keras.layers import Dropout
from keras.callbacks import EarlyStopping

# LSTM 모델 정의 (드롭아웃과 조기 종료 포함)
def build_lstm_model(input_shape):
    model = Sequential()
    model.add(LSTM(50, activation='relu', input_shape=input_shape))
    model.add(Dropout(0.2))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model

# GRU 모델 정의 (드롭아웃과 조기 종료 포함)
def build_gru_model(input_shape):
    model = Sequential()
    model.add(GRU(50, activation='relu', input_shape=input_shape))
    model.add(Dropout(0.2))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model
    
# RNN 모델 정의
def build_rnn_model(input_shape):
    model = Sequential()
    model.add(SimpleRNN(50, activation='relu', input_shape=input_shape))
    model.add(Dropout(0.2))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model

# 조기 종료 설정
early_stopping = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)

# 모델 훈련 (조기 종료 콜백 추가)
lstm_model = build_lstm_model((X_train.shape[1], X_train.shape[2]))
gru_model = build_gru_model((X_train.shape[1], X_train.shape[2]))
rnn_model = build_rnn_model((X_train.shape[1], X_train.shape[2]))

lstm_history = lstm_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)
gru_history = gru_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)
rnn_history = rnn_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)

# 6. 모델 평가
lstm_loss, lstm_mse = lstm_model.evaluate(X_test, y_test, verbose=0)
gru_loss, gru_mse = gru_model.evaluate(X_test, y_test, verbose=0)
rnn_loss, rnn_mse = rnn_model.evaluate(X_test, y_test, verbose=0)

print(f"LSTM Model - Test Loss: {lstm_loss}, Test MSE: {lstm_mse}")
print(f"GRU Model - Test Loss: {gru_loss}, Test MSE: {gru_mse}")
print(f"RNN Model - Test Loss: {rnn_loss}, Test MSE: {rnn_mse}")

# 7. 학습 과정 시각화

plot_history(lstm_history, "LSTM Model Loss")
plot_history(gru_history, "GRU Model Loss")
plot_history(rnn_history, "RNN Model Loss")


In [None]:
def create_sequences(X, y, time_steps):
    Xs, ys = [], []
    for i in range(len(X) - time_steps):
        Xs.append(X[i:(i + time_steps), :])
        ys.append(y[i + time_steps])
    return np.array(Xs), np.array(ys)

X_seq, y_seq = create_sequences(X_scaled, y, time_steps)

# 데이터셋을 훈련, 검증, 테스트 세트로 분할
X_train, X_test, y_train, y_test = train_test_split(X_seq, y_seq, test_size=0.2, random_state=42, shuffle=False)

# 3. LSTM 모델 정의 (드롭아웃과 조기 종료 포함)
def build_lstm_model(input_shape):
    model = Sequential()
    model.add(LSTM(50, activation='relu', input_shape=input_shape))
    model.add(Dropout(0.2))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model

# 4. GRU 모델 정의 (드롭아웃과 조기 종료 포함)
def build_gru_model(input_shape):
    model = Sequential()
    model.add(GRU(50, activation='relu', input_shape=input_shape))
    model.add(Dropout(0.2))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model
    
# RNN 모델 정의 (드롭아웃과 조기 종료 포함)
def build_rnn_model(input_shape):
    model = Sequential()
    model.add(SimpleRNN(50, activation='relu', input_shape=input_shape))
    model.add(Dropout(0.2))
    model.add(Dense(1))
    model.compile(optimizer=RMSprop(), loss='mse', metrics=[MeanSquaredError()])
    return model

# 조기 종료 설정
early_stopping = EarlyStopping(monitor='val_loss', patience=5, restore_best_weights=True)

# 모델 훈련 (조기 종료 콜백 추가)
lstm_model = build_lstm_model((X_train.shape[1], X_train.shape[2]))
gru_model = build_gru_model((X_train.shape[1], X_train.shape[2]))
rnn_model = build_rnn_model((X_train.shape[1], X_train.shape[2]))

lstm_history = lstm_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)
gru_history = gru_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)
rnn_history = rnn_model.fit(X_train, y_train, epochs=20, batch_size=32, validation_data=(X_test, y_test), verbose=1)

# 6. 모델 평가
lstm_loss, lstm_mse = lstm_model.evaluate(X_test, y_test, verbose=0)
gru_loss, gru_mse = gru_model.evaluate(X_test, y_test, verbose=0)
rnn_loss, rnn_mse = rnn_model.evaluate(X_test, y_test, verbose=0)

print(f"LSTM Model - Test Loss: {lstm_loss}, Test MSE: {lstm_mse}")
print(f"GRU Model - Test Loss: {gru_loss}, Test MSE: {gru_mse}")
print(f"RNN Model - Test Loss: {rnn_loss}, Test MSE: {rnn_mse}")

# 학습 과정 시각화

plot_history(lstm_history, "LSTM Model Loss")
plot_history(gru_history, "GRU Model Loss")
plot_history(rnn_history, "RNN Model Loss")


In [None]:
from sklearn.metrics import mean_squared_error
# 모델 평가
rnn_pred = rnn_model.predict(X_test)
lstm_pred = lstm_model.predict(X_test)
gru_pred = gru_model.predict(X_test)

# MSE 계산
rnn_mse = mean_squared_error(y_test, rnn_pred)
lstm_mse = mean_squared_error(y_test, lstm_pred)
gru_mse = mean_squared_error(y_test, gru_pred)

print(f"RNN MSE: {rnn_mse}")
print(f"LSTM MSE: {lstm_mse}")
print(f"GRU MSE: {gru_mse}")

In [None]:
# 4. 학습 및 검증 손실 시각화
plt.figure(figsize=(12, 8))

# Epochs 기준 그래프
plt.subplot(2, 2, 1)
plt.plot(rnn_history.history['loss'], label='tanh train', color='blue')
plt.plot(rnn_history.history['val_loss'], label='tanh valid', color='blue', linestyle='--')
plt.plot(gru_history.history['loss'], label='GRU train', color='green')
plt.plot(gru_history.history['val_loss'], label='GRU valid', color='green', linestyle='--')
plt.plot(lstm_history.history['loss'], label='LSTM train', color='purple')
plt.plot(lstm_history.history['val_loss'], label='LSTM valid', color='purple', linestyle='--')
plt.yscale('log')
plt.title('Per epoch')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

# 시간 기준 그래프
plt.subplot(2, 2, 2)
plt.plot(np.cumsum(rnn_history.history['loss']), label='tanh train', color='blue')
plt.plot(np.cumsum(rnn_history.history['val_loss']), label='tanh valid', color='blue', linestyle='--')
plt.plot(np.cumsum(gru_history.history['loss']), label='GRU train', color='green')
plt.plot(np.cumsum(gru_history.history['val_loss']), label='GRU valid', color='green', linestyle='--')
plt.plot(np.cumsum(lstm_history.history['loss']), label='LSTM train', color='purple')
plt.plot(np.cumsum(lstm_history.history['val_loss']), label='LSTM valid', color='purple', linestyle='--')
plt.yscale('log')
plt.title('Wall Clock Time (seconds)')
plt.xlabel('Epochs')
plt.ylabel('Cumulative Loss')
plt.legend()

# 두 그래프를 합친 제목 추가
plt.suptitle('Appliances Energy Prediction', fontsize=16)

plt.tight_layout(rect=[0, 0, 1, 0.95])  # suptitle과 그래프가 겹치지 않도록 조정
plt.show()

1. Per Epoch 그래프 (왼쪽 그래프)  
x축 (Epochs): 모델이 학습한 에포크 수를 나타냅니다.  
y축 (Loss, Log Scale): 로그 스케일로 표시된 손실 값입니다. 값이 낮을수록 모델이 더 잘 학습하고 있음을 의미합니다.  
그래프 해석:  
tanh 모델 (파란색): tanh 모델의 학습 손실과 검증 손실은 비교적 안정적입니다. 하지만 초기 에포크에서 검증 손실이 급격히 증가하는 패턴이 보이며, 이는 모델이 초기 단계에서 과적합될 가능성이 있음을 시사합니다.  
GRU 모델 (녹색): GRU 모델은 학습 손실이 에포크가 진행됨에 따라 감소하고 있지만, 검증 손실이 일정한 패턴 없이 변동하는 것을 볼 수 있습니다. 이는 GRU 모델이 데이터에 민감하게 반응할 수 있음을 의미합니다.  
LSTM 모델 (보라색): LSTM 모델은 학습 손실이 꾸준히 감소하는 경향을 보입니다. 그러나 검증 손실은 에포크가 진행됨에 따라 큰 변동을 보입니다. 이는 LSTM 모델이 일부 데이터셋에서 과적합되는 경향이 있음을 나타낼 수 있습니다.  
2. Wall Clock Time (오른쪽 그래프)  
x축 (Epochs): 학습 진행 시간(에포크 기준)을 나타냅니다.   
y축 (Cumulative Loss, Log Scale): 누적 손실을 로그 스케일로 표시합니다.   
그래프 해석:   
tanh 모델 (파란색): tanh 모델의 학습과 검증 손실이 다른 모델들에 비해 더 빠르게 증가하는 경향을 보입니다. 이로 인해 tanh 모델이 상대적으로 더 빠르게 학습을 완료할 수 있음을 의미할 수 있습니다.     
GRU 모델 (녹색): GRU 모델의 손실 증가율이 비교적 빠르며, 검증 손실은 시간이 지나면서 안정화되는 경향을 보입니다. 이는 GRU가 에포크 수가 증가함에 따라 더 좋은 일반화 성능을 보일 가능성이 있음을 시사합니다.   
LSTM 모델 (보라색): LSTM 모델의 누적 손실이 매우 안정적이며, 다른 모델들에 비해 천천히 증가합니다. 이는 LSTM 모델이 더 많은 계산 자원을 소모하며, 천천히 학습하지만 결과적으로 좋은 성능을 낼 가능성이 있음을 나타냅니다.   
종합 해석:    
tanh 모델: 가장 단순한 모델로, 빠르게 학습이 진행되지만, 검증 손실이 증가하는 패턴을 보이기 때문에 과적합 가능성이 있습니다.   
GRU 모델: 초기에는 불안정하지만, 시간이 지나면서 손실이 안정화되고 수렴하는 경향이 있습니다. 상대적으로 LSTM에 비해 학습이 빠르게 진행됩니다.   
LSTM 모델: 학습이 천천히 이루어지지만, 가장 안정적인 손실 곡선을 보입니다. 그러나 일부 데이터셋에서는 과적합의 징후가 보일 수 있습니다.   
1. Per Epoch 그래프 (왼쪽 그래프)   
x축 (Epochs): 모델이 학습한 에포크 수를 나타냅니다.   
y축 (Loss, Log Scale): 로그 스케일로 표시된 손실 값입니다. 값이 낮을수록 모델이 더 잘 학습하고 있음을 의미합니다.    
그래프 해석:    
tanh 모델 (파란색): tanh 모델의 학습 손실과 검증 손실은 비교적 안정적입니다. 하지만 초기 에포크에서 검증 손실이 급격히 증가하는 패턴이 보이며, 이는 모델이 초기 단계에서 과적합될 가능성이 있음을 시사합니다.    
GRU 모델 (녹색): GRU 모델은 학습 손실이 에포크가 진행됨에 따라 감소하고 있지만, 검증 손실이 일정한 패턴 없이 변동하는 것을 볼 수 있습니다. 이는 GRU 모델이 데이터에 민감하게 반응할 수 있음을 의미합니다.    
LSTM 모델 (보라색): LSTM 모델은 학습 손실이 꾸준히 감소하는 경향을 보입니다. 그러나 검증 손실은 에포크가 진행됨에 따라 큰 변동을 보입니다. 이는 LSTM 모델이 일부 데이터셋에서 과적합되는 경향이 있음을 나타낼 수 있습니다.   
2. Wall Clock Time (오른쪽 그래프)   
x축 (Epochs): 학습 진행 시간(에포크 기준)을 나타냅니다.   
y축 (Cumulative Loss, Log Scale): 누적 손실을 로그 스케일로 표시합니다.   
그래프 해석:    
tanh 모델 (파란색): tanh 모델의 학습과 검증 손실이 다른 모델들에 비해 더 빠르게 증가하는 경향을 보입니다. 이로 인해 tanh 모델이 상대적으로 더 빠르게 학습을 완료할 수 있음을 의미할 수 있습니다.   
GRU 모델 (녹색): GRU 모델의 손실 증가율이 비교적 빠르며, 검증 손실은 시간이 지나면서 안정화되는 경향을 보입니다. 이는 GRU가 에포크 수가 증가함에 따라 더 좋은 일반화 성능을 보일 가능성이 있음을 시사합니다.    
LSTM 모델 (보라색): LSTM 모델의 누적 손실이 매우 안정적이며, 다른 모델들에 비해 천천히 증가합니다. 이는 LSTM 모델이 더 많은 계산 자원을 소모하며, 천천히 학습하지만 결과적으로 좋은 성능을 낼 가능성이 있음을 나타냅니다.    
종합 해석:   
tanh 모델: 가장 단순한 모델로, 빠르게 학습이 진행되지만, 검증 손실이 증가하는 패턴을 보이기 때문에 과적합 가능성이 있습니다.    
GRU 모델: 초기에는 불안정하지만, 시간이 지나면서 손실이 안정화되고 수렴하는 경향이 있습니다. 상대적으로 LSTM에 비해 학습이 빠르게 진행됩니다.    
LSTM 모델: 학습이 천천히 이루어지지만, 가장 안정적인 손실 곡선을 보입니다. 그러나 일부 데이터셋에서는 과적합의 징후가 보일 수 있습니다.    