In [1]:
import numpy as np
import pandas as pd
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler

# ----------------------------------------
# 1. 데이터 불러오기
# ----------------------------------------
df = pd.read_csv("electricity_data.csv")  # 전력량 데이터 CSV
values = df['전력량'].values.reshape(-1, 1)

# 데이터 정규화
scaler = MinMaxScaler()
scaled = scaler.fit_transform(values)

# ----------------------------------------
# 2. 시계열 데이터셋 만들기
# ----------------------------------------
def create_dataset(data, time_steps=10):
    X, y = [], []
    for i in range(len(data) - time_steps):
        X.append(data[i:(i + time_steps), 0])
        y.append(data[i + time_steps, 0])
    return np.array(X), np.array(y)

X, y = create_dataset(scaled, time_steps=10)
X = X.reshape((X.shape[0], X.shape[1], 1))

# ----------------------------------------
# 3. LSTM 모델 정의
# ----------------------------------------
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(10, 1)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')

# ----------------------------------------
# 4. 모델 학습
# ----------------------------------------
model.fit(X, y, epochs=50, batch_size=16, verbose=1)

# ----------------------------------------
# 5. 모델 저장
# ----------------------------------------
model.save("electricity_lstm_model.h5")
print("✅ electricity_lstm_model.h5 파일이 생성되었습니다.")


KeyError: '전력량'

In [3]:
pip install SQLAlchemy

Collecting SQLAlchemy
  Downloading sqlalchemy-2.0.43-cp311-cp311-win_amd64.whl.metadata (9.8 kB)
Collecting greenlet>=1 (from SQLAlchemy)
  Downloading greenlet-3.2.4-cp311-cp311-win_amd64.whl.metadata (4.2 kB)
Downloading sqlalchemy-2.0.43-cp311-cp311-win_amd64.whl (2.1 MB)
   ---------------------------------------- 0.0/2.1 MB ? eta -:--:--
   - -------------------------------------- 0.1/2.1 MB 2.6 MB/s eta 0:00:01
   ------- -------------------------------- 0.4/2.1 MB 6.5 MB/s eta 0:00:01
   ------------------ --------------------- 1.0/2.1 MB 8.7 MB/s eta 0:00:01
   ----------------------------- ---------- 1.5/2.1 MB 8.9 MB/s eta 0:00:01
   ---------------------------------------  2.1/2.1 MB 10.4 MB/s eta 0:00:01
   ---------------------------------------- 2.1/2.1 MB 9.7 MB/s eta 0:00:00
Downloading greenlet-3.2.4-cp311-cp311-win_amd64.whl (299 kB)
   ---------------------------------------- 0.0/299.1 kB ? eta -:--:--
   ---------------------------------------- 299.1/299.1 kB 9.0 M


[notice] A new release of pip is available: 24.0 -> 25.2
[notice] To update, run: c:\Users\Admin\.pyenv\pyenv-win\versions\3.11.9\python.exe -m pip install --upgrade pip


In [4]:
pip install pymysql

Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 24.0 -> 25.2
[notice] To update, run: c:\Users\Admin\.pyenv\pyenv-win\versions\3.11.9\python.exe -m pip install --upgrade pip


In [8]:
import numpy as np
import pandas as pd
import pymysql
from sqlalchemy import create_engine
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler

# ----------------------------------------
# 1. MySQL DB 연결
# ----------------------------------------
# DB 접속 정보
DB_HOST = "localhost"    # MySQL 서버 주소
DB_USER = "root"         # 사용자명
DB_PASSWORD = "12345" # MySQL 비밀번호
DB_NAME = "electric_db"  # 사용할 데이터베이스 이름
DB_PORT = 3306           # 기본 포트

# SQLAlchemy 엔진 생성
engine = create_engine(f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}")

# 데이터 불러오기 (예: 테이블 이름이 electricity_data 이고 컬럼명이 'date', '전력량')
query = "SELECT 시간, 전력량 FROM 전력량 ORDER BY 시간 ASC"
df = pd.read_sql(query, engine)

# ----------------------------------------
# 2. 데이터 전처리
# ----------------------------------------
values = df['전력량'].values.reshape(-1, 1)

scaler = MinMaxScaler()
scaled = scaler.fit_transform(values)

# ----------------------------------------
# 3. 시계열 데이터셋 만들기
# ----------------------------------------
def create_dataset(data, time_steps=10):
    X, y = [], []
    for i in range(len(data) - time_steps):
        X.append(data[i:(i + time_steps), 0])
        y.append(data[i + time_steps, 0])
    return np.array(X), np.array(y)

# X, y = create_dataset(scaled, time_steps=10)
# X = X.reshape((X.shape[0], X.shape[1], 1))

# 🚨 문제 코드
X, y = create_dataset(scaled, time_steps=10)
X = X.reshape((X.shape[0], X.shape[1], 1))  # 여기서 IndexError

# ✅ 수정된 코드
X, y = create_dataset(scaled, time_steps=10)

# 안전한 reshape
if X.size > 0 and len(X.shape) >= 2:
    print(f"X shape before reshape: {X.shape}")
    X = X.reshape((X.shape[0], X.shape[1], 1))
    print(f"X shape after reshape: {X.shape}")
else:
    print(f"오류: X가 비어있거나 차원이 부족합니다. X shape: {X.shape}")
    print("해결 방법:")
    print("1. 더 많은 데이터를 준비하세요")
    print("2. time_steps 값을 줄여보세요")
    exit()

# ----------------------------------------
# 4. LSTM 모델 정의
# ----------------------------------------
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(10, 1)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')

# ----------------------------------------
# 5. 모델 학습
# ----------------------------------------
model.fit(X, y, epochs=50, batch_size=16, verbose=1)

# ----------------------------------------
# 6. 모델 저장
# ----------------------------------------
model.save("electricity_lstm_model.h5")
print("✅ electricity_lstm_model.h5 파일이 생성되었습니다.")

IndexError: tuple index out of range

In [2]:
import numpy as np
import pandas as pd
import pymysql
from sqlalchemy import create_engine
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense
from sklearn.preprocessing import MinMaxScaler
import os

# ----------------------------------------
# 1. MySQL DB 연결
# ----------------------------------------
DB_HOST = "localhost"
DB_USER = "root"
DB_PASSWORD = "12345"
DB_NAME = "electric_db"
DB_PORT = 3306

# SQLAlchemy 엔진 생성
try:
    engine = create_engine(f"mysql+pymysql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}")
    # 데이터 불러오기
    query = "SELECT 시간, 전력량 FROM 전력량 ORDER BY 시간 ASC"
    df = pd.read_sql(query, engine)
    print("데이터 로드 완료")
except Exception as e:
    print(f"데이터베이스 연결 또는 쿼리 오류: {e}")
    exit()

# 컬럼 이름 확인
print("컬럼 이름:", df.columns.tolist())
power_column = '전력량'  # 실제 컬럼 이름으로 변경 필요, 예: 'power_usage'
if power_column not in df.columns:
    print(f"오류: '{power_column}' 컬럼이 없습니다. 사용 가능한 컬럼: {df.columns.tolist()}")
    exit()

# 결측값 확인 및 처리
if df[power_column].isnull().any():
    print(f"경고: '{power_column}' 컬럼에 결측값이 있습니다. 결측값 제거 중...")
    df = df.dropna()
    if df.empty:
        print("오류: 결측값 제거 후 데이터가 없습니다.")
        exit()

# 데이터 유효성 확인 (숫자형인지 확인)
df[power_column] = pd.to_numeric(df[power_column], errors='coerce')
if df[power_column].isnull().any():
    print(f"경고: '{power_column}' 컬럼에 숫자가 아닌 값이 포함되어 있습니다. 결측값 제거 중...")
    df = df.dropna()
    if df.empty:
        print("오류: 비숫자 값 처리 후 데이터가 없습니다.")
        exit()

# ----------------------------------------
# 2. 데이터 전처리
# ----------------------------------------
values = df[power_column].values.reshape(-1, 1)
scaler = MinMaxScaler()
scaled = scaler.fit_transform(values)
print(f"Scaled data length: {len(scaled)}")

# ----------------------------------------
# 3. 시계열 데이터셋 만들기
# ----------------------------------------
def create_dataset(data, time_steps=10):
    if len(data) <= time_steps:
        raise ValueError(f"데이터 길이({len(data)})가 time_steps({time_steps})보다 작습니다.")
    
    X, y = [], []
    for i in range(len(data) - time_steps):
        X.append(data[i:(i + time_steps), 0])
        y.append(data[i + time_steps, 0])
    X = np.array(X)
    y = np.array(y)
    
    if X.size == 0:
        raise ValueError("생성된 X 배열이 비어 있습니다.")
    
    return X, y

# 데이터 크기 확인
time_steps = 3
if len(scaled) <= time_steps:
    print(f"오류: 데이터 길이({len(scaled)})가 time_steps({time_steps})보다 작습니다.")
    print("해결 방법: 더 많은 데이터를 준비하거나 time_steps 값을 줄이세요.")
    exit()

# 데이터셋 생성
try:
    X, y = create_dataset(scaled, time_steps=time_steps)
except ValueError as e:
    print(f"데이터셋 생성 오류: {e}")
    exit()

# X 차원 확인 및 reshape
print(f"X shape before reshape: {X.shape}")
if X.size > 0 and len(X.shape) == 2:
    X = X.reshape((X.shape[0], X.shape[1], 1))
    print(f"X shape after reshape: {X.shape}")
else:
    print(f"오류: X가 비어 있거나 2차원 배열이 아닙니다. X shape: {X.shape}")
    print("해결 방법:")
    print("1. 데이터 길이를 확인하세요 (len(scaled) > time_steps).")
    print("2. create_dataset 함수가 올바른 차원의 데이터를 반환하는지 확인하세요.")
    exit()

# ----------------------------------------
# 4. LSTM 모델 정의
# ----------------------------------------
model = Sequential()
model.add(LSTM(50, activation='relu', input_shape=(time_steps, 1)))
model.add(Dense(1))
model.compile(optimizer='adam', loss='mse')

# ----------------------------------------
# 5. 모델 학습
# ----------------------------------------
if X.shape[0] == 0 or y.shape[0] == 0:
    print("오류: 학습 데이터(X 또는 y)가 비어 있습니다.")
    exit()

model.fit(X, y, epochs=50, batch_size=16, verbose=1)

# ----------------------------------------
# 6. 모델 저장
# ----------------------------------------
model_dir = "models"
os.makedirs(model_dir, exist_ok=True)
model_path = os.path.join(model_dir, "electricity_lstm_model.h5")
model.save(model_path)
print(f"✅ {model_path} 파일이 생성되었습니다.")

데이터 로드 완료
컬럼 이름: ['시간', '전력량']
Scaled data length: 5
X shape before reshape: (2, 3)
X shape after reshape: (2, 3, 1)
Epoch 1/50


  super().__init__(**kwargs)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 817ms/step - loss: 0.5125
Epoch 2/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 0.5085
Epoch 3/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 34ms/step - loss: 0.5048
Epoch 4/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 0.5013
Epoch 5/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 0.4979
Epoch 6/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step - loss: 0.4944
Epoch 7/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step - loss: 0.4909
Epoch 8/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step - loss: 0.4873
Epoch 9/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 34ms/step - loss: 0.4839
Epoch 10/50
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 34ms/step - loss: 0.4806
Epoch 11/50
[1m1/1[0m [32m



✅ models\electricity_lstm_model.h5 파일이 생성되었습니다.
