In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sqlalchemy import create_engine
import pymysql
import os
import gc
from IPython.display import clear_output
import tensorflow.keras as keras
from sklearn.model_selection import train_test_split

In [2]:
## 모델 생성용 코드
def create_model(X_train):
    model = keras.models.Sequential(
        [
            keras.layers.Dense(1024,activation="relu",input_shape=(X_train.shape[1],)),
            keras.layers.Dropout(0.2),
            keras.layers.Dense(512,activation="relu"),
            keras.layers.BatchNormalization(),
            keras.layers.Dense(256,activation="relu"),
            keras.layers.Dense(128),
            keras.layers.Dropout(0.2),
            keras.layers.Dense(64),
            keras.layers.BatchNormalization(),
            keras.layers.Dense(32),
            keras.layers.Dense(1)
        ]
    )
    
    model.summary()
    return model

In [6]:
#데이터 로드
engine = create_engine("mysql+pymysql://yoon:1234@10.10.21.81:3306/solar_power_forecast?charset=utf8")
conn = engine.connect()
y_data = pd.read_sql_table("generate_data",conn)
X_data = pd.read_sql_table("mean_weather",conn)
conn.close()

#의미없는 index칼럼 삭제
X_data = X_data.iloc[:,1:]
y_data = y_data.iloc[:,1:]

#데이터 조인 후 이전 데이터 제거
data_raw = pd.merge(X_data,y_data, how="inner", on=["TM","LOC"])
del(X_data,y_data)

In [7]:
#지역들 가져오기
data_locations = np.unique(data_raw.LOC)

In [8]:
#지역마다 반복시키기
for location in data_locations:
    print(location, "모델 작업중...")

    #과하게 차이가 큰 값 빼기
    data = data_raw.drop([378451,378809,379999,291246,141024])
    #일광이 0보다 큰 데이터로 축소하고, 사용할 컬럼 고르기
    data = data.loc[data.SS>0].loc[data.LOC==location][["WS","SS","SI","HM","PV","TS","VS","value"]]
    #마지막에 절대값 평균 오차와 비교하기위한 측정값의 평균값 저장해두기
    value_mean = data.value.mean()

    #제시할 데이터와 결론의 측정값 분리해두기
    X_raw = data.iloc[:,:-1]
    y_raw = data.iloc[:,-1]

    #train, validation, test용 분리하기
    X_, X_test, y_, y_test = train_test_split(X_raw, y_raw, test_size=0.2)
    X_train, X_validation, y_train, y_validation = train_test_split(X_, y_, test_size=0.2)

    #사용이 끝난 데이터 메모리에서 내리고 갈비지 콜렉팅하기
    del(X_, y_, X_raw, y_raw, data)
    gc.collect()

    #파일 유무 확인해서 파일이 있으면 모델을 호출해서 강화학습, 없으면 위에서 정의한 함수에 따라 모델 생성하기
    if os.path.isfile(f'./models/{location}_model.h5'):
        model = keras.models.load_model(f'./models/{location}_model.h5',compile=False)
        print("\n model +1 강 \n")
    else:
        model = create_model(X_train)
        print("\n model 제작 \n")
        print()

    #모델 컴파일 및 체크포인트 지정 후 학습시키기 (현재 에폭스 1000번)
    model.compile(optimizer="adam", loss="mean_absolute_error")
    check_point_cb = keras.callbacks.ModelCheckpoint(f'./models/{location}_model.h5', save_best_only=True)
    model.fit(X_train, y_train, epochs=1000, validation_data=(X_validation, y_validation), callbacks=[check_point_cb])

    #이전까지의 노트북 이번 셀의 출력 내용 삭제하기
    clear_output()

    #evaludate의 값과 측정값의 평균값 출력하기
    print("="*50)
    print(location, "End fitting")
    print("="*50)
    model.evaluate(X_test,y_test)
    print("비교용 평균치:",value_mean)
    print()
    

경기 End fitting
비교용 평균치: 82156202.39267135

경남 모델 작업중...
Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_14 (Dense)            (None, 1024)              8192      
                                                                 
 dropout_4 (Dropout)         (None, 1024)              0         
                                                                 
 dense_15 (Dense)            (None, 512)               524800    
                                                                 
 batch_normalization_4 (Batc  (None, 512)              2048      
 hNormalization)                                                 
                                                                 
 dense_16 (Dense)            (None, 256)               131328    
                                                                 
 dense_17 (Dense)            (None, 128)               32896    

KeyboardInterrupt: 