<font color="#CC3D3D"><p>
# Creating deep neural networks with various structures

<font color="blue"><p>
아래와 같은 구조를 갖는 DNN을 만들어보자.   
<img align='left' src='http://drive.google.com/uc?export=view&id=1Yx64HH33yGZW5CZmey1wtBwj4KLqn4kA' /><br>

####  전역변수 설정

In [None]:
DNN_VERSION = 3.0  # submission 화일명에 사용
SEED = 0           # random_state 지정

In [None]:
%matplotlib inline
import warnings
warnings.filterwarnings("ignore")

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import random

import tensorflow as tf
from tensorflow import keras
print(tf.__version__)

In [None]:
# 매번 모델링을 할 때마다 동일한 결과를 얻으려면 아래 코드를 실행해야 함.

def reset_seeds(reset_graph_with_backend=None):
    if reset_graph_with_backend is not None:
        K = reset_graph_with_backend
        K.clear_session()
        tf.compat.v1.reset_default_graph()
        print("KERAS AND TENSORFLOW GRAPHS RESET")  # optional

    np.random.seed(SEED)
    random.seed(SEED)
    tf.compat.v1.set_random_seed(SEED)
#    os.environ['CUDA_VISIBLE_DEVICES'] = ''  # for GPU
    print("RANDOM SEEDS RESET")  # optional
   
reset_seeds()

#### 데이터 로딩

In [None]:
# 학습 데이터
X_train = pd.read_csv('X_train_preprocessed.csv').drop(columns='ID')
y_train = pd.read_csv('y_train.csv').Salary

# 평가 데이터
X_test = pd.read_csv('X_test_preprocessed.csv')
test_id = X_test.ID
X_test = X_test.drop(columns='ID')

<font color="blue"><p>
#### DNN 모형 생성

<font color="blue"><p>
- 1단계: 모형 정의하기 (입력층/은익층/출력층 쌓기)

In [None]:
inputs = keras.Input(shape=X_train.shape[1], ) 
y = keras.layers.Dense(1, activation='elu')(inputs)
x = keras.layers.BatchNormalization()(inputs)
x = keras.layers.Dense(128, activation='elu')(x)  
x = keras.layers.Dense(64, activation='elu')(x)  
x = keras.layers.Dense(1, activation='linear')(x)  
x = keras.layers.Add()([x,y])  
output = keras.layers.Dense(1, activation='linear')(x)  

model = keras.Model(inputs=inputs, outputs=output)      

In [None]:
# 모형 구조 출력: Total params가 많을수록 복잡한 모델임.
print(model.summary())

# 연결 그래프 시각화: graphviz와 pydot 설치 필요 (graphviz 다운로드하고 설치한 후 pip install pydot)
keras.utils.plot_model(model, show_shapes=True, show_layer_names=False, show_layer_activations=True, dpi=70)

<font color="blue"><p>
- 2단계: 학습방식(손실함수/옵티마이저/평가척도) 설정하기

In [None]:
model.compile(
    loss='mse',
    optimizer=keras.optimizers.Adam(),                     
    metrics=[keras.metrics.RootMeanSquaredError(name='rmse')]
)

<font color="blue"><p>
- 3단계: 모형 학습하기 (에포크, 배치사이즈, 조기중단 등 지정) 

In [None]:
hist = model.fit(
    x=X_train,
    y=y_train,
    validation_split=0.1,
    batch_size=64, 
    epochs=200, 
    callbacks=[keras.callbacks.EarlyStopping(monitor='val_loss', patience=5)], 
    shuffle=False,
    verbose=2,
)

In [None]:
# 러닝커브 그리기: 학습이 잘되었는지 어느정도 판단할 수 있음.

plt.plot(hist.history['rmse'], label="train")
plt.plot(hist.history['val_rmse'], label="valid")
plt.xlabel('epoch')
plt.ylabel('RMSE')
plt.legend()
plt.show()

<font color="blue"><p>
- 4단계: 예측하기

In [None]:
# 예측값 얻기: sklearn 과 달리 2차원 array로 출력 => 1차원으로 변경 필요.
pred = model.predict(X_test).flatten()

# submission 화일 생성
filename = f'dnn_{DNN_VERSION}_{hist.history["val_rmse"][-1]:.2f}.csv'
pd.DataFrame({'ID':test_id, 'Salary':pred}).to_csv(filename, index=False)

print(f'{filename} is ready to submit.')

<font color="#CC3D3D"><p>
# End