In [None]:
from keras.datasets import boston_housing
from keras import models
from keras import layers
import numpy as np

(train_data, train_targets), (test_data, test_targets) = boston_housing.load_data()


# 정규화 (Standard Normal Distribution; Z-Distribution)
'''
상이한 스케일을 가지고 있는 데이터를 같은 스케일로 맞추어줌.
따라서 features 별로 정규화를 진행.
특성의 중앙이 0, 표준편차가 1
'''

max_val = train_data.max(axis=0)
min_val = train_data.min(axis=0)
train_data = (train_data - min_val) / (max_val - min_val)

'''
test_data를 정규화 할 때 train_data 정규화 값을 사용하는 것은
머신러닝 작업 과정에서는 절대로 test_data의 어떠한 계산 값도 사용해서는 안되기 때문임.
'''
test_data = (test_data - min_val) / (max_val - min_val)




# Model 설정

def build_model():
    model = models.Sequential()
    model.add(layers.Dense(64, activation='relu', input_shape=(train_data.shape[1],)))
    model.add(layers.Dense(64, activation='relu'))
    model.add(layers.Dense(1))

    model.compile(optimizer='rmsprop', loss='mse', metrics=['mae'])
    return model

# mse(mean squared error) : 예측값과 실제값 차이의 제곱의 평균 -> 손실함수
# mae(mean absolute error) : 예측값에서 실제값을 뺸 절대값의 평균 -> 회귀 지표






# K-Fold cross-validation
k = 4
num_val_samples = len(train_data) // k
num_epochs = 100
all_scores = []

for i in range(k):
    # validation data & targets 설정
    val_data = train_data[i * num_val_samples : (i + 1) * num_val_samples]
    val_targets = train_targets[i * num_val_samples : (i + 1) * num_val_samples]
    
    # train data & targets 설정
    partial_train_data = np.concatenate(
    [
        train_data[ : i * num_val_samples],
        train_data[(i+1) * num_val_samples : ]
    ],axis = 0)
    
    partial_train_targets = np.concatenate(
    [
        train_targets[ : i * num_val_samples],
        train_targets[(i+1) * num_val_samples : ]
    ],axis = 0)
    
    # train
    model = build_model()
    model.fit(partial_train_data, 
              partial_train_targets,
              epochs = num_epochs,
              batch_size = 1,
              verbose = 0)
    val_mse, val_mae = model.evaluate(val_data, val_targets, verbose = 0)
    all_scores.append(val_mae)
    
    
print(all_scores)
np.mean(all_scores)