## 보스턴 주택 가격 데이터셋 다운로드

In [None]:
from tensorflow.keras.datasets.boston_housing import load_data
import tensorflow as tf

# 데이터를 다운받습니다.
(x_train, y_train), (x_test, y_test) = load_data(path='boston_housing.npz',
                                                 test_split=0.2,
                                                 seed=777)

## 데이터 형태 확인하기

In [None]:
print(x_train.shape, y_train.shape)
print(x_test.shape, y_test.shape)

## 데이터 전처리 및 검증 데이터셋 만들기

In [None]:
norm_layer = tf.keras.layers.Normalization(axis = -1)
norm_layer.adapt(x_train)

# 훈련 데이터셋과 검증 데이터셋으로 나눕니다.
from sklearn.model_selection import train_test_split

x_train, x_val, y_train, y_val = train_test_split(x_train, y_train, 
                                                  test_size = 0.33, 
                                                  random_state = 777)

## 모델 구성하기

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input



model = Sequential([
    Input(shape = (13, )),
    norm_layer
])

# 입력 데이터의 형태를 꼭 명시해야 합니다.
# 13차원의 데이터를 입력으로 받고, 64개의 출력을 가지는 첫 번째 Dense 층
model.add(Dense(64, activation = 'relu', input_shape = (13, )))
model.add(Dense(32, activation = 'relu')) # 32개의 출력을 가지는 Dense 층
model.add(Dense(1)) # 하나의 값을 출력합니다.

model.compile(optimizer = 'adam', loss = 'mse', metrics = ['mae'])

## 학습하고 평가하기

In [None]:
history = model.fit(x_train, y_train, 
                    epochs = 300, 
                    validation_data = (x_val, y_val))

In [None]:
model.evaluate(x_test, y_test)

## K-Fold 사용하기

In [None]:
from tensorflow.keras.datasets.boston_housing import load_data
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Input
import tensorflow as tf

from sklearn.model_selection import KFold

(x_train, y_train), (x_test, y_test) = load_data(path='boston_housing.npz',
                                                 test_split=0.2,
                                                 seed=777)

norm_layer = tf.keras.layers.Normalization(axis = -1)
norm_layer.adapt(x_train)

#----------------------------------------
# K-Fold를 진행해봅니다.
k = 3

# 주어진 데이터셋을 k만큼 등분합니다.
# 여기서는 3이므로 훈련 데이터셋(404개)를 3등분하여
# 1개는 검증셋으로, 나머지 2개는 훈련셋으로 활용합니다.
kfold = KFold(n_splits = k, shuffle = True, random_state = 777)

# 재사용을 위해 모델을 반환하는 함수를 정의합니다.
def get_model():
    model = Sequential([
                Input(shape = (13, )),
                norm_layer
            ])
    model.add(Dense(64, activation = 'relu', input_shape = (13, )))
    model.add(Dense(32, activation = 'relu')) 
    model.add(Dense(1))   

    model.compile(optimizer = 'adam', loss = 'mse', metrics = ['mae'])
    
    return model

mae_list = [] # 테스트셋을 평가한 후 결과 mae를 담을 리스트를 선언합니다.

# k번 진행합니다.
for train_index, val_index in kfold.split(x_train):
    # 해당 인덱스는 무작위로 생성됩니다.
    # 무작위로 생성해주는 것은 과대적합을 피할 수 있는 좋은 방법입니다.
    x_train_fold, x_val_fold = x_train[train_index], x_train[val_index]
    y_train_fold, y_val_fold = y_train[train_index], y_train[val_index]
    
    # 모델을 불러옵니다.
    model = get_model()
    
    model.fit(x_train_fold, y_train_fold, epochs = 10, validation_data = (x_val_fold, y_val_fold))
    
    _, test_mae = model.evaluate(x_test, y_test)
    mae_list.append(test_mae)

## K-Fold 결과 확인하기

In [None]:
import numpy as np

print(f'- 전체 결과: {mae_list}')
print(f'- 평균낸 결과를 최종 결과로 사용합니다: {np.mean(mae_list)}')