In [1]:
from keras.datasets import boston_housing

(train_data, train_targets), (test_data, test_targets) = boston_housing.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/boston_housing.npz


In [2]:
print(train_data.shape)
print(test_data.shape)

(404, 13)
(102, 13)


404개의 훈련 샘플과 102개의 테스트 샘플이 존재, 모두 13개의 수치 특성이 존재

특성들은 '1인당 범죄율', '주택당 평균 방의 개수', '고속도고 접근성' 등

In [3]:
train_targets

array([15.2, 42.3, 50. , 21.1, 17.7, 18.5, 11.3, 15.6, 15.6, 14.4, 12.1,
       17.9, 23.1, 19.9, 15.7,  8.8, 50. , 22.5, 24.1, 27.5, 10.9, 30.8,
       32.9, 24. , 18.5, 13.3, 22.9, 34.7, 16.6, 17.5, 22.3, 16.1, 14.9,
       23.1, 34.9, 25. , 13.9, 13.1, 20.4, 20. , 15.2, 24.7, 22.2, 16.7,
       12.7, 15.6, 18.4, 21. , 30.1, 15.1, 18.7,  9.6, 31.5, 24.8, 19.1,
       22. , 14.5, 11. , 32. , 29.4, 20.3, 24.4, 14.6, 19.5, 14.1, 14.3,
       15.6, 10.5,  6.3, 19.3, 19.3, 13.4, 36.4, 17.8, 13.5, 16.5,  8.3,
       14.3, 16. , 13.4, 28.6, 43.5, 20.2, 22. , 23. , 20.7, 12.5, 48.5,
       14.6, 13.4, 23.7, 50. , 21.7, 39.8, 38.7, 22.2, 34.9, 22.5, 31.1,
       28.7, 46. , 41.7, 21. , 26.6, 15. , 24.4, 13.3, 21.2, 11.7, 21.7,
       19.4, 50. , 22.8, 19.7, 24.7, 36.2, 14.2, 18.9, 18.3, 20.6, 24.6,
       18.2,  8.7, 44. , 10.4, 13.2, 21.2, 37. , 30.7, 22.9, 20. , 19.3,
       31.7, 32. , 23.1, 18.8, 10.9, 50. , 19.6,  5. , 14.4, 19.8, 13.8,
       19.6, 23.9, 24.5, 25. , 19.9, 17.2, 24.6, 13

In [4]:
train_targets.shape

(404,)

상이한 스케일을 가진 값을 신경망에 주입하게 되면 문제가 생김
==> 정규화 해야 함
입력 데이터에 있는 각 특성에 대해 특성의 평균을 빼고 표준 편차로 나눔

In [5]:
mean = train_data.mean(axis = 0)
train_data -= mean
std = train_data.std(axis = 0)
train_data /= std

test_data -= mean
test_data /= std

테스트 데이터를 정규화할 때 사용한 값이 훈련 데이터에서 계산한 값ㅇ르 사용 ==> **머신 러닝 작업 과정에서 절대로 테스트 데이터에서 계산한 어떠한 값도 사용해선 안됨**

In [8]:
from keras import models
from keras import layers

from keras import optimizers

def build_model():  # 동일한 모델을 여러 번 생성할 것이므로 함수를 만들어 사용
    model = models.Sequential()
    model.add(layers.Dense(64, activation='relu', input_shape=(train_data.shape[1],)))
    model.add(layers.Dense(64, activation='relu'))
    model.add(layers.Dense(1))
    model.compile(optimizers.RMSprop(lr=0.001), loss='mse', metrics=['mae'])
    
    return model

네트워크의 마지막 층은 하나의 유닛을 가지고 활성화 함수가 존재하지 않음(선형 층)
==> 전형적인 스칼라 회귀(하나의 연속적인 값을 예측하는 회귀)를 위한 구성

mse 손실 함수를 사용해 컴파일, 평균 제곱 오차(mean squared error)의 약어로 회귀 문제에서 널리 사용되는 손실함수

In [None]:
import numpy as np

k = 4

num_val_samples = len(train_data) // k
num_epochs = 100
all_scores = []

for i in range(k):
    print('처리중인 폴드 #',i)
    # 검증 데이터 준비
    val_data = train_data[i * num_val_samples : (i+1) * num_val_samples]  
    val_targets = train_targets[i * num_val_samples : (i+1) * num_val_samples]
    
    # 훈련 데이터 준비: 다른 분할 전체
    partial_train_data = np.concatenate([train_data[: i*num_val_samples], 
                                         train_data[(i + 1)*num_val_samples : ]],
                                       axis = 0)
    partial_train_targets = np.concatenate([train_targets[: i*num_val_samples], 
                                            train_targets[(i + 1)*num_val_samples : ]],
                                           axis = 0)
    
    
    model = build_model()
    model.fit(partial_train_data, partial_train_targets, epochs=num_epochs, batch_size=1, verbose=0)
    
    # 검증 세트로 모델 평가
    val_mse, val_mae = model.evaluate(val_data, val_targets, verbose = 0)
    all_scores.append(val_mae)

처리중인 폴드 # 0


  super().__init__(name, **kwargs)
2022-12-19 21:21:48.182633: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.
2022-12-19 21:23:10.405481: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.


처리중인 폴드 # 1


2022-12-19 21:23:11.138764: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.
2022-12-19 21:24:33.551387: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.
2022-12-19 21:24:33.728367: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.


처리중인 폴드 # 2


2022-12-19 21:25:55.758203: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.
2022-12-19 21:25:55.936285: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:114] Plugin optimizer for device_type GPU is enabled.


처리중인 폴드 # 3


In [None]:
all_scores