데이터명 : Boston Housing Price (보스턴 주택 가격 데이터)

데이터설명 : 보스턴 시의 주택 가격에 대한 데이터이다.
주택의 여러가진 요건들과 주택의 가격 정보가 포함되어 있다. 주택의 가격에 영향을 미치는 요소를 분석하고자 하는 목적으로 사용될 수 있다. 회귀분석 등의 분석에 활용될 수 있다.

보스턴 주택 데이터는 여러 개의 측정지표들 (예를 들어, 범죄율, 학생/교사 비율 등)을 포함한, 보스턴 인근의 주택 가격의 중앙값(median value)이다. 이 데이터 집합은 14개의 변수를 포함하고 있다.

필드의 이해 :
데이터의 이해를 돕기 위해 포함된 14개의 변수에 대하여 간략하게 설명한다.  
위 14개의 필드는 입력 변수로 사용되고, 맨 아래의 Play 속성이 목표(종속) 변수로 사용된다.

 [01]  CRIM	자치시(town) 별 1인당 범죄율

 [02]  ZN	25,000 평방피트를 초과하는 거주지역의 비율

 [03]  INDUS	비소매상업지역이 점유하고 있는 토지의 비율

 [04]  CHAS	찰스강에 대한 더미변수(강의 경계에 위치한 경우는 1, 아니면 0)

 [05]  NOX	10ppm 당 농축 일산화질소

 [06]  RM	주택 1가구당 평균 방의 개수

 [07]  AGE	1940년 이전에 건축된 소유주택의 비율

 [08]  DIS	5개의 보스턴 직업센터까지의 접근성 지수

 [09]  RAD	방사형 도로까지의 접근성 지수

 [10]  TAX	10,000 달러 당 재산세율

 [11]  PTRATIO	자치시(town)별 학생/교사 비율

 [12]  B	1000(Bk-0.63)^2, 여기서 Bk는 자치시별 흑인의 비율을 말함.

 [13]  LSTAT	모집단의 하위계층의 비율(%)

 [14]  MEDV	본인 소유의 주택가격(중앙값) (단위: $1,000)

In [38]:
from tensorflow import keras
(train_data, train_label), (test_data, test_label) = keras.datasets.boston_housing.load_data()

In [39]:
train_data.shape

(404, 13)

In [40]:
train_label.shape

(404,)

In [41]:
train_data[0:5]

array([[1.23247e+00, 0.00000e+00, 8.14000e+00, 0.00000e+00, 5.38000e-01,
        6.14200e+00, 9.17000e+01, 3.97690e+00, 4.00000e+00, 3.07000e+02,
        2.10000e+01, 3.96900e+02, 1.87200e+01],
       [2.17700e-02, 8.25000e+01, 2.03000e+00, 0.00000e+00, 4.15000e-01,
        7.61000e+00, 1.57000e+01, 6.27000e+00, 2.00000e+00, 3.48000e+02,
        1.47000e+01, 3.95380e+02, 3.11000e+00],
       [4.89822e+00, 0.00000e+00, 1.81000e+01, 0.00000e+00, 6.31000e-01,
        4.97000e+00, 1.00000e+02, 1.33250e+00, 2.40000e+01, 6.66000e+02,
        2.02000e+01, 3.75520e+02, 3.26000e+00],
       [3.96100e-02, 0.00000e+00, 5.19000e+00, 0.00000e+00, 5.15000e-01,
        6.03700e+00, 3.45000e+01, 5.98530e+00, 5.00000e+00, 2.24000e+02,
        2.02000e+01, 3.96900e+02, 8.01000e+00],
       [3.69311e+00, 0.00000e+00, 1.81000e+01, 0.00000e+00, 7.13000e-01,
        6.37600e+00, 8.84000e+01, 2.56710e+00, 2.40000e+01, 6.66000e+02,
        2.02000e+01, 3.91430e+02, 1.46500e+01]])

In [42]:
train_label[0:5]

array([15.2, 42.3, 50. , 21.1, 17.7])

In [43]:
# 학습 모델 만들기
from tensorflow.keras import layers

model = keras.Sequential()

model.add(layers.Dense(10,activation='relu', input_shape=(13,)))
model.add(layers.Dense(1,activation='linear'))
model.summary()
# 주어진 데이터에 맞게 input_shape을 설정
# model = model.add ( layers.Dense( ... ) )
# ....

# 마지막 layer는 출력에 맞게 Dense(1, activation='...')


Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_4 (Dense)             (None, 10)                140       
                                                                 
 dense_5 (Dense)             (None, 1)                 11        
                                                                 
Total params: 151 (604.00 Byte)
Trainable params: 151 (604.00 Byte)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [44]:
# loss 함수 정하기
# model.compile( ... )
model.compile(optimizer='rmsprop', loss='mse', metrics='mae')

In [45]:
# 학습하기
# model.fit( ... )
model.fit(train_data,train_label,epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x2a1527e10>

In [46]:
print(train_label[:3])

[15.2 42.3 50. ]


In [47]:
# 손실이 너무 크므로 표준화 작업이 필요하다.

from sklearn.preprocessing import StandardScaler

sc = StandardScaler()
train_label = train_label.reshape((-1,1))
sc.fit(train_label)
train_label = sc.transform(train_label)
print(train_label[:3])

[[-0.7821526 ]
 [ 2.16380844]
 [ 3.00085272]]


In [48]:
model.fit(train_data,train_label,epochs=100)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


<keras.src.callbacks.History at 0x176ce3950>