In [1]:
import pandas as pd
import tensorflow as tf

## 배치 정규화 and/or Batch Normalization
- 배치 정규화는 각 층에서 활성화 값이 적당히 분포되도록 조정하는 것을 목표로 함
- 각 층 사이에 정규화 함수를 사용하여 (가급적이면 활성화 함수 이전에) 정규화 효과를 극대화
- 정규화로 인한 기대 효과는:
> 1. 오버피팅을 억제하고,
> 2. 학습 속도를 향상 시키고
> 3. 학습 효율성도 높임
___

## 데이터 준비

In [2]:
directory = 'https://raw.githubusercontent.com/blackdew/tensorflow1/master/csv/boston.csv'
boston = pd.read_csv(directory)

In [3]:
boston.head()

Unnamed: 0,crim,zn,indus,chas,nox,rm,age,dis,rad,tax,ptratio,b,lstat,medv
0,0.00632,18.0,2.31,0,0.538,6.575,65.2,4.09,1,296,15.3,396.9,4.98,24.0
1,0.02731,0.0,7.07,0,0.469,6.421,78.9,4.9671,2,242,17.8,396.9,9.14,21.6
2,0.02729,0.0,7.07,0,0.469,7.185,61.1,4.9671,2,242,17.8,392.83,4.03,34.7
3,0.03237,0.0,2.18,0,0.458,6.998,45.8,6.0622,3,222,18.7,394.63,2.94,33.4
4,0.06905,0.0,2.18,0,0.458,7.147,54.2,6.0622,3,222,18.7,396.9,5.33,36.2


In [4]:
ind_var = boston.iloc[:,:-1]
dep_var = boston.iloc[:,-1:]

In [5]:
print(ind_var.shape, dep_var.shape)

(506, 13) (506, 1)


## 모델의 구조 만들기

In [11]:
# 3개의 은닉층이 있는 신경망 모델을 다음과 같이 변경
#X = tf.keras.layers.Input([13])
#H = tf.keras.layers.Dense(5, activation='swish')(X) 
#H = tf.keras.layers.Dense(5, activation='swish')(H)
#H = tf.keras.layers.Dense(5, activation='swish')(H)
#y = tf.keras.layers.Dense(1)(H)


X = tf.keras.layers.Input([13])
### 이하 하나의 은닉층 구성
### 기존에는 Dense 함수로 활성화 함수까지 한번에 해결하였으나,
### 확성화 단계를 분리하고 중간에 배치정규화 단계을 삽입
H1 = tf.keras.layers.Dense(5)(X) 
H1 = tf.keras.layers.BatchNormalization()(H1)
H1 = tf.keras.layers.Activation('swish')(H1) 
### 은닉층 2
H2 = tf.keras.layers.Dense(5)(H1) 
H2 = tf.keras.layers.BatchNormalization()(H2)
H2 = tf.keras.layers.Activation('swish')(H2) 
### 은닉층 3
H3 = tf.keras.layers.Dense(5)(H2) 
H3 = tf.keras.layers.BatchNormalization()(H3)
H3 = tf.keras.layers.Activation('swish')(H3) 

y = tf.keras.layers.Dense(1)(H3)

In [12]:
model = tf.keras.models.Model(X, y)
model.compile(loss='mse')

## 모델 학습하기

In [13]:
model.fit(ind_var, dep_var, epochs=1000, verbose=0)
model.fit(ind_var, dep_var, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x1fcd8333ca0>

## 기타 신경망 모델과 성능 비교

In [14]:
## 단층
X = tf.keras.layers.Input([13])
y = tf.keras.layers.Dense(1)(X)
model2 = tf.keras.models.Model(X, y)
model2.compile(loss='mse')
model2.fit(ind_var, dep_var, epochs=1000, verbose=0)
model2.fit(ind_var, dep_var, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x1fcd5a86130>

In [15]:
## 다층 (3)
X = tf.keras.layers.Input([13])
H = tf.keras.layers.Dense(5, activation='swish')(X)
H = tf.keras.layers.Dense(5, activation='swish')(H) 
H = tf.keras.layers.Dense(5, activation='swish')(H) 
y = tf.keras.layers.Dense(1)(H)
model3 = tf.keras.models.Model(X, y)
model3.compile(loss='mse')
model3.fit(ind_var, dep_var, epochs=1000, verbose=0)
model3.fit(ind_var, dep_var, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x1fcd9940700>

- 각각 loss를 살펴보면 근소하지만, 정규화 모델이 우수한 결과를 보여주는 것을 확인 가능
> 1. 단층: 27.6
> 2. 다층(3): 17.0
> 3. 다층 정규화(3): 13.9