# Sequential API를 이용한 MLP

In [None]:
import tensorflow as tf 
from tensorflow import keras 

### Fashion Dataset

In [None]:
### 데이터 적재 
# fashion dataset : 60000 x 28 x 28 크기 
fashion_mnist = keras.datasets.fashion_mnist 
(X_train_full, y_train_full), (X_test, y_test) = fashion_mnist.load_data()

In [None]:
X_train_full.shape

In [None]:
X_train_full.dtype

##### 경사 하강법으로 신경망 훈련, 입력 특성의 스케일 조정 필요 

In [None]:
# 훈련세트와 테스트 세트 분리 
X_valid = X_train_full[:5000] / 255.0
X_train = X_train_full[5000:] / 255.0
y_valid = y_train_full[:5000] / 255.0
y_train = y_train_full[5000:] / 255.0
X_test = X_test / 255.0 

##### 패션 아이템을 나타내기 위한 클래스 설정

In [None]:
class_names = ["T-shirt/top", "Trouser", "Pullover", "Dress", "Coat", "Sandal", "Shirt", "Sneaker", "Bag", "Ankle boot"]

##### Sequential API 사용 모델 만들기
$$ 은닉층 연산 : h_{W,b}(X) = \theta{(XW + b)} $$
$$ W : 편향 뉴런을 제외한 모든 연결 가중치 $$
$$ 편향 벡터 b : 편향 뉴런과 인공 뉴런 사이의 모든 연결 가중치 $$

###### Sequential 객체 생성 1. 

In [None]:
# Sequential 객체  : 순서대로 연결된 층을 일렬로 쌓아서 구성 

# Sequential 객체 생성 
model = keras.models.Sequential() 


# 입력 레이어 
    # Flatteen
    # 1. 입력 이미지를 1D 배열로 변환 
    # 2. X입력 -> X = X.reshape(-1, 1) 연산 
# 전처리 
model.add(keras.layers.Flatten(input_shape = [ 28, 28] )) 

# 300개를 가진 Dnese은닉층, relu 활성화함수 사용 
# Dense마다 각자 가중치 행렬 관리 
model.add(keras.layers.Dense(300, activation = 'relu'))
model.add(keras.layers.Dense(100, activation = 'relu'))

# 배타적 클래스 분류 : 소프트 맥스 
model.add(keras.layers.Dense(10, activation = 'softmax'))

###### Sequential 객체 생성 2

In [None]:
model = keras.models.Sequential([
    keras.layers.Flatten(input_shape=[28,28]),
    keras.layers.Dense(300, activation = 'relu'),
    keras.layers.Dense(100, activation = 'relu'),
    # 출력층 
    keras.layers.Dense(10, activation = 'softmax')
])

In [None]:
model.summary()

첫번째 층 : 784 * 300개 연결 가중치 + 300개의 편향 = 235500
-> 많은 파라미터 : 과대적합의 위험 

In [None]:
model.layers

In [None]:
hidden1 = model.layers[1]
# model.get_layer('dense_19') is hidden1

###### get_weights(), set_weights() 메소드 
바이아스 : 0 초기화
가중치 : 무작위 초기화 

In [None]:
weights, biases = hidden1.get_weights()
weights

In [None]:
weights.shape

In [None]:
biases

##### 모델 컴파일 

In [None]:
model.compile(loss = 'sparse_categorical_crossentropy',
             optimizer = 'sgd',
             metrics = ['accuracy'])

###### 모델 훈련과 평가 
➤ 훈련 정확도와, 검증 정확도의 차이로 과대 적합 확인 가능 

In [None]:
history = model.fit(X_train, y_train,   # 학습 데이터
                    epochs = 10,        # 에포크  
                    validation_data = (X_valid, y_valid))
                                        # 검증 세트 : 각 에포크마다, 손실 및 지표 확인  

### California Housing 

In [None]:
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

In [None]:
housing = fetch_california_housing()

In [None]:
print(housing.data)
housing.data.shape # 8개의 컬럼, 20640개의 열 
# 20640 x 8 행렬 

In [None]:
# 행렬의 행, 열 변환되서 들어옴 

# 테스트 셋, 사용할 세트 분리
X_train_full, X_test, y_train_full, y_test = \
        train_test_split(housing.data, housing.target)

# 학습 셋, 검증 셋 분리
X_train, X_valid, y_train, y_valid = \
        train_test_split(X_train_full, y_train_full)

In [300]:
X_train.shape[1:]

(8,)

In [301]:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_valid = scaler.transform(X_valid)
X_test = scaler.transform(X_test)

In [302]:
model = keras.models.Sequential([
    keras.layers.Dense(30, activation = 'relu', 
                      input_shape = X_train.shape[1:]),
    keras.layers.Dense(1)
])
    # 8 개의 칼럼의 데이터들이 입력값으로 들어옴 
    # a : 1, 2, 3,.....
    # b : 4, 5, 6,.....
    # c : 7, 8, 9,.....

model.compile(loss = 'mean_squared_error', 
              optimizer = 'sgd')

history = model.fit(X_train, y_train, epochs = 20, 
                   validation_data = (X_valid, y_valid))

mse_test = model.evaluate(X_test, y_test)

X_new = X_test[:3]
y_pred = model.predict(X_new)

Train on 11610 samples, validate on 3870 samples
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


### 10.2.함수형 API 

###### Deep and Wide 신경망 

In [303]:
input_ = keras.layers.Input(shape = X_train.shape[1:])
# 모델 입력 정의 

hidden1 = keras.layers.Dense(30, activation = 'relu')(input_)
# 입력과 함께 호출 -> 함수형 API 

hidden2 = keras.layers.Dense(30, activation = 'relu')(hidden1)
# 첫번째 출력 전달 

concat = keras.layers.Concatenate()([input_, hidden1])
# 주어진 입력으로 바로 호출 

output = keras.layers.Dense(1)(concat)
# 하나의 뉴런과 활성화 함수가 없는 층을 통해, 주어진 입력 바로 호출 

model = keras.Model(inputs = [input_], outputs = [output])
# 사용할 입력과 출력을 지정, model 생성 

In [304]:
'''
A - - - - - - - - - concat - output 
B - 은닉1 - 은닉2 /
'''
input_A = keras.layers.Input(shape=[5], name = 'wide_input')

input_B = keras.layers.Input(shape=[6], name = 'deep_input')
hidden1 = keras.layers.Dense(30, activation = 'relu')(input_B)
hidden2 = keras.layers.Dense(30, activation = 'relu')(hidden1)

concat = keras.layers.concatenate([input_A, hidden2])

output = keras.layers.Dense(1, name='output')(concat) # 단순 출력층 ㄷ

model = keras.Model(inputs = [input_A, input_B], outputs = [output])

In [305]:
X_train.shape

(11610, 8)

In [None]:
model.compile(loss = 'mse',
             optimizer = keras.optimizers.SGD(lr= 1e-3))

X_train_A, X_train_B = X_train[:, :5], X_train[:, 2:]
X_valid_A, X_valid_B = X_valid[:, :5], X_valid[:, 2:]
X_test_A, X_test_B = X_test[:, :5], X_test[:, 2:] 

X_new_A, X_new_B = X_test_A[:3], X_test_B[:3]

history = model.fit((X_train_A, X_train_B), y_train,
                   epochs = 20,
                   validation_data = ((X_valid_A, X_valid_B), y_valid))

mse_test = model.evaluate((X_test_A, X_test_B), y_test)
y_pred = model.predict((X_new_A, X_new_B))

Train on 11610 samples, validate on 3870 samples
Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
   32/11610 [..............................] - ETA: 0s - loss: 0.4851

### 10.2.6 모델 저장과 복원 

In [None]:
model.save('deep_wide_model.h5') 
deep_wide_model = keras.models.load_model('deep_wide_model.h5')
model.summary()

### 콜백 사용하기 

In [None]:
checkpoint_cb = keras.callbacks.ModelCheckpoint('deep_wide_model.h5')

In [None]:
history = model.fit(X_train, y_train, epochs = 10, callbacks=[checkpoint_cb])