# 11장
### 11-1, 11-3
----

### Optimizer, Activation, Initializer를 조합하여 모델을 만들고 평가해 봅니다.

* 수렴이 언제부터 시작되나요? 

* 모델의 성능은 어떤가요?

* 전체 훈련 속도는 몇인가요? 

----

# [ 0 ] 

* CIFAR10 데이터셋을 불러오세요. keras.datasets.cifar10.load_ data()를 사용하여 데이터를 적재할 수 있습니다.
* 데이터셋의 차원을 확인해봅시다.
* Dense layer을 사용하기 때문에 데이터의 shape을 1차원으로 바꿔야 합니다. ( np.reshape(데이터, (바꿀shape) ) 사용)

In [3]:
import tensorflow as tf
import numpy as np

In [4]:
# load
(x_train, y_train), (x_test, y_test) =  tf.keras.datasets.cifar10.load_data()
x_train.shape, y_train.shape, x_test.shape, y_test.shape

((50000, 32, 32, 3), (50000, 1), (10000, 32, 32, 3), (10000, 1))

In [5]:
# reshape
x_train = np.reshape(x_train,(50000, 32*32*3))
x_test = np.reshape(x_test, (10000, 32*32*3))
x_train.shape, x_test.shape

((50000, 3072), (10000, 3072))

In [6]:
# normalization

pixel_means = x_train.mean(axis=0, keepdims=True)
pixel_stds = x_train.std(axis=0, keepdims=True)
x_train_scaled = (x_train - pixel_means) / pixel_stds
x_test_scaled = (x_test - pixel_means) / pixel_stds


----
# [ 1 ]

* **100**개의 뉴런을 가진 **은닉층** **20개**를 쌓아 심층 신경망을 만듭니다.
* 모든 은닉층의 initializer는 **He 초기화**를, 활성화 함수는 **Relu** 함수를 사용합니다.
* 출력층은 **10개**의 뉴런과 **소프트맥스 활성화** 함수를 사용합니다. 
* 출력층에서는 Initializer를 사용하지 않습니다. 

In [5]:
def make_model_1():
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.InputLayer((32*32*3)))

    for _ in range(20):
        model.add(tf.keras.layers.Dense(100, activation="relu", kernel_initializer='he_normal'))  
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
    return model

## 1-1 )

* 옵티마이저는 **Adam**를 사용합니다. 
* 모델 저장 이름은 **1-1_model.h5** 로 합니다.

In [6]:
tf.__version__, tf.keras.__version__

('2.3.0', '2.4.0')

In [7]:
#모델 생성
model=make_model_1()

# 모델 컴파일
model.compile(loss="sparse_categorical_crossentropy",
              optimizer=tf.keras.optimizers.Adam(),
              metrics=["accuracy"])

# 콜백 선언
model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint("1-1_model.h5", save_best_only=True)

# 모델 훈련
model.fit(x_train_scaled, y_train, 
          validation_split=0.2,
          epochs=20,
          callbacks=[model_checkpoint_cb])

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f99cf532430>

## 1-2 )

* 옵티마이저는 **Adam**을 사용합니다. Adam의 파라미터 **beta1**, **beta2**를 0.9, 0.999로 초기화 합니다. 
* 콜백 ModelCheckpoint의 저장 이름을 **1-2_model.h5**로 바꿉니다.

In [9]:
# 모델 생성
model=make_model_1()

# 모델 컴파일
model.compile(loss="sparse_categorical_crossentropy",
              optimizer=tf.keras.optimizers.Adam(beta_1=0.9, beta_2=0.999),
              metrics=["accuracy"])

# 콜백 선언
model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint("1-2_model.h5", save_best_only=True)

# 모델 훈련
model.fit(x_train_scaled, y_train, 
          validation_split=0.2,
          epochs=20,
          callbacks=[model_checkpoint_cb])


Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f9a4035a7f0>

----
# [ 2 ]

* **100**개의 뉴런을 가진 **은닉층** **20개**를 쌓아 심층 신경망을 만듭니다.
* 모든 은닉층의 initializer는 **He 초기화**를, 활성화 함수는 **Elu** 함수를 사용합니다.
* 출력층은 **10개**의 뉴런과 **소프트맥스 활성화** 함수를 사용합니다. 
* 출력층에서는 **initializer**를 사용하지 않습니다. 

In [10]:
def make_model_2():
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.InputLayer((32*32*3)))
    
    for _ in range(20):
        model.add(tf.keras.layers.Dense(100, activation="elu", kernel_initializer='he_normal'))  
    
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
    
    return model

## 2-1 )

* 옵티마이저는 **Adam**을 사용합니다. Adam의 파라미터 **beta1**, **beta2**를 0.9, 0.999로 초기화 합니다. 
* 콜백 ModelCheckpoint의 저장 이름을 **2-1_model.h5**로 바꿉니다.

In [11]:
# 모델 생성
model = make_model_2()

# 모델 컴파일
model.compile(loss="sparse_categorical_crossentropy",
              optimizer=tf.keras.optimizers.Adam(beta_1=0.9, beta_2=0.999),
              metrics=["accuracy"])

# 콜백 선언
model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint("2-1_model.h5", save_best_only=True)

# 모델 훈련
model.fit(x_train_scaled, y_train, 
          validation_split=0.2,
          epochs=20,
          callbacks=[model_checkpoint_cb])

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f9a404b38b0>

## 2-2 )

* 옵티마이저는 **Nadam**을 사용합니다. Ndam의 학습률을 **5e-5** 로 초기화합니다
* 콜백 ModelCheckpoint의 저장 이름을 **2-2_model.h5**로 바꿉니다.

In [12]:
# 모델 생성
model = make_model_2()

# 모델 컴파일
model.compile(loss="sparse_categorical_crossentropy",
              optimizer=tf.keras.optimizers.Nadam(learning_rate=5e-5),
              metrics=["accuracy"])

# 콜백 선언
model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint("2-2_model.h5", save_best_only=True)

# 모델 훈련
model.fit(x_train_scaled, y_train, 
          validation_split=0.2,
          epochs=20,
          callbacks=[model_checkpoint_cb])

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f9a20030670>

----
# [  3 ] 

* **100**개의 뉴런을 가진 **은닉층** **20개**를 쌓아 심층 신경망을 만듭니다.
* 모든 은닉층의 initializer는 **He 초기화**를, 활성화 함수는 **Elu** 함수를 사용합니다.
* 모든 은닉층의 다음층에서 BatchNormaliztion을 수행합니다. 
* 출력층은 **10개**의 뉴런과 **소프트맥스 활성화** 함수를 사용합니다. 
* 출력층에서는 **initializer**를 사용하지 않습니다. 
* 출력층 다음층에서는 BatchNormalization을 수행하지 않습니다.

In [7]:
def make_model_3():
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.InputLayer((32*32*3)))
    model.add(tf.keras.layers.BatchNormalization())
    
    for _ in range(20):
        model.add(tf.keras.layers.Dense(100, activation="elu", kernel_initializer='he_normal'))  
        model.add(tf.keras.layers.BatchNormalization())
    
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
    
    return model

* 옵티마이저는 **Nadam**을 사용합니다. Ndam의 학습률을 **5e-5** 로 초기화합니다
* 콜백 ModelCheckpoint의 저장 이름을 **3_model.h5**로 바꿉니다.

In [8]:
# 모델 생성
model = make_model_3()

# 모델 컴파일
model.compile(loss="sparse_categorical_crossentropy",
              optimizer=tf.keras.optimizers.Nadam(learning_rate=5e-5),
              metrics=["accuracy"])

# 콜백 선언
model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint("3_model.h5", save_best_only=True)

# 모델 훈련
model.fit(x_train_scaled, y_train, 
          validation_split=0.2,
          epochs=20,
          callbacks=[model_checkpoint_cb])

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7fc0a6473400>

----
# [  4 ] 

* **100**개의 뉴런을 가진 **은닉층** **20개**를 쌓아 심층 신경망을 만듭니다.
* 모든 은닉층의 initializer는 **르쿤 초기화**를, 활성화 함수는 **Selu** 함수를 사용합니다.
* 출력층은 **10개**의 뉴런과 **소프트맥스 활성화** 함수를 사용합니다. 
* 출력층에서는 **initializer**를 사용하지 않습니다.

In [17]:
def make_model_4():
    model = tf.keras.models.Sequential()
    model.add(tf.keras.layers.InputLayer((32*32*3)))
    
    for _ in range(20):
        model.add(tf.keras.layers.Dense(100, activation="selu", kernel_initializer='lecun_normal'))  
    
    model.add(tf.keras.layers.Dense(10, activation="softmax"))
    
    return model

* 옵티마이저는 **Nadam**을 사용합니다. Ndam의 학습률을 **5e-5** 로 초기화합니다
* 콜백 ModelCheckpoint의 저장 이름을 **4_model.h5**로 바꿉니다.

In [18]:
# 모델 생성
model = make_model_4()

# 모델 컴파일
model.compile(loss="sparse_categorical_crossentropy",
              optimizer=tf.keras.optimizers.Nadam(learning_rate=5e-5),
              metrics=["accuracy"])

# 콜백 선언
model_checkpoint_cb = tf.keras.callbacks.ModelCheckpoint("4_model.h5", save_best_only=True)

# 모델 훈련
model.fit(x_train_scaled, y_train, 
          validation_split=0.2,
          epochs=20,
          callbacks=[model_checkpoint_cb])

Epoch 1/20
Epoch 2/20
Epoch 3/20
Epoch 4/20
Epoch 5/20
Epoch 6/20
Epoch 7/20
Epoch 8/20
Epoch 9/20
Epoch 10/20
Epoch 11/20
Epoch 12/20
Epoch 13/20
Epoch 14/20
Epoch 15/20
Epoch 16/20
Epoch 17/20
Epoch 18/20
Epoch 19/20
Epoch 20/20


<tensorflow.python.keras.callbacks.History at 0x7f98930cb550>

## [ 5 ]

* 지금까지 만든 6가지 모델을 불러오고 평가해 봅니다.
* **tf.keras.models.load_model( )**을 통해 모델을 불러올 수 있습니다.
* **model.evaluate( )**를 통해 모든 모델을 평가해 봅니다.
* 불러오기 전에 아래 셀에서 각 모델의 특징을 간단히 메모하세요

* model_11:
* model_12:
* model_21:
* model_22:
* model_3:
* model_4:

In [10]:
model_11 = tf.keras.models.load_model("1-1_model.h5")
model_12 = tf.keras.models.load_model("1-2_model.h5")
model_21 = tf.keras.models.load_model("2-1_model.h5")
model_22 = tf.keras.models.load_model("2-2_model.h5")
model_3 = tf.keras.models.load_model("3_model.h5")
model_4 = tf.keras.models.load_model("4_model.h5")

print("model_11\n")
model_11.evaluate(x_test_scaled, y_test)
print("\nmodel_12\n")
model_12.evaluate(x_test_scaled, y_test)
print("\nmodel_21\n")
model_21.evaluate(x_test_scaled, y_test)
print("\nmodel_22\n")
model_22.evaluate(x_test_scaled, y_test)
print("\nmodel_3\n")
model_3.evaluate(x_test_scaled, y_test)
print("\nmodel_4\n")
model_4.evaluate(x_test_scaled, y_test)

model_11


model_12


model_21


model_22


model_3


model_4



[1.4865167140960693, 0.10589999705553055]