## 3.1 옵티마이저

In [1]:
import tensorflow as tf

model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dense(10, activation='softmax')
])

In [2]:
# 텐서플로에 내장된 옵티마이저 목록을 출력해 봅니다. 
# 'Adadelta', 'Adagrad', 'Adam', 'Adamax', 'Ftrl', 'Nadam', 'Optimizer', 'RMSprop', 'SGD' 등의 옵티마이저를 제공하고 있습니다.
print(dir(tf.keras.optimizers))

['Adadelta', 'Adagrad', 'Adam', 'Adamax', 'Ftrl', 'Nadam', 'Optimizer', 'RMSprop', 'SGD', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '_sys', 'deserialize', 'get', 'schedules', 'serialize']


In [3]:
# 아담(adam)은 RMSProp과 모멘텀의 기능을 결합한 옵티마이저입니다. 
# 손실 함수의 기울기에 따라 학습률을 조절하면서 관성을 이용해 지역 최솟값에 갇히지 않고 전체 최솟값을 찾습니다. 
# 두 가지 옵티마이저의 장점이 합쳐진 아담은 대체적으로 좋은 성능을 내는 옵티마이저입니다.
# learning_rate 등의 옵션을 설정해서 사용할 수 있습니다.
tf.keras.optimizers.Adam(
    learning_rate=0.001,
    beta_1=0.9,
    beta_2=0.999,
    epsilon=1e-07,
    amsgrad=False,
    name='Adam')

<tensorflow.python.keras.optimizer_v2.adam.Adam at 0x7ffe58157b90>

## 3.2 모델 컴파일

In [4]:
# 모델을 컴파일 합니다. 이 때 최적화 함수로는 adam을 사용합니다. 
# loss는 손실 함수(Loss function)로 훈련 하는 동안 모델의 오차를 측정합니다. 
# 예측할 값이 멀티클래스(예측할 값의 종류가 2개 이상) 일 때는 출력해하는 값에 따라 
# categorical crossentropy 는 one-hot형태의 클래스 일 때 사용하며 
# sparse categorical crossentropy 는 정답값이 0, 1, 2, 3, 4 와 같은 형태일 때 사용합니다.
# metric는 훈련 단계와 테스트 단계를 모니터링하기 위해 사용합니다. 
# 분류, 회귀에 따라 적절한 평가지표를 사용하게 됩니다. 분류일 때는 정확도 측정을 위해 accuracy를 사용합니다.

model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

## 3.3 Dropout

In [5]:
# Sequential layer에 tf.keras.layers.Dropout(0.2)으로 Dropout을 추가 합니다. 
# 0.2 로 설정을 하면 전체 노드 중 20% 는 임의로 제외하고 사용하겠다는 의미입니다. 
# Dropout을 추가하고 model.summary()를 해보면 Dropout layer 가 추가된 것을 확인해 볼 수 있습니다.
model = tf.keras.models.Sequential([
  tf.keras.layers.Flatten(input_shape=(28, 28)),
  tf.keras.layers.Dense(128, activation='relu'),
  tf.keras.layers.Dropout(0.2),
  tf.keras.layers.Dense(10, activation='softmax')
])

In [6]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
flatten_1 (Flatten)          (None, 784)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 128)               100480    
_________________________________________________________________
dropout (Dropout)            (None, 128)               0         
_________________________________________________________________
dense_3 (Dense)              (None, 10)                1290      
Total params: 101,770
Trainable params: 101,770
Non-trainable params: 0
_________________________________________________________________
