In [1]:
import tensorflow as tf

tf.keras.utils.set_random_seed(42)
tf.config.experimental.enable_op_determinism()

In [None]:
# keras API로 패션 MNIST 데이터셋 불러오기
from tensorflow import keras

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

In [3]:
# 이미지의 픽셀값을 0~225범위에서 0~1로 변환하고, 28x28크기의 2차원 배열을 784 크기의 1차원 배열로 펼침
# train_test_split()함수로 훈련 세트, 검증세트로 나눔
from sklearn.model_selection import train_test_split

train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [4]:
# 은닉층과 출력층 만들기
# 신경망의 첫번째 층은 input_shape()로 입력의 크기를 지정해주어야 함
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax')

In [5]:
# 심층 신경망 (Deep Neural Network) 만들기
# 층을 리스트로 만들어 전달, 출력층은 마지막에 두어야 함, 층 순서대로 나열
model = keras.Sequential([dense1, dense2])

In [6]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [7]:
# 층을 추가하는 다른 방법
# Sequential 클래스 안에서 바로 Dense 클래스의 객체를 만듦
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
], name='패션 MNIST 모델')

In [8]:
model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [9]:
# add()메서드로 층을 추가
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [10]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [11]:
# 모델 훈련하기
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fc28375f590>

In [12]:
# 케라스의 Flatten을 통해 입력 차원을1차원으로 펼치기
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [13]:
# 입력값의 차원을 짐작할 수 있음 (784개의 입력)
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [14]:
# 모델 훈련 (reshape()사용하지 않음)
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input / 255.0

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [15]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fc283672bd0>

In [16]:
model.evaluate(val_scaled, val_target)



[0.3711349368095398, 0.8692499995231628]

In [17]:
# SGD옵티마이저 사용
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics='accuracy')

In [18]:
# 객체를 만들어서 사용해도 같음
sgd = keras.optimizers.SGD()
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [19]:
# 학습률을 바꿀 수 있음
sgd = keras.optimizers.SGD(learning_rate=0.1)

In [20]:
# momentum 매개변수를 0보다 큰 값으로 지정하면 그레디언트를 가속도처럼 사용하는 모멘텀 최적화(momentum optimization)을 사용
# 네스테로프 모멘텀 최적화: 모멘텀 최적화를 2번 반복하여 구현
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)

In [21]:
# 적응적 학습률을 사용하는 옵티마이저 Adagrad
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [22]:
# 적응적 학습률을 사용하는 옵티마이저 RMSprop
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [23]:
# 모멘텀 최적화와 RMSprop의 장점을 접목한 Adam
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))


model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy')

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fc281e29810>

In [24]:
model.evaluate(val_scaled, val_target)



[0.3544268310070038, 0.8725000023841858]

- 심층 신경망: 2개 이상의 층을 포함한 신경망, 딥러닝과 같은 의미

- 렐루 함수: 이미지 분류 모델의 은닉층에 많이 사용하는 활성화 함수, 시그모이드 함수는 층이 많을수록 활성화 함수의 양 끝에서 변화가 작기 때문에 학습이 어려워져, 문제가 없고 계산이 간단한 렐루 함수 사용

- 옵티마이저: 신경망의 가중치와 절편을 학습하기 위한 알고리즘 또는 방법, 케라스에는 다양한 경사 하강법 알고리즘 'SGD, 네스테로프 모멘텀, RMSprop, Adam' 등이 구현되어 있음