## 케라스 API를 통해 패션 MNIST 데이터셋을 불러온다.

In [1]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) =\
  keras.datasets.fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


* 이미지 픽셀 값을 0에서 255 범위에서 0~1 사이로 변환
* 28 * 28 크기의 2차원 배열을 784 크기의 1차원 배열로 펼친다.
* 사이킷런 train_test_split() 함수로 훈련세트와 검증 세트로 나눈다.

In [2]:
from sklearn.model_selection import train_test_split

train_scaled = train_input / 255
train_scaled = train_scaled.reshape(-1, 28*28)

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size=0.2, random_state=42)

## 인공 신경망 모델에 층을 2개 추가

* 1절에서 만ㄷ느 신경망 모델과 다른 점은 입력층과 출력층 사이에 밀집층이 추가 된 것

* **은닉층** : 입력층과 출력층 사이에 있는 모든 층

In [3]:
# 은닉층
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))

# 출력층
dense2 = keras.layers.Dense(10, activation='softmax')

* dense1 과 dense2 를 Sequential 클래스에 추가하여 **심층 신경망**을 만든다.

In [4]:
model = keras.Sequential([dense1, dense2]) # 여러 개를 추가하려면 리스트로 넣어야한다.

In [5]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


## 층을 추가하는 다른 방법

* Sequential 클래스 생성자 안에서 바로 Dense 클래스의 객체를 만든다.

In [6]:
model = keras.Sequential([
                          keras.layers.Dense(100, activation='sigmoid', input_shape=(784,),
                                             name = 'hidden'),
                          keras.layers.Dense(10, activation='softmax', name= 'output')
],name = '패션 MNIST 모델')

* 이전과 달리 층을 한 눈에 쉽게 알아볼 수 있다.
* name 매개변수로 모델의 이름을 지정

In [7]:
model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


## add() 메서드를 사용하여 층을 추가 

In [8]:
model = keras.Sequential()

model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [9]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


## compile() 메서드를 사용해 훈련시키기

In [12]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fe9b8d6acd0>

## 렐루 함수

* 입력이 양수일 경우 마치 활성화 함수가 없는 것처럼 그냥 입력을 통과 시킨다.
* 입력이 음수일 경우 0으로 만든다.
* 렐루 함수 = max(0, z)
* z > 0 이면 z를 출력, z < 0 이면 0을 출력

### Flatten

* 배치 차원을 제외하고 나머지 입력 차원을 모두 이렬로 펼치는 역할만 한다.
* 입력에 곱해지는 가중치나 절편 X
* 입력층과 은닉층 사이에 추가하기 때문에 이를 층이라고 부른다.

In [13]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [14]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [15]:
(train_input, train_target), (test_input, test_target) =\
  keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42
)

In [16]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fe9b5ea4e10>

## 검증 세트에서의 성능 확인

In [17]:
model.evaluate(val_scaled, val_target)



[0.37414348125457764, 0.874666690826416]

* SGD 옵티마이저를 사용하려면 compile 메서드의 optimizer 매개변수를 sgd로 지정한다.
* 이 옵티마이저는 tensorflow.keras.optimizer 패키지 아래 SGD 클래스로 구현되어 있다.

      model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy,
                    metrics='accuracy')

위에 코드와 아래 코드는 동일하다

      sgd = keras.optimizer.SGD()
      model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy,
                    metrics='accuracy')


* 학습률을 바꾸고 싶다면 learning_rate 매개변수를 지정해 사용한다

       sgd = keras.optimizer.SGD(learning_rate = 0.1)

      
* SGD 클래스의 nesterov 매개변수를 기본값 Fasle 에서 True로 
  바꾸면 네스테로프 모멘텀 최적화를 사용한다

      sgd = keras.optimizer.SGD(momentum=0.9, nesterov=True)

* 대부분의 경우 네스테로프 모멘텀 최적화가 기본 확률적 경사 하강법보다 더 나은 성능을 제공한다.



In [20]:
# Adam 클래스의 매개변수 기본값을 사용해 패션 MNIST 모델을 훈련
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [21]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy',
              metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7fe9b965d290>

In [22]:
model.evaluate(val_scaled, val_target)



[0.3558790981769562, 0.871749997138977]

* RMSprop를 사용 했을 때보다 Adam을 사용할 때 아주 약간 더 떨어졌다