## data set 구축.

In [88]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) =\
    keras.datasets.fashion_mnist.load_data()

In [89]:
#이미지 픽셀값을 0~255범위에서 0~1사이로 변환한다.
#28x28 크기의 2차원배열을 784크기의 1차원 배열로 펼친다.
#train_test_split()함수로 data set을 나눈다.
from sklearn.model_selection import train_test_split
train_scaled = train_input/255.0
train_scaled = train_scaled.reshape(-1,28*28)
train_scaled, test_scaled, train_target, test_target = train_test_split(train_scaled, train_target, test_size=0.2, random_state=42)

## 은닉층(hidden layer)만들기.
- 은닉층은 입력층과 출력층 사이에 있는 모든 층을 말한다.

In [72]:
#신경망의 첫번째 층은 input_shape 매개변수로 입력의 크기를 지정해 주어야 한다.
#100개의 뉴런을 가지도록 한다.(뉴런의 개수를 정하는데에는 기준이없다.)
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))

#신경망의 두번째 층. 뉴런을 10개로 한다.(출력층의 뉴런보다는 많게 만들어야 한다.)
dense2 = keras.layers.Dense(10, activation='softmax')


## 심층 신경망 만들기(DNN)

In [73]:
#Sequential클래스의 객체를 만들때에는 여러층을 추가하기 위해 리스트로 만들어 전달한다. 출력층은 가장마지막에 둔다.
model = keras.Sequential([dense1, dense2])

In [74]:
#summary() 메서드를 호출하여 층에대한 정보를 얻는다.
model.summary()
#Non-trainable params : train되지 않은 파라미터

Model: "sequential_12"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_25 (Dense)             (None, 100)               78500     
_________________________________________________________________
dense_26 (Dense)             (None, 10)                1010      
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


### 층을 추가하는 다른 방법

In [75]:
#Sequential 클래스의 생성자 안에 바로 Dense 클래스의 객체를 만들기.
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid',input_shape=(784,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
], name = 'fashin MNIST model')

In [76]:
model.summary()

Model: "fashin MNIST model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
hidden (Dense)               (None, 100)               78500     
_________________________________________________________________
output (Dense)               (None, 10)                1010      
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [77]:
#Sequential 클래스에 add()메서드를 통해 층을 추가하기.
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [78]:
model.summary()

Model: "sequential_13"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_27 (Dense)             (None, 100)               78500     
_________________________________________________________________
dense_28 (Dense)             (None, 10)                1010      
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


### 모델 훈련해보기.

In [79]:
#epochs 몇회 훈련할지 지정.
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x2302e891610>

## Flatten 클래스
- Flatten클래스는 입력차원을 모두 일차원으로 펼치는 역할을 한다.
- 입력층 바로 뒤에 추가한다.

In [80]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [81]:
model.summary()

Model: "sequential_14"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
flatten_3 (Flatten)          (None, 784)               0         
_________________________________________________________________
dense_29 (Dense)             (None, 100)               78500     
_________________________________________________________________
dense_30 (Dense)             (None, 10)                1010      
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [92]:
(train_input, train_target), (test_input, test_target) =\
    keras.datasets.fashion_mnist.load_data()
train_scaled = train_input/255.0
train_scaled, test_scaled, train_target, test_target = train_test_split(train_scaled, train_target, test_size=0.2, random_state=42)

In [93]:
#train set 성능평가.
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x2302eebfdf0>

In [96]:
#test set 성능평가.
model.evaluate(test_scaled, test_target)



[0.42053860425949097, 0.8763333559036255]

## SGD 옵티마이저 사용하기.
- 옵티마이저 : loss함수의 값을 최소화 하기 위해 최적의 가중치 값을 찾는 알고리즘.

In [97]:
model.compile(optimizer='sgd', loss='sparse_categorical', metrics='accuracy')

In [99]:
#SGD클래스의 momentum 매개변수의 기본값은 0이다. 
#0보다 큰 값을 지정하면 이전의 Gradient를 가속도처럼 사용하는 momentum optimization을 사용한다.
#SGD클래스의 nesterov 매개변수의 기본값은 False이다.
#False에서 True로 바꾸면 nesterov momentum optimization을 사용한다.
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)

In [103]:
#적응적 학습률(adaptive learning rate) : 모델이 최적점에 가까이 갈수록 학습률을 낮추게 하는 방법.
#적응적 학습률을 사용하는 대표적 옵티마이저 : Adagrad, RMSprop

#adgard
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics = 'accuracy')

#rmsprop
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss='spare_categorical_crossentropy', metrics='accuracy')


## Adam알고리즘.
- 모멘텀 최적화(momentum optimization)와 RMSprop의 장점을 접목한 것.
- learning_rate 매개변수의 기본값으로 모두 0.001을 사용한다.

In [104]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [105]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x2302f425190>

In [106]:
model.evaluate(test_scaled,test_target)



[0.3344849944114685, 0.8800833225250244]