# 데이터셋 준비
- 다른 챕터에 비해 순서가 일목요연하지 않으니 각 부분마다 꼼꼼하게 잘 읽어보도록 하자

In [12]:
import keras

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)
print(train_scaled.shape)

(60000, 784)


---
# Keras로 DNN만들어보기 - 기본적인 사용 예시

In [2]:
import keras

inputs = keras.layers.Input(shape=(784,))
dense1 = keras.layers.Dense(100, activation='sigmoid')
dense2 = keras.layers.Dense(10, activation='softmax')

model = keras.Sequential([inputs, dense1, dense2])
model.summary()

---
# `Seqeuntial`에 레이어 바로 넣어주기
- Dense Layer 객체는 만들어둬도 따로 재사용할 일이 없기 때문에, 보통 바로 모델 객체에 넣어주는식으로 한다.

In [5]:
model = keras.Sequential([
    keras.layers.Input(shape=(784,)),
    keras.layers.Dense(100, activation='sigmoid', name='은닉층'),
    keras.layers.Dense(10, activation='softmax', name='출력층'),
], name='패션 MNIST 모델')

model.summary()

---
# `add()`를 통해 레이어 추가하기
- Seqential로 한방에 선언하는건 너무 길어지기도 하고, 조건에 따라 후에 층을 추가할 수도 없어, 일반적으로 `add()`를 많이 사용한다.
- `Sequential` 객체를 일단 만들어놓고, `add()`를 통해 층을 추가하는식이다.

In [7]:
model = keras.Sequential()
model.add(keras.layers.Input(shape=(784,)))
model.add(keras.layers.Dense(100, activation='sigmoid'))
model.add(keras.layers.Dense(10, activation='softmax'))

model.summary()

---
# 모델 학습시켜보기

In [10]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 872us/step - accuracy: 0.8143 - loss: 0.5413
Epoch 2/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 883us/step - accuracy: 0.8561 - loss: 0.3981
Epoch 3/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 923us/step - accuracy: 0.8673 - loss: 0.3652
Epoch 4/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 870us/step - accuracy: 0.8767 - loss: 0.3422
Epoch 5/5
[1m1875/1875[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 969us/step - accuracy: 0.8815 - loss: 0.3260


<keras.src.callbacks.history.History at 0x30adf5be0>

---
# `Flatten`으로 1차원으로 펼치기
- MNIST의 데이터 샘플은 28x28의 shape이므로 넘파이의 `reshape`를 통해 직접 펼쳐주었다.
- 직접 펼쳐도 상관은 없지만, 케라스에서는 이를 위한 `Flatten`메서드를 지원한다.


<br/>



### 활성화 함수 바꾸기: sigmoid → relu
- 시그모이드는 값이 양 끝으로 갈수록 saturation되기 때문에 
    - 특히 층이 깊어질수록 영향력이 커진다.
- 이번에는 렐루를 사용해보자. 
    - 렐루 함수는 특히 이미지 처리에서 좋은 성능을 갖는다고 알려져있다.

In [11]:
model = keras.Sequential()
model.add(keras.layers.Input(shape=(28, 28))) # (784,) -> (28, 28)
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(100, activation='sigmoid'))
model.add(keras.layers.Dense(10, activation='softmax'))

model.summary()

In [15]:
import keras
from sklearn.model_selection import train_test_split

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42
)
print(train_scaled.shape)

(48000, 28, 28)


### 훈련 및 검증

In [16]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 964us/step - accuracy: 0.8056 - loss: 0.5695
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 864us/step - accuracy: 0.8524 - loss: 0.4118
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 903us/step - accuracy: 0.8640 - loss: 0.3769
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 869us/step - accuracy: 0.8717 - loss: 0.3534
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 883us/step - accuracy: 0.8800 - loss: 0.3364


<keras.src.callbacks.history.History at 0x387fe2660>

In [17]:
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 581us/step - accuracy: 0.8738 - loss: 0.3463


[0.34633317589759827, 0.8738333582878113]

---
# 옵티마이저
- model.compile의 파라미터 중 optimizer옵션에서 원하는 옵티마이저를 지정할 수 있다.

```python
model.compile(
    optimizer='~~', loss='sparse_categorical_crossentropy', metrics=['accuracy']
    )
```

- 각 옵티마이저는 `keras.optimizers`패키지 내에 정의되어있다. 그 중 sgd, rmsprop, adam 세 개 정도만 살펴보자.

### SGD

In [19]:
model.compile(
    optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy']
    )

또는 아래와 같이 해도 된다(이후 부터는 아래와 같은 방식으로 선언함).

In [22]:
sgd = keras.optimizers.SGD()
model.compile(
    optimizer=sgd, loss='sparse_categorical_crossentropy', metrics=['accuracy']
    )

SGD 옵티마이저 내부의 하이퍼 파라미터에는 학습률이나, 모멘텀 등의 파라미터가 존재한다.

In [20]:
sgd = keras.optimizers.SGD(learning_rate=0.1)

In [21]:
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)

모멘텀을 

### RMSProp
- RMSProp은 케라스의 기본적인 경사 하강법 알고리즘이다.
- RMSProp과 더불어 이후에 나올 Adagrad는 대표적인 적응적 학습률을 사용하는 옵티마이저이다.

In [24]:
rmsprop = keras.optimizers.RMSprop()
model.compile(
    optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics=['accuracy']
)

### Adagrad

In [25]:
adagrad = keras.optimizers.Adagrad()
model.compile(
    optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics=['accuracy']
)

### Adam
- Adam은 모멘텀 최적화와 RMSProp의 장점을 점목시킨것이다.
    - 가장 무난하게 시도해볼 수 있는 옵티마이저가 RMSProp과 Adam이다.

---
# Adam을 통해 다시 학습시켜보기

In [26]:
model = keras.Sequential()
model.add(keras.layers.Input(shape=(28,28)))
model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

model.compile(
    optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']
)
model.fit(train_scaled, train_target, epochs=5)
model.evaluate(val_scaled, val_target)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8182 - loss: 0.5251
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8613 - loss: 0.3915
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8723 - loss: 0.3522
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8814 - loss: 0.3256
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8869 - loss: 0.3077
[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 639us/step - accuracy: 0.8741 - loss: 0.3463


[0.34634557366371155, 0.8740833401679993]