- 층 추가하기

In [2]:
from tensorflow import keras

In [8]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

In [12]:
# 이미지의 픽셀값을 0~255 범위에서 0~1사이로 변환
# 28 * 28 크기의 2차원 배열은 1차원 배열로 변환
# 훈련 세트와 검증 세트로 나누기

from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28 * 28)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size = 0.2, random_state = 42)

In [18]:
# 입력층과 츨력층 사이 -> 은닉층
# 은닉층은 활성화 함수를 사용하여 비선형성을 만듬 (층으로 쌓은것을 무의미하지 않게 하기 위해)
# ex) 시그모이드 함수, 렐루 함수

# 시그모이드 활성화 함수를 사용한 은닉층 100개의 뉴런, 입력갑은 한 샘플을 펼친 크기(28*28)
dense1 = keras.layers.Dense(100, activation = 'sigmoid', input_shape = (784,))

# 소프트맥수 함수를 사용한 출력층 (10개의 타켓)
dense2 = keras.layers.Dense(10, activation = 'softmax')

In [22]:
# 신경망 만들기 (순서대로 지정, 출력층은 맨 마지막에)
model = keras.Sequential([dense1, dense2])

In [26]:
# 각 층에 대한 정보
model.summary()

In [34]:
# 미리 지정하기 않고 한번에 층 추가하기
model = keras.Sequential([
    keras.layers.Dense(100, activation = 'sigmoid', input_shape = (784,),
                       name = 'hidden'), #층 이름 설정
    keras.layers.Dense(10, activation = 'softmax', name = 'output')
    ], name = '패션 MNIST 모델') 

In [36]:
model.summary()

In [42]:
# 모델 생성 후 층 추가하기
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation = 'sigmoid', input_shape = (784,)))
model.add(keras.layers.Dense(10, activation = 'softmax'))

In [44]:
model.summary()

In [46]:
# 모델 훈련
# 5번의 에폭으로 훈련
model.compile(loss = 'sparse_categorical_crossentropy', metrics = ['accuracy'])
model.fit(train_scaled, train_target, epochs = 5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 3ms/step - accuracy: 0.7542 - loss: 0.7718
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8487 - loss: 0.4197
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8627 - loss: 0.3834
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - accuracy: 0.8724 - loss: 0.3564
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8775 - loss: 0.3412


<keras.src.callbacks.history.History at 0x1bab54137d0>

#### 렐루 함수

- 초반에는 인공 신경망의 은닉층에 시그모이드 함수를 사용했음
- 시그모이드 함수는 끝으로 갈수록 그래프가 누워있어, 출력을 만드는데 신속하게 대응하지 못함 -> 층이 많을 수록 더 느려짐
- 렐루 함수는 음수의 경우 0, 양수의 값은 해당 값으로 출력해 심층 신경망에서 뛰어나다.

In [57]:
# 기존에는 입력 함수를 28*28의 1차원의 배열로 직접 펼쳤음
# keras에서는 이를 위한 Flatten층 존재

model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape = (28, 28)))
model.add(keras.layers.Dense(100, activation = 'relu'))
model.add(keras.layers.Dense(10, activation = 'softmax'))

In [59]:
model.summary()

In [63]:
# 훈련 데이터 준비
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size = 0.2, random_state = 42)

In [71]:
# 모델 훈련
model.compile(loss = 'sparse_categorical_crossentropy', metrics = ['accuracy'])
model.fit(train_scaled, train_target, epochs = 5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 3ms/step - accuracy: 0.7633 - loss: 0.6819
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8566 - loss: 0.3951
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8732 - loss: 0.3520
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8802 - loss: 0.3334
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8872 - loss: 0.3111


<keras.src.callbacks.history.History at 0x1bab7516420>

In [73]:
# 검증 세트 성능 확인
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.8750 - loss: 0.3620


[0.35947883129119873, 0.874916672706604]