<a href="https://colab.research.google.com/github/Kim-Min-Gyeong/study-mldl/blob/main/DNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [24]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()



이미지 픽셀값을 0 ~ 255 범위에서 0~1 사이로 변환하고, 28*28 크기의 2차원 배열을 784 크기의 1차원 배열로 펼친다.

In [25]:
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28) #28 * 28 이미지 크기에 맞게 지정하여 원본 데이터의 두 번째, 세 번째 차원이 1차원으로 합쳐진다.

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size = 0.2, random_state=42) #검증 세트 나누기


In [27]:
#케라스에서 신경망의 첫 번째 층은 input_shape 매개변수로 입력 크기를 지정해주어야 함
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)) #은닉층, 100개의 뉴런, 출력츠의 뉴런 개수보다 많도록 지정
dense2 = keras.layers.Dense(10, activation='softmax') #출력층, 10개의 클래스를 분류하므로, 10개의 뉴런

#심층 신경망 만들기
model = keras.Sequential([dense1, dense2]) #출력층을 가장 마지막에 작성

model.summary()


Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_8 (Dense)             (None, 100)               78500     
                                                                 
 dense_9 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


층 이름, 클래스, 출력 크기, 모델 파라미터 개수 순으로 출력됨 <br>

출력 크기의 첫 번째 차원은 샘플의 개수. 아직 정의되어 있지 않아 None<br>

샘플마다 784개의 픽셀 값이 은닉층을 통과하면서 100개의 특성으로 압축되었다.<br>

이 층은 Dense 층이므로 입력 픽셀 784개와 100개의 모든 조합에 대한 가중치가 있다. 그리고 뉴런마다 1개의 절편이 있다.


In [28]:
#층을 추가하는 두 번째 방법
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784, ), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
    ], name='패션 MNIST 모델')

model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [30]:
#층을 추가하는 세 번째 방법
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784, )))
model.add(keras.layers.Dense(10, activation='softmax'))

model.summary()

Model: "sequential_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_10 (Dense)            (None, 100)               78500     
                                                                 
 dense_11 (Dense)            (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [31]:
#모델 훈련

model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7b0f05760400>

In [32]:
#2차원 배열을 1차원 배열로 펼치려고 reshape를 사용한 것 대신, Flatten 클래스를 사용

model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28))) #첫 번째 Dense 층에 있던 input_shape 매개변수를 Flatten 층으로 옮김.
model.add(keras.layers.Dense(100, activation='relu')) #활성화 함수도 relu로 변경
model.add(keras.layers.Dense(10, activation='softmax'))

model.summary()

Model: "sequential_4"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_12 (Dense)            (None, 100)               78500     
                                                                 
 dense_13 (Dense)            (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


784개의 입력이 첫 번째 은닉층에 전달됨.

In [33]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input / 255.0

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size = 0.2, random_state=42) #검증 세트 나누기

In [34]:
#모델 훈련

model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x7b0fa78bf460>

compile() 메소드에서는 케라스의 기본 경사 하강법 알고리즘인 RMSprop를 사용한다. <br>


In [35]:
#검증 세트에서의 성능을 확인
model.evaluate(val_scaled, val_target)



[0.34397590160369873, 0.8805000185966492]