심층 신경망

<table align="left">
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/rickiepark/hg-mldl/blob/master/7-2.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />구글 코랩에서 실행하기</a>
  </td>
</table>

In [2]:
import tensorflow as tf

tf.keras.utils.set_random_seed(42)
tf.config.experimental.enable_op_determinism()




2개의 층

In [3]:
#TensorFlow의 Keras 모듈(=딥러닝 모델을 쉽게 구축하고 학습할 수 있는 인터페이스 제공)을 사용하여 Fashion MNIST 데이터셋 로드

from tensorflow import keras

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

In [4]:
#Fashion MNIST 데이터셋의 훈련 데이터를 전처리하고, 훈련 세트와 검증 세트로 나눔

from sklearn.model_selection import train_test_split

train_scaled = train_input / 255.0 #훈련데이터의 픽셀 값(0~255)을 0과 1사이의 값으로 스케일링
train_scaled = train_scaled.reshape(-1, 28*28) #훈련데이터의 형태를 변경. 28x28 크기의 2차원 배열 -> 784개 픽셀로 이루어진 1차원 배열

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [27]:
#Keras를 사용하여 각각의 레이어(layer) 정의
#첫 번째 밀집층 정의. 100개의 뉴런, 활성화 함수로는 시그모이드 함수, 784=픽셀값으로 이루어진 28x28 크기의 이미지를 1차원 배열로 펼침

dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax') #두 번째 밀집층 정의. 10개의 뉴런, 활성화 함수로는 소프트맥스 함수

심층 신경망 만들기

In [6]:
#Sequential 모델을 생성하고, 이전에 정의된 두 개의 레이어를 순차적으로 추가

model = keras.Sequential([dense1, dense2])

In [7]:
model.summary() #모델 구조와 파라미터 수에 대한 요약 정보

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


층을 추가하는 다른 방법

In [8]:
#첫 번째 층인 hidden과 두 번째 층인 output으로 명명된 두 개의 층을 가진 Sequential 모델 생성

model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'), #첫 번째 밀집층 정의
    keras.layers.Dense(10, activation='softmax', name='output') #두 번째 밀집층 정의. 층의 이름=output
], name='패션 MNIST 모델')


In [9]:
model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [10]:
#케라스(Keras)를 사용하여 간단한 신경망 모델 생성
#소프트맥스 함수는 다중 클래스 분류 문제에서 각 클래스에 속할 확률을 출력하기 위해 사용

model = keras.Sequential() #Sequential 모델(=각 층(layer)이 순차적으로 쌓여있는 신경망 모델) 생성
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax')) #모델에 두 번째 층을 추가

In [11]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [12]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')

model.fit(train_scaled, train_target, epochs=5)

#epochs=5: 전체 훈련 데이터셋에 대해 모델이 학습을 반복할 횟수. 5번의 에포크(epoch)동안 훈련
#훈련된 모델은 손실 함수와 평가 지표를 사용하여 성능을 평가할 수 있음




Epoch 1/5


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x1ccd78afb80>

렐루 활성화 함수

In [13]:
#Keras를 사용하여 다른 형식의 신경망 모델 생성
#입력층, 은닉층, 출력층으로 구성된 다층 퍼셉트론(multilayer perceptron, MLP)

model = keras.Sequential() #Sequential 모델(=각 층(layer)이 순차적으로 쌓여있는 신경망 모델) 생성
model.add(keras.layers.Flatten(input_shape=(28, 28))) #모델에 첫 번째 층 추가. Flatten: 입력 데이터를 1차원 배열로 평평하게 펼치는 역할. 28x28 크기의 이미지를 1차원 배열로 변환
model.add(keras.layers.Dense(100, activation='relu')) #모델에 두 번째 층 추가. 입력이 0보다 작을 때는 0을, 0보다 클 때는 그 값을 그대로 출력하는 'ReLU 함수' 사용
model.add(keras.layers.Dense(10, activation='softmax')) #모델에 세 번째 층 추가. 다중 클래스 분류 문제에서 각 클래스에 속할 확률을 출력하기 위해 사용되는 '소프트맥스 함수'

In [14]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79510 (310.59 KB)
Trainable params: 79510 (310.59 KB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [15]:
#Fashion MNIST 데이터셋 로드 -> 전처리

(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data() #load_data(): 훈련 데이터와 테스트 데이터를 튜플 형태로 반환

train_scaled = train_input / 255.0 #각 픽셀 값은 0부터 255까지의 값을 가지므로, 이를 255로 나누어서 0에서 1사이의 값으로 변환

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [16]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy') #모델을 컴파일. compile() 메소드를 사용하여 모델의 손실함수(loss function)와 평가지표(metrics)를 설정

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x1cce8455100>

In [17]:
model.evaluate(val_scaled, val_target)

#검증 세트에 대한 모델의 성능을 평가
#(검증 세트의 입력 데이터, 검증 세트의 타겟 변수(레이블))



[0.38328099250793457, 0.8679999709129333]

옵티마이저

In [18]:
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics='accuracy')
#확률적 경사 하강법(SGD)을 옵티마이저로, : sparse categorical cross-entropy를 손실함수로, 정확도를 훈련 및 평가 중에 모니터링할 지표로 설정

In [19]:
#SGD(Stochastic Gradient Descent) 옵티마이저를 생성하고 'compile' 메서드에 전달

sgd = keras.optimizers.SGD() #SGD 옵티마이저 생성
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy') #모델 설정

In [20]:
sgd = keras.optimizers.SGD(learning_rate=0.1) #학습률이 0.1인 SGD 옵티마이저 생성

In [21]:
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True) #모멘텀이 0.9이고 네스테로프 모멘텀을 사용하는 SGD 옵티마이저 생성

In [22]:
#Adagrad 옵티마이저를 사용하여 모델을 컴파일

adagrad = keras.optimizers.Adagrad() #Adagrad 옵티마이저 생성
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [23]:
#RMSprp 옵티마이저를 사용하여 모델을 컴파일

rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [24]:
#입력층, 은닉층, 출력층을 순차적으로 연결하여 간단한 분류 모델 구성

model = keras.Sequential() #Sequential 모델(=선형으로 연결하여 순차적으로 처리하는 모델) 생성
model.add(keras.layers.Flatten(input_shape=(28, 28))) #입력 데이터를 28x28 크기의 이미지로 받아 평평하게 만드는 Flatten 레이어 추기
model.add(keras.layers.Dense(100, activation='relu')) #100개의 뉴런을 가지는 은닉층 추가, 활성화 함수는 ReLU
model.add(keras.layers.Dense(10, activation='softmax')) #출력층으로 10개의 뉴런을 가지는 층 추가, 활성화 함수는 소프트맥스

In [25]:
#Adam 옵티마이저를 사용하여 모델을 컴파일하고, 훈련 데이터를 사용하여 모델을 학습

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy') #모델 컴파일

model.fit(train_scaled, train_target, epochs=5) #epochs: 전체 데이터셋에 대해 반복하는 횟수. 5번 반복하여 모델을 학습

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.src.callbacks.History at 0x1cc82d7a040>

In [26]:
#검증 데이터를 사용하여 모델의 성능을 평가하고, 손실과 정확도를 출력

model.evaluate(val_scaled, val_target)



[0.3468457758426666, 0.8761666417121887]