# 심층 신경망

In [1]:
import tensorflow as tf # TensorFlow 라이브러리 불러오기

tf.keras.utils.set_random_seed(42) # 랜덤 시드 설정
tf.config.experimental.enable_op_determinism() # 연산 결정성 활성화

## 2개의 층

In [2]:
from tensorflow import keras # TensorFlow 라이브러리를 불러와서 keras 모듈을 사용합니다.

# 패션 MNIST 데이터셋을 불러와서 훈련 데이터와 테스트 데이터로 나눕니다.
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data() 

In [None]:
from sklearn.model_selection import train_test_split    # 훈련 데이터와 검증 데이터로 나누기 위해 사용

train_scaled = train_input / 255.0                      # 훈련 데이터를 0~1 사이로 정규화
train_scaled = train_scaled.reshape(-1, 28 * 28)        # 훈련 데이터를 28*28 크기의 이미지로 변환

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42) # 훈련 데이터를 80%와 20%로 나누어 검증 데이터로 사용

In [19]:
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)) # 은닉 레이어
dense2 = keras.layers.Dense(10, activation='softmax') # 출력 레이어

## 심층 신경망 만들기

In [5]:
model = keras.Sequential([dense1, dense2])

In [6]:
model.summary() # 모델 구조 출력

## 층을 추가하는 다른 방법

In [7]:
model = keras.Sequential([ # 모델 생성
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'), # 은닉 레이어
    keras.layers.Dense(10, activation='softmax', name='output') # 출력 레이어
], name='패션 MNIST 모델')

In [8]:
model.summary() # 모델 구조 출력

In [9]:
model = keras.Sequential() # 모델 생성
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))) # 은닉 레이어
model.add(keras.layers.Dense(10, activation='softmax')) # 출력 레이어

In [10]:
model.summary() # 모델 구조 출력

In [11]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

model.fit(train_scaled, train_target, epochs=5) # 모델 훈련

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - accuracy: 0.7525 - loss: 0.7720
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8463 - loss: 0.4270
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8604 - loss: 0.3857
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8696 - loss: 0.3600
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8759 - loss: 0.3410


<keras.src.callbacks.history.History at 0x25517b65710>

## 렐루 활성화 함수

In [20]:
model = keras.Sequential() # 모델 생성
model.add(keras.layers.Flatten(input_shape=(28, 28))) # 입력 레이어
model.add(keras.layers.Dense(100, activation='relu')) # 은닉 레이어
model.add(keras.layers.Dense(10, activation='softmax')) # 출력 레이어

In [13]:
model.summary() # 모델 구조 출력

In [14]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data() # 패션 MNIST 데이터셋 불러오기

train_scaled = train_input / 255.0 # 훈련 데이터 정규화

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42) # 훈련 데이터와 검증 데이터로 나누기


In [15]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

model.fit(train_scaled, train_target, epochs=5) # 모델 훈련

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.7637 - loss: 0.6723
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8519 - loss: 0.4061
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8687 - loss: 0.3612
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8776 - loss: 0.3343
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8854 - loss: 0.3171


<keras.src.callbacks.history.History at 0x25517a63450>

In [16]:
model.evaluate(val_scaled, val_target) # 검증 데이터로 모델 평가

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step - accuracy: 0.8662 - loss: 0.3863


[0.38631802797317505, 0.8661666512489319]

## 옵티마이저

In [17]:
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

In [None]:
sgd = keras.optimizers.SGD() # SGD 옵티마이저 생성
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

In [21]:
sgd = keras.optimizers.SGD(learning_rate=0.1) # 학습률을 0.1로 설정하여 SGD 옵티마이저 생성

In [22]:
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True) # 모멘텀을 0.9로 설정하고 Nesterov 가속도를 사용하는 SGD 옵티마이저 생성

In [23]:
adagrad = keras.optimizers.Adagrad() # Adagrad 옵티마이저 생성
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

In [24]:
rmsprop = keras.optimizers.RMSprop() # RMSprop 옵티마이저 생성
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

In [25]:
model = keras.Sequential() # 모델 생성
model.add(keras.layers.Flatten(input_shape=(28, 28))) # 입력 레이어
model.add(keras.layers.Dense(100, activation='relu')) # 은닉 레이어
model.add(keras.layers.Dense(10, activation='softmax')) # 출력 레이어 

In [26]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy']) # 모델 컴파일

model.fit(train_scaled, train_target, epochs=5) # 모델 훈련

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.7681 - loss: 0.6693
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8559 - loss: 0.4029
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8720 - loss: 0.3577
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8801 - loss: 0.3292
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 2ms/step - accuracy: 0.8881 - loss: 0.3061


<keras.src.callbacks.history.History at 0x2551807ac90>

In [27]:
model.evaluate(val_scaled, val_target) # 검증 데이터로 모델 평가

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step - accuracy: 0.8749 - loss: 0.3516


[0.352140337228775, 0.8727499842643738]