# 심층 신경망

<table align="left">
  <td>
    <a target="_blank" href="https://colab.research.google.com/github/rickiepark/hg-mldl/blob/master/7-2.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png" />구글 코랩에서 실행하기</a>
  </td>
</table>

In [2]:
# 실행마다 동일한 결과를 얻기 위해 케라스에 랜덤 시드를 설정하고 텐서플로 연산을 결정적으로 만듭니다.
import tensorflow as tf

# 케라스의 난수 생성 시드를 42로 설정하여 실험의 재현성을 보장합니다.
tf.keras.utils.set_random_seed(42)

# 텐서플로 연산의 결정성을 활성화하여 GPU에서의 연산이 일관된 결과를 생성하도록 합니다.
tf.config.experimental.enable_op_determinism()


## 2개의 층

In [7]:
from tensorflow import keras

# Fashion MNIST 데이터셋을 로드합니다.
# 이 데이터셋은 학습 데이터와 테스트 데이터로 나뉘어 있습니다.
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()


In [None]:
from sklearn.model_selection import train_test_split

# 학습 데이터를 0과 1 사이로 정규화합니다. (픽셀 값을 255로 나누어 [0, 1] 범위로 변환)
train_scaled = train_input / 255.0

# 이미지를 2D 벡터로 변환합니다. (원본 이미지는 28x28 픽셀 크기입니다. 이를 784(=28*28) 크기의 1D 벡터로 변환합니다.)
train_scaled = train_scaled.reshape(-1, 28*28)

# train_test_split을 사용하여 학습 데이터와 타겟을 훈련 세트와 검증 세트로 나눕니다.
# test_size=0.2: 데이터의 20%를 검증 세트로 사용합니다.
# random_state=42: 난수 생성 시드를 설정하여 결과의 재현성을 보장합니다.
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)


In [33]:
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax')

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


## 심층 신경망 만들기

In [34]:
model = keras.Sequential([dense1, dense2])

In [35]:
model.summary()

## 층을 추가하는 다른 방법

In [36]:
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')
], name='패션 MNIST 모델')

In [37]:
model.summary()

In [38]:
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [10]:
model.summary()

In [12]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 3ms/step - accuracy: 0.7525 - loss: 0.7720
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 2ms/step - accuracy: 0.8463 - loss: 0.4270
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.8604 - loss: 0.3857
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.8696 - loss: 0.3600
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.8759 - loss: 0.3410


<keras.src.callbacks.history.History at 0x7ba27907a9b0>

## 렐루 활성화 함수

In [14]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

  super().__init__(**kwargs)


In [15]:
model.summary()

In [16]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input / 255.0

train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [17]:
model.compile(loss='sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.7637 - loss: 0.6723
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8519 - loss: 0.4050
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8688 - loss: 0.3592
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8804 - loss: 0.3346
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8872 - loss: 0.3161


<keras.src.callbacks.history.History at 0x1ef4b6e8090>

In [18]:
model.evaluate(val_scaled, val_target)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 756us/step - accuracy: 0.8692 - loss: 0.3789


[0.382429838180542, 0.8665833473205566]

## 옵티마이저

In [39]:
# 모델을 컴파일합니다.
# optimizer: 'sgd'는 Stochastic Gradient Descent(확률적 경량화 기법)를 사용하여 모델의 가중치를 업데이트합니다.
# loss: 'sparse_categorical_crossentropy'는 손실 함수로, 다중 클래스 분류 문제를 해결하기 위해 사용됩니다.
# metrics: 'accuracy'는 모델의 성능 평가 지표로 정확도를 사용합니다.
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics=['accuracy'])


In [40]:
# SGD 최적화 알고리즘의 기본 인스턴스를 생성합니다.
# 기본 하이퍼파라미터(학습률 등)를 사용하여 최적화 알고리즘을 설정합니다.
sgd = keras.optimizers.SGD()

# 모델을 컴파일합니다.
# optimizer: 위에서 생성한 SGD 인스턴스를 사용하여 모델의 가중치를 업데이트합니다.
# loss: 'sparse_categorical_crossentropy'는 다중 클래스 분류 문제에 적합한 손실 함수입니다.
# metrics: 'accuracy'는 모델의 성능을 평가하기 위해 정확도를 사용합니다.
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics=['accuracy'])


In [41]:
# 학습률을 0.1로 설정하여 SGD 최적화 알고리즘의 인스턴스를 생성합니다.
# learning_rate=0.1은 가중치 업데이트 시 사용되는 학습률을 설정합니다.
sgd = keras.optimizers.SGD(learning_rate=0.1)


In [42]:
# 모멘텀을 0.9로 설정하고 Nesterov 가속 경량화(NAG)를 활성화하여 SGD 최적화 알고리즘의 인스턴스를 생성합니다.
# momentum=0.9: 모멘텀 값으로, 이전 업데이트의 영향을 고려하여 현재 가중치 업데이트를 조정합니다.
# nesterov=True: Nesterov 가속 경량화를 활성화하여 모멘텀을 적용하기 전 예측값에서 업데이트를 수행합니다.
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)


In [43]:
# Adagrad 최적화 알고리즘의 기본 인스턴스를 생성합니다.
# Adagrad는 학습률을 각 파라미터에 대해 자동으로 조정하여 학습을 수행합니다.
adagrad = keras.optimizers.Adagrad()

# 모델을 컴파일합니다.
# optimizer: 위에서 생성한 Adagrad 인스턴스를 사용하여 모델의 가중치를 업데이트합니다.
# loss: 'sparse_categorical_crossentropy'는 다중 클래스 분류 문제에 적합한 손실 함수입니다.
# metrics: 'accuracy'는 모델의 성능을 평가하기 위해 정확도를 사용합니다.
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics=['accuracy'])


In [44]:
# RMSprop 최적화 알고리즘의 기본 인스턴스를 생성합니다.
# RMSprop는 각 파라미터의 학습률을 개별적으로 조정하여 학습을 수행합니다.
rmsprop = keras.optimizers.RMSprop()

# 모델을 컴파일합니다.
# optimizer: 위에서 생성한 RMSprop 인스턴스를 사용하여 모델의 가중치를 업데이트합니다.
# loss: 'sparse_categorical_crossentropy'는 다중 클래스 분류 문제에 적합한 손실 함수입니다.
# metrics: 'accuracy'는 모델의 성능을 평가하기 위해 정확도를 사용합니다.
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics=['accuracy'])


In [45]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [46]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.7617 - loss: 0.6845
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8528 - loss: 0.4177
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8677 - loss: 0.3683
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8780 - loss: 0.3368
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 1ms/step - accuracy: 0.8856 - loss: 0.3150


<keras.src.callbacks.history.History at 0x1ef49f57e90>

In [47]:
# 검증 데이터셋(val_scaled)과 검증 레이블(val_target)을 사용하여 모델의 성능을 평가합니다.
# model.evaluate() 함수는 모델의 손실 값과 선택한 평가 지표(예: 정확도)를 반환합니다.
# 반환된 값은 일반적으로 손실 값과 정확도입니다.
evaluation_results = model.evaluate(val_scaled, val_target)

# 평가 결과를 출력합니다.
print(evaluation_results)

[1m375/375[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 739us/step - accuracy: 0.8617 - loss: 0.3866
[0.3883677124977112, 0.8616666793823242]
