# 심층 신경망

In [None]:
# 실행마다 동일한 결과를 얻기 위해 케라스에 랜덤 시드를 사용하고 텐서플로 연산을 결정적으로 만듭니다.
import tensorflow as tf

tf.keras.utils.set_random_seed(42)
tf.config.experimental.enable_op_determinism()

## 2개의 층

In [None]:
# 텐서플로의 케라스 사용
from tensorflow import keras

# MNIST 데이터 불러오기(train set, test set)
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [None]:
from sklearn.model_selection import train_test_split

# 0~1 사이의 값으로 정규화
train_scaled = train_input / 255.0
# 1차원 배열로 만듦
train_scaled = train_scaled.reshape(-1, 28*28)

# train set과 validation set으로 나누기 (기본 train set: 80%, validation set: 20%)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [None]:
# dense layer 만들기
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)) # (뉴런 100개, 활성화 함수 - 시그모이드, input layer 784개 뉴런)
dense2 = keras.layers.Dense(10, activation='softmax') # output layer # (뉴런 10개, 활성화 함수 - 소프트맥스)

## 심층 신경망 만들기

In [None]:
# 모델 생성
model = keras.Sequential([dense1, dense2]) # dense layer들을 리스트로 만들어 전달 # 가장 처음 등장하는 hidden layer에서 마지막 output layer 순서로 나열

In [None]:
# 모델 정보
model.summary() # 깊이가 2인 뉴럴 네트워크

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


## 층을 추가하는 다른 방법

In [None]:
# 모델 생성
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'), # name에 layer 이름 설정
    keras.layers.Dense(10, activation='softmax', name='output') # name에 layer 이름 설정
], name='패션 MNIST 모델') # name에 모델 이름 설정

In [None]:
# 모델 정보
model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [None]:
# 모델 생성
model = keras.Sequential() # 비어있는 모델
# 모델에 layer 추가
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [None]:
# 모델 정보
model.summary() # 깊이가 2인 뉴럴 네트워크

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [None]:
# 모델 설정 (기본 optimizer은 RMSprop)
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')

# 모델 훈련
model.fit(train_scaled, train_target, epochs=5) # 에포크 5회

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7a1fb0eb7a00>

## 렐루 활성화 함수

In [None]:
# 모델 생성
model = keras.Sequential() # 비어있는 모델
# 모델에 layer 추가
model.add(keras.layers.Flatten(input_shape=(28, 28))) # 배치 차원을 제외하고 나머지 입력 차원을 모두 일렬로 펼침 # 곱해지는 가중치나 절편이 없음(학습하는 층이 아님)
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [None]:
# 모델 정보
model.summary() # 깊이가 2인 뉴럴 네트워크 # Flatten layer을 추가함으로써 입력값의 차원을 알 수 있음

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [None]:
# MNIST 데이터 불러오기(train set, test set)
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

# 0~1 사이의 값으로 정규화
train_scaled = train_input / 255.0

# train set과 validation set으로 나누기 (기본 train set: 80%, validation set: 20%)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42)

In [None]:
# 모델 설정 (기본 optimizer은 RMSprop)
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')

# 모델 훈련
model.fit(train_scaled, train_target, epochs=5) # 에포크 5회

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7a1fb0c11090>

In [None]:
# 모델 평가
model.evaluate(val_scaled, val_target)



[0.3683287501335144, 0.8725833296775818]

## 옵티마이저

In [None]:
# 모델 설정
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics='accuracy') # optimizer 이름이 "SGD" 이지만 미니배치 사용

In [None]:
# 위와 완전히 동일한 코드
sgd = keras.optimizers.SGD()
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [None]:
# 학습률 지정
sgd = keras.optimizers.SGD(learning_rate=0.1)

In [None]:
# 모멘텀 최적화 # 이전의 그레이디언트를 가속도 처럼 사용
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True) # 보통 momentum 매개변수는 0.9이상으로 지정 # nesterov를 True로 바꾸면 네스테로프 모멘텀 최적화를 사용(네스테로프 모멘텀은 모멘텀 최적화를 2번 반복) # 대부분의 경우 네스테로프 모멘텀 최적화가 기본 확률적 경사 하강법보다 더 나은 성능 제공

In [None]:
# 적응적 학습률 사용하는 optimizer
adagrad = keras.optimizers.Adagrad() # learning_rate 기본값 : 0.001 # 매개변수 설정 필요
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [None]:
# 적응적 학습률 사용하는 optimizer
rmsprop = keras.optimizers.RMSprop() # learning_rate 기본값 : 0.001 # 매개변수 설정 필요
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [None]:
# 모델 생성
model = keras.Sequential() # 비어있는 모델
# 모델에 layer 추가
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [None]:
# 모델 설정
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics='accuracy')

# 모델 훈련
model.fit(train_scaled, train_target, epochs=5) # 에포크 5회

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7a1fcaf39ff0>

In [None]:
# 모델 평가
model.evaluate(val_scaled, val_target)



[0.3525600731372833, 0.8732500076293945]