<a href="https://colab.research.google.com/github/Byeon-MJ/DL_Practice_Repo/blob/main/Deep_Neural_Network_baseline.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 심층 신경망

## 2개의 층

### FashionMNIST 데이터셋 준비하기
* 은닉층 : 입력층과 출력층 사이에 있는 모든 충
* 활성화 함수 : 뉴런의 선형 방정식 계산 결과에 적용되는 함수

In [1]:
from tensorflow import keras
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [2]:
from sklearn.model_selection import train_test_split
train_scaled = train_input / 255.0
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42
)

In [3]:
dense1 = keras.layers.Dense(100, activation='sigmoid', input_shape=(784,))
dense2 = keras.layers.Dense(10, activation='softmax')

## 심층 신경망 만들기

In [4]:
model = keras.Sequential([dense1, dense2])

In [5]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 100)               78500     
                                                                 
 dense_1 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


* 케라스의 기본 미니배치 크기는 32개

## 층을 추가하는 다른 방법
* Sequential에서 층을 직접 추가하기
* name 매개변수로 모델 및 레이어의 이름 지정 가능

In [7]:
model = keras.Sequential([
    keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name='hidden'),
    keras.layers.Dense(10, activation='softmax', name='output')], name='패션 MNIST 모델'
)

In [8]:
model.summary()

Model: "패션 MNIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


### add() 메서드를 이용하여 층 쌓기

In [9]:
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,)))
model.add(keras.layers.Dense(10, activation='softmax'))

In [10]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [12]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f25bc23f670>

## 렐루 함수
* 입력이 양수일 경우 그냥 입력을 통과시키고 음수일 경우에는 0으로 만든다.
* 렐루 함수는 특히 이미지 처리에서 좋은 성능을 낸다고 알려짐

In [13]:
model = keras.Sequential()

**Flatten 층 추가하기**
* 학습하는 층이 아니므로 깊이에 포함되지는 않음
* 모델 파라미터는 0
* 입력 데이터에 대한 전처리 과정을 가능한 모델에 포함시키는 것이 케라스 API의 철학 중 하나

In [16]:
model.add(keras.layers.Flatten(input_shape=(28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [17]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_4 (Dense)             (None, 100)               78500     
                                                                 
 dense_5 (Dense)             (None, 10)                1010      
                                                                 
 flatten_1 (Flatten)         (None, 10)                0         
                                                                 
 dense_6 (Dense)             (None, 100)               1100      
                                                                 
 dense_7 (Dense)             (None, 10)                1010      
                                                                 
Total params: 81,620
Trainable params: 81,620
Non-trai

In [18]:
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255.0
train_scaled, val_scaled, train_target, val_target = train_test_split(
    train_scaled, train_target, test_size=0.2, random_state=42
)

In [19]:
model.compile(loss='sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f25b40c4400>

In [20]:
model.evaluate(val_scaled, val_target)



[0.39831072092056274, 0.8644999861717224]

## 옵티마이저
* 딥러닝의 하이퍼 파라미터 
    * 은닉층의 개수
    * 뉴런의 개수
    * 활성화 함수
    * 층의 종류
    * 미니배치 개수
    * epochs
    * 옵티마이저 등
* 신경망의 가중치와 절편을 학습하기 위한 알고리즘 또는 방법
* 다양한 경사하강법 알고리즘이 구현되어 있으며 대표적으로 SGD, 모멘텀, RMSprop, Adam 등이 있다.

In [22]:
# SGD 옵티마이저 적용
model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics='accuracy')

In [23]:
# SGD 옵티마이저 적용2
sgd = keras.optimizers.SGD()
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy')

### 모멘텀 최적화
* 기본 경사 하강법 옵티마이저는 모두 SGD 클래스에서 제공
* SGD 클래스의 momentum의 기본값은 0
* momentum을 큰 값으로 지정하면 이전의 그래디언트를 가속도 처럼 사용하는 모멘텀 최적화
* 보통 momentum은 0.9 이상을 지정
* nesterov 매개변수를 True로 바꾸면 네스테로프 모멘텀 최적화
* 대부분의 경우 네스테로프 모멘텀 최적화가 기본 경사 하강법보다 더 나은 성능 제공

In [24]:
# 옵티마이저 학습률 변경
sgd = keras.optimizers.SGD(learning_rate=0.1)
model.compile(optimizer=sgd, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [26]:
# 네스테로프 모멘텀 최적화 적용
sgd = keras.optimizers.SGD(momentum=0.9, nesterov=True)

### 적응적 학습률(adaptive learning rate)
* 대표적인 옵티마이저는 Adagrad와 RMSprop
* 모델이 최적점에 가까이 갈수록 학습률을 낮출 수 있다.

In [27]:
# adagrad 적용
adagrad = keras.optimizers.Adagrad()
model.compile(optimizer=adagrad, loss='sparse_categorical_crossentropy', metrics='accuracy')

In [28]:
# RMSprop 적용
rmsprop = keras.optimizers.RMSprop()
model.compile(optimizer=rmsprop, loss='sparse_categorical_crossentropy', metrics='accuracy')

### Adam을 사용해 모델 훈련하기

In [29]:
model = keras.Sequential()

In [30]:
model.add(keras.layers.Flatten(input_shape=(28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [32]:
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy',
              metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f25b75011c0>

In [33]:
model.evaluate(val_scaled, val_target)



[0.3645041584968567, 0.8691666722297668]