<a href="https://colab.research.google.com/github/pumkinni/book_study/blob/master/%ED%98%BC%EA%B3%B5_%EB%A8%B8_%EB%94%A5_7_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 심층 신경망
> 인공 신경망에 층을 여러 개 추가하여 패션 MNIST 데이터셋을 분류하면서 케라스로 심층 신경망을 만드는 방법을 자세히 배우기

#### 2개의 층
- 은닉층 : 입력층과 출력충 사이에 있는 모든 층
- 출력층에 적용하는 활성화 함수 
  > 이진 분류 : 시그모이드 함수
  
  > 다중 분류 : 소프트맥스 함수

  > 은닉층의 활성화 함수는 비교적 자유로음(대표적 : 시그모이드 함수, 볼 렐루 함수)

In [None]:
# 데이터 불러오기
from tensorflow import keras
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz


In [None]:
# 데이터 구분하기
from sklearn.model_selection import train_test_split
import numpy as np
train_scaled = train_input / 255
train_scaled = train_scaled.reshape(-1, 28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size = 0.2, random_state=42)

In [None]:
# dense1(은닉층), dense2(출력층) 생성
dense1 = keras.layers.Dense(100, activation = 'sigmoid', input_shape = (784,0))
dense2 = keras.layers.Dense(10, activation = 'softmax')

#### 심층 신경망 만들기

In [None]:
model = keras.Sequential([dense1, dense2])

In [None]:
# 층에 대한 정보 얻기
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 784, 100)          100       
                                                                 
 dense_1 (Dense)             (None, 784, 10)           1010      
                                                                 
Total params: 1,110
Trainable params: 1,110
Non-trainable params: 0
_________________________________________________________________


#### 층을 추가하는 다른 방법
- Sequential 클래스의 생성자 안에 바로 Dense 클래스의 객체 만들기

In [None]:
model = keras.Sequential([keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name = 'hidden'), \
                          keras.layers.Dense(10, activation='softmax', name = 'output')], name = '패션 MINIST 모델')


In [None]:
model.summary()

Model: "패션 MINIST 모델"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [None]:
# add를 사용하여 추가하기
model = keras.Sequential()
model.add(keras.layers.Dense(100, activation='sigmoid', input_shape=(784,), name = 'hidden'))
model.add(keras.layers.Dense(10, activation= 'softmax', name = 'output'))

In [None]:
model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 hidden (Dense)              (None, 100)               78500     
                                                                 
 output (Dense)              (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [None]:
# 모델 훈련
model.compile(loss='sparse_categorical_crossentropy', metrics = 'accuracy')
model.fit(train_scaled, train_target, epochs = 5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f38b3f9b910>

#### 렐루 함수
- 이미지 분류 문제에서 높은 성능을 낼 수 있는 활성화 함수(심층 신경망에서 뛰어남)
- max(0,z)로 쓸 수 있음(z가 0보다 크면 z를 출력하고 z가 0보다 작으면 0을 출력)

In [None]:
# Flatten 클래스 : 배치 차원을 제외하고 나머지 입력 차원을 모두 일렬로 펼치는 역할 -> 입력 데이터를 1차원을 줄일 필요가 없다
# 입력에 곱해지는 가중치나 절편은 없다.(인공 신경망의 성능을 위해 기여하는 바는 없다)
# 입력층 바로 뒤에 추가
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape = (28, 28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))
# 입력 데이터에 대한 전처리 과정을 가능한 모델에 포함시키는 것이 케라스 API 철학 중 하나

In [None]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 flatten (Flatten)           (None, 784)               0         
                                                                 
 dense_2 (Dense)             (None, 100)               78500     
                                                                 
 dense_3 (Dense)             (None, 10)                1010      
                                                                 
Total params: 79,510
Trainable params: 79,510
Non-trainable params: 0
_________________________________________________________________


In [None]:
# 훈련데이터를 다시 준비해서 학습 시키기
(train_input, train_target), (test_input, test_target) = keras.datasets.fashion_mnist.load_data()
train_scaled = train_input / 255
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, random_state=42)

In [None]:
model.compile(loss = 'sparse_categorical_crossentropy', metrics='accuracy')
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f38b80df550>

In [None]:
model.evaluate(val_scaled, val_target)



[0.36867979168891907, 0.8708000183105469]

#### 옵티마이저
- 다양한 종류의 경사 하강법 알고리즘
- 확률적 경사 하강법(SDG)
      model.compile(optimizer='sgd', loss='sparse_categorical_crossentropy', metrics = 'accuracy')
      #클래스로 구현      
      sgd = keras.optimizers.SGD()
      model.compile(optimizer = sgd, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy)
      # 학습률 지정하여 사용 
      sgd = keras.optimizers.SGD(learning_rate = 0.1)

- 기본 경사 하강법 옵티마이저
> momentum 매개변수를 0보다 큰 값으로 지정하면 그레이디언트를 가속도처럼 사용하는 모멘텀 최적화를 사용(보통 0.9이상 지정)

  > nesterov 매개변수를 True로 바꾸면 네스테로프 모멘텀 최적화(네스트로프 가속 경사)를 사용

      sgd = keras.optimizers.SGD(momentum = 0.9, nesterov = True)
- 적응적 학습률 : 모델이 최적점에 가까이 갈수록 학습률을 낮추어 안정적으로 최적점에 수렴할 가능성이 높아짐
> 대표적인 옵티마이저 : Adagrad, RMSprop (클래스 객체를 만들어 사용)
      # Adagrad
      adagrad = keras.optimizers.Adagrad()
      model.compile(optimizer = adagrad, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy')
      # RMSprop
      rmsprop = keras.optimizers.RMSprop()
      model.compile(optimizer = rmsprop, loss = 'sparse_categorical_crossentropy', metrics = 'accuracy')

- 모멘텀 최적화와 RMSprop의 장점을 접목한 것이 Adam

In [None]:
model = keras.Sequential()
model.add(keras.layers.Flatten(input_shape = (28,28)))
model.add(keras.layers.Dense(100, activation='relu'))
model.add(keras.layers.Dense(10, activation='softmax'))

In [None]:
# adam 옵티마이저로 실행해보기
model.compile(optimizer='adam', loss = 'sparse_categorical_crossentropy', metrics = 'accuracy')
model.fit(train_scaled, train_target, epochs = 5)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x7f38b3cc0050>

In [None]:
model.evaluate(val_scaled, val_target)



[0.34171390533447266, 0.8777333498001099]