## 인공신경망 (Artif- icial Neural Network : ANN)

인공신경망 (Artif- icial Neural Network : ANN)
- 인간의 뉴런 구조를 본떠 만든 기계학습 모델
- 인간의 뉴런 동작 원리에 기초해 인공적으로 구축한 신경망 (기계학습 모델)

인공신경망의 종류
- DNN(Deep Neural Network:심층 신경망) 
- RNN(Recurrent Neural Network : 순환 싱경망)
- Long Short-Term Memory (LSTM)
- CNN(Convolution Neural Network :  합성곱 신경망)

DNN(Deep Neural Network:심층 신경망)
- 하나의 입력층과 하나의 출력증, 다수의 은닉층으로 구성
- 무방향 이분 그래프 형태의 모양을 기반으로
- 사전할습을 통해 어느 정도 보정을 한 후 튜닝의 과정을 거쳐 최종 가중치를 계산하는 방법
- 레이블된 데이터 세트가 충분하지 않아도 적용 가능

RNN(Recurrent Neural Network : 순환 싱경망)
- DFN의 시계열 데이터 처리의 한계점 해결하기 위한 신경망
- 유닛 간 연결이 순환적 구조를 이룸
- 신경망 내부에 상태를 저장할 수 있게 함으로써
- 내부의 메모리를 이용해 시퀀스 형태의 입력 처리
- RNN은 은닉층의 노드에서 활성화 함수를 통해 나온 결과값을 
- 출력층 방향으로도 보내면서, 
- 다시 은닉층 노드의 다음 계산의 입력으로 보내는 특징
- 문자열, 센서 데이터, 음성인식과 같이 시간적으로 연속성이 있는 데이터 처리에 용이
- 층이 많은 네트워크에서 나타나는 그래디언트 소실 문제(vanishing gradient problem) 발생
- 오랜 시간에 결쳐 학습시 gradient가 소실하는 문제

Long Short-Term Memory (LSTM)
- 장단기 메모리
- RNN에서 발생하는 그래디언트 소실 문제를 해결하기 위해 제안
- 실전에서 응용들은 대부분 이 LSTM을 이용하여 구현
- 은닉층의 메모리 셀에 입력 게이트, 망각 게이트, 출력 게이트를 추가하여 
- 불필요한 기억을 지우고, 기억해야할 것들을 정함
- 은닉 상태(hidden state)를 계산하는 식이 
- 전통적인 RNN보다 조금 더 복잡해졌으며 셀 상태(cell state)라는 값을 추가
- forget gate, input gate, output gate라는 새로운 요소를 은닉층의 각 뉴런에 추가

CNN(Convolution Neural Network :  합성곱 신경망)
- 최소한의 사전처리를 사용하도록 설계된 다층 퍼셉트론으 한 종류
- 하나 또는 여러 개의 합성곱 계측과 그 위에 올려진 일반적인 인공신경망 계층들로 이루어짐
- 주로 시각적 이미지를 분석하는 데 사용
- 오디오, 시계열, 신호 데이터와 같이 영상 이외의 데이터를 분류하는 데도 효과적

In [1]:
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [2]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity="all"

In [7]:
# 데이터 로드 
from keras.datasets import mnist

(X_train, y_train), (X_test, y_test) = mnist.load_data()

In [8]:
X_train.shape
y_train.shape
X_test.shape
y_test.shape

(60000, 28, 28)

(60000,)

(10000, 28, 28)

(10000,)

In [11]:
# 차원 변환 및 정규화
# X_train : (60000, 28, 28) -> (60000, 28*28) == (60000, 784)
X_train = X_train.reshape(X_train.shape[0], 28*28, 1).astype('float32') / 255
X_test = X_test.reshape(X_test.shape[0], 28*28, 1).astype('float32') / 255

from keras.utils import to_categorical

y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

In [12]:
X_train.shape
y_train.shape
X_test.shape
y_test.shape

(60000, 784, 1)

(60000, 10, 10, 10)

(10000, 784, 1)

(10000, 10)

In [13]:
import tensorflow as tf
tf.random.set_seed(3)

In [18]:
# convolution 신경망 설정
# (1) 모델 설정

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense,Dropout, Flatten, Conv2D, MaxPooling2D

model = Sequential()
model.add(Conv2D(32, (3,3), input_shape=(28,28,1), activation='relu'))
model.add(MaxPooling2D(2,2))
model.add(Conv2D(64, (3,3), activation='relu'))
model.add(MaxPooling2D(2,2))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

# 첫번째 층
# 필터크기(3X3) + 입력채널(1) X 출력채널(32) + 출력채널(32)
# (3X3) + 1 X 32 + 32 = 320

# 두번째 층
# (3X3) + 32 X 64 + 64 = 



In [19]:
model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 conv2d_2 (Conv2D)           (None, 26, 26, 32)        320       
                                                                 
 max_pooling2d_2 (MaxPoolin  (None, 13, 13, 32)        0         
 g2D)                                                            
                                                                 
 conv2d_3 (Conv2D)           (None, 11, 11, 64)        18496     
                                                                 
 max_pooling2d_3 (MaxPoolin  (None, 5, 5, 64)          0         
 g2D)                                                            
                                                                 
 dropout_2 (Dropout)         (None, 5, 5, 64)          0         
                                                                 
 flatten_1 (Flatten)         (None, 1600)             