<a href="https://colab.research.google.com/github/kikiru328/Study_notebook/blob/main/Study_code/Deeplearning_framework/keras/keras03.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 신경망의 구조

    * 신경망의 훈련에는 다음 요소가 관련되어 있다.
    1. 네트워크 (또는 모델)을 구성하는 층
    2. 입력 데이터와 그에 상응하는 타깃
    3. 학습에 사용할 피드백 신호를 정의하는 손실 함수
    4. 학습 진행 방식을 결정하는 옵티마이저

### 층 : 딥러닝의 구성 단위

In [None]:
# 층은 하나 이상의 텐서를 입력으로 받아 하나 이상의 텐서를 출력하는 데이터 처리 모듈.
# 대부분의 경우 가중치라는 층의 상태를 가지며, 가중치는 확률적 경사 하강법에 의해 학습되는 하나 이상의 텐서이다.
# 층마다 적절한 텐서 포맷ㅎ과 데이터 처리 방식이 다름.
# ex) (samples, features) 크기의 2D 텐서가 저장된 간단한 벡터 데이터 == 완전 연결 층 / 빌집 연결 층 에 의해 처리됨.
#     (samples, timesteps, features) 크기의 3D 텐서로 저장된 시퀀스 데이터는 보통 LSTM과 같은 순환층
#     4D 텐서로 저장되어 있는 이미지 데이터는 일반적으로 2D 합성곱 층에 의해 처리됨. (Conv2D)
# 케라스는 호환 가능한 층들을 엮어 데이터 변환 파이프라인을 구성함으로써 딥러닝 모델을 구축함.
# 층 호환성은 각 층이 특정 크기의 입력 텐서만 받고 특정 크기의 출력 텐서를 반환함.

from tensorflow.keras import layers
layer = layers.Dense( 32, input_shape=(784,) ) # 32개의 유닛으로 된 밀집 층을 의미.

# 첫 번째 차원이 784인 2D 텐서만 입력으로 받는 층. ( 배치 차원인 0번째 축은 지정하지 않아 어떤 배치 크기도 입력 가능)
# 이 층은 첫 번째 차원 크기가 32로 변환된 텐서를 출력할 것.
# 따라서 이 층에는 32차원의 벡터를 입력으로 받는 하위 층이 연결되어야 함.

from tensorflow.keras import models
from tensorflow.keras import layers

model = models.Sequential()
model.add( layers.Dense( 32, input_shape = (784,) )
model.add( layers.Dense( 10 ) )

# 두 번째 층에는 input_shape 매개변수를 지정하지 않음 --> 앞선 층의 출력 크기를 입력 크기로 자동 채택

### 모델 : 층의 네트워크

In [4]:
# 띱러닝 모델은 층으로 만든 비순환 유향 그래프. 
# 하나의 입력을 하나의 출력으로 매핑하는 층을 순서대로 쌓음.
# 네트워크 구조 == 가설 공간. ( 가능성 있는 공간을 사전에 정의하고 피드백 신호의 도움을 받아 입력 데이터에 대한 유용한 변환을 찾는 것. )
# 가설 공간을 입력 데이터에서 출력 데이터로 매핑하는 일련의 특정 텐서 == 네트워크 구조

### 손실 함수와 옵티마이저 : 학습 과정을 조절하는 열쇠

In [5]:
# 네트워크 구조를 정의하면 두 가지를 선택해야된다.
# 손실함수 ( 목적 함수 ) : 훈련하는 동안 최소화 될 값.
# 옵티마이저 : 손실 함수를 기반으로 네트워크가 어떻게 업데이트될지 결정. 특정 종류의 확률적 경사 하강법을 구현.
# 문제에 맞는 목적 함수를 선택해야 됨.
# 2개의 클래스 분류 : 이진 크로스엔트로피 ( binary crossentropy )
# 다중 클래스 분류 : 범주형 크로스엔트로피 ( categorical crossentropy )
# 회귀 문제 : 평균 제곱 오차 ( Mean Squard Error )
# 시퀀스 학습 문제 : CTC ( connection Temporal Classification )

# 케라스란

    - 동일한 코드로 cpu 와 gpu 에서 사용이 가능
    - 사용하기 쉬운 api, 딥러닝 모델의 프로토타입을 빠르게 생성 가능
    - 컴퓨터 비전을 위한 합성곱 신경망, 시퀀스 처리를 위한 순환 신경망을 지원. --> 자유롭게 조합하여 사용 가능
    - 다중 입력이나 다중 출력 모델, 층의 공유, 모델 공유 등 어떤 네트워크 구조도 만들 수 있음. ==> GAN 

### 케라스를 사용한 개발

In [None]:
from typing import Sequence
# 모델을 정의하는 방법은 두가지.
# 1. Sequential 클래스 ( 가장 자주 사용하는 구조인 층을 순서대로 쌓아 올린 네트워크 )
# 2. Functional API ( 완전히 임의의 구조를 만들 수 있는 비순환 유향 그래프 )

# Sequential
from tensorflow.keras import models, layers
model = models.Sequential()
model.add(layers.Dense(32, activation='relu', input_shape = (784,)))
model.add(layers.Dense(10, activation='softmax'))

# API
input_tensor = layers.Input(shape=(784,))
x = layers.Dense(32, activation='relu')(input_tensor)
output_tensor = layers.Dense(10, activation='softmax')(x)
model = models.Model(inputs= input_tensor, outputs=output_tensor)
# API를 사용하면 모델이 처리할 데이터 텐서를 만들고 마치 함수처럼 이 텐서에 층을 적용함.


# 컴파일 단계에서 학습 과정이 설정된다.
# 여기에서 모델이 사용할 옵티마이저와 손실 함수, 훈련 하는 동안 필요한 측정 지표를 지정.
from tensorflow.keras import optimizers
model.compile(optimizer=optimizers.RMSprop(learning_rate = 0.001),
              loss = 'mse',
              metrics=['accuracy'])

# 마지막으로 입력 데이터의 넘파이 배열을
# 모델의 fit() 메서드에 전달함으로써 학습 과정이 진행된다.
model.fit(input_tensor, target_tensor, batch_size=128, epoch=10)

# NLP ( 영화 리뷰 분류 : binary crossentropy )

### IMDB

    = Train 25000
    - test 25000
    - 