# 모델의 성능을 올리기 위한 기법들

## 배치 정규화 (Batch Normalization)

훈련하는 동안 평균과 분산이 바뀌어도 이에 적응하여 데이터를 정규화  
훈련 과정에 사용된 배치 데이터의 평균과 분산에 대한 지수 이동 평균을 유지함  
주요 목적 : 그래디언트의 전파를 도움 -> 깊은 네트워크를 구성할 수 있도록  

In [None]:
# 보통 BatchNormalization() 층은 합성곱이나 완전 연결 층 다음에 사용
conv_model.add(layers.Conv2D(32, 3, activation='relu'))
conv_model.add(layers.BatchNormalization())

conv_model.add(layers.Dense(32, 3, activation='relu'))
conv_model.add(layers.BatchNormalization())

## 깊이별 분리 합성곱 (Depthwise Separable Convolution)

SeparableConv2D()  
입력 채널별로 분리해 공간 방향의 합성곱을 수행함  
점별 합성곱을 통해 출력 채널을 합친다.  
공간 특성의 학습과 채널 방향 특성의 학습을 분리하는 효과  
모델 파라미터와 연산의 수를 크게 줄여줌  

In [None]:
from keras.models import Sequential, Model
from keras import layers

height = 64
width = 64
channels = 3
num_classes = 10

model = Sequential()
model.add(layers.SeparableConv2D(32, 3, 
                                 activation='relu', 
                                 input_shape=(height, width, channels,)))
model.add(layers.SeparableConv2D(64, 3, activation='relu'))
model.add(layers.MaxPooling2D(2))

model.add(layers.SeparableConv2D(64, 3, activation='relu'))
model.add(layers.SeparableConv2D(128, 3, activation='relu'))
model.add(layers.MaxPooling2D(2))

model.add(layers.SeparableConv2D(64, 3, activation='relu'))
model.add(layers.SeparableConv2D(128, 3, activation='relu'))
model.add(layers.GlobalAveragePooling2D())

model.add(layers.Dense(32, activation='relu'))

model.add(layers.Dense(num_classes, activation='softmax'))

model.compile(optimizer='rmsprop', loss='categorical_crossentropy')

## 하이퍼파라미터 최적화

hypyerparameter : 네트워크 구조와 관련된 파라미터 (역전파로 훈련되는 모델 파라미터와 구분함)

하이퍼파라미터 최적화 과정  
1. 하이퍼파라미터를 자동으로 선택
2. 선택한 값으로 모델 만듦
3. 훈련 데이터로 학습, 검증에서 성능 측정
4. 다음 시도할 하이퍼파라미터를 자동으로 선택
5. 반복
6. 마지막으로 테스트 데이터에서 성능 측정  

검증 성능을 이용해 다음 하이퍼파라미터를 선택하는 것

## 모델 앙상블 (Model Ensemble)