# 하이퍼파라미터 (hyper-parameter)

> + 머신러닝, 딥러닝 모델을 훈련할 때 사용자가 직접 설정해 주는 설정값
> + 학습 속도나, 반복횟수 등 사용자가 직접 설정하면서 모델의 성능을 올리고 좋은 결과를 추출하기 위한 변경하는 값
    

# 과소적합 / 과대적합


> + 과소적합 (underfitting)

    : 모델이 충분이 학습되지 않은 경우 예측 성능이 떨어진다

> + 과대적합 (overfitting)

    : 학습 데이타를 과하게 학습하여 주어진 훈련 데이터에 대한 예측 성능은 좋지만, 
            정작 중요한 예측 데이터에 대한 예측 오차가 발생할 확률이 커진다


---
<img src='imgs/과대적합.jfif' width='400'>

# 신경망에서 덴스 (Dense)

+ Dense : 분석 모델의 층(layer)

<img src='./imgs/Dense.PNG' width='500'/>

+ activation : 다음층으로 어떻게 값을 넘길지 결정하는 부분

             - relu / sigmoid 많이 사용
             
+ loss : 한 번 신경망이 실행될 때마다 오차 값을 추적하는 함수

+ optimizer : 오차를 어떻게 줄여 나갈지 정하는 함수

[ 출처 ] 모두의딥러닝

# 에코드 (epoch)

> + 딥러닝은 데이터셋을 학습하는 과정을 반복하면서 초적의 모델 가중치를 찾는 것이다

> + 딥러닝 모델이 반복 훈련을 할 때 데이터셋을 전부 학습에 사용하는 1회의 훈련을 1 epoch라 한다

> + 미리 설정한 epoch까지 반복 학습이 끝나고 모델이 과소적합되었다면 epoch를 늘려서 학습하고 과대적합으로 되지 않도록 epoch를 조절하여 최적의 구간을 찾는다

# 손실함수 (loss function)

> + 예측값과 정답값의 차이 또는 오차

> - 분류나 회귀 모델에 따라 손실함수를 다르게 적용

> - 텐서플로에서 제공하는 손실함수는 함수형과 클래스형으로 다양하게 제공한다
> - 딥러닝시 텐서플로우에서 제공하는 손실함수로 해결하지 어려운 경우 사용자 정의 손실함수를 만들어서 사용하기도 한다




<table>
    <tr>
        <th colspan='3'>* 손실함수 목록</th>
    </tr>
    <tr><td></td><td>분류</td><td>회귀</td></tr>
    <tr><td>함수형</td>
        <td>
            ` binary_crossentropy <br/>       
            ` categorial_crossentropy    <br/>         
            ` sparse_categorial_crossentropy  <br/>           
        </td>
        <td>
            ` mean_squared_error<br/>             
            ` mean_absolute_error<br/>             
            ` mean_absolute_percentage_error<br/> 
            ` mean_squared_squared_logarithmic_error<br/>             
        </td>
    </tr>
    <tr><td>클래스형</td>
        <td>
            - BinaryCrossentropy<br/>             
            - CategoricalCrossentropy<br/>             
            - SparseCategoricalCrossentropy<br/>             
        </td>
        <td>
            - MeanSquaredError<br/>             
            - MeanAbsoluteError<br/>             
            - MeanAbsolutePercentageError<br/>             
            - MeanSquaredLogarithmicError    <br/>         
        </td>
    </tr>
</table>    


<img src='./imgs/model2.PNG' width='500'/>

## 활성화 함수 (Activation Function)

   + 입력을 비선형 출력으로 변환해주는 함수
   + 자주 사용되는 활성화 함수
       - 시그모이드 (sigmoid)
       - 하이퍼볼릭 탄젠트 (tanh)
       - ReLU
       
       [공식문서] https://www.tensorflow.org/api_docs/python/tf/keras/activations

       
## 입력과 출력

   + 첫번째 레이어는 입력 데이터 형태로 이미지의 가로, 세로 배열값으로 input_shape=(28,28)
   + 마지막 레이어는 출력층으로 반드시 분류해야하는 클래스 수와 동일해야 함
       - mnist는 0~9까지 총 10개의 분류값(클래스)로 되어 있기에 출력층 노드는 10이여야 함
       - 출력층의 노드가 1개인 경우는 sigmoid 활성화 함수를 적용하지만
           - tf.keras.layers.Dense(units=1, activation='sigmoid')
       - 출력층의 노드가 2개 이상인 경우는 softmax 활성화 함수를 적용한다.
           - tf.keras.layers.Dense(units=2, activation='softmax')
           
           
## 손실함수        

   + 모델의 출력층에 따라 손실함수를 설정해야 정상적인 훈련이 가능
   + compile() 함수에 loss지정
    
    
   + 이진분류 : 출력층의 노드 = 1, sigmoid 활성화 함수
        - model.compile(loss='binary_crossentropy')
        
        
   + 출력층의 노드 = 2개 이상, softmax 활성화 함수
        - model.compile(loss='categorical_crossentropy' ) : 출력 데이타(y)가 one-hot vector인 경우
        - model.compile(loss='sparse_categorical_crossentropy' ) : 출력 데이타(y)가 one-hot vector가 아닌 경우
        - mnist 데이타는 클래스의 수가 10개로 원핫벡터가 아니라 0~9까지 레이블 값을 가진다
        
         [참고] one-hot vector : [0,0,1,0,0,0,0,0,0,0]
     

## 옵티마이저 (optimizer )

   + 손실을 낮추기 위해 신경망의 가중치 같은 속성 변경하는데 사용되는 최적화 방법
   + 일반적으로 많이 사용하는 알고리즘 : Adam
   + 케라스에서 지원하는 옵티마이저 :
       -   SGD, Adam, Adgrad, Nadam, RMRprop, Adadelta, Adamax, Ftrl   
       
          [공식문서] https://www.tensorflow.org/api_docs/python/tf/keras/optimizers
   
   
      + 클래스 인스턴스로 지정 
           - adam = tf.keras.optimizers.Adam(lr=0.001)
             model.compile(optimizer=adam)
           - lr (Learning rate:학습률) 같은 하이퍼파라미터르 직접 지정 가능
           
      + 문자열 지정 (전부 소문자임 )
           - model.compile(optimizer='adam')
           
           
## 평가지표 (metrics)

   + 분류모델에 대한 평가지표는 정확도를 나탸내는 'accurary' 또는 'acc'가 많이 사용
   + 'auc', 'precision', 'recall' 등의 지표도 사용
   
       [공식문서] https://www.tensorflow.org/api_docs/python/tf/keras/metrics
   