# 머신 러닝 모델 평가

![이미지](../img/ML1.png)
- 실제 모델을 평가하기 위해 데이터를 **훈련용, 검증용, 테스트용** (또는 훈련용과 테스트용)으로 분리하여 사용한다.
- 검증용 데이터는 모델의 성능을 조정하기 위한 용도로 과적합 여부를 판단하거나 하이퍼파라미터의 조정을 하기위해 사용한다.
- **하이퍼파라미터**
    - 값에 따라 모델의 성능에 영향을 주는 매개변수를 뜻한다.
    - 보통은 사용자가 직접 정해줄 수 있는 변수이며 경사하강법의 학습률이 이에 해당된다.
    - 딥 러닝에서는 은닉층의 개수, 뉴런의 개수, 드롭아웃 비율 등이 있다.
- **매개변수**
    - 학습을 통해 바뀌는 변수를 뜻한다.
    - 사용자가 직접 결정하지 않고 모델의 학습과정에서 얻어지는 값으로 가중치와 편향과 같은 변수가 있다.
- 훈련을 완료한 모델은 검증용 데이터를 사용해 정확도를 검증하고 하이퍼파라미터를 **튜닝** 한다.
- 튜닝이 끝난 뒤에는 최적화가 되지 않은, 즉 새로운 데이터(테스트용 데이터)로 모델을 평가한다.
- 데이터가 적어 검증 데이터를 따로 나누기 어려울 경우 **k-폴드 교차 검증** 이라는 방법을 사용하기도 한다.

# 분류(Classification), 회귀(Regression)

1. **이진 분류 문제(Binary Classification)**
    - 주어진 입력에 대해 **둘 중 하나의 답** 을 정하는 문제이다.
    - Ex) 합격 불합격 판단, 스팸 메일 분류 등
2. **다중 클래스 분류(Multi-class Classification)**
    - 주어진 입력에 대해서 **세 개 이상의 정해진 선택지** 중 답을 정하는 문제이며, 이 때 선택지를 주로 카테고리 또는 범주 또는 클래스라고 한다.
    - 주어진 입력으로부터 정해진 클래스 중 하나로 판단하는 것을 다중 클래스 분류 문제라고 한다.
3. **회귀 문제(Regression)**
    - 분류 문제와 다르게 **연속된 값을 결과로** 가진다.
    - Ex) 공부 시간에 따른 시험 성적 예측, 시계열 데이터를 이용한 주가 예측 등

# 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning)

1. **지도 학습**
    - 정답을 알려주고 **정답과 함께 학습시키는** 방법이다.
    - 정답은 Lable 또는 y 또는 실제값 등으로 불린다.
    - 예측값은 y^ 와 같이 표현하기도 한다.
2. **비지도 학습**
    - 기본적으로 **목적 데이터(or 레이블) 없이 학습시키는 학습** 방법이다.
    - 대표적으로 군집이나 차원 축소와 같은 학습 방법들이 있다.
3. 강화 학습
    - 어떤 환경 내에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다.

# 샘플(Sample), 특성(Feature)

- 독립 변수 x의 행렬을 X라고 할 경우, 독립 변수의 개수가 n개이고 데이터의 개수가 m인 행렬 X는 다음과 같다.
![행렬 X](../img/ML2.png)
- **Sample** : 하나의 데이터, 하나의 행을 의미한다. DB에서는 레코드라고 부르는 단위이다.
- **Feature** : 종속 변수 y를 예측하기 위한 각각의 독립 변수 x를 의미한다.

# 혼동 행렬(Confusion Matrix)

- **정확도(Accuracy)** : (맞춘 문제수) / (전체 문제수)
- 맞춘 결과와 틀린 결과에 대한 세부적인 내용은 정확도만으로 알 수 없어 사용하는 것이 **혼동 행렬** 이다.
- **혼동 행렬(Confusion Matrix)**
    ![혼동 행렬](../img/ML3.png)
    - 위는 양성(Positive)과 음성(Negative)을 구분하는 이진분류의 혼동행렬이다.
    - 각 열은 예측값을, 각 행은 실제값을 나타낸다.
    - 예를들어 위에서 FN은 실제값이 양성인데 예측값이 음성이라 대답하여 틀린 경우를 의미한다.
1. **정밀도(Percision)**
    - 양성이라고 대답한 전체 케이스에 대한 TP의 비율이다. (예측값이 양성인 케이스 중 참인 케이스의 비율)
    - __정밀도 = TP / (TP + FP)__
2. **재현률(Recall)**
    - 실제값이 양성인 데이터의 전체 개수에 대한 TP의 비율이다. (실제값이 양성인 케이스 중 참인 케이스의 비율)
    - __재현률 = TP / (TP + FN)__

# 과적합(Overfitting), 과소 적합(Underfitting)

- **과적합(Overfitting)** : 훈련 데이터를 과하게 학습하여 테스트 데이터나 실제 서비스에서의 데이터에서 정확도가 좋지 않은 현상을 의미한다.
- 과적합 상태에서는 훈련 데이터에 대해서만 오차가 낮고, 테스트 데이터와 같은 다른 데이터에 대해 오차가 높아진다.
- **과소적합(Underfitting)** : 테스트 데이터의 성능이 올라갈 여지가 있음에도 훈련을 덜 한 상태로, 과대 적합과 달리 훈련 데이터에 대해서도 정확도가 낮다.
- 딥 러닝 시 과적합을 막을 수 있는 방법으로는 드롭아웃(Dropout), 조기 종료(Early Stopping) 등이 있다.