# 분류모형개요


**분류문제**
- 분류(Classification)문제는 독립변수값이 주어졌을때 그 값과 가장 연관성이 큰 **종속변수(클래스)** 값을 예측하는 문제.


\
**분류모형**  
분류문제를 푸는 방법 또는 방법론
 - **확률적모형** : 주어진 데이터를 이용하여 모든 조건부 확률을 계산하여 가장 높은 확률 값으로 예측하는 방법
   - 확률적판별모형 : 베이즈 정리를 사용하지 않는 모형
   - 확률적생성모형 : 베이즈 정리를 이용한 모형
 - **판별함수모형** : 판별함수(discriminant function)를 이용한 방법.

## 확률적 모형

출력 변수 y 는 K개의 클래스에 속하는 값들 중 하나를 가진다고 가정할 때, 확률적 모형은 주어진 x에 따른 결과 y가 클래스에 속할 확률 $P(y=k|x)$ 확률을 모두 계산한 후 가장 높은 확률의 카테고리 값을 선택한다.

$$
\hat{y} = \arg \max_k P(y = k | x)
$$

예) 이미지 분류 문제에서 3000개의 카테고리 값이 출력 변수라면 3000개의 이미지 각각에 대해 주어진 x 가 일치할 확률 값을 모두 계산한다.

[확률적 모형 사용 메서드]
```python
# 예측된 결과를 리턴한다.
model.predict(X)

# 각 카테고리별 확률 값을 리턴 한다.
model.predict_proba(X)

# 각 카테고리별 확률 값의 로그를 리턴 한다.
model.predict_log_proba(X)

```

### 확률적 생성모형 (베이즈정리)

1. 새로운 가상의 특징 데이터를 생성해내거나 특징 데이터 만으로도 아웃라이어를 판단할 수 있다.  
2. 카테고리값이 2개이상인 경우에도 바로 적용하여 확인 가능하다.
3. 하지만, 클래스가 많을 경우 모든 클래스에 대해 $P(x|y=k)$ 를 추정하는데에는 많은 자원과 계산량이 소모되는 단점이 있다.


$$
P(y=k|x) = {P(x|y=k)P(y=k) \over P(x)}
$$


생성모형에서는 전체 확률의 법칙을 이용하여 특징 데이터 x의 무조건부 확률분포 P(x)를 구할 수 있다.

$$
P(x) = \sum^K_{k=1}P(x|y=k)P(y=k)
$$


$P(x|y=k)$ : likelyhood
답이 주어졌을때 x를 구할 수 있을 확률  
예) 고양이라는 답이 주어졌을때, 이 정보의 특징을 불러와 고양이 그림을 생성 할 확률.

설명) 예측결과 값이 주어질때 **저장된 특징 벡터들을 이용해 그림(특징 벡터의 조합)을 추론해 낼 수 있다.** 때문에 이를 **생성 모형**이라고 부른다.



- LDA/QDA
- 나이브 베이지만




In [9]:
#

### 확률적 판별모형

x가 주어졌을때 y가 K개의 카테고리중에 하나일 확률을 구하는 함수 f(x) 를 찾는 것.


$$
P(y=k|x) = f(x)
$$

- 로지스틱 회귀
- 의사결정나무



### 판별함수모형
예측 결과값 y 를 도출하는 독립변수 $X$가 군집을 이룬다고 가정 할때. 결과값 $y$ 를 도출 하는 $X$를 클래스별로 경계면을 나눌 수 있는데. 이때 경계면을 으로부터 각 클래스의 거리를 계산하는 함수 $f(x)$ 를 판별함수(discriminant function)이라고 한다. 

### <center>  때문에 경계면의 안 과 밖 이진 분류만 가능하다.</center>

**※ 확률적 판별모형과의 차이**  
학률적 판별모형의 함수 $f(x)$ 는 확률값을 계산하는 함수를 의미함.  
<span style="color:red">판별함수모형은 확률값을 계산하는 함수가 아닌 분류를 판별하는 T/F 형식의 함수를 말함.  </span>

예) 다중퍼셉트론에서 노드와 노드로 데이터가 흐를떄 지속 여부를 관장하는 **활성함수(Activation Function)**를 거쳐 최종 분류 모형이 결정 되는 방식이 판별함수를 적용한 예라고 할 수 있다

이때 판별함수를 통해 분류된 카레고리값들의 경계면을 **하이퍼 플레인(decision hyperplane)** 이라고 한다.

- 퍼셉트론
- 서포트벡터머신
- 인공신경망

In [None]:
# 판별함수모형


**※ 다중클래스 분류**  
판별함수모형의 경우 이진 분류 형태로 밖에 학습 분류가 불가능 하다. 하지만 다중 클래스 분류문제로 변환하여 이를 해결 할 수 있는데 **OvO(One-Vs-One) 방법**과 **OvR(One-Vs-Rest) 방법**을 이용할 수 있다.

