# 나이브 베이즈 분류기

* 확률 기반 분류기
* 데이터가 각 클래스에 속할 특징 확률을 계산
* 나이브(Naive) : 예측한 특징이 상호 독립적이라는 가정 하에 확률 계산을 단순화함
* 베이즈(Bayes) : 입력 특징이 클래스 전체의 확률 분포 대비 특정 클래스에 속할 확률을 베이즈 정리를 기반으로 계산

# 베이즈 정리

* `베이즈 정리 == 조건부확률을 구하는 공식`
* 베이즈 정리에서는 $P(A|B)$는 사건 B가 주어졌을 때 사건 A가 일어날 확률 <br>
  ![image.png](attachment:image.png) <br>
  ![image.png](attachment:image-3.png)
* 샘플 데이터 k에 속하는 사건의 확률 $P(y_k)$는 관측값의 특징에 대한 지식없이 클래스가 어떻게 분포되어 있는지 나타냄 --> `사전 확률`
* 사전 확률은 사전에 미리 결정되어 있거나, 학습 샘플 데이터를 이용해 학습시킬 수도 있음
* $P(y_k | x)$는 관측값에 대해 외부 지식을 이용한 `사후 확률`
* $P(x | y_k)$는 클래스 $P(y_k)$에 속한 샘플 데이터가 주어졌을 때 $n$개의 특징에 대한 결합 분포를 나타냄 --> `유사 가능도`



# 나이브 베이즈 동작 원리

* 나이브 베이즈의 목표는 n개의 특징을 가진 샘플 데이터 x가 주어졌을 때 k개의 클래스 중 하나에 속할 확률을 결정하는 것
* 샘플 데이터는 $x_1, x_2, .., x_n$의 값을 가진 특징으로 구성되고, $y_k$는 샘플 데이터가 $k$에 속하는 사건을 나타냄 --> 베이즈 정리를 적용 <br> <br>
$x = (x_1, x_2, x_3, ..., x_n)$ <br>
$P(y_k | x_1, x_2, x_3, ..., x_n) = P(y_k|x) =$ $P(x|y_k)P(y_k)\over P(x)$

* 나이브 베이즈는 특징 간 서로 독립이라는 가정이 있으므로, n개의 특징에 대한 결합 조건부 분포는 특징들의 분포를 곱한 것으로 표현할 수 있음.<br>
$P(x|y_k) = P(x_1|y_k) * P(x_2|y_k) * ... * P(x_n|y_k) $
* $P_x$는 특정 클래스에 속하지 않은 특징의 분포에 따라 값이 계산되므로 상수로 처리할 수 있음
* 사전 확률과 유사 가능도를 이용해 사후 확률을 계산할 수 있음
![image.png](attachment:image.png) <br>
![image.png](attachment:image-2.png) <br>
![image.png](attachment:image-3.png) <br>

* `라플라스 스무딩` : 확률에 대한 곱을 처리하다 보니, 어떠한 확률이 0이 나오면 전체가 0이 나오는 문제가 발생. 특징의 `출현 빈도 초기값을 1로 설정`하는 방식. 나이브 베이즈 분류기로 작업할 때, $\alpha$ paramter를 이용하여 출현 빈도 초기값 제어 가능.