# 베이즈 정리 (Bayes' Theorem)

## 1. 개요
- 베이즈 정리(Bayes' theorem)는 확률론에서 조건부 확률을 계산하는 중요한 방법으로, 어떤 사건이 주어진 조건 하에서 일어날 확률을 계산하는 방법을 제공합니다. 이 정리는 새로운 정보가 주어졌을 때 기존의 가설이나 신념을 갱신하는 데 사용됩니다.
- 사전 확률(prior probability)과 사후 확률(posterior probability)의 관계를 나타내는 정리로, 조건부 확률에 기반합니다.
    - 조건부 확률: 어떤 사건 A가 발생했을 때, 다른 사건 B가 발생할 확률을 나타냅니다. 이를 **P(B|A)**로 표현합니다. 예를 들어, 날씨가 맑은 날 비가 올 확률을 계산할 때 조건부 확률이 사용됩니다.

## 2. 공식 및 증명

#### 1) 공식

![](https://img1.daumcdn.net/thumb/R1280x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcf03hd%2FbtrOihZNtfF%2FZ2cSxXwWBG43S5EooiauXk%2Fimg.png)
*출처 : https://roytravel.tistory.com/350*

- 위의 두 식은 동일하게 베이즈 정리를 나타낸 것으로, 변수명만 다르게 한 것입니다. 왼쪽은 조건부 확률에서 유도할 때 흔히 사용하고, 오른쪽은 베이즈 정리가 결국 모수 추정을 목적으로 한다는 것을 보이기 위해 작성한 것입니다.
- 왼쪽의 식을 설명하면 다음과 같습니다.
    - P(A|B)는 사건 B가 주어졌을 때 사건 A가 일어날 확률(조건부 확률)입니다.
    - P(B|A)는 사건 A가 주어졌을 때 사건 B가 일어날 확률입니다.
    - P(A)는 사건 A가 일어날 확률(사전 확률)입니다.
    - P(B)는 사건 B가 일어날 확률입니다.
- 추가로 설명하자면, 
    - posterior는 새로운 표본 X가 관측됐을 때 어떤 모수값을 갖는지를 의미합니다.
    - likelihood는 어떤 표본 X가 관찰되었을 때 어떤 확률분포를 갖는 모집단(모수)에서 추출되었을 확률을 의미합니다.
    - prior는 사전확률인 모수값을 의미하며, evidence는 모집단으로부터 표본 X가 관측될 확률입니다.
- 요약하자면, 베이즈 정리는 가능도(likelihood), 사전확률(prior), 관측 데이터(evidence)를 이용해 사후 확률(posterior)를 예측하는 방법입니다.

#### 2) 베이즈 정리 유도 및 증명

베이즈 정리는 조건부 확률의 정의에서 유도됩니다. 두 사건 A와 B의 교집합 사건의 확률 P(A ∩ B)는 두 가지 방법으로 표현할 수 있습니다:

1. 사건 B가 주어졌을 때 A가 발생할 확률로 표현:
   $$
   P(A ∩ B) = P(A|B) ⋅ P(B)
   $$

2. 사건 A가 주어졌을 때 B가 발생할 확률로 표현:
   $$
   P(A ∩ B) = P(B|A) ⋅ P(A)
   $$

위의 두 식이 모두 P(A ∩ B)를 나타내므로, 이들을 서로 같다고 할 수 있습니다:

$$
P(A|B) ⋅ P(B) = P(B|A) ⋅ P(A)
$$

이제, 양 변을 P(B)로 나누어 베이즈 정리를 얻습니다:

$$
P(A|B) = \frac{P(B|A) ⋅ P(A)}{P(B)}
$$

여기서 중요한 점은, P(B)는 사건 B의 발생 확률로, 모든 가능한 사건 A에 대한 B의 확률을 합산한 값으로 표현될 수 있습니다. 즉,

$$
P(B) = \sum_{i} P(B|A_i) ⋅ P(A_i)
$$

이를 이용해 베이즈 정리를 다음과 같이 더 일반화할 수 있습니다:

$$
P(A_i|B) = \frac{P(B|A_i) ⋅ P(A_i)}{\sum_{j} P(B|A_j) ⋅ P(A_j)}
$$

이 식은 사건 A_i 중 하나가 발생할 확률을 구할 때 유용합니다.

## 4. 일상에서의 활용
베이즈 정리는 일상생활에서 다양한 상황에 적용될 수 있습니다:

- **의료 진단**: 특정 증상이 있을 때 환자가 특정 질병을 가질 확률을 계산하는 데 사용됩니다. 예를 들어, 어떤 검사 결과가 양성일 때, 그 환자가 실제로 질병을 가지고 있을 확률을 계산할 수 있습니다.
- **스팸 필터**: 이메일이 스팸일 확률을 계산하는 데 사용됩니다. 이메일의 특정 단어가 나타날 때, 그 이메일이 스팸일 확률을 베이즈 정리로 계산합니다.
- **법적 판단**: 증거가 제시되었을 때 피고가 유죄일 확률을 추정하는 데도 활용될 수 있습니다.

## 5. 머신러닝에서의 활용
베이즈 정리는 머신러닝 알고리즘에서 중요한 역할을 합니다.

#### 1) 나이브 베이즈 분류기
- 나이브 베이즈 분류기는 베이즈 정리에 기반한 간단하면서도 강력한 분류 알고리즘입니다. 이 모델은 독립 사건이라는 가정을 바탕으로 특정 클래스에 속할 확률을 계산합니다. 예를 들어, 텍스트 분류에서 특정 단어가 주어졌을 때 문서가 스팸인지 아닌지를 예측하는 데 사용됩니다.

#### 2) 베이지안 최적화
- 베이지안 최적화는 고차원 함수의 최적값을 찾는 문제를 해결하는 데 사용됩니다. 이 방법은 주어진 데이터에 대한 확률 모델을 구축하고, 이 모델을 사용해 탐색 공간에서 최적의 점을 선택하는 과정을 반복합니다. 머신러닝에서 하이퍼파라미터 튜닝에 주로 사용됩니다.



## 참고자료

https://junpyopark.github.io/bayes/

https://roytravel.tistory.com/350
