**이공계생을 위한 확률과 통계** 안승철지금

In [1]:
import warnings
warnings.filterwarnings('ignore')

import pandas as pd

from matplotlib import font_manager, rc
import matplotlib.pyplot as plt

%matplotlib inline

plt.rcParams['axes.unicode_minus'] = False
rc('font', family='AppleGothic')

## chapter 02 확률

불확실성을 정량화 하고 성능과 설계에 미치는 영향을 평가하기 위해서는 확률의 개념을 적절히 이용해야 한다.

### section 01 표본공간과 사건

* 표본공간(sample space): 모든 가능한 결과의 집합
* 사건(event): 표본공간의 임의의 부분집합
* 표본점(sample point): 표본공간을 구성하고있는 개개의 원소
* 근원사건(elementary event): 표본공간의 한 원소로만 이루어진 사건
* 전사건 Ω (cerain event): 표본공간의 모든 원소를 포함하고있는 사건
* 공사건 ∅ (empty event): 표본점을 하나도 포함하지 않은 사건

#### 이산 표본공간와 연속 표본공간
* 셀 수 있는 경우: 이산 표본공간(discrete sample space)
* 셀 수 없는 경우: 연속 표본공간(continuous sample space)

#### 사건의 연산 
1. 합사건(union event): $A \cup B = \{w|w\in A \, 또는 \, w\in B\}$
2. 곱사건(multiplication event): $A \cap B = \{w|w\in A \, 이고 \, w\in B\}$
3. 여사건(complement event): $A^c = \{w|w\notin A\}$
4. 배반사건(exclusive event): $A \cap B = \emptyset $ 

#### 사건의 연산 법칙 
1. 교환법칙
    * $A\cup B = B\cup A$
    * $A\cap B = B\cap A$
2. 결합법칙
    * $A \cup (B\cup C) = (A\cup B) \cup C$
    * $A \cap (B\cap C) = (A\cap B) \cap C$
3. 배분법칙
    * $A \cap (B\cup C) = (A\cap B) \cup (A\cap C)$
    * $A \cup (B\cap C) = (A\cup B) \cap (A\cup C)$
4. 드 모르간의 법칙
    * $(A\cup B)^c = A^c \cap B^c$
    * $(A\cap B)^c = A^c \cup B^c$

### section 02 확률
* 라플라스(Laplace) 확률 
    * 사건 $A$가 일어나는 모든 경우의 수를 $n$이라하면, $P(A) = \frac{n}{N}$ 과 같다. 
* 콜모고로프(Kolmogorov) 확률

#### 확률의 공리
1. 표본공간 에서의 임의의 사건 $A$에 대하여 $0 \leq P(A) \geq 1$
2. $P(Ω) = 1$
3. $A_1, A_2, \dots$이 각각 서로 배반이라면, $P(A_1 \cup A_2 \cup \dots ) = P(A_1)+P(A_2)+\dots$

#### 확률의 성질 
확률의 공리로부터 유도되는 확률의 성질은 다음과 같다.
1. $P(\emptyset) = 0$, `공사건의 확률`
2. $P(A^c) = 1-P(A)$, `여사건의 확률`
3. 임의의 사건 $A, B$가 $A \subset B$이면, $P(A) <= P(B)$
4. 임의의 사건 $A, B$에대하여 다음과 같은 `덧셈정리가 성립`한다.
   $$ P(A\cup B) = P(A) + P(B) - P(A\cap B) $$
5. 임의의 사건 $A,B$에 대하여 $p(A\cup B) \leq P(A) + P(B)$ 이다.

### secetion 03 조건부 확률
#### 조건부 확률

아래와 같은 조사 결과가 있다고 하자.
* 생산라인A - 불량품: 6 양품: 50 
* 생산라인B - 불량품: 4 양품: 40 

이 분류를 상대도수로 나타내면, 아래와 같다.
* 생산라인A - 불량품: 0.06 양품: 0.5 -> 각생산라인에서 생한되었을 학률: 0.56
* 생산라인B - 불량품: 0.04 양품: 0.4 -> 각생산라인에서 생한되었을 학률: 0.44


**완제품중에서 임의로 1개를 추출했을때, 추출한 제품이 `불량품`이라 하자.**

> Q. 이 추출된 불량품이 생산라인 A에서 생산되었을 확률은 어떻게 구할까?

> A. 이미 불량품이 추출된 상태이므로, 불량품 그룹 중 생산라인 A에서 생산된 것을 찾으면된다. -> **6/10**

불량품이 추출되었다는(B) 조건에서, 추출된 제품이 생산라인 A에서 생산(A)되었다는 확률을 구하면 다음과 같다.
* $\frac{P(A\cap B)}{P(B)}=\frac{0.06}{0.10}$

이와같이 사건 B가 일어났다는 조건하에 사건 A가 일어날 확률을 **사건 B에대한 사건 A의 조건부확률**이라고 한다.
* $P(A|B) = \frac{P(A\cap B)}{P(B)}, P(B) \neq 0 $

#### 조건부 확률의 공리
$P(B) \neq 0$인 사건B에 대하여 다음이 성립한다.
1. 임의의 사건 $A$에 대하여 $0 \leq P(A|B) \geq 1$
2. $P(B|B) = 1$
3. $A_1 \cap A_2 = ∅ 이면,\, P(A_1\cup A_2|B) = P(A_1|B) + P(A_2|B)$

#### 곱셈정리
조건부 확률의 정의를 이용하여 
`사건 B가 일어났을 때, 사건 A가일어날 확률`과, `사건 A가일어났을때, 사건 B가 일어날 확률`은 아래와 같다.
* $ P(A|B) = \frac{P(A∩B)}{P(B)}$
* $ P(B|A) = \frac{P(A∩B)}{P(A)}$

이 두식을 정리하면, 다음과 같은 곱셈정리를 얻을 수 있다.
* $P(A|B)P(B) = P(A∩B)$
* $P(B|A)P(B) = P(A∩B)$
* $P(B|A)P(B) = P(A|B)P(B)$

### section 04 독립 사건

A, B에 대하여 어느 한 사건이 일어나는데 다른 사건이 아무런 영향을 미치지 않는다면, 이 두사건 A, B는 서로 독립(independent)라 한다.

$P(A) = P(A|B)\, 또는\, P(B) = P(B|A)$

따라서, 서로 독립이면 곱셈정리에 의하여 다음과 같이 쓸수 있다.

$P(A\cap B) = P(A)P(B|A) = P(B)P(A|B) = P(A)P(B)$

### section 05 베이즈 정리

공집합이 아닌 어떤 집합 $A$에 대하여 집합 $A$의 부분집합 $A_1, A_2, A_3, \dots A_n$을 원소로하는 집합족 $\{A_1, A_2, A_3, \dots , A_n\}$이 다음을 만족할때, 집합 A 의 분할이라고 한다. 

* $A_i\subset A$

* $A_i\cap A_j = \emptyset \; ( i\neq j, i,j = 1, 2, 3, ...n)$

* $A_1\cup A_2 \cup A_3\cup \dots \cup A_n = A$

사건 $A_1, A_2, \dots, A_n$이 표본공간 Ω의 분할을 이룬다고 하자. (즉 사건 $A_i$가 서로 배반이고 이들의 모든 합이 표본공간과 같다.)

이때 $B$를 임의의 사건이라 하면 아래와 같이 표현할 수 있다.

$$ B = Ω \cap B = (A_1\cup A_2 \cup \dots \cup A_n)\cap B = (A_1 \cap B) \cup (A_2 \cap B) \cup \dots \cup (A_n \cap B)$$


따라서, $P(B) = P(A_1\cap B) + P(A_2\cap B) + \dots + P(A_n \cap B)$이 성립한다.


이것을 다시 다음과 같은 식으로 표현할 수 있는데 이를 **전확률(total probability)**이라한다.

$$P(B) = p(A_1)P(B|A_1) + \dots + P(A_n)P(B|A_n)=\sum_{k=1}^{n}P(A_k)P(B|A_k)$$

또한, 임의의 사건 $A_i$에 대한 사건 $B$의 조건부 확률 $P(B|A_i)$의 정의로 부터를 얻을 수 있고, 

$$P(A_i\cup B) = P(A_i)P(B|A)$$

사건 $A1, A2, ... An$이 표본공간 Ω의 분할이고, $P(A_i) > 0, P(B) > 0$ 이면 다음이 성립한다.

$$P(A_i|B) = \frac{P(A_i\cap B)}{P(B)} = \frac{P(A_i)P(B|A_i)}{\sum_{k=1}^{n}P(A_k)P(B|A_k)}, \,i = 1, 2, ..., n$$

베이즈 정리에서 $P(A_i$)를 사건 $A_i$의 `사전확률(prior probability)`이라하고 $P(A_i|B)$를 사건 $A_i$를 `사후확률(posterior probability)`이라 한다$