### 6.2 확률의 수학적 정의와 의미

- 확률을 다룰 때는 현실에서 해결하고 하는 문제와 결부하여 정의한다.
    - 동전, 플레잉카드, 동전 두번, 약속 날짜 31일, 어떤 과일, 삼성전자 주식 가격 몇 % 변동, 회전 원판 각도 몇도?, 체온 측정 몇도?
    - 이러한 문제가 어떤 답을 가질 수 있고, 그 답의 신뢰성이 얼마나 되는지 정량적인 방법 계산
    - 수학적 정의를 살펴본다.

- 확률표본
- 표본공간
- 사건

- 표본공간과 확률표본
    - 확률표본 혹은 표본 : 확률적 문제에서 발생할 수 있는 '하나의' 현상, 혹은 선택될 수 있는 '하나의'경우
    - 표본공간 : 가능한 모든 표본의 집합. 어떤 표본이 가능하고 어떤 표본이 가능하지 않은가를 정의하는 작업
    - "앞면", "뒷면" 으로 구분.

- 사건
    - 사건 : 표본공간의 부분집합, 표본공간은 부분집합의 집합
    - 경우 : 사건에 해당한다.
    

In [1]:
A = frozenset([])
B = frozenset(['H'])
C = frozenset(['M'])
D = frozenset(['H', 'T'])
set([A, B, C, D])

{frozenset(), frozenset({'H'}), frozenset({'M'}), frozenset({'H', 'T'})}

In [3]:
B

frozenset({'H'})

In [4]:
from itertools import chain, combinations
def get_set_of_subsets(omega):
    return set([frozenset(s) for s in chain.from_iterable(combinations(omega, r) for r in range(len(omega) + 1))])

In [5]:
omega = {"♦", "♥", "♠", "♣"}
SS1 = get_set_of_subsets(omega)
SS1

{frozenset(),
 frozenset({'♠', '♣'}),
 frozenset({'♥'}),
 frozenset({'♦'}),
 frozenset({'♣', '♥'}),
 frozenset({'♥', '♦'}),
 frozenset({'♣'}),
 frozenset({'♣', '♥', '♦'}),
 frozenset({'♠'}),
 frozenset({'♠', '♣', '♦'}),
 frozenset({'♠', '♥', '♦'}),
 frozenset({'♣', '♦'}),
 frozenset({'♠', '♥'}),
 frozenset({'♠', '♣', '♥'}),
 frozenset({'♠', '♦'}),
 frozenset({'♠', '♣', '♥', '♦'})}

- 확률
    - 확률이란 사건을 입력하면 숫자가 출력되는 함수
    - 사건(부분집합) -> 숫자(확률값)
    - 정의역(domain)은 표본공간의 모든 사건(부분집합)의 집합
    - 모든 각각의 사건(부분집합)에 어떤 숫자를 할당(assign, allocate)하는 함수가 확률이다.
    
    - 콜모고로프의 공리
        - 모든 사건에 대해 확률은 실수이고 0 또는 양수이다.
        - 표본공간(전체집합)이라는 사건(부분집합)에 대한 확률은 1이다.
        - 공통 원소가 없는 두 사건의 합집합의 확률은 사건별 확률의 합이다.

    

- 확률은 표본이 아닌 사건을 입력으로 가지는 함수
    - 표본이 아닌 사건에 대해 정의한다.

- 파이썬을 이용한 확률의 구현
    - 사건을 키(Key)로 가지고 숫자를 값(value)으로 가지는 딕셔너리를 사용하여 확률 함수를 구현할 수 있다.

In [6]:
P = {A: 0, B: 0.4, C: 0.6, D: 1}
P

{frozenset(): 0,
 frozenset({'H'}): 0.4,
 frozenset({'M'}): 0.6,
 frozenset({'H', 'T'}): 1}

콜모고로프의 공리 지키고 있는지 확인하기.

In [7]:
P1 = {
A_1: 0, A_2: 0.25, A_3: 0.25,
A_4: 0.25, A_5: 0.25, A_6: 0.5,
A_7: 0.5, A_8: 0.5, A_9: 0.5,
A_10: 0.5, A_11: 0.5,
A_12: 0.75, A_13: 0.75,
A_14: 0.75, A_15: 0.75, A_16: 1}

NameError: name 'A_1' is not defined

In [8]:
P2 = {
B_1: 0, B_2: 1/4, B_3: 1/4,
B_4: 1/4, B_5: 1/4, B_6: 2/4,
B_7: 2/4, B_8: 2/4, B_9: 2/4,
B_10: 2/4, B_11: 2/4, B_12: 3/4, B_13: 3/4,
B_14: 3/4, B_15: 3/4, B_16: 1}
P2

NameError: name 'B_1' is not defined

- 주사위 한 면의 확률은 무조건 1/6?
    - 

In [12]:
omega = {1, 2, 3, 4, 5, 6}
SS3 = get_set_of_subsets(omega)
P3 = {}
for i in SS3:
    probability = 0.0
    if 1 in i:
        probability += 0.5 # P({1}) = 0.5
    if 2 in i:
        probability += 0.11 # 또는 다른 값
    if 3 in i:
        probability += 0.12 # 또는 다른 값
    if 4 in i:
        probability += 0.13 # 또는 다른 값
    if 5 in i:
        probability += 0.14 # 또는 다른 값
    if 6 in i:
        probability += 0 # P({6}) = 0
    P3[i] = probability
P3

{frozenset({1, 3, 5}): 0.76,
 frozenset({1, 4}): 0.63,
 frozenset({4, 6}): 0.13,
 frozenset({2, 3}): 0.22999999999999998,
 frozenset({2, 3, 4}): 0.36,
 frozenset({1, 4, 5, 6}): 0.77,
 frozenset({2, 6}): 0.11,
 frozenset({4, 5}): 0.27,
 frozenset({2, 3, 5, 6}): 0.37,
 frozenset({1, 2, 3, 6}): 0.73,
 frozenset({1}): 0.5,
 frozenset({1, 2, 3, 4, 5, 6}): 1.0,
 frozenset({2, 4, 5, 6}): 0.38,
 frozenset({4, 5, 6}): 0.27,
 frozenset({1, 3, 4, 6}): 0.75,
 frozenset({2, 3, 4, 6}): 0.36,
 frozenset({1, 2, 3, 4, 6}): 0.86,
 frozenset({1, 3, 4, 5, 6}): 0.89,
 frozenset({1, 4, 6}): 0.63,
 frozenset({3, 4}): 0.25,
 frozenset({2, 4, 6}): 0.24,
 frozenset({3, 4, 5, 6}): 0.39,
 frozenset({1, 2, 3, 4, 5}): 1.0,
 frozenset({2, 4}): 0.24,
 frozenset({5, 6}): 0.14,
 frozenset({2, 3, 5}): 0.37,
 frozenset({3, 4, 6}): 0.25,
 frozenset({3, 5}): 0.26,
 frozenset({2, 5, 6}): 0.25,
 frozenset({3, 4, 5}): 0.39,
 frozenset({1, 6}): 0.5,
 frozenset({1, 2, 3}): 0.73,
 frozenset({1, 2, 4, 6}): 0.74,
 frozenset({1, 3}

In [15]:
def f(x):
    if x == 1:
        return 0.5
    if x == 2:
        return 0.1
    if x == 3:
        return 0.2
    if x == 4:
        return 0.1
    if x == 5:
        return 0.1
    if x == 6:
        return 0

    

In [16]:
f(1)

0.5

In [17]:
P4 = {"True": 7/ 365, "False":358/365}
P4

{'True': 0.019178082191780823, 'False': 0.9808219178082191}

In [18]:
P5 = {"Oragnge": 0.5, "Apple": 0.5}
P5

{'Oragnge': 0.5, 'Apple': 0.5}

In [20]:
P6 = {}
P6 = {"Apple": 70 / 100, "Orange": 30 / 100}
P6

{'Apple': 0.7, 'Orange': 0.3}

- 확률의 의미
    - 빈도주의적 관점과 베이지안 관점
    - 빈도주의 : 반복적으로 선택된 표본이 사건(부분 집합) A의 원소가 될 경향
    - 베이지안 : 선택된 표본이 특정한 사건(부분 집합)에 속한다는 가설, 명제 혹은 주장의 신뢰도