# 6.1 집합

**집합**: 구별가능한 객체의 모임, 여기서 객체는 **원소**

**set**: 내용 변경 가능한 뮤터블 자료형 집합

**frozenset**: 내용 변경 불가능한 임뮤터블 자료형 집합

* 임뮤터블 자료형만 딕셔너리의 키나 set의 원소가 될 수 있다.

In [1]:
A = set([1, 2, 3, 3, 2])
A

{1, 2, 3}

In [2]:
B = frozenset(['H', 'T'])
B

frozenset({'H', 'T'})

In [3]:
C = {'\u2660', '\u2661', '\u2662', '\u2663'}
C

{'♠', '♡', '♢', '♣'}

In [4]:
type(C)

set

### 집합의 크기(cardinality)

len 명령어 사용

In [5]:
len(A), len(B), len(C)

(3, 2, 4)

* 원소수가 무한한 경우 파이썬의 set나 frozenset 자료형으로 표현 불가능

### 합집합과 교집합

**합집합**: 각 집합의 원소를 모두 포함하는 집합

**교집합**: 두 사건 모두에 속하는 원소로만 이루어진 집합

**union**, **intersection** 메서드나 **|**, **&** 연산자 사용

In [6]:
A1 = set([1, 2, 3, 4])
A2 = set([2, 4, 6])
A3 = set([1, 2, 3])
A4 = set([2, 3, 4, 5, 6])

In [7]:
A1.union(A2)

{1, 2, 3, 4, 6}

In [8]:
A2 | A1

{1, 2, 3, 4, 6}

In [9]:
A3.intersection(A4)

{2, 3}

In [10]:
A3 & A4

{2, 3}

### 전체집합, 부분집합, 여집합

**부분집합**: 어떤 집합의 원소 중 일부만을 포함하는 집합

**전체집합**: 원래의 집합

* 모든 집합은 자기 자신의 부분집합임

**진부분집합**: 원소의 크기가 더 작은 부분집합

부분집합은인지 여부 확인은 **issubset()** 메서드 사용

혹은 (등호 포함) 부등식 연산자 사용

In [11]:
A3.issubset(A1)

True

In [12]:
A3 <= A1

True

In [13]:
A3.issubset(A2)

False

In [14]:
A3 <= A2

False

In [15]:
A3 <= A3

True

In [16]:
A3 < A3

False

### 차집합과 여집합

**차집합**: 어떤 집합 A에 속하면서 다른 집합 B에는 속하지 않는 원소로 이루어진 A의 부분집합

**여집합**: 전체집합 중에서 부분집합 A에 속하지 않은 원소로만 이루어진 부분집합

파이썬에서 **difference** 메서드 혹은 **-** 연산자로 차집합을 구함.

In [18]:
A1.difference(A2)

{1, 3}

In [19]:
A1 - A2

{1, 3}

### 공집합

아무런 원소도 포함하지 않는 집합

* 공집합은 모든 집합의 부분집합임

임의의 집합 A에 대해서,

A와 공집합의 교집합은 공집합이고, A와 공집합의 합집합은 A이다.

또한 여집합과 원래의 집합의 교집합은 공집합이다.

In [21]:
empty_set = set([])
empty_set

set()

In [22]:
empty_set < A1

True

In [23]:
empty_set.intersection(A1)

set()

In [24]:
empty_set.union(A1)

{1, 2, 3, 4}

### 부분집합의 수

원소 수가 N인 집합은 2^N 개의 부분집합을 가짐

### 연습문제 6.1.1

1. 16

In [40]:
from itertools import combinations, chain
    
a = {'HH','HT','TH','TT'}
set([frozenset(s)
    for s in chain.from_iterable(combinations(a, i)
                                for i in range(5))])

{frozenset(),
 frozenset({'HT'}),
 frozenset({'HT', 'TT'}),
 frozenset({'HH', 'HT'}),
 frozenset({'HT', 'TH'}),
 frozenset({'TH', 'TT'}),
 frozenset({'HH'}),
 frozenset({'HH', 'TT'}),
 frozenset({'HH', 'HT', 'TH'}),
 frozenset({'TT'}),
 frozenset({'HT', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TT'}),
 frozenset({'TH'}),
 frozenset({'HH', 'TH'}),
 frozenset({'HH', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TH', 'TT'})}

### 합집합과 교집합의 분배 법칙

A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)

A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)

### 연습문제 6.1.2

In [41]:
A = {1, 3, 5}
B = {1, 2, 3}
C = {2, 4, 6}

In [43]:
A | (B & C), (A | B) & (A | C)

({1, 2, 3, 5}, {1, 2, 3, 5})

In [46]:
A & (B | C) , (A & B) | (A & C)

({1, 3}, {1, 3})

### 6.2 확률의 수학적 정의와 의미

### 표본공간과 확률분포

**확률표본**, **표본**: 풀고자 하는 확률적 문제에서 **발생할 수 있는 하나의 현상**, 혹은 **선택될 수 있는 하나의 경우**

**표본공간Ω**: **가능한 모든 표본의 집합**

표본공간을 정의하는 것: 우리가 고려하는 범위에서 **어떤 표본(경우, 현상)이 가능하고 어떤 표본이 가능하지 않은가를 정의하는 작업**

### 연습문제 6.2.1

1. Ω3 = {HH, HT, TH, TT}
2. Ω4 = {T, F}

### 연습문제 6.2.2

1. Ω7 = {0<= θ < 360}
2. 무한하다 ,Ω8 = IR

### 연습문제 6.2.3

1. 로또 당첨 여부, {T,F}
2. 기부 참여 경험, {T,F}
3. 어제 마신 물의 양, IR
4. 어제 냉장고 문이 열어져 있던 시간, IR

### 사건

**표본공간 Ω의 부분집합**, 우리가 관심을 가지는 일부 표본의 집합

In [47]:
A = frozenset([])
B = frozenset(['H'])
C = frozenset(['T'])
D = frozenset(['H', 'T'])
set([A, B, C, D])

{frozenset(), frozenset({'T'}), frozenset({'H'}), frozenset({'H', 'T'})}

### 연습문제 6.2.4

In [49]:
#1
from itertools import combinations, chain
    
Ω2 = {'♠','♡','♢','♣'}
set([frozenset(s)
    for s in chain.from_iterable(combinations(Ω2, i)
                                for i in range(5))])

{frozenset(),
 frozenset({'♡', '♣'}),
 frozenset({'♢'}),
 frozenset({'♣'}),
 frozenset({'♠'}),
 frozenset({'♠', '♢', '♣'}),
 frozenset({'♠', '♡'}),
 frozenset({'♢', '♣'}),
 frozenset({'♡', '♢'}),
 frozenset({'♡', '♢', '♣'}),
 frozenset({'♠', '♡', '♣'}),
 frozenset({'♠', '♢'}),
 frozenset({'♡'}),
 frozenset({'♠', '♡', '♢'}),
 frozenset({'♠', '♣'}),
 frozenset({'♠', '♡', '♢', '♣'})}

In [50]:
from itertools import combinations, chain
    
Ω3 = {'HH','HT','TH','TT'}
set([frozenset(s)
    for s in chain.from_iterable(combinations(Ω3, i)
                                for i in range(5))])

{frozenset(),
 frozenset({'HT'}),
 frozenset({'HT', 'TT'}),
 frozenset({'HH', 'HT'}),
 frozenset({'HT', 'TH'}),
 frozenset({'TH', 'TT'}),
 frozenset({'HH'}),
 frozenset({'HH', 'TT'}),
 frozenset({'HH', 'HT', 'TH'}),
 frozenset({'TT'}),
 frozenset({'HT', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TT'}),
 frozenset({'TH'}),
 frozenset({'HH', 'TH'}),
 frozenset({'HH', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TH', 'TT'})}

### 확률(P)

**사건(부분집합)을 입력하면 숫자(확률값)가 출력되는 함수**

이 때 이 함수의 정의역은 표본공간의 모든 사건(부분집합)의 집합

즉, **모든 각각의 사건(부분집합)에 어떤 숫자를 할당하는 함수** 

P(A): A라는 사건(부분집합)에 할당된 숫자

#### 함수의 조건(콜모고로프의 공리)

1. 모든 사건에 대해 확률은 실수이고 0 또는 양수다.
2. 표본공간(전체집합)이라는 사건(부분집합)에 대한 확률은 1이다.
3. 공통 원소가 없는 두 사건의 합집합의 확률은 사건별 확률의 합이다.

#### 확률은 표본이 아닌 사건을 입력으로 가지는 함수

ex) P({1}) = 1 / 6

### 파이썬을 이용한 확률의 구현

사건을 키로 가지고 확률을 값으로 가지는 딕셔너리를 사용

In [52]:
P = {A: 0, B: 0.4, C: 0.6, D: 1}
P

{frozenset(): 0,
 frozenset({'H'}): 0.4,
 frozenset({'T'}): 0.6,
 frozenset({'H', 'T'}): 1}

### 연습문제 6.2.5

In [57]:
#1
Ω2 = {'♠','♡','♢','♣'}
set([frozenset(s)
    for s in chain.from_iterable(combinations(Ω2, i)
                                for i in range(5))])

{frozenset(),
 frozenset({'♡', '♣'}),
 frozenset({'♢'}),
 frozenset({'♣'}),
 frozenset({'♠'}),
 frozenset({'♠', '♢', '♣'}),
 frozenset({'♠', '♡'}),
 frozenset({'♢', '♣'}),
 frozenset({'♡', '♢'}),
 frozenset({'♡', '♢', '♣'}),
 frozenset({'♠', '♡', '♣'}),
 frozenset({'♠', '♢'}),
 frozenset({'♡'}),
 frozenset({'♠', '♡', '♢'}),
 frozenset({'♠', '♣'}),
 frozenset({'♠', '♡', '♢', '♣'})}

In [59]:
P1 = {
    A1: 0, A2: 0.25, A3: 0.25, A4: 0.25, A5: 0.25, A6:0.5, A7:0.5, A8: 0.5, A9: 0.5, A10: 0.5, A11:0.5, A12:0.75, A13:0.75, A14: 0.75,
    A15: 0.75, A16:1
}

NameError: name 'A5' is not defined

In [58]:
#2
Ω3 = {'HH','HT','TH','TT'}
set([frozenset(s)
    for s in chain.from_iterable(combinations(Ω3, i)
                                for i in range(5))])

{frozenset(),
 frozenset({'HT'}),
 frozenset({'HT', 'TT'}),
 frozenset({'HH', 'HT'}),
 frozenset({'HT', 'TH'}),
 frozenset({'TH', 'TT'}),
 frozenset({'HH'}),
 frozenset({'HH', 'TT'}),
 frozenset({'HH', 'HT', 'TH'}),
 frozenset({'TT'}),
 frozenset({'HT', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TT'}),
 frozenset({'TH'}),
 frozenset({'HH', 'TH'}),
 frozenset({'HH', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TH', 'TT'})}

In [None]:
P2 = {
    A1: 0, A2: 0.25, A3: 0.25, A4: 0.25, A5: 0.25, A6:0.5, A7:0.5, A8: 0.5, A9: 0.5, A10: 0.5, A11:0.5, A12:0.75, A13:0.75, A14: 0.75,
    A15: 0.75, A16:1
}

### 주사위 한 면의 확률은 무조건 1 / 6?

### 연습문제 6.2.6

In [62]:
Ω3 = {1, 2, 3, 4, 5, 6}
SS3 = set([frozenset(s)
    for s in chain.from_iterable(combinations(Ω3, i)
                                for i in range(5))])
P3 = {}

for i in SS3:
    probability = 0.0
    if 1 in i:
        probability += 0.5
    if 2 in i:
        probability += 0.11
    if 3 in i:
        probability += 0.12
    if 4 in i:
        probability += 0.13
    if 5 in i:
        probability += 0.14
    P3[i] = probability
P3

{frozenset({1, 3, 5}): 0.76,
 frozenset({1, 4}): 0.63,
 frozenset({4, 6}): 0.13,
 frozenset({2, 3}): 0.22999999999999998,
 frozenset({2, 3, 4}): 0.36,
 frozenset({1, 4, 5, 6}): 0.77,
 frozenset({2, 6}): 0.11,
 frozenset({4, 5}): 0.27,
 frozenset({2, 3, 5, 6}): 0.37,
 frozenset({1, 2, 3, 6}): 0.73,
 frozenset({1}): 0.5,
 frozenset({2, 4, 5, 6}): 0.38,
 frozenset({4, 5, 6}): 0.27,
 frozenset({1, 3, 4, 6}): 0.75,
 frozenset({2, 3, 4, 6}): 0.36,
 frozenset({1, 4, 6}): 0.63,
 frozenset({3, 4}): 0.25,
 frozenset({2, 4, 6}): 0.24,
 frozenset({3, 4, 5, 6}): 0.39,
 frozenset({2, 4}): 0.24,
 frozenset({5, 6}): 0.14,
 frozenset({2, 3, 5}): 0.37,
 frozenset({3, 4, 6}): 0.25,
 frozenset({3, 5}): 0.26,
 frozenset({2, 5, 6}): 0.25,
 frozenset({3, 4, 5}): 0.39,
 frozenset({1, 6}): 0.5,
 frozenset({1, 2, 3}): 0.73,
 frozenset({1, 2, 4, 6}): 0.74,
 frozenset({1, 3}): 0.62,
 frozenset({1, 2, 6}): 0.61,
 frozenset({1, 3, 4}): 0.75,
 frozenset({1, 2, 4, 5}): 0.88,
 frozenset({1, 3, 5, 6}): 0.76,
 frozenset

일반적인 경우, P(A) = card(A) / card(Ω)

### 연습문제 6.2.7

1.<br>
F: 30 / 31 
T: 1 / 31

2.<br>
A: 1/2, O:1/2

3.<br>
A: 7/10, O: 3/10

### 확률의 의미

#### 빈도주의 관점

**반복적으로 선택된 표본이 사건(부분집합) A의 원소가 될 경향**

#### 베이지안 관점

**선택된 표본이 특정한 사건(부분 집합)에 속한다는 가설, 명제 혹은 주장의 신뢰도**

**사건이 일어났다, 발생했다.**: **그 사건(부분집합)의 원소 중에 정말로 선택된 표본이 있다는 사실을 알게 되었다.**

(**추가적인 정보**가 들어왔다.)