# 6.1 집합

- 확률을 수학적으로 정의하기 위해서는 집합에 대한 지식이 필요
- 확률론 공부에 들어가기 전에 집합의 기초를 복습함
- python 에서 집합을 사용할 때는 `set` 자료형과 `frozenset` 자료형을 사용

## 집합과 원소

#### `집합(set)` : 구별 가능한 객체의 모임 - 보통 알파벳 대문자로 사용하여 표시
#### `원소(element)` : 집합에 포함된 구별 가능한 객체 - 알파벳 소문자로 사용하여 표시

![image.png](attachment:image.png)


- `set` 은 내용을 변경할 수 있는 `mutable` 자료형 - `mutable`자료형은 딕셔너리 자료형의 키나 set 자료형의 원소가 될 수 없음
- `frozenset`은 내용을 변경할 수 없는 `immutable` 자료형 - `immutable` 자료형만 딕셔너리 자료형의 키나 set 자료형의 원소가 될 수 있음

In [1]:
A = set([1,2,3,3,2])
A

{1, 2, 3}

In [2]:
B = frozenset(['H','T'])
B

frozenset({'H', 'T'})

In [3]:
C = {"\u2660", "\u2661", "\u2662", "\u2663"}
C

{'♠', '♡', '♢', '♣'}

In [4]:
print(type(A), type(B), type(C))

<class 'set'> <class 'frozenset'> <class 'set'>


## 집합의 크기

- `집합의 크기(Cardinality)`: 집합이 가지는 원소의 갯수
![image.png](attachment:image.png)

In [5]:
print(len(A))
print(len(B))
print(len(C))

3
2
4


![image.png](attachment:image.png)

## 합집합과 교집합

#### `합집합(union)` : 각 집합의 원소를 모두 포함한 집합, 기호 `∪`
#### `교집합(intersection)` : 두 사건 모두에 속하는 원소로만 이루어진 집합, 기호 `∩`
![image.png](attachment:image.png)

In [8]:
A1 = set([1,2,3,4])
A2 = set([2,4,6])
A3 = set([1,2,3])
A4 = set([2,3,4,5,6])

In [9]:
A1.union(A2)

{1, 2, 3, 4, 6}

In [10]:
A1|A2

{1, 2, 3, 4, 6}

In [11]:
A3.intersection(A4)

{2, 3}

In [12]:
A3&A4

{2, 3}

## 전체집합, 부분집합

#### `부분집합(subset)` : 어떤 집합의 원소 중 일부만을 포함하는 집합  <-> 원래의 집합 : 전체집합

![image.png](attachment:image.png)


#### `진부분집합(proper subset)` : 원소의 크기가 더 작은 부분집합
- python에서는 두 집합이 부분집합인지 알아보는 `issubset` 메서드가 있음
- 객체가 인수의 부분집합이면 `True` 반환
- 등호를 포함하는 부등식 연산자로도 같은 결과를 구할 수 있으며, 더 `작은 쪽`이 `부분집합`
- 등호가 없는 부등식 연산자는 진부분집합 관계를 구함

In [13]:
A3.issubset(A1)

True

In [14]:
A3 <= A1

True

In [15]:
A3.issubset(A2)

False

In [16]:
A3 <= A2

False

In [17]:
A3 <= A3 # 모든 집합은 자기 자신의 부분 집합이다.

True

In [18]:
A3 < A3 # 모든 집합은 자기 자신의 진부분집합이 아니다.

False

In [21]:
A3 < A1

True

## 차집합과 여집합

#### `차집합(difference)` : 어떤 집합 A에 속하면서 다른 집합 B에는 속하지 않는 원소로 이루어진 A의 부분집합 (A에서 B를 뺀 차집합) `A-B`
#### `여집합(complement)`: 전체집합 Ω 에서 부분집합 A에 속하지 않는 원소로만 이루어진 부분집합

![image.png](attachment:image.png)

- python에서는 `difference 메서드` 혹은 `- 연산자`로 `차집합`을 구함

In [22]:
A1.difference(A2)

{1, 3}

In [23]:
A1-A2

{1, 3}

## 공집합

#### `공집합(null set)` : 아무런 원소도 포함하지 않는 집합 ` ∅ `
- `공집합은 모든 집합의 부분집합`
![image.png](attachment:image.png)

In [24]:
empty_set = set([])
empty_set

set()

In [25]:
empty_set < A1

True

In [26]:
empty_set.intersection(A1)

set()

In [27]:
empty_set.union(A1)

{1, 2, 3, 4}

## 부분집합의 수 

- 집합 A = {1,2}는 다음과 같은 4개의 부분집합을 가짐
- `공집합`과 `자기 자신인 집합`도 `부분집합`

- 부분집합을 만들 때, 우리가 결정할 수 있는 것은 각각의 원소가 우리가 만들고자 하는 `부분집합에 포함`되느냐, `포함되지 않느냐`

![image.png](attachment:image.png)

### *문제*

![image.png](attachment:image.png)

In [53]:
print('(1)', 2**4)

(1) 16


## 합집합과 교집합의 분배 법칙

![image.png](attachment:image.png)

### *문제*
![image.png](attachment:image.png)

In [37]:
A={1,3,5}
B={1,2,3}
C={2,4,6}

In [38]:
A.union(B.intersection(C))

{1, 2, 3, 5}

In [39]:
A_B = A.union(B)
A_B

{1, 2, 3, 5}

In [40]:
A_C = A.union(C)
A_C

{1, 2, 3, 4, 5, 6}

In [41]:
A_B.intersection(A_C)

{1, 2, 3, 5}

In [42]:
A.intersection(B.union(C))

{1, 3}

In [45]:
A_B=A.intersection(B)
A_B

{1, 3}

In [46]:
A_C=A.intersection(C)
A_C

set()

In [47]:
A_B.union(A_C)

{1, 3}