In [1]:
A = set([1, 2, 3, 3, 2])
A

{1, 2, 3}

In [2]:
B = frozenset(['H', 'T'])
B

frozenset({'H', 'T'})

- set의 원소로 list를 넣을 수는 없다. list는 mutable 하기 때문

In [3]:
C = {"\u2660", "\u2661", "\u2662", "\u2663"}
C

{'♠', '♡', '♢', '♣'}

In [4]:
type(C)

set

#### 집합의 크기
- Cardinailty.
- 집합이 가지는 원소의 개수.
- |A| 기호나 card 기호를 사용해 나타냄.
$$A = {1,2,3}$$
$$|A| = card(A) = 3$$

In [6]:
len(A), len(B), len(C)

(3, 2, 4)

- 무한개의 원소를 가진 집합은 파이썬의 set 혹은 frozenset 자료형으로 나타낼 수 없다.

#### 합집합

In [8]:
A1 = set([1, 2, 3, 4])
A2 = set([2, 4, 5])
A3 = set([1, 2, 3])
A4 = set([2, 3, 4, 5, 6])

In [9]:
A1.union(A2)

{1, 2, 3, 4, 5}

In [10]:
A2|A1

{1, 2, 3, 4, 5}

In [12]:
A3.intersection(A4)

{2, 3}

In [13]:
A4 & A3

{2, 3}

### 전체집합, 부분집합, 여집합

#### 부분집합 여부

In [15]:
A3.issubset(A1)

True

In [16]:
A3 <= A1

True

In [20]:
# 부분집합이 아닌 경우
A3.issubset(A2)

False

- 모든 집합은 자신의 부분집합이다.

In [18]:
A3 <= A3

True

In [22]:
A3.issubset(A3)

True

In [23]:
#집합과 그 진부분집합
A3<A3

False

### 차집합과 여집합

- 어떤 집합 A에 속하면서 다른 집합 B에 속하지 않는 원소로 이루어진 A의 부분집합을 A에서 B를 뺀 차집합(difference)이라고 하며
$$A - B$$
라고 나타낸다.

- 전체집합 \Omega 중에서 부분집합 A에 속하지 않은 원소로만 이루어진 부분집합을 여집합(complement)이라고 하고 윗첨자 C를 사용하여
$$A^C$$
로 표시한다.
- 여집합 A^C은 전체집합에서 집합 A를 뺸 차집합과 같다.
$$A^C = \Omega - A$$

In [24]:
# 파이썬으로 차집합 구현하기

A1.difference(A2)

{1, 3}

In [25]:
A1 - A2

{1, 3}

### 공집합

- 아무런 원소도 포함하지 않는 집합
- 'null set'

In [26]:
empty_set = set([])
empty_set

set()

In [27]:
empty_set < A1

True

In [28]:
empty_set.intersection(A1)

set()

In [29]:
empty_set.union(A1)

{1, 2, 3, 4}

### 부분집합 수
- [정리] 원소의 갯수가 N개인 집합은 2^N개의 부분집합을 가진다.

$$\Omega = \{HH, HT, TH, TT\}$$

- 이 집합의 모든 부분집합을 frozenset 자료형 객체로 만들고 이 부분집합들을 원소로 가지는 하나의 set 객체를 만든다.
- 이는 일종의 "부분집합의 집합".

In [31]:
A1 = frozenset([])
A2 = frozenset(["HH"])
A3 = frozenset(["HT"])
A4 = frozenset(["TH"])
A5 = frozenset(["TT"])
A6 = frozenset(["HH", "HT"])
A7 = frozenset(["HH", "TH"])
A8 = frozenset(["HH", "TT"])
A9 = frozenset(["HT", "TH"])
A10 = frozenset(["HT", "TT"])
A11 = frozenset(["TH", "TT"])
A12 = frozenset(["HT", "TH", "TT"]) # HH가 없을 때
A13 = frozenset(["HH", "TH", "TT"]) # HT가 없을 때
A14 = frozenset(["HH", "HT", "TT"]) # TH가 없을 때
A15 = frozenset(["HH", "HT", "TH"]) # TT가 없을 때
A16 = frozenset(["HH", "HT", "TH", "TT"])

In [32]:
set([A1, A2, A3, A4, A5, A6, A7, A8, A9, A10, A11, A12, A13, A14, A15, A16])

{frozenset(),
 frozenset({'HH'}),
 frozenset({'TH'}),
 frozenset({'TT'}),
 frozenset({'HT', 'TT'}),
 frozenset({'TH', 'TT'}),
 frozenset({'HT'}),
 frozenset({'HT', 'TH'}),
 frozenset({'HT', 'TH', 'TT'}),
 frozenset({'HH', 'HT'}),
 frozenset({'HH', 'TH'}),
 frozenset({'HH', 'HT', 'TH'}),
 frozenset({'HH', 'TT'}),
 frozenset({'HH', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TT'}),
 frozenset({'HH', 'HT', 'TH', 'TT'})}

In [35]:
from itertools import chain, combinations

def get_set_of_subsets(omega):
    return set([frozenset(s) for s in chain.from_iterable(combinations(omega, r)for r in range(len(omega) + 1))])

In [37]:
Omega = {"\u2660", "\u2661", "\u2662", "\u2663"}
get_set_of_subsets(Omega)

{frozenset(),
 frozenset({'♢', '♣'}),
 frozenset({'♠', '♣'}),
 frozenset({'♡'}),
 frozenset({'♢'}),
 frozenset({'♠'}),
 frozenset({'♠', '♢'}),
 frozenset({'♠', '♡'}),
 frozenset({'♠', '♡', '♢'}),
 frozenset({'♠', '♢', '♣'}),
 frozenset({'♠', '♡', '♣'}),
 frozenset({'♡', '♢'}),
 frozenset({'♣'}),
 frozenset({'♡', '♣'}),
 frozenset({'♡', '♢', '♣'}),
 frozenset({'♠', '♡', '♢', '♣'})}