# 집합
파이썬에서 집합을 나타내는 자료형 :  `set`, `frozenset`

# 1. 집합과 원소
* 집합(set) : 구별 가능한 객체의 모임
    * 보통 알파벳 대문자로 표시
* 원소(element) : 집합에 포함된 구별 가능한 객체
    * 알파벳 소문자로 표시  

원소 x와 그 원소를 포함하는 집합 A의 관계
$$x ∈ A$$

A = {1, 2, 3} 일 때 관계
$$ 1 ∈ A $$
$$ 4 /∈ A $$

집합을 이루는 객체는 숫자가 아닌 어떠한 원소도 포함 가능
$$ B = {H, T} $$
$$ C = {◆, ♥, ♠, ♣} $$

##### set
집합을 나타내는 자료형으로 뮤터블(mutable, 변할 수 있는) 자료형
> 뮤터블 자료형
* 딕셔너리 자료형의 key나 set 자료형의 원소가 될 수 없다.

##### frozenset
집합을 나타내는 자료형으로 임뮤터블(immutable, 불변의) 자료형
> 임뮤터블 자료형
* 딕셔너리 자료형의 key나 set 자료형의 원소가 될 수 있다.

In [4]:
A = set([1, 2, 3, 3, 2]) # 중복은 사라진다.
A

{1, 2, 3}

In [5]:
B = frozenset(['H', 'T'])
B

frozenset({'H', 'T'})

`set` 자료형은 `{` `}` 기호로 생성도 가능

In [6]:
C = {"\u2660", "\u2663", "\u2665", "\u2666"}
C

{'♠', '♣', '♥', '♦'}

In [7]:
type(C)

set

# 2. 집합의 크기(cardinality, 카디널리티)
집합이 가지는 원소 갯수
* |A| 기호나 card 기호로 표시

A = {1, 2, 3}이면, 
$$ |A| = card(A) = 3 $$

##### len
집합의 원소 갯수를 구한다.

In [8]:
len(A), len(B), len(C)

(3, 2, 4)

실수 구간 집합은 무한개의 원소를 가진 집합이다.
예를 들어 집합이 0보다 크고 1보다 같거나 작은 모든 실수로 이루어진 집합이며, 원소 갯수는 무한히 많다.
$$ D = {x:0 < x ≤ 1} $$
이런 집합은 `set`, `frozenset` 자료형으로 표현 불가

# 3. 합집합과 교집합
* 합집합(union) : 각 집합의 원소를 모두 포함하는 집합, ∪ 기호로 표시
$$ A ∪ B $$
* 교집합(intersection) : 두 사건 모두에 속하는 원소로만 이루어진 집합, ∩로 표시
$$ A ∩ B $$

##### union, |
합집합을 구한다.

In [9]:
A1 = set([1, 2, 3, 4])
A2 = set([2, 4, 6])
A3 = set([1, 2, 3])
A4 = set([2, 3, 4, 5, 6])

In [10]:
A1.union(A2)

{1, 2, 3, 4, 6}

In [11]:
A2 | A1

{1, 2, 3, 4, 6}

##### intersection, &
교집합을 구한다.

In [12]:
A3.intersection(A4)

{2, 3}

In [16]:
A4 & A3

{2, 3}

# 4. 전체집합, 부분집합, 여집합
* 부분집합(subset) : 어떤 집합의 원소 중 일부만 포함하는 집합
* 전체집합 : 원래의 집합

집합 A가 집합 Ω의 부분집합이면
$$ A ⊂ Ω $$

* 진부분집합(proper subset) : 원소의 크기가 더 작은 부분집합(모든 집합은 자기 자신의 부분집합이다.)

##### issubset
부분집합인지 알아본다.
* 객체가 인수의 부분집합이면 `True` 반환
* 등호를 포함하는 부등식 연산자로도 같은 결과를 구할 수 있다. 더 작은 쪽이 부분집합
* 등호가 없는 부등식 연산자는 진부분집합 관계를 구한다.

In [17]:
A3.issubset(A1)

True

In [18]:
A3 <= A1

True

In [19]:
A3.issubset(A2)

False

In [20]:
A3 <= A2

False

In [21]:
A3 <= A3 # 모든 집합은 자기 자신의 부분집합

True

In [22]:
A3 < A3 # 모든 집합은 자기 자신의 진부분집합이 아니다.

False

# 5. 차집합, 여집합
* 차집합(difference) : 어떤 집합 A에 속하면서 다른 집합 B에는 속하지 않는 원소로 이루어진 A의 부분집합
$$ A - B $$
* 여집합 : 전체집합 Ω 중에서 부분집합 A에 속하지 않은 원소로만 이루어진 부분집합
    * 윗첨자 C(complement)를 사용한다.
$$ A^C $$
$$ A^C = Ω - A $$

##### difference, -
차집합을 구한다.

In [23]:
A1.difference(A2)

{1, 3}

In [24]:
A1 - A2

{1, 3}

# 6. 공집합(null set)
아무런 원소도 포함하지 않는 집합, /0로 표시
* 공집합은 모든 집합의 부분집합이다.
$$ /0 ⊂ A, for all A $$
* 임의의 집합과 공집합의 교집합은 공집합
$$ A ∩ /0 = /0 $$
* 임의의 집합과 공집합의 합집합은 그 집합 자신
$$ A ∪ /0 = A $$
* 여집합과 원래 집합의 교집합은 공집합
$$ A ∩ A^C = /0 $$

In [25]:
empty_set = set([])
empty_set

set()

In [26]:
empty_set < A1

True

In [27]:
empty_set.intersection(A1)

set()

In [28]:
empty_set.union(A1)

{1, 2, 3, 4}

# 7. 부분집합의 수
원소의 갯수가 N개인 집합의 부분집합 수 : 2^N
* N개 원소에 대한 부분집합의 갯수 2^N은 의사결정의 가짓수이다.
* 공집합과 자기 자신인 집합도 부분집합이다.
* 집합 A = {1, 2}는 4개의 부분집합을 가진다.  
$$ A_1 = /0 $$
$$ A_2 = {1} $$
$$ A_3 = {2} $$
$$ A_4 = {1, 2} $$

# 연습 문제
$$ Ω  = \{HH, HT, TH, TT\} $$
1. 이 집합의 부분집합 갯수는? 16개
2. 이 집합의 모든 부분집합을 `frozenset` 자료형 객체로 만들고 이 부분집합들을 원소로 가지는 하나의 `set` 객체를 만든다. 이 집합은 일종의 "부분집합의 집합"이 된다.

In [29]:
s0 = frozenset([])
s1 = frozenset(["HH"])
s2 = frozenset(["HT"])
s3 = frozenset(["TH"]) 
s4 = frozenset(["TT"])
s5 = frozenset(["HH", "HT"])
s6 = frozenset(["HH", "TH"])
s7 = frozenset(["HH", "TT"])
s8 = frozenset(["HT", "TH"])
s9 = frozenset(["HT", "TT"])
s10 = frozenset(["TH", "TT"])
s11 = frozenset(["HH", "HT", "TH"])
s12 = frozenset(["HH", "HT", "TT"])
s13 = frozenset(["HH", "TH", "TT"])
s14 = frozenset(["HT", "TH", "TT"])
s15 = frozenset(["HH", "HT", "TH", "TT"])

s = set([s0, s1, s2, s3, s4, s5, s6, s7, s8, s9, s10, s11, s12, s13, s14, s15])
s

{frozenset(),
 frozenset({'HH', 'TH'}),
 frozenset({'HT', 'TT'}),
 frozenset({'HT', 'TH'}),
 frozenset({'TH', 'TT'}),
 frozenset({'HH'}),
 frozenset({'TT'}),
 frozenset({'HH', 'TT'}),
 frozenset({'HT'}),
 frozenset({'HH', 'HT'}),
 frozenset({'HH', 'HT', 'TT'}),
 frozenset({'TH'}),
 frozenset({'HH', 'HT', 'TH'}),
 frozenset({'HH', 'TH', 'TT'}),
 frozenset({'HT', 'TH', 'TT'}),
 frozenset({'HH', 'HT', 'TH', 'TT'})}

---------------------

# 8. 합집합과 교집합의 분배 법칙
$$ A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) $$
$$ A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) $$

# 연습 문제
다음 세 집합 A, B, C에 대해 위에서 말한 두가지 분배법칙이 성립하는지 파이썬 코드로 증명하라.
$$ A = \{1, 3, 5\} $$
$$ B = \{1, 2, 3\} $$
$$ C = \{2, 4, 6\} $$

In [33]:
# A ∪ (B ∩ C)
A = set([1, 3, 5])
B = set([1, 2, 3])
C = set([2, 4, 6])

A.union(B.intersection(C))

{1, 2, 3, 5}

In [34]:
# (A ∪ B) ∩ (A ∪ C)
A.union(B).intersection(A.union(C))

{1, 2, 3, 5}

In [35]:
# A ∩ (B ∪ C)
A.intersection(B.union(C))

{1, 3}

In [36]:
# (A ∩ B) ∪ (A ∩ C)
A.intersection(B).union(A.intersection(C))

{1, 3}