<a href="https://colab.research.google.com/github/SpecialAlex/TemporaryStation/blob/main/P03_02_04_Set.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 집합
위대한 수학자 다비트 힐베르트(David Hillbert)는 '아무도 우리를 칸토어가 만들어낸 낙원에서 쫓아낼 수 없다'라고 말했고,  
그 낙원이란 게오르크 칸토어(Georg Cantor)이후 주류 수학계에 집합론이 자리 잡은 이 현실 세계를 말한다.  
수학에서 집합(Set)이란 '특정 조건을 만족시키는 서로 다른 대상들의 모임'으로 정의하고, 컴퓨터과학에서 집합은 '데이터를 순서와 중복 없이 저장하는 추상 데이터 구조'로 정의한다.  
이에 따르면 수학에서 말하는 집합과 정의는 크게 달라졌지만 결과적으로 성질 자체는 얼추 유사하다.  
  
Julia에서 집합을 만드는 방법은 간단히 다른 컬렉션에 `Set()`함수, 더 정확히는 Set의 생성자를 취하는 것이다.  
집합이 되고 나면 중복된 원소들은 그중 하나만 남고, 원소들 간의 순서도 원래 주어진 것과 전혀 상관없이 무작위로 출력된다.  
실제로 집합이 되고 나면 `sort`와 같이 컬렉션을 정렬하는 함수를 사용할 수 없게 된다.

In [1]:
S = Set([ 3, 1, 4, 1, 5 ])

Set{Int64} with 4 elements:
  5
  4
  3
  1

In [2]:
sort(S)

LoadError: MethodError: no method matching sort(::Set{Int64})
The function `sort` exists, but no method is defined for this combination of argument types.

[0mClosest candidates are:
[0m  sort([91m::AbstractUnitRange[39m)
[0m[90m   @[39m [90mBase[39m [90m[4mrange.jl:1397[24m[39m
[0m  sort([91m::AbstractRange[39m)
[0m[90m   @[39m [90mBase[39m [90m[4mrange.jl:1400[24m[39m
[0m  sort([91m::AbstractVector[39m; kws...)
[0m[90m   @[39m [90mBase[39m [90m[4msort.jl:1720[24m[39m
[0m  ...


In [3]:
P = Set()

Set{Any}()

In [4]:
push!(P, 4)

Set{Any} with 1 element:
  4

In [5]:
push!(P, 7)

Set{Any} with 2 elements:
  4
  7

In [6]:
pop!(P)

4

## 포함관계
Julia의 집합은 앞서 설명했던 컴퓨터과학에서 말하는 집합이면서, 컬렉션에 원소가 포함되는지를 확인하는 작업인 멤버십 테스팅(Membership Testing)이 빠른 가변 데이터(Mutable Container)라고 한다.  
아마 Julia의 개발진은 '빠른 멤버십 테스팅'이라는 성능적 면모를 내세우고 싶은 것 같다.  
  
원소와 집합 사이의 멤버십 테스팅은 `in()`함수, 이항 연산 꼴로는 ∈('\in' 입력 후 \<tab\>)을 사용하고 그 부정(Negation)으로는 ∉('\notin' 입력 후 \<tab\>)을 사용한다.  
굳이 좌우를 바꾸고 싶다면 ∋('\ni' 입력 후 \<tab\>)도 있는데, 이 정도로는 알아둬야 할 필요도 없고 만약 쓸 수 있어도 가능한 자제하는게 좋다.

In [15]:
A = Set([ 2, 3, 5, 7 ])

Set{Int64} with 4 elements:
  5
  7
  2
  3

In [17]:
a = 9
b = 7
println(a ∈ A)
println(b ∈ A)
println(a ∉ A)
println(b ∉ A)

false
true
true
false


집합과 집합 사이의 멤버십 테스팅, 즉 부분집합(Subset)인지 확인하는 함수는 `issubset()`함수로 이항 연산 꼴로는 ⊆('subseteq' 입력 후 \<tab\>)을 사용하고 진부분집합(Proper Subset)인지 확인하려면 ⊊('\subsetneq'입력 후 \<tab\>)을 사용한다.  
  
지금까지 언급한 멤버십 테스팅은 물론 집합을 다룰 떄 가장 자연스럽지만, 집합에서만 정의할 이유는 없기 떄문에 대부분의 배열 등에서도 사용할 수 있다.  
반대로 집합이 아닌 때 더 큰 의미가 있는 함수로, `issetequal()`함수는 컬렉션의 구성에 관계없이 집합 개념으로 비교했을 때 두 컬렉션이 같은지를 판단해준다.  
예를 들어 배열의 순서가 다르면 엄연히 다르지만, 같은 원소들로 이루어져 있는지로 비교했을 떈 같을 수 있다.

In [20]:
println(isequal([ 2, 3, 1 ], [ 1, 2, 3 ]))
println(issetequal([ 2, 3, 1 ], [ 1, 2, 3 ]))

false
true


## 집합의 연산
프로그래밍을 하다 보면 집합 개념을 쓸 일이 생각보다 많은데, 합집합이나 교집합 등의 연산이 별것 아닌 것처럼 보여도 막상 직접 짜려면 빠르고 깔끔하게 구현하기가 어렵다.  
다행 스럽게도 Julia의 공식 문서에는 집합의 연산 역시 효율적으로 구현했다는 언급이 있다.  
  
합집합을 수행하는 `union()`함수는 이항 연산 꼴로 ∪('\cup'입력 후 \<tab\>), 교집합을 수행하는 `intersect()`함수는 이항 연산 꼴로 ∩('\cap'입력 후 \<tab\>)을 사용한다.

In [21]:
X = Set([ 3, 1, 4 ])
Y = Set([ 5, 6, 1 ])

X ∪ Y

Set{Int64} with 5 elements:
  5
  4
  6
  3
  1

In [22]:
X ∩ Y

Set{Int64} with 1 element:
  1

차집합(Set Difference) `setdiff()`와 대칭차집합(Symmetric Set Difference) `symdiff()`는 따로 이항 연산 꼴이 정의되어 있지는 않다.

In [25]:
setdiff(X, Y)

Set{Int64} with 2 elements:
  4
  3

In [26]:
symdiff(X, Y)

Set{Int64} with 4 elements:
  5
  4
  6
  3

참고로 대칭차집합이란 다음 수식의 Δ('Delta' 입력 후 \<tab\>)처럼 정의되는 연산으로, 보기보다 쓸 일이 많다.  
여기서 \는 차집합을 의미한다.  
$A \Delta B := (A \cup B) \ (A \cap B)$  
지금까지 연급된 집합의 연산자들 역시 꼭 집합에만 국한될 필요가 없으므로 마찬가지로 대부분의 배열 등에서 사용할 수 있다.  
딱히 집합처럼 원소가 유일해야 한다는 조건이 없을 때도 두 컬렉션이 서로소인지, 다시 말해 어떤 원소가 컬렉션 중 단 한 곳에만 속하는지를 확인해야 할 일이 꽤 있는데 이런 경우 `indisjoint()`함수를 통해 컬렉션 자체를 바로 비교함으로서 교집합 연산을 생략할 수 있다.

In [27]:
println(isempty([2, 0] ∩ [1, 3]))
println(isdisjoint([2, 0], [1, 3]))

true
true
