# 26. 세트 이용하기

수학에는 ordered pair $(a,b)$와 unordered pair $\{a,b\}$가 있다.
또한 (ordered) tuple $(a_1,a_2,\cdots,a_n)$과 unordered tuple $\{a_1,a_2,\cdots,a_n\}$이 있다.
즉, ordered pair와 (ordered) tuple에서는 순서가 존재하고 unordered pair와 unordered tuple에서는 순서가 존재하지 않는다.
전자를 (finite) **sequence**라고도 부르고, 후자를 **set** 이라고도 부른다.

파이썬에서 sequence에 해당하는 것은 `list`와 `tuple`이다.
`numpy`까지 확장하면 rank 1의 `np.array`까지도 sequence에 해당한다.
이것은 euclidean vector의 의미와 비슷하게 생각할 수 있지만, `list`와 `tuple`에서는 (벡터공간을 구성하는 두 연산) scalar multiplication과 vector addition에 해당하는 연산들(`*`, `+`)이 선형대수적으로 잘 작동하지 않는다.
반면 `np.array`는 선형대수적으로 scalar multiplication과 vector addition이 잘 작동한다는 이점이 있다.

파이썬에서 **set**에 해당하는 것은 `set`이다.
수학에서의 **set**과 파이썬에서의 `set`이 얼마나 같고 얼마나 다른지는 아직 모르겠다.

|매서드|설명|문법|반환|분류|비고|
|:-:|:-:|:-:|:-:|:-:|:-:|
|`\|`|합집합|*set* `\|`*set*|*set*|연산자||
|`&`|교집합|*set*`&`*set*|*set*|연산자||
|`-`|차집합|*set*`-`*set*|*set*|연산자||
|`^`|대칭차집합|*set*`^`*set*|*set*|연산자||
|`union`|합집합|*set*.`set.union`(*set*)|*set*|*set*의 _method_||
|`intersection`|교집합|*set*.`set.intersection`(*set*)|*set*|*set*의 _method_||
|`difference`|차집합|*set*.`set.difference`(*set*)|*set*|*set*의 _method_||
|`symmetric_difference`|대칭차집합|*set*.`set.symmetric_difference`(*set*)|*set*|*set*의 _method_||
|`update`|합집합|*set*.`update`(*set*)|x|*set*의 _method_||
|`intersection`|교집합|*set*.`intersection_update`(*set*)|x|*set*의 _method_||
|`difference`|차집합|*set*.`difference_update`(*set*)|x|*set*의 _method_||
|`symmetric_difference`|차집합|*set*.`symmetric_difference_update`(*set*)|x|*set*의 _method_||
|`<=`|부분집합|*set* `<=` *set*|*bool*|연산자||
|`>=`|포함집합|*set* `>=` *set*|*bool*|연산자||
|`<`|진부분집합|*set* `<` *set*|*bool*|연산자||
|`>`|진포함집합|*set* `>` *set*|*bool*|연산자||
|`isdisjoint`|서로소|*set*.`isdisjoint`(*set*)|*bool*|*set*의 _method_||
|`add`|특정 요소를 추가한다.|*set*.`add`(ele)|x|*set*의 _method_||
|`remove`|특정 요소를 삭제한다.|*set*.`remove`(ele)|x|*set*의 _method_|특정 요소가 없을시 에러|
|`discard`|특정 요소를 삭제한다.|*set*.`discard`(ele)|x|*set*의 _method_|특정 요소가 없어도 넘어감|
|`pop`|임의의(맨 처음) 요소를 삭제한다.|*set*.`pop`()|삭제된 요소|*set*의 _method_||
|`clear`|모든 요소를 삭제한다.|*set*.`clear`()||*set*의 _method_||
|`len`|요소의 개수를 구한다.|`len`(*set*)||_function_||

In [622]:
print(set.union, type(set.union))
print(set.update, type(set.update))
print(type(2==3))
print(len, type(len))

<method 'union' of 'set' objects> <class 'method_descriptor'>
<method 'update' of 'set' objects> <class 'method_descriptor'>
<class 'bool'>
<built-in function len> <class 'builtin_function_or_method'>


## 26.1. 세트 만들기

In [356]:
A = {'a', 'b', 'c'}
B = {'a', 'c', 'b'} # mixed
C = {'a', 'b', 'c', 'c'} # repeated
print(A)
print(B)
print(C)
print(A is B)
print(A is C)
print(B is C)
print(A == B)
print(A == C)
print(B == C)
print(id(A))
print(id(B))
print(id(C))

{'a', 'b', 'c'}
{'a', 'b', 'c'}
{'a', 'b', 'c'}
False
False
False
True
True
True
140141432308896
140141432310464
140141432308448


수학에서의 **set**과 마찬가지로 순서가 바뀌어도 서로 같다 (`A == B`) 중복된 요소가 존재해도 여전히 같다 (`A == C`)
하지만 완전한 의미에서 같은 것은 아니다. (`not A is B`, `not A is C`)

<font color = red> 이상한 점</font> :

교재에 따르면
> 세트는 요소의 순서가 정해져 있지 않습니다(unordered). 따라서 세트를 출력해보면 매번 요소의 순서가 다르게 나옵니다.

라고 되어 있다.
하지만 실제로 `A`를 여러번 출력한다고 하더라도 순서는 일정하게 나온다.

### 26.1.1. 세트에 특정 값이 있는지 확인하기

In [358]:
A = {'a', 'b', 'c'}
print('a' in A)
print(a in A)

True
False


### 26.1.2. 반복가능한 객체를 사용하여 세트 만들기

반복가능한 객체(iterable object, e.g. `str`, `list`, `dict`, `set`, `range`)로 `set`을 만들 수 있다.
 - 위 subsubsection의 제목은 원래 '26.1.2  set를 사용하여 세트 만들기'였다. 이것을 옳게 바꾸었다.

In [365]:
P = 'Python'
print(set(P))

{'h', 't', 'o', 'y', 'n', 'P'}


In [368]:
R = range(5)
print(set(R))

{0, 1, 2, 3, 4}


In [369]:
E = set()
print(E)

set()


이것은 공집합처럼 생각해도 되는 것 같다.

## 26.2. 집합 연산 사용하기

In [597]:
A = {1,2,3,4}
B = {3,4,5,6}
print(A|B)
print(set.union(A,B))
print(A&B)
print(set.intersection(A,B))
print(A-B)
print(set.difference(A,B))
print(A^B)
print(set.symmetric_difference(A,B))

{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}
{3, 4}
{3, 4}
{1, 2}
{1, 2}
{1, 2, 5, 6}
{1, 2, 5, 6}


이전에 품었던 의문인`3^5=6`이 해결되었다.
그때 연수님께서 저 `^` 연산이 비트연산자(bitwise operator, XOR)에 해당된다고 말씀하신 적이 있는데, 이것은 정확하게 대칭차집합(symmetric difference)에 대응된다.

- `3^5=6`
|base 10||base 2|base 2|base 2|
|-||-|-|-|
|3||0|1|1|
|5||1|0|1|
|-||-|-|-|
|6||1|1|0|

In [382]:
3^5

6

즉, `^`는 두 집합 사이의 연산이기도 하면서 두 숫자 사이의 연산이기도 하다.
혹시 그렇다면, 숫자나 문자열, 리스트 사이에 '교집합', '합집합', '차집합'이 성립할까?

In [405]:
print(5|3)
print(5&3)
print(5-3)
print(5^3)
# print('analysis'|'calculus') # TypeError: unsupported operand type(s) for |: 'str' and 'str'
# print('analysis'&'calculus') # TypeError: unsupported operand type(s) for &: 'str' and 'str'
# print('analysis'-'calculus') # TypeError: unsupported operand type(s) for -: 'str' and 'str'
# print('analysis'^'calculus') # TypeError: unsupported operand type(s) for ^: 'str' and 'str'
# print([1,2]|[1,3]) # TypeError: unsupported operand type(s) for |: 'list' and 'list'
# print([1,2]&[1,3]) # TypeError: unsupported operand type(s) for &: 'list' and 'list'
# print([1,2]-[1,3]) # TypeError: unsupported operand type(s) for -: 'list' and 'list'
# print([1,2]^[1,3]) # TypeError: unsupported operand type(s) for ^: 'list' and 'list'

7
1
2
6


두 숫자에 대하여 `|`와 `&`가 bitwise(?)한 or gate / and gate를 나타내는 것 같다.

- `5|3=7`
|base 10||base 2|base 2|base 2|
|-||-|-|-|
|5||1|0|1|
|3||0|1|1|
|-||-|-|-|
|7||1|1|1|

- `5&3=1`
|base 10||base 2|base 2|base 2|
|-||-|-|-|
|5||1|0|1|
|3||0|1|1|
|-||-|-|-|
|1||0|0|1|

`-`는 평소에 쓰던 정수의 뺄셈 연산이라고 생각할 수 있다.
이것이 bitwise(?)한 difference gate와도 일치할 것만 같기도 하다.
실제로 일치하는지를 살펴보면

- `5-3=2`
|base 10||base 2|base 2|base 2|
|-||-|-|-|
|5||1|0|1|
|3||0|1|1|
|-||-|-|-|
|1||0|1|0|

이 된다.
즉, bitwise difference와 일치하는 것 같다.


참고 :
\begin{align*}
a\text{ and }b&\leftrightarrow A\cap B\\
a\text{ or }b&\leftrightarrow A\cup B\\
a-b\equiv a\text{ and } \neg b&\leftrightarrow A\setminus B=A\cap B^c\\
a\wedge b\equiv (a\text{ or }b)\setminus(a\text{ and }b)\equiv(a\setminus b)\text{ or }(b\setminus a)&\leftrightarrow A\ominus B = (A\cup B)\setminus(A\cap B)=(A\setminus B)\cup(B\setminus A)
\end{align*}


### 26.2.1. 집합 연산 후 할당 연산자 사용하기

In [601]:
A = {1, 2, 3}
A |={3,4}
print(A)
A = {1, 2, 3}
A.update({3,4})
print(A)

{1, 2, 3, 4}
{1, 2, 3, 4}


In [417]:
A = {1, 2, 3}
A &={3,4}
print(A)
A = {1, 2, 3}
A.intersection_update({3,4})
print(A)

{3}


In [421]:
A = {1, 2, 3}
A -={3,4}
print(A)
A = {1, 2, 3}
A.difference_update({3,4})
print(A)

{1, 2}
{1, 2}


In [423]:
A = {1, 2, 3}
A ^={3,4}
print(A)
A = {1, 2, 3}
A.symmetric_difference_update({3,4})
print(A)

{1, 2, 4}
{1, 2, 4}


### 26.2.2. 부분집합과 상위집합 확인하기

### 26.2.3. 세트가 같은지 다른지 확인하기

여기서 상위집합은 superset의 번역이다.
superset은 사전에 따라, 문헌에 따라 다르게 번역되는 듯 보이지만 [대한수학회](https://www.kms.or.kr/mathdict/list.html?start=930&sort=ename&key=&keyword=&alpa=S)에 따르면 '포함집합'이라고 번역하는 것이 맞을 듯하다. (\*는 위 링크에 없긴 하다.)

|한국어|영어|기호|$\TeX$ 명령어|
|:-:|:-:|:-:|:-:|
|부분집합|subset|$\subset$|\subset|
|진부분집합|proper subset|$\subsetneq$|\subsetneq|
|포함집합|superset|$\supset$|\supset|
|진포함집합|proper superset|$\supsetneq$|\supsetneq|


In [438]:
A = {1, 2, 3}
B = {1, 2}
C = {1, 2, 3, 4}
D = {1, 2, 3}

In [439]:
print(A==D, A is D)

True False


In [453]:
'%-10s', '%-10s' % 'python', 'calculus'

('%-10s', 'python    ', 'calculus')

In [474]:
print('{:>12}{:>6}{:>6}{:>6}'.format('','B','C','D'))
print('{:>12}{:>6}{:>6}{:>6}'.format('subset',A<=B,A<=C,A<=D))
print('{:>12}{:>6}{:>6}{:>6}'.format('subsetneq',A<B,A<C,A<D))
print('{:>12}{:>6}{:>6}{:>6}'.format('supset',A>=B,A>=C,A>=D))
print('{:>12}{:>6}{:>6}{:>6}'.format('supsetneq',A>B,A>C,A>D))

                 B     C     D
      subset     0     1     1
   subsetneq     0     1     0
      supset     1     0     1
   supsetneq     1     0     0


 - 위의 코드에서 `0`은 `False`, `1`은 `True`
   - 부등식 `A<=B`는 `boolean` 형식으로 출력되는데, `print` 내부에 있어서 그런가 0/1로 표시되고 있다.
   - 각각의 부등식을 `bool()`로 감싸도 `boolean` 형식으로 출력되지 않는다.
 - 좀 보기 쉽게 만들기 위해서 표 형식으로 출력해봤는데, 영 별로인 것 같다.
 - 그래도 전단원에서 배운 `{:>12}`를 적용했다는 데에는 의미가 있다.

### 26.2.4. 세트가 겹치지 않는지 확인하기

두 집합의 서로소

In [478]:
A = {1, 2, 3}
B = {3, 4}
C = {4, 5}
print(A.isdisjoint(B))
print(B.isdisjoint(A))
print(A.isdisjoint(C))
print(C.isdisjoint(A))

False
False
True
True


여기서는 두 집합의 서로소, 그러니까 pairwise disjoint 개념을 이야기하고 있다.
세 집합 이상일 때의 mutual disjoint 개념을 나타내는 명령어가 존재할 지도 모르겠다.

## 26.3. 세트 조작하기

### 26.3.1. 세트에 요소 추가하기

In [481]:
A = {1,2,3,4}
A.add(5)
print(A)

{1, 2, 3, 4, 5}


### 26.3.2. 세트에서 특정 요소를 삭제하기

In [611]:
A = {1,2,3,4}
A.remove(3)
print(A)
# A = {1,2,3,4}
# A.remove(5) # KeyError: 5
# print(A)

{1, 2, 4}


In [613]:
A = {1,2,3,4}
A.discard(3)
print(A)
A = {1,2,3,4}
A.discard(5)
print(A)

{1, 2, 4}
{1, 2, 3, 4}


### 26.3.3. 세트에서 임의의 요소를 삭제하기

In [616]:
A = {1,2,3,4}
A.pop()
print(A)

{2, 3, 4}


'임의의'라는 말은 잘못되었다.
세트의 요소들 중 가장 작은 요소 (혹은, 아마도 맨 처음 요소)를 삭제하는 것 같다.

### 26.3.4. 세트의 모든 요소 삭제하기

In [620]:
A = {1,2,3,4}
A.clear()
print(A)

set()


### 26.3.5. 세트의 요소 개수 구하기

cardinality

In [621]:
A = {1,2,3,4}
print(len(A))

4


## 26.4. 세트의 할당과 복사
딕셔너리, 리스트에서와 원리가 같다.

In [508]:
A = {1,2,3,4}
B = A
C = A.copy()

- `B`는 `A`를 그대로 할당한 것이고
- `C`는 `A`를 복사한 것이다.

In [509]:
print(B == A, B is A)
print(C == A, C is A)

True True
True False


 - 할당한 변수 `B`는 원래 변수 `A`와 완전히 같다.
 - 하지만 복사한 변수 `C`는 원래 변수 `A`와 값은 같지만 주소까지 같지는 않다.

In [511]:
A.add(5)
print(B == A, B is A)
print(C == A, C is A)

True True
False False


- `A`에 `1`을 추가하면
- `B`에도 `1`이 추가되지만
- `C`에는 `1`이 추가되지 않는다.

즉, `A`와 독립된 변수 `C`를 만들려면 단순히 *할당*만 해서는 안되고 **복사**해야 한다.

In [502]:
A = {1,2,3,4}
B = A
C = A.copy()

## 26.5. 반복문으로 세트의 요소 모두 출력하기

In [512]:
A = {1,2,3,4}
for a in A:
    print(a)

1
2
3
4


## 26.6. 세트 표현식 사용하기

In [514]:
A = {char for char in 'apple'}
print(A)

{'l', 'p', 'a', 'e'}


'조건제시법'을 보는 것 같다.

### 26.6.1. 세트 표현식에 if 조건문 사용하기

In [517]:
A = {char for char in 'pineapple' if char not in 'apl'}
print(A)

{'i', 'n', 'e'}


## 26.7. 퀴즈

1번 문제

In [518]:
a = {1,2,3,4,5}
b = {}
c = set('hello')
d = set(range(10))
e = set()

In [545]:
print('{:<5}{:<35}{:<20}'.format('','print','print(type)'))
print('{:<5}{:<35}{:<20}'.format('a',str(a),str(type(a))))
print('{:<5}{:<35}{:<20}'.format('b',str(b),str(type(b))))
print('{:<5}{:<35}{:<20}'.format('c',str(c),str(type(c))))
print('{:<5}{:<35}{:<20}'.format('d',str(d),str(type(d))))
print('{:<5}{:<35}{:<20}'.format('e',str(e),str(type(e))))

     print                              print(type)         
a    {1, 2, 3, 4, 5}                    <class 'set'>       
b    {}                                 <class 'dict'>      
c    {'h', 'l', 'o', 'e'}               <class 'set'>       
d    {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}     <class 'set'>       
e    set()                              <class 'set'>       


5번 문제

In [555]:
# 1번 : 같다
A = {1,2,3}
B = {3,4}
print(set.intersection(A,B))
print(A&B)

{3}
{3}


 - `set.intsersection`은 `set` 클래스의 매서드이다.
 - `&`는 잘 모르겠지만 연산자인 것 같다.
   - 수학 용어로 말하면 '이항연산(binary operation)'이라고는 말할 수 있다.

In [565]:
# 2번 : 같다
A = {1,2,3}
B = {3,4}
A.update(B)
print(A)
A = {1,2,3}
B = {3,4}
A|=B
print(A)

{1, 2, 3, 4}
{1, 2, 3, 4}


In [563]:
print(set.update)

<method 'update' of 'set' objects>


 - `update`는 `set` 클래스의 매서드이다.
 - `|=`는 잘 모르겠지만 이것도 연산자인 것 같다.
   - 이것도 이항연산이라고 해야 할까? 모르겠다.

In [569]:
# 3번 : 다르다
A = {1,2,3}
B = {3,4}
A.symmetric_difference_update(B)
print(A)
A = {1,2,3}
B = {3,4}
A-=B
print(A)
A = {1,2,3}
B = {3,4}
A.difference_update(B)
print(A)
A = {1,2,3}
B = {3,4}
A^=B
print(A)

{1, 2, 4}
{1, 2}
{1, 2}
{1, 2, 4}


 - `symmetric_difference_update`와 `difference_update`도 둘다 `set` 클래스의 매서드이다.
 - `-=`와 `^=`도 아마 이것도 연산자인 것 같다.

## 26.8. 연습문제

## 26.9. 심사문제

10 20

100 200

\begin{align*}
x|y
&\iff y\text{ is divisible by } x\\
&\iff x\text{ is a divisor of } y\\
&\iff \text{`x%y==0`}
\end{align*}
12 is divisible by 4 since `12%4==0`

In [575]:
x = 6
ax = {i for i in range(1,x) if x % i ==0}
print(x)

6


In [591]:
x,y = map(int,input().split())
a = {i for i in range(1,x+1) if x % i ==0}
b = {i for i in range(1,y+1) if y % i ==0}
divisor = a & b
 
result = 0
if type(divisor) == set:
    result = sum(divisor)
 
print(result)

10 20
18
