# 집합(기초)

리스트에서는 index를, 딕셔너리에서는 key를 사용하여 value에 접근할 수 있었다. 그렇다면 index나 key는 반드시 필요할까?

집합은 그 틀을 깼다. 집합(set)은 index나 key가 없다. 그렇기 때문에 순서가 없으며, 값이 중복되지 않는 특징을 가진 자료구조이다. 수학의 집합과 개념적으로 아주 비슷하다. 

## set 생성
- 중괄호 { }안에 아이템을 콤마로 나열하여 직접 생성할 수 있다.
- 또한 `변수명 = set()`나 `변수명 = {}`와 같이 쓰면 비어있는 set을 생성할 수 있다.
- set은 아이템의 중복을 수용하지 않기 때문에 중복을 제거할 필요가 있는 데이터라면 set으로 만들면 된다.

:::{admonition} 동적타이핑(Dynamic typing)  
:class: tip 

빈 딕셔너리를 만들거나 빈 set을 만들때 `변수명 = {}`와 같이 선언하는데, 그렇다면 어떻게 딕셔너리 변수인지 set변수인지 구분할 수 있을까? 파이썬은 동적으로 형(type)을 정의해주는 동적타이핑 기능을 지원하고 있다. 따라서 변수에 저장되는 데이터가 딕셔너리 형태이면 딕셔너리변수가 되고, set형태이면 set변수가 된다. 다른 언어를 다뤄본 사람이라면 파이썬에서 지원하는 이 기능이 얼마나 프로그래머에게 편의를 제공해주는지 말하지 않아도 알 것이다.😄

:::

In [None]:
s1 = {'foo', 'bar', 'baz', 'foo', 'qux'}
s2 = {}
s3 = set()
s4 = set([1,1,4,2,2,6,6,6,6,7,8,10,4,2,8,6,3])
print(s1, s2, s3, s4, sep='\n')

- set은 순서가 없기 때문에 인덱싱이나 슬라이싱을 할 수 없다.


```
s1 = {'muzi', 'con', 'apeach', 'jay-G', 'frodo', 'neo', 'tube', 'ryan', 'choonsik'}
s1[0]
s1[2:5]
```



- set에 대해서 인덱싱 또는 슬라이싱을 해야 하거나 아이템을 추가, 삽입, 수정, 삭제, 정렬 등의 작업을 해야 할 필요가 생긴다면 list()함수나 tuple()함수로 타입을 변환하면 된다.

In [None]:
s1 = {'muzi', 'con', 'apeach', 'jay-G', 'frodo', 'neo', 'tube', 'ryan', 'choonsik'}
l = list(s1)
t = tuple(s1)
print( l )
print( t )

- set은 순서가 없기 때문에 반복이 안된다? 아니다! 순서는 없지만 반복가능한(iterable) 데이터타입이다.

In [None]:
for item in s1:
  print(f'kakao-{item}')

kakao-con
kakao-frodo
kakao-choonsik
kakao-muzi
kakao-tube
kakao-jay-G
kakao-ryan
kakao-apeach
kakao-neo


## set 주요 메서드와 iteration

|사용 방법|의미|예시<br> s1={1,4,7} b={1,3,6,8,10}|
|:----------:|:----------|:----------|
|a.union(b) or <br> a\|b |합집합 | a\|b ➡ {1, 3, 4, 6, 7, 8, 10}|
|a.difference(b) or <br> a-b|차집합 | a-b ➡ {4, 7}| 
|a.intersection(b) or <br> a&b|교집합 | a&b ➡ {1}| 
|a.symmetric_difference(b) or <br> a^b|대칭차집합 | a^b ➡ {3, 4, 6, 7, 8, 10}| 

이외에도 몇 가지 메서드가 있으니 살펴보기 바란다.

In [None]:
a= {1,4,7}
b={1,3,6,8,10}

In [None]:
print(a | b)
print(a.union(b))

In [None]:
print(a-b)
print(a.difference(b))

In [None]:
print(a.intersection(b))
print(a & b)

In [None]:
print(a.symmetric_difference(b))
print(a ^ b)