## Set 자료구조
- 셋 자료구조의 가장 큰 특징은 중복이 불가능하다는 것이다.
- 때문에 주로 리스트, 튜플 등의 요소에서 **중복을 제거**하는 용도로 쓰인다.
- 중복을 허용하지 않기 때문에 입력한 순서를 기억, 보존하지 않는다.</br>
    -> 순서가 존재하지 않기 때문에 인덱스[0] 방식으로 값에 접근할 수 없다.
- 함수를 이용해서 값에 접근하거나 값을 제거 하는 방식으로만 동작한다.
- 기존의 변수처럼 해당 위치에 새로운 값을 덮어쓰기 하는 방식이 아니라는 점이, 리스트, 튜플과의 가장 큰 차이점이다.
- 셋의 선언, 생성방법
```python
set_data = {1, 2, 1, 3, 3}
print(set_data) # {1, 2, 3}
```

In [None]:
# 셋의 생성
# 1. set() 이용하기
# set()만 작성하면 빈 셋을 생성하게 된다.
empty_set = set()

# 1-1. set() 소괄호() 안에 리스트, 튜플 등의 다른 자료구조를 전달하면
# 해당 요소들에서 중복을 제거한 요소들로 이루어진
# set 데이터를 생성하게 된다.
converted_set = set([3, 1, 6, 2, 4, 1])
print(converted_set) # {1, 2, 3, 4, 6}
# 입력한 순서와 무관하게 내부적으로 정해진 규칙에 따라 정렬된다.

# 2. 중괄호 안에 반점,으로 요소들을 구분하여 전달하면
# 해당 요소들에서 중복을 제거한 셋 데이터를 생성한다.
origin_set = {1, 3, 2, 5, 1, 6}
print(origin_set)

In [None]:
# 셋 자료구조에 데이터 추가/삭제
# 1. 요소의 추가 .add()
# 셋 데이터가 담긴 변수 뒤에 .add()를 작성하고
# 소괄호() 안에 추가할 값을 전달하면
# 해당 값을 셋 데이터에 추가한다.
# 단, 이미 존재하는 값이라면 추가되지 않는다(중복불가)
my_set = {1, 3, 5}
# 기존 셋에 4를 추가한다.
my_set.add(4)
print(my_set)
# 이미 존재하는 값을 추가해본다.
my_set.add(4)
print(my_set)

In [None]:
# 2. 요소의 삭제
# 요소 제거는 두 가지 메서드가 존재하는데,
# 하나는, 해당 값이 없으면 에러 발생
# 다른 하나는, 값이 없어도 에러 없음
# 공통적으로 값이 존재하면 에러 없이 값 제거
# .remove()
# 전달한 요소를 제거하는데, 해당 값이 존재하지 않으면
# 오류를 발생시킨다.
my_set = {3, 1, 2, 5}
# 4 값 제거
if 4 in my_set: # 만약 4라는 값이 my_set 안에 존재하면
    my_set.remove(4) # 없는 값을 제거하려 하므로 에러 발생
print(my_set)

# .discard()
# 해당 값이 존재하지 않더라도 에러를 발생시키지 않는다.
my_set.discard(4) # 에러 발생 x

# 2-1. 랜덤 요소 제거
# 임의의 요소를 제거하는 .pop() 메서드가 존재한다.
# 이때 소괄호 안에는 어떤 값도 전달하지 않아야 한다.
poped_element = my_set.pop() # pop()으로 제거된 요소는
# 반환되어 변수에 담을 수 있다.
# 단, 셋 데이터가 빈 셋이면 KeyError를 발생시킨다.
print(poped_element)
print(my_set)

In [None]:
# 모든 요소의 삭제
# .clear() 메서드를 사용하면 모든 요소를 제거한다.
my_set = {1, 4, 2, 3}
my_set.clear()
print(my_set) # set()

In [None]:
# 셋 연산
# 셋은 수학시간에 배웠던 집합과 그 개념을 같이 한다.
# 합집합, 교집합, 차집합, 대칭차집합 등의 연산자가 있다.
# 1. 합집합
# 두 set을 하나로 합치는데, 중복된 데이터는 단일만 남긴다.
# shift + \ -> |
# union 혹은 or 라고 읽는다.
my_set1 = {1, 2, 3}
my_set2 = {3, 4, 5}
union_set = my_set1 | my_set2
print(union_set) # {1, 2, 3, 4, 5}

# 합집합 메서드
# | 연산자뿐만 아니라 .union() 메서드로
# 두 set을 병합할 수 있다.
union_set = my_set1.union(my_set2)
print(union_set)

print(my_set1 + my_set2) # list, tuple에서 병합(union)에 사용하던
# + 연산자는 사용할 수 없다.

In [None]:
# 교집합 연산자
# 두 set에 모두 존재하는 요소를 추출
# & , .intersection()
inter_set = my_set1 & my_set2
print(inter_set)

inter_set = my_set1.intersection(my_set2)
print(inter_set)

In [None]:
# 차집합 연산
# 차집합 연산은 순서가 중요하다
# - , .difference()
print(my_set1 - my_set2)
print(my_set1.difference(my_set2))

# 대칭차집합
# ^ , symmetric_difference()
# 합집합에서 교집합 요소를 제거한 만큼을 대칭차집합이라고 한다.
# 서로의 차집합의 합집합이라고 봐도 무방하다.
# 순서가 중요하지 않다.
print(my_set1.symmetric_difference(my_set2))