# Chapter 6 : 자료구조 (집합, set)

- `집합(set)` : 순서가 없고, 원소를 수정할 수 있는 자료구조
- 수학 집합의 성질을 가지고 있음
  - 각 원소는 유일함(unique)

## 1. 생성

- 중괄호 `{}` 를 이용하여 생성

In [1]:
foods = {100, 200, 300, 400}
print(foods)
print(type(foods))

{200, 100, 400, 300}
<class 'set'>


## 2. 원소 접근

- 집합은 각 원소에 직접 접근할 수 없다!! (순서를 모르기 때문)
- 대신 멤버 연산자 `in` 을 사용하여 특정 값이 포함되어 있는지 알 수 있다.

In [2]:
foods = {'pizza', 'hamburger', 'pasta', 'salad'}
print('pasta' in foods)
print('sushi' in foods)

True
False


## 3. 집합 수정

- `set.add(U, D)` : 집합 `U` 에 데이터 `D` 를 추가

In [3]:
fruits = {'banana', 'orange', 'apple'}
set.add(fruits, 'grape')
print(fruits)

# 이미 포함된 값을 추가해도 변함 없음 : 유일성(unique)
fruits.add('orange')
print(fruits)

{'orange', 'apple', 'banana', 'grape'}
{'orange', 'apple', 'banana', 'grape'}


- `set.remove(U, D)` : 집합 `U` 에서 데이터 `D` 를 찾아 제거
- 해당 원소가 없는 경우, `KeyError` 예외 발생

In [4]:
foods = {'hamburger', 'pizza', 'pasta'}
set.remove(foods, 'pizza')
print(foods)

foods.remove('salad')  # KeyError

{'pasta', 'hamburger'}


KeyError: 'salad'

- `set.discard(U, D)` : 집합 `U` 에서 데이터 `D` 를 찾아 제거
- `remove()` 와 달리, 데이터가 없으면 아무 일도 일어나지 않음

In [5]:
scores = {10, 20, 30}
scores.discard(30)
print(scores)

scores.discard(500)
print(scores)

{10, 20}
{10, 20}


## 4. 집합 연산

- `set.union(A, B)` : 집합 `A`, `B` 의 합집합(union)
- 연산자 `|` 로도 가능

In [6]:
set_A = {100, 200, 300}
set_B = {200, 400, 600}
print(set.union(set_A, set_B))
print(set_A.union(set_B))
print(set_A | set_B)

{400, 100, 200, 600, 300}
{400, 100, 200, 600, 300}
{400, 100, 200, 600, 300}


- `set.difference(A, B)` : 집합 `A`, `B` 의 차집합(difference)
- 연산자 `-` 로도 가능

In [7]:
set_A = {100, 200, 300}
set_B = {200, 400, 600}
print(set.difference(set_A, set_B))
print(set_A.difference(set_B))
print(set_A - set_B)

{100, 300}
{100, 300}
{100, 300}


- `set.intersection(A, B)` : 집합 `A`, `B` 의 교집합(intersection)
- 연산자 `&` 로도 가능

In [8]:
set_A = {100, 200, 300}
set_B = {200, 400, 600}
print(set.intersection(set_A, set_B))
print(set_A.intersection(set_B))
print(set_A & set_B)

{200}
{200}
{200}


- `set.symmetric_difference(A, B)` : 집합 `A`, `B` 의 대칭차집합(symmetric difference)
- 연산자 `^` 로도 가능

In [9]:
set_A = {100, 200, 300}
set_B = {200, 400, 600}
print(set.symmetric_difference(set_A, set_B))
print(set_A ^ set_B)

{100, 300, 400, 600}
{100, 300, 400, 600}


- `set.isdisjoint(A, B)` : 집합 `A`, `B` 가 서로소 집합인지 여부 반환

In [10]:
set_A = {100, 200, 300}
set_B = {200, 400, 600}
print(set.isdisjoint(set_A, set_B))

set_A = {100, 200}
set_B = {300, 400}
print(set_A.isdisjoint(set_B))

False
True


- `set.issuperset(A, B)` : 집합 `A` 가 집합 `B` 를 포함하는지 여부 반환
- 연산자 `>=` 로도 가능
- `set.issubset(A, B)` : 집합 `A` 가 집합 `B` 의 부분집합인지 여부 반환
- 연산자 `<=` 로도 가능

In [11]:
set_A = {100, 200, 300}
set_B = {200, 300}
print(set.issuperset(set_A, set_B))
print(set_A >= set_B)

set_A = {100, 200, 300}
set_B = {100, 300, 500, 600}
print(set_A.issubset(set_B))
print(set_A <= set_B)

True
True
False
False


> ※ 참고
>
> 연산자 `A > B` : 집합 `A` 에 집합 `B` 가 포함되어 있는지 여부, 서로 같은 집합이면 `False`
>
> 연산자 `A < B` : 집합 `A` 가 집합 `B` 에 포함되어 있는지 여부, 서로 같은 집합이면 `False`

In [12]:
set_A = {100, 200, 300}
set_B = {100, 200, 300}
print(set_A >= set_B)
print(set_A > set_B)

True
False
