## 8. 집합(Set)
- 집합은 포함되어야 하는 데이터의 묶음을 나타내는 데이터 구조이다.

#### 집합(set)
- 집합은 순서(sequence)나 키(key)를 갖지 않는다.
- 집합은 동일한 데이터를 중복으로 저장할 수 없다.
- 집합은 수학의 집합 연산이 가능하다.

### 1) 집합 생성
- 집합은 중괄호({})를 사용하여 값을 묶는다.
- 각 원소는 쉽표(,)로 구분한다.
- 집합은 변경할 수 없는 자료형(immutable)만 담을 수 있다.
- 집합은 서로 다른 자료형을 담을 수 있다.

#### 공집합

In [2]:
type({})

dict

In [1]:
type(set())

set

#### 원소가 하나 이상인 집합

In [3]:
print(type({0, -127, 123, 'asdf'}))
print(type({'i', 'e', 'a', 'u', 'o'}))
print(type({(1, 2), (3, 4)}))

<class 'set'>
<class 'set'>
<class 'set'>


#### 서로 다른 자료형을 담은 집합

In [4]:
print(type({'a', 1}))

<class 'set'>


#### 클래스 생성자

In [5]:
# 시퀀스 변환
print(set('HAPPY'))
print(set([6, 1, 1, 2, 3, 3, 1, 5, 5, 4]))
print(set(('사과', '토마토', '바나나', '감')))

{'Y', 'H', 'A', 'P'}
{1, 2, 3, 4, 5, 6}
{'토마토', '사과', '바나나', '감'}


In [7]:
# 레인지 변환
even = set(range(0, 10, 2))
odd = set(range(1, 10, 2))
print(even)
print(odd)

{0, 2, 4, 6, 8}
{1, 3, 5, 7, 9}


#### 중복 원소 제거

In [8]:
 list(set([6, 1, 1, 2, 3, 3, 1, 5, 5, 4]))

[1, 2, 3, 4, 5, 6]

### 2) 집합 연산

#### 집합 대입

In [10]:
wildanimal = {'사자', '박쥐', '늑대', '곰'}
flyanimal = {'독수리', '매', '박쥐'}
seaanimal = {'참치', '상어', '문어'}

#### 집합 길이(length)

In [11]:
len(wildanimal)

4

#### 멤버 연산자

In [12]:
print('늑대' in wildanimal)
print('곰' not in wildanimal)

True
False


#### 참고
- 시퀀스의 멤버 연산은 요소를 처음부터 끝까지 순서대로 하나씩 찾는다.
- 집합의 멤버 연산은 해시 알고리즘을 사용하여 한 번에 찾는다.
- 데이터 양이 많을수록 시퀀스보다 집합의 연산 방식이 유리하기 때문에 멤버 연산을 자주 수행하는 컬렉션을 정의할 때는 집합으로 정의하는 것을 고려한다.

#### 합집합
- | 연산자
- union()

In [13]:
print(wildanimal | flyanimal)
print(wildanimal | flyanimal | {'인간'})

{'매', '곰', '사자', '박쥐', '늑대', '독수리'}
{'매', '인간', '곰', '사자', '박쥐', '늑대', '독수리'}


In [15]:
animal = wildanimal.union(flyanimal)
print(animal)

{'매', '곰', '사자', '박쥐', '늑대', '독수리'}


#### 교집합
- & 연산자
- intersection()

In [16]:
print(wildanimal & flyanimal)

{'박쥐'}


In [17]:
print(wildanimal.intersection(flyanimal))
print(wildanimal.intersection(seaanimal))

{'박쥐'}
set()


#### 차집합

- - 연산자
- difference()

In [18]:
print(flyanimal - wildanimal)

{'매', '독수리'}


In [19]:
print(animal.difference(flyanimal))

{'사자', '늑대', '곰'}


#### 대칭차
- 한 집합에는 속하지만 두 집합 모두에는 속하지는 않는 원소들의 집합이다. 즉, 합집합 - 교집합이다.
- ^ 연산자
- symmetric_difference()

In [20]:
print(wildanimal ^ flyanimal)

{'사자', '매', '곰', '늑대', '독수리'}


In [21]:
print(wildanimal.symmetric_difference(flyanimal))

{'사자', '매', '곰', '늑대', '독수리'}


#### 부분집합
- <= 연산자
- issubset()

In [24]:
print(wildanimal <= animal)
print(wildanimal <= flyanimal)

True
False


In [25]:
print(wildanimal.issubset(animal))
print(wildanimal.issubset(flyanimal))

True
False


#### 상위집합
- >= 연산자
- issuperset()

#### 서로소 집합
- 서로소 집합은 공통 원소가 없는 두 집합이다.
- isdisjoint()

In [26]:
print(wildanimal.isdisjoint(flyanimal))
print(wildanimal.isdisjoint(seaanimal))

False
True


### 3) mutable 객체
- 집합의 원소는 변경할 수 있다.

#### 원소 추가
- add()
- update()

In [28]:
wildanimal.add('인간')
print(wildanimal)

{'사자', '박쥐', '인간', '곰', '늑대'}


In [34]:
wildanimal = {'사자', '박쥐', '인간', '곰', '늑대'}
wildanimal.update(['사슴', '토끼'])
print(wildanimal)

{'사자', '사슴', '박쥐', '인간', '곰', '늑대', '토끼'}


#### 원소 제거
- remove()
- discard()
- pop()
- clear()

In [35]:
wildanimal.remove('곰')
print(wildanimal)

{'사자', '사슴', '박쥐', '인간', '늑대', '토끼'}


In [37]:
wildanimal.discard('인간')
print(wildanimal)

{'사자', '사슴', '박쥐', '늑대', '토끼'}


In [38]:
print(wildanimal.pop())
print(wildanimal)

사자
{'사슴', '박쥐', '늑대', '토끼'}


In [39]:
wildanimal.clear()
print(wildanimal)

set()


### 4) 프로즌 셋(Frozenset)
- 변경할 수 없는(immutable) 집합 컬렉션이다.
- 공집합 프로즌셋 frozenset()
- 집합 변환 frozenset({원소 1, 원소 2, 원소 3, ...})
- 시퀀스 변환 frozenset([원소 1, 원소 2, 원소 3, ...])