### set 집합

 - ‘카페인이 든 음료들’이라는 컬렉션과 ‘가격이 3천 원 이하인 음료들’이라는 컬렉션에 모두 포함되어 있는 음료(교집합)을 구하는 방법?
 
 - ‘카페 라테’가 그 속에 포함되는지(소속 검사)를 알 수 있는 방법
 
 - 집합(set)을 이용하면 이런 문제를 더 쉽고 빠르게 해결할 수 있음

### 원소를 묶어 둔 데이터 구조 : 집합

 - 집합은 그 속에 포함되어야 할 원소들을 묶어 놓은 데이터 구조
 
 - 데이터를 모아 둔 컬렉션이라는 점에서 집합은 다른 컬렉션(특히 시퀀스)과 비슷하지만 차이점이 있음
 
 - 집합은 원소에 순서(번호)나 키를 붙여 관리하지 않음 ... 그저 포함해야 할 원소를 원소를 담고 있을 뿐
 
 - 또, 시퀀스와 매핑은 동일한 값을 여러 개 중복으로 저장할 수 있지만 집합은 동일한 원소를 하나만 가질 수 있음
 
 - 그래서 어떤 원소가 집합에 포함되는지는 알 수 있어도, 그 원소가 몇 번째인지 또는 몇 개나 있는지는 알 수 없음
 
 - 집합의 특징은 아래와 같음

 > 순서나 키 없이, 포함되는 원소를 모아 둔 데이터 구조
 >
 > 원소를 중복으로 저장하지 않음
 >
 > 합집합, 교집합 같은 수학의 집합 연산이 가능
 >
 > 어떤 원소가 집합에 포함되었는지 검사할 수 있음

### 집합을 표현

 - {1, 2, 3, 4}와 같이 중괄호({})를 이용해 데이터를 묶고, 각 원소를 쉼표로 구분
 
 - dict 사전과 비슷함 --> {키1: 값1, 키2: 값2}와 같이 사전을 표현하는 양식과는 차이, 콜론(:)으로 표현된 키-값 쌍을 담음
 
 ```
 
 원소가 하나인 집합

 {원소1, 원소2, 원소3, …}

 공집합

 set()
 
 ```

In [1]:
# 정수의 집합
정수집합 = {0, -127, 97, 1789}

# 이메일 주소의 집합
이메일집합 = {'bakyeono@gmail.com', 'i@bakyeono.net'}

# 공집합
공집합 = set()

### 시퀀스를 집합으로 변환

 - 시퀀스는 순서와 중복이 있다는 점을 제외하면 집합과 형태가 유사
 
 - 따라서 집합을 시퀀스로 변환하거나 반대로 집합을 시퀀스로 변환할 수 있음
 
 - 단, 시퀀스를 집합으로 변환할 때는 원소의 순서와 중복된 원소가 사라진다는 점에 유의

In [2]:
set([6, 1, 1, 2, 3, 3, 1, 5, 5, 4])      # 리스트를 집합으로

{1, 2, 3, 4, 5, 6}

In [3]:
set(('사과', '토마토', '바나나', '감'))  # 튜플을 집합으로

{'감', '바나나', '사과', '토마토'}

In [4]:
# 코드 5-62 레인지를 이용해 집합 정의하기

짝수 = set(range(0, 10000, 2))
홀수 = set(range(1, 10000, 2))

In [5]:
# 리스트에서 중복 원소 제거하고 리스트로 받기

list(set([6, 1, 1, 2, 3, 3, 1, 5, 5, 4]))

[1, 2, 3, 4, 5, 6]

### 집합 연산

 - 소속 검사, 합집합, 교집합, 여집합, 차집합, 부분집합 검사 등 수학의 집합 연산을 수행할 수 있음

In [6]:
들짐승 = {'사자', '박쥐', '늑대', '곰'}
날짐승 = {'독수리', '매', '박쥐'}
바다생물 = {'참치', '상어', '문어 괴물'}

In [7]:
# 집합의 원소 개수 세기

len(들짐승)

4

In [8]:
# 집합에서 소속 검사하기

'늑대' in 들짐승

True

In [9]:
'곰' not in 들짐승

False

In [10]:
# 두 집합의 합집합 구하기

짐승 = 들짐승.union(날짐승)  # 들짐승과 날짐승의 합집합
짐승

{'곰', '늑대', '독수리', '매', '박쥐', '사자'}

In [11]:
# 연산자로 합집합 구하기

들짐승 | 날짐승

{'곰', '늑대', '독수리', '매', '박쥐', '사자'}

In [12]:
들짐승 | 날짐승 | {'인간'}  # ❶ 여러 집합을 연달아 합할 때

{'곰', '늑대', '독수리', '매', '박쥐', '사자', '인간'}

In [13]:
# 두 집합의 교집합 구하기

들짐승.intersection(날짐승)  # 들짐승과 날짐승의 교집합

{'박쥐'}

In [14]:
들짐승.intersection(바다생물)  # 짐승과 바다생물의 교집합

set()

In [15]:
# 차집합 구하기

짐승.difference(날짐승)  # 짐승에서 날짐승을 뺀 집합

{'곰', '늑대', '사자'}

In [16]:
# - 연산자로 차집합 구하기

날짐승 - 들짐승  # 날짐승에서 들짐승을 뺀 집합

{'독수리', '매'}

In [18]:
# ^ 연산자로 대칭차 구하기

들짐승 ^ 날짐승  # 들짐승과 날짐승의 대칭차

{'곰', '늑대', '독수리', '매', '사자'}

In [19]:
# 부분집합 검사하기

들짐승.issubset(짐승)    # 들짐승이 짐승의 부분집합인가?

True

In [20]:
# 부분집합 검사하기

들짐승 <= 짐승

True

In [21]:
들짐승 <= 날짐승

False

In [22]:
# 서로소 집합 검사하기

들짐승.isdisjoint(날짐승)

False

In [23]:
들짐승.isdisjoint(바다생물)

True

### 원소 변경하기

 - 집합은 수정 가능한 데이터
 
 - 이미 정의한 집합에 원소를 추가하거나 삭제할 수 있음
 
 - 다음과 같은 메서드를 사용

 > - add(데이터): 데이터를 원소로 추가
 >
 > - discard(원소): 원소 제거
 >
 > - remove(원소): 원소 제거 (원소가 없으면 오류)
 >
 > - pop(): 아무 원소나 꺼낸다 (집합이 비어있으면 오류)
 >
 > - clear(): 모든 원소를 제거

In [24]:
# 집합 원소 수정하기

들짐승.add('인간')      # 들짐승에 인간 추가
들짐승

{'곰', '늑대', '박쥐', '사자', '인간'}

In [25]:
들짐승.discard('인간')  # 인간 제거
들짐승

{'곰', '늑대', '박쥐', '사자'}

In [26]:
들짐승.remove('곰')     # 곰 제거
들짐승

{'늑대', '박쥐', '사자'}

In [27]:
들짐승.pop()            # 아무 원소나 꺼내기

'사자'

In [29]:
들짐승

{'늑대', '박쥐'}

In [30]:
들짐승.clear()          # 모든 원소 제거
들짐승

set()