# Chapter 3  컬렉션 자료구조
- 컬렉션 자료구조는 시퀀스 자료구조와 달리 데이터를 서로 연관시키지 않고 모아두는 컨테이너
- 세가지 속성
    * 멤버십 연산자: in
    * 크기 함수: len(seq)
    * 반복성
- 파이썬 내장 컬렉션 데이터 타입으로는 set과 dict이 존재

# 3.1 Set
- 반복 가능, 가변적, 중복 요소 없고, 정렬되지 않은 컬렉션 데이터 타입
- 인덱스 연산 불가
- 멤버십 테스트 및 중복 항목 제거에 사용
- 삽입 시간복잡도는 O(1)이고, 합집합의 시간복잡도는 O(m+n)
- 교집합 시간복잡도는 더 작은 셋에 대해서만 계산하면 되므로 시간복잡도는 O(n)

In [1]:
dir(set())

['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

In [2]:
dir(frozenset())  # frozenset은 불변 객체

['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'copy',
 'difference',
 'intersection',
 'isdisjoint',
 'issubset',
 'issuperset',
 'symmetric_difference',
 'union']

In [3]:
fs = frozenset((0, 1, 2, 3, 4))
2 in fs

True

In [4]:
len(fs)

5

## 3.1.1 셋 메서드

In [5]:
# A.add(x): 셋 A에 x가 없는 경우 x를 추가
people = {"버피", "에인절", "자일스"}
people.add("윌로")
people

{'버피', '에인절', '윌로', '자일스'}

In [6]:
# A.update(B) 혹은 A |= B는 A를 B에 추가한다(합집합)
people = {"버피", "에인절", "자일스"}
people.update({"로미오", "줄리엣", "에인절"})
people

{'로미오', '버피', '에인절', '자일스', '줄리엣'}

In [7]:
people |= {"리키", "유진"}
people

{'로미오', '리키', '버피', '에인절', '유진', '자일스', '줄리엣'}

In [8]:
# A.union(B)와 A | B는 앞에서 본 update() 메서드와 같지만, 연산 결과를 복사본으로 반환한다.
people = {"버피", "에인절", "자일스"}
people.union({"로미오", "줄리엣"})

{'로미오', '버피', '에인절', '자일스', '줄리엣'}

In [9]:
people   # people은 원형 그대로 유지

{'버피', '에인절', '자일스'}

In [10]:
people | {"브라이언"}

{'버피', '브라이언', '에인절', '자일스'}

In [11]:
people   # people은 원형 그대로 유지

{'버피', '에인절', '자일스'}

In [12]:
# A.intersection(B)와 A & B는 A와 B의 교집합의 복사본을 반환
people = {"버피", "에인절", "자일스", "이안"}
vampires = {"에인절", "자일스", "윌로"}
people.intersection(vampires)

{'에인절', '자일스'}

In [13]:
people & vampires

{'에인절', '자일스'}

In [14]:
# A.difference(B)와 A - B는 A와 B의 차집합의 복사본을 반환
people = {"버피", "에인절", "자일스", "아영"}
vampires = {"스파이크", "에인절", "상민"}
people.difference(vampires)

{'버피', '아영', '자일스'}

In [15]:
people - vampires

{'버피', '아영', '자일스'}

In [16]:
# A.clear()는 A의 모든 항목을 제거
people = {"버피", "에인절", "자일스", "아영"}
people.clear()
people

set()

In [17]:
# A.discard(x)는 A의 항목 x를 제거하며 반환값은 없음
# A.remove()는 A.discard()와 같지만 항목 x가 없을 경우 KeyError 예외 발생
# A.pop()은 A에서 한 항목을 무작위로 제거하고 그 항목을 반환, 셋이 비어 있으면 KeyError 예외 발생
countries = {"프랑스", "스페인", "영국"}
countries.discard("한국")

In [18]:
countries.remove("일본")

KeyError: '일본'

In [19]:
countries.pop()  # 무작위

'스페인'

In [20]:
countries

{'영국', '프랑스'}

In [21]:
countries.discard("프랑스")

In [22]:
countries.remove("영국")

In [23]:
countries.pop()

KeyError: 'pop from an empty set'

# 3.2 딕셔너리
- 파이썬 딕셔너리는 해시 테이블로 구현
- 해시 함수는 특정 객체에 해당하는 임의의 정수 값을 상수 시간 내에 계산(?)

In [24]:
hash(42)

42

In [25]:
hash("hello")

3068040838128048813

- 컬렉션 매핑 타입인 딕셔너리는 반복 가능
- 멤버십 연산자 in과 len() 함수 지원
- 매핑은 key-value 항목의 컬렉션

- 딕셔너리의 항목은 고유하므로, 항목에 접근하는 시간복잡도는 O(1)
- 딕셔너리는 변경 가능하므로 항목의 추가 및 제거 가능
- 딕셔너리는 항목의 삽입 순서를 기억하지 않으며, 인덱스 위치 사용 불가

In [26]:
tarantino = {}
tarantino['name'] = '쿠엔틴 타란티노'
tarantino['job'] = '감독'
tarantino

{'name': '쿠엔틴 타란티노', 'job': '감독'}

In [27]:
sunnydale = dict({"name":"버피", "age":16, "hobby":"게임"})
sunnydale

{'name': '버피', 'age': 16, 'hobby': '게임'}

In [28]:
sunnydale = dict(name="자일스", age=45, hobby="영화감상")
sunnydale

{'name': '자일스', 'age': 45, 'hobby': '영화감상'}