## 컬렉션 자료구조

### 셋(SET)

### 시간 복잡도 참고

- 삽입 시간복잡도 O(1)
- 합집합의 시간 복잡도 O(m+n)
- 교집합 O(n)

### 프로즌 셋
- 불변 객체, 셋에서 사용할 수 있는 일부 메서드를 사용할 수 없다.

In [3]:
fs = frozenset((0,1,2,3,4))

In [4]:
2 in fs

True

In [5]:
len(fs)

5

### 셋 메서드

### add()
- A.add(x)는 셋 A에 x가 없는 경우 x를 추가한다.

In [8]:
people = {"버피","에인절","자일스"}
people.add("윌로")
people

{'버피', '에인절', '윌로', '자일스'}

### update()
- A.update(B) 혹은 A|=B는 A를 B에 추가한다(합집합)

In [14]:
people = {"버피","에인절","자일스"}
people.update({"로미오","줄리엣","에인절"})

In [10]:
people

{'로미오', '버피', '에인절', '자일스', '줄리엣'}

In [11]:
people |= {"리키","유진"}

In [12]:
people

{'로미오', '리키', '버피', '에인절', '유진', '자일스', '줄리엣'}

### union()
- A.union()와 A|B는 앞에서 본 update() 메서드와 같지만, 연산 결과를 복사본으로 반환합니다.

In [15]:
people = {"버피","에인절","자일스"}
people.union({"로미오","줄리엣"})

{'로미오', '버피', '에인절', '자일스', '줄리엣'}

In [16]:
people

{'버피', '에인절', '자일스'}

In [17]:
people | {"브라이언"}

{'버피', '브라이언', '에인절', '자일스'}

### intersection()과 & 연산자
- A.intersection(B)와 A & B 의 교집합의 복사본을 반환합니다.

In [19]:
people = {"버피","에인절","자일스","이안"}
vampires = {"에인절","자일스","윌로"}
people.intersection(vampires)

{'에인절', '자일스'}

In [20]:
people & vampires

{'에인절', '자일스'}

### difference()와 - 연산자
- A.difference(B)와 A-B는 A와 B의 차집합의 복사본을 반환합니다.

In [22]:
people = {"버피","에인절","자일스","아영"}
vampires = {"스파이크","에인절","상민"}
people.difference(vampires)

{'버피', '아영', '자일스'}

In [23]:
people-vampires

{'버피', '아영', '자일스'}

### clear()
- A.clear()는 A의 모든 항목을 제거합니다.

In [24]:
people = {"버피","자일스","에인절"}
people.clear()
people

set()

### discard(),remove(),pop()
- A.discard(x)는 A의 항목 X를 제거하며 반환값은 없습니다.
- A.remove()는 A.discard()와 같지만, 항목 x가 없을 경우 KeyError 예외를 발생시킵니다.
- A.pop()는 A에서 한 항목을 무작위로 제거하고 그 항목을 반환합니다. Set이 비어있으면 KeyError 예외를 발생시킵니다.

In [25]:
countires = {"프랑스","스페인","영국"}
countires.discard("한국")

In [26]:
countires.remove("일본")

KeyError: '일본'

In [27]:
countires.pop()

'스페인'

In [28]:
countires.discard("스페인")

In [29]:
countires.remove("영국")

In [30]:
countires.pop()

'프랑스'

In [31]:
countires.pop()

KeyError: 'pop from an empty set'

# 딕셔너리

- 딕셔너리는 해시 테이블로 구현되어 있습니다. 해시 함수는 특정 객체에 해당하는 임의의 정수 값을 상수 시간 내에 계산합니다. 이 정수는 연관 배열의 인덱스로 사용 됩니다.

### 딕셔너리 선언 방법

In [32]:
tarantino = {}

In [33]:
tarantino['name'] = '쿠엔틴 타란티노'
tarantino['job'] = '감독'

In [34]:
tarantino

{'name': '쿠엔틴 타란티노', 'job': '감독'}

In [35]:
sunnydale = dict({"name":"버피","age":16,"hobby":"게임"})

In [36]:
sunnydale

{'name': '버피', 'age': 16, 'hobby': '게임'}

In [38]:
new_dict = dict(name="자일스",age=45,hobby="영화감상")

In [39]:
new_dict

{'name': '자일스', 'age': 45, 'hobby': '영화감상'}

In [40]:
tuple_dict = dict([("name","윌로"),("age",15),("hobby","개발")])

In [41]:
tuple_dict

{'name': '윌로', 'age': 15, 'hobby': '개발'}

### setdefault()
- setdefault()는 딕셔너리에서 키의 존재 여부를 모른 채 접근 할 때 사용됩니다.
- A.setdefault(key,default)를 사용하면 딕셔너리 A에 key가 존재할 경우 키에 해당하는 값을 얻을 수 있고, key가 존재하지 않는다면, 새 키와 기본값 default가 딕셔너리에 저장됩니다.

### update()
- A.update(B)는 딕셔너리 A에 딕셔너리 B의 키가 존재한다면, 기존 A의 (키,값)을 B의(키,값)으로 갱신합니다.
- 만약 B의 키가 A에 존재하지 않는다면, B의(키,값)을 A에 추가합니다.

In [42]:
d = {'a':1,'b':2}
d.update({'b':10})

In [43]:
d

{'a': 1, 'b': 10}

In [44]:
d.update({'c':100})

In [45]:
d

{'a': 1, 'b': 10, 'c': 100}

### get()
- A.get(key)는 딕셔너리 A의 key값을 반환한다. key가 존재하지 않으면 아무것도 반환하지 않는다.

In [46]:
sunnyable = dict(name="잰더",age=17,hobby="게임")
sunnyable.get("hobby")

'게임'

In [47]:
sunnyable['hobby']

'게임'

In [48]:
sunnyable.get("hello")

In [50]:
sunnyable["hello"]

KeyError: 'hello'

### items(),values(),keys()
- items(), keys(), values() 메서드는 딕셔너리 뷰다. 딕셔너리 뷰란 딕셔너리의 항목(키 또는 값)을 조회하는 읽기 전용의 반복 가능한 객체다.

In [51]:
sunnyable = dict(name="잰더",age=17,hobby="게임")
sunnyable.items()

dict_items([('name', '잰더'), ('age', 17), ('hobby', '게임')])

In [52]:
sunnyable.keys()

dict_keys(['name', 'age', 'hobby'])

In [53]:
sunnyable.values()

dict_values(['잰더', 17, '게임'])

### pop(), popitem()
- A.pop(key)는 딕셔너리 A의 key 항목을 제거한 후, 그 값을 반환합니다.
- A.popitem()은 딕셔너리 A에서 항목(키와 값)을 제거한 후, 그 키와 항목을 반환합니다.

In [54]:
sunnyable = dict(name="잰더",age=17,hobby="게임")
sunnyable.pop("age")

17

In [55]:
sunnyable.popitem()

('hobby', '게임')

In [56]:
sunnyable

{'name': '잰더'}

### 카운터 딕셔너리
- 카운터 타입은 해시 가능한 객체를 카운팅하는 특화된 서브클래스 입니다.

In [61]:
from collections import Counter
def counter_example():
    """항목의 발생 횟수를 매핑하는 딕셔너리를 생성합니다."""
    seq1 = [1,2,3,5,1,2,5,5,2,5,1,4]
    seq_counts = Counter(seq1)
    print(seq_counts)
    
    """ 항목의 발생 횟수를 수동으로 갱신하거나, update() 메서드를 사용할 수 있습니다."""
    seq2 =[1,2,3]
    seq_counts.update(seq2)
    print(seq_counts)
    
    seq3 = [1,4,3]
    for key in seq3:
        seq_counts[key] +=1
    print(seq_counts)
    
    """ a+b, a-b 같은 Set 연산을 사용할 수 있습니다."""
    seq_counts_2 = Counter(seq3)
    print(seq_counts_2)
    print(seq_counts+seq_counts_2)
    print(seq_counts-seq_counts_2)

In [62]:
counter_example()

Counter({5: 4, 1: 3, 2: 3, 3: 1, 4: 1})
Counter({1: 4, 2: 4, 5: 4, 3: 2, 4: 1})
Counter({1: 5, 2: 4, 5: 4, 3: 3, 4: 2})
Counter({1: 1, 4: 1, 3: 1})
Counter({1: 6, 2: 4, 3: 4, 5: 4, 4: 3})
Counter({1: 4, 2: 4, 5: 4, 3: 2, 4: 1})
