작성일자: 2022-08-09<br>
작성자: 김동연

In [1]:
from collections import deque, OrderedDict, defaultdict
from random import randint
from heapq import *
from bisect import bisect_left
from itertools import *
import time

## 더블 앤디드 큐
collections 모듈의 deque 클래스는 double-ended queue다.<br>
이 클래스는 큐의 처음과 끝에서 아이템의 삭제와 삽입에 대하여 항상 일정한 시간이 걸리는 연산을 제공한다.<br>
리스트는 시작 부분에 아이템을 삭제하고 삽입하는데에는 linear한 시간이 걸리므로 deque가 더 유리한 점이 있다.

In [3]:
fifo = deque()
print(fifo)
fifo.append(1)
print(fifo)
fifo.append(2)
print(fifo)
x = fifo.popleft()
print(fifo)

deque([])
deque([1])
deque([1, 2])
deque([2])


In [4]:
print(x)

1


## 정렬된 딕셔너리
이전 버전의 Python3에서는 딕셔너리의 입력순서와 상관없이 딕셔너리가 정렬되었다.<br>
하지만 최신 버전의 python3의 딕셔너리는 입력순서에 따라 키와 밸류를 정렬한다.<br>
과거에는 순서대로 키를 순회하기 위해 Collections 모듈의 OrderedDirct 클래스를 사용했다.<br>
Ordereddict 클래스는 딕셔너리 사이의 비교에도 키의 순서를 고려하므로 더 엄밀한 딕셔너리의 사용이 필요한 프로그램에 적용 가능하다.

In [5]:
a = {}
a['foo'] = 1
a['bar'] = 2

In [6]:
b = {}
b['bar'] = 2
b['foo'] = 1

In [7]:
print(a)
print(b)
print('Equal?', a == b)

{'foo': 1, 'bar': 2}
{'bar': 2, 'foo': 1}
Equal? True


In [8]:
a = OrderedDict()
a['foo'] = 1
a['bar'] = 2

b = OrderedDict()
b['bar'] = 2
b['foo'] = 1

In [9]:
print(a)
print(b)
print('Equal?', a == b)

OrderedDict([('foo', 1), ('bar', 2)])
OrderedDict([('bar', 2), ('foo', 1)])
Equal? False


## 기본 딕셔너리
딕셔너리는 키가 존재하지 않으면 에러를 발생시키기 때문에 사용에 약간의 불편함이 생긴다.<br>
collections 모듈의 defaultdict 클래스는 키가 존재하지 않으면 자동으로 default값을 할당하여 이런 불편함을 줄여준다.<br>
같은 작업을 하는 프로그램이지만 더 단순화된 구현이 가능하다.

In [10]:
stats = {}
key = 'my_counter'
if key not in stats:
    stats[key] = 0
stats[key] += 1

In [11]:
stats = defaultdict(int)
stats['my_counter'] += 1

## 힙 큐
힙은 priority queue를 유지하는 유용한 자료 구조이다.<br>
heapq 모듈은 표준 list 타입으로 힙을 생성하는 함수를 제공한다.<br>
<br>
heappush 함수는 힙 불변성을 유지하면서 힙에 아이템을 삽입한다.

In [12]:
a = []
heappush(a, 5)
heappush(a, 3)
heappush(a, 7)
heappush(a, 4)

heappop 함수는 힙 불변성을 유지하면서 힙에서 아이템을 삭제한다.

In [13]:
print(heappop(a), heappop(a), heappop(a), heappop(a))

3 4 5 7


nsmallest 함수는 n개의 가장 작은 요소들을 보여준다.

In [14]:
a = []
heappush(a, 5)
heappush(a, 3)
heappush(a, 7)
heappush(a, 4)
assert a[0] == nsmallest(1, a)[0] == 3

In [15]:
print(nsmallest(2, a))

[3, 4]


list의 sort 메서드를 사용하여도 힙의 불변성이 잘 유지된다.

In [16]:
print('Before', a)
a.sort()
print('After', a)

Before [3, 4, 7, 5]
After [3, 4, 5, 7]


heap 연산은 리스트의 길이에 로그 형태로 비례해 증가한다.<br>
반면에 리스트로 같은 동작을 수행할 경우 리스트의 길이에 linear하게 비례해 증가한다.<br>
실행속도 측면에서 큰 이 점을 얻을 수 있다.

## 바이섹션
리스트의 인덱스 메서드는 linear하게 시간이 걸린다.<br>
반면에 bisect 모듈의 bisect_left 함수는 더 효율적인 바이너리 검색을 사용한다.<br>
시간 복잡도가 로그이기 때문에 검색에 걸리는 시간이 더 짧다는 것을 확인할 수 있다.

In [17]:
x = list(range(10**6))
start = time.time()
i = x.index(991234)
end = time.time()
print(end - start)

0.021055936813354492


In [18]:
start = time.time()
i = bisect_left(x, 991234)
end = time.time()
print(end - start)

0.0002162456512451172


## 이터레이터 도구
내장 모듈 itertools는 이터레이터를 구성하거나 다루는데 있어 유용한 함수를 제공한다.<br>
chain : iterable한 객체들은 하나의 이터레이터로 결합한다.<br>

In [19]:
list1 = [1, 2, 3, 4]
list2 = [8, 9, 10, 11]
list3 = [15, 16, 17]
chained_list = chain(list1, list2, list3)
print(list(chained_list))

[1, 2, 3, 4, 8, 9, 10, 11, 15, 16, 17]


cycle: iterable한 객체의 아이템을 계속 반복한다.

In [21]:
temp = 0
for i in cycle("123"):
    if temp > 7:
        break
    else:
        print(i, end=' ')
        temp = temp + 1

1 2 3 1 2 3 1 2 

tee: iterable한 객체를 여러 개의 독립된 이터레이터로 반환한다.

In [22]:
iter1, iter2, iter3 = tee(range(10), 3)

print(list(iter1))
print(list(iter1))

print(list(iter2))
print(list(iter2))

print(list(iter3))
print(list(iter3))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[]


zip_longest: 길이가 다른 iterable한 객체들에 대해 zip과 유사한 동작을 제공한다.

In [23]:
x = [1, 2, 3]
y = [4, 5, 6, 7]

zipped_1 = zip(x, y)
zipped_2 = zip_longest(x, y)
zipped_3 = zip_longest(x, y, fillvalue=0)

print(list(zipped_1))
print(list(zipped_2))
print(list(zipped_3))

[(1, 4), (2, 5), (3, 6)]
[(1, 4), (2, 5), (3, 6), (None, 7)]
[(1, 4), (2, 5), (3, 6), (0, 7)]


islice: iterable한 객체를 인덱싱한다.

In [25]:
print(list(islice(range(10), 5)))
print(list(islice(range(100), 0, 100, 10)))

[0, 1, 2, 3, 4]
[0, 10, 20, 30, 40, 50, 60, 70, 80, 90]


1. takewhile : predicate function이 True를 반환하는 동안 iterable한 객체의 아이템을 반환한다.
2. dropwhile : predicate function이 처음 False를 반환하고 iterable한 객체의 아이템을 반환한다.
3. filterfalse : predicate function이 False를 반환하는 iterable한 객체의 모든 아이템을 반환한다.

In [27]:
target_list = [1, 4, 6, 7, 11, 34, 66, 100, 1]
take_res = takewhile(lambda x: x < 10, target_list)
print('takewhile : ', list(take_res))
drop_res = dropwhile(lambda x: x < 10, target_list)
print('dropwhile : ', list(drop_res))
filt_res = filterfalse(lambda x: x % 2, target_list)
print('filterfalse : ', list(filt_res))

takewhile :  [1, 4, 6, 7]
dropwhile :  [11, 34, 66, 100, 1]
filterfalse :  [4, 6, 34, 66, 100]


product : iterable한 객체의 아이템들의 카테시안 곱을 반환한다.

In [28]:
example = ['가나다', 'abc', '123']
pd = list(product(*example))
print(pd)

[('가', 'a', '1'), ('가', 'a', '2'), ('가', 'a', '3'), ('가', 'b', '1'), ('가', 'b', '2'), ('가', 'b', '3'), ('가', 'c', '1'), ('가', 'c', '2'), ('가', 'c', '3'), ('나', 'a', '1'), ('나', 'a', '2'), ('나', 'a', '3'), ('나', 'b', '1'), ('나', 'b', '2'), ('나', 'b', '3'), ('나', 'c', '1'), ('나', 'c', '2'), ('나', 'c', '3'), ('다', 'a', '1'), ('다', 'a', '2'), ('다', 'a', '3'), ('다', 'b', '1'), ('다', 'b', '2'), ('다', 'b', '3'), ('다', 'c', '1'), ('다', 'c', '2'), ('다', 'c', '3')]


permutations: iterable한 객체의 아이템에 대해 임의의 길이의 순열을 반환한다.

In [29]:
example = [1, 2, 3]
perm = list(permutations(example, 2))
print(perm)

[(1, 2), (1, 3), (2, 1), (2, 3), (3, 1), (3, 2)]


combinations: iterable한 객체의 아이템에 대해 임의의 길이의 조합을 반환한다.