참고 : https://dbader.org/blog/priority-queues-in-python

참고 : http://www.daleseo.com/python-heapq/

## heapq

List 타입을 가지고 그대로 사용하며, **min heap**으로만 구현해준다. max heap은 따로 구현해야 함

데이터의 삽입, 삭제는 O(log N)의 복잡도를 가진다.

참고 : 항상 heapq.함수명 형태로 사용해야 한다.

In [18]:
import heapq

#### heapify : 먼저, list를 heap 형태로 정렬

In [19]:
h=[7,8,3,2,1,9,12]

heapq.heapify(h)

In [20]:
print(h)
print(type(h))

[1, 2, 3, 7, 8, 9, 12]
<class 'list'>


In [21]:
show_tree(h) # 맨 아래 show_tree 함수 정의


                 1                  
        2                 3         
    7        8        9        12   
------------------------------------



#### 삽입 및 삭제

In [22]:
heapq.heappush(h, 4) # heap의 마지막 node로 삽입 후 parent node와 비교
show_tree(h)


                 1                  
        2                 3         
    4        8        9        12   
 7  
------------------------------------



In [23]:
heapq.heappop(h) # heap의 root 삭제 후 마지막 node를 root로 올린 후 min-heapify
show_tree(h) 


                 2                  
        4                 3         
    7        8        9        12   
------------------------------------



#### ( 우선순위, 데이터 ) 형태 - 첫번째 원소를 우선순위로 인식

tuple을 활용하면 첫번째, 두번째, 세번째 원소 순으로 비교를 한다. (value가 같으면 다음 요소)

When you put the objects (i.e. tuples) into heap, it will compare the first attribute in the object to compare. If a tie happens, heap wills use the next attribute (i.e. value_1) and so on.

In [9]:
import heapq
h = [(3, "Go to home"), (10, "Do not study"), (1, "Enjoy!"), (4, "Eat!"), (7, "Pray!")]

heapq.heapify(h)
print(h)

[(1, 'Enjoy!'), (4, 'Eat!'), (3, 'Go to home'), (10, 'Do not study'), (7, 'Pray!')]


###  max-heap 구현

#### 1. 모든 값에 -1을 곱해서 활용

pop 또는 push 할 때도 -1을 곱하면 된다.

In [41]:
h=[7,8,3,2,1,9,12]
h=list(map(lambda x:x*-1, h))

In [42]:
heapq.heapify(h)
show_tree(h)


                -12                 
        -8                -9        
    -2       -1       -7       -3   
------------------------------------



In [43]:
print( -heapq.heappop(h) )

12


In [44]:
show_tree(h)


                 -9                 
        -8                -7        
    -2       -1       -3   
------------------------------------



#### 2. heapq의 함수 활용

heapify와 pop은 제공하지만 **heappush**는 함수로 제공하지 않아서 삽입 node에 대한 새로 정의가 필요하다.

In [125]:
h=[7,8,3,2,1,9,12]

heapq._heapify_max(h)

In [126]:
show_tree(h)


                 12                 
        8                 9         
    2        1        7        3    
------------------------------------



In [127]:
heapq._heappop_max(h)

12

In [128]:
show_tree(h)


                 9                  
        8                 7         
    2        1        3    
------------------------------------



#### push를 적용하기 위한 새로운 node 정의

heappush 함수는 삽입한 원소가 작으면 ( < ) parent와 교환하기 때문에 반대 연산을 수행하도록 연산자를 정의한다.

In [132]:
class MaxHeapNode:
    def __init__(self, val): self.val = val
    def __lt__(self, other): return self.val > other.val # < 연산자를 정의
    def __str__(self): return str(self.val)

In [133]:
MaxHeapNode(5) < MaxHeapNode(3) # True가 False로 바뀌었다.

True

In [139]:
h=[]
for i in [7,8,3,2,1,9,12]:
    heapq.heappush(h, MaxHeapObj(i))

In [140]:
heapq.heappush(h, MaxHeapObj(6))

In [141]:
show_tree(h)


                 1                  
        2                 7         
    6        3        9        12   
 8  
------------------------------------



## Priority Queue

내부적으로 heapq 라이브러리로 구현되어 있으며, lock을 추가로 지원하는 라이브러리

참고 : lock이 유용하지 않은 경우에는 불필요한 overhead로 인해 속도가 느릴 수 있음

In [1]:
from queue import PriorityQueue

q = PriorityQueue()

#### 삽입 및 삭제

In [2]:
h=[5,8,3,2,1,9,12]
for node in h:
    q.put(node)

In [3]:
print( q.queue ) # queue 확인 가능
print( q.qsize() )

[1, 2, 5, 8, 3, 9, 12]
7


In [4]:
print( q.get() )
print( q.qsize() )

1
6


In [5]:
while not q.empty():
    next_item = q.get()
    print(next_item)

2
3
5
8
9
12


heap을 보여주는 함수

In [1]:
import math
from io import StringIO

def show_tree(tree, total_width=36, fill=' '):
    """Pretty-print a tree."""
    output = StringIO()
    last_row = -1
    for i, n in enumerate(tree):
        if i:
            row = int(math.floor(math.log(i+1, 2)))
        else:
            row = 0
        if row != last_row:
            output.write('\n')
        columns = 2**row
        col_width = int(math.floor((total_width * 1.0) / columns))
        output.write(str(n).center(col_width, fill))
        last_row = row
    print(output.getvalue())
    print('-' * total_width)
    print()
    return