# 파이썬 heapq

* 파이썬 heapq 모듈은 heapq (priority queue) 알고리즘을 제공
    * 내부적으로는 인덱스 0에서 시작해 k번째 원소가 항상 자식 원소들(2k+1, 2k+2) 보다  
      작거나 같은 최소 힙의 형태로 정렬  

### 힙의 특징
    * 데이터 삽입, 삭제의 시간복잡도가 모두 : O(logN) 임
    * 리스트의 경우: 삽입=O(1), 삭제=O(N)


### heapq 모듈 주요 기능
 * heapq.heappush(heap, item) : item을 heap에 추가
     * heappush() 시간복잡도 : O(logN)
 * heapq.heappop(heap)
     + heap에서 가장 작은 원소를 pop & 리턴. 비어 있는 경우 IndexError가 호출됨. 
     * 부모가 최솟값이므로 부모가 빠쪄나오고 새로운 최솟값이 부모가 됨
     * heappop() 시간복잡도 : O(logN)
 * heapq.heapify(x) : 리스트 x를 즉각적으로 heap으로 변환함 (in linear time, O(N) )

 * 빈 리스트에 힙 구조로 값 추가

In [1]:
import heapq

heap = []
heapq.heappush(heap, 50)
heapq.heappush(heap, 10)
heapq.heappush(heap, 20)

print(heap)   # 가장 작은 값이 부모 노드로 옮겨짐

[10, 50, 20]


 * 기존의 리스트를 최소 힙 구조로 변경

In [2]:
h = [50, 89, 13, 20, 62, 31, 14]

heapq.heapify(h)

h

[13, 20, 14, 89, 62, 31, 50]

 * heappop() 연산
     * 최솟값이 부모가 빠져나오고, 
     * 나머지 중 최솟값이 다시 부모로 변경됨

In [3]:
h = [13, 20, 14, 89, 62, 31, 50]

result = heapq.heappop(h)

print(result)
print(h)

13
[14, 20, 31, 89, 62, 50]


 * 최솟값을 삭제하지 않고 가져오기  => [0] 인덱싱 이용

In [4]:
h = [13, 20, 14, 89, 62, 31, 50]

print(h[0])
print(h)

13
[13, 20, 14, 89, 62, 31, 50]


# 최대 힙 만들기

## 모든 값에 -를 붙이고 heap에 넣은 뒤, -를 빼면 됨!!!

In [6]:
h = [1, 3, 5, 7, 9]

max_heap = []
for i in h:
    heapq.heappush(max_heap, (-i, i))
    
print(max_heap)

[(-9, 9), (-7, 7), (-3, 3), (-1, 1), (-5, 5)]


 => 이렇게 튜플 형태로 넣어 놓고 값을 접근 할 때는 인덱싱[1]을 이용해서 출력

In [7]:
max_item = heapq.heappop(max_heap)[1]
print(max_item)

9


# 힙정렬 구현하기

    * 힙을 이용한 정렬 임
    * 그냥 데이터를 힙에 넣었다가 빼서 출력하면 끝
    * 시간복잡도 : O(NlogN)

In [2]:
import heapq

def heapsort(iterable):
    h = []
    result = []
    
    for i in iterable:
        heapq.heappush(h, i)
        
    for i in range(len(h)):
        result.append(heapq.heappop(h))
        
    return result

a = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(a)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


* 내림차순 정렬

In [3]:
import heapq

def heapsort(iterable):
    h = []
    result = []
    
    for i in iterable:
        heapq.heappush(h, -i)    # 넣을 때, 음수로 넣고(역으로 정렬하기 위함)
        
    for i in range(len(h)):
        result.append(-heapq.heappop(h)) # 뺄 때, 다시 음수로 뺀다(원래 값으로 돌려주기 위함)
        
    return result

a = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(a)

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


## 예제 (최솟값을 계속 뽑아내야 하는 문제)

### [예제] 주어진 리스트의 모든 값이 T 이상이 될 때까지 최솟값 두 개를 합치기

* N개의 비커에 액체가 담겨 있다. 
* 모든 비커에 있는 액체의 양이 T 이상이 될 때까지, 액체가 가장 적게 담긴 두 비커의 액체를 합쳐가려 한다.
* 각각의 비커에 담겨있는 액체의 양을 표기한 리스트 L과 기준 T가 주어질 때, 
* 모든 비커의 양이 T 이상이 될 때까지 필요한 작업 횟수를 리턴하는 함수를 구현해보자. 
* (구현할 수 없는 경우 -1을 리턴)


T = 4  

L = [1, 2, 3, 4, 5, 6, 7]

step1. [1, 2]를 합침
    => [3, 3, 4, 5, 6, 7]
    
step2. [3, 3]을 합침
    => [6, 4, 5, 6, 7]
    
=> 모든 비커의 액체의 양이 기준인 4보다 크므로 STOP

In [14]:
import heapq

T = 4
L = [1, 2, 3, 4, 5, 6, 7]

cnt = 0   # 작업횟수

if T > sum(L):
    cnt = -1
    
else:
    heapq.heapify(L)

    while(L[0] < T):
        min_1 = heapq.heappop(L)
        min_2 = heapq.heappop(L)
        heapq.heappush(L, min_1+min_2)
        cnt +=1


    
print(cnt)

2


In [16]:
import heapq

T = 50
L = [3, 5, 1, 8, 3, 2, 1, 9]

cnt = 0   # 작업횟수

if T > sum(L):
    cnt = -1
    
else:
    heapq.heapify(L)

    while(L[0] < T):
        min_1 = heapq.heappop(L)
        min_2 = heapq.heappop(L)
        heapq.heappush(L, min_1+min_2)
        cnt +=1


    
print(cnt)

-1
