# Heap 자료구조

In [None]:
부모 노드 인덱스 번호 (parent node's index)
                = 자식 노드 인덱스 번호 (child node's index) // 2
왼쪽 자식 노드 인덱스 번호 (left child node's index) 
                = 부모 노드 인덱스 번호 (parent node's index) * 2
오른쪽 자식 노드 인덱스 번호 (right child node's index) 
                = 부모 노드 인덱스 번호 (parent node's index) * 2 + 1

In [3]:
# 힙 구현해보기 swap 구현

class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 인덱스 번호는 1번부터
        self.heap_array.append(data)

    def move_up(self, inserted_idx):
        if inserted_idx <= 1:
            return False
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False

    def insert(self, data):
        if len(self.heap_array) == 1:
            self.heap_array.append(data)
            return True
        
        self.heap_array.append(data)
        inserted_idx = len(self.heap_array) - 1
        
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
            inserted_idx = parent_idx
            
        return True

In [5]:
# 구현한 최대 힙 사용하기

heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.heap_array

[None, 20, 10, 15, 5, 4, 8]

In [None]:
# 힙 구현해보기 delete 구현!

class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 인덱스 번호는 1번부터
        self.heap_array.append(data)

    def pop(self):
        if len(self.heap_array) <= 1:
            return None
        
        returned_data = self.heap_array[1]
        return returned_data

In [6]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) # 인덱스 번호는 1번부터
        self.heap_array.append(data)

    def move_down(self, popped_idx):
        left_child_popped_idx = popped_idx * 2
        right_child_popped_idx = popped_idx * 2 + 1
        if left_child_popped_idx >= len(self.heap_array):
            return False
        elif right_child_popped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                return True
            else:
                return False
        else:
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            else:
                if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                    return True
                else:
                    return False
        
    def pop(self):
        if len(self.heap_array) <= 1:
            return None
        
        returned_data = self.heap_array[1]
        self.heap_array[1] = self.heap_array[-1]
        del self.heap_array[-1]
        popped_idx = 1
        
        while self.move_down(popped_idx):
            left_child_popped_idx = popped_idx * 2
            right_child_popped_idx = popped_idx * 2 + 1
            if right_child_popped_idx >= len(self.heap_array):
                self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                poppoed_idx = left_child_popped_idx
            else:
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                    self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                    poppoed_idx = left_child_popped_idx
                else:
                    self.heap_array[popped_idx], self.heap_array[right_child_popped_idx] = self.heap_array[right_child_popped_idx], self.heap_array[popped_idx]
                    poppoed_idx = right_child_popped_idx
        
        return returned_data
    
    
    def move_up(self, inserted_idx):
        if inserted_idx <= 1:
            return False
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False

    def insert(self, data):
        if len(self.heap_array) == 1:
            self.heap_array.append(data)
            return True
        
        self.heap_array.append(data)
        inserted_idx = len(self.heap_array) - 1
        
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
            inserted_idx = parent_idx
        return True

In [7]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.heap_array

[None, 20, 10, 15, 5, 4, 8]

In [8]:
heap.pop()

20

In [9]:
heap.heap_array


[None, 15, 10, 8, 5, 4]

## 힙 (Heap) 시간 복잡도

- depth (트리의 높이) 를 h라고 표기한다면,
- n개의 노드를 가지는 heap 에 데이터 삽입 또는 삭제시,
- 최악의 경우 root 노드에서 leaf 노드까지 비교해야 하므로 h=log2n 에 가까우므로,
- 시간 복잡도는 O(logn)


- 참고: 빅오 표기법에서 logn 에서의 log의 밑은 10이 아니라, 2입니다.
- 한번 실행시마다, 50%의 실행할 수도 있는 명령을 제거한다는 의미. 즉 50%의 실행시간을 단축시킬 수 있다는 것을 의미함







# 힙 라이브러리 heapq

In [None]:
# 힙공식
heap[k] <= heap[2*k+1] and heap[k] <= heap[2*k+2]

In [18]:
import heapq as h



In [30]:
heap = []

## 힙 push 메서드 
heapq.heapush(리스트, 인자)

In [31]:
h.heappush(heap, 4)
h.heappush(heap, 1)
h.heappush(heap, 7)
h.heappush(heap, 3)
print(heap)

[1, 3, 7, 4]


## 힙 pop 메서드 
heapq.heapush(리스트, 인자)

In [32]:
print(heapq.heappop(heap))
print(heap)

1
[3, 4, 7]


## 최소값 삭제하지 않고 얻기. (단순히 읽기)

In [33]:
print(heap[0])

3


여기서 주의사항은 인덱스 0에 가장 작은 원소가 있다고 해서, 인덱스 1에 두번째 작은 원소, 인덱스 2에 세번째 작은 원소가 있다는 보장은 없다는 것입니다.
왜냐하면 힙은 heappop() 함수를 호출하여 원소를 삭제할 때마다 이진 트리의 재배치를 통해 매번 새로운 최소값을 인덱스 0에 위치시키기 때문입니다.

따라서 **두번째로 작은 원소를 얻으려면 바로** heap[1]으로 접근하면 안되고, `반드시 heappop()을 통해 가장 작은 원소를 삭제 후`에 heap[0]를 통해 새로운 최소값에 접근해야 합니다.

## 기존 리스트를 힙으로 변환

## 힙 heapify 메서드
heapq.heapify(리스트)

In [38]:
heap = [4, 1, 7, 3, 8, 5]
heapq.heapify(heap)
print(heap)

[1, 3, 5, 4, 8, 7]


# [응용] 최대힙

바로 힙에 튜플(tuple)를 원소로 추가하거나 삭제하면, 튜플 내에서 맨 앞에 있는 값을 기준으로 최소 힙이 구성되는 원리를 이용하는 것입니다.

따라서, 최대 힙을 만들려면 각 값에 대한 우선 순위를 구한 후, (우선 순위, 값) 구조의 튜플(tuple)을 힙에 추가하거나 삭제하면 됩니다.
그리고 힙에서 값을 읽어올 때는 각 튜플에서 인덱스 1에 있는 값을 취하면 됩니다. (우선 순위에는 관심이 없으므로 )




In [42]:
import heapq

nums = [4, 1, 7, 3, 8, 5]
heap = []

for num in nums:
    heapq.heappush(heap, (-num, num))  # (우선 순위, 값)

while heap:
    print(heapq.heappop(heap)[1])  # index 1

8
7
5
4
3
1


# [응용] K번째 최소값 / 최대값
최소 힙이나 최대 힙을 사용하면 K번째 최소값이나 최대값을 효츌적으로 구할 수 있습니다.

In [44]:
import heapq

def kth_smallest(nums, k):
    heap = []
    for num in nums:
        heapq.heappush(heap, num)

    kth_min = None
    for _ in range(k):
        kth_min = heapq.heappop(heap)
    return kth_min

print(kth_smallest([4, 1, 7, 3, 8, 5], 3))

4


# [응용] 힙정렬


In [45]:
import heapq

def heap_sort(nums):
    heap = []
    for num in nums:
        heapq.heappush(heap, num)
  
    sorted_nums = []
    while heap:
        sorted_nums.append(heapq.heappop(heap))
    return sorted_nums

print(heap_sort([4, 1, 7, 3, 8, 5]))

[1, 3, 4, 5, 7, 8]


# 프로그래머스 더 맵게

섞은 음식의 스코빌 지수 =
가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2)

In [174]:
# 1차 시도, (실패)
import heapq as h

def mix(a, b):
    return a + (b*2)

def solution(scoville, K):
    answer = 0
    #힙으로 만듬
    h.heapify(scoville)
    
    # k값을 못넘는지 확인
    for i in scoville :
        if len(scscovilleoville) >= 2:
            if i < K:  # 못넘을 때
                a = h.heappop(scoville)
                b = h.heappop(scoville)
                h.heappush(scoville, mix(a,b))
                answer += 1

            else: # 넘을 때,
                break
        else:
            answer = -1
            break
    return answer

In [169]:
# 2차시도, 인덱스를 len() 체크하지 않고, try-except로 체크함.
import heapq as h
def solution(scoville, K):
    answer = 0
    #힙으로 만듬
    h.heapify(scoville)
    
    while scoville[0] < K:
        try:
            h.heappush(scoville, h.heappop(scoville) + (h.heappop(scoville) * 2))
        except IndexError:
            return -1
        answer += 1

    return answer

In [None]:
# 원래 내가 시도하려던 로직의 다른사람 풀이 

import heapq as hq

def solution(scoville, K):

    hq.heapify(scoville)
    answer = 0
    while True:
        first = hq.heappop(scoville)
        if first >= K:
            break
        if len(scoville) == 0:
            return -1
        second = hq.heappop(scoville)
        hq.heappush(scoville, first + second*2)
        answer += 1  

    return answer

In [171]:
# 1차 시도를 로직 수정
import heapq as h

def mix(a, b):
    return a + (b*2)

def solution(scoville, K):
    answer = 0
    #힙으로 만듬
    h.heapify(scoville)
    
    # k값을 못넘는지 확인
    while True:
        a = h.heappop(scoville)
        if a >= K:
            break
        # scoville크기가 0이라면,   
        if len(scoville) == 0:
            return -1
        b = h.heappop(scoville)
        h.heappush(scoville, mix(a,b))
        answer += 1
        
    return answer

## 속도는 try - except IndexError가 훨씬 빠르다. 