힙: 데이터에서 최대값과 최소값을 빠르게 찾기 위해 고안된 완전 이진 트리

힙을 사용하는 이유
- 배열에 데이터를 넣고, 최대값과 최소값을 찾으려면 O(n)이 걸리는 반면에
- 이에 반해, 힙에 데이터를 넣고, 최대값과 최소값을 찾으면, O($logn$)이 결림
- 우선순위 큐와 같이 최대값 또는 최소값을 빠르게 찾아야 하는 자료구조 및 알고리즘 구현 등에 활용됨

힙은 최대값을 구하기 위한 최대 힙과 최소값을 구하기 위한 최소 힙으로 분류될 수 있음

- 힙은 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 크거나 같다. (최대 힙의 경우)
- 최소 힙의 경우에는 반대
- 완전 이진 트리의 형태를 가짐 (데이터를 넣을 때 항상 왼쪽 최하단부 노드부터 채워가게 되어있음
- 이진 탐색 트리는 탐색을 위한 구조, 힙은 최대/최소값 검색을 위한 구조 중 하나이다.

## 힙 동작

힙에 데이터를 삽입하는 경우에는 먼저 완전이진트리 형식을 맞추어서 넣은 다음에
그 후에 삽입된 노드와 부모 노드와의 swap 과정을 반복하여 순서가 맞도록 한다.

힙에서 데이터를 제거하는 경우는 일반적으로 최상단 노드를 삭제하는 것이 일반적이며, 
최상단 노드를 제거시 가장 마지막에 추가한 값을 루트 노드로 올린 후에 자식 노드들 중 더 큰 값하고 swap함

## 힙의 구현

- 일반적으로 힙 구현시 배열 자료구조를 활용함.
- 배열은 인덱스가 0번부터 시작하지만, 힙 구현의 편의를 위해, root 노드 인덱스 번호를 1로 지정하면 구현이 좀 더 수월함
- 부모 노드 인덱스 번호 = 자식 노드 인덱스 번호 // 2
- 왼쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2
- 오른쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 *  2  + 1

In [168]:
# heap 구현
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None)
        self.heap_array.append(data)
        
    
    def move_up(self, inserted_idx):
        if inserted_idx <= 1:
            return False
        
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False
        
    def insert(self, data):
        if len(self.heap_array) == 0:
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        
        self.heap_array.append(data)
        
        inserted_idx = len(self.heap_array) - 1
        
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            self.heap_array[inserted_idx],  self.heap_array[parent_idx] = self.heap_array[parent_idx],  self.heap_array[inserted_idx]
            inserted_idx = parent_idx
        
        return True
    
    
    ## 노드 삭제 직접 구현
    def delete(self):
        import numpy as np
        
        if len(heap_array) == 1:
            return None
        
        max_num = self.heap_array[1]
        del self.heap_array[1]
        self.heap_array.insert(1, self.heap_array[-1])
        del self.heap_array[-1]
        
        current_index = 1
        children_indices = [current_index * 2, current_index * 2 + 1]
        
        while True:     
            if len(self.heap_array) - 1 < current_index * 2:
                break
            elif len(self.heap_array) - 1 == current_index * 2:
                if self.heap_array[current_index] < self.heap_array[children_indices[0]]:
                    self.heap_array[current_index], self.heap_array[children_indices[0]] = self.heap_array[children_indices[0]], self.heap_array[current_index]
                    break
                else:
                    break
            else:
                if self.heap_array[current_index] < max(self.heap_array[children_indices[0]], self.heap_array[children_indices[1]]):
                    selected_child_index = children_indices[np.argmax([self.heap_array[children_indices[0]], self.heap_array[children_indices[1]]])]
                    self.heap_array[current_index], self.heap_array[selected_child_index] = self.heap_array[selected_child_index], self.heap_array[current_index]
                    current_index = selected_child_index
                    children_indices = [current_index * 2, current_index * 2 + 1]
                else:
                    break
        
        return max_num

In [169]:
head = Heap(1)
head.heap_array

[None, 1]

In [170]:
heap = Heap(15)

for i in [10, 8, 5, 4, 20]:
    heap.insert(i)

print(heap.heap_array)

[None, 20, 10, 15, 5, 4, 8]


In [171]:
print(heap.heap_array)

[None, 20, 10, 15, 5, 4, 8]


In [182]:
heap.delete()

[None] 1 [2, 3]


4

In [183]:
heap.heap_array

[None]

In [None]:
3

In [70]:
## heap 직접 구현
class Heap:
    def __init__(self, data):
        self.data = [None, data]
    def insert(self, data):
        self.data.append(data)
        
        current_num = len(self.data) - 1
        parent_num = current_num // 2
 
        while self.data[current_num] > self.data[parent_num]:
            self.data[current_num], self.data[parent_num] = self.data[parent_num], self.data[current_num]
            current_num = parent_num
            parent_num = current_num // 2
            
            if parent_num == 0:
                break

## heap 직접 구현2
class Heap:
    def __init__(self, data):
        self.data = [None, data]
        
    def insert(self, data):
        self.data.append(data)
        
        current_num = len(self.data) - 1
        parent_num = current_num // 2
        while self.data[current_num] > self.data[parent_num]:    
            self.data[current_num], self.data[parent_num] = self.data[parent_num], self.data[current_num]
            current_num = parent_num
            parent_num = current_num // 2
            
            if current_num <= 1:
                break               