# Heap

### 1. Heap이란?
* Heap : 데이터에서 **<u>최대값과 최소값을 빠르게</u> 찾기 위해 고안된 <u>완전 이진 트리(Complete Binary Tree)**</u>
    - 완전 이진 트리 : 노드를 삽입할 때 최하단 좌측 노드부터 차례대로 삽입하는 트리

* Heap을 사용하는 이유
    - <u>**최대값 최소값 탐색이 빠르다** -> $O(log n)$</u>
        - 배열로 최대값 최소값 찾으려면 $O(n)$ 소요
        - 이에 반해, Heap으로 최대값 최소값 찾으면 $O(log n)$ 소요
    - <u>**우선순위 큐**</u>와 같이 최대값/최소값을 빠르게 찾아야 하는 자료구조 및 알고리즘 구현 등에 활용됨

### 2. Heap 구조

* Heap의 2가지 분류
    - 최대값을 구하기 위한 구조(=최대힙, Max Heap)
        - 가장 큰 값이 위에 옴
    - 최소값을 구하기 위한 구조(=최소힙, Min Heap)
        - 가장 작은 값이 위에 옴

* Heap은 다음과 같이 두 가지 조건을 가지는 자료구조
    1. 각 노드의 값은 
        - <u>최대힙</u>의 경우, **각 노드의 값**은 해당 노드의 **자식 노드가 가진 값**보다 **크거나 같음**
        - <u>최소힙</u>의 경우, 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 **작거나 같음**
    2. <u>완전 이진 트리</u> 형태를 가짐

### Heap과 Binary Search Tree의 비교
![Heap vs BST](img/ds_heap_vs_bst.png)

* 공통점
    - Heap과 BST 모두 Binary Tree(이진 트리)

* 차이점
    - 값의 위치
        - Heap
            - 각 노드의 값이 자식 노드보다 크거나 같음(Max Heap의 경우)
                - 큰 값은 부모에 위치, 자식 노드들은 부모 노드보다 작다
            - Heap은 BST의 조건인 자식 노드에서 작은 값은 왼쪽, 큰 값은 오른쪽이라는 조건은 없음
            - 그렇기에 Heap의 왼쪽 및 오른쪽 자식 노드의 값은 오른쪽이 클 수도 있고, 왼쪽이 클 수도 있음

        - BST
            - 부모 노드 값을 기준으로 데이터를 넣기 때문에 왼쪽 자식 노드의 값이 가장 작고, 그 다음으로 부모 노드가 크고, 그 다음으로 오른쪽 자식 노드 값이 가장 크게 위치한다.

    - 탐색의 용도
        - Heap은 최대/최소값 검색을 위한 구조
        - BST는 탐색을 위한 구조

### 3. Heap의 동작
- 데이터를 Heap 구조에 삽입, 삭제 하는 과정을 선명하게 이해하기

#### 삽입 - 기본 동작
- 힙은 완전 이진 트리이므로, 삽입할 노드는 기본적으로 <u>왼쪽 최하단부 노드부터 채워지는 형태</u>로 삽입
- 완전 이진 트리 형태를 만들며 트리를 채워감

#### Heap에 데이터 삽입하기 - 삽입할 데이터가 Heap의 데이터보다 클 경우 (Max Heap의 예)

1. Insert
    - 먼저 삽입된 데이터는 **완전 이진 트리 구조에 맞추어, 최하단부 왼쪽 노드부터 채워짐**
2. Swap
    - 채워진 노드 위치에서, **부모 노드보다 값이 클 경우, 부모 노드와 위치를 바꿔주는 작업을 반복함**
    - 항상 부모보다 값이 크다면 루트 노드까지 올라갈 수 있음

#### Heap의 데이터 삭제하기 - (Max Heap의 예)

- 보통 삭제는 <u>최상단 노드 (Root Node)를 삭제하는 것이 일반적</u>
    - Heap의 용도는 최대값 또는 최소값을 Root에 놓아서, 최대값과 최소값을 바로 꺼내 쓸 수 있도록 하는 것
- 상단의 데이터 삭제시, 가장 최하단부 왼쪽에 위치한 노드 (일반적으로 가장 마지막에 추가한 노드)를 Root Node로 이동
- Root Node의 값이 Child Node보다 작을 경우, Root Node의 Child Node 중 가장 큰 값을 가진 노드와 Root Node 위치를 바꿔주는 작업을 반복함


1. Remove Root Node
    - Root Node 제거
2. Move Last Node to Root Node
    - 가장 마지막에 들어갔던 Node를 맨 위에 Root Node로 옮김
3. Swap
    - 자식 노드보다 부모 노드가 값이 큰지 비교하고, 부모가 자식보다 작다면 자식노드끼리 비교해서 둘 중에 더 큰 값을 부모 자리로 올림

### 4. Heap 구현

### 힙과 배열

- <u>힙 구현시 일반적으로 배열을 활용</u>
    - 완전 이진 트리 형태를 띄기 때문
- 배열은 index가 0번부터 시작하지만, **힙 구현의 편의를 위해 Root Node index 번호를 1로 지정하면 구현이 수월**

    - 부모 노드 인덱스 번호 = 자식 노드 인덱스 번호 // 2 (몫)
    - 왼쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2
    - 오른쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2 + 1

```
      [1]
     /  ＼
  [2]     [3]
 /  ＼
[4] [5]
```


In [None]:
idx_data = 2

print("자식 인덱스가", idx_data, "일 때, 부모 인덱스는", idx_data // 2)
print("부모 인덱스가", idx_data, "일 때, 왼쪽자식 인덱스는", idx_data * 2)
print("부모 인덱스가", idx_data, "일 때, 오른쪽자식 인덱스는", idx_data * 2 + 1)

### 삽입 구현 (Max Heap 예)
- 힙 클래스 구현1

In [None]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None) #인덱스 1번부터 쓰기 위해서 0번 채우기
        self.heap_array.append(data)    

In [None]:
heap = Heap(1)
heap.heap_array

- 힙 클래스 구현2 - insert1
    - 인덱스 번호는 1번부터 시작하도록 변경

In [None]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None)
        self.heap_array.append(data)

    def insert(self, data):
        if len(self.heap_array) == 0:
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        
        self.heap_array.append(data)
        return True

- 힙 클래스 구현3 - insert2
    - 삽입한 노드가 부모 노드 값보다 클 경우, 부모 노드와 삽입한 노드 위치를 바꿈
    - 삽입한 노드가 루트 노드가 되거나, 부모 노드보다 값이 작거나 같을 때까지 반복

In [10]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None)
        self.heap_array.append(data)
    
    def move_up(self, inserted_idx):
        if inserted_idx <= 1: #root
            return False
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False

    def insert(self, data):
        if len(self.heap_array) == 0:
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        self.heap_array.append(data)

        inserted_idx = len(self.heap_array)-1
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
            inserted_idx = parent_idx
        return True

In [11]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)

True

In [13]:
print(heap.heap_array)

[None, 15, 10, 8, 5, 4]


In [14]:
heap.insert(20)
print(heap.heap_array)

[None, 20, 10, 15, 5, 4, 8]


### 삭제 구현 (Max Heap 예)
- 힙 클래스 구현4 - delete1
- 보통 삭제는 최상단 노드(Root)를 삭제하는 것이 일반적임
    - 힙의 용도는 최대값 또는 최소값을 Root에 놓아서 최대값 최소값을 바로 꺼내 쓸 수 있도록 하는 것

In [16]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None)
        self.heap_array.append(data)

    def pop(self):
        if len(self.heap_array) <= 1:
            return None

        returned_data = self.heap_array[1]
        return returned_data

- 힙 클래스 구현4 - delete2
    - 상단의 데이터 삭제 시, 가장 최하단부 왼쪽에 위치한 노드 (일반적으로 가장 마지막에 추가한 노드)를 Root 노드로 이동
    - Root 노드의 값이 Child 노드보다 작을 경우, Root 노드의 Child 노드 중 가장 큰 값을 가진 노드와 Root 노드 위치를 바꿔주는 작업을 반복

In [17]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None)
        self.heap_array.append(data)

    def move_down(self, popped_idx):
        left_child_popped_idx = popped_idx * 2
        right_child_popped_idx = popped_idx * 2 + 1

        # case1: 왼쪽자식 노드도 없을 때
        if left_child_popped_idx >= len(self.heap_array):
            return False
        # case2: 오른쪽자식 노드만 없을 때
        elif right_child_popped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                return True
            else:
                return False
        #case3: 왼쪽, 오른쪽 자식 노드 모두 있을 때
        else:
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            else:
                if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                    return True
                else:
                    return False

    def pop(self):
        if len(self.heap_array) <= 1:
            return None

        returned_data = self.heap_array[1]
        self.heap_array[1] = self.heap_array[-1]
        del self.heap_array[-1]
        popped_idx = 1

        while self.move_down(popped_idx):
            left_child_popped_idx = popped_idx * 2
            right_child_popped_idx = popped_idx * 2 + 1

            # case2: 오른쪽자식 노드만 없을 때
            if right_child_popped_idx >= len(self.heap_array):
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                    popped_idx = left_child_popped_idx
            #case3: 왼쪽, 오른쪽 자식 노드 모두 있을 때
            else:
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                    if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                        self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = left_child_popped_idx
                else:
                    if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                        self.heap_array[popped_idx], self.heap_array[right_child_popped_idx] = self.heap_array[right_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = right_child_popped_idx

        return returned_data

### 삽입+삭제 전체 코드

In [19]:
class Heap:
    def __init__(self, data):
        self.heap_array = list()
        self.heap_array.append(None)
        self.heap_array.append(data)

    def move_up(self, inserted_idx):
        if inserted_idx <= 1: #root
            return False
        parent_idx = inserted_idx // 2
        if self.heap_array[inserted_idx] > self.heap_array[parent_idx]:
            return True
        else:
            return False

    def insert(self, data):
        if len(self.heap_array) == 0:
            self.heap_array.append(None)
            self.heap_array.append(data)
            return True
        self.heap_array.append(data)

        inserted_idx = len(self.heap_array)-1
        while self.move_up(inserted_idx):
            parent_idx = inserted_idx // 2
            self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
            inserted_idx = parent_idx
        return True

    def move_down(self, popped_idx):
        left_child_popped_idx = popped_idx * 2
        right_child_popped_idx = popped_idx * 2 + 1

        # case1: 왼쪽자식 노드도 없을 때
        if left_child_popped_idx >= len(self.heap_array):
            return False
        # case2: 오른쪽자식 노드만 없을 때
        elif right_child_popped_idx >= len(self.heap_array):
            if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                return True
            else:
                return False
        #case3: 왼쪽, 오른쪽 자식 노드 모두 있을 때
        else:
            if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    return True
                else:
                    return False
            else:
                if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                    return True
                else:
                    return False

    def pop(self):
        if len(self.heap_array) <= 1:
            return None

        returned_data = self.heap_array[1]
        self.heap_array[1] = self.heap_array[-1]
        del self.heap_array[-1]
        popped_idx = 1

        while self.move_down(popped_idx):
            left_child_popped_idx = popped_idx * 2
            right_child_popped_idx = popped_idx * 2 + 1

            # case2: 오른쪽자식 노드만 없을 때
            if right_child_popped_idx >= len(self.heap_array):
                if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                    self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                    popped_idx = left_child_popped_idx
            #case3: 왼쪽, 오른쪽 자식 노드 모두 있을 때
            else:
                if self.heap_array[left_child_popped_idx] > self.heap_array[right_child_popped_idx]:
                    if self.heap_array[popped_idx] < self.heap_array[left_child_popped_idx]:
                        self.heap_array[popped_idx], self.heap_array[left_child_popped_idx] = self.heap_array[left_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = left_child_popped_idx
                else:
                    if self.heap_array[popped_idx] < self.heap_array[right_child_popped_idx]:
                        self.heap_array[popped_idx], self.heap_array[right_child_popped_idx] = self.heap_array[right_child_popped_idx], self.heap_array[popped_idx]
                        popped_idx = right_child_popped_idx

        return returned_data

In [20]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
print(heap.heap_array)

[None, 20, 10, 15, 5, 4, 8]


In [21]:
heap.pop()

20

In [22]:
print(heap.heap_array)

[None, 15, 10, 8, 5, 4]


### 5. Heap 시간 복잡도
- depth(트리의 높이)를 h라고 표기한다면,
- n개의 노드를 가지는 heap에 데이터 삽입 또는 삭제 시, 최악의 경우 Root노드에서 Leaf노드까지 비교해야하므로 $h=log₂n$에 가깝다.
- 시간복잡도는 $O(log n)$
    - 그래서 한번 실행시마다, 50%의 실행할 수도 있는 명령을 제거하게 됨
    - 즉, 50%의 실행시간을 단축시킬 수 있다는 것을 의미