# **1. 힙(Heap)**

### **1-1. 힙이란?**

* 데이터에서 최대값과 최소값을 빠르게 찾기 위해 고안된 완전 이진 트리(Complete Binary Tree) 의 일종이다.
> 완전이진트리 : 노드를 삽입할 때 최하단 왼쪽 노드부터 차례대로 삽입하는 트리


### **1-2. 힙을 사용하는 이유**

* 배열에 데이터를 넣고 최대값과 최소값을 찾으려면 O(n) 의 시간이 걸린다.
* 힙에 데이터를 넣고 최대값과 최소값을 찾으면 O(log n) 의 시간밖에 걸리지 않는다.
* 우선순위 큐와 같이 최대값 또는 최소값을 빠르게 찾아야 하는 자료구조 및 알고리즘의 구현 등에 활용된다.

# **2. 힙의 구조**

* 힙은 최대값을 구하기 위한 구조 (최대 힙, Max Heap) 와, 최소값을 구하기 위한 구조 (최소 힙, Min Heap) 로 분류할 수 있다.
* 힙은 아래와 같은 두 가지의 조건을 따르는 자료구조이다.
  1. 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 크거나 같다. (최대 힙의 경우)
  2. 완전 이진 트리의 형태를 가진다. (자식이 최대 2 개이다.)

### **2-1. 힙과 이진 탐색 트리의 공통점과 차이점**

* 공통점 : 힙과 이진 탐색 트리 모두 이진 트리의 구조를 갖는다.
* 차이점 
  1. 힙은 각 노드의 값이 자식 노드보다 크거나 같다.
  2. 이진 탐색 트리는 왼쪽 자식 노드의 값이 가장 작고, 그 다음 부모 노드, 그 다음 오른쪽 자식 노드의 크기가 가장 크다.
  3. 힙은 이진 탐색 트리의 조건인 자식 노드에서 작은 값은 왼쪽, 큰 값은 오른쪽이라는 조건이 없고, 대신 힙의 왼쪽 및 오른쪽 자식 노드의 값은 들어가는 순서에 따라 달라진다.

> 이진 탐색 트리는 탐색을 위한 구조이고, 힙은 최대/최소값의 검색을 위한 구조이다.

# **3. 힙의 동작**

### **3-1. 힙에 데이터 삽입하기(기본 동작)**

* 힙은 완전 이진 트리 이므로 삽입할 노드는 기본적으로 왼쪽 최하단부 노드부터 채워지는 형태로 삽입된다.
* 채워진 노드 위치에서 부모 노드보다 값이 클 경우 부모 노드와 위치를 바꿔주는 작업을 반복하게 된다.

# **4. 힙 구현**

* 일반적으로 힙 구현시 배열 자료구조를 활용한다.
* 배열은 인덱스가 0 번 부터 시작하지만, 힙 구현의 편의를 위해 Root 노드 인덱스의 번호를 1 로 지정하면 구현이 조금 더 수월하다.

### **4-1. 힙 데이터 삽입 구현(Max Heap 의 예)**

### **4-2. 힙에 데이터 삭제 구현**

In [None]:
class Heap : 
  def __init__(self, data) : # 힙 의 생성자
    self.heap_array = list() 
    self.heap_array.append(None)
    self.heap_array.append(data) # Root 노드의 인덱스 번호를 1 로 지정함

  def insert(self, data) : 
    if len(self.heap_array) == 0 : 
      self.heap_array = list() 
      self.heap_array.append(None)
      self.heap_array.append(data)
      return True
      
    # 삽입한 노드가 부모 노드의 값보다 클 경우, 부모 노드와 삽입한 노드의 위치를 변경
    # 삽입한 노드가 루트 노드가 되거나, 부모 노드보다 값이 작거나 같을 경우까지 반복
    else : 
      self.heap_array.append(data)
      index = len(self.heap_array) - 1
      parent = int(index / 2) # = index // 2

      while self.heap_array[parent] :
        if self.heap_array[parent] >= self.heap_array[index] : 
          return True

        else :
          self.heap_array[parent], self.heap_array[index] = self.heap_array[index], self.heap_array[parent] 
          index = parent
          parent = index // 2 # index 를 2 로 나눈 몫

      return True

  # 보통 삭제는 최상단 노드(Root 노드) 를 삭제하는 것이 일반적이다.
  # 힙의 용도는 최대값 또는 최소값을 Root 노드에 놓아서, 최대값과 최소값을 바로 꺼내 쓸 수 있도록 하는 것이다.
  def pop(self) : 
    if len(self.heap_array) == 0 : 
      return None
    
    else : 
      value = self.heap_array[1]

      # 상단의 데이터 삭제시, 가장 최 하단부 왼쪽에 위치한 노드를 Root 노드로 이동한다.
      # Root 노드의 값이 child 노드보다 작을 경우, root 노드의 child 중 가장 큰 값을 가진 노드와 
      # root 노드의 위치를 바꿔주는 작업을 반복한다.
      self.heap_array[1] = self.heap_array[-1] # 1번 연결을 끊음(자동삭제)
      del self.heap_array[-1] # 마지막 배열을 삭제

      # 특정 노드와 관련된 노드의 위치를 알아내는 방법
      # 부모 노드의 인덱스 번호 = 자식 노드 인덱스 번호 // 2
      # 자식 노드의 인덱스 번호 = 부모 노드 인덱스 번호 * 2(왼쪽), * 2 + 1(오른쪽)

      index = 1 
      childleft = index * 2 
      childright = childleft + 1

      while childleft < len(self.heap_array) : # 양쪽 노드 중 하나라도 있을 때
        childright = childleft + 1

        # 오른쪽 자식 노드만 없을 때
        if childright >= len(self.heap_array) : 
          if self.heap_array[index] < self.heap_array[childleft] : 
            self.heap_array[index], self.heap_array[childleft] = self.heap_array[childleft]. self.heap_array[index]
            index = childleft
            childleft = index * 2
          else : return False
            

        # 양쪽 자식 노드가 모두 있을 때
        elif childright < len(self.heap_array) : 
          if self.heap_array[childleft] > self.heap_array[childright] : 
            if self.heap_array[index] < self.heap_array[childleft] : 
              self.heap_array[index], self.heap_array[childleft] = self.heap_array[childleft], self.heap_array[index]
              index = childleft
              childleft = index * 2
            else : return False
          else : 
            if self.heap_array[index] < self.heap_array[childright] : 
              self.heap_array[index], self.heap_array[childright] = self.heap_array[childright], self.heap_array[index]
              index = childright
              childleft = index * 2
            else : return False

      return value

In [None]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.insert(9)
print(heap.heap_array)
heap.heap_array
print(heap.pop())
heap.heap_array

[None, 15, 10, 9, 5, 4, 8]

In [None]:
# 강사님 코드

class Heap : 
  def __init__(self, data) : # 힙 의 생성자
    self.heap_array = list() 
    self.heap_array.append(None)
    self.heap_array.append(data) # Root 노드의 인덱스 번호를 1 로 지정함

  def move_up(self, inserted_idx) : 
    if inserted_idx <= 1 : 
      return False

    parent_idx = inserted_idx // 2
    if self.heap_array[inserted_idx] > self.heap_array[parent_idx] : 
      return True
    else : 
      return False

  def insert(self, data) : 
    if len(self.heap_array) == 0 : 
      self.heap_array = list() 
      self.heap_array.append(None)
      self.heap_array.append(data)
      return True

    self.heap_array.append(data)

    inserted_idx = len(self.heap_array) - 1

    while self.move_up(inserted_idx) : 
      parent_idx = inserted_idx // 2
      self.heap_array[inserted_idx], self.heap_array[parent_idx] = self.heap_array[parent_idx], self.heap_array[inserted_idx]
      inserted_idx = parent_idx

    return True

  def move_down(self, poped_idx) : 
    left_child_poped_idx = poped_idx * 2
    right_child_poped_idx = poped_idx * 2 + 1

    # 왼쪽 자식 노드가 없을 때
    if left_child_poped_idx >= len(self.heap_array) : 
      return False
    
    # 왼쪽 자식 노드만 있을 때
    elif right_child_poped_idx >= len(self.heap_array) : 
      if self.heap_array[poped_idx] < self.heap_array[left_child_poped_idx] : 
        return True
      else : return False
    
    # 양 쪽 자식 노드 모두 있을 때
    else : 
      if self.heap_array[left_child_poped_idx] > self.heap_array[right_child_poped_idx] : 
        if self.heap_array[poped_idx] < self.heap_array[left_child_poped_idx] : 
          return True
        else : return False
      else : 
        if self.heap_array[poped_idx] < self.heap_array[right_child_poped_idx] : 
          return True
        else : return False

  def pop(self) : 
    if len(self.heap_array) <= 1 :
      return None
    returned_data = self.heap_array[1]
    self.heap_array[1] = self.heap_array[-1]
    del self.heap_array[-1]
    poped_idx = 1

    while self.move_down(poped_idx) :
      left_child_poped_idx = poped_idx * 2
      right_child_poped_idx = poped_idx * 2 + 1
      
      # 오른쪽 자식 노드만 없을 때
      if right_child_poped_idx >= len(self.heap_array):
        if self.heap_array[poped_idx] < self.heap_array[left_child_poped_idx]:
          self.heap_array[poped_idx], self.heap_array[left_child_poped_idx] = self.heap_array[left_child_poped_idx], self.heap_array[poped_idx]
          poped_idx = left_child_poped_idx

      # 왼쪽 오른쪽 자식 노드 모두 있을 때
      else:
        if self.heap_array[left_child_poped_idx] > self.heap_array[right_child_poped_idx]:
          if self.heap_array[poped_idx] < self.heap_array[left_child_poped_idx]:
            self.heap_array[poped_idx], self.heap_array[left_child_poped_idx] = self.heap_array[left_child_poped_idx], self.heap_array[poped_idx]
            poped_idx = left_child_poped_idx 
        else:
          if self.heap_array[poped_idx] < self.heap_array[right_child_poped_idx]:
            self.heap_array[poped_idx], self.heap_array[right_child_poped_idx] = self.heap_array[right_child_poped_idx], self.heap_array[poped_idx]
            poped_idx = right_child_poped_idx 

    return returned_data

In [None]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.insert(9)
print(heap.heap_array)
heap.heap_array
print(heap.pop())
heap.heap_array

[None, 20, 10, 15, 5, 4, 8, 9]
20


[None, 15, 10, 9, 5, 4, 8]