# 1. Heap 힙

### 1-1 힙이란?
* 데이터에서 최대값과 최소값을 빠르게 찾기 위해 고안된 완전 이진 트리 (Complete Binary Tree)
* 완전 이진 트리: 노드를 삽입할 때 최하단 왼쪽 노드부터 차례대로 삽입하는 트리 

### 1-2. 힙을 사용하는 이유
* 배열에 데이터를 넣고 최대값 최소값을 찾으려면 시간복잡도는 O(n)이 걸림 
* 힙에 데이터를 넣고 최대값 최소값을 찾으려면 시간복잡도는 O(logn)이 걸림 
* 우선순위 큐와 같이 최대값 또는 최소값을 빠르게 찾아야하는 자료구조 및 알고리즘 구현등에 활용됨


# 2. 힙의 구조

* 힙은 최대값을 구하기 위한 구조 (Max Heap)와 최소값을 구하기 위한 구조 (Min HEap)으로 분류할 수 있음 
* 힙은 아래와 같이 두가지 조건을 가지고 있는 자료구조
  1. 각 노드의 값은 해당 노드의 자식 노드가 가진 값보다 크거나 같다 (최대 힙의 경우)
  2. 완전 이진 트리 형태를 가짐 


### 힙과 이진 탐색 트리의 공통점과 차이점 

1. 공통점
  * 힙과 이진 탐색 트리는 모두 이진 트리임 
2. 차이점
  * 힙은 각 노드의 값이 자식 노드보다 크거나 같음 
  * 이진 탐색 트리는 왼쪽 자식 노드의 값이 가장 작고, 그 다음 부모 노드, 그 다음 오른쪽 자식 노드값이 큼 
  * 힙은 이진 탐색 트리의 조건인 자식 노드에서 작은 값은 왼쪽, 큰값은 오른쪽이라는 조건이 없음 > 힙의 왼쪽 및 오른쪽 자식 노드의 값은 오른쪽이 클수도 있고, 왼쪽이 클수도 있음 

# 3. 힙의 동작 

### 3-1. 힙에 데이터 삽입하기 
* 힙은 완전 이진 트리이므로 삽입할 노드는 기본적으로 왼쪽 최하단부 노드부터 채워지는 형태로 삽입
* 채워진 노드 위치에서 부모 노드보다 값이 클 경우, 부모 노드와 위치를 바꿔주는 작업 (swap)을 반복함 

### 3-2. 힙 데이터 삭제하기
* 최상단 노드를 삭제하는 것이 일반적
* 힙의 용도는 최대값 또는 최소값을 root노드에 옿아서 최대값을 바로 꺼내 쓸 수 있도록 하는 것 
* 상단의 데이터 삭제시 가장 최하단부 왼쪽에 위치한 노드(일반적으로 가장 마지막에 추가한 노드)를 root 노드로 이동 
* root 노드의 값이 child node보다 작을 경우, root 노드의 child node 중 가장 큰 값을 가진 노드와 root 노드 위치를 바꿔주는 작업(swap)을 반복 

# 4. 힙 구현 

* 힙 구현시 배열 자료구조를 활용
* 배열은 인덱스가 0번부터 시작하지만 힙 구현의 편의를 위해 root 노드 인덱스 번호를 1로 지정하면 구현이 좀 더 수월함 
  * 부모 노드 인덱스 번호 = 자식 노드 인덱스 번호 // 2
  * 왼쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2
  * 오른쪽 자식 노드 인덱스 번호 = 부모 노드 인덱스 번호 * 2 + 1


### 4-1 힙 클래스 구현 

In [3]:
class Heap:
  def __init__(self, data):
    # ha = heap_array
    self.ha = list()
    self.ha.append(None) # array의 index 0은 비워둠
    self.ha.append(data) # array의 index 1부터 데이터를 추가 

In [4]:
heap = Heap(1)
heap.ha

[None, 1]

### 4-2. 힙의 삽입 구현 

In [12]:
class Heap:
  def __init__(self, data):
    self.ha = list()
    self.ha.append(None)
    self.ha.append(data)
  
  def insert(self, data):
    if len(self.ha) == 0:
      self.ha.append(None)
      self.ha.append(data)
      return True

    self.ha.append(data)
    return True 

Max Heap
* 새로운 데이터는 leaf node로 삽입 됨 > 그 후 비교 시작 > if newly added data is bigger than parent node, this newly added bigger data node swap with its smaller data parent node 
* 삽입한 노드가 부모 노드의 값보다 클 경우, 부모 노드와 삽입한 노드 위치를 바꿈 
* 삽입한 노드가 루트 노드가 되거나, 부모 노드보다 값이 작거나 같을 경우까지 반복 


In [13]:
heap = Heap(15)

heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)

heap.ha

[None, 15, 10, 8, 5, 4, 20]

In [16]:
class Heap:
  def __init__(self, data):
    self.ha = list()
    self.ha.append(None)
    self.ha.append(data)

  def insert(self,data):
    if len(self.ha) == 0:
      self.ha.append(None)
      self.ha.append(data)
      return True
    
    # insert data in order first 
    self.ha.append(data)
    inserted_idx = len(self.ha) -1 # index of lastly added data 
    
    # swap child node and parent node 
    # if child node data is bigger than parent node data 
    while self.move_up(inserted_idx): # while child node data is bigger than parent node data
      parent_idx = inserted_idx // 2
      # swap node data 
        # self.ha[inserted_idx] is now smaller node data
        # self.ha[parent_idx] is now bigger node data 
      self.ha[inserted_idx], self.ha[parent_idx] = self.ha[parent_idx], self.ha[inserted_idx]
      # now the index of lastly added data becomes its parent node index 
        # to compare this new index to its upper level (or new parent node)
      inserted_idx = parent_idx
    return True  


  # compare to determine if newly added data node is bigger than parent node     
  def move_up(self, inserted_idx):
    if inserted_idx <= 1: # if root node 
      return False

    # assigning parent node index 
    parent_idx = inserted_idx // 2 

    # compare child node value and parent node value 
    # return True if child node bigger
    # return False if parent node bigger 
    if self.ha[inserted_idx] > self.ha[parent_idx]:
      return True 
    else:
      return False 








In [17]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.ha

[None, 20, 10, 15, 5, 4, 8]

### 4-3 삭제 구현 
* 최상단 노드 (root node)를 삭제하는 것이 일반적 
* root node의 값이 child node보다 작을 경우, root node의 child node 중 가장 큰 값을 가진 노드와 root노드 위치를 swap 반복 

In [20]:
class Heap:
  def __init__(self, data):
    self.ha = list()
    self.ha.append(None)
    self.ha.append(data)
  
  # return and delete the root node data 
  def pop(self):
    if len(self.ha) <= 1:
      return None
    
    returned_data = self.ha[1]
    self.ha[1] = self.ha[-1]
    del self.ha[-1]
    popped_idx = 1

    while self.move_down(popped_idx):
      child1_idx = popped_idx * 2
      child2_idx = popped_idx * 2 + 1

      # when there is only left child node
      if child2_idx >= len(self.ha):
        # if parent parent node is smaller than left child node
        if self.ha[popped_idx] < self.ha[child1_idx]:
          self.ha[popped_idx], self.ha[child1_idx] = self.ha[child1_idx], self.ha[popped_idx]
          popped_idx = child1_idx
      #when there is two childs 
      else:
        # if left child node is bigger than right child node 
        if self.ha[child1_idx] > self.ha[child2_idx]:
          # if parent node is smaller than left child node
          if self.ha[popped_idx] < self.ha[child1_idx]:
            self.ha[popped_idx], self.ha[child1_idx] = self.ha[child1_idx], self.ha[popped_idx]
            popped_idx = child1_idx 
        # if right child node is bigger than left node 
        else:
          if self.ha[popped_idx] < self.ha[child2_idx]:
            self.ha[popped_idx], self.ha[child2_idx] = self.ha[child2_idx], self.ha[popped_idx]
            popped_idx = child2_idx

    return returned_data 
    
  # compare to determine if parent node data is smaller than child node data
    # return True if parent node data is smaller than child node data
    # return False if parent node data is bigger than child node data 
  def move_down(self, popped_idx): 
    child1_idx = popped_idx * 2
    child2_idx = popped_idx * 2 + 1

    # when there is no child1 or left child node 
    if child1_idx >= len(self.ha): 
      return False 
    # when there is only child1 or left child node
    elif child2_idx >= len(self.ha):
      if self.ha[popped_idx] < self.ha[child1_idx]:
        return True
      else:
        return False 
    # when there is both childs 
    else:
      # when left child node is bigger 
      if self.ha[child1_idx] > self.ha[child2_idx]:
        # when parent is smaller than left child node 
        if self.ha[popped_idx] < self.ha[child1_idx]:
          return True
        # when parent is bigger than left child node
        else:
          return False
      # when right child node is bigger
      else:
        if self.ha[popped_idx] < self.ha[child2_idx]:
          return True
        else:
          return False 


  def insert(self,data):
    if len(self.ha) == 0:
      self.ha.append(None)
      self.ha.append(data)
      return True
    
    # insert data in order first 
    self.ha.append(data)
    inserted_idx = len(self.ha) -1 # index of lastly added data 
    
    # swap child node and parent node 
    # if child node data is bigger than parent node data 
    while self.move_up(inserted_idx): # while child node data is bigger than parent node data
      parent_idx = inserted_idx // 2
      # swap node data 
        # self.ha[inserted_idx] is now smaller node data
        # self.ha[parent_idx] is now bigger node data 
      self.ha[inserted_idx], self.ha[parent_idx] = self.ha[parent_idx], self.ha[inserted_idx]
      # now the index of lastly added data becomes its parent node index 
        # to compare this new index to its upper level (or new parent node)
      inserted_idx = parent_idx
    return True  


  # compare to determine if newly added data node is bigger than parent node     
  def move_up(self, inserted_idx):
    if inserted_idx <= 1: # if root node 
      return False

    # assigning parent node index 
    parent_idx = inserted_idx // 2 

    # compare child node value and parent node value 
    # return True if child node bigger
    # return False if parent node bigger 
    if self.ha[inserted_idx] > self.ha[parent_idx]:
      return True 
    else:
      return False 



In [21]:
heap = Heap(15)
heap.insert(10)
heap.insert(8)
heap.insert(5)
heap.insert(4)
heap.insert(20)
heap.ha

[None, 20, 10, 15, 5, 4, 8]

In [22]:
heap.pop(), heap.ha

(20, [None, 15, 10, 8, 5, 4])