## Binary heap

### List implementation

In [148]:
class Heap():
    def __init__(self, size, heap_type='min'):
        # size 是要存放到資料量
        self.data = [None]*(size+1) # 為了計算方便，0 location 不用
        self.current_size = 0  # 目前有 value 的數量，也是最後一個資料的 location
        self.max_size = size  # 最大的資料儲存location。
        self.heap_type = heap_type  # 指定 heap type
        
    def peek(self, size):
        return self.data[1]  # return root node, located at [1]
    
    def size_of_heap(self):
        return self.current_size
    
    def level_order_travasal(self):
        for i in range(1,self.current_size+1):
            print(self.data[i])
            
    def __str__(self, level=0, location=1): 
        # 有 data 給他一行，沒 data 不給行
        # 當被查詢的 node有數值，給他根據level的空白，並在最後加一行
        if location<=self.current_size and self.data[location] is not None:
            root_str = '  '*level + str(self.data[location]) + '\n'
        else:
            # 當被查詢 node 超過範圍了，那就不會有接下來的內容，所以 return ''
            return ''
        # node 的左右邊可能有內容
        left_str = self.__str__(level+1, location*2) # 如果沒內容，那就得到 ‘’
        right_str = self.__str__(level+1, location*2+1) # 如果有內容，會是一行 "  "*level+ data + 換行
            
        # 綜合所有內容
        return_str = left_str + root_str + right_str
        return return_str
        
    def add(self, value):
        # 讓外部呼叫，控制流程正當性
        location = self.current_size+1
        if location>self.max_size:
            raise Exception("The heap is full")
        # 呼叫 heapify，讓需要的部分recursion，其他部分不需要recuresion
        self.data[location] = value
        self.heap_push(location)
        self.current_size +=1
 
    def heap_pop(self):
        # 如果沒有 element，return None
        if self.current_size==0:
            return None
        
        # 先記者return value
        return_value = self.data[1]
        if return_value is not None:
            self.data[1] = self.data[self.current_size]  # 將root value 設為最後一個 node
            self.data[self.current_size] = None  # 刪除最後一個 node
            self.current_size-=1  # 先減1，這樣如果只有一個element，則可以在一開始就處理掉
            self.heap_push_down(1)  # 從root 開始，比較兩個 children，進行交換，符合heap原則
        return return_value
        
    def heap_push_down(self, location):
        print(self)
        # 在傳入之前，最好已經先確定 location 是 legit
        if location>self.current_size:
            return location
        
        left_child_location = location*2
        right_child_location = location*2+1
        current_value = self.data[location]
        if left_child_location<=self.current_size:
            left_child = self.data[left_child_location]
        else:
            left_child = None
        if right_child_location<=self.current_size:
            right_child = self.data[right_child_location]
        else:
            right_child = None
            
        # 只有三種情況，： L/R=None/None, xx/None, xx/oo; 不可能 None/xx
        # 兩個 child 都是 None，則不必比較，直接結束
        if left_child is None:
            return
        # 只有 left child 的情況下，則比較完之後，結束， 不需再call
        elif right_child is None:
            # minimum heap
            if self.heap_type=='min':
                if current_value>left_child:
                    self.data[location], self.data[left_child_location] = \
                        left_child, current_value
                return
            # maximum heap
            else:
                if current_value<left_child:
                    self.data[location], self.data[left_child_location] = \
                        left_child, current_value
                return
        # 兩個 children 的情況下，比較完之後，再次呼叫比較
        else:
            # minimum heap
            if self.heap_type=='min':
                # 設定 swap_child 為比較小的那個。
                    # 如果 root 都比 swap_child 小的話，那麼不必換。
                    # 如果 swap_child 比較小，那麼把他換上去，也會滿足比另一個 child 小的條件
                if left_child<right_child:
                    swap_child_location = left_child_location
                else:
                    swap_child_location = right_child_location
                if self.data[swap_child_location]<current_value:
                    self.data[location], self.data[swap_child_location] = \
                        self.data[swap_child_location], current_value
                    self.heap_push_down(swap_child_location)
                # 上面的 node 最小，則不需要再繼續了
                else:
                    return
            # maximum heap
            else:
                if left_child>right_child:
                    swap_child_location = left_child_location
                else:
                    swap_child_location = right_child_location
                if self.data[swap_child_location]>current_value:
                    self.data[location], self.data[swap_child_location] = \
                        self.data[swap_child_location], current_value
                    self.heap_push_down(swap_child_location)
                else:
                    return

    def delete_value(self, value):
        if value not in self.data:
            raise Exception('No such value')
        # 找到 value 的位置
        location = self.data.index(value)
        # 將最後一個 value 取代原本的value
        self.data[location] = self.data[self.current_size]
        self.data[self.current_size] = None
        self.current_size-=1
        heap_location = self.heap_push(location)  # heap_push 回傳停下來的 location
        self.heap_push_down(heap_location)  # 從那個位置開始，往下看是否需要和 children node 交換
    

    def heap_push(self, location):
        # delete value 的時候，需要 return 停下來的時候的 location
        # 單純操作 heapify, 使用 recursion
        parent_location = location//2
        if parent_location==0:
            return location
        # 根據 heap_typef
        # minimum heap
        if self.heap_type=='min':
            if self.data[location]<self.data[parent_location]:
                self.data[location],self.data[parent_location] = \
                    self.data[parent_location], self.data[location]
                return self.heap_push(parent_location)
            else:
                return location
        # maximum heap
        else:
            if self.data[location]>self.data[parent_location]:
                self.data[location],self.data[parent_location] = \
                    self.data[parent_location], self.data[location]
                return self.heap_push(parent_location)
            else:
                return location
            
                
        
        
            
    

In [151]:
h = Heap(20,'min')
h.add(100)
h.add(95)
h.add(98)
h.add(9)
h.add(8)
h.add(97)
h.add(96)


100

95

  100
95

  100
95
  98

  9
95
  98

  95
9
  98

    100
  95
9
  98

    100
  8
9
  98

    100
  9
8
  98

    100
  9
    95
8
  98

    100
  9
    95
8
  97

    100
  9
    95
8
    98
  97

    100
  9
    95
8
    98
  96



In [152]:
print(h)
h.delete_value(9)

    100
  9
    95
8
    98
  96
    97

    100
  97
    95
8
    98
  96

    100
  97
    95
8
    98
  96

    100
  95
    97
8
    98
  96



In [None]:

# My solution for add
    def add(self, value):
        # 找到要被安置新資料的位置
        location = self.current_size+1
        # 如果超過最大限制，則報錯
        if location>self.max_size:
            raise Exception("The heap is full")
        
        # 先在location加入數值
        self.data[location] = value
        
        # 從location到 root，依序比對資料大小
        # 也可以寫成 recursion
        while True:
            parent_location = location//2
            # 當 location==1, parent==0 -> break，因為 data[0]為了方便起見，是None
            if parent_location<1:
                break
            # 在 minimal heap，如果 child資料小於parent，則交換
            if self.heap_type=='min':
                if self.data[location]<self.data[parent_location]:
                    self.data[parent_location], self.data[location] = self.data[location], self.data[parent_location]
                else:
                    # 在 minimal heap 情況下，如果要加的 value比 parent 大，那就結束
                    break
            # maximum heap
            else:
                if self.data[location]>self.data[parent_location]:
                    self.data[parent_location], self.data[location] = self.data[location], self.data[parent_location]
                else:
                    break
                
            # 更新 location
            location = parent_location
            
        # 調整現有資料數量
        self.current_size+=1