## Heapを使うことで、PriorityQueueを実装する。

(ただし、Priorityといっても、それは最大か最小かしか選べない)を実装できる

HeapをTreeで実装するのは、実際リストで実装するより難しい。なぜなら、Last Filled Nodeの場所を突き詰めるのに、https://stackoverflow.com/a/21391589 のような方法を使う必要があるからである。

リストを使用するのであれば、rootのNodeをindex = 0にすると、

- 自分の親Nodeは、  (i-1)//2
- 自分のchildrenは　(2i+1)と(2i+2)



### このnotebookでやること
    
1. Heapをリストで実装する(PopとPushを実装)
2. HeapSortを実装する


# MaxHeapを実装

In [238]:
# class Node:
#     def __init__(self):
#         self.list = []
       
class MaxHeap:
    def __init__(self):
        self.list = []
        
    # まず、存在するFilled Nodeと同じ深さで右横に新しくNodeをくっつける。
    # それを、正しい場所まで上に移動させていく
    def push(self, val):      # 追加=upheap (listの最後に新しい要素を入れてあげていく)
        self.list.append(val)
        
        
        crt_idx = len(self.list) - 1
        
        while crt_idx > 0:
            parent_idx = (crt_idx - 1) // 2
            if val >= self.list[parent_idx]:
                self.list[parent_idx], self.list[crt_idx] = self.list[crt_idx], self.list[parent_idx]
            else:
                break
            crt_idx = parent_idx 
        
    def pop(self):             # 除去=downheap

        if len(self.list) == 1:
            return self.list.pop()

        max_val = self.list[0]
        self.list[0] = self.list.pop()   # listの最後の要素をrootに持ってきておろしていく
        
        crt_idx = 0
        left_child_idx = 2 * crt_idx + 1
        right_child_idx = 2 * crt_idx + 2
        
        while (right_child_idx <= len(self.list) - 1):
            idxes = sorted([crt_idx, left_child_idx, right_child_idx], key=lambda x: self.list[x]) # ascending
            if idxes[2] == crt_idx:  # crt_idx is the largest
                break
            elif idxes[1] == crt_idx:
                idx_exchanged = idxes[2]
                self.list[crt_idx], self.list[idx_exchanged] = self.list[idx_exchanged], self.list[crt_idx]
                
                crt_idx = idx_exchanged
                left_child_idx = 2 * crt_idx + 1
                right_child_idx = 2 * crt_idx + 2
            else: # idxes[0] == crt_idx:
                idx_exchanged = idxes[2]
                self.list[crt_idx], self.list[idx_exchanged] = self.list[idx_exchanged], self.list[crt_idx]
                
                crt_idx = idx_exchanged          
                left_child_idx = 2 * crt_idx + 1
                right_child_idx = 2 * crt_idx + 2
                
        if (left_child_idx == len(self.list) - 1):
            if self.list[crt_idx] < self.list[left_child_idx]:
                self.list[crt_idx], self.list[left_child_idx] = self.list[left_child_idx], self.list[crt_idx]
            
        return max_val
    

In [239]:
h = MaxHeap()

In [240]:
## test

h = MaxHeap()

h.push(1)
h.push(12)
h.push(8)
h.push(18)
h.push(35)
h.push(35)
h.push(24)

assert h.pop() == 35
assert h.pop() == 35
assert h.pop() == 24
assert h.pop() == 18
assert h.pop() == 12
assert h.pop() == 8
assert h.pop() == 1

# heap sort(昇順)を実装

### [ヒープソートの流れ](https://webbibouroku.com/Blog/Article/py-heapsort)
ヒープソートは内部ソートとして実装できます。したがって外部領域を使わず配列内でソートを行います。まず、配列の先頭(a[0])のみで構成されるヒープを考えます。これの末尾に要素(a[1])を追加し、整合性を保つ位置まで移動(UpHeap)します。これをくりかえしていけば、配列全体でヒープを高背することができます。

ヒープの構成が完了すると、ルート要素(a[0])が最大値になっています。これをヒープ構成部分末尾(a[n])と入れ替えます。a[0..n-1]でヒープを再構成するために a[0] を整合性を保つ位置まで移動(DownHeap)します。これをくりかえしていくと、ヒープ構成部分が小さくなり、配列の末尾から順に大きな値で埋まっていく次第です。

In [294]:
# ascending order
class HeapSort:
    def __init__(self, list_):
        self.list = list_
    
    def sort(self):        
        # sort as heap
        for i in range(1, len(self.list)):
            print(self.upheap(self.list[:i], self.list[i]))
            self.list[:i+1] = self.upheap(self.list[:i], self.list[i])
            
#         print(self.list)
        
        # sort in ascending order
        for i in range(len(self.list)-1, 0, -1):
            current_max, remaining_list = self.downheap(self.list[:i+1])
#             print(current_max, remaining_list)
            self.list[i] = current_max
            self.list[:i] = remaining_list
            
        return self.list
        
    # まず、存在するFilled Nodeと同じ深さで右横に新しくNodeをくっつける。
    # それを、正しい場所まで上に移動させていく
    def upheap(self, heap_list, val):       # pop
        heap_list.append(val)
        crt_idx = len(heap_list) - 1
        
        while crt_idx > 0:
            parent_idx = (crt_idx - 1) // 2
            if val >= heap_list[parent_idx]:
                heap_list[parent_idx], heap_list[crt_idx] = heap_list[crt_idx], heap_list[parent_idx]
            else:
                break
            crt_idx = parent_idx 
        return heap_list
        
    def downheap(self, heap_list):          # push
        if len(heap_list) == 1:
            return heap_list.pop()

        max_val = heap_list[0]
        heap_list[0] = heap_list.pop()
        
        crt_idx = 0
        left_child_idx = 2 * crt_idx + 1
        right_child_idx = 2 * crt_idx + 2
        
        while (right_child_idx <= len(heap_list) - 1):
            idxes = sorted([crt_idx, left_child_idx, right_child_idx], key=lambda x: heap_list[x]) # ascending
            if idxes[2] == crt_idx:  # crt_idx is the largest
                break
            elif idxes[1] == crt_idx:
                idx_exchanged = idxes[2]
                heap_list[crt_idx], heap_list[idx_exchanged] = heap_list[idx_exchanged], heap_list[crt_idx]
                
                crt_idx = idx_exchanged
                left_child_idx = 2 * crt_idx + 1
                right_child_idx = 2 * crt_idx + 2
            else: # idxes[0] == crt_idx:
                idx_exchanged = idxes[2]
                heap_list[crt_idx], heap_list[idx_exchanged] = heap_list[idx_exchanged], heap_list[crt_idx]
                
                crt_idx = idx_exchanged          
                left_child_idx = 2 * crt_idx + 1
                right_child_idx = 2 * crt_idx + 2
                
        if (left_child_idx == len(heap_list) - 1):
            if heap_list[crt_idx] < heap_list[left_child_idx]:
                heap_list[crt_idx], heap_list[left_child_idx] = heap_list[left_child_idx], heap_list[crt_idx]
            
        return max_val, heap_list
    

In [296]:
h = HeapSort([1,12,8,18,35,2])

h.sort()

[12, 1]
[12, 1, 8]
[18, 12, 8, 1]
[35, 18, 8, 1, 12]
[35, 18, 8, 1, 12, 2]
[35, 18, 8, 1, 12, 2]


[1, 2, 8, 12, 18, 35]

# Pythonのheapqライブラリを使う

- 以下の通り、リストに数字を包含する。
- 値の追加は、heapq.heapify(list), heapq.heappush(list)
- 値の取り出しは、heapq.heappop(list)

In [257]:
a = [1,12,8,18,35,]

In [258]:
import heapq  # minheapだった

heapq.heapify(a)  
heapq.heappush(a, 35)
heapq.heappush(a, 24)

In [259]:
while True:
    print(heapq.heappop(a))

1
8
12
18
24
35
35


IndexError: index out of range

## メモ

- sorted(mylist)はlistを返す
- mylist.sort()は、mylistをmutateし、何も返さない