# 最大堆
- 本节实现一个最大堆，根节点的索引是0，而不是1，当然，设为1也是可行的。
- 是一颗完全二叉树（不一定是满树，但是不满的地方一定在最后一层的右半部分）
- 堆中某个节点的值总是不大于其父节点的值，即父节点的值一定大于或者等于其两个孩子的值
- 可以包含重复元素

In [3]:
import random
from collections import Iterable

In [23]:
# 最大堆中的元素一定要支持可比较性
class MaxHeap:
    def __init__(self, iterable_obj=None):
        """
        最大堆构造函数
        Params:
            - iterable: python可迭代对象
        """
        self.data = [] # 由于是完全二叉树，所以用list来表示就可以了
        self.size = 0
        
        if iterable_obj is not None:
            if isinstance(iterable_obj, Iterable):
                alist = list(iterable_obj)
                self.heapify(alist)
            else:
                raise Exception('The input object must be an Iterable object!')
    
    def getSize(self):
        """获取最大堆中有效元素的数目"""
        return self.size
    
    def isEmpty(self):
        """判空"""
        return self.size == 0
    
    def add(self, elem):
        """
        向对大堆中添加一个元素
        O(logn)
        Params:
            - elem: 带添加元素
        """
        self.data.append(elem)
        self.size += 1  # 要先更新self.size，否则self._swap的边界条件判断就会报错
        self._shiftUp(self.size - 1)
        
    def findMax(self):
        """
        获取最大堆中的最大的那个元素的值
        O(1)
        """
        if self.isEmpty():
            raise Exception('Empty max heap!')
        return self.data[0]
        
    def extractMax(self):
        """
        将最大堆中的最大值抽出来
        O(1)
        Returns:
            抽取出来的同时返回其值
        """
        if self.isEmpty():
            raise Exception('Empty max heap!')
        ret = self.findMax()
        self._swap(0, self.size - 1)
        self.data.pop()
        self.size -= 1
        self._shiftDown(0)
        return ret
    
    def replace(self, value):
        """
        替换最大堆中最大的那个元素
        O(logn)
        Params:
            - value: 将要替换的新值
        Returns:
            返回原先最大堆中的最大值
        """
        ret = self.findMax()
        self.data[0] = value
        self._shiftDown(0)
        return ret
    
    def heapify(self, alist):
        """
        接收一个python list，并用list中的元素来组成一个最大堆
        O(n)——推导比较复杂
        Params:
            - alist: 输入的python list
        """
        # 笨方法是扫描一下输入数组，然后一个一个的add进Maxheap中，即可完成堆排列，大可不必这么做
        # 因为最后一个非叶子节点的索引我们能够轻松找到：self._parent(self.size - 1)
        # 然后不断的向前调用_shiftdown操作，这个过程中叶子节点被自动的维护了
        # 此时时间复杂度是O(n)的，而一个一个的add的时间复杂度是O(nlogn)的
        if not len(alist):
            raise Exception('Input is empty')
        self.data, self.size = list(alist), len(alist)
        start_index = self._parent(self.getSize() - 1) # 核心语句
        while start_index >= 0:
            self._shiftDown(start_index)
            start_index -= 1
        
            
    # privete
    def _parent(self, index):
        """
        根据当前索引去找其父节点的索引
        Params:
            - index: 输入的索引
        Returns:
            父节点的索引
        """
        if index == 0 or index > self.size:
            raise Exception('Invalid index:{}'.format(index))
        return (index - 1) // 2
    
    def _leftChild(self, index):
        """
        根据当前索引去找其左孩子的索引
        Params:
            - index: 输入的索引
        Returns:
            左孩子的索引
        """
        return index * 2 + 1
    
    def _rightChild(self, index):
        """
        根据当前索引去找其右孩子的索引
        Params:
            - index: 输入的索引
        Returns:
            右孩子的索引
        """
        return index * 2 + 2
    
    def _shiftUp(self, index):
        """
        将某一索引处的元素"上移"，并移动到合适的位置
        Params:
            - index: 输入的索引
        """
        if index < 0 or index > self.size:
            raise Exception('Invalid index:{}'.format(index))
        while index > 0 and self.data[index] > self.data[self._parent(index)]:
            self._swap(index, self._parent(index))
            index = self._parent(index)
            
    def _shiftDown(self, index):
        """
        将某一索引处的元素"下移"，并移动到合适的位置
        Params:
            - index: 输入的索引
        """
        if index < 0 or index > self.size:
            raise Exception('Invalid index:{}'.format(index))
        # 左孩子一定不能越界，才能去考虑右孩子是否越界的问题。如果右孩子越界了，但是左孩子不一定越界，因为这是一颗完全二叉树
        while self._leftChild(index) < self.size:  
            j = self._leftChild(index)
            if (j + 1 < self.size) and (self.data[j + 1] > self.data[j]):
                j += 1
            if self.data[index] >= self.data[j]:
                break
            else:
                self._swap(index, j)
                index = j
        
    def _swap(self, index1, index2):
        """
        交换两个索引位置上的元素
        Params:
            - index1: 输入的索引1
            - index2: 输入的索引2
        """
        if index1 < 0 or index1 >= self.size or index2 < 0 or index2 >= self.size:
            raise Exception('Invalid index,please check again.')
        self.data[index1], self.data[index2] = self.data[index2], self.data[index1]

In [24]:
# test MaxHep
test1 = MaxHeap()
nums_op = 10000
# 10000次添加操作
for i in range(nums_op):
    test1.add(random.randint(0, 1000000))
record_list = []
for i in range(nums_op):
    record_list.append(test1.extractMax())  # record_list中的元素一定是非升序排列的
# 检查record_list
for i in range(len(record_list) - 1):
    if record_list[i] < record_list[i + 1]:
        raise Exception('The max heap you have realized has some mistakes, please check again.')
print('The max heap you have realized has no mistake!')
# 测试 heapify
random.shuffle(record_list)
test2 = MaxHeap(record_list)
new_record_list = []
for i in range(test2.size):
    new_record_list.append(test2.extractMax())
# 检查new_record_list
for i in range(len(new_record_list) - 1):
    if new_record_list[i] < new_record_list[i + 1]:
        raise Exception('The max heap you initialized with heapify function has some mistakes, please check again.')
print('The max heap you initialized with heapify function has no mistake!')

The max heap you have realized has no mistake!
The max heap you initialized with heapify function has no mistake!


# 用maxheap实现一个优先队列

In [25]:
class PriorityQueue:
    def __init__(self):
        """优先队列的构造函数"""
        self.data = MaxHeap()
        
    def getSize(self):
        """获取优先队列内有效元素的数目"""
        return self.data.getSize()
    
    def isEmpty(self):
        """判空"""
        return self.data.isEmpty()
    
    def enqueue(self, elem):
        """
        入队一个元素
        O(logn)
        Params:
            - elem: 准备入队的元素
        """
        self.data.add(elem)
        
    def getFront(self):
        """
        获取优先级最高的那个元素
        O(1)
        Returns:
            优先级最高的那个元素
        """
        return self.data.findMax()
    
    def dequeue(self):
        """
        将优先级最高的元素出队
        O(1)
        Returns:
            优先级最高的元素
        """
        return self.data.extractMax()

In [26]:
# test PriorityQueue
test_pq = PriorityQueue()
nums = [i for i in range(20)]
random.shuffle(nums)
print('待入队元素-----', nums)
for elem in nums:
    test_pq.enqueue(elem)
print('此时优先级最高的元素为-----', test_pq.getFront()) # 19
print('出队一个元素，此时优先级最高的元素为-----', end=' ')
test_pq.dequeue()
print(test_pq.getFront()) # 18
print('此时优先队列中元素的数目为-----', test_pq.getSize()) # 19

待入队元素----- [18, 12, 0, 7, 1, 6, 9, 15, 16, 19, 14, 5, 4, 3, 10, 8, 17, 13, 11, 2]
此时优先级最高的元素为----- 19
出队一个元素，此时优先级最高的元素为----- 18
此时优先队列中元素的数目为----- 19
