## 703. 数据流中的第K大元素
- 设计一个找到数据流中第K大元素的类（class）。注意是排序后的第K大元素，不是第K个不同的元素。

- 你的 KthLargest 类需要一个同时接收整数 k 和整数数组nums 的构造器，它包含数据流中的初始元素。每次调用 KthLargest.add，返回当前数据流中第K大的元素。

- 示例:
    - int k = 3;
    - int[] arr = [4,5,8,2];
    - KthLargest kthLargest = new KthLargest(3, arr);
    - kthLargest.add(3);   // returns 4
    - kthLargest.add(5);   // returns 5
    - kthLargest.add(10);  // returns 5
    - kthLargest.add(9);   // returns 8
    - kthLargest.add(4);   // returns 8

## 思路
- 排序
- 优先队列
- 自己实现优先队列

In [1]:
import heapq

In [2]:
class KthLargest:

    def __init__(self, k, nums):
        self.pool = heapq.nlargest(k, nums)
        heapq.heapify(self.pool)
        self.k = k

    def add(self, val):
        if len(self.pool) < self.k:
            heapq.heappush(self.pool, val)
        else:
            heapq.heappushpop(self.pool, val)
        return self.pool[0]

In [3]:
obj = KthLargest(3, [4,5,8,2])

In [4]:
obj.add(3)

4

In [5]:
obj.add(5)

5

In [6]:
obj.add(10)

5

In [7]:
obj.add(9)

8

## 测试优先队列

In [8]:
from queue import PriorityQueue

In [9]:
q = PriorityQueue()

In [10]:
q.put(1)

In [11]:
q.put(0)
q.put(8)
q.put(6)
q.put(3)

In [12]:
for i in range(5):
    print(q.get())

0
1
3
6
8


In [13]:
import heapq

In [14]:
q = heapq.nlargest(3, [1,3,9,5,4])

In [15]:
heapq.heapify(q)

In [16]:
q

[4, 5, 9]

In [17]:
class KthLargest:
    def __init__(self, k, nums):
        self.k = k
        self.minheap = []
        
        # 构建大小为 k 的小顶堆(O(k))
        for i in range(min(k, len(nums))):
            self.minheap.append(nums[i])
            self.sift_up(i)
        
        # 将多余的 nums 元素加入其中(O(nlog(t)))
        for num in nums[k:]:
            if num > self.minheap[0]:
                self.minheap[0] = num
                # 下沉新加入的节点以维护小顶堆
                self.sift_down(0, k - 1)

    def sift_up(self, new_idx):
        new_val = self.minheap[new_idx]
        # 循环比较新加入的节点以及其双亲节点以上浮新加入的节点
        while new_idx > 0 and new_val < self.minheap[(new_idx - 1) // 2]:
            self.minheap[new_idx] = self.minheap[(new_idx - 1) // 2]
            new_idx = (new_idx - 1) // 2
        self.minheap[new_idx] = new_val

    def sift_down(self, start, end):
        start_val = self.minheap[start]
        # 循环比较新加入的节点以及其双子节点以下沉新加入的节点
        while start * 2 + 1 <= end:
            child = start * 2 + 1
            # 找到双子节点中较小的一个节点
            if child + 1 <= end and self.minheap[child] > self.minheap[child + 1]:
                child += 1
            if start_val > self.minheap[child]:
                self.minheap[start] = self.minheap[child]
                start = child
            else: 
                break
        self.minheap[start] = start_val

    def add(self, val):
        print(self.minheap)
        if len(self.minheap) < self.k:
            self.minheap.append(val)
            self.sift_up(len(self.minheap) - 1)
        elif self.minheap[0] < val:
            self.minheap[0] = val
            self.sift_down(0, self.k - 1)
        return self.minheap[0]

In [18]:
obj = KthLargest(3, [4,5,8,2])

In [19]:
obj.add(3)

[4, 5, 8]


4

In [20]:
obj.add(5)

[4, 5, 8]


5

In [21]:
obj.add(10)

[5, 5, 8]


5

In [22]:
class KthLargest:
    """
    返回数据流中的第K大元素
    通过小顶堆解决
    """
    def __init__(self, k, nums):
        # 定义k个元素的堆
        self.k = k
        self.minheap = []
        
        # 建堆, 分为两种情况：
        #    一是nums长度小于 堆的大小， 从堆低添加元素，进行上浮调整。
        #    二是nums长度大于堆的大小，小于堆大小的部分，上浮调整；大于部分从堆顶添加
        for i in range(min(k, len(nums))):
            pass
            