### heapq的使用

https://docs.python.org/zh-cn/3.7/library/heapq.html

In [1]:
from heapq import *

In [2]:
nums = [3,2,8,3,5,6,1,1,0,9,3,7,5]

In [3]:
# 创建一个堆，方法1
h = []
for val in nums:
    heappush(h, val)
h

[0, 1, 2, 1, 3, 5, 6, 3, 3, 9, 5, 8, 7]

In [4]:
# 创建一个堆，方法2
h = nums
heapify(h)
h

[0, 1, 1, 2, 3, 5, 8, 3, 3, 9, 5, 7, 6]

In [5]:
# 弹出最小元素
heappop(h)

0

In [6]:
h

[1, 1, 5, 2, 3, 6, 8, 3, 3, 9, 5, 7]

In [7]:
# 堆排序
def heapsort(nums):
    h = []
    for val in nums:
        heappush(h, val)
    return [heappop(h) for i in range(len(h))]

In [8]:
heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### 堆的实现

In [9]:
# 堆，堆是一种特殊的完全二叉树
# 最小堆，所有父节点比子节点小
# 使用数组储存
class Heap(object):
    
    def __init__(self):
        self.vals = []
        
    def __len__(self):
        return len(self.vals)
    
    def push(self, val):
        self.vals.append(val)
        self.sift_up(len(self.vals) - 1)
        return
    
    def pop(self):
        if not self.vals:
            return None
        self.vals[0], self.vals[len(self.vals) - 1] = self.vals[len(self.vals) - 1], self.vals[0]
        val = self.vals.pop()
        if self.vals:
            self.sift_down(0)
        return val
    
    def sift_up(self, idx):
        if idx == 0:
            return
        parent_idx = (idx - 1) // 2
        if self.vals[idx] < self.vals[parent_idx]:
            self.vals[idx], self.vals[parent_idx] = self.vals[parent_idx], self.vals[idx]
            self.sift_up(parent_idx)
        
    def sift_down(self, idx):
        min_idx = idx * 2 + 1
        if min_idx >= len(self.vals):
            return
        right_idx = min_idx + 1
        if right_idx < len(self.vals) and self.vals[right_idx] < self.vals[min_idx]:
            min_idx = right_idx
        if self.vals[idx] > self.vals[min_idx]:
            self.vals[idx], self.vals[min_idx] = self.vals[min_idx], self.vals[idx]
            self.sift_down(min_idx)

In [10]:
# 堆排序
def heapsort2(nums):
    heap = Heap()
    for val in nums:
        heap.push(val)
    return [heap.pop() for i in range(len(heap))]

In [11]:
heapsort2([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

### 链表的实现

In [12]:
# 单向链表的节点
class ListNode(object):
    def __init__(self, item):
        self.val = item
        self.next = None
        
    def __lt__(self, other):
        return self.val < other.val

    def __eq__(self, other):
        return self.val == other.val

# 单向链表
class SinglyLinkedList(object):
    
    def __init__(self):
        self.head = None
    
    def init_with_list(self, val_list):
        if len(val_list) == 0:
            return
        self.head = ListNode(val_list[0])
        x = self.head
        for i in val_list[1:]:
            x.next = ListNode(i)
            x = x.next
    
    def get_node(self, index):
        x = self.head
        for i in range(index):
            if not x:
                return None
            x = x.next
        return x
    
    def get_length(self):
        length = 0
        x = self.head
        while x:
            x = x.next
            length += 1
        return length
    
    def append(self, item):
        node = ListNode(item)
        if self.head:
            x = self.head
            while x.next:
                x = x.next
            x.next = node
        else:
            self.head = node
    
    def insert_head(self, item):
        x = ListNode(item)
        x.next = self.head
        self.head = x
        
    def to_list(self):
        val_list = []
        x = self.head
        while x:
            val_list.append(x.val)
            x = x.next
        return val_list

### LeetCode 295. 数据流的中位数

中位数是有序列表中间的数。如果列表长度是偶数，中位数则是中间两个数的平均值。

例如，

[2,3,4] 的中位数是 3

[2,3] 的中位数是 (2 + 3) / 2 = 2.5

设计一个支持以下两种操作的数据结构：

void addNum(int num) - 从数据流中添加一个整数到数据结构中。

double findMedian() - 返回目前所有元素的中位数。

示例：

addNum(1)

addNum(2)

findMedian() -> 1.5

addNum(3) 

findMedian() -> 2

进阶:

如果数据流中所有整数都在 0 到 100 范围内，你将如何优化你的算法？

如果数据流中 99% 的整数都在 0 到 100 范围内，你将如何优化你的算法？

In [13]:
# 由于heapq未实现最大堆，所以将push(e)改为push(-e)、pop(e)改为-pop(e)来模拟最大堆的效果
# 左边为最大堆，右边为最小堆，每次把一个元素推入并弹出最大堆，弹出的元素推入最小堆
class MedianFinder:

    def __init__(self):
        self.maxheap = []
        self.minheap = []

    def add_num(self, num):
        heappush(self.minheap, -heappushpop(self.maxheap, -num))
        if len(self.minheap) > len(self.maxheap):
            heappush(self.maxheap, -heappop(self.minheap))        

    def find_median(self):
        if len(self.maxheap) == 0:
            return None
        if len(self.maxheap) == len(self.minheap):
            return (self.minheap[0] - self.maxheap[0]) / 2
        else:
            return -self.maxheap[0]

In [14]:
finder = MedianFinder()
finder.add_num(1)
finder.find_median()

1

In [15]:
finder.add_num(2)
finder.find_median()

1.5

In [16]:
finder.add_num(3)
finder.find_median()

2

In [17]:
finder.add_num(-99)
finder.find_median()

1.5

In [18]:
finder = MedianFinder()
finder.add_num(13)
finder.add_num(7)
finder.add_num(2)
finder.add_num(10)
finder.add_num(8)
finder.add_num(4)
finder.add_num(5)
finder.find_median()

7

进阶:

如果数据流中所有整数都在 0 到 100 范围内，你将如何优化你的算法？

In [19]:
class MedianFinder2:

    def __init__(self):
        self.freq = [0] * 101
        self.length = 0

    def add_num(self, num):
        self.freq[num] += 1
        self.length += 1
    
    def find_median(self):
        count = 0
        left = -1
        for i in range(101):
            count += self.freq[i]
            if self.length % 2 == 1:
                if count >= (self.length + 1) / 2: return i
            else:
                if left < 0 and count >= self.length / 2: left = i
                if left >= 0 and count >= self.length / 2 + 1: return (left + i) / 2

In [20]:
finder = MedianFinder2()
finder.add_num(1)
finder.find_median()

1

In [21]:
finder.add_num(2)
finder.find_median()

1.5

In [22]:
finder.add_num(3)
finder.find_median()

2

In [23]:
finder.add_num(0)
finder.find_median()

1.5

In [24]:
finder = MedianFinder()
finder.add_num(13)
finder.add_num(7)
finder.add_num(2)
finder.add_num(10)
finder.add_num(8)
finder.add_num(4)
finder.add_num(5)
finder.find_median()

7

### LeetCode 23. 合并K个排序链表

合并 k 个排序链表，返回合并后的排序链表。请分析和描述算法的复杂度。

示例:

输入:
[
  1->4->5,
  1->3->4,
  2->6
]

输出: 1->1->2->3->4->4->5->6

In [25]:
from queue import PriorityQueue

# 比较每个链表的首节点，获得最小值的节点。将选中的节点接在最终有序链表的后面。
def merge_k_lists(lists):
    queue = PriorityQueue()
    dummy = ListNode(0)
    x = dummy
    for node in lists:
        if node:
            queue.put((node.val, node))
    while not queue.empty():
        val, node = queue.get()
        x.next = node
        x = x.next
        node = node.next
        if node:
            queue.put((node.val, node))
    return dummy.next

In [26]:
list1 = SinglyLinkedList()
list1.init_with_list([1,4,5])
list2 = SinglyLinkedList()
list2.init_with_list([1,3,4])
list3 = SinglyLinkedList()
list3.init_with_list([2,6])

result = SinglyLinkedList()
result.head = merge_k_lists([list1.head, list2.head, list3.head])
result.to_list()

[1, 1, 2, 3, 4, 4, 5, 6]

In [27]:
# 使用heapq代替PriorityQueue
def merge_k_lists2(lists):
    queue = []
    dummy = ListNode(0)
    x = dummy
    for node in lists:
        if node:
            heappush(queue, (node.val, node))
    while queue:
        val, node = heappop(queue)
        x.next = node
        x = x.next
        node = node.next
        if node:
            heappush(queue, (node.val, node))
    return dummy.next

In [28]:
list1 = SinglyLinkedList()
list1.init_with_list([1,4,5])
list2 = SinglyLinkedList()
list2.init_with_list([1,3,4])
list3 = SinglyLinkedList()
list3.init_with_list([2,6])

result = SinglyLinkedList()
result.head = merge_k_lists2([list1.head, list2.head, list3.head])
result.to_list()

[1, 1, 2, 3, 4, 4, 5, 6]

In [29]:
list1 = SinglyLinkedList()
list1.init_with_list([])
list2 = SinglyLinkedList()
list2.init_with_list([])
list3 = SinglyLinkedList()
list3.init_with_list([])

result = SinglyLinkedList()
result.head = merge_k_lists2([list1.head, list2.head, list3.head])
result.to_list()

[]

In [30]:
list1 = SinglyLinkedList()
list1.init_with_list([])
list2 = SinglyLinkedList()
list2.init_with_list([])
list3 = SinglyLinkedList()
list3.init_with_list([-1])

result = SinglyLinkedList()
result.head = merge_k_lists2([list1.head, list2.head, list3.head])
result.to_list()

[-1]

### LeetCode 373. 查找和最小的K对数字

给定两个以升序排列的整形数组 nums1 和 nums2, 以及一个整数 k。

定义一对值 (u,v)，其中第一个元素来自 nums1，第二个元素来自 nums2。

找到和最小的 k 对数字 (u1,v1), (u2,v2) ... (uk,vk)。

示例 1:

输入: nums1 = [1,7,11], nums2 = [2,4,6], k = 3
输出: [1,2],[1,4],[1,6]

解释: 返回序列中的前 3 对数：
     [1,2],[1,4],[1,6],[7,2],[7,4],[11,2],[7,6],[11,4],[11,6]
     
示例 2:

输入: nums1 = [1,1,2], nums2 = [1,2,3], k = 2
输出: [1,1],[1,1]

解释: 返回序列中的前 2 对数：
     [1,1],[1,1],[1,2],[2,1],[1,2],[2,2],[1,3],[1,3],[2,3]
     
示例 3:

输入: nums1 = [1,2], nums2 = [3], k = 3 
输出: [1,3],[2,3]

解释: 也可能序列中所有的数对都被返回:[1,3],[2,3]

In [31]:
# 使用两个指针分别指向两个数组，每次从最小堆中取出一个最小对，然后分别使两个最小对的指针后移一位，将两组数对压入堆中
def k_smallest_pairs(nums1, nums2, k):
    if not nums1 or not nums2:
        return []
    heap = []
    max_i, max_j = len(nums1), len(nums2)
    output = []
    visited = set()
    heappush(heap, (nums1[0] + nums2[0], 0, 0))
    while heap and k:
        val, i, j = heappop(heap)
        output.append([nums1[i], nums2[j]])
        if i + 1 < max_i and (i + 1, j) not in visited:
            heappush(heap, (nums1[i + 1] + nums2[j], i + 1, j))
            visited.add((i + 1, j))
        if j + 1 < max_j and (i, j + 1) not in visited:
            heappush(heap, (nums1[i] + nums2[j + 1], i, j + 1))
            visited.add((i, j + 1))
        k -= 1
    return output

In [32]:
k_smallest_pairs([1,7,11], [2,4,6], 3)

[[1, 2], [1, 4], [1, 6]]

In [33]:
k_smallest_pairs([1,1,2], [1,2,3], 2)

[[1, 1], [1, 1]]

In [34]:
k_smallest_pairs([1,2], [3], 3)

[[1, 3], [2, 3]]

In [35]:
k_smallest_pairs([], [], 3)

[]

### LeetCode 451. 根据字符出现频率排序

给定一个字符串，请将字符串里的字符按照出现的频率降序排列。

示例 1:

输入:
"tree"

输出:
"eert"

解释:
'e'出现两次，'r'和't'都只出现一次。
因此'e'必须出现在'r'和't'之前。此外，"eetr"也是一个有效的答案。

示例 2:

输入:
"cccaaa"

输出:
"cccaaa"

解释:
'c'和'a'都出现三次。此外，"aaaccc"也是有效的答案。
注意"cacaca"是不正确的，因为相同的字母必须放在一起。

示例 3:

输入:
"Aabb"

输出:
"bbAa"

解释:
此外，"bbaA"也是一个有效的答案，但"Aabb"是不正确的。
注意'A'和'a'被认为是两种不同的字符。

In [36]:
# 快速排序
def frequency_sort(s):
    count = {}
    for c in s:
        if c in count:
            count[c] += 1
        else:
            count[c] = 1
    sorted_chars = sorted(count.items(), key=lambda x: x[1], reverse=True)
    output = ''
    for c, time in sorted_chars:
        output += c * time
    return output

In [37]:
frequency_sort('tree')

'eetr'

In [38]:
frequency_sort('cccaaa')

'cccaaa'

In [39]:
frequency_sort('Aabb')

'bbAa'

In [40]:
frequency_sort('a')

'a'

In [41]:
frequency_sort('')

''

In [42]:
# 堆排序
def frequency_sort2(s):
    count = {}
    for c in s:
        if c in count:
            count[c] += 1
        else:
            count[c] = 1
    heap = []
    for c, time in count.items():
        heappush(heap, (-time, c))
    output = ''
    while heap:
        time, c = heappop(heap)
        output += c * (-time)
    return output

In [43]:
frequency_sort2('tree')

'eert'

In [44]:
frequency_sort2('cccaaa')

'aaaccc'

In [45]:
frequency_sort2('Aabb')

'bbAa'

In [46]:
frequency_sort2('a')

'a'

In [47]:
frequency_sort2('')

''

### LeetCode 871. 最低加油次数

汽车从起点出发驶向目的地，该目的地位于出发位置东面 target 英里处。

沿途有加油站，每个 station[i] 代表一个加油站，它位于出发位置东面 station[i][0] 英里处，并且有 station[i][1] 升汽油。

假设汽车油箱的容量是无限的，其中最初有 startFuel 升燃料。它每行驶 1 英里就会用掉 1 升汽油。

当汽车到达加油站时，它可能停下来加油，将所有汽油从加油站转移到汽车中。

为了到达目的地，汽车所必要的最低加油次数是多少？如果无法到达目的地，则返回 -1 。

注意：如果汽车到达加油站时剩余燃料为 0，它仍然可以在那里加油。如果汽车到达目的地时剩余燃料为 0，仍然认为它已经到达目的地。

 

示例 1：

输入：target = 1, startFuel = 1, stations = []
输出：0

解释：我们可以在不加油的情况下到达目的地。

示例 2：

输入：target = 100, startFuel = 1, stations = [[10,100]]
输出：-1

解释：我们无法抵达目的地，甚至无法到达第一个加油站。

示例 3：

输入：target = 100, startFuel = 10, stations = [[10,60],[20,30],[30,30],[60,40]]
输出：2

解释：
我们出发时有 10 升燃料。
我们开车来到距起点 10 英里处的加油站，消耗 10 升燃料。将汽油从 0 升加到 60 升。
然后，我们从 10 英里处的加油站开到 60 英里处的加油站（消耗 50 升燃料），
并将汽油从 10 升加到 50 升。然后我们开车抵达目的地。
我们沿途在1两个加油站停靠，所以返回 2 。
 

提示：

1 <= target, startFuel, stations[i][1] <= 10^9
0 <= stations.length <= 500
0 < stations[0][0] < stations[1][0] < ... < stations[stations.length-1][0] < target

In [48]:
def min_refuel_stops(target, startFuel, stations):
    return