问题:我们想在某个集合中找出最大或最小的 N 个元素。
解决方案heapq 模块中有两个函数—nlargest()和 nsmallest()

In [1]:
import heapq
nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2] 
print(heapq.nlargest(3, nums)) # Prints [42, 37, 23]
print(heapq.nsmallest(3, nums)) # Prints [-4, 1, 2]

[42, 37, 23]
[-4, 1, 2]


这两个函数都可以接受一个参数 key，从而允许它们工作在更加复杂的数据结构之上。

In [2]:
portfolio = [
 {'name': 'IBM', 'shares': 100, 'price': 91.1},
 {'name': 'AAPL', 'shares': 50, 'price': 543.22},
 {'name': 'FB', 'shares': 200, 'price': 21.09},
 {'name': 'HPQ', 'shares': 35, 'price': 31.75},
 {'name': 'YHOO', 'shares': 45, 'price': 16.35},
 {'name': 'ACME', 'shares': 75, 'price': 115.65}
] 
cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price']) 
print(cheap,expensive,sep='\n')

[{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]
[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]


如果正在寻找最大或最小的 N 个元素，且同集合中元素的总数目相比，N 很小，那么
下面这些函数可以提供更好的性能。这些函数首先会在底层将数据转化成列表，且元
素会以堆的顺序排列。这个操作的复杂度是 O(logN)

In [3]:
nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
import heapq
heap = list(nums)
heapq.heapify(heap)#会在底层将数据转化成列表，且元素会以堆的顺序排列。
print(heap)
#heap[0]永远是最小值


[-4, 2, 1, 23, 7, 2, 18, 23, 42, 37, 8]


In [4]:
print(heapq.heappop(heap))
print(heapq.heappop(heap))
print(heapq.heappop(heap))


-4
1
2


注意：当所要找的元素数量相对较小时，函数 nlargest()和 nsmallest()才是最适用的。

如果只是简单地想找到最小或最大的元素（N=1 时），那么用 min()和 max()会更加快。

同样，如
果 N 和集合本身的大小差不多大，通常更快的方法是先对集合排序，然后做切片操作
（例如，使用 sorted(items)[:N]或者 sorted(items)[-N:]）。

应该要注意的是，nlargest()和
nsmallest()的实际实现会根据使用它们的方式而有所不同，可能会相应作出一些优化措
施（比如，当 N 的大小同输入大小很接近时，就会采用排序的方法）。