>怎样从一个集合中获得最大或者最小的N个元素列表？

heapq模块有两个函数：nlargest()和nsmallest()可以完美解决这个问题

In [2]:
import heapq
nums = [1,34,456,45,545,1,4,4,5,7]
print(heapq.nlargest(3,nums))
print(heapq.nsmallest(3,nums))

[545, 456, 45]
[1, 1, 4]


In [3]:
import heapq
portfolio = [
{'name': 'IBM', 'shares': 100, 'price': 91.1},
{'name': 'AAPL', 'shares': 50, 'price': 543.22},
{'name': 'FB', 'shares': 200, 'price': 21.09},
{'name': 'HPQ', 'shares': 35, 'price': 31.75},
{'name': 'YHOO', 'shares': 45, 'price': 16.35},
{'name': 'ACME', 'shares': 75, 'price': 115.65}
]
cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price'])
print(cheap)
print(expensive)

[{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]
[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]


如果你想在一个集合中查找出最小或最大的N个元素，并且N小于集合元素数量，那么这些函数提供了很好的性能。因为在底层实现里面，首先会将集合数据进行堆排序后放入一个列表中

In [2]:
nums=[1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
import heapq
heap=list(nums)
heapq.heapify(heap)
heap

[-4, 2, 1, 23, 7, 2, 18, 23, 42, 37, 8]

堆数据结构最重要的特征是heap[0]永远是最小的元素。并且剩余的元素可以很容易的通过调用heapq.heappop()方法得到，该方法会先将第一个元素弹出来，然后用下一个最小的元素来取代被弹出的元素(这种操作复杂度仅仅是O(log N),N是堆大小。比如，如果想要查找最小的3个元素)

In [9]:
heapq.heappop(heap)

37

In [10]:
heapq.heappop(heap)

42

In [None]:
当要查找的元素个数相对比较小的时候，函数nlargest()和nsmallest()是很合适的。如果你仅仅想查找唯一的最小或最大(N=1)的元素的话，那么使用min()和max()函数会更快些。类似的，如果N的大小和集合大小接近的时候，通常先排序这个集合然后再使用切片操作会更快些(sorted(items)[:N]或是sorted(items)[-N:]).需要在正确场合使用函数nlargest()和nsmallest()才能发挥它们的优势（如果N快接近集合大小了，那么使用排序操作会更好些