# 我们想在某个集合中找出最大或最小的N个元素。

## heapq模块中有两个函数 nlargest()和nsmallest()

## 要找的元素数量N相对较小时，nlargest()和nsmallest()才是最适用的。
## 如果只是简单的寻找最大最小值(N=1)，那么用max()和min()最佳。
## N和集合本身差不多大，最快的方法是先对集合排序，然后做切片操作。例如sorted(items)[:N]
## nlargest()和nsmallest()的实现方法会根据使用他们的方式不同而有所不同，可能会有一些优化措施。
## 比如，当N和集合本身差不多大，就会采用排序的方法

In [13]:
import heapq

nums = [5, 31, 12, 42, 53, 75, 1, 42, 22, 22, 3, 3, 2, 53]
print(heapq.nlargest(n=3, iterable=nums))
print(heapq.nsmallest(n=3, iterable=nums))

[75, 53, 53]
[1, 2, 3]


In [7]:
# 接收参数key，允许工作在更加复杂的数据结构之上。
portfolio = [
    {'name':'IBM','shares':100,'price':91.1},
    {'name':'AAPL','shares':50,'price':543.22},
    {'name':'FB','shares':200,'price':21.09},
    {'name':'HPQ','shares':35,'price':31.75},
    {'name':'YHHO','shares':45,'price':16.35},
    {'name':'ACME','shares':75,'price':115.65},
]
cheap = heapq.nsmallest(3,portfolio,key=lambda x:x['price'])
expensive = heapq.nlargest(3,portfolio,key=lambda x:x['price'])
cheap, expensive

([{'name': 'YHHO', 'shares': 45, 'price': 16.35},
  {'name': 'FB', 'shares': 200, 'price': 21.09},
  {'name': 'HPQ', 'shares': 35, 'price': 31.75}],
 [{'name': 'AAPL', 'shares': 50, 'price': 543.22},
  {'name': 'ACME', 'shares': 75, 'price': 115.65},
  {'name': 'IBM', 'shares': 100, 'price': 91.1}])

In [26]:
# 寻找最小的N个元素，N很小，可以考虑heapq.heapify()将列表转换为堆
# 堆最重要特性是heap[0]总是最小的一个值，通过heappop()弹出第一个也就是最小的值
nums = (5, 31, 12, 42, 53, 75, 1, 42, 22, 22, 3, 3, 2, 53)
import heapq
heap = list(nums)
heapq.heapify(heap)
heap

[1, 3, 2, 22, 22, 3, 12, 42, 42, 31, 53, 5, 75, 53]

In [27]:
heap[0]

1

In [28]:
heapq.heappop(heap) # 弹出最小值

1

In [29]:
heapq.heappop(heap)

2

In [30]:
heap

[3, 3, 5, 22, 22, 53, 12, 42, 42, 31, 53, 75]