# 第 1 章 数据结构和算法

## 1.1 将序列分解为单独的变量

任何序列(或可迭代的对象)都可以通过一个简单的赋值操作来分解为单独的变量。  
唯一的要求是变量的总数和结构要与序列相吻合。

In [1]:
p = (4, 5)
x, y = p
print(x)
print(y)

4
5


In [2]:
data = ['ACME', 50, 91.1, (2012, 12, 21)]
name, shares, price, date = data
print(name)
print(shares)
print(price)
print(date)

ACME
50
91.1
(2012, 12, 21)


In [3]:
name, shares, price, (year, mon, day) = data
print(name)
print(shares)
print(price)
print(year)
print(mon)
print(day)

ACME
50
91.1
2012
12
21


In [4]:
# 如果元素的数量不匹配，将得到一个错误提示
p = (4, 5)
x, y, z = p

ValueError: not enough values to unpack (expected 3, got 2)

In [None]:
s = 'Hello'
a, b, c, d, e = s
print(a)
print(b)
print(c)
print(d)
print(e)

### <font color="#FF0000">问题：迭代器以及生成器怎么分解？</font>

## 1.2 从任意长度的可迭代对象中分解元素

Python 的“\*表达式”可以用来解决这个问题。  
例如,假设开设了一门课程,并决定在期末的作业成绩中去掉第一个和最后一个,只对中间剩下的成绩做平均分统计。  
如果只有 4 个成绩,也许可以简单地将 4 个都分解出来,但是如果有 24 个呢?\*表达式使这一切都变得简单。

```python
def drop_first_last(grades):
    first, *middle, last = grades
    return avg(middle)
```

In [7]:
record = ('Dave', 'dave@example.com', '773-555-1212', '847-555-1212')
name, email, *phone_numbers = record
print(name)
print(email)
print(phone_numbers)

Dave
dave@example.com
['773-555-1212', '847-555-1212']


## 1.3 保存最后 N 个元素

In [13]:
from collections import deque


def search(lines, pattern, history=5):
    previous_lines = deque(maxlen=history) 
    # deque(maxlen=N)创建了一个固定长度的队列。
    # 当有新记录加入而队列已满时会自动移除最老的那条记录。
    for line in lines:
        if pattern in line:
            yield line, previous_lines
        previous_lines.append(line)
        
lines = ['pythondq', 'hiqpythons', 'dghuqiw', 'dhusq', 'dasd', 'python', 'sdads', 'python']
for line, prevlines in search(lines, 'python', 5):
    for pline in prevlines:
        print(pline, end=',')
    print(line, end='\n')
    print('-' * 20)

pythondq
--------------------
pythondq,hiqpythons
--------------------
pythondq,hiqpythons,dghuqiw,dhusq,dasd,python
--------------------
dghuqiw,dhusq,dasd,python,sdads,python
--------------------


## 1.4 找到最大或最小的 N 个元素

想在某个集合中找出最大或最小的 N 个元素  
heapq 模块中有两个函数—nlargest()和 nsmallest()—它们正是我们所需要的

In [14]:
import heapq


nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
print(heapq.nlargest(3, nums))
print(heapq.nsmallest(3, nums))

[42, 37, 23]
[-4, 1, 2]


In [16]:
# 这两个函数都可以接受一个参数 key,从而允许它们工作在更加复杂的数据结构之上
portfolio = [
    {'name': 'IBM', 'shares': 100, 'price': 91.1},
    {'name': 'AAPL', 'shares': 50, 'price': 543.22},
    {'name': 'FB', 'shares': 200, 'price': 21.09},
    {'name': 'HPQ', 'shares': 35, 'price': 31.75},
    {'name': 'YHOO', 'shares': 45, 'price': 16.35},
    {'name': 'ACME', 'shares': 75, 'price': 115.65}
]

cheap = heapq.nsmallest(3, portfolio, key=lambda x: x['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda x: x['price'])
print(cheap)
print(expensive)

[{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]
[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]


## 1.5 实现优先级队列

In [24]:
# 我们想要实现一个队列,它能够以给定的优先级来对元素排序,且每次 pop 操作时都会返回优先级最高的那个元素。

import heapq


class PriorityQueue:
    
    def __init__(self):
        self._queue = []
        self._index = 0
        
    def push(self, item, priority):
        heapq.heappush(self._queue, (-priority, self._index, item))
        self._index += 1
        
    def pop(self):
        return heapq.heappop(self._queue)[-1]
    
    
class Item:
    
    def __init__(self, name):
        self.name = name
        
    def __repr__(self):
        return 'Item({!r})'.format(self.name) # !r python变量的格式
    

q = PriorityQueue()
q.push(Item('foo'), 1)
q.push(Item('bar'), 5)
q.push(Item('spam'), 4)
q.push(Item('grok'), 1)
print(q.pop())
print(q.pop())
print(q.pop())
print(q.pop())
# 有相同优先级的两个元素(foo 和 grok)返回的顺序同它们插入到队列时的顺序相同

Item('bar')
Item('spam')
Item('foo')
Item('grok')
