#  1.1 将序列分解为单独的变量

有一个包含N个元素的元组或者序列，现在分解成N个单独的变量

In [4]:
data = ['ABCD',50, 91.2, (2012,12,21)]

In [5]:
_, num, _, date = data

In [6]:
num

50

# 1.2 从任意长度的可叠戴对象中

In [12]:
record = [
    ('foo', 1, 2),
    ('bar', 'hello'),
    ('foo', 3, 4)
]

def print_foo(x, y):
    print('foo', x, y)

for tag, *args in record:
    if tag =='foo':
        print_foo(*args)
    else:
        print('bar', *args)

foo 1 2
bar hello
foo 3 4


In [20]:
line = 'nobody:#2242098fsfufos:-2:User:/mata/waa/false'
uname, *field, homedir, sh = line.split(':')
field

['#2242098fsfufos', '-2']

# 1.3 保存最后N个元素

对一系列文本进行简单的匹配操作，当发现有匹配时就输出当前匹配行以及最后检查过的N行文本

In [22]:
from collections import deque

In [33]:
def search(lines, patten, history=5):
    previous_lines = deque(maxlen=history)
    for line in lines:
        if patten in line:
            yield line, previous_lines
        previous_lines.append(line)

In [34]:
with open('somefile.txt') as f:
    for line, previous in search(f, 'python', 5):
        for pline in previous:
            print(pline, end='')
        print(line, end='')
        print('-'*20)

python is xxxxx
--------------------
python is xxxxx
for testing
sfsljflsjflsj
sklfjslkjfsljfsslkfjlskjflsjf
sfsjlfjslfjslkfjsljflksjfklsjflksjlfkjslfjslkjflksdf
python is ok
--------------------
sfsjlfjslfjslkfjsljflksjfklsjflksjlfkjslfjslkjflksdf
python is ok
end testing
sfsfskljfslkjfslkjfslkjflsjfs
sfkshflsjflkjsf
python is ok
--------------------


In [35]:
q = deque(maxlen=3)
q.append(1)
q.append(2)
q.append(3)
q.append(4)

In [36]:
q

deque([2, 3, 4])

# 1.4 找到最大或者最小的N个元素

找出某个集合中最大的或者最小的N个元素。

In [39]:
import heapq
nums = [32,3,4,345,34,2,243,34,57,7,9,756]
print(heapq.nlargest(2,nums))
print(heapq.nsmallest(3,nums))

[756, 345]
[2, 3, 4]


当要查找的元素个数相对比较小的时候，函数 nlargest() 和 nsmallest() 是很 合适的。如果你仅仅想查找唯一的最小或最大 (N=1) 的元素的话，那么使用 min() 和 max() 函数会更快些。类似的，如果 N 的大小和集合大小接近的时候，通常先排序这 个集合然后再使用切片操作会更快点 ( sorted(items)[:N] 或者是 sorted(items)[- N:] )。需要在正确场合使用函数 nlargest() 和 nsmallest() 才能发挥它们的优势 (如果 N 快接近集合大小了，那么使用排序操作会更好些)。

In [37]:
heap = list(nums)
# 排序
heapq.heapify(heap)
heap

[2, 3, 4, 34, 7, 32, 243, 345, 57, 34, 9, 756]

堆数据结构最重要的特征是 heap[0] 永远是最小的元素。并且剩余的元素可以很 容易的通过调用 heapq.heappop() 方法得到，该方法会先将第一个元素弹出来，然后 用下一个最小的元素来取代被弹出元素 (这种操作时间复杂度仅仅是 O(log N)，N 是 堆大小)。

# 1.5 实现优先级队列

实现一个按优先级排序的队列?并且在这个队列上面每次 pop 操作总是返回 优先级最高的那个元素

In [50]:
import heapq
class PriorityQueue:
    def __init__(self):
        self._queue =[]
        self._index = 0
        
    def push(self, item, priority):
        heapq.heappush(self._queue, [-priority,  self._index, item]) #优先级为负 数的目的是使得元素按照优先级从高到低排序
        self._index +=1
        
    def pop(self):
        return heapq.heappop(self._queue)[-1]
    
class Item:
    def __init__(self, name):   #输入，定义
        self.name = name
    def __repr__(self):         #输出，呈现
        return 'Item({!r})'.format(self.name)

In [51]:
q = PriorityQueue()
q.push(Item('foo'),1)
q.push(Item('bar'),5)
q.push(Item('spam'),4)
q.push(Item('grok'),1)
q

<__main__.PriorityQueue at 0x10c48bcc0>

In [52]:
q.pop()

Item('bar')

函数 heapq.heappush() 和 heapq.heappop() 分别在队列 queue 上插入和删除第一个元素，并且队列 queue 保证 第一个元素拥有最小优先级 (1.4 节已经讨论过这个问题)。 heappop() 函数总是返回” 最小的” 的元素，这就是保证队列 pop 操作返回正确元素的关键。另外，由于 push 和 pop 操作时间复杂度为 O(log N)，其中 N 是堆的大小，因此就算是 N 很大的时候它们 运行速度也依旧很快。

# 1.6 在字典中将健映射到多个值上

怎样实现一个键对应多个值的字典 (也叫 multidict )?

一个字典就是一个键对应一个单值的映射。如果你想要一个键映射多个值，那么你 就需要将这多个值放到另外的容器中，比如列表或者集合里面。比如，你可以像下面 这样构造这样的字典

In [54]:
d={
'a' : [1, 2, 3],
'b' : [4, 5] }
e={
'a' : {1, 2, 3},
'b' : {4, 5} }

In [55]:
d

{'a': [1, 2, 3], 'b': [4, 5]}

In [56]:
from collections import defaultdict
testing_dic = defaultdict(list)
testing_dic['a'].append(1)
testing_dic['c'].append(50)
testing_dic['a'].append(4)
testing_dic

defaultdict(list, {'a': [1, 4], 'c': [50]})

# 1.7 让字典保持有序

创建一个字典，并且在迭代或序列化这个字典的时候能够控制元素的顺序。

为了能控制一个字典中元素的顺序，你可以使用 collections 模块中的OrderedDict 类。
在迭代操作的时候它会保持元素被插入时的顺序.

In [62]:
from collections import OrderedDict 

def ordered_dict():
    d = OrderedDict() 
    d['foo'] = 1 
    d['bar'] = 5
    d['spam'] = 3
    d['grok'] = 4
    # Outputs "foo 1", "bar 5", "spam 3", "grok 4" 按照先后顺序
    for key in d: 
        print(key, d[key])

In [63]:
ordered_dict()

foo 1
bar 5
spam 3
grok 4


OrderedDict 内部维护着一个根据键插入顺序排序的双向链表。每次当一个新的元 素插入进来的时候，它会被放到链表的尾部。对于一个已经存在的键的重复赋值不会 改变键的顺序。

# 1.8 字典的运算

In [66]:
prices = { 
    'ACME': 45.23,
    'AAPL': 612.78,
    'IBM': 205.55, 
    'HPQ': 37.20, 
    'FB': 10.75
}

方法一：可以使用 zip() 和 sorted() 函数来排列字典数据

In [67]:
min_price = min(zip(prices.values(), prices.keys())) 
min_price

(10.75, 'FB')

In [69]:
min_test = min(prices)
min_test

'AAPL'

In [70]:
prices_sorted = sorted(zip(prices.values(), prices.keys()))
prices_sorted

[(10.75, 'FB'),
 (37.2, 'HPQ'),
 (45.23, 'ACME'),
 (205.55, 'IBM'),
 (612.78, 'AAPL')]

执行这些计算的时候，需要注意的是 zip() 函数创建的是一个只能访问一次的迭 代器。

方法二：可以在 min() 和 max() 函数中提供 key 函数参数来获取最小值或最大值对应的键的信息。

In [73]:
min(prices, key=lambda k: prices[k]) 

'FB'

In [74]:
max(prices, key=lambda k: prices[k])

'AAPL'

但是，如果还想要得到最小值，你又得执行一次查找操作

In [76]:
min_value = prices[min(prices, key=lambda k: prices[k])]
min_value

10.75

综上所述，还是第一种方法比较好。

# 1.9 在两个字典中寻找相同点

怎样在两个字典中寻寻找相同点 (比如相同的键、相同的值等等)?

In [77]:
a={
'x' : 1,
'y' : 2,
'z' : 3 }
b={
'w' : 10,
'x' : 11,
'y' : 2 }

In [78]:
a.keys() & b.keys() # Find keys in common

{'x', 'y'}

In [79]:
a.keys() - b.keys() # Find keys in a that are not in b

{'z'}

In [80]:
a.items() & b.items() # Find (key,value) pairs in common

{('y', 2)}

In [84]:
a.values() & b.values()

TypeError: unsupported operand type(s) for &: 'dict_values' and 'dict_values'

这些操作也可以用于修改或者过滤字典元素。比如，假如你想以现有字典构造一个
排除几个指定键的新字典。

In [90]:
c = {key: a[key] for key in a.keys()-{'z','w'}}  # Make a new dictionary with certain keys removed
c

{'x': 1, 'y': 2}

In [91]:
c = {key: a[key] for key in a.keys()-{'z','x'}}  # Make a new dictionary with certain keys removed
c

{'y': 2}

1: 字典的 keys() 方法返回一个展现 键集合的键视图对象。键视图的一个很少被了解的特性就是它们也支持集合操作，比 如集合并、交、差运算。所以，如果你想对集合的键执行一些普通的集合操作，可以 直接使用键视图对象而不用先将它们转换成一个 set。

2: 字典的 items() 方法返回一个包含 (键，值) 对的元素视图对象。这个对象同样也 支持集合操作，并且可以被用来查找两个字典有哪些相同的键值对。

3: 字典的 values() 方法也是类似，但是它并不支持这里介绍的集合操作。某 种程度上是因为值视图不能保证所有的值互不相同，这样会导致某些集合操作会出现 问题。不过，如果你硬要在值上面执行这些集合操作的话，你可以先将值集合转换成 set，然后再执行集合运算就行了。

# 1.10： 从序列中移除重复项且保持元素间顺序不变

怎样在一个序列上面保持元素顺序的同时消除重复的值?

情况一：如果序列上的值都是 hashable 类型，那么可以很简单的利用集合或者生成器来解决这个问题。

（如果一个对象是哈希的，那么在它的生存期内必须是不可变的，它需要一个__hash__()方法，整数，浮点数，字符串，元祖都是不可变的。）