# 1.1 解压序列赋值给多个变量
* 问题：一个元组或者序列包含N个元素，将这些元素赋值给N个变量
* 方案：任何序列或者可迭代序列都可以通过一个直接赋值语句进行解压赋值给多变量
* 推广：这种解压赋值的方式可以应用于任何可迭代的对象上面，包括列表、元祖、字符串、文件对象、迭代器、生成器等。

In [1]:
p = (2,3,4)
x,y,z = p

In [3]:
x

2

In [4]:
y

3

In [5]:
data = ['ASD',90,9.9,(1,2,3)]
c,i,f,t = data

In [7]:
c

'ASD'

In [8]:
t

(1, 2, 3)

In [9]:
c,i,f,(t1,t2,t3) = data

In [11]:
c

'ASD'

In [12]:
i

90

In [13]:
t1

1

In [14]:
t3

3

In [15]:
s = 'ABCD'
a,b,c,d = s

In [16]:
a

'A'

In [17]:
d

'D'

* 有时候需要解压一部分，python没有提供特殊的方法，这时我们可以使用任意变量占位，然后丢掉这些变量即可

In [20]:
data = ['Lily',50,90.2,(2012,3,12)]
_, weight ,score , _ = data

In [21]:
weight

50

In [22]:
score

90.2

# 1.2解压可迭代对象赋值给多个变量
* 问题：如果一个可迭代对象元素的个数大于变量个数，会抛出一个ValueError，怎么解决？
* 方案：使用星号表达式来接收多个值。
* 注意：*args解压出来的数据类型永远为 列表

* 比如：一个元祖中存放着你的各科成绩，你想求取除了第一个和最后一个之外其他成绩的平均值
* *args用于中间

In [25]:
def drop_first_last(grade):
    first,*args,last = grade
    return sum(args)/len(args)

In [26]:
drop_first_last((90,78,89,59,89))

75.33333333333333

* *args用于末尾

In [27]:
record = ('Lily','Lily@qq.com','757-8558-1235','556-6464-5400')
name,email,*phone_num = record

In [28]:
name

'Lily'

In [29]:
email

'Lily@qq.com'

In [31]:
phone_num

['757-8558-1235', '556-6464-5400']

In [32]:
phone_num[1]

'556-6464-5400'

* *args用于开始

In [34]:
*score,last  = [10,8,9,45,12,3,2,1]

In [35]:
score

[10, 8, 9, 45, 12, 3, 2]

In [36]:
last

1

In [37]:
score[3]

45

* 星号表达式在迭代元素为可变长元祖的序列时很有用

In [38]:
record = [('foo',1,2),
         ('bar','hello'),
         ('foo',3,4)]

def do_foo(x,y):
    print('foo',x,y)
    
def do_bar(s):
    print('bar',s)

In [39]:
for tag,*args in record:
    if tag=='foo':
        do_foo(*args)
    else:
        do_bar(*args)

foo 1 2
bar hello
foo 3 4


* 星号表达式用于字符串分割
* 注意line.split()的用法

In [40]:
line = 'nobody:*:-2:-2:Unprivileged User:/var/empty:/user/bin/false'
uname,*fields,homedir,sh = line.split(':')

In [41]:
uname

'nobody'

In [42]:
fields

['*', '-2', '-2', 'Unprivileged User']

In [43]:
homedir

'/var/empty'

In [44]:
sh

'/user/bin/false'

* 其它用法

In [45]:
data1 = ['Lily',50,90.2,(3,12,2018)]
name,*_,(*_,year) = data1

In [46]:
name

'Lily'

In [49]:
_   #首先将50，90.2赋值给 _  ,然后又将3，12赋值给 _ ,原来的被覆盖

[3, 12]

In [50]:
year

2018

* 小测试（此测试性能并不好，只是用于学习该章节）

In [53]:
items = [4,5,9,10,3,16]

def Sum(items):
    header,*tail = items
    return header + Sum(tail) if tail else header

In [54]:
Sum(items)

47

# 1.3保留最后N个元素
* 问题：在迭代操作中怎样保留最后几个有限元素的历史纪录
* 方案：保留有限历史纪录是collections.deque所擅长的。deque(双端队列)

* 下面的代码 在多行上面做简单的文本匹配，并返回匹配所在行的最后几行
* 我们在写查找元素代码时，通常会使用包含yield表达式的生成器函数。这样可以将搜索过程的代码和使用搜索结果代码解耦

In [4]:
from collections import deque

def search(lines,pattern,history = 5):
    previous_lines = deque(maxlen=history)
    for line in lines:
        if pattern in line:
            yield line,previous_lines
        previous_lines.append(line)

if __name__ == '__main__':
    with open('data_file/test1_3.txt',encoding='utf-8') as f:
        for line,previous in search(f,'python',5):
            for pline in previous:
                print(pline ,end='')
            print(line,end='')
            print('-'*20)

my name is flfl
love python 
--------------------
my name is flfl
love python 
say hello
 to the world
 python nihao 
--------------------
say hello
 to the world
 python nihao 
yongyuan 
yanthon
pythonnn--------------------


* deque（maxlen = N）构造函数会建立一个固定大小为N的队列，当新的元素加入到队列中去并且队列已经满时，最老的元素就会被丢弃

In [5]:
q = deque(maxlen=3)
q.append(1)

In [6]:
q

deque([1])

In [7]:
q.append(2)
q.append(3)

q

deque([1, 2, 3])

In [8]:
q.append(4)
q

deque([2, 3, 4])

* 可以不指定deque() 的大小，这样可以创建一个无限大小的队列。
* 可以在两端进行添加和弹出操作
* append()右边添加、appebdleft()左边添加、pop()弹出最右边的元素、popleft()弹出最右边元素
# 注意：在队列两端插入删除元素复杂度为O(1),而在列表开头插入或者删除元素复杂度为O(n)

In [9]:
q = deque()
q.append(1)
q.append(2)
q.append(3)
q

deque([1, 2, 3])

In [10]:
q.appendleft(4)
q.appendleft(5)
q

deque([5, 4, 1, 2, 3])

In [11]:
q.pop()

3

In [12]:
q

deque([5, 4, 1, 2])

In [13]:
q.popleft()

5

In [14]:
q

deque([4, 1, 2])

# 1.4查找最大或者最小的N个元素
* 问题：从一个集合中获取最大或者最小的N个元素
* 方案：使用heapq模块的两个函数nlargest() 和 nsmallest()

In [24]:
import heapq

nums = [1,3,5,0,11,9,23,78,11,100,4]
n_large = heapq.nlargest(3,nums)
n_small = heapq.nsmallest(3,nums)
print(n_large)
print(n_small)

[100, 78, 23]
[0, 1, 3]


In [25]:
type(n_small)

list

* 两个函数都接受一个关键字参数用于更复杂的数据结构中

In [26]:
portfolio = [
{'name': 'IBM', 'shares': 100, 'price': 91.1},
{'name': 'AAPL', 'shares': 50, 'price': 543.22},
{'name': 'FB', 'shares': 200, 'price': 21.09},
{'name': 'HPQ', 'shares': 35, 'price': 31.75},
{'name': 'YHOO', 'shares': 45, 'price': 16.35},
{'name': 'ACME', 'shares': 75, 'price': 115.65}
]

cheap = heapq.nsmallest(3,portfolio,key=lambda s:s['price'])
expensive = heapq.nlargest(3,portfolio,key=lambda s:s['price'])

In [27]:
print(cheap)
print(expensive)

[{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]
[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]


* 在底层实现中，首先会将集合数据进行堆排序，然后放入到一个集合中

In [34]:
nums = [1,8,2,23,-4,18,23,43,21,2]
h = list(nums)
heapq.heapify(h)
h

[-4, 1, 2, 21, 2, 18, 23, 43, 23, 8]

* 堆数据结构最重要的特性是，堆的第一个元素永远是最小的。并且剩余的元素可以使用heapq.heappop()方法得到。该方法首先将第一个元素弹出，然后用下一个最小的元素取代弹出的元素。时间复杂度为O（logN）

In [35]:
heapq.heappop(h)

-4

In [36]:
heapq.heappop(h)

1

In [37]:
heapq.heappop(h)

2

In [38]:
heapq.heappop(h)

2

* 当查找的元素个数相对较小时，函数nlargest()和nsmallest()比较合适；
* 如果只想查找唯一的最小或者最大，函数min() 和max()比较合适；
* 如果N的大小和集合的大小接近，则通常先排序这个集合，然后利用切片更快。sorted(items)[:N]或者sorted(item)[-N:]

In [39]:
sorted(nums)[:3]

[-4, 1, 2]

In [40]:
heapq.nsmallest(3,nums)

[-4, 1, 2]

In [41]:
min(nums)

-4

In [49]:
sorted(nums)[-3:]

[23, 23, 43]

In [43]:
heapq.nlargest(3,nums)

[43, 23, 23]

# 实现一个优先队列
* 问题：实现一个按优先级排序的队列，并且每次使用pop操作总是返回优先级最高的那个元素
* 方案：利用heapq模块实现
* heapq.heappush()和heapq.heappop()函数插入或者弹出队列的第一个元素

In [66]:
import heapq
class PriorityQueue:
    def __init__(self):
        self._queue = []
        self._index = 0
    
    def push(self,item,priority):
        heapq.heappush(self._queue,(-priority,self._index,item))
        self._index +=1
    
    def pop(self):
        return heapq.heappop(self._queue)[-1]

In [67]:
class Item:
    def __init__(self,name):
        self.name = name
        
    def __repr__(self):
        return 'Item({!r})'.format(self.name)

In [68]:
q = PriorityQueue()
q.push(Item('foo'),1)
q.push(Item('bar'),5)
q.push(Item('spam'),4)
q.push(Item('grok'),2)
q.push(Item('kkk'),3)

In [69]:
q.pop()

Item('bar')

In [70]:
q.pop()

Item('spam')

In [71]:
q.pop()

Item('kkk')

In [72]:
q.pop()

Item('grok')

In [73]:
q.pop()

Item('foo')

In [74]:
q.pop()

IndexError: index out of range

In [75]:
#不指定优先级
a = Item('foo')
b = Item('bar')
a < b

TypeError: '<' not supported between instances of 'Item' and 'Item'

In [79]:
#指定优先级
a = (1,Item('foo'))
b = (3,Item('bar'))
a < b

True

In [81]:
c = (1,Item('kkk'))
c < a

TypeError: '<' not supported between instances of 'Item' and 'Item'

In [82]:
a = (1,0,Item('foo'))
b = (3,1,Item('bar'))
c = (1,2,Item('kkk'))
a < b

True

In [83]:
c < a

False

* 可以看出元祖在比较的时候会首先比较第一个元素，如果相同，则比较下一个元素

In [88]:
a = (1,'foo')
b = (2,'kkk')
a<b

True

In [89]:
a

(1, 'foo')

In [92]:
a = ('dbc')
b = ('bcd')
a < b

False

In [95]:
a = ('bcc')
b = ('bcd')
a < b

True

In [105]:
h = []
heapq.heappush(h,1)
heapq.heappush(h,2)
heapq.heappush(h,3)

In [106]:
h

[1, 2, 3]

In [107]:
heapq.heappop(h)

1

# 1.6字典中的键映射多个值