# collections

## 一、namedtuple
具名元组 -- 定义具名元组后，可以用name.attr 访问，而不需要用索引

> arg_name = namedtuple('name', ['x', 'y', 'z', attr_list]) <br>
   a = arg_name(1,2,3)<br>
   output: name(x=1,y=2,z=3)<br>
   可以通过arg_name.x访问， 也可以用索引访问

In [5]:
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])  # class type

p = Point(1,2)  # Point(x=1, y=2) 获得一个具名元组
print(p)
print(p.x)
print(p[1])

Point(x=1, y=2)
1
2


In [8]:
Circle = namedtuple('Circle', ['x', 'y', 'r'])  # 用坐标，半径定义一个圆

c = Circle(1,2,3)
print(c)


Circle(x=1, y=2, r=3)


## 二、deque
使用list存储数据时，按索引访问元素很快，但是插入和删除元素就很慢了，因为list是线性存储，数据量大的时候，插入和删除效率很低。

deque是为了高效实现插入和删除操作的双向列表，适合用于队列和栈：__可以实现先进先出，先进后出__


In [15]:
from collections import deque

lyst = deque([1,2,3,4,5])  # define a list
# print(lyst)  deque([1, 2, 3, 4, 5])

lyst.append(10)
print(lyst)

lyst.appendleft(0)
print(lyst)

lyst.pop()
print(lyst)

lyst.popleft()
print(lyst)

deque([1, 2, 3, 4, 5, 10])
deque([0, 1, 2, 3, 4, 5, 10])
deque([0, 1, 2, 3, 4, 5])
deque([1, 2, 3, 4, 5])


## 三、defaultdict
使用dict时，如果引用的Key不存在，就会抛出KeyError。如果希望key不存在时，__返回一个默认值__，就可以用defaultdict：



In [19]:
from collections import defaultdict

ddict = defaultdict(lambda:'this is default value')

ddict['name'] = 'xiaoming'
print(ddict['name'])

print(ddict['age'])  # age not existence

xiaoming
this is default value


## 四、OrderedDict
使用dict时，Key是无序的。在对dict做迭代时，我们无法确定Key的顺序。

如果要保持Key的顺序，可以用OrderedDict：

In [26]:
from collections import OrderedDict
lyst = [('a', 1),
        ('b', 2),
        ('d', 4),
        ('c', 5)]

ud = dict(lyst)
print(ud)
# ud[1]  KeyError

od = OrderedDict(lyst)
print(od)



{'a': 1, 'b': 2, 'd': 4, 'c': 5}
OrderedDict([('a', 1), ('b', 2), ('d', 4), ('c', 5)])


In [33]:
# 注意，OrderedDict的Key会按照插入的顺序排列，不是Key本身排序：

od2 = OrderedDict()
od2['z'] = 1
od2['y'] = 2
od2['x'] = 3
print(od2)
od2_list = list(od2.keys())
print(od2_list)

# --------------------------------------
ud2 = dict()
ud2['z'] = 1
ud2['y'] = 2
ud2['x'] = 3
print(ud2)
ud2_list = list(ud2.keys())
print(ud2_list)

OrderedDict([('z', 1), ('y', 2), ('x', 3)])
['z', 'y', 'x']
{'z': 1, 'y': 2, 'x': 3}
['z', 'y', 'x']


In [49]:
#  OrderedDict可以实现一个FIFO（先进先出）的dict，当容量超出限制时，先删除最早添加的Key：

class LastUpdatedOrderedDict(OrderedDict):

    def __init__(self, capacity):
        super(LastUpdatedOrderedDict, self).__init__()
        self._capacity = capacity

    def __setitem__(self, key, value):
        containsKey = 1 if key in self else 0
        if len(self) - containsKey >= self._capacity:
            last = self.popitem(last=False)
            print('remove:', last)
        if containsKey:
            del self[key]
            print('set:', (key, value))
        else:
            print('add:', (key, value))
        OrderedDict.__setitem__(self, key, value)
od = LastUpdatedOrderedDict(2)
od['a'] = 1
od['b'] = 2
od['c'] = 3


add: ('a', 1)
add: ('b', 2)
remove: ('a', 1)
add: ('c', 3)


## 五、counter

In [63]:
from collections import Counter

c = Counter()
for ch in 'counter test....':
    c[ch] = c[ch] + 1
print(c)
for k,v in list(c.items()):
    print(k,"---",v)

Counter({'.': 4, 't': 3, 'e': 2, 'c': 1, 'o': 1, 'u': 1, 'n': 1, 'r': 1, ' ': 1, 's': 1})
c --- 1
o --- 1
u --- 1
n --- 1
t --- 3
e --- 2
r --- 1
  --- 1
s --- 1
. --- 4


## 六、itertools


### 首先，我们看看itertools提供的几个“无限”迭代器

In [None]:
import itertools
natuals = itertools.count(1)
for n in natuals:
    print(n)
    if n > 10:
        break
# 如果不设置退出条件的话，会无限循环


In [75]:
# cycle： 把传入的一个序列进行无限循环

cs = itertools.cycle('abc')  # 字符串也是一种序列，
count = 0
for c in cs:
    print(c)
    count+=1
    if count == 10:
        break

a
b
c
a
b
c
a
b
c
a


repeat()负责把一个元素无限重复下去，不过如果提供第二个参数就可以限定重复次数：



In [77]:
ns = itertools.repeat('a', 5)  # 重复5次
for n in ns:
    print(n)

a
a
a
a
a


无限序列虽然可以无限迭代下去，但是通常我们会通过takewhile()等函数根据条件判断来截取出一个有限的序列：



In [79]:
natuals = itertools.count(1,step=2)
ns = itertools.takewhile(lambda x : x<=10, natuals)
print(list(ns))

[1, 3, 5, 7, 9]


chain() ---- 把一组可迭代对象串联起来，形成更大的迭代器


In [85]:
big_iter = itertools.chain('aaa','bbb','ccc')
print(list(big_iter))

big_iter2 = itertools.chain(range(10),range(10,15),'abc')
print(list(big_iter2))

for i in itertools.chain('abc','sss'):
    print(i)


['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'c']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 'a', 'b', 'c']
a
b
c
s
s
s


groupby()<br>
groupby()把迭代器中相邻的重复元素挑出来放在一起：



In [88]:
for key,group in itertools.groupby('aabbBEee'):
    print(key,'----', list(group))
    
# case insensitive
for key, group in itertools.groupby('aaAbbBeee', lambda x:x.upper()):
    print(key,'----', list(group))


a ---- ['a', 'a']
b ---- ['b', 'b']
B ---- ['B']
E ---- ['E']
e ---- ['e', 'e']
A ---- ['a', 'a', 'A']
B ---- ['b', 'b', 'B']
E ---- ['e', 'e', 'e']


练习<br>
计算圆周率可以根据公式：<br>

利用Python提供的itertools模块，我们来计算这个序列的前N项和：<br>


In [None]:
def pi(N):
    ' 计算pi的值 '
    # step 1: 创建一个奇数序列: 1, 3, 5, 7, 9, ...
    natuals_odd = itertools.count(1, step=2)

    # step 2: 取该序列的前N项: 1, 3, 5, 7, 9, ..., 2*N-1.
    odds = itertools.takewhile(lambda x:x <= 2*N-1, natuals_odd)
    
    # step 3: 添加正负符号并用4除: 4/1, -4/3, 4/5, -4/7, 4/9, ...
    map_odds = map(lambda x:((-1)**(x//2)) * 4 / )
    # step 4: 求和:
    return 3.14
