介绍了collection模块中提供的一些数据容器

### 1. Counter

Counter 是一个有助于 hashable 对象计数的 dict 子类。它是一个无序的集合，其中 hashable 对象的元素存储为字典的键，它们的计数存储为字典的值

In [2]:
from collections import Counter

In [4]:
text = "It is a good day! I have a good mood!"
text_counter = Counter(text.split())

In [5]:
# 最高频的5个字段
text_counter.most_common(5)

[('a', 2), ('good', 2), ('It', 1), ('is', 1), ('day!', 1)]

In [10]:
# 所有元素,其顺序是任意的
list(text_counter.elements())

['It', 'is', 'a', 'a', 'good', 'good', 'day!', 'I', 'have', 'mood!']

In [11]:
# Counter中的计数可为0和负数
# 若要删除某个计数为0或负数的元素，需用del
c = Counter(a=4, b=2, c=0, d=-2)
print(c)
del c['c']
print(c)

Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})
Counter({'a': 4, 'b': 2, 'd': -2})


In [12]:
# 两个counter之间可进行substract操作，即查两个对应元素之间的数量差，返回给第一个dict
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.subtract(d)     # 返回给c
c

Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})

In [13]:
# 两个counter之间可进行update更新操作，即查两个对应元素之间的数量和（而非直接替换更新），返回给第一个dict
# 而普通字典的update是直接更新
c = Counter(a=4, b=2, c=0, d=-2)
d = Counter(a=1, b=2, c=3, d=4)
c.update(d)     # 返回给c
c

Counter({'a': 5, 'b': 4, 'c': 3, 'd': 2})

In [14]:
# 两个counter之间的数学操作,会忽略掉结果为0或负数的结果
c = Counter(a=3, b=1)
d = Counter(a=1, b=2)
print(c + d)    # 和
print(c - d)    # 差，忽略0或负数
print(c & d)    # min
print(c | d)    # max

Counter({'a': 4, 'b': 3})
Counter({'a': 2})
Counter({'a': 1, 'b': 1})
Counter({'a': 3, 'b': 2})


### 2. defaultdict

defaultdict 是内建 dict 类的子类，它覆写了一个方法并添加了一个可写的实例变量。
defaultdict() 第一个参数提供了 default_factory 属性的初始值，默认值为 None，default_factory 属性值将作为字典的默认数据类型。所有剩余的参数与字典的构造方法相同，包括关键字参数。
同样的功能使用 defaultdict 比使用 dict.setdefault 方法快。

In [9]:
# defaultdict避免在进行dict的get或索引操作时出现keyerror的问题
from collections import defaultdict
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)
for k, v in s:
    d[k].append(v)     # 并没有报错
d.items()

dict_items([('yellow', [1, 3]), ('blue', [2, 4]), ('red', [1])])

### 3. orderdict

defaultdict 是内建 dict 类的子类，其能够记住插入的顺序

In [41]:
from collections import OrderedDict
A = OrderedDict()
A.update({"a":1})
A.update({"b":2})
print(A)

OrderedDict([('a', 1), ('b', 2)])


### 4. deque

双向队列对象,常用来实现队列或栈结果（虽然list中的append和insert可以模拟添加，pop和pop(0)能支持类栈和队列操作），但其效率不高，建议用双端队列实现

In [17]:
from collections import deque

#### 4.1 添加操作

In [18]:
# 右端添加append
d = deque('ghi') 
d.append('j')
print(d)

deque(['g', 'h', 'i', 'j'])


In [20]:
# 左端添加appendleft
d = deque('ghi') 
d.appendleft('f')
print(d)

deque(['f', 'g', 'h', 'i'])


In [21]:
# 中间插入insert
d = deque('ghi') 
d.insert(2, 'z')
print(d)

deque(['g', 'h', 'z', 'i'])


In [26]:
# 从右端添加iterable可迭代对象extend
d = deque('ghi') 
d.extend('xyz')
print(d)

deque(['g', 'h', 'i', 'x', 'y', 'z'])


In [27]:
# 从左端添加iterable可迭代对象extendleft
d = deque('ghi') 
d.extendleft('xyz')
print(d)

deque(['z', 'y', 'x', 'g', 'h', 'i'])


#### 4.2 弹出操作

In [22]:
# 右端弹出pop
d = deque('ghi') 
d.pop()
print(d)

deque(['g', 'h'])


In [23]:
# 左端弹出pop
d = deque('ghi') 
d.popleft()
print(d)

deque(['h', 'i'])


In [25]:
# 取出找到的第一个value
d = deque('ghghi') 
d.remove('h')
print(d)

deque(['g', 'g', 'h', 'i'])


#### 4.3 拷贝

In [28]:
d = deque('ghghi') 
e = d.copy()   # 浅拷贝
e

deque(['g', 'h', 'g', 'h', 'i'])

#### 4.4 切片

In [34]:
# 指定index(value[, start[, stop]])，即再start和stop之间第一个value对应的index
# 若未找到，报错
d = deque('ghghi') 
d.index('g',0,4)

0

#### 4.5 计数

In [35]:
d = deque('ghghi') 
d.count('g')

2

#### 4.6 清除元素

In [36]:
d = deque('ghghi') 
d.clear()
d

deque([])

#### 4.7 指定最大长度

In [37]:
# 可以通过指定参数maxlen来规定deque的最大长度，若未指定默认None即长度任意

#### 4.8 rotate

In [40]:
# rotate(n=1), 向右循环移动 n 步。 如果 n 是负数，就向左循环。
# 如果deque不是空的，向右循环移动一步就等价于 d.appendleft(d.pop()) ， 
# 向左循环一步就等价于 d.append(d.popleft())
import copy
d = deque('ghghi') 
print(d)
d1 = copy.deepcopy(d)
d1.rotate(1)
print(d1)
d2 = copy.deepcopy(d)
d2.rotate(-1)
print(d2)

deque(['g', 'h', 'g', 'h', 'i'])
deque(['i', 'g', 'h', 'g', 'h'])
deque(['h', 'g', 'h', 'i', 'g'])


#### 5. 命名元组namedtuple

命名元组赋予每个位置一个含义，提供可读性和自文档性。从而可以通过名字进行元组内的索引

In [42]:
from collections import namedtuple
Point = namedtuple('Point', ['x', 'y'])   # 表示点坐标的命名元组
p = Point(11, y=22)
print(p[0]+p[1])
print(p.x+p.y)

33
33
