| [`namedtuple()`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.namedtuple) | 创建命名元组子类的工厂函数                                   |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| [`deque`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.deque) | 类似列表(list)的容器，实现了在两端快速添加(append)和弹出(pop) |
| [`ChainMap`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.ChainMap) | 类似字典(dict)的容器类，将多个映射集合到一个视图里面         |
| [`Counter`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.Counter) | dict subclass for counting [hashable](https://docs.python.org/zh-cn/3.10/glossary.html#term-hashable) objects |
| [`OrderedDict`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.OrderedDict) | 字典的子类，保存了他们被添加的顺序                           |
| [`defaultdict`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.defaultdict) | 字典的子类，提供了一个工厂函数，为字典查询提供一个默认值     |
| [`UserDict`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.UserDict) | 封装了字典对象，简化了字典子类化                             |
| [`UserList`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.UserList) | 封装了列表对象，简化了列表子类化                             |
| [`UserString`](https://docs.python.org/zh-cn/3.10/library/collections.html?highlight=collections#collections.UserString) | 封装了字符串对象，简化了字符串子类化                         |

In [54]:
# ChainMap 对象
# 一个ChainMap类是为了将多个映射快速的链接到一起，这样它们可以作为一个单元处理。
# 它通常比创建一个新的字典和多次调用update()要快很多。

# class collections.ChainMap(*maps)

# maps 一个可以更新的映射列表。
# new_child(m=None, **kwargs) 返回一个新的ChainMap,其中包含一个新的映射，后面跟随当前实例中的所有映射。
# 如果指定了 m，它会成为新的映射加在映射列表的前面；
# 如果未指定，则会使用一个空字典，因此调用 d.new_child() 就等价于 ChainMap({}, *d.maps)。
# parents 属性返回一个新的ChainMap包含所有的当前实例的映射，除了第一个。
from collections import ChainMap
from itertools import chain

baseline = {'music': 'bach', 'art': 'rembrandt'}
adjustments = {'art': 'van gogh', 'opera': 'carmen'}
list(ChainMap(adjustments, baseline))
# list(chain(baseline, adjustments))

# 上面的操作同以下操作
combined = baseline.copy()
combined.update(adjustments)
list(combined)

# c = ChainMap()        # Create root context
# d = c.new_child()     # Create nested child context
# e = c.new_child()     # Child of c, independent from d
# e.maps[0]             # Current context dictionary -- like Python's locals()
# e.maps[-1]            # Root context -- like Python's globals()
# e.parents             # Enclosing context chain -- like Python's nonlocals

# class DeepChainMap(ChainMap):
#     'Variant of ChainMap that allows direct updates to inner scopes'

#     def __setitem__(self, key, value):
#         for mapping in self.maps:
#             if key in mapping:
#                 mapping[key] = value
#                 return
#         self.maps[0][key] = value
#         print(self.maps[0])

#     def __delitem__(self, key):
#         for mapping in self.maps:
#             if key in mapping:
#                 del mapping[key]
#                 return
#         raise KeyError(key)

# d = DeepChainMap({'zebra': 'black'}, {'elephant': 'blue'}, {'lion': 'yellow'})
# d['lion'] = 'orange'
# d['snake'] = 'red'
# del d['elephant']
# d
d = ChainMap({'zebra': 'black'}, {'elephant': 'blue'}, {'lion': 'yellow'})
d['lion'] = 'orange'
d.new_child({'f': 'b'})
d = ChainMap(1, 2, 3)
d

ChainMap(1, 2, 3)

In [87]:
# Counter 对象
# 一个计数器工具提供快速和方便的计数。比如
from collections import Counter

cnt = Counter()
for word in ['red', 'blue', 'red', 'green', 'blue', 'blue']:
    cnt[word] += 1
cnt

import re
# word = re.findall(r'\w+', open(r'C:\Users\Administrator\Desktop\test.txt', encoding='utf8').read())
# Counter(word).most_common(2)
# [('这是我们一直以来坚信并信任的祖国', 1), ('我相信他一定会带我们走向更加繁荣富强的时代', 1)]

# class collections.Counter([iterable-or-mapping])
# 元素从一个iterable被计数或从其他的mapping（or counter）初始化：
c = Counter()
c = Counter('gallahad') # Counter({'g': 1, 'a': 3, 'l': 2, 'h': 1, 'd': 1})
c = Counter({'red': 4, 'blue': 2}) # Counter({'red': 4, 'blue': 2})
c = Counter(cats=4, dogs=8)  # Counter({'cats': 4, 'dogs': 8})

## elements()
# 返回一个迭代器，其中每个元素将重复出现计数值所指定次。元素会按首次出现的顺序返回。如果一个元素计数值小于1，elements()将会忽略它。
c = Counter(a=4, b=2, c=0, d=-2)
sorted(c.elements())
# ['a', 'a', 'a', 'a', 'b', 'b']
list(c.elements())
# ['a', 'a', 'a', 'a', 'b', 'b']

## most_common([n])
# 返回一个列表，其中包含n个常见的元素及出现次数，按常见程度由高到低排序。
Counter('abracadabra').most_common(3)
# [('a', 5), ('b', 2), ('r', 2)]

## subtract([iterable-or-mapping])
# 从迭代对象或映射对象减去元素。像dict.update()，但是是减去，而不是替换。输入输出都可以是0或负数。
c = Counter(a=4, b=2, c=0, d=-2)
# Counter({'a': 4, 'b': 2, 'c': 0, 'd': -2})
d = Counter(a=1, b=2, c=3, d=4)
# Counter({'a': 1, 'b': 2, 'c': 3, 'd': 4})
c.subtract(d)
# Counter({'a': 3, 'b': 0, 'c': -3, 'd': -6})
c = Counter([1, 2, 3, 2])
c.subtract([1])
# Counter({1: 0, 2: 2, 3: 1})

## total()
# 计算总计数值。
c = Counter(a=10, b=5, c=0)

# c.total() 3.10版本更新

## fromkeys(iterable)
## update([iterable-or-mapping])
# 从迭代对象计数元素或者从另一个映射对象或计数器添加。
# 计数对象支持相等性、子集和超集关系等富比较运算符: ==, !=, <, <=, >, >=。 
# 所有这些检测会将不存在的元素当作计数值为零，因此 Counter(a=1) == Counter(a=1, b=0) 将返回真值。
c = Counter(a=3, b=1)
d = Counter(a=1, b=2)
c + d
# Counter({'a': 4, 'b': 3})
c & d # intersection:  min(c[x], d[x])
# Counter({'a': 1, 'b': 1})
c | d # intersection:  max(c[x], d[x])
# Counter({'a': 3, 'b': 2})
c == d   
# False
c = Counter(a=2, b=-4)
+c
# Counter({'a': 2})
-c
# Counter({'b': 4})

Counter({'b': 4})

In [107]:
# deque 对象
# class collections.deque([iterable[,maxlen]])
# 返回一个新的双向队列对象，从左往右初始化（用方法append())，从iterable数据创建。
# 如果iterable没有指定，新队列为空。
## append(x) 添加x到右端
## appendleft(x) 添加到左端
## clear() 移除所有元素，使其长度为0
## copy() 创建一份浅拷贝
## count(x) 计算deque中元素等于x的个数
## extend(iterable) 扩展deque的右侧，通过添加iterable参数中的元素
## extendleft(iterable) 扩展deque的左侧，通过添加iterable参数中的元素，注意，左添加时，在结果中iterable参数中的顺序将被反过来添加。
## index(x[,start[,stop]]) 返回x在deque中的位置
## insert(i, x) 在位置i插入x
## pop() 移去并且返回一个元素，deque 最右侧的那一个。 如果没有元素的话，就引发一个 IndexError
## popleft() 移去并且返回一个元素，deque 最左侧的那一个。 如果没有元素的话，就引发 IndexError
## remove() 移除找到的第一个value
## reverse() 将deque逆序
## rotate(n=1) 向右循环移动 n 步。 如果 n 是负数，就向左循环。
# 如果deque不是空的，向右循环移动一步就等价于 d.appendleft(d.pop()) ，
# 向左循环一步就等价于 d.append(d.popleft()) 。
# maxlen deque的最大尺寸，如果没有限定的话就是NOne
from collections import deque

d = deque('ghi')
for elem in d:
    print(elem.upper())
# G
# H
# I

d.append('j')
d.appendleft('f')
# deque(['g', 'h', 'i', 'j'])

d.pop() 
# 'j'
d.popleft()
# 'g'
d
# deque(['g', 'h', 'i'])
d[0]
# 'g'
d[-1]
# 'i'
list(reversed(d)) 
# ['i', 'h', 'g']

'h' in d  
# True
d.extend('jkl') 
d
# deque(['g', 'h', 'i', 'j', 'k', 'l'])
d.rotate(1)
d
# deque(['l', 'g', 'h', 'i', 'j', 'k'])
d.rotate(-1)
d
# deque(['g', 'h', 'i', 'j', 'k', 'l'])
d.clear()
d
# deque([])
d.extendleft('abc')
d
# deque(['c', 'b', 'a'])

##### deque用法 #####
##### 第一种用法 ： 实现tail(n) 功能
def tail(filename, n=5):
    'Return the last n lines of a file'
    with open(filename) as f:
        return deque(f, n)
    
# tail(r"C:\Users\Administrator\Desktop\test.txt")
# deque(['efe\n', 'fef\n', 'aef\n', 'efe\n', 'a'], maxlen=5)

import itertools
##### 第二种用法：维护一个惊奇添加元素的序列，通过从右边添加和从左边弹出
def moving_average(iterable, n=3):
    # moving_average([40, 30, 50, 46, 39, 44]) --> 40.0 42.0 45.0 43.0
    # https://en.wikipedia.org/wiki/Moving_average
    it = iter(iterable)
    d = deque(itertools.islice(it, n-1))
    d.appendleft(0)
    s = sum(d)
    for elem in it:
        s += elem - d.popleft()
        d.append(elem)
        yield s / n
list(moving_average([1, 2, 3, 4]))

G
H
I


[2.0, 3.0]

In [126]:
# defaultdict对象
# class collections.defaultdict(default_factory=None,/[...])
# 返回一个新的类似字典的对象。
# 本对象包含一个名为default_factory的属性，构造时，第一个参数用于为该属性提供初始值，默认为None。
## __missing__(key)
## 如果default_factory属性为None，则调用本方法会抛出KeyError异常。
## default_factory
## 本属性有__missing__()调用。如果构造对象时提供了第一个参数，则本属性会被初始化成那个参数
from collections import defaultdict

# 使用list作为default_factory，很轻松的将 kv对序列转换为 字典
s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]
d = defaultdict(list)

for k, v in s:
    d[k].append(v)

sorted(d.items())
# [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]
d = {}
for k, v in s:
    d.setdefault(k, []).append(v)
sorted(d.items())
# [('blue', [2, 4]), ('red', [1]), ('yellow', [1, 3])]

s = 'mississippi'
d = defaultdict(int)
for k in s:
    d[k] += 1

sorted(d.items())

def constant_factory(value):
    return lambda: value
d = defaultdict(constant_factory('<missing>'))
d.update(name='John', action='ran')
'%(name)s %(action)s to %(object)s' % d
# 'John ran to <missing>'

s = [('red', 1), ('blue', 2), ('red', 3), ('blue', 4), ('red', 1), ('blue', 4)]
d = defaultdict(set)
for k, v in s:
    d[k].add(v)

sorted(d.items())


[('blue', {2, 4}), ('red', {1, 3})]

In [147]:
### namedtuple() 命名元祖的工厂函数
# 命名元组赋予每个位置一个含义，提供可读性和自文档性。它们可以用于任何普通元组，并添加了通过名字获取值的能力，通过索引值也是可以的。
# collections.namedtuple(typename, field_names, *, rename=False, defaults=None, module=None)
# 返回一个新的元组子类，名为 typename 。
# 这个新的子类用于创建类元组的对象，可以通过字段名来获取属性值，同样也可以通过索引和迭代获取值。
# 子类实例同样有文档字符串（类名和字段名）另外一个有用的 __repr__() 方法，以 name=value 格式列明了元组内容。
# field_names 是一个像 [‘x’, ‘y’] 一样的字符串序列。
# 另外 field_names 可以是一个纯字符串，用空白或逗号分隔开元素名，比如 'x y' 或者 'x, y' 。
# 任何有效的Python 标识符都可以作为字段名，除了下划线开头的那些。
# 有效标识符由字母，数字，下划线组成，但首字母不能是数字或下划线，另外不能是关键词 keyword 比如 class, for, return, global, pass, 或 raise 。
# 如果 rename 为真， 无效字段名会自动转换成位置名。
# 比如 ['abc', 'def', 'ghi', 'abc'] 转换成 ['abc', '_1', 'ghi', '_3'] ， 消除关键词 def 和重复字段名 abc 。
# defaults 可以为 None 或者是一个默认值的 iterable 。
# 如果一个默认值域必须跟其他没有默认值的域在一起出现，defaults 就应用到最右边的参数。
# 比如如果域名 ['x', 'y', 'z'] 和默认值 (1, 2) ，那么 x 就必须指定一个参数值 ，y 默认值 1 ， z 默认值 2 。
# 如果 module 值有定义，命名元组的 __module__ 属性值就被设置。
# 命名元组实例没有字典，所以它们要更轻量，并且占用更小内存。
# 要支持封存操作，应当将命名元组类赋值给一个匹配 typename 的变量。
from collections import namedtuple
Point = namedtuple('Point', ['x', 'y'])
p = Point(11, y=22)
p[0] + p[1]
# 33

x, y = p
x, y
# (11, 22)

p.x + p.y
# 33

p
# Point(x=11, y=22)

EmployeeRecord = namedtuple('EmployeeRecord', 'name, age, title, department, paygrade')

### classmethod somenamedtuple._make(iterable)
t = [11, 22]
Point._make(t)
# Point(x=11, y=22)

### somenamedtuple._asdict()
p = Point(x=11, y=22)
p._asdict()
# {'x': 11, 'y': 22}
# somenamedtuple._replace(**kwargs) 返回一个新的命名元组实例，并将指定域替换为新的值
p = Point(x=11, y=22)
p._replace(x=33)
# Point(x=33, y=22)

# somenamedtuple._fields
# 字符串元组列出了字段名。用于提醒和从现有元组创建一个新的命名元组类型。
p._fields            # view the field names
# ('x', 'y')
Color = namedtuple('Color', 'red green blue')
Pixel = namedtuple('Pixel', Point._fields + Color._fields)
Pixel(11, 22, 128, 255, 0)
# Pixel(x=11, y=22, red=128, green=255, blue=0)

# somenamedtuple._field_defaults 字典将字段名称映射到默认值。
Account = namedtuple('Account', ['type', 'balance'], defaults=[0, 1])
Account._field_defaults
# {'balance': 0}
Account('premium')
# Account(type='premium', balance=0)

# 想要获取这个名字与使用getattr()函数
getattr(p, 'x')
# 11

d = {'x':11, 'y':22}
Point(**d)
# Point(x=11, y=22)

# __slots__为一个空元组，通过阻止创建实例字典保持较低的内存开销
class Point(namedtuple('Point', ['x', 'y'])):
    __slots__ = ()
    @property
    def hypot(self):
        return (self.x ** 2 + self.y ** 2) ** 0.5
    def __str__(self):
        return 'Point: x=%6.3f  y=%6.3f  hypot=%6.3f' % (self.x, self.y, self.hypot)

for p in Point(3, 4), Point(14, 5/7):
    print(p)

Point3D = namedtuple('Point3D', Point._fields + ('z',))

Point: x= 3.000  y= 4.000  hypot= 5.000
Point: x=14.000  y= 0.714  hypot=14.018


In [149]:
### OrderedDict 对象
# 有序词典就像常规词典一样，但有一些与排序操作相关的额外功能。
# 由于内置的 dict 类获得了记住插入顺序的能力（在 Python 3.7 中保证了这种新行为），它们变得不那么重要了。
# class collections.OrderedDict([items]) 返回一个 dict 子类的实例，它具有专门用于重新排列字典顺序的方法。
# popitem(last=True)
# 有序字典的 popitem() 方法移除并返回一个 (key, value) 键值对。 
# 如果 last 值为真，则按 LIFO 后进先出的顺序返回键值对，否则就按 FIFO 先进先出的顺序返回键值对。
# move_to_end(key, last=True)
# 将一个现有的key移到有序字典的任一端
# 如果 last 为真值（默认）则将条目移到右端，或者如果 last 为假值则将条目移到开头。 如果 key 不存在则会引发 KeyError:
from collections import OrderedDict
d = OrderedDict.fromkeys('abcde')
d.move_to_end('b')
''.join(d)
# 'acdeb'
d.move_to_end('b', last=False)
''.join(d)
# 'bacde'

'acdeb'

In [155]:
## UserDict对象
# UserDict 类是用作字典对象的外包装。
# 对这个类的需求已部分由直接创建 dict 的子类的功能所替代；
# 不过，这个类处理起来更容易，因为底层的字典可以作为属性来访问。
# class collections.UserDict([initialdata])
# 模拟字典的类。
## data 一个真实的字典，用于保存UserDict类的内容

from collections import UserDict

data = {}
u = UserDict(data)
u['a'] = 'a'
u.values


<bound method Mapping.values of {'a': 'a'}>

In [None]:
## UserList
# 这个类封装了列表对象。
# 它是一个有用的基础类，对于你想自定义的类似列表的类，可以继承和覆盖现有的方法，也可以添加新的方法。
# 这样我们可以对列表添加新的行为。
# 对这个类的需求已部分由直接创建 list 的子类的功能所替代；
# 不过，这个类处理起来更容易，因为底层的列表可以作为属性来访问。

# class collections.UserList([list])
# 模拟一个列表。这个实例的内容被保存为一个正常列表，通过 UserList 的 data 属性存取。
# 实例内容被初始化为一个 list 的copy，默认为 [] 空列表。 
# list 可以是迭代对象，比如一个Python列表，或者一个 UserList 对象。

# UserList 提供了以下属性作为可变序列的方法和操作的扩展:
# data
# 一个 list 对象用于存储 UserList 的内容。