### collections.Counter —— 自动统计计数

In [None]:
from collections import Counter

c = Counter()
c['a'] += 1
c.update(['a', 'b', 'a'])  # 批量更新计数
print(c)  # Counter({'a': 3, 'b': 1})


### 词频统计

In [None]:
text = "apple banana apple orange banana apple"
counter = Counter(text.split())
print(counter)  # Counter({'apple': 3, 'banana': 2, 'orange': 1})

### most_common([n]) — 获取最常见元素

In [8]:
from collections import Counter

c = Counter("bananatree")
print(c)
print(c.most_common(3))


Counter({'a': 3, 'n': 2, 'e': 2, 'b': 1, 't': 1, 'r': 1})
[('a', 3), ('n', 2), ('e', 2)]


In [9]:
print(c.most_common(3)[-1][0]) # 获取第三大的value对应的key
print(type(c.most_common(3)[0]))
print(c.most_common()[0][1]) #获取最高的频数

e
<class 'tuple'>
3


### most_common([n]) — 获取最不常见元素

In [12]:
from collections import Counter

In [13]:
c = Counter("112233344")

In [15]:
c.most_common()

[('3', 3), ('1', 2), ('2', 2), ('4', 2)]

In [18]:
c.most_common()[-1][1] == min(c.values())

True

In [19]:
[key for key, value in c.items() if value == min(c.values())]

['1', '2', '4']

### elements() — 将元素按出现次数展开成可迭代对象

In [None]:
c = Counter({'a': 2, 'b': 1})
print(list(c.elements()))  # ['a', 'a', 'b']

### update() — 类似 dict.update()，但会自动加上数量

In [None]:
c = Counter("apple")
c.update("pear")
print(c)  # Counter({'p': 2, 'a': 2, 'l': 1, 'e': 2, 'r': 1})

### subtract() — 和 update() 相反，减少计数

In [None]:
c = Counter("apple")
c.subtract("pl")
print(c)  # Counter({'a': 1, 'p': 1, 'l': 0, 'e': 1})

### 数学操作：+, -, &, |

In [None]:
c1 = Counter(a=3, b=1)
c2 = Counter(a=1, b=2, c=1)
print(c1 + c2)  # Counter({'a': 4, 'b': 3, 'c': 1})
print(c1 - c2)  # Counter({'a': 2})
print(c1 & c2)  # Counter({'a': 1, 'b': 1})
print(c1 | c2)  # Counter({'a': 3, 'b': 2, 'c': 1})

### c.clear()         # 清空计数器

In [None]:
c = Counter({'a': 1})  # 直接初始化

In [None]:
dict(c)  # 可以转换为普通字典

### 集合之间比大小

In [None]:
from collections import Counter

c1 = Counter(a=1, b=3, c=2)
c2 = Counter(a=1, b=2, c=1)

print(c2 <= c1)  # True  -- 所有元素的计数都小于等于 c1


### get(key, default)

####  `.get(key, default)` 方法

`Counter` 继承了字典的 `.get()` 方法，用法如下：

```python
count = c.get(key, default)
```

* `key`：你想查找的元素
* `default`：如果 `key` 不存在，返回这个默认值
* 返回值：元素的计数，如果不存在则返回 `default`（默认是 `None`）



In [1]:
from collections import Counter

c = Counter(['a', 'b', 'b', 'c', 'c', 'c'])

# 已存在的 key
print(c.get('b'))  # 输出 2

# 不存在的 key
print(c.get('d'))  # 输出 None

# 不存在的 key，指定默认值
print(c.get('d', 0))  # 输出 0


2
None
0
