`defaultdict` 可以实现当访问字典中不存在的键时，不报错，而是调用工厂函数先初始化一个值，允许你进行下一步操作

- int 初始化为 0
- list, set 初始化为空列表、集合


In [None]:
from collections import defaultdict

string: str = "I love coding~"

# 将每个字符出现的次数初始化为 0
word_count: defaultdict[str, int] = defaultdict(int)

for word in string:
    word_count[word] += 1

# 打印出 defaultdict
print(word_count)

# 打印出正常的 dict
print(dict(word_count))


# 按照值进行排序从大到小输出
print(sorted(word_count, key=lambda x: word_count[x], reverse=True))

defaultdict(<class 'int'>, {'I': 1, ' ': 2, 'l': 1, 'o': 2, 'v': 1, 'e': 1, 'c': 1, 'd': 1, 'i': 1, 'n': 1, 'g': 1, '~': 1})
{'I': 1, ' ': 2, 'l': 1, 'o': 2, 'v': 1, 'e': 1, 'c': 1, 'd': 1, 'i': 1, 'n': 1, 'g': 1, '~': 1}
[' ', 'o', 'I', 'l', 'v', 'e', 'c', 'd', 'i', 'n', 'g', '~']


In [1]:
from collections import defaultdict
from typing import List, Tuple

items: List[Tuple[str, int]] = [("a", 1), ("a", 2), ("b", 3), ("c", 4), ("b", 2)]

word_equip: defaultdict[str, list] = defaultdict(list)

for item in items:
    word_equip[item[0]].append(item[1])

print(dict(word_equip))

{'a': [1, 2], 'b': [3, 2], 'c': [4]}


`counter` 支持对可迭代对象或字典进行快速统计，常用于元素频率统计。

- 内置 `update` 更新计数方法（如果是数据将数据统计个数更新到计数器中，如果是另一个 counter 则增加相同键值的计数）
- 内置 `most_common` 方法返回频率最高的元素
- 内置 `subtract` 方法减去可迭代对象或字典的计数


In [7]:
from collections import Counter

# 基础使用

# 统计字符串中每个字符出现的次数
word_count: Counter[str] = Counter("hello world")
print(word_count)

# 统计列表中每个元素出现的次数
word_count: Counter[str] = Counter(["a", "b", "a", "c", "b", "a"])
print(word_count)

# update 更新计数
word_count.update("hello")
print(word_count)

# 使用另一个 counter 更新计数
word_count.update(Counter("zzzongzii"))
print(word_count)

Counter({'l': 3, 'o': 2, 'h': 1, 'e': 1, ' ': 1, 'w': 1, 'r': 1, 'd': 1})
Counter({'a': 3, 'b': 2, 'c': 1})
Counter({'a': 3, 'b': 2, 'l': 2, 'c': 1, 'h': 1, 'e': 1, 'o': 1})
Counter({'z': 4, 'a': 3, 'b': 2, 'l': 2, 'o': 2, 'i': 2, 'c': 1, 'h': 1, 'e': 1, 'n': 1, 'g': 1})


In [None]:
# 使用另一个 counter 减去计数
word_count.subtract(Counter("zzzongzii"))
print(word_count)

# 使用一个字符串减去计数
word_count.subtract("hello")
print(word_count)

# 获取频率最高的三个元素
print(word_count.most_common(2))

Counter({'a': 3, 'b': 2, 'c': 1, 'h': -1, 'e': -1, 'l': -2, 'n': -2, 'g': -2, 'o': -3, 'i': -4, 'z': -8})
Counter({'a': 3, 'b': 2, 'c': 1, 'h': -2, 'e': -2, 'n': -2, 'g': -2, 'l': -4, 'o': -4, 'i': -4, 'z': -8})
[('a', 3), ('b', 2)]
<itertools.chain object at 0x11423ed40>


`OrderedDict` 可以实现有序字典，常用于需要保持插入顺序的场景。

- 内置 `move_to_end` 方法将指定键值对移动到末尾
- 内置 `popitem` 方法弹出末尾的键值对
- 内置 `fromkeys` 方法创建一个新字典，指定键值对
- 内置 `setdefault` 方法设置指定键值对，如果键不存在则创建
- 内置 `update` 方法更新指定键值对


In [14]:
from collections import OrderedDict

# 基础使用

# 创建一个有序字典
ordered_dict: OrderedDict[str, int] = OrderedDict()
ordered_dict["a"] = 1
ordered_dict["b"] = 2

print(ordered_dict)

# 移动键值对到末尾
ordered_dict.move_to_end("a")
print(ordered_dict)

# 弹出末尾的键值对
print(ordered_dict.popitem())
print(ordered_dict)

# 设置指定键值对，如果键不存在则创建
ordered_dict.setdefault("c", 3)
print(ordered_dict)

# from_keys 创建一个新字典，指定键值对
ordered_dict: OrderedDict[str, int] = OrderedDict.fromkeys(["a", "b", "c"])
print(ordered_dict)

# 更新指定键值对
ordered_dict.update({"a": 1, "b": 2, "c": 3})
print(ordered_dict)


OrderedDict({'a': 1, 'b': 2})
OrderedDict({'b': 2, 'a': 1})
('a', 1)
OrderedDict({'b': 2})
OrderedDict({'b': 2, 'c': 3})
OrderedDict({'a': None, 'b': None, 'c': None})
OrderedDict({'a': 1, 'b': 2, 'c': 3})


`namedtuple` 可以实现命名元组，常用于需要命名元组来表示数据结构的场景。

它可以像普通的元组一样使用，但是可以通过字段名访问元素，比直接使用索引更具有可读性。


In [1]:
from collections import namedtuple

# 定义一个 Point 类型的 namedtuple
Point = namedtuple("Point", ["x", "y"])

# 创建一个 Point 对象
p = Point(10, 20)

# 访问字段
print(f"x 坐标: {p.x}, y 坐标: {p.y}")

x 坐标: 10, y 坐标: 20


`deque` 是双端队列，支持从两端快速添加和删除元素。它比列表在插入和删除操作时更高效。


In [5]:
from collections import deque

# 创建一个空的 deque
d = deque()

# 在右端添加元素
d.append(1)
d.append(2)
print(d)

# 在左端添加元素
d.appendleft(0)
print(d)

# 弹出右端元素
print(d.pop())
print(d)

# 弹出左端元素
print(d.popleft())
print(d)

d = deque([1, 2, 3, 2, 4])
d.remove(2)  # 从左向右查找移除第一个 2
print(d)  # deque([1, 3, 2, 4])


deque([1, 2])
deque([0, 1, 2])
2
deque([0, 1])
0
deque([1])
deque([1, 3, 2, 4])


通过 `__iter__` 和 `__next__` 方法可以实现自己的 Iterable 迭代器


In [None]:
# 实现一个倒计时器
class CountDown:
    def __init__(self, value: int) -> None:
        if value <= 0:
            raise ValueError("value must larger than zero")
        self.value = value

    def __iter__(self):
        """调用迭代器的时候先调用 __iter__ 之后返回一个值，之后迭代时调用 __next__(返回值)"""
        return self

    def __next__(self):
        if self.value >= 0:
            value = self.value
            self.value -= 1
            return value
        else:
            raise StopIteration


count_down = CountDown(10)

for i in count_down:
    print(i)

10
9
8
7
6
5
4
3
2
1
0


使用 `__enter__`和`__exit__` 实现上下文管理器


In [None]:
class FileManager:
    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode
        self.file = None

    def __enter__(self):
        print("打开文件")
        self.file = open(self.filename, self.mode)
        return self.file  # 这里返回的对象会赋给 with as 后面的变量

    def __exit__(self, exc_type, exc_val, exc_tb):
        """
        完成 with as 中语句后调用

        Args:
            exc_type (Any): 表示异常类型
            exc_val (Any): 表示异常值
            exc_tb (Any): 表示traceback
        """
        print("关闭文件")
        if self.file:
            self.file.close()
        if exc_type:
            print(f"Error happened: {exc_val}")
        # 如果不想异常终止程序，返回 True；否则返回 False
        return True


# 使用示例
with FileManager("test.txt", "w") as f:
    f.write("Hello, world!")


打开文件
关闭文件


In [17]:
import traceback


class SuppressException:
    """
    查看上下文管理器如何处理异常
    """

    def __enter__(self):
        print("进入上下文")
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        print("触发 __exit__")
        print(f"异常类型: {exc_type}")
        print(f"异常值: {exc_val}")
        # 返回 True 表示：异常已处理，不要向上传递
        return True


with SuppressException():
    print("即将除以 0")
    1 / 0
print("程序正常结束（异常被抑制）")


进入上下文
即将除以 0
触发 __exit__
异常类型: <class 'ZeroDivisionError'>
异常值: division by zero
程序正常结束（异常被抑制）
