# Python 第 2 天｜函数与装饰器

目标：吃透参数模型（位置/关键字/仅限位置/仅限关键字/可变参数）、作用域与闭包（LEGB / nonlocal / global）、高阶函数（wraps / lru_cache / partial / singledispatch），写出常用装饰器（计时 / 重试 / 缓存 / 权限 / 限流），并在小项目中落地。

## 学习产出（今日完成）
- 一个可复用的 `utils/decorators.py`（计时、重试、TTL 缓存、限流、权限示例、装饰器堆叠模板）。
- 一组演示脚本与单元测试样例，覆盖常见参数模型与装饰器使用场景。
- 练习清单（含答案）：闭包 / 晚绑定、带参数装饰器、`singledispatch` 等。

## 知识地图
```text
参数模型
 ├─ 位置参数 / 关键字参数
 ├─ 仅限位置（/）  ─ Python 3.8+
 ├─ 仅限关键字（*）
 └─ *args / **kwargs
作用域与闭包（LEGB）
 ├─ local → enclosing → global → builtins
 ├─ 闭包捕获自由变量
 └─ nonlocal / global
高阶函数与工具
 ├─ functools.wraps  ─ 保留元数据
 ├─ lru_cache / cache
 ├─ partial          ─ 偏函数
 └─ singledispatch   ─ 函数多态
装饰器模式
 ├─ 简单装饰器 / 带参数装饰器 / 类装饰器
 ├─ 可组合：堆叠顺序自内向外
 └─ 实用：计时 / 重试 / 缓存 / 限流 / 权限
```

## 1. 参数模型（Parameter Kinds）

### 1.1 五大种类与书写顺序
顺序规则：仅限位置 → 位置/关键字 → 可变位置 → 仅限关键字 → 可变关键字。
```python
def f(a, b, /, c, d=1, *args, e, f=2, **kwargs):
    ...
```
- `a, b, /`：仅限位置；调用时不可写 `a=`。
- `c, d`：普通位置/关键字。
- `*args`：可变位置参数（元组）。
- `e, f`：`*` 后为仅限关键字；必须写成 `e=`。
- `**kwargs`：可变关键字参数（字典）。

In [1]:
from pprint import pprint  # 用于更直观地展示返回结构

# 通过结构化返回值区分每种参数类型
def demo_signature(a, b, /, c, d=1, *args, e, f=2, **kwargs):
    """Return a breakdown for each parameter kind."""
    return {
        "pos_only": (a, b),  # 仅限位置参数：只能按顺序传值
        "pos_or_kw": (c, d),  # 既能按位置也能按关键字传参
        "var_pos": args,  # 收集额外位置参数，形成元组
        "kw_only": {"e": e, "f": f},  # * 之后的仅限关键字参数
        "var_kw": kwargs,  # 收集额外关键字参数，形成字典
    }


# 演示调用中混合使用五种参数类型，并打印结构化结果
sample = demo_signature(1, 2, 3, 4, 99, e=6, f=7, mode="train", lr=0.1)
pprint(sample)


{'kw_only': {'e': 6, 'f': 7},
 'pos_only': (1, 2),
 'pos_or_kw': (3, 4),
 'var_kw': {'lr': 0.1, 'mode': 'train'},
 'var_pos': (99,)}


### 1.2 可变默认参数陷阱
函数定义时默认值只求值一次，若使用可变对象，会导致状态被复用。

In [2]:
# 错误示例：所有调用共享同一列表实例
def bad_append(item, bucket=[]):
    """Demonstrate the mutable default pitfall."""
    bucket.append(item)  # 共享列表被污染
    return bucket


# 推荐示例：仅在第一次调用时创建新列表
def good_append(item, bucket=None):
    """Use a sentinel to create a fresh container per call."""
    bucket = [] if bucket is None else bucket  # 每次调用获得独立容器
    bucket.append(item)
    return bucket


# 对比两个函数的调用结果，观察列表是否被意外复用
print("bad sequence:", bad_append("a"), bad_append("b"))
print("good sequence:", good_append("a"), good_append("b"))


bad sequence: ['a', 'b'] ['a', 'b']
good sequence: ['a'] ['b']


### 1.3 签名与参数种类检查
借助 `inspect.signature` 可枚举参数类型，利于调试或生成文档。

In [3]:
import inspect  # 内省工具，支持读取函数签名

sig = inspect.signature(demo_signature)  # 获取完整的签名对象
for name, param in sig.parameters.items():
    kind = param.kind.name  # 参数分类：POSITIONAL_ONLY 等
    default = param.default  # 默认值，若未设置则为 inspect._empty
    print(f"{name:<10} kind={kind:<15} default={default!r}")


a          kind=POSITIONAL_ONLY default=<class 'inspect._empty'>
b          kind=POSITIONAL_ONLY default=<class 'inspect._empty'>
c          kind=POSITIONAL_OR_KEYWORD default=<class 'inspect._empty'>
d          kind=POSITIONAL_OR_KEYWORD default=1
args       kind=VAR_POSITIONAL  default=<class 'inspect._empty'>
e          kind=KEYWORD_ONLY    default=<class 'inspect._empty'>
f          kind=KEYWORD_ONLY    default=2
kwargs     kind=VAR_KEYWORD     default=<class 'inspect._empty'>


## 2. 作用域与闭包（LEGB）

- 解析顺序：Local → Enclosing → Global → Builtins。
- 闭包会捕获自由变量；需要修改时使用 `nonlocal`。
- `global` 用于跨模块共享状态，但应谨慎使用。

In [4]:
# 创建闭包，利用 nonlocal 修改外层变量
def make_counter(start: int = 0) -> callable:
    """Build a stateful counter closure starting from start."""
    n = start  # 自由变量，位于 Enclosing 作用域

    def inc():
        nonlocal n  # 声明使用外层的 n，并允许赋值
        n += 1
        return n

    return inc  # 返回闭包，保留对 n 的引用


counter = make_counter()  # 创建从 0 开始的计数器
print("counter sequence:", [counter() for _ in range(3)])

counter_10 = make_counter(10)  # 独立的计数器，不共享状态
print("counter(10) sequence:", [counter_10() for _ in range(2)])


counter sequence: [1, 2, 3]
counter(10) sequence: [11, 12]


In [5]:
# 晚绑定陷阱：循环中的 lambda 捕获的是变量 i 的引用
funcs_bad = [lambda: i for i in range(3)]
# 解决方案：将当前 i 作为默认参数绑定，形成新的局部变量
funcs_good = [lambda x=i: x for i in range(3)]

bad_results = [func() for func in funcs_bad]  # 所有函数都读取同一个最终值
good_results = [func() for func in funcs_good]  # 每个函数拥有自己的拷贝

print("bad results:", bad_results)
print("good results:", good_results)


bad results: [2, 2, 2]
good results: [0, 1, 2]


## 3. 高阶函数常用工具

- `functools.wraps`：装饰器中保留原函数的 `__name__`、`__doc__` 等元数据。
- `lru_cache(maxsize=None)`：无限缓存；适合纯函数与读多写少情况。
- `partial(func, fixed_arg=...)`：预填部分参数，生成偏函数。
- `singledispatch`：基于首个参数类型分发实现多态。

In [6]:
from functools import wraps, lru_cache, partial, singledispatch


@lru_cache(maxsize=1024)
def fib(n: int) -> int:
    """Compute Fibonacci numbers with memoization."""
    return n if n < 2 else fib(n - 1) + fib(n - 2)


@singledispatch
def dump(value):
    """Fallback: convert any object to repr string."""
    return repr(value)


@dump.register
def _(value: list):
    """Specialize dump for list objects."""
    return f"list(len={len(value)})"


@dump.register
def _(value: dict):
    """Specialize dump for dict objects."""
    return f"dict(keys={len(value)})"


@dump.register
def _(value: set):
    """Specialize dump for set objects."""
    return f"set(len={len(value)})"


square_all = partial(map, lambda x: x * x)  # 偏函数：固定 map 的函数参数

print("fib(10) =", fib(10))  # 触发缓存后后续调用将复用结果
print("dump(list) =", dump([1, 2, 3]))
print("dump(dict) =", dump({"a": 1, "b": 2}))
print("dump(set) =", dump({1, 2, 3}))
print("square_all ->", list(square_all([1, 2, 3])))


fib(10) = 55
dump(list) = list(len=3)
dump(dict) = dict(keys=2)
dump(set) = set(len=3)
square_all -> [1, 4, 9]


## 4. 装饰器教程（从 0 到 1）

- 简单装饰器：函数 → 包装函数。
- 带参数的装饰器：装饰器工厂返回实际装饰器。
- 装饰器堆叠：执行顺序自内向外；最靠近函数体的装饰器最先运行。
- 类装饰器：可在实例状态中维护计数等信息。

In [7]:
import logging
import random
import sys
import time
from functools import wraps
from time import perf_counter, monotonic, sleep

# 配置日志输出到 stdout，便于 notebook 中查看
logging.basicConfig(level=logging.INFO, format="%(message)s", stream=sys.stdout, force=True)


def timeit(func):
    """Record elapsed time for the wrapped function."""

    @wraps(func)
    def wrapper(*args, **kwargs):
        t0 = perf_counter()  # 精确计时的起点
        try:
            return func(*args, **kwargs)
        finally:
            dt = perf_counter() - t0  # 计算耗时
            logging.getLogger(func.__module__).info("%s: %.3fs", func.__name__, dt)

    return wrapper


def retry(exceptions=(Exception,), tries=3, delay=0.1, backoff=2.0, jitter=0.0):
    """Retry with exponential backoff for given exceptions."""

    def deco(func):
        @wraps(func)
        def wrapper(*args, **kwargs):
            _tries, _delay = tries, delay  # 可变副本，避免污染默认参数
            while True:
                try:
                    return func(*args, **kwargs)
                except exceptions:
                    if _tries <= 0:
                        raise  # 超出重试次数，向上传递异常
                    pause = _delay + (random.uniform(0, jitter) if jitter else 0.0)
                    time.sleep(pause)  # 等待一段时间再尝试
                    _delay *= backoff  # 扩大等待间隔
                    _tries -= 1

        return wrapper

    return deco


def ttl_cache(seconds=60.0):
    """Cache results for a limited time-to-live window."""

    def deco(func):
        store = {}  # key -> (value, expire_timestamp)

        @wraps(func)
        def wrapper(*args, **kwargs):
            key = (args, frozenset(kwargs.items()))  # 基于实参构建可哈希键
            now = monotonic()  # 使用单调时钟，避免系统时间回拨
            cached = store.get(key)
            if cached and now < cached[1]:  # 命中且未过期
                return cached[0]
            result = func(*args, **kwargs)  # 重新计算
            store[key] = (result, now + seconds)  # 写入缓存
            return result

        return wrapper

    return deco


def rate_limit(qps: float):
    """Throttle calls so frequency does not exceed qps."""

    interval = 1.0 / qps  # 最小间隔

    def deco(func):
        last = {"t": 0.0}  # 使用可变容器持有上次调用时间

        @wraps(func)
        def wrapper(*args, **kwargs):
            elapsed = monotonic() - last["t"]  # 距离上次调用的时间
            if elapsed < interval:
                sleep(interval - elapsed)  # 如果过快则等待
            last["t"] = monotonic()
            return func(*args, **kwargs)

        return wrapper

    return deco


def require_role(*roles):
    """Validate that user.role belongs to allowed roles."""

    def deco(func):
        @wraps(func)
        def wrapper(user, *args, **kwargs):
            if getattr(user, "role", None) not in roles:
                raise PermissionError("forbidden")  # 拒绝未授权用户
            return func(user, *args, **kwargs)

        return wrapper

    return deco


@rate_limit(10)
@retry(tries=2, delay=0.02, jitter=0.0)
@timeit
def fetch_resource():
    """Demonstrate stacked decorators: timeit → retry → rate_limit."""
    return "ok"


class CallCounter:
    """Class-based decorator that tracks invocation count."""

    def __init__(self, func):
        wraps(func)(self)  # 保留元数据，使实例看起来像原函数
        self.func = func
        self.count = 0  # 记录调用次数

    def __call__(self, *args, **kwargs):
        self.count += 1
        return self.func(*args, **kwargs)


@CallCounter
def greet(name: str) -> str:
    """Return a greeting string and update call counter."""
    return f"hi {name}"


@timeit
def slow_add(a: int, b: int) -> int:
    """Sleep briefly to highlight timing log output."""
    time.sleep(0.01)
    return a + b


print("slow_add:", slow_add(3, 4))  # 触发装饰器，查看计时日志

unstable_state = {"n": 0}  # 用于模拟失败次数的薄封装字典


@retry(tries=2, delay=0.01)
def flaky_operation():
    """Fail twice before succeeding to prove retry works."""
    unstable_state["n"] += 1
    if unstable_state["n"] < 3:
        raise ValueError("transient failure")
    return f"success after {unstable_state['n']} tries"


print("flaky_operation:", flaky_operation())

cached_state = {"hits": 0}


@ttl_cache(seconds=0.5)
def expensive(x: int) -> int:
    """Double input and count real executions for cache demo."""
    cached_state["hits"] += 1
    return x * 2


# 前两次命中缓存，缓存失效后重新计算
print("ttl first:", expensive(10), expensive(10), "hits=", cached_state["hits"])
time.sleep(0.6)
print("ttl expired:", expensive(10), "hits=", cached_state["hits"])

timestamps = []  # 记录调用时间戳，用于计算间隔


@rate_limit(5)
def limited_call():
    """Append invocation timestamp to show enforced spacing."""
    timestamps.append(monotonic())
    return len(timestamps)


for _ in range(3):
    print("limited_call:", limited_call())

if len(timestamps) > 1:
    deltas = [round(timestamps[i + 1] - timestamps[i], 3) for i in range(len(timestamps) - 1)]
    print("rate intervals:", deltas)


class User:
    """Lightweight user with name and role attributes."""

    def __init__(self, name: str, role: str):
        self.name = name
        self.role = role


@require_role("admin")
def delete_project(user, name: str) -> str:
    """Allow deletion only for admin role."""
    return f"{user.name} deleted {name}"


admin = User("alice", "admin")
guest = User("bob", "guest")

print("delete_project (admin):", delete_project(admin, "demo"))
try:
    delete_project(guest, "demo")
except PermissionError as exc:
    print("delete_project (guest):", exc)

print("greet once:", greet("Ada"))
print("greet twice:", greet("Bob"))
print("greet count:", greet.count)


slow_add: 0.013s
slow_add: 7
flaky_operation: success after 3 tries
ttl first: 20 20 hits= 1
ttl expired: 20 hits= 2
limited_call: 1
limited_call: 2
limited_call: 3
rate intervals: [0.203, 0.205]
delete_project (admin): alice deleted demo
delete_project (guest): forbidden
greet once: hi Ada
greet twice: hi Bob
greet count: 2


## 5. `utils/decorators.py` 模板
将以下代码保存到 `src/yourpkg/utils/decorators.py`，并为你的项目按需调整日志器或异常类型。

```python
from __future__ import annotations

import logging
import random
import time
from functools import wraps
from time import monotonic, perf_counter, sleep
from typing import Any, Callable, Dict, Tuple


def timeit(func: Callable) -> Callable:
    @wraps(func)
    def wrapper(*args, **kwargs):
        t0 = perf_counter()
        try:
            return func(*args, **kwargs)
        finally:
            dt = perf_counter() - t0
            logging.getLogger(func.__module__).info("%s: %.3fs", func.__name__, dt)

    return wrapper


def retry(
    exceptions: Tuple[type, ...] = (Exception,),
    tries: int = 3,
    delay: float = 0.1,
    backoff: float = 2.0,
    jitter: float = 0.0,
) -> Callable:
    def deco(func: Callable) -> Callable:
        @wraps(func)
        def wrapper(*args, **kwargs):
            _tries, _delay = tries, delay
            while True:
                try:
                    return func(*args, **kwargs)
                except exceptions:
                    if _tries <= 0:
                        raise
                    pause = _delay + (random.uniform(0, jitter) if jitter else 0.0)
                    time.sleep(pause)
                    _delay *= backoff
                    _tries -= 1

        return wrapper

    return deco


def ttl_cache(seconds: float = 60.0) -> Callable:
    def deco(func: Callable) -> Callable:
        store: Dict[Any, Tuple[Any, float]] = {}

        @wraps(func)
        def wrapper(*args, **kwargs):
            key = (args, frozenset(kwargs.items()))
            now = monotonic()
            cached = store.get(key)
            if cached and now < cached[1]:
                return cached[0]
            result = func(*args, **kwargs)
            store[key] = (result, now + seconds)
            return result

        return wrapper

    return deco


def rate_limit(qps: float) -> Callable:
    interval = 1.0 / qps

    def deco(func: Callable) -> Callable:
        last = {"t": 0.0}

        @wraps(func)
        def wrapper(*args, **kwargs):
            elapsed = monotonic() - last["t"]
            if elapsed < interval:
                sleep(interval - elapsed)
            last["t"] = monotonic()
            return func(*args, **kwargs)

        return wrapper

    return deco


def require_role(*roles: str) -> Callable:
    def deco(func: Callable) -> Callable:
        @wraps(func)
        def wrapper(user, *args, **kwargs):
            if getattr(user, "role", None) not in roles:
                raise PermissionError("forbidden")
            return func(user, *args, **kwargs)

        return wrapper

    return deco


__all__ = [
    "timeit",
    "retry",
    "ttl_cache",
    "rate_limit",
    "require_role",
]
```

## 6. 练习（含答案）
1. 带参数计数器装饰器：
    ```python
    from functools import wraps

    def count(label: str = ""):
        def deco(func):
            @wraps(func)
            def wrapper(*args, **kwargs):
                wrapper.count += 1
                return func(*args, **kwargs)

            wrapper.count = 0
            wrapper.label = label
            return wrapper

        return deco
    ```
2. 修复晚绑定：`funcs = [(lambda x=i: x * x) for i in range(5)]`。
3. `singledispatch` 扩展：
    ```python
    @dump.register
    def _(x: dict):
        return f"dict(keys={len(x)})"

    @dump.register
    def _(x: set):
        return f"set(len={len(x)})"
    ```
4. `memoize`（不淘汰）：
    ```python
    from functools import wraps

    def memoize(func):
        cache = {}

        @wraps(func)
        def wrapper(*args, **kwargs):
            key = (args, frozenset(kwargs.items()))
            if key not in cache:
                cache[key] = func(*args, **kwargs)
            return cache[key]

        return wrapper
    ```
5. 装饰器堆叠顺序：推荐 `@rate_limit` 外层、`@retry` 中层、业务或 `@timeit` 内层；因为重试会多次调用被包裹函数，限流应约束总调用频率，`timeit` 记录整体耗时。

## 7. 自测题与答疑卡
- 说出参数五大种类，并写出同时包含 `/` 与 `*` 的函数示例。
- 解释 LEGB，并用 `nonlocal` 写一个自增闭包。
- 写出带参数装饰器的模板结构（装饰器工厂）。
- 如何用 `wraps` 保留原函数签名与文档？
- `lru_cache` 与自写 `ttl_cache` 的适用差异？
- 装饰器堆叠顺序如何判断？

## 8. 小项目落地（30–60 分钟）
- 为第 1 天的 `text_cleaner` 加上 `@timeit`，统计处理时长。
- 用 `@retry` 尝试重读因短暂 IO 失败的输入文件。
- 提供 `--cache` 开关，示范 `@ttl_cache` 在重复 CSV 解析上的加速。
- 写单元测试验证：失败重试次数、缓存命中路径、限流逻辑。