\
            # 42. RabbitMQ：基础与可靠投递（RabbitMQ Basics & Reliable Delivery）

            讲清 AMQP/RabbitMQ 的核心概念与可靠性思路：ack、持久化、重试/死信、发布确认、幂等消费。
示例提供 `pika` 可选连接与内存队列降级。

            > 约定：Python 3.8；示例尽量只用标准库；代码块可直接运行（第三方依赖会做可选降级）。


## 前置知识

- 网络/并发基础
- 异常处理
- JSON 与序列化概念


## 知识点地图

- 1. 核心概念：exchange / queue / binding / routing key
- 2. 可靠性 1：ack/nack + 持久化（durable/persistent）
- 3. 可靠性 2：QoS/prefetch + 背压
- 4. 可靠性 3：重试与死信（DLX）常见模式
- 5. 可靠性 4：发布确认与幂等消费
- 6. 最小可运行示例：pika 可选 + 内存队列降级


## 自检清单（学完打勾）

- [ ] 能解释 exchange/queue/binding/routing key
- [ ] 知道 ack/nack 与 prefetch 的意义
- [ ] 理解重试/死信队列的常见设计
- [ ] 知道发布确认与消费幂等为什么必要


In [None]:
\
from pathlib import Path

ART = Path('_nb_artifacts')
ART.mkdir(exist_ok=True)
print('artifacts dir:', ART.resolve())


## 知识点 1：核心概念：exchange / queue / binding / routing key

- Exchange：消息入口，决定如何路由到队列。
- Queue：消息落地位置，消费者从队列取。
- Binding：exchange 与 queue 的绑定关系。
- Routing key：消息的路由键；不同 exchange 类型（direct/topic/fanout）匹配规则不同。


## 知识点 2：可靠性 1：ack/nack + 持久化（durable/persistent）

- ack：消费者确认“处理完成”；未 ack 的消息在连接断开时通常会重新入队（取决于模式）。
- durable queue/exchange + persistent message 才能在 broker 重启后尽量保住消息（仍需结合集群策略）。
- 失败处理常见：nack + requeue=False -> DLQ；或业务重试后再决定。


## 知识点 3：可靠性 2：QoS/prefetch + 背压

- `basic_qos(prefetch_count=N)`：每个消费者未 ack 的最大消息数。
- 作用：避免一次推太多导致消费者内存爆；实现更公平的分发。


## 知识点 4：可靠性 3：重试与死信（DLX）常见模式

- 立即重试可能放大故障；常见做法：延迟重试（TTL + DLX）或业务定时重试。
- 死信队列用于隔离“长期失败/格式错误”的消息，便于人工排查与补偿。


## 知识点 5：可靠性 4：发布确认与幂等消费

- 发布确认（publisher confirms）：生产者确认消息已被 broker 接收，避免“你以为发成功但其实丢了”。
- 幂等消费：用 message_id/业务唯一键去重，避免重复投递导致重复扣款/重复发货。
- 注意：分布式里“恰好一次”很难；常见目标是“至少一次 + 幂等”。


## 知识点 6：最小可运行示例：pika 可选 + 内存队列降级

如果你本机没有 RabbitMQ，本段会自动降级到 `queue.Queue` 模拟基本行为。

如果你有 RabbitMQ：
- 设置 `AMQP_URL`（例如 `amqp://guest:guest@localhost:5672/`）
- 安装 `pika`：`pip install pika`


In [None]:
import os
import json
from queue import Queue

amqp_url = os.getenv('AMQP_URL')

try:
    import pika  # type: ignore
except Exception:
    pika = None


def demo_in_memory():
    q = Queue()
    q.put(json.dumps({'id': 'm1', 'payload': 'hello'}))
    msg = q.get()
    print('in-memory got:', msg)
    q.task_done()


def demo_rabbitmq():
    assert pika is not None
    params = pika.URLParameters(amqp_url)
    conn = pika.BlockingConnection(params)
    ch = conn.channel()
    ch.queue_declare(queue='demo.q', durable=True)

    body = json.dumps({'id': 'm1', 'payload': 'hello'}).encode('utf-8')
    ch.basic_publish(exchange='', routing_key='demo.q', body=body)

    method, props, body2 = ch.basic_get(queue='demo.q', auto_ack=False)
    print('rabbitmq got:', body2.decode('utf-8'))
    ch.basic_ack(method.delivery_tag)
    conn.close()


if amqp_url and pika is not None:
    demo_rabbitmq()
else:
    demo_in_memory()


## 常见坑

- auto_ack=True：消费者挂了也算成功，消息可能丢失
- 无 prefetch：慢消费者被推爆
- 无限重试：故障放大，队列堆积
- 不做幂等：重复投递导致重复业务操作


## 综合小案例：失败延迟重试 + 死信隔离（内存队列示意）

用内存队列模拟“重试队列”和“死信队列”的思想：
- 消费失败：把消息放入 retry 队列并记录次数
- 超过阈值：进入 dlq

真实 RabbitMQ 通常用：TTL（延迟队列）+ DLX（死信交换机）实现。


In [None]:
import time
from dataclasses import dataclass
from queue import Queue, Empty


@dataclass
class Msg:
    id: str
    payload: str
    attempts: int = 0


main_q: Queue = Queue()
retry_q: Queue = Queue()
dlq: Queue = Queue()

main_q.put(Msg('m1', 'ok'))
main_q.put(Msg('m2', 'fail'))


def handle(m: Msg):
    if m.payload == 'fail':
        raise RuntimeError('boom')
    return 'done'


def consume_one(q: Queue):
    try:
        return q.get_nowait()
    except Empty:
        return None


while True:
    m = consume_one(main_q) or consume_one(retry_q)
    if m is None:
        break

    try:
        print('handling', m)
        handle(m)
        print(' ack', m.id)
    except Exception:
        m.attempts += 1
        if m.attempts >= 3:
            print(' -> dlq', m.id)
            dlq.put(m)
        else:
            print(' -> retry', m.id, 'attempts', m.attempts)
            time.sleep(0.02)  # 模拟延迟
            retry_q.put(m)

print('dlq size:', dlq.qsize())


## 自测题（不写代码也能回答）

- 为什么需要 ack？auto_ack=True 有什么风险？
- prefetch_count 的作用是什么？它如何实现背压？
- 为什么“至少一次”投递必须配合幂等消费？


## 练习题（建议写代码）

- 把小案例改成：retry 队列按指数退避延迟（用 time + 优先队列模拟）。
- 为消息加 message_id 去重：同一 id 只处理一次。
- 如果使用真实 RabbitMQ：写出用 DLX + TTL 设计延迟重试队列的声明参数与路由关系。
