# 树


In [None]:
from collections import deque
from typing import Generator

## 二叉树

[二叉树 binary tree]是一种非线性数据结构.


In [None]:
class TreeNode:
    """二叉树节点类"""

    def __init__(self, val: int) -> None:
        # 节点值
        self.val = val
        # 左子节点
        self.left: TreeNode | None = None
        # 右子节点
        self.right: TreeNode | None = None

    def __repr__(self) -> str:
        return f"TreeNode({self.val}, {repr(self.left)}, {repr(self.right)})"

插入和删除节点操作.

无论是插入还是删除节点, 都需要有三个指针分别对应:

- p: 当前节点(待插入或待删除的节点)
- n1: p 节点的父节点
- n2: n1 节点的子节点(左节点或右节点)

<img src="../imgs/binary_tree_add_remove.png" width="50%">


## 二叉树遍历

常见的二叉树遍历方式:

- 广度优先搜索 breadth-first search, BFS
  - 层序遍历 level-order traversal
- 深度优先搜索 depth-first search, DFS
  - 前序遍历
  - 中序遍历
  - 后续遍历


### 层序遍历

广度优先遍历通常借助"队列"来实现. 队列遵循"先进先出"的规则, 而广度优先遍历则遵循"逐层推进"的规则, 两者的背后的思想是一致的.

<img src="../imgs/binary_tree_bfs.png" width="50%">


In [None]:
def level_order(root: TreeNode | None) -> list[int]:
    """层序遍历"""
    # 初始化队列, 加入根节点
    queue: deque[TreeNode | None] = deque([root])
    # 初始化一个列表, 用于保存遍历序列
    res: list[int] = []

    # 当队列不为空
    while queue:
        # 出列
        node = queue.popleft()
        # 保存节点值
        if node:
            res.append(node.val)
        # 左节点入队
        if node and node.left is not None:
            queue.append(node.left)
        # 右节点入队
        if node and node.right is not None:
            queue.append(node.right)

    return res


def level_order_recursion(
    queue: deque[TreeNode | None],
    res: list[int] | None = None,
) -> list[int]:
    """层序遍历, 采用递归方式"""
    if res is None:
        res = []
    if not queue:
        return res

    node = queue.popleft()
    if node is not None:
        res.append(node.val)
        if node.left:
            queue.append(node.left)
        if node.right:
            queue.append(node.right)

    return level_order_recursion(queue, res)


def level_order_gen(root: TreeNode | None) -> Generator[int, None, None]:
    """层序遍历, 采用Generator方法

    层序遍历采用[递归生成器]并不适合, 因此层序遍历并不是递进的, 而是从上到下左右到右
    但是前序, 中序, 后序遍历是合适的
    """

    queue = deque([root])

    # 当队列不为空
    while queue:
        node = queue.popleft()
        if node is not None:
            yield node.val
            if node.left:
                queue.append(node.left)
            if node.right:
                queue.append(node.right)

In [None]:
def create_tree_BFS(ary: list[int], i: int = 0) -> TreeNode | None:
    """帮助函数. 使用广度优先算法创建一个完全二叉树"""

    if i >= len(ary) or ary[i] is None:
        return None

    node = TreeNode(ary[i])
    node.left = create_tree_BFS(ary, 2 * i + 1)
    node.right = create_tree_BFS(ary, 2 * i + 2)

    return node

In [None]:
tree_node = create_tree_BFS([1, 2, 3, 4])
tree_node

In [None]:
[v for v in level_order_gen(tree_node)]

### 前序, 中序, 后序遍历

这三种遍历都属于[深度优先遍历 depth-first traversal], 也称为[深度优先搜索 depth-first search DFS], 它体现了一种"先走到尽头, 再回溯继续"的遍历方法

- 前序遍历: 根 -> 左 -> 右
- 中序遍历: 左 -> 根 -> 右
- 后序遍历: 左 -> 右 -> 根

<img src="../imgs/binary_tree_dfs.png" width="50%">


In [None]:
def pre_order(root: TreeNode | None) -> list[int]:
    """前序遍历. 循环

    前序遍历：根节点 -> 左子树 -> 右子树。

    思考逻辑：首先访问根节点，然后遍历左子树，最后遍历右子树。
             在每个子树中我们同样先访问根节点，然后左子树，然后右子树
             对于使用栈的迭代算法，我们需要首先将根节点入栈，然后在循环中:
             弹出栈顶元素（访问），然后把栈顶元素的右子节点、左子节点依次入栈。
    """
    if root is None:
        return []

    stack = [root]
    res = []

    while stack:
        node = stack.pop()
        res.append(node.val)
        # 右节点先入栈
        if node.right:
            stack.append(node.right)
        # 左节点再入栈
        if node.left:
            stack.append(node.left)

    return res


def pre_order_recursion(
    root: TreeNode | None, res: list[int] | None = None
) -> list[int]:
    """前序遍历. 递归

    访问优先级: 根 -> 左 -> 右
    """

    if res is None:
        res = []

    if root is None:
        return res

    res.append(root.val)
    pre_order_recursion(root.left, res)
    pre_order_recursion(root.right, res)

    return res


def pre_order_gen(root: TreeNode | None) -> Generator[int, None, None]:
    """前序遍历. 递归生成器

    访问优先级: 根 -> 左 -> 右
    """
    if root:
        yield root.val

        yield from pre_order_gen(root.left)
        yield from pre_order_gen(root.right)

In [None]:
tree_node = create_tree_BFS([1, 2, 3, 4])

# 前序遍历
(
    # 循环
    pre_order(tree_node),
    # 递归
    pre_order_recursion(tree_node),
    # 递归生成器
    [v for v in pre_order_gen(tree_node)],
)

<span style="background-color: lightgray; color: #B8860B; padding: 10px 20px; border-radius: 50px;">
从上面三种前序遍历的方法看, 递归生成器方法是最简洁和最具扩展力的一种.
</span>


In [None]:
def in_order(root: TreeNode | None) -> list[int]:
    """中序遍历. 循环

    中序遍历： 左子树 -> 根节点 -> 右子树。

    思考逻辑：首先遍历左子树，然后访问根节点，然后遍历右子树。
             在每个子树中，我们同样是先遍历左子树，然后访问根节点，然后遍历右子树。
             这需要在访问每个节点之前，都需要先访问它的左子树。
             因此在实现迭代算法的时候，我们需要通过一个 while 循环找到
             每子树的最左节点，并在寻找的过程中将路径上的节点全部入栈，
             然后再访问栈顶的节点，转向它的右子树继续这个过程。
    """

    if root is None:
        return []

    res: list[int] = []
    stack: list[TreeNode] = []
    curr = root

    while stack or curr:
        # 全部左子树入栈(含整个树的根节点, 实际上它是第一个入栈的节点)
        while curr:
            stack.append(curr)
            curr = curr.left
        # 弹出栈顶元素, 即最左节点
        curr = stack.pop()
        # 访问
        res.append(curr.val)
        # 转向右子树
        curr = curr.right

    return res


def in_order_recursion(
    root: TreeNode | None, res: list[int] | None = None
) -> list[int]:
    """中序遍历. 递归

    访问优先级: 左 -> 根 -> 右
    """

    if res is None:
        res = []

    if root is None:
        return res

    in_order_recursion(root.left, res)
    res.append(root.val)
    in_order_recursion(root.right, res)

    return res


def in_order_gen(root: TreeNode | None) -> Generator[int, None, None]:
    """中序遍历. 递归

    访问优先级: 左 -> 根 -> 右
    """

    if root:
        yield from in_order_gen(root.left)
        yield root.val
        yield from in_order_gen(root.right)

In [None]:
tree_node = create_tree_BFS([1, 2, 3, 4])

# 中序遍历
(
    # 循环
    in_order(tree_node),
    # 递归
    in_order_recursion(tree_node),
    # 递归生成器
    [v for v in in_order_gen(tree_node)],
)

In [None]:
def post_order(root: TreeNode | None) -> list[int]:
    """后序遍历. 循环

    后序遍历: 左子树 -> 右子树 -> 根节点。

    思考逻辑：首先遍历左子树，然后遍历右子树，最后访问根节点。
             在每个子树中，我们同样是先遍历左子树，然后遍历右子树，最后访问根节点。
             这个过程最复杂，因为在我们遍历完一个节点的左右子树之后，
             我们还需要再次回到这个节点。为此在实现迭代算法的时候，
             我们需要维护一个指向最近访问过的节点的指针。在每次迭代中，
             如果栈顶节点的右子节点存在并且未被访问过，就转向这个右子节点，
             否则就访问栈顶节点。

    实现上面的逻辑是比较复杂的, 代码不易读, 因此下面的代码采用了小技巧:

    在这段代码中, 我们用stack来保存还未访问过的节点, 用 `res` 来保存已经访问过的节点的值。
    我们先把根节点root推入stack, 然后进入一个while循环, 只要stack不为空就一直运行。
    在这个loop中, 我们pop出stack的最后一个元素, 并把它的值加入 `res` 。
    然后我们检查这个节点的左子节点和右子节点, 如果它们存在的话, 就将它们推入stack。
    最后, 我们返回 `res` 的逆序, 因为我们实际上是在做反向的后序遍历
    （即根节点 -> 右子节点 -> 左子节点）。

    注意：这种方法不是最直观的后序遍历实现方式，
         它利用了栈这个数据结构和后序遍历访问次序
         （左子节点 -> 右子节点 -> 根节点）的逆序之间的关系。

    如果我们仔细看这段代码, 它实际上是前序遍历(根 -> 左 -> 右)的变形, 仅仅是将左右
    子树入栈的顺序调整了一下, 使其变为(根 -> 右 -> 左), 最后逆序返回恰好可以变成
    (左 -> 右 -> 根)
    """

    if root is None:
        return []

    res: list[int] = []
    stack: list[TreeNode] = [root]

    while stack:
        node = stack.pop()
        res.append(node.val)
        if node.left:
            stack.append(node.left)
        if node.right:
            stack.append(node.right)

    return res[::-1]


def post_order_recursion(
    root: TreeNode | None, res: list[int] | None = None
) -> list[int]:
    """后续遍历. 递归

    后序遍历: 左子树 -> 右子树 -> 根节点。
    """

    if res is None:
        res = []

    if root is None:
        return res

    post_order_recursion(root.left, res)
    post_order_recursion(root.right, res)
    res.append(root.val)

    return res


def post_order_gen(root: TreeNode | None) -> Generator[int, None, None]:
    """后续遍历. 递归

    后序遍历: 左子树 -> 右子树 -> 根节点。
    """

    if root:
        yield from post_order_gen(root.left)
        yield from post_order_gen(root.right)
        yield root.val

In [None]:
tree_node = create_tree_BFS([1, 2, 3, 4])

# 后序遍历
(
    # 循环
    post_order(tree_node),
    # 递归
    post_order_recursion(tree_node),
    # 递归生成器
    [v for v in post_order_gen(tree_node)],
)