# 从树开始

## 树
- 树是一种数据结构，由节点和边组成。每个节点可以有零个或多个子节点，但每个节点只能有一个父节点。树的顶端节点称为根节点，叶子节点是没有子节点的节点。
- 树是极小联通图的特例。 
### 树的基本性质：
1. 有 n 个节点的树有 n-1 条边。
2. 树是无环的。
3. 树是连通的。

### 树的基本概念：
- **根节点**：树的顶端节点。深度为0。
- **叶子节点**：没有子节点的节点。
- **子节点**：某个节点的直接下级节点。
- **父节点**：某个节点的直接上级节点。
- **兄弟节点**：同一个父节点的子节点。
- **深度**：节点到根节点的边数。
- **高度**：节点到叶子节点的最长路径的边数。空树的高度为-1，只有一个节点的树高度为0。
- **层数**：树的层数等于高度加1。
- **子树**：某个节点及其所有后代节点组成的树。
- **路径**：从一个节点到另一个节点的边的序列。
- **层次**：树的层次从根节点开始，根节点为第0层，子节点为第1层，以此类推。
- **度**：节点的子节点数量。(出度：子节点数量；入度：父节点数量)
- **森林**：由多棵树组成的集合。
- **满树**：每个节点都有相同数量的子节点。
- **完全树**：除了最后一层外，每一层的节点数都达到最大值，且最后一层的节点从左到右连续排列。
- **平衡树**：树的高度尽可能小，左右子树的高度差不超过1。
- **二叉树**：每个节点最多有两个子节点的树。
- **二叉搜索树**：左子树的所有节点小于根节点，右子树的所有节点大于根节点。
- **AVL树**：一种自平衡的二叉搜索树，保证左右子树的高度差不超过1。
- **红黑树**：一种自平衡的二叉搜索树，具有红黑性质，保证树的高度平衡。
- **B树**：一种自平衡的多路搜索树，适用于数据库和文件系统。
- **B+树**：B树的变种，所有叶子节点在同一层，适用于数据库索引。

In [20]:
class TreeNode:
    def __init__(self, data, parent=None):
        self.data = data
        self.parent = parent
        self.children = []

    def add_child(self, child_data):
        child_node = TreeNode(child_data, parent=self)
        self.children.append(child_node)
        return child_node
    def is_empty_children(self):
        return len(self.children) == 0
    def __repr__(self):
        return f"TreeNode(data={self.data})"
def print_tree(node, level=0):
    indent = " " * (level * 4)
    print(f"{indent}{node.data}")
    for child in node.children:
        print_tree(child, level + 1)
# 示例：构建一棵树
root = TreeNode("根节点")
child1 = root.add_child("子节点1")
child2 = root.add_child("子节点2")
child1.add_child("子节点1.1")
child2.add_child("子节点2.1")
child2.add_child("子节点2.2")
print_tree(root)

根节点
    子节点1
        子节点1.1
    子节点2
        子节点2.1
        子节点2.2


## 二叉树
- 二叉树是一种特殊的树，每个节点最多有两个子节点，分别称为左子节点和右子节点。
- 二叉树的基本性质：
  1. 有 n 个节点的二叉树有 n-1 条边。
  2. 二叉树的高度为 log(n)。
  3. 完全二叉树的叶子节点在最后一层或倒数第二层。
- 二叉树的基本概念：
  - **根节点**：二叉树的顶端节点。
  - **叶子节点**：没有子节点的节点。
  - **左子节点**：某个节点的左侧子节点。
  - **右子节点**：某个节点的右侧子节点。
  - **深度**：节点到根节点的边数。
  - **高度**：节点到叶子节点的最长路径的边数。
  - **层数**：二叉树的层数等于高度加1。
- 二叉树的遍历方式：
  - **前序遍历**：访问根节点，遍历左子树，再遍历右子树。
  - **中序遍历**：遍历左子树，访问根节点，再遍历右子树。
  - **后序遍历**：遍历左子树，遍历右子树，访问根节点。
  - **层次遍历**：按层次从上到下、从左到右访问节点。
### 基数和满树
- **满二叉树**：每个节点都有两个子节点，且所有叶子节点在同一层。
- **完全二叉树**：除了最后一层外，每一层的节点数都达到最大值，且最后一层的节点从左到右连续排列。
- **二叉树的基数**：二叉树的基数是指节点的数量。
- **二叉树的高度**：二叉树的高度是指从根节点到叶子节点的最长路径的边数。空树的高度为-1，只有一个节点的树高度为0。
- **二叉树的层数**：二叉树的层数等于高度加1。
- **二叉树的度**：节点的子节点数量。对于二叉树，度只能是0、1或2。
- **二叉树的深度**：节点到根节点的边数。根节点的深度为0，叶子节点的深度为树的高度。
- **二叉树的子树**：某个节点及其所有后代节点组成的树。
- **二叉树的度**：节点的子节点数量。对于二叉树，度只能是0、1或2。
深度为k的二叉树，最多有 $2^(k+1)-1$个节点，最少有$k+1$个节点，至多能有$ 2^k$ 个。
- 特殊情况：单链树（每个节点只有一个子节点）和满二叉树（每个节点都有两个子节点，且所有叶子节点在同一层）。
设度数为0，1，2的节点数分别为 $N_0$，$N_1$，$N_2$，则有以下关系：
- $N_0 + N_1 + N_2 = n$ （节点总数）
- $N_0 = N_1 + 1$ （叶子节点数等于非叶子节点数加1）
- 边数：e = n - 1 （树的边数等于节点数减1）

In [21]:
class BinTreeNode:
    def __init__(self, data, parent=None):
        self.data = data
        self.parent = parent
        self.lc = None  # left child
        self.rc = None  # right child
        self.size = 1   # subtree size including self
        self.height = 0 # height of subtree rooted at this node

    def update_size(self):
        left_size = self.lc.size if self.lc else 0
        right_size = self.rc.size if self.rc else 0
        self.size = 1 + left_size + right_size

    def update_height(self):
        left_height = self.lc.height if self.lc else -1
        right_height = self.rc.height if self.rc else -1
        self.height = 1 + max(left_height, right_height)

    def set_left(self, node):
        # Check if 'node' is one of self's ancestors
        current = self
        while current is not None:
            if current is node:
                raise ValueError("Cannot set a node as its own child or create a cycle.")
            current = current.parent
        self.lc = node
        if node:
            node.parent = self
        self._update_subtree()

    def set_right(self, node):
        # Check if 'node' is one of self's ancestors
        current = self
        while current is not None:
            if current is node:
                raise ValueError("Cannot set a node as its own child or create a cycle.")
            current = current.parent
        self.rc = node
        if node:
            node.parent = self
        self._update_subtree()

    def _is_descendant(self, node):
        """Check if the given node is a descendant of self."""
        if node is None:
            return False
        if node is self:
            return True
        return (self.lc and self.lc._is_descendant(node)) or (self.rc and self.rc._is_descendant(node))

    def _update_subtree(self):
        current = self
        while current:
            current.update_size()
            current.update_height()
            current = current.parent

    def is_leaf(self):
        return not self.lc and not self.rc

    def __repr__(self):
        return f"BinTreeNode(data={self.data}, size={self.size}, height={self.height})"

    def get_left(self):
        return self.lc

    def get_right(self):
        return self.rc

    def get_parent(self):
        return self.parent

    def get_data(self):
        return self.data

    def get_size(self):
        return self.size

    def get_height(self):
        return self.height


class BinTree:
    _UNSET = object()  # 哑元，用来区分“未传参”和“传了 None”

    def __init__(self, root=None):
        self.root = root

    def insert(self, data, parent=None, is_left=True):
        new_node = BinTreeNode(data)
        new_node.parent = parent
        if parent is None:
            if self.root is None:
                self.root = new_node
            else:
                raise ValueError("Root already exists")
        else:
            if is_left:
                parent.set_left(new_node)
            else:
                parent.set_right(new_node)
        return new_node

    # 先序遍历
    def traverse_preorder(self, node=_UNSET, visit=lambda x: print(x.data)):
        if node is self._UNSET:
            node = self.root
        def _pre(n):
            if n is None:
                return
            visit(n)
            _pre(n.lc)
            _pre(n.rc)
        _pre(node)

    # 中序遍历
    def traverse_inorder(self, node=_UNSET, visit=lambda x: print(x.data)):
        if node is self._UNSET:
            node = self.root
        def _in(n):
            if n is None:
                return
            _in(n.lc)
            visit(n)
            _in(n.rc)
        _in(node)

    # 后序遍历
    def traverse_postorder(self, node=_UNSET, visit=lambda x: print(x.data)):
        if node is self._UNSET:
            node = self.root
        def _post(n):
            if n is None:
                return
            _post(n.lc)
            _post(n.rc)
            visit(n)
        _post(node)
    
    # ---------------- 栈实现的遍历 ----------------
    def traverse_preorder_iter(self, visit=lambda x: print(x.data)):
        """先序遍历（根 -> 左 -> 右）"""
        if not self.root:
            return
        stack = [self.root]
        while stack:
            node = stack.pop()
            visit(node)
            # 注意：先右后左，保证左子树先处理
            if node.rc:
                stack.append(node.rc)
            if node.lc:
                stack.append(node.lc)

    def traverse_inorder_iter(self, visit=lambda x: print(x.data)):
        """中序遍历（左 -> 根 -> 右）"""
        stack = []
        node = self.root
        while stack or node:
            while node:  # 一直走到最左
                stack.append(node)
                node = node.lc
            node = stack.pop()
            visit(node)
            node = node.rc

    def traverse_postorder_iter(self, visit=lambda x: print(x.data)):
        """后序遍历（左 -> 右 -> 根）"""
        if not self.root:
            return
        stack = [(self.root, False)]
        while stack:
            node, visited = stack.pop()
            if node is None:
                continue
            if visited:
                visit(node)
            else:
                # 根结点在最后访问，所以先压入“已访问”标记
                stack.append((node, True))
                if node.rc:
                    stack.append((node.rc, False))
                if node.lc:
                    stack.append((node.lc, False))
    
    def print_tree(self, node=_UNSET, prefix="", is_left=True):
        if node is self._UNSET:
            node = self.root
        if node is None:
            print("<empty>")
            return
        if node.rc:
            self.print_tree(node.rc, prefix + ("│   " if is_left else "    "), False)
        print(prefix + ("└── " if is_left else "┌── ") + str(node.data))
        if node.lc:
            self.print_tree(node.lc, prefix + ("    " if is_left else "│   "), True)


# Example usage of BinTree
if __name__ == "__main__":
    bin_tree = BinTree()
    root = bin_tree.insert("Root")
    left_child = bin_tree.insert("Left Child", root, is_left=True)
    right_child = bin_tree.insert("Right Child", root, is_left=False)
    bin_tree.insert("Left Left Child", left_child, is_left=True)
    bin_tree.insert("Left Right Child", left_child, is_left=False)
    bin_tree.insert("Right Left Child", right_child, is_left=True)
    bin_tree.insert("Right Right Child", right_child, is_left=False)

    bin_tree.print_tree()
    print("Preorder Traversal:")
    bin_tree.traverse_preorder()
    print("Preorder Traversal iter:")
    bin_tree.traverse_preorder_iter()
    print("\nInorder Traversal:")
    bin_tree.traverse_inorder()
    print("Inorder Traversal iter:")
    bin_tree.traverse_inorder_iter()
    print("\nPostorder Traversal:")
    bin_tree.traverse_postorder()
    print("Postorder Traversal iter:")
    bin_tree.traverse_postorder_iter()


│       ┌── Right Right Child
│   ┌── Right Child
│   │   └── Right Left Child
└── Root
    │   ┌── Left Right Child
    └── Left Child
        └── Left Left Child
Preorder Traversal:
Root
Left Child
Left Left Child
Left Right Child
Right Child
Right Left Child
Right Right Child
Preorder Traversal iter:
Root
Left Child
Left Left Child
Left Right Child
Right Child
Right Left Child
Right Right Child

Inorder Traversal:
Left Left Child
Left Child
Left Right Child
Root
Right Left Child
Right Child
Right Right Child
Inorder Traversal iter:
Left Left Child
Left Child
Left Right Child
Root
Right Left Child
Right Child
Right Right Child

Postorder Traversal:
Left Left Child
Left Right Child
Left Child
Right Left Child
Right Right Child
Right Child
Root
Postorder Traversal iter:
Left Left Child
Left Right Child
Left Child
Right Left Child
Right Right Child
Right Child
Root


## 二叉树表达式求值

In [22]:
import math

# 运算符优先级 & 结合性
precedence = {
    '+': (1, 'L'),
    '-': (1, 'L'),
    '*': (2, 'L'),
    '/': (2, 'L'),
    '^': (3, 'R'),
    '!': (4, 'R'),   # 单目运算符
}

def infix_to_postfix(expr: str):
    # 中缀 -> 后缀表达式（Shunting-yard）
    output, stack, number = [], [], ''

    def flush_number():
        nonlocal number
        if number:
            output.append(number)
            number = ''

    for ch in expr:
        if ch.isdigit() or ch == '.':
            number += ch
        else:
            flush_number()
            if ch in precedence:
                prec, assoc = precedence[ch]
                while stack and stack[-1] in precedence:
                    p2, assoc2 = precedence[stack[-1]]
                    if (assoc == 'L' and prec <= p2) or (assoc == 'R' and prec < p2):
                        output.append(stack.pop())
                    else:
                        break
                stack.append(ch)
            elif ch == '(':
                stack.append(ch)
            elif ch == ')':
                while stack and stack[-1] != '(':
                    output.append(stack.pop())
                stack.pop()
            elif ch.isspace():
                continue
            else:
                raise ValueError(f"非法字符: {ch}")
    flush_number()
    while stack:
        output.append(stack.pop())
    return output

def postfix_to_expr_tree(tree: BinTree, postfix_tokens):
    # 后缀 -> 表达式树 (返回 root)
    # 数字放入，表达式进行匹配，单目留在右边
    stack = []
    for token in postfix_tokens:
        if token in precedence:  # 运算符
            if token == '!':  # 单目运算符
                operand = stack.pop()
                node = tree.insert(token) if tree.root is None else BinTreeNode(token)
                node.set_left(operand)  # 用左孩子保存操作数
                stack.append(node)
            else:  # 双目运算符
                right = stack.pop()
                left = stack.pop()
                node = tree.insert(token) if tree.root is None else BinTreeNode(token)
                node.set_left(left)
                node.set_right(right)
                stack.append(node)
        else:  # 数字
            node = tree.insert(token) if tree.root is None else BinTreeNode(token)
            stack.append(node)
    return stack[0]

def evaluate_postorder(node):
    # 递归后序遍历求值
    if node.lc is None and node.rc is None:
        return float(node.data)

    if node.data == '!':
        val = evaluate_postorder(node.lc)
        return math.factorial(int(val))

    left_val = evaluate_postorder(node.lc)
    right_val = evaluate_postorder(node.rc)

    if node.data == '+':
        return left_val + right_val
    elif node.data == '-':
        return left_val - right_val
    elif node.data == '*':
        return left_val * right_val
    elif node.data == '/':
        return left_val / right_val
    elif node.data == '^':
        return left_val ** right_val
    else:
        raise ValueError(f"未知运算符: {node.data}")

def build_tree_from_infix(expr: str):
    """中缀表达式 -> 表达式树 (BinTree)"""
    postfix = infix_to_postfix(expr)
    tree = BinTree()
    root = postfix_to_expr_tree(tree, postfix)
    tree.root = root
    return tree, postfix

expr = "(32+2)*5-4^2!"
tree, postfix = build_tree_from_infix(expr)

print("表达式:", expr)
print("后缀表达式:", postfix)
tree.print_tree()
print("计算结果:", evaluate_postorder(tree.root))


表达式: (32+2)*5-4^2!
后缀表达式: ['32', '2', '+', '5', '*', '4', '2', '!', '^', '-']
│       ┌── !
│       │   └── 2
│   ┌── ^
│   │   └── 4
└── -
    │   ┌── 5
    └── *
        │   ┌── 2
        └── +
            └── 32
计算结果: 154.0


## 完全二叉树
| 遍历方式               | 定义            |
| ------------------ | ------------- |
| **先序** Preorder    | 根 → 左 → 右     |
| **中序** Inorder     | 左 → 根 → 右     |
| **后序** Postorder   | 左 → 右 → 根     |
| **层序** Level-order | 按层从上到下、从左到右访问 |

可以使用数列很好得到；
并且[先序|后序] + 中序就可以构建
- 先序加后序也可以，但是需要真二叉树！
- 增强序列
![增强序列例图](.\sources\enhancelist.png)

In [23]:
def build_tree_from_pre_in(preorder, inorder):
    """
    根据先序 + 中序构建二叉树，返回 BinTree 实例
    """
    if not preorder or not inorder:
        return BinTree()

    val_to_index = {val: i for i, val in enumerate(inorder)}

    def helper(pre_l, pre_r, in_l, in_r, parent=None):
        if pre_l > pre_r or in_l > in_r:
            return None
        root_val = preorder[pre_l]
        root = BinTreeNode(root_val, parent)
        in_root_idx = val_to_index[root_val]
        left_size = in_root_idx - in_l
        root.lc = helper(pre_l + 1, pre_l + left_size, in_l, in_root_idx - 1, root)
        root.rc = helper(pre_l + left_size + 1, pre_r, in_root_idx + 1, in_r, root)
        root._update_subtree()
        return root

    n = len(preorder)
    root = helper(0, n - 1, 0, n - 1)
    return BinTree(root)


def build_tree_from_post_in(postorder, inorder):
    """
    根据后序 + 中序构建二叉树，返回 BinTree 实例
    """
    if not postorder or not inorder:
        return BinTree()

    val_to_index = {val: i for i, val in enumerate(inorder)}

    def helper(post_l, post_r, in_l, in_r, parent=None):
        if post_l > post_r or in_l > in_r:
            return None
        root_val = postorder[post_r]
        root = BinTreeNode(root_val, parent)
        in_root_idx = val_to_index[root_val]
        left_size = in_root_idx - in_l
        root.lc = helper(post_l, post_l + left_size - 1, in_l, in_root_idx - 1, root)
        root.rc = helper(post_l + left_size, post_r - 1, in_root_idx + 1, in_r, root)
        root._update_subtree()
        return root

    n = len(postorder)
    root = helper(0, n - 1, 0, n - 1)
    return BinTree(root)

preorder = ['A', 'B', 'D', 'E', 'C', 'F']
inorder  = ['D', 'B', 'E', 'A', 'F', 'C']
tree1 = build_tree_from_pre_in(preorder, inorder)
tree1.print_tree()

postorder = ['D', 'E', 'B', 'F', 'C', 'A']
tree2 = build_tree_from_post_in(postorder, inorder)
tree2.print_tree()

│   ┌── C
│   │   └── F
└── A
    │   ┌── E
    └── B
        └── D
│   ┌── C
│   │   └── F
└── A
    │   ┌── E
    └── B
        └── D


## 编码树

- PFC编码 将字符集中字符组织成二叉树，0/1表示左右孩子，并存放字符，来得到编码串
- 平均编码长度 ald有最小，可以得到最优编码树——叶子只出现在倒数两层内，否则节点交换即可
- 字符频率不同 使用不同 —— 文件长度正比于平均带权深度 
- 带权编码长度，得到加权最优编码树

### Huffman算法
频率低的字符优先引入，位置安排也更低（贪婪算法）

## 二叉搜索树
- 优化插入，查找，删除的复杂度，实现平均复杂度O(logn)

### 特点
把数据用树来表示，左叉更小，右叉更大来分类；
- ![从数组到树](.\sources\listtotree.png)

### 定义
空树或者满足以下条件
- 每个节点都有一作为搜索依据的关键码(key)
- 任意节点的左子树（若非空）的关键码都小于等于该节点关键码
- 任意节点的右子树（若非空）的关键码都大于等于该节点关键码

### 部分性质
- 中序遍历，可以从小到大进行排列
- 当且仅当中序遍历单调非减

In [24]:
class BST:
    def __init__(self):
        self.root = None
    
    def insert(self,data):
        # 插入一个值
        if self.root is None:
            self.root = BinTreeNode(data)
            return self.root
        
        current = self.root
        parent = None
        while current:
            parent = current
            if data < current.data:
                current = current.get_left()
            elif data > current.data:
                current = current.get_right()
            else:
                return current
            
        new_node = BinTreeNode(data, parent)
        if data < parent.data:
            parent.set_left(new_node)
        else:
            parent.set_right(new_node)
        return new_node
    
    def search(self, data):
        """查找一个值，返回节点或 None"""
        current = self.root
        while current:
            if data < current.data:
                current = current.lc
            elif data > current.data:
                current = current.rc
            else:
                return current
        return None
    
    def _min_node(self, node):
        """返回以 node 为根的最小值节点"""
        current = node
        while current.lc:
            current = current.lc
        return current

    def _max_node(self, node):
        """返回以 node 为根的最大值节点"""
        current = node
        while current.rc:
            current = current.rc
        return current

    def delete(self, data):
        """删除一个值"""
        node = self.search(data)
        if node is None:
            return False

        def transplant(u, v):
            if u.parent is None:
                self.root = v
            elif u == u.parent.lc:
                u.parent.lc = v
            else:
                u.parent.rc = v
            if v:
                v.parent = u.parent

        # 情况 1: 没有子节点（叶子）
        if node.lc is None and node.rc is None:
            transplant(node, None)

        # 情况 2: 只有右子树
        elif node.lc is None:
            transplant(node, node.rc)

        # 情况 3: 只有左子树
        elif node.rc is None:
            transplant(node, node.lc)

        # 情况 4: 有两个子树
        else:
            succ = self._min_node(node.rc)  # 后继
            if succ.parent != node:
                transplant(succ, succ.rc)
                succ.rc = node.rc
                if succ.rc:
                    succ.rc.parent = succ
            transplant(node, succ)
            succ.lc = node.lc
            if succ.lc:
                succ.lc.parent = succ

        # 更新整棵树的 size 和 height
        current = node.parent
        while current:
            current._update_subtree()
            current = current.parent
        return True

    def inorder(self, node=None):
        """中序遍历（升序）"""
        if node is None:
            node = self.root
        result = []
        def _in(n):
            if n:
                _in(n.lc)
                result.append(n.data)
                _in(n.rc)
        _in(node)
        return result

    def print_tree(self):
        """打印树形结构"""
        if not self.root:
            print("<empty>")
            return

        def _print(node, prefix="", is_left=True):
            if node.rc:
                _print(node.rc, prefix + ("│   " if is_left else "    "), False)
            print(prefix + ("└── " if is_left else "┌── ") + str(node.data))
            if node.lc:
                _print(node.lc, prefix + ("    " if is_left else "│   "), True)

        _print(self.root)


# example usage

bst = BST()
for val in [5, 3, 7, 2, 4, 6, 8,1,9,14,56,33]:
    bst.insert(val)

print("中序遍历:", bst.inorder())
bst.print_tree()

print("查找 4:", bst.search(4))
print("查找 10:", bst.search(10))

bst.delete(3)
print("删除 3 后的中序遍历:", bst.inorder())
bst.print_tree()
bst.delete(4)
print("删除 4 后的中序遍历:", bst.inorder())
bst.print_tree()
bst.delete(8)
print("删除 8 后的中序遍历:", bst.inorder())
bst.print_tree()


中序遍历: [1, 2, 3, 4, 5, 6, 7, 8, 9, 14, 33, 56]
│                   ┌── 56
│                   │   └── 33
│               ┌── 14
│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 6
└── 5
    │   ┌── 4
    └── 3
        └── 2
            └── 1
查找 4: BinTreeNode(data=4, size=1, height=0)
查找 10: None
删除 3 后的中序遍历: [1, 2, 4, 5, 6, 7, 8, 9, 14, 33, 56]
│                   ┌── 56
│                   │   └── 33
│               ┌── 14
│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 6
└── 5
    └── 4
        └── 2
            └── 1
删除 4 后的中序遍历: [1, 2, 5, 6, 7, 8, 9, 14, 33, 56]
│                   ┌── 56
│                   │   └── 33
│               ┌── 14
│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 6
└── 5
    └── 2
        └── 1
删除 8 后的中序遍历: [1, 2, 5, 6, 7, 9, 14, 33, 56]
│               ┌── 56
│               │   └── 33
│           ┌── 14
│       ┌── 9
│   ┌── 7
│   │   └── 6
└── 5
    └── 2
        └── 1


## 理想平衡？
中序序列固定，有卡特兰数种前序序列，n个形态二叉树形态数。

### 二叉搜索树缺点
1. 删除困难，删除后难以保持原来特性
2. 二叉搜索树的搜索（查找）、插入、删除复杂度皆为O(h),h为树的高度，最坏情况下为O(n)，即退化为链表。
- 二叉搜索树后续分类：
    - AVL树：自平衡的二叉搜索树，保证左右子树的高度差不超过1。
    - 红黑树：自平衡的二叉搜索树，具有红黑性质，保证树的高度平衡。
    - B树：自平衡的多路搜索树，适用于数据库和文件系统。
    - B+树：B树的变种，所有叶子节点在同一层，适用于数据库索引。
！[divide](.\sources\dividetree.png)
### 平衡二叉搜索树——BBST
- 平衡二叉搜索树（BBST）是一种自平衡的二叉搜索树，保证左右子树的高度差不超过1。
- BBST的插入、删除和查找操作的时间复杂度为O(logn)，其中n为节点数。
- BBST的实现方式有多种，如AVL树、红黑树等。
- BBST的特点是能够在动态数据集上保持平衡，避免了二叉搜索树在最坏情况下退化为链表的情况。
等价：两棵二叉搜索树的中序遍历序列相同，则称它们彼此等价，需要“矮胖”的二叉树

### AVL树
- AVL树是一种自平衡的二叉搜索树，保证左右子树的高度差不超过1。
- AVL树的插入、删除和查找操作的时间复杂度为O(logn)，其中n为节点数。
- AVL树的特点是能够在动态数据集上保持平衡，避免了二叉搜索树在最坏情况下退化为链表的情况。
- AVL树的插入和删除操作需要进行旋转操作，以保持树的平衡。
- AVL树的旋转操作分为单旋转和双旋转两种。
    - 单旋转：当插入或删除操作导致某个节点的高度差超过1时，进行单旋转操作以恢复平衡。
    - 双旋转：当插入或删除操作导致某个节点的高度差超过1时，且该节点的子树高度差也超过1时，进行双旋转操作以恢复平衡。
- AVL树的旋转操作可以分为左旋和右旋两种。
    - 左旋：将某个节点的右子树作为新的根节点，原根节点成为新的左子节点。**zag,逆时针**
    - 右旋：将某个节点的左子树作为新的根节点，原根节点成为新的右子节点。**zig,顺时针**
- AVL树的高度平衡因子定义为左右子树高度差，取值范围为-1、0、1。
- AVL树的插入和删除操作需要更新节点的高度和平衡因子。
- AVL树的查找操作与普通二叉搜索树相同，时间复杂度为O(logn)。
- AVL树的实现需要维护节点的高度和平衡因子。

#### AVL树的旋转操作
- 先确定最小失衡子树，找到最小失衡节点，关注其下层p，v节点的位置
    - 最小失衡子树根节点记为”g”（grandparent）
    - 其下层节点记为”p”(parent)
    - 孙子节点记为”v”(对插入来说为插入节点)
    - 规律：p为g孩子中高度更高者，v为p孩子中高度更高者
- ![AVL旋转](.\sources\demontionofrotate.png)
- ![AVL旋转](.\sources\demontionofrotate2.png)
- ![AVL旋转](.\sources\demontionofrotate3.png)
- [AVL树的插入操作](https://www.cs.usfca.edu/~galles/visualization/Algorithms.html)



In [25]:
class AVLNode(BinTreeNode):
    def __init__(self, data, parent=None):
        super().__init__(data, parent)
        self.balance_factor = 0  # 平衡因子

    def update_balance_factor(self):
        left_height = self.lc.height if self.lc else -1
        right_height = self.rc.height if self.rc else -1
        self.balance_factor = left_height - right_height

    def __repr__(self):
        return f"AVLNode(data={self.data}, bf={self.balance_factor}, size={self.size}, height={self.height})"
    
class AVLTree:
    def __init__(self):
        self.root = None

    def insert(self, data, needtoprint=False):
        if self.root is None:
            self.root = AVLNode(data)
            return self.root
        current = self.root
        parent = None
        while current:
            parent = current
            if data < current.data:
                current = current.get_left()
            elif data > current.data:
                current = current.get_right()
            else:
                return current # 同BST，AVL树不允许重复元素
        # 插入新节点
        new_node = AVLNode(data, parent)
        if data < parent.data:
            parent.set_left(new_node)
        else:
            parent.set_right(new_node)
        self._rebalance(parent, needtoprint=needtoprint) # AVL树插入后需要重新平衡
        return new_node

    def _rebalance(self, node, needtoprint=False):
        while node:
            node.update_height()
            node.update_balance_factor()
            if node.balance_factor > 1:  # 左重
                if node.lc and node.lc.balance_factor < 0:  # LR
                    self._rotate_left(node.lc, needtoprint = needtoprint)
                self._rotate_right(node, needtoprint = needtoprint)  # LL
            elif node.balance_factor < -1:  # 右重
                if node.rc and node.rc.balance_factor > 0:  # RL
                    self._rotate_right(node.rc, needtoprint=needtoprint)
                self._rotate_left(node, needtoprint=needtoprint)  # RR
            node = node.parent

    def _rotate_left(self, x, needtoprint=False):
        y = x.rc
        if y is None:
            return
        x.set_right(y.lc)
        if x.parent is None:
            self.root = y
            y.parent = None
        elif x == x.parent.lc:
            x.parent.set_left(y)
        else:
            x.parent.set_right(y)
        y.set_left(x)
        x.update_height()
        x.update_balance_factor()
        y.update_height()
        y.update_balance_factor()

        if needtoprint:
            # 打印旋转结果
            print(f"\n执行左旋 (rotate_left) 于节点 {x.data}:")
            self.print_tree()

    def _rotate_right(self, y, needtoprint=False):
        x = y.lc
        if x is None:
            return
        y.set_left(x.rc)
        if y.parent is None:
            self.root = x
            x.parent = None
        elif y == y.parent.lc:
            y.parent.set_left(x)
        else:
            y.parent.set_right(x)
        x.set_right(y)
        y.update_height()
        y.update_balance_factor()
        x.update_height()
        x.update_balance_factor()

        if needtoprint:
            # 打印旋转结果
            print(f"\n执行右旋 (rotate_right) 于节点 {y.data}:")
            self.print_tree()

    def _min_node(self, node):
        """返回以 node 为根的最小值节点"""
        current = node
        while current.lc:
            current = current.lc
        return current
    
    def _max_node(self, node):
        """返回以 node 为根的最大值节点"""
        current = node
        while current.rc:
            current = current.rc
        return current
    
    def delete(self, data):
        """删除一个值"""
        node = self.search(data)
        if node is None:
            return False
        def transplant(u, v):
            if u.parent is None:
                self.root = v
            elif u == u.parent.lc:
                u.parent.set_left(v)
            else:
                u.parent.set_right(v)
            if v:
                v.parent = u.parent
        # 情况 1: 没有子节点（叶子）
        if node.lc is None and node.rc is None:
            transplant(node, None)
        # 情况 2: 只有右子树
        elif node.lc is None:
            transplant(node, node.rc)
        # 情况 3: 只有左子树
        elif node.rc is None:
            transplant(node, node.lc)
        # 情况 4: 有两个子树
        else:
            succ = self._min_node(node.rc)
            if succ.parent != node:
                transplant(succ, succ.rc)
                succ.rc = node.rc
                if succ.rc:
                    succ.rc.parent = succ
            transplant(node, succ)
            succ.lc = node.lc
            if succ.lc:
                succ.lc.parent = succ
        # 更新整棵树的 size 和 height,和BST一样，但是需要从删除的开始向上迭代调整树的形状
        current = node.parent
        while current:
            current._update_subtree()
            current.update_balance_factor()
            self._rebalance(current)
            current = current.parent
        return True
    
    def search(self, data):
        """查找一个值，返回节点或 None"""
        current = self.root
        while current:
            if data < current.data:
                current = current.lc
            elif data > current.data:
                current = current.rc
            else:
                return current

    def inorder(self, node=None):
        if node is None:
            node = self.root
        result = []
        def _in(n):
            if n:
                _in(n.lc)
                result.append(n.data)
                _in(n.rc)
        _in(node)
        return result

    def print_tree(self):
        if not self.root:
            print("<empty>")
            return
        def _print(node, prefix="", is_left=True):
            if node.rc:
                _print(node.rc, prefix + ("│   " if is_left else "    "), False)
            print(prefix + ("└── " if is_left else "┌── ") + str(node.data) + f"(bf={node.balance_factor})")
            if node.lc:
                _print(node.lc, prefix + ("    " if is_left else "│   "), True)
        _print(self.root)

# example usage
avl = AVLTree()
for val in [30,20,10,40,50,60,70,100,90,80,65,63,25]:
    print(f"插入 {val} 后:")
    avl.insert(val,needtoprint=True)
    avl.print_tree()
print("中序遍历:", avl.inorder())
avl.print_tree()
avl.delete(20)
print("删除 20 后:")
avl.print_tree()
avl.delete(30)
print("删除 30 后:")
avl.print_tree()
avl.delete(50)
print("删除 50 后:")
avl.print_tree()
avl.search(100)
print("查找 100:", avl.search(100))
avl.delete(100)
print("删除 100 后:")
avl.print_tree()

插入 30 后:
└── 30(bf=0)
插入 20 后:
└── 30(bf=1)
    └── 20(bf=0)
插入 10 后:

执行右旋 (rotate_right) 于节点 30:
│   ┌── 30(bf=0)
└── 20(bf=0)
    └── 10(bf=0)
│   ┌── 30(bf=0)
└── 20(bf=0)
    └── 10(bf=0)
插入 40 后:
│       ┌── 40(bf=0)
│   ┌── 30(bf=-1)
└── 20(bf=-1)
    └── 10(bf=0)
插入 50 后:

执行左旋 (rotate_left) 于节点 30:
│       ┌── 50(bf=0)
│   ┌── 40(bf=0)
│   │   └── 30(bf=0)
└── 20(bf=-1)
    └── 10(bf=0)
│       ┌── 50(bf=0)
│   ┌── 40(bf=0)
│   │   └── 30(bf=0)
└── 20(bf=-1)
    └── 10(bf=0)
插入 60 后:

执行左旋 (rotate_left) 于节点 20:
│       ┌── 60(bf=0)
│   ┌── 50(bf=-1)
└── 40(bf=0)
    │   ┌── 30(bf=0)
    └── 20(bf=0)
        └── 10(bf=0)
│       ┌── 60(bf=0)
│   ┌── 50(bf=-1)
└── 40(bf=0)
    │   ┌── 30(bf=0)
    └── 20(bf=0)
        └── 10(bf=0)
插入 70 后:

执行左旋 (rotate_left) 于节点 50:
│       ┌── 70(bf=0)
│   ┌── 60(bf=0)
│   │   └── 50(bf=0)
└── 40(bf=0)
    │   ┌── 30(bf=0)
    └── 20(bf=0)
        └── 10(bf=0)
│       ┌── 70(bf=0)
│   ┌── 60(bf=0)
│   │   └── 50(bf=0)
└── 40(bf=0)
    │   ┌── 

## KD树
一种平衡二叉树、一种二叉空间分割树(BSP)、  一种高维几何搜索的数据结构（J.L.Bentley 1975年发明），目的是范围搜索

### 一维范围查找
先组织AVL树，查找范围内的点
- 第一步：分别查找区间的两端节点1和23，获得两条路径
- 第二步：找到两条路径的最低共同祖先 LCA(3,24)=15
- 第三步：从LCA开始重走两条路径，左边路径对所有左转过程，遍历输出对应的右子树；右边路径对所有右转过程，遍历输出对应的左子树

In [28]:
def search_form_to(tree, from_value, to_value):
    # 在AVL树中查找 from_value 到 to_value 的所有节点
    result = []
    def _search(node):
        if node is None:
            return
        if from_value <= node.data <= to_value:
            result.append(node.data)
        if node.data > from_value:  # 有可能在左子树
            _search(node.lc)
        if node.data < to_value:    # 有可能在右子树
            _search(node.rc)
    _search(tree.root)  # 只调用一次
    return result


# Example usage of search_form_to
avl = AVLTree()
for val in [30,20,10,40,50,60,70,100,90,80,65,63,25]:
    avl.insert(val)
print("查找范围 50 到 100 的节点:", search_form_to(avl, 50, 100))
print("查找范围 10 到 30 的节点:", search_form_to(avl, 10, 30))
print("查找范围 80 到 90 的节点:", search_form_to(avl, 80, 90))

查找范围 50 到 100 的节点: [60, 50, 70, 65, 63, 90, 80, 100]
查找范围 10 到 30 的节点: [30, 20, 10, 25]
查找范围 80 到 90 的节点: [90, 80]


### 二维范围查找
- 有序向量的二分查找对该问题无能为力
#### 构造2d-tree
- 核心思想：每次选取一个维度进行划分
- 点深度为偶（奇）时，则沿垂直（水平）方向切分
- 如何保证每次划分尽量居中？
- 每次切分都在中位点（对应坐标居中点），保证全树不高于O(logn)


In [None]:
class twodetreeNode(BinTreeNode):
    def __init__(self, point, parent=None):
        super().__init__(point, parent)
        self.point = point  # (x, y)
        self.axis = 0  # 0 for x-axis, 1 for y-axis

    def __repr__(self):
        return f"twodetreeNode(point={self.point}, axis={self.axis})"
    
class twodetree:
    def __init__(self):
        self.root = None

    def insert(self, point):
        # insert区别于BST，点的比较基于当前轴
        if self.root is None:
            self.root = twodetreeNode(point)
            self.root.axis = 0
            return self.root
        current = self.root
        parent = None
        axis = 0
        while current:
            parent = current
            if point[axis] < current.point[axis]:
                current = current.lc
            else:
                current = current.rc
            axis = 1 - axis  # alternate between x and y

        new_node = twodetreeNode(point, parent)
        new_node.axis = 1 - parent.axis
        if point[parent.axis] < parent.point[parent.axis]:
            parent.set_left(new_node)
        else:
            parent.set_right(new_node)
        return new_node

    def _range_search(self, node, rect, result):
        if node is None:
            return
        (x_min, y_min), (x_max, y_max) = rect
        x, y = node.point
        if x_min <= x <= x_max and y_min <= y <= y_max:
            result.append(node.point)
        axis = node.axis
        if axis == 0:  # x-axis
            if node.lc and x_min <= x:
                self._range_search(node.lc, rect, result)
            if node.rc and x <= x_max:
                self._range_search(node.rc, rect, result)
        else:  # y-axis
            if node.lc and y_min <= y:
                self._range_search(node.lc, rect, result)
            if node.rc and y <= y_max:
                self._range_search(node.rc, rect, result)

    def range_search(self, rect):
        result = []
        self._range_search(self.root, rect, result)
        return result
    
    def print_tree(self):
        if not self.root:
            print("<empty>")
            return
        def _print(node, prefix="", is_left=True):
            if node.rc:
                _print(node.rc, prefix + ("│   " if is_left else "    "), False)
            print(prefix + ("└── " if is_left else "┌── ") + str(node.point) + f"(axis={node.axis})")
            if node.lc:
                _print(node.lc, prefix + ("    " if is_left else "│   "), True)
        _print(self.root)

    def mindist(self, point):
        """查找距离 point 最近的点"""
        best = [None, float('inf')]
        def _search(node):
            if node is None:
                return
            dist = (node.point[0] - point[0]) ** 2 + (node.point[1] - point[1]) ** 2
            if dist < best[1]:
                best[0] = node.point
                best[1] = dist
            axis = node.axis
            diff = point[axis] - node.point[axis]
            close, away = (node.lc, node.rc) if diff < 0 else (node.rc, node.lc)
            _search(close)
            if diff ** 2 < best[1]:
                _search(away) # 必进入一颗子树，另一颗子树有可能进入，需要根据垂直距离判断
        _search(self.root)
        return best[0]
    
# Example usage of twodetree
points = [(7,2), (5,4), (9,6), (2,3), (4,7), (8,1)]
tree = twodetree()
for p in points:
    tree.insert(p)
tree.print_tree()

rect = ((3, 2), (9, 5))
found_points = tree.range_search(rect)
print(f"在矩形 {rect} 内的点:", found_points)

point = (9,2)
nearest = tree.mindist(point)
print(f"距离点 {point} 最近的点是:", nearest)

│   ┌── (9, 6)(axis=1)
│   │   └── (8, 1)(axis=0)
└── (7, 2)(axis=0)
    │   ┌── (4, 7)(axis=0)
    └── (5, 4)(axis=1)
        └── (2, 3)(axis=0)
在矩形 ((3, 2), (9, 5)) 内的点: [(7, 2), (5, 4)]
距离点 (9, 2) 最近的点是: (8, 1)


## kd-树：多维空间数据划分和搜索
- 维度越高时，搜索效率越差
- 可用BBF（Best-Bin-First，优先级队列）优化搜索速度
- kd-树应用于多维数据处理，如图像的SIFT特征匹配（128维特征）、计算机图形学中的光线跟踪、数据挖掘分类与检索
- 维度越高时，搜索效率越差的原因：**维度高，回溯次数大**
- 为降低回溯次数，限制回溯次数上限
- 怎样保证在最大回溯次数内找到的最近邻比较接近真实最近邻？ **优先级队列**
- 核心思想：**每分支离目标点距离和相交情况不一**

In [None]:
class kdtreeNode(twodetreeNode):
    def __init__(self, point, parent=None):
        super().__init__(point, parent)
        self.axis = 0

class kdtree(twodetree):
    def insert(self, point):
        if self.root is None:
            self.root = kdtreeNode(point)
            self.root.axis = 0
            return self.root
        current = self.root
        parent = None
        axis = 0
        while current:
            parent = current
            if point[axis] < current.point[axis]:
                current = current.lc
            else:
                current = current.rc
            axis = axis + 1 if axis < len(point) - 1 else 0  # 循环使用轴
        new_node = kdtreeNode(point, parent)
        new_node.axis = axis
        if point[parent.axis] < parent.point[parent.axis]:
            parent.set_left(new_node)
        else:
            parent.set_right(new_node)
        return new_node

## B树
## 背景
- 当数据规模大到内存无法容纳，需要存储于外存时，传统 **二叉搜索树 / AVL 树** 查找效率大幅下降。
- **磁盘 I/O 特点**：
  - 磁盘不是严格按需读取，而是**预读一个数据块**（page），比如一次读取 4KB。
  - 理论依据：**局部性原理** —— 当一个数据被用到时，其附近的数据也通常马上会被使用。
- **优化目标**：减少从外存读取的次数，而不是单纯减少比较次数。
### 多路搜索树
- 将二叉搜索树改为多路搜索树，每个节点数据变多，降低读取次数，提高时间效率。
- 如下图，通过左右孩子合并，得到四路搜索树
- ![fourBtree](./sources/Btree.png)
- 进一步可推广到$2^k$路搜索树，统称多路搜索树
- 每搜索一层，都在对应的“大节点”读取一组关键码
- 取k=8（每个大节点有255个关键码及256个分支），则在1G个记录里读取1个记录，所涉及外存访问次数从30次降低到4-5次
### 多路平衡搜索树
- m阶B-树(实际应为B树，B-Tree), m路平衡搜索树(m≥3)
- **m 阶 B树**（$m \ge 3$）：一种 **平衡的多路搜索树**。
- 特点：
  1. 所有叶节点深度相同。
  2. 根节点至少有 2 个孩子（除非树只有一个节点）。
  3. 每个节点关键码个数 $n$ 满足：
     $$
     \lceil m/2 \rceil - 1 \le n \le m - 1
     $$
  4. 内部节点孩子数 = 关键码数 + 1。
  5. 关键码升序排列，子树区间互不重叠。
- ![fourBtree2](./sources/Btree2.png)
- 所有叶节点深度相同，根结点至少有两个分支
- 除叶子节点外，节点的分支数（度数）比关键码个数多1
- m限制节点的分支数可能，根据节点的分支数允许范围[⌈m/2⌉, m]命名B-树，如(2,3)树，(2,4)树
- (2,3)树表明，除根节点外，每节点的分支数范围最少2个，最多3个
- (2,4)树表明，除根节点外，每节点的分支数范围最少2个，最多4个
- 除叶子节点外，节点的分支数（度数）比关键码个数多1
- [⌈m/2⌉, m]树，每个非根节点的关键码个数不能过少，也不能超过m-1，⌈m/2⌉−1≤n≤m−1
- ![fourBtree3](./sources/Btree3.png)
#### 关键参数
- **关键码个数范围**：$[\lceil m/2 \rceil - 1, \, m-1]$
- **子树数范围**：$[\lceil m/2 \rceil, \, m]$

示例：
- **(2,3) 树**：除根外，每个节点分支数 ∈ [2,3]
- **(2,4) 树**：除根外，每个节点分支数 ∈ [2,4]
#### 树高
若关键码总数为 $N$，树高 $h$ 的范围：
$$
\log_m(N+1) \le h \le \log_{\lceil m/2 \rceil}\left(\lfloor (N+1)/2 \rfloor \right) + 1
$$
- 树的高度与 $m$ 成反比，$m$ 越大，树越矮。
#### 插入操作
1. **查找位置**：总是插入到叶子。
2. 若插入后关键码数 $\le m-1$，直接完成。
3. 若关键码数 = $m$，发生 **上溢（Overflow）**：
   - 取中间关键码上移到父节点。
   - 当前节点分裂为两个：左半 + 右半。
   - 若父节点也满，则递归分裂，可能一直到根。
   - 根分裂后，树高 +1。
#### 删除操作
1. **删除叶子**：
   - 若删除后关键码数 ≥ $\lceil m/2 \rceil - 1$，则合法。
   - 否则发生 **下溢（Underflow）**。
2. **下溢处理**：
   - 若兄弟节点关键码数 > 最小值：**向兄弟借关键码**。
   - 否则：**与兄弟合并**，父节点关键码下移，子节点合并。
3. **删除内部节点**：
   - 用 **前驱 / 后继关键码** 替换，再转化为叶子删除。

[插入，删除演示](https://www.cs.usfca.edu/~galles/visualization/BTree.html)


In [1]:
class BTreeNode:
    def __init__(self, t, leaf=False):
        self.t = t                  # 最小度数
        self.keys = []              # 存放关键字
        self.children = []          # 孩子指针
        self.leaf = leaf            # 是否是叶子

    def __repr__(self):
        return f"Keys:{self.keys}"

class BTree:
    def __init__(self, t=2):
        if t < 2:
            raise ValueError("B树的最小度数 t 必须 >= 2")
        self.t = t
        self.root = BTreeNode(t, leaf=True)

    def search(self, k, node=None):
        """搜索关键字 k，返回 (节点, 索引) 或 None"""
        if node is None:
            node = self.root
        i = 0
        while i < len(node.keys) and k > node.keys[i]:
            i += 1
        if i < len(node.keys) and k == node.keys[i]:
            return node, i
        if node.leaf:
            return None
        return self.search(k, node.children[i])

    def insert(self, k):
        """插入关键字 k"""
        root = self.root
        if len(root.keys) == 2 * self.t - 1:
            # 根已满，分裂
            new_root = BTreeNode(self.t, leaf=False)
            new_root.children.append(root)
            self._split_child(new_root, 0)
            self.root = new_root
            self._insert_non_full(new_root, k)
        else:
            self._insert_non_full(root, k)

    def _insert_non_full(self, node, k):
        """向一个未满的节点插入 k"""
        i = len(node.keys) - 1
        if node.leaf:
            node.keys.append(None)
            while i >= 0 and k < node.keys[i]:
                node.keys[i + 1] = node.keys[i]
                i -= 1
            node.keys[i + 1] = k
        else:
            while i >= 0 and k < node.keys[i]:
                i -= 1
            i += 1
            if len(node.children[i].keys) == 2 * self.t - 1:
                self._split_child(node, i)
                if k > node.keys[i]:
                    i += 1
            self._insert_non_full(node.children[i], k)

    def _split_child(self, parent, i):
        """分裂 parent 的第 i 个孩子"""
        t = self.t
        node = parent.children[i]
        new_node = BTreeNode(t, leaf=node.leaf)
        parent.keys.insert(i, node.keys[t - 1])
        parent.children.insert(i + 1, new_node)
        new_node.keys = node.keys[t:(2 * t - 1)]
        node.keys = node.keys[0:(t - 1)]
        if not node.leaf:
            new_node.children = node.children[t:(2 * t)]
            node.children = node.children[0:t]

    def print_tree(self, node=None, level=0):
        """打印树的层次结构"""
        if node is None:
            node = self.root
        print("  " * level, node.keys)
        for child in node.children:
            self.print_tree(child, level + 1)

btree = BTree(t=2)  # 最小度数 2 -> 每个节点最多 3 个 key

for val in [10, 20, 5, 6, 12, 30, 7, 17]:
    btree.insert(val)

btree.print_tree()

print("查找 6:", btree.search(6))
print("查找 15:", btree.search(15))


 [10, 20]
   [5, 6, 7]
   [12, 17]
   [30]
查找 6: (Keys:[5, 6, 7], 1)
查找 15: None


## 红黑树
### 背景与目标
- **问题**：在二叉搜索树中，插入/删除可能导致树退化为链表，查找效率降为 $O(n)$。
- **AVL 树**：严格平衡（左右子树高度差 ≤ 1），保证 $O(\log n)$ 查找，但插入/删除需要频繁旋转，调整代价高。
- **红黑树目标**：
  - 允许适度“不平衡”，换取 **插入/删除调整次数 ≤ O(1)**。
  - 仍能保证树高为 $O(\log n)$，查找、插入、删除均为 $O(\log n)$。

### 定义
一棵二叉搜索树，满足以下 **5 条性质**：

1. 每个节点要么是红色，要么是黑色。
2. 根节点是黑色。
3. 每个叶子节点（NIL 空节点）是黑色。(补全后)
4. 若一个节点是红色，则它的两个子节点都是黑色（红色节点不能相邻）。
5. 从任一节点到其所有叶子节点的路径，所含黑色节点数相同（**黑高一致性**）。
- ![红黑树](./sources/rdtree.png)

#### 黑深度
除去根节点，沿途所经过黑节点（包括外部节点）总数称为该节点黑深度；根节点黑深度为0
####  黑高度
除去外部节点，沿途所经过黑节点总数称为该节点黑高度；外部节点黑高度为0，根节点黑高度为全树黑高度
#### 提升变换
自顶向下，每遇一个红节点，都将其对应子树整体提升一层，从而与父节点（必为黑）对齐，二者联边调整为横向
每棵红黑树等价于一棵(2,4)树，前者节点对应后者关键码
通往红节点的边对B-树高度无贡献，在图中为虚线
- ![红黑树2](./sources/rdtree2.png)
### 性质与高度
- 由定义 (4)(5) 可知，最长路径 ≤ 最短路径的 **2 倍**。
- 若黑高为 $bh$，则树高 $h \le 2 \cdot bh$。
- 保证树的高度 $O(\log n)$。
### 红黑树的平衡性分析

- 红黑树来源于 B-树（2-3-4 树）理论，**黑高度是严格平衡的**。
- 那么计入红节点后，红黑树高度是 O(log n)。

#### 高度范围
设红黑树共有 $n$ 个节点，高度为 $h$，则有：
$$
\log_2(n+1) \le h \le 2 \cdot \log_2(n+1)
$$
- 左边：最理想情况（所有节点都是黑色）。
- 右边：最坏情况（红黑交替），红节点让路径长度变成黑高的 2 倍。

#### 黑高与总高度的关系
- 设黑高为 $H$（从根到任一叶子的黑节点数量），根据 B-树高度结论可得：
$$
H \le 1 + \log_{\left\lfloor \frac{m}{2} \right\rfloor} \left\lceil \frac{n+1}{2} \right\rceil
$$
对于红黑树（对应 2-3-4 树，$m = 4$）：
$$
H \le 1 + \log_2 \left( \frac{n+1}{2} \right) \le \log_2(n+1)
$$

#### 任一路径不包含相邻红节点
- 性质 4：**红节点不能连续出现**。
- 所以红节点最多穿插在黑节点之间，导致：
$$
h \le 2H \le 2 \cdot \log_2(n+1)
$$
### 基本操作
#### 旋转（Rotation）
- **左旋 (Left Rotate)**：节点右子树上移，当前节点下沉到左边。
- **右旋 (Right Rotate)**：节点左子树上移，当前节点下沉到右边。
- 旋转保持 **AVL树性质**，但改变局部平衡。

#### 插入（Insert）
1. 按 **二叉搜索树**方式插入，初始设为 **红色节点**。
2. 若违反红黑性质（例如父子同红），通过以下修复：
   - **情况 1**：叔父节点是红色 → 父、叔变黑，祖父变红，继续向上修复。
   - **情况 2**：叔父节点是黑色，且插入节点是“内侧” → 先旋转，再染色。
   - **情况 3**：叔父节点是黑色，且插入节点是“外侧” → 染色并旋转。
3. 根始终保持黑色。

- 双红修正（RR-1）
  - 按双红假设，父节点p为红，祖父g必为黑，因g为内部节点，其必有另一孩子u(可能为外部节点)，若u为黑色
  - 由路径所经过黑节点数目相等，推知T0,T1,T2根节点都为黑
  - ![PR-1](./sources/pr1.png)
- 双红修正（RR-2）
  - 若u为红色，u的左右孩子非空且根节点为黑色
  - T0,T1,T2,T3,T4 的根节点都为黑
  - ![PR-2-1](./sources/pr2-1.png)
  - ![PR-2-2](./sources/pr2-2.png)

- 按顺序插入节点 70,80,90,10,100,60,120,130,140,150
  - ![红黑树3](./sources/rdtree3.png)
- **本质：避免两个红色碰面，先化为B树，如果两红在左，一黑在右直接变黑中间即可；如果四个则需要先旋转（改变B树一个节点内部的排序），之后将其中间黑色上移变红，其余下到两个节点，则避免了冲突**
#### 删除（Delete）
1. 若删除节点有 **两个子节点**，用 **后继/前驱替代**，转化为删除单子节点情况。
2. 删除红节点 → 直接安全删除。
3. 删除黑节点 → 会导致路径黑高减少，引发 **双重黑 (double black)** 问题。
   - 通过 **兄弟节点染色 / 旋转 / 父节点调整** 修复。
   - 最多 $O(1)$ 次旋转即可恢复平衡。
- ![红黑树d](./sources/rdtree_del.png)
- [插入删除演示](https://cs.usfca.edu/~galles/visualization/RedBlack.html)
### 时间复杂度
- **查找**：$O(\log n)$  
- **插入**：$O(\log n)$，旋转 ≤ 2 次  
- **删除**：$O(\log n)$，旋转 ≤ 3 次  


In [None]:
RED = True
BLACK = False


class RBNode:
    __slots__ = ("key", "color", "left", "right", "parent")
    def __init__(self, key=None, color=BLACK, left=None, right=None, parent=None):
        self.key = key
        self.color = color
        self.left = left
        self.right = right
        self.parent = parent

    def __repr__(self):
        c = "R" if self.color else "B"
        return f"{self.key}:{c}"


class RBTree:
    def __init__(self):
        # 单例哨兵 NIL：代替所有空指针，颜色为黑
        self.NIL = RBNode(key=None, color=BLACK)
        self.root = self.NIL

    # ---------------- 基础旋转 ----------------
    def left_rotate(self, x):
        y = x.right
        x.right = y.left
        if y.left is not self.NIL:
            y.left.parent = x
        y.parent = x.parent
        if x.parent is self.NIL:
            self.root = y
        elif x is x.parent.left:
            x.parent.left = y
        else:
            x.parent.right = y
        y.left = x
        x.parent = y

    def right_rotate(self, y):
        x = y.left
        y.left = x.right
        if x.right is not self.NIL:
            x.right.parent = y
        x.parent = y.parent
        if y.parent is self.NIL:
            self.root = x
        elif y is y.parent.left:
            y.parent.left = x
        else:
            y.parent.right = x
        x.right = y
        y.parent = x

    # ---------------- 查找 ----------------
    def search(self, key):
        cur = self.root
        while cur is not self.NIL and key != cur.key:
            cur = cur.left if key < cur.key else cur.right
        return cur if cur is not self.NIL else None

    # ---------------- 最小/最大/后继 ----------------
    def _minimum(self, x):
        while x.left is not self.NIL:
            x = x.left
        return x

    def _maximum(self, x):
        while x.right is not self.NIL:
            x = x.right
        return x

    def successor(self, x):
        if x.right is not self.NIL:
            return self._minimum(x.right)
        y = x.parent
        while y is not self.NIL and x is y.right:
            x, y = y, y.parent
        return y if y is not self.NIL else None

    # ---------------- 插入 ----------------
    def insert(self, key):
        node = RBNode(key=key, color=RED, left=self.NIL, right=self.NIL)
        y = self.NIL
        x = self.root
        while x is not self.NIL:
            y = x
            x = x.left if node.key < x.key else x.right
        node.parent = y
        if y is self.NIL:
            self.root = node
        elif node.key < y.key:
            y.left = node
        else:
            y.right = node
        self._insert_fixup(node)

    def _insert_fixup(self, z):
        while z.parent.color == RED:
            if z.parent is z.parent.parent.left:
                y = z.parent.parent.right  # 叔父
                if y.color == RED:
                    # Case 1: 叔父红 -> 父叔变黑，祖父变红，z 上移
                    z.parent.color = BLACK
                    y.color = BLACK
                    z.parent.parent.color = RED
                    z = z.parent.parent
                else:
                    if z is z.parent.right:
                        # Case 2: 叔父黑，z 内侧 -> 左旋转变外侧
                        z = z.parent
                        self.left_rotate(z)
                    # Case 3: 叔父黑，z 外侧 -> 染色并右旋
                    z.parent.color = BLACK
                    z.parent.parent.color = RED
                    self.right_rotate(z.parent.parent)
            else:
                # 对称情况
                y = z.parent.parent.left
                if y.color == RED:
                    z.parent.color = BLACK
                    y.color = BLACK
                    z.parent.parent.color = RED
                    z = z.parent.parent
                else:
                    if z is z.parent.left:
                        z = z.parent
                        self.right_rotate(z)
                    z.parent.color = BLACK
                    z.parent.parent.color = RED
                    self.left_rotate(z.parent.parent)
        self.root.color = BLACK
        self.root.parent = self.NIL  # 保持根的 parent 为 NIL

    # ---------------- 删除 ----------------
    def delete(self, key):
        z = self.search(key)
        if z is None:
            return False

        y = z
        y_original_color = y.color
        if z.left is self.NIL:
            x = z.right
            self._transplant(z, z.right)
        elif z.right is self.NIL:
            x = z.left
            self._transplant(z, z.left)
        else:
            y = self._minimum(z.right)  # 后继
            y_original_color = y.color
            x = y.right
            if y.parent is z:
                x.parent = y
            else:
                self._transplant(y, y.right)
                y.right = z.right
                y.right.parent = y
            self._transplant(z, y)
            y.left = z.left
            y.left.parent = y
            y.color = z.color

        if y_original_color == BLACK:
            self._delete_fixup(x)
        return True

    def _transplant(self, u, v):
        if u.parent is self.NIL:
            self.root = v
        elif u is u.parent.left:
            u.parent.left = v
        else:
            u.parent.right = v
        v.parent = u.parent

    def _delete_fixup(self, x):
        while x is not self.root and x.color == BLACK:
            if x is x.parent.left:
                w = x.parent.right  # 兄弟
                if w.color == RED:
                    # Case 1: 兄弟红 -> 变换为黑兄弟情形
                    w.color = BLACK
                    x.parent.color = RED
                    self.left_rotate(x.parent)
                    w = x.parent.right
                if w.left.color == BLACK and w.right.color == BLACK:
                    # Case 2: 兄弟两个孩子均黑
                    w.color = RED
                    x = x.parent
                else:
                    if w.right.color == BLACK:
                        # Case 3: 兄弟右黑左红 -> 先右旋兄弟
                        w.left.color = BLACK
                        w.color = RED
                        self.right_rotate(w)
                        w = x.parent.right
                    # Case 4: 兄弟右红 -> 左旋父，重染色，结束
                    w.color = x.parent.color
                    x.parent.color = BLACK
                    w.right.color = BLACK
                    self.left_rotate(x.parent)
                    x = self.root
            else:
                # 对称
                w = x.parent.left
                if w.color == RED:
                    w.color = BLACK
                    x.parent.color = RED
                    self.right_rotate(x.parent)
                    w = x.parent.left
                if w.right.color == BLACK and w.left.color == BLACK:
                    w.color = RED
                    x = x.parent
                else:
                    if w.left.color == BLACK:
                        w.right.color = BLACK
                        w.color = RED
                        self.left_rotate(w)
                        w = x.parent.left
                    w.color = x.parent.color
                    x.parent.color = BLACK
                    w.left.color = BLACK
                    self.right_rotate(x.parent)
                    x = self.root
        x.color = BLACK

    # ---------------- 遍历与打印 ----------------
    def inorder(self):
        res = []
        def _in(n):
            if n is self.NIL: return
            _in(n.left)
            res.append(n.key)
            _in(n.right)
        _in(self.root)
        return res

    def bfs_levels(self):
        """按层打印（key:color），用于可视化结构。"""
        if self.root is self.NIL:
            return []
        out, q = [], [self.root]
        while q:
            nxt, layer = [], []
            for n in q:
                if n is self.NIL:
                    layer.append("NIL:B")
                else:
                    layer.append(f"{n.key}:{'R' if n.color else 'B'}")
                    nxt.extend([n.left, n.right])
            out.append(layer)
            # 若下一层全为 NIL 则停止
            if all(x is self.NIL for x in nxt):
                break
            q = nxt
        return out

    # ---------------- 验证红黑性质 ----------------
    def validate(self):
        """验证 5 条性质，错误则抛异常；返回黑高。"""
        # 性质2：根黑
        assert self.root.color == BLACK, "Root must be black"

        def dfs(n):
            if n is self.NIL:
                return 1  # NIL 的黑高为 1（数上 NIL 黑色）
            # 性质1：每个节点红或黑（由实现保证）
            # 性质4：红节点的两个孩子必须为黑
            if n.color == RED:
                assert n.left.color == BLACK and n.right.color == BLACK, "Red node has red child"
            # 递归验证
            lh = dfs(n.left)
            rh = dfs(n.right)
            # 性质5：从任意节点到叶子黑高相等
            assert lh == rh, f"Black height mismatch at {n}"
            return lh + (1 if n.color == BLACK else 0)

        return dfs(self.root)


# ---------------- 使用示例 ----------------
if __name__ == "__main__":
    rbt = RBTree()

    # 插入一组元素
    data = [10, 20, 30, 15, 25, 5, 1, 50, 60, 55, 13, 17]
    for x in data:
        rbt.insert(x)

    print("中序遍历（升序）:", rbt.inorder())
    print("按层打印（key:color）:")
    for lvl, layer in enumerate(rbt.bfs_levels()):
        print(f"Level {lvl}: ", layer)

    # 校验 5 条性质
    bh = rbt.validate()
    print("验证通过，黑高 =", bh)

    # 查找
    print("查找 25 ->", rbt.search(25))
    print("查找 99 ->", rbt.search(99))

    # 删除若干元素并验证
    for k in [20, 10, 55, 1, 30]:
        ok = rbt.delete(k)
        print(f"删除 {k}: {ok}, 中序 ->", rbt.inorder())
        rbt.validate()

    print("最终按层打印：")
    for lvl, layer in enumerate(rbt.bfs_levels()):
        print(f"Level {lvl}: ", layer)


中序遍历（升序）: [1, 5, 10, 13, 15, 17, 20, 25, 30, 50, 55, 60]
按层打印（key:color）:
Level 0:  ['20:B']
Level 1:  ['10:R', '30:R']
Level 2:  ['5:B', '15:B', '25:B', '55:B']
Level 3:  ['1:R', 'NIL:B', '13:R', '17:R', 'NIL:B', 'NIL:B', '50:R', '60:R']
验证通过，黑高 = 3
查找 25 -> 25:B
查找 99 -> None
删除 20: True, 中序 -> [1, 5, 10, 13, 15, 17, 25, 30, 50, 55, 60]
删除 10: True, 中序 -> [1, 5, 13, 15, 17, 25, 30, 50, 55, 60]
删除 55: True, 中序 -> [1, 5, 13, 15, 17, 25, 30, 50, 60]
删除 1: True, 中序 -> [5, 13, 15, 17, 25, 30, 50, 60]
删除 30: True, 中序 -> [5, 13, 15, 17, 25, 50, 60]
最终按层打印：
Level 0:  ['25:B']
Level 1:  ['13:R', '50:B']
Level 2:  ['5:B', '15:B', 'NIL:B', '60:R']
Level 3:  ['NIL:B', 'NIL:B', 'NIL:B', '17:R', 'NIL:B', 'NIL:B']
