# 从树开始

## 树
- 树是一种数据结构，由节点和边组成。每个节点可以有零个或多个子节点，但每个节点只能有一个父节点。树的顶端节点称为根节点，叶子节点是没有子节点的节点。
- 树是极小联通图的特例。 
### 树的基本性质：
1. 有 n 个节点的树有 n-1 条边。
2. 树是无环的。
3. 树是连通的。

### 树的基本概念：
- **根节点**：树的顶端节点。深度为0。
- **叶子节点**：没有子节点的节点。
- **子节点**：某个节点的直接下级节点。
- **父节点**：某个节点的直接上级节点。
- **兄弟节点**：同一个父节点的子节点。
- **深度**：节点到根节点的边数。
- **高度**：节点到叶子节点的最长路径的边数。空树的高度为-1，只有一个节点的树高度为0。
- **层数**：树的层数等于高度加1。
- **子树**：某个节点及其所有后代节点组成的树。
- **路径**：从一个节点到另一个节点的边的序列。
- **层次**：树的层次从根节点开始，根节点为第0层，子节点为第1层，以此类推。
- **度**：节点的子节点数量。(出度：子节点数量；入度：父节点数量)
- **森林**：由多棵树组成的集合。
- **满树**：每个节点都有相同数量的子节点。
- **完全树**：除了最后一层外，每一层的节点数都达到最大值，且最后一层的节点从左到右连续排列。
- **平衡树**：树的高度尽可能小，左右子树的高度差不超过1。
- **二叉树**：每个节点最多有两个子节点的树。
- **二叉搜索树**：左子树的所有节点小于根节点，右子树的所有节点大于根节点。
- **AVL树**：一种自平衡的二叉搜索树，保证左右子树的高度差不超过1。
- **红黑树**：一种自平衡的二叉搜索树，具有红黑性质，保证树的高度平衡。
- **B树**：一种自平衡的多路搜索树，适用于数据库和文件系统。
- **B+树**：B树的变种，所有叶子节点在同一层，适用于数据库索引。

In [2]:
class TreeNode:
    def __init__(self, data, parent=None):
        self.data = data
        self.parent = parent
        self.children = []

    def add_child(self, child_data):
        child_node = TreeNode(child_data, parent=self)
        self.children.append(child_node)
        return child_node
    def is_empty_children(self):
        return len(self.children) == 0
    def __repr__(self):
        return f"TreeNode(data={self.data})"
def print_tree(node, level=0):
    indent = " " * (level * 4)
    print(f"{indent}{node.data}")
    for child in node.children:
        print_tree(child, level + 1)
# 示例：构建一棵树
root = TreeNode("根节点")
child1 = root.add_child("子节点1")
child2 = root.add_child("子节点2")
child1.add_child("子节点1.1")
child2.add_child("子节点2.1")
child2.add_child("子节点2.2")
print_tree(root)

根节点
    子节点1
        子节点1.1
    子节点2
        子节点2.1
        子节点2.2


## 二叉树
- 二叉树是一种特殊的树，每个节点最多有两个子节点，分别称为左子节点和右子节点。
- 二叉树的基本性质：
  1. 有 n 个节点的二叉树有 n-1 条边。
  2. 二叉树的高度为 log(n)。
  3. 完全二叉树的叶子节点在最后一层或倒数第二层。
- 二叉树的基本概念：
  - **根节点**：二叉树的顶端节点。
  - **叶子节点**：没有子节点的节点。
  - **左子节点**：某个节点的左侧子节点。
  - **右子节点**：某个节点的右侧子节点。
  - **深度**：节点到根节点的边数。
  - **高度**：节点到叶子节点的最长路径的边数。
  - **层数**：二叉树的层数等于高度加1。
- 二叉树的遍历方式：
  - **前序遍历**：访问根节点，遍历左子树，再遍历右子树。
  - **中序遍历**：遍历左子树，访问根节点，再遍历右子树。
  - **后序遍历**：遍历左子树，遍历右子树，访问根节点。
  - **层次遍历**：按层次从上到下、从左到右访问节点。
### 基数和满树
- **满二叉树**：每个节点都有两个子节点，且所有叶子节点在同一层。
- **完全二叉树**：除了最后一层外，每一层的节点数都达到最大值，且最后一层的节点从左到右连续排列。
- **二叉树的基数**：二叉树的基数是指节点的数量。
- **二叉树的高度**：二叉树的高度是指从根节点到叶子节点的最长路径的边数。空树的高度为-1，只有一个节点的树高度为0。
- **二叉树的层数**：二叉树的层数等于高度加1。
- **二叉树的度**：节点的子节点数量。对于二叉树，度只能是0、1或2。
- **二叉树的深度**：节点到根节点的边数。根节点的深度为0，叶子节点的深度为树的高度。
- **二叉树的子树**：某个节点及其所有后代节点组成的树。
- **二叉树的度**：节点的子节点数量。对于二叉树，度只能是0、1或2。
深度为k的二叉树，最多有 $2^(k+1)-1$个节点，最少有$k+1$个节点，至多能有$ 2^k$ 个。
- 特殊情况：单链树（每个节点只有一个子节点）和满二叉树（每个节点都有两个子节点，且所有叶子节点在同一层）。
设度数为0，1，2的节点数分别为 $N_0$，$N_1$，$N_2$，则有以下关系：
- $N_0 + N_1 + N_2 = n$ （节点总数）
- $N_0 = N_1 + 1$ （叶子节点数等于非叶子节点数加1）
- 边数：e = n - 1 （树的边数等于节点数减1）

In [2]:
class BinTreeNode:
    def __init__(self, data, parent=None):
        self.data = data
        self.parent = parent
        self.lc = None  # left child
        self.rc = None  # right child
        self.size = 1   # subtree size including self
        self.height = 0 # height of subtree rooted at this node

    def update_size(self):
        left_size = self.lc.size if self.lc else 0
        right_size = self.rc.size if self.rc else 0
        self.size = 1 + left_size + right_size

    def update_height(self):
        left_height = self.lc.height if self.lc else -1
        right_height = self.rc.height if self.rc else -1
        self.height = 1 + max(left_height, right_height)

    def set_left(self, node):
        # Check if 'node' is one of self's ancestors
        current = self
        while current is not None:
            if current is node:
                raise ValueError("Cannot set a node as its own child or create a cycle.")
            current = current.parent
        self.lc = node
        if node:
            node.parent = self
        self._update_subtree()

    def set_right(self, node):
        # Check if 'node' is one of self's ancestors
        current = self
        while current is not None:
            if current is node:
                raise ValueError("Cannot set a node as its own child or create a cycle.")
            current = current.parent
        self.rc = node
        if node:
            node.parent = self
        self._update_subtree()

    def _is_descendant(self, node):
        """Check if the given node is a descendant of self."""
        if node is None:
            return False
        if node is self:
            return True
        return (self.lc and self.lc._is_descendant(node)) or (self.rc and self.rc._is_descendant(node))

    def _update_subtree(self):
        current = self
        while current:
            current.update_size()
            current.update_height()
            current = current.parent

    def is_leaf(self):
        return not self.lc and not self.rc

    def __repr__(self):
        return f"BinTreeNode(data={self.data}, size={self.size}, height={self.height})"

    def get_left(self):
        return self.lc

    def get_right(self):
        return self.rc

    def get_parent(self):
        return self.parent

    def get_data(self):
        return self.data

    def get_size(self):
        return self.size

    def get_height(self):
        return self.height


class BinTree:
    _UNSET = object()  # 哑元，用来区分“未传参”和“传了 None”

    def __init__(self, root=None):
        self.root = root

    def insert(self, data, parent=None, is_left=True):
        new_node = BinTreeNode(data)
        new_node.parent = parent
        if parent is None:
            if self.root is None:
                self.root = new_node
            else:
                raise ValueError("Root already exists")
        else:
            if is_left:
                parent.set_left(new_node)
            else:
                parent.set_right(new_node)
        return new_node

    # 先序遍历
    def traverse_preorder(self, node=_UNSET, visit=lambda x: print(x.data)):
        if node is self._UNSET:
            node = self.root
        def _pre(n):
            if n is None:
                return
            visit(n)
            _pre(n.lc)
            _pre(n.rc)
        _pre(node)

    # 中序遍历
    def traverse_inorder(self, node=_UNSET, visit=lambda x: print(x.data)):
        if node is self._UNSET:
            node = self.root
        def _in(n):
            if n is None:
                return
            _in(n.lc)
            visit(n)
            _in(n.rc)
        _in(node)

    # 后序遍历
    def traverse_postorder(self, node=_UNSET, visit=lambda x: print(x.data)):
        if node is self._UNSET:
            node = self.root
        def _post(n):
            if n is None:
                return
            _post(n.lc)
            _post(n.rc)
            visit(n)
        _post(node)
    
    # ---------------- 栈实现的遍历 ----------------
    def traverse_preorder_iter(self, visit=lambda x: print(x.data)):
        """先序遍历（根 -> 左 -> 右）"""
        if not self.root:
            return
        stack = [self.root]
        while stack:
            node = stack.pop()
            visit(node)
            # 注意：先右后左，保证左子树先处理
            if node.rc:
                stack.append(node.rc)
            if node.lc:
                stack.append(node.lc)

    def traverse_inorder_iter(self, visit=lambda x: print(x.data)):
        """中序遍历（左 -> 根 -> 右）"""
        stack = []
        node = self.root
        while stack or node:
            while node:  # 一直走到最左
                stack.append(node)
                node = node.lc
            node = stack.pop()
            visit(node)
            node = node.rc

    def traverse_postorder_iter(self, visit=lambda x: print(x.data)):
        """后序遍历（左 -> 右 -> 根）"""
        if not self.root:
            return
        stack = [(self.root, False)]
        while stack:
            node, visited = stack.pop()
            if node is None:
                continue
            if visited:
                visit(node)
            else:
                # 根结点在最后访问，所以先压入“已访问”标记
                stack.append((node, True))
                if node.rc:
                    stack.append((node.rc, False))
                if node.lc:
                    stack.append((node.lc, False))
    
    def print_tree(self, node=_UNSET, prefix="", is_left=True):
        if node is self._UNSET:
            node = self.root
        if node is None:
            print("<empty>")
            return
        if node.rc:
            self.print_tree(node.rc, prefix + ("│   " if is_left else "    "), False)
        print(prefix + ("└── " if is_left else "┌── ") + str(node.data))
        if node.lc:
            self.print_tree(node.lc, prefix + ("    " if is_left else "│   "), True)


# Example usage of BinTree
if __name__ == "__main__":
    bin_tree = BinTree()
    root = bin_tree.insert("Root")
    left_child = bin_tree.insert("Left Child", root, is_left=True)
    right_child = bin_tree.insert("Right Child", root, is_left=False)
    bin_tree.insert("Left Left Child", left_child, is_left=True)
    bin_tree.insert("Left Right Child", left_child, is_left=False)
    bin_tree.insert("Right Left Child", right_child, is_left=True)
    bin_tree.insert("Right Right Child", right_child, is_left=False)

    bin_tree.print_tree()
    print("Preorder Traversal:")
    bin_tree.traverse_preorder()
    print("Preorder Traversal iter:")
    bin_tree.traverse_preorder_iter()
    print("\nInorder Traversal:")
    bin_tree.traverse_inorder()
    print("Inorder Traversal iter:")
    bin_tree.traverse_inorder_iter()
    print("\nPostorder Traversal:")
    bin_tree.traverse_postorder()
    print("Postorder Traversal iter:")
    bin_tree.traverse_postorder_iter()


│       ┌── Right Right Child
│   ┌── Right Child
│   │   └── Right Left Child
└── Root
    │   ┌── Left Right Child
    └── Left Child
        └── Left Left Child
Preorder Traversal:
Root
Left Child
Left Left Child
Left Right Child
Right Child
Right Left Child
Right Right Child
Preorder Traversal iter:
Root
Left Child
Left Left Child
Left Right Child
Right Child
Right Left Child
Right Right Child

Inorder Traversal:
Left Left Child
Left Child
Left Right Child
Root
Right Left Child
Right Child
Right Right Child
Inorder Traversal iter:
Left Left Child
Left Child
Left Right Child
Root
Right Left Child
Right Child
Right Right Child

Postorder Traversal:
Left Left Child
Left Right Child
Left Child
Right Left Child
Right Right Child
Right Child
Root
Postorder Traversal iter:
Left Left Child
Left Right Child
Left Child
Right Left Child
Right Right Child
Right Child
Root


## 二叉树表达式求值

In [24]:
import math

# 运算符优先级 & 结合性
precedence = {
    '+': (1, 'L'),
    '-': (1, 'L'),
    '*': (2, 'L'),
    '/': (2, 'L'),
    '^': (3, 'R'),
    '!': (4, 'R'),   # 单目运算符
}

def infix_to_postfix(expr: str):
    # 中缀 -> 后缀表达式（Shunting-yard）
    output, stack, number = [], [], ''

    def flush_number():
        nonlocal number
        if number:
            output.append(number)
            number = ''

    for ch in expr:
        if ch.isdigit() or ch == '.':
            number += ch
        else:
            flush_number()
            if ch in precedence:
                prec, assoc = precedence[ch]
                while stack and stack[-1] in precedence:
                    p2, assoc2 = precedence[stack[-1]]
                    if (assoc == 'L' and prec <= p2) or (assoc == 'R' and prec < p2):
                        output.append(stack.pop())
                    else:
                        break
                stack.append(ch)
            elif ch == '(':
                stack.append(ch)
            elif ch == ')':
                while stack and stack[-1] != '(':
                    output.append(stack.pop())
                stack.pop()
            elif ch.isspace():
                continue
            else:
                raise ValueError(f"非法字符: {ch}")
    flush_number()
    while stack:
        output.append(stack.pop())
    return output

def postfix_to_expr_tree(tree: BinTree, postfix_tokens):
    # 后缀 -> 表达式树 (返回 root)
    # 数字放入，表达式进行匹配，单目留在右边
    stack = []
    for token in postfix_tokens:
        if token in precedence:  # 运算符
            if token == '!':  # 单目运算符
                operand = stack.pop()
                node = tree.insert(token) if tree.root is None else BinTreeNode(token)
                node.set_left(operand)  # 用左孩子保存操作数
                stack.append(node)
            else:  # 双目运算符
                right = stack.pop()
                left = stack.pop()
                node = tree.insert(token) if tree.root is None else BinTreeNode(token)
                node.set_left(left)
                node.set_right(right)
                stack.append(node)
        else:  # 数字
            node = tree.insert(token) if tree.root is None else BinTreeNode(token)
            stack.append(node)
    return stack[0]

def evaluate_postorder(node):
    # 递归后序遍历求值
    if node.lc is None and node.rc is None:
        return float(node.data)

    if node.data == '!':
        val = evaluate_postorder(node.lc)
        return math.factorial(int(val))

    left_val = evaluate_postorder(node.lc)
    right_val = evaluate_postorder(node.rc)

    if node.data == '+':
        return left_val + right_val
    elif node.data == '-':
        return left_val - right_val
    elif node.data == '*':
        return left_val * right_val
    elif node.data == '/':
        return left_val / right_val
    elif node.data == '^':
        return left_val ** right_val
    else:
        raise ValueError(f"未知运算符: {node.data}")

def build_tree_from_infix(expr: str):
    """中缀表达式 -> 表达式树 (BinTree)"""
    postfix = infix_to_postfix(expr)
    tree = BinTree()
    root = postfix_to_expr_tree(tree, postfix)
    tree.root = root
    return tree, postfix

expr = "(32+2)*5-4^2!"
tree, postfix = build_tree_from_infix(expr)

print("表达式:", expr)
print("后缀表达式:", postfix)
tree.print_tree()
print("计算结果:", evaluate_postorder(tree.root))


表达式: (32+2)*5-4^2!
后缀表达式: ['32', '2', '+', '5', '*', '4', '2', '!', '^', '-']
│       ┌── !
│       │   └── 2
│   ┌── ^
│   │   └── 4
└── -
    │   ┌── 5
    └── *
        │   ┌── 2
        └── +
            └── 32
计算结果: 154.0


## 完全二叉树
| 遍历方式               | 定义            |
| ------------------ | ------------- |
| **先序** Preorder    | 根 → 左 → 右     |
| **中序** Inorder     | 左 → 根 → 右     |
| **后序** Postorder   | 左 → 右 → 根     |
| **层序** Level-order | 按层从上到下、从左到右访问 |

可以使用数列很好得到；
并且[先序|后序] + 中序就可以构建
- 先序加后序也可以，但是需要真二叉树！
- 增强序列
![增强序列例图](.\sources\enhancelist.png)

In [3]:
def build_tree_from_pre_in(preorder, inorder):
    """
    根据先序 + 中序构建二叉树，返回 BinTree 实例
    """
    if not preorder or not inorder:
        return BinTree()

    val_to_index = {val: i for i, val in enumerate(inorder)}

    def helper(pre_l, pre_r, in_l, in_r, parent=None):
        if pre_l > pre_r or in_l > in_r:
            return None
        root_val = preorder[pre_l]
        root = BinTreeNode(root_val, parent)
        in_root_idx = val_to_index[root_val]
        left_size = in_root_idx - in_l
        root.lc = helper(pre_l + 1, pre_l + left_size, in_l, in_root_idx - 1, root)
        root.rc = helper(pre_l + left_size + 1, pre_r, in_root_idx + 1, in_r, root)
        root._update_subtree()
        return root

    n = len(preorder)
    root = helper(0, n - 1, 0, n - 1)
    return BinTree(root)


def build_tree_from_post_in(postorder, inorder):
    """
    根据后序 + 中序构建二叉树，返回 BinTree 实例
    """
    if not postorder or not inorder:
        return BinTree()

    val_to_index = {val: i for i, val in enumerate(inorder)}

    def helper(post_l, post_r, in_l, in_r, parent=None):
        if post_l > post_r or in_l > in_r:
            return None
        root_val = postorder[post_r]
        root = BinTreeNode(root_val, parent)
        in_root_idx = val_to_index[root_val]
        left_size = in_root_idx - in_l
        root.lc = helper(post_l, post_l + left_size - 1, in_l, in_root_idx - 1, root)
        root.rc = helper(post_l + left_size, post_r - 1, in_root_idx + 1, in_r, root)
        root._update_subtree()
        return root

    n = len(postorder)
    root = helper(0, n - 1, 0, n - 1)
    return BinTree(root)

preorder = ['A', 'B', 'D', 'E', 'C', 'F']
inorder  = ['D', 'B', 'E', 'A', 'F', 'C']
tree1 = build_tree_from_pre_in(preorder, inorder)
tree1.print_tree()

postorder = ['D', 'E', 'B', 'F', 'C', 'A']
tree2 = build_tree_from_post_in(postorder, inorder)
tree2.print_tree()

│   ┌── C
│   │   └── F
└── A
    │   ┌── E
    └── B
        └── D
│   ┌── C
│   │   └── F
└── A
    │   ┌── E
    └── B
        └── D


## 编码树

- PFC编码 将字符集中字符组织成二叉树，0/1表示左右孩子，并存放字符，来得到编码串
- 平均编码长度 ald有最小，可以得到最优编码树——叶子只出现在倒数两层内，否则节点交换即可
- 字符频率不同 使用不同 —— 文件长度正比于平均带权深度 
- 带权编码长度，得到加权最优编码树

### Huffman算法
频率低的字符优先引入，位置安排也更低（贪婪算法）

## 二叉搜索树
- 优化插入，查找，删除的复杂度，实现平均复杂度O(logn)

### 特点
把数据用树来表示，左叉更小，右叉更大来分类；
![从数组到树](.\sources\listtotree.png)

### 定义
空树或者满足以下条件
- 每个节点都有一作为搜索依据的关键码(key)
- 任意节点的左子树（若非空）的关键码都小于等于该节点关键码
- 任意节点的右子树（若非空）的关键码都大于等于该节点关键码

### 部分性质
- 中序遍历，可以从小到大进行排列
- 当且仅当中序遍历单调非减

In [10]:
class BST:
    def __init__(self):
        self.root = None
    
    def insert(self,data):
        # 插入一个值
        if self.root is None:
            self.root = BinTreeNode(data)
            return self.root
        
        current = self.root
        parent = None
        while current:
            parent = current
            if data < current.data:
                current = current.get_left()
            elif data > current.data:
                current = current.get_right()
            else:
                return current
            
        new_node = BinTreeNode(data, parent)
        if data < parent.data:
            parent.set_left(new_node)
        else:
            parent.set_right(new_node)
        return new_node
    
    def search(self, data):
        """查找一个值，返回节点或 None"""
        current = self.root
        while current:
            if data < current.data:
                current = current.lc
            elif data > current.data:
                current = current.rc
            else:
                return current
        return None
    
    def _min_node(self, node):
        """返回以 node 为根的最小值节点"""
        current = node
        while current.lc:
            current = current.lc
        return current

    def _max_node(self, node):
        """返回以 node 为根的最大值节点"""
        current = node
        while current.rc:
            current = current.rc
        return current

    def delete(self, data):
        """删除一个值"""
        node = self.search(data)
        if node is None:
            return False

        def transplant(u, v):
            if u.parent is None:
                self.root = v
            elif u == u.parent.lc:
                u.parent.lc = v
            else:
                u.parent.rc = v
            if v:
                v.parent = u.parent

        # 情况 1: 没有子节点（叶子）
        if node.lc is None and node.rc is None:
            transplant(node, None)

        # 情况 2: 只有右子树
        elif node.lc is None:
            transplant(node, node.rc)

        # 情况 3: 只有左子树
        elif node.rc is None:
            transplant(node, node.lc)

        # 情况 4: 有两个子树
        else:
            succ = self._min_node(node.rc)  # 后继
            if succ.parent != node:
                transplant(succ, succ.rc)
                succ.rc = node.rc
                if succ.rc:
                    succ.rc.parent = succ
            transplant(node, succ)
            succ.lc = node.lc
            if succ.lc:
                succ.lc.parent = succ

        # 更新整棵树的 size 和 height
        current = node.parent
        while current:
            current._update_subtree()
            current = current.parent
        return True

    def inorder(self, node=None):
        """中序遍历（升序）"""
        if node is None:
            node = self.root
        result = []
        def _in(n):
            if n:
                _in(n.lc)
                result.append(n.data)
                _in(n.rc)
        _in(node)
        return result

    def print_tree(self):
        """打印树形结构"""
        if not self.root:
            print("<empty>")
            return

        def _print(node, prefix="", is_left=True):
            if node.rc:
                _print(node.rc, prefix + ("│   " if is_left else "    "), False)
            print(prefix + ("└── " if is_left else "┌── ") + str(node.data))
            if node.lc:
                _print(node.lc, prefix + ("    " if is_left else "│   "), True)

        _print(self.root)


# example usage

bst = BST()
for val in [5, 3, 7, 2, 4, 6, 8,1,9,14,56,33]:
    bst.insert(val)

print("中序遍历:", bst.inorder())
bst.print_tree()

print("查找 4:", bst.search(4))
print("查找 10:", bst.search(10))

bst.delete(3)
print("删除 3 后的中序遍历:", bst.inorder())
bst.print_tree()
bst.delete(4)
print("删除 4 后的中序遍历:", bst.inorder())
bst.print_tree()
bst.delete(8)
print("删除 8 后的中序遍历:", bst.inorder())
bst.print_tree()


中序遍历: [1, 2, 3, 4, 5, 6, 7, 8, 9, 14, 33, 56]
│                   ┌── 56
│                   │   └── 33
│               ┌── 14
│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 6
└── 5
    │   ┌── 4
    └── 3
        └── 2
            └── 1
查找 4: BinTreeNode(data=4, size=1, height=0)
查找 10: None
删除 3 后的中序遍历: [1, 2, 4, 5, 6, 7, 8, 9, 14, 33, 56]
│                   ┌── 56
│                   │   └── 33
│               ┌── 14
│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 6
└── 5
    └── 4
        └── 2
            └── 1
删除 4 后的中序遍历: [1, 2, 5, 6, 7, 8, 9, 14, 33, 56]
│                   ┌── 56
│                   │   └── 33
│               ┌── 14
│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 6
└── 5
    └── 2
        └── 1
删除 8 后的中序遍历: [1, 2, 5, 6, 7, 9, 14, 33, 56]
│               ┌── 56
│               │   └── 33
│           ┌── 14
│       ┌── 9
│   ┌── 7
│   │   └── 6
└── 5
    └── 2
        └── 1


## 理想平衡？
中序序列固定，有卡特兰数种前序序列，n个形态二叉树形态数。

### 二叉搜索树缺点
1. 删除困难，删除后难以保持原来特性