# Chapter X 红黑树

## 0. Recapture 二叉搜索树

### 0.1 BST 查找

- 一棵有n个结点的平衡二叉树的高度为$O(log(n))$,远胜过$O(n)$，所以树在需要搜索优化的地方用得比较多。

- 树如果不平衡，则容易退化成链表。

### 0.2 BST 定义

二叉搜索树又叫二叉排序数，如果树不为空的话，对树上的任意一个结点x，具有如下性质：

- 如果x的左子树存在的话，则x左子树上所有的结点的值都小于x；  
- 如果x的右子树存在的话，则x右子树上所有的结点的值都大于x。

>二叉搜索树不允许有重复值。以常用的Map举例，如果插入重复的值，要么覆盖原来的值，要么插入失败。

### 0.3 BST 节点操作

In [20]:
from util.RedBlackTree import RedBlackTree
from util.RedBlackTree import RBNode
from util.RedBlackTree import nil

#### 0.3.1 查找

从根开始依次比较，设当前结点为 x，待查找的数据为 data；  
如果 x.data == data，则找到了，返回结果；  
如果 data < x.data，则继续查找 x.left，否则继续查找 x.right

In [21]:
def search(bst, target):
    node = bst.root
    while node != nil:
        if node.val == target:
            return node
        if node.val < target:
            node = node.right
        else:
            node = node.left
    print("not found")
    return node


rbtree = RedBlackTree([3,1,0,2,5,4,8,7,9])
print("original bst\n")
rbtree.pretty_print_tree()
print(search(rbtree, 8))

original bst

│           ┌── 9
│       ┌── 8
│       │   └── 7
│   ┌── 5
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0
<util.RedBlackTree.RBNode object at 0x105ab55f8>


#### 0.3.2 插入
- 如果root不存在，则将插入的结点设为根，插入结束；  
- 否则，从根开始依次比较，设p为待插入结点的父结点，设当前结点为x，待插入的数据为data; 
  若data < x.data，则需要插入到左边的某个位置：p = x; x = x.left;  
  否则插入到右边的某个位置：p = x; x = x.right;  
- 当x == nil 时，将待插入的结点挂在p下面即可。

In [28]:
def insert(bst, node):
    new_node = RBNode(node) if type(node) == int else node
    if bst.root == nil:
        bst.root = new_node
        return
    node = bst.root
    while node != nil:
        parent = node
        if new_node.val < node.val:
            node = node.left
        else:
            node = node.right
    if new_node.val < parent.val:
        parent.left = new_node
    else:
        parent.right = new_node
    new_node.parent = parent
        
rbtree = RedBlackTree([3,1,0,2,5,4,7,9])
print("original bst\n")
rbtree.pretty_print_tree()
insert(rbtree, 8)
print("\ninsert node valued 8\n")
rbtree.pretty_print_tree()

original bst

│           ┌── 9
│       ┌── 7
│   ┌── 5
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0

insert node valued 8

│           ┌── 9
│           │   └── 8
│       ┌── 7
│   ┌── 5
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0


#### 0.3.3 删除

- 如果L不存在，则用R替代x即可；  
- 如果R不存在，则用L替代x即可；  
- 如果L与R都存在，需要找到最接近x的且比它大的结点（即后继）来替代x。
  另外特别注意，x 的左右结点还需要在原来的地方。

In [23]:
def delete(bst, node):
    
    def replace(old_node, new_node):
        # replace() 仅负责将new_node挂载在old_node的父节点之下
        # 不处理new_node，old_node的子节点
        if old_node.parent == nil:
            bst.root = new_node
        else:
            if old_node == old_node.parent.left:
                old_node.parent.left = new_node
            else:
                old_node.parent.right = new_node
        if new_node != nil:
            new_node.parent = old_node.parent
    
    if type(node) == int:
        node = bst.search(node)
        
    if node == nil:  # 无此节点
        return False
    # 删除节点不同时具有两个子节点，删除后仅需重新挂载，不需要调整子节点
    if node.left == nil:  
        replace(node, node.right)
        return True
    if node.right == nil:
        replace(node, node.left)
        return True
    
    successor = bst.get_successor(node)
    # 后继节点必然在删除节点的右子树中（右子树最左节点）
    # 可以直接接管删除节点的左子树
    successor.left = node.left
    node.left.parent = successor
    
    if node.right != successor:
        # 若删除节点与后继节点非前驱后继关系，先摘出后继节点
        # 后继节点必定没有左子树，因其为最左节点
        # 直接由其父节点接管右子树
        replace(successor, successor.right)
        node.right.parent = successor
        successor.right = node.right
    
    replace(node, successor)
    return True
            

rbtree = RedBlackTree([3,1,0,2,7,8,9,5,4])
rbtree.pretty_print_tree()
print("\ndelete node 5\n")
delete(rbtree, 5)
rbtree.pretty_print_tree()
print("\ndelete node 8\n")
delete(rbtree, 8)
rbtree.pretty_print_tree()
print("\ndelete node 3\n")
delete(rbtree, 3)
rbtree.pretty_print_tree()

│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 5
│   │       └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0

delete node 5

│           ┌── 9
│       ┌── 8
│   ┌── 7
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0

delete node 8

│       ┌── 9
│   ┌── 7
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0

delete node 3

│       ┌── 9
│   ┌── 7
└── 4
    │   ┌── 2
    └── 1
        └── 0


## 1. 红黑树

### 1.1 定义

- 红黑树是一种平衡搜索树。其源于二叉搜索树，通过额外引入的5条规则来维持二叉树的平衡，但并不要求绝对平衡；

- 红黑树特性（五规则）：  
  - 每个节点不是红色就是黑色；  
  - 根节点是黑色；  
  - 每个叶节点都是黑色；  
  - 不允许出现连续的红色节点（若某个节点为红色，其两个子节点必为黑色）；  
  - 从根节点到每个叶节点的路径上，黑色节点的数量相等。

- 三规则（属性 1 和属性 3 作为不成文的规则，不许在代码中特别维护）
  - 不允许两个连续的红色结点；  
  - 从根到每个叶子结点的路径上，黑色结点的个数相等；  
  - 根是黑色的。

### 1.2 树的旋转

>旋转的目的：调整某一侧的黑色节点使得两侧黑色节点数目平衡

<img src="imgs/rb_rotate_1.jpg">

将右侧 **节点1** 左旋，得到左侧的子树

- 树的旋转不影响 BST 的性质；  
- 旋转可使子树的某一侧比另一侧多一个某种颜色的节点，同时不减少另一侧该颜色节点的数量  
  节点1 右侧比左侧多了一个黑色节点，经过旋转，黑色节点上升，节点1 右侧黑色节点数量减少1，左侧黑色节点数不变；  
- 旋转操作的实现：想象节点1和右子3，围绕蓝色的正方形中心向左（逆时针）旋转$90^\circ$，节点3上升，节点1 下降。节点1 右子本来是节点3，由于节点3 上升，节点1 失去右子，而节点3 左子2 的位置被节点1 占有，故将节点3 左子挂在节点1 右子。

In [24]:
from util.RedBlackTree import RedBlackTree
from util.RedBlackTree import RBNode
from util.RedBlackTree import nil

In [25]:
def rotate_left(rbtree, pivot):
    """
    以 pivot 为轴，进行左旋
    左旋将轴的右子上升，轴下降
    轴成为原右子的左子，原右子的原左子成为轴的右子
    """
    pivot_parent, pivot_right = pivot.parent, pivot.right
    pivot.right = pivot_right.left # 轴接管原右子的左子
    if pivot.right != nil:         # 若新右子非空
        pivot.right.parent = pivot # 建立新右子到轴的链接
    if pivot_parent != nil:        # 若轴非根
        if pivot == pivot_parent.left: # 原右子上升
            pivot_parent.left = pivot_right
        else:
            pivot_parent.right = pivot_right
    else:
        rbtree.set_root(pivot_right)
    pivot_right.parent = pivot_parent
    pivot_right.left = pivot       # 轴下降
    pivot.parent = pivot_right

In [26]:
def rotate_right(rbtree, pivot):
    """
    以 pivot 为轴，进行右旋
    右旋将轴的左子上升，轴下降
    轴成为原左子的右子，原左子的右子成为轴的左子
    """
    pivot_parent, pivot_left = pivot.parent, pivot.left
    pivot.left = pivot_left.right
    if pivot.left != nil:
        pivot.left.parent = pivot
    if pivot_parent != nil:            # 若轴非根
        if pivot == pivot_parent.left: # 原左子上升
            pivot_parent.left = pivot_left
        else:
            pivot_parent.right = pivot_left
    else:
        rbtree.set_root(pivot_left)
    pivot_left.parent = pivot_parent
    pivot_left.right = pivot            # 轴下降
    pivot.parent = pivot_left

In [27]:
rbtree = RedBlackTree([3,1,0,2,5,4,8,7,9])
print("original bst\n")
rbtree.pretty_print_tree()
pivot = rbtree.search(3)
print("\nnode 3 rotate left\n")
rotate_left(rbtree, pivot)
rbtree.pretty_print_tree()
pivot = rbtree.search(5)
print("\nnode 5 rotate right (recovery)\n")
rotate_right(rbtree, pivot)
rbtree.pretty_print_tree()

original bst

│           ┌── 9
│       ┌── 8
│       │   └── 7
│   ┌── 5
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0

node 3 rotate left

│       ┌── 9
│   ┌── 8
│   │   └── 7
└── 5
    │   ┌── 4
    └── 3
        │   ┌── 2
        └── 1
            └── 0

node 5 rotate right (recovery)

│           ┌── 9
│       ┌── 8
│       │   └── 7
│   ┌── 5
│   │   └── 4
└── 3
    │   ┌── 2
    └── 1
        └── 0


<img src="imgs/rb_rotate_2.jpg" width="80%">
节点3左旋 $\downarrow$   $\uparrow$ 节点5右旋
<img src="imgs/rb_rotate_3.jpg" width="80%">

## 2. 红黑节点增删改

插入与删除操作的主逻辑与 BST 插入基本一致，但需要注意：

- 当插入节点和其父节点均为红色，违反红黑树属性（不允许连续的红色节点），需要调整。共 3 种情况（对称 6 种）；
- 当删除或替换节点时，若涉及黑色节点，导致某一侧黑色节点数目减少，违反红黑树属性（从根到每个叶子结点的路径上，黑色结点的个数相等），需要调整。共 4 种情况；

### 2.1 插入

Notation：
- node: 插入节点
- parent: 插入节点的父节点
- pparent: 插入节点父节点的父节点
- parent_sibling: 插入节点父节点的兄弟节点
- parent_sibling_left: 插入节点父节点兄弟节点的左子
- parent_sibling_right: 插入节点父节点兄弟节点的右子

> 你爸爸的姑姑的唯一的兄弟的老婆的孩子的老婆的最大的姐姐和你是什么关系？

此处讨论 <code>parent == pparent.left</code> 情况。

在插入节点违反属性的情况下：

1. node 红色，parent 红色，pparent 黑色，需要将 node 或 parent 置黑。  
   只能将 parent 置黑。若 node 置黑，则红黑树蜕化为二叉搜索树，树中不再有红色节点；

2. 此时 pparent 左子树比右子树多一个黑色节点，违反规则，需要减少左侧黑色节点，将 pparent 置红。

3. 此时