# 红黑树(Red–black tree)

    红黑树是一种自平衡二叉查找树，是在计算机科学中用到的一种数据结构，典型的用途是实现关联数组。它是在1972年由鲁道夫·贝尔发明的，他称之为"对称二叉B树"，它现代的名字是在Leo J. Guibas和Robert Sedgewick于1978年写的一篇论文中获得的。它是复杂的，但它的操作有着良好的最坏情况运行时间，并且在实践中是高效的：它可以在O(log n)时间内做查找，插入和删除。

    红黑树是每个节点都带有颜色属性的二叉查找树，颜色为红色或黑色。在二叉查找树强制一般要求以外，对于任何有效的红黑树我们增加了如下的额外要求：
    1. 节点是红色或黑色。
    2. 根是黑色。
    3. 所有叶子都是黑色。
    4. 每个红色节点必须有两个黑色的子节点。（从每个叶子到根的所有路径上不能有两个连续的红色节点。）
    5. 从任一节点到其每个叶子的所有简单路径都包含相同数目的黑色节点（黑色路径）。

    这些约束确保了红黑树的关键特性：从根到叶子的最长的可能路径不多于最短的可能路径的两倍长。结果是这个树大致上是平衡的。因为操作比如插入、删除和查找某个值的最坏情况时间都要求与树的高度成比例，这个在高度上的理论上限允许红黑树在最坏情况下都是高效的，而不同于普通的二叉查找树。
![image](https://raw.githubusercontent.com/baifan-wang/data_structures_and_algorithms_in_python/master/image/7-searchtree_redblack1.png)

    操作复杂度
    因为红黑树也是二叉查找树，因此红黑树上的查询操作与普通二叉查找树上的查询操作相同。然而，在红黑树上进行插入操作和删除操作会导致不再匹配红黑树的性质。恢复红黑树的性质需要少量（的颜色变更（实际是非常快速的）和不超过三次树旋转（对于插入操作是两次）。虽然插入和删除很复杂，但操作时间仍可以保持为O(log n)次。

    插入
    我们首先以二叉查找树的方法增加节点并标记它为红色。因为新插入的节点为黑色，就会导致根到叶子的路径上有一条路上，多一个额外的黑节点。但是新插入的节点为红色时，可能会导致出现两个连续红色节点的冲突，那么可以通过颜色调换（color flips）和树旋转来调整。注意插入节点时，必须考虑如下情况:

    情况1: 新节点N位于树的根上，没有父节点。在这种情况下，我们把它涂为为黑色以满足性质2。
    情况2: 新节点的父节点P是黑色。这时候由于新节点是红色，没有改变所有节点的黑色路径长度，所以依然满足红黑树的性质。
    情况3:父节点是红色而叔父节点是黑色或None，这种情况下，我们进行类似AVL树三节点的旋转来恢复红黑树的性质。
    情况4:如果父节点和叔父节点都是红色，这时候将它们涂为黑色并将祖父节点涂为红色。这时候新节点有了一个黑色的父节点P。但是，红色的祖父节点可能是根节点，或者祖父节点的父节点是红色的。为了解决这个问题，可以在祖父节点上递归检查双红色冲突问题。
![image](https://raw.githubusercontent.com/baifan-wang/data_structures_and_algorithms_in_python/master/image/7-searchtree_redblack2.png)


    删除
    删除的节点时，与二叉树的删除操作一样, 即在查找到需要删除的节点 X; 接着我们找到要么在它的左子树中的最大元素节点 M(前驱）、要么在它的右子树中的最小元素节点 M（后继）（注意是中序遍历）, 并交换(M,X)。 此时, M 节点必然至多只有一个子节点。这时候只需考虑删除M节点的问题，这就把问题简化为如何删除最多有一个子节点的节点。

    如果我们删除一个红色节点，它的父亲和子节点一定是黑色的。所以我们可以简单的用它的黑色子节点替换它，并不会破坏红黑树的性质。另一种简单情况是在被删除节点是黑色而它的子节点是红色的时候。如果只是去除这个黑色节点，用它的红色子节点顶替上来的话，并将其涂为为黑色，这样可以继续保持红黑树的性质。如果删除节点是黑节点，分四种情况：
    设要删除的节点为N，其父节点为P，其兄弟节点（即N的叔父节点）为U。
    由于N是黑色的，则P可能是黑色的，也可能是红色的，U也可能是黑色的或者红色的
    
    （1）U及其子节点全是黑色的
    在这种情况下，P可能是黑色的或者红色的，我们简单第将U涂为红色。结果是通过U的所有黑色路径，都少了一个黑色节点。因为删除 N 的话使得通过 N 的所有路径少了一个黑色节点。但是，通过 P 的所有路径比不通过 P 的路径少了一个黑色节点。接下来，要调整以P作为N递归调整树。

    （2）U是黑色的，U的左子节点是红色，右子节点是黑色
    这种情况下我们在 U 上做右旋转，这样 U 的左儿子成为 U 的父亲和 N 的新兄弟。我们接着交换U和它的新父亲的颜色。所有路径仍有同样数目的黑色节点，但是现在 N 有了一个右儿子是红色的黑色兄弟，所以我们进入了情况（3）。N 和它的父亲都不受这个变换的影响。

    （3）U是黑色的，U的右子节点是红色
    在这种情况下我们在 N 的父亲上做左旋转，这样 U 成为 N 的父亲和 U 的右儿子的父亲。我们接着交换 N 的父亲和 U 的颜色，并使 U 的右儿子为黑色。子树在它的根上的仍是同样的颜色。但是，N 现在增加了一个黑色祖先: 要么 N 的父亲变成黑色，要么它是黑色而 S 被增加为一个黑色祖父。所以，通过 N 的路径都增加了一个黑色节点。
    
    （4）U是红色的
    此时P肯定是黑色的。我们对P进行左旋转，然后把红色兄弟转换成N的祖父。我们接着对调 N 的父亲和祖父的颜色。尽管所有的路径仍然有相同数目的黑色节点，现在 N 有了一个黑色的兄弟和一个红色的父亲，所以我们可以接下去按 (1)、(2)或(3)情况来处理。
![image](https://raw.githubusercontent.com/baifan-wang/data_structures_and_algorithms_in_python/master/image/7-searchtree_redblack3.png)
代码（部分方法需继承自BinaryTree）

In [1]:
class RedBlackTree():

    class Node():
        def __init__(self, element, parent=None, left=None, right=None):
            self.element = element
            self.parent=parent
            self.left=left
            self.right =right
            self.red = True #新节点默认为红色
    def set_red(self, p): 
        p.node.red = True
    def set_black(self, p): 
        p.node.red = False
    def set_color(self, p, make_red): 
        p.node.red = make_red
    def is_red(self, p): 
        return p is not None and p.node.red
    def is_red_leaf(self, p): 
        return self.is_red(p) and self.is_leaf(p)
    def get_red_child(self, p):
        for child in (self.left(p), self.right(p)):
            if self.is_red(child):
                return child
        return None

    def rebalance_insert(self, p):
        self.resolve_red(p) # new node is always red

    def resolve_red(self, p):
        if self.is_root(p):
            self.set_black(p) # make root black
        else:
            parent = self.parent(p)
            if self.is_red(parent): # double red problem
                uncle = self.sibling(parent)
                if not self.is_red(uncle): # Case 1: misshapen 4-node
                    middle = self.restructure(p) # do trinode restructuring
                    self.set_black(middle) # and then fix colors
                    self.set_red(self.left(middle))
                    self.set_red(self.right(middle))
                else: # Case 2: overfull 5-node
                    grand = self.parent(parent)
                    self.set_red(grand) # grandparent becomes red
                    self.set_black(self.left(grand)) # its children become black
                    self.set_black(self.right(grand))
                    self.resolve_red(grand) # recur at red grandparent

    def rebalance_delete(self, p):
        if len(self) == 1:
            self.set_black(self.root()) # special case: ensure that root is black
        elif p is not None:
            n = self.num_children(p)
            if n == 1: # deficit exists unless child is a red leaf
                c = next(self.children(p))
                if not self.is_red_leaf(c):
                    self.fix_deficit(p, c)
            elif n == 2: # removed black node with red child
                if self.is_red_leaf(self.left(p)):
                    self.set_black(self.left(p))
                else:
                    self.set_black(self.right(p))

    def fix_deficit(self, z, y):
    #Resolve black deficit at z, where y is the root of z s heavier subtree.¡±¡±¡±
        if not self.is_red(y): # y is black; will apply Case 1 or 2
            x = self.get_red_child(y)
            if x is not None: # Case 1: y is black and has red child x; do ¡±transfer¡±
                old_color = self.is_red(z)
                middle = self.restructure(x)
                self.set_color(middle, old_color) # middle gets old color of z
                self.set_black(self.left(middle)) # children become black
                self.set_black(self.right(middle))
            else: # Case 2: y is black, but no red children; recolor as ¡±fusion¡±
                self.set_red(y)
                if self.is_red(z):
                    self.set_black(z) # this resolves the problem
                elif not self.is_root(z):
                    self.fix_deficit(self.parent(z), self.sibling(z)) # recur upward
        else: # Case 3: y is_red; rotate misaligned 3-node and repeat
            self.rotate(y)
            self.set_black(y)
            self.set_red(z)
            if z == self.right(y):
                self.fix_deficit(z, self.left(z))
            else:
                self.fix_deficit(z, self.right(z))

参考文献:
1. Goodrich M T, Tamassia R, Goldwasser M H. Data structures and algorithms in Python[M]. John Wiley & Sons Ltd, 2013.
2. 裘宗燕. 数据结构与算法: Python语言描述. 机械工业出版社, 2016.
3. https://zh.wikipedia.org/wiki/%E7%BA%A2%E9%BB%91%E6%A0%91