## <font color=red>Литература</font>

1. Лекции «Алгоритмы: построение, анализ и реализация на языке программирования Си» - Ворожцов А.В., Винокуров Н.А.. Выложена в канале **#edu_materials**

# <font color=blue>Деревья. Продолжение 2</font>

# <font color=blue>Балансировка двоичного дерева</font>

Количество операций, необходимое для того, чтобы найти элемент в дереве, связано с высотой дерева $H$. Поиск элемента требует $O(H)$ операций. Если дерево случайное, то его высота может быть равна количеству узлов дерева $N$, а в лучшем случае высота двоичного дерева - $\left\lceil\log N\right\rceil$. Чтобы высота дерева в худшем случае была логарифмической, применяют **балансировку**.

**Методы балансировки деревьев поиска**  — это алгоритмы выполнения операций добавления и удаления записей (insert и del), которые гарантируют, что при любой последовательности выполнения запросов высота $H$ дерева поиска будет ограничена сверху линейной функцией от логарифма числа N хранимых записей:

$$H < A \cdot log_2 N + B$$

где $A$ и $B$ - фиксированные константы.

**Теорема**

Если в двоичном дереве c $N$ узлами выполнено хотя бы одно из следующих условий:

а) для любого узла число узлов в правом и левом поддереве $N_r$ , $N_l$ отличаются не более чем на $1$:
  $$N_r \le N_l + 1,\quad\quad N_l \le N_r +1$$
  
б) для любого узла число узлов в правом и левом поддереве $N_r$ , $N_l$ удовлетворяют условиям
  $$N_r \le 2 N_l + 1,\quad\quad N_l \le 2 N_r +1$$
  
а) для любого узла высота правого и левого поддеревьев $H_r$ , $H_l$ отличаются не более чем на $1$:
  $$H_r \le H_l + 1,\quad\quad H_l \le H_r +1$$
  
то высота дерева не превосходит $A \cdot log_2 N + B$, где $A$ и $B$ – некоторые положительные
константы, не зависящие от $N$.

**Доказательства** приведены в [1]

**Идально сбалансированное дерево** — это двоичное дерево поиска, для которого с помощью специальных алгоритмов поддерживается свойство (а).

**АВЛ-дерево** — это двоичное дерево поиска, для которого с помощью специальных алгоритмов поддерживается свойство (в).

Высота деревьев поиска, удовлетворяющих условиям (а), (б), (в) ограничена сверху логарифмической функцией от числа узлов дерева, а именно:

а) $H \le \log_2 N$

б) $H \le 1.70951 \log_2 N + 1$

в) $H \le 1.4404 \log_2 N + 1$

## <font color=green>АВЛ-дерево</font>

Названо так в честь математиков Адельского-Вельского и Ландиса.

Пусть высота правого поддерева равна $(k+2)$, а высота левого поддерева - $k$.

<img src="images/tree_rotations.png" alt="Drawing" style="width: 800px">

### Упражнение 1. Правое вращение

Добавьте в узлы ссылки на родителей. Реализуйте правое вращение.

In [27]:
class BSTNode:
    def __init__(self, key, value, left=None, right=None, parent=None):
        self.value = value
        self.key = key
        self.left = left
        self.right = right
        self.parent = parent
        
    def __str__(self):
        t = (
            repr(self.key),
            repr(self.value),
            'None' if self.left is None else repr(self.left.key),
            'None' if self.right is None else repr(self.right.key),
            'None' if self.parent is None else repr(self.parent.key)
        )
        fs = '(key={}, value={}, left_key={}, right_key={}, parent_key={})'
        return self.__class__.__name__ + fs.format(*t)
    
    def is_left_child(self):
        if self.parent is None:
            return False
        if self is self.parent.left:
            return True
        return False
    
    def is_right_child(self):
        if self.parent is None:
            return False
        if self is self.parent.right:
            return True
        return False
        

class BST:
    def __init__(self):
        self.root = None
        
    def _insert(self, key, value, root):
        if key == root.key:
            root.value = value
        elif key < root.key:
            if root.left is None:
                root.left = BSTNode(key, value, parent=root)
            else:
                self._insert(key, value, root.left)
        else:
            if root.right is None:
                root.right = BSTNode(key, value, parent=root)
            else:
                self._insert(key, value, root.right)
        
    def insert(self, key, value):
        if self.root is None:
            self.root = BSTNode(key, value)
        else:
            self._insert(key, value, self.root)
            
    def _find(self, key, root):
        if root is None:
            return None
        if key == root.key:
            return root.value
        elif key < root.key:
            return self._find(key, root.left)
        else:
            return self._find(key, root.right)
            
    def find(self, key):
        return self._find(key, self.root)
    
    def _traverse(self, root):
        if root is not None:
            self._traverse(root.left)
            print(root.key, root.value)
            self._traverse(root.right)
    
    def traverse(self):
        self._traverse(self.root)
        
    @staticmethod
    def _get_connection_lines_for_children(connections):
        connections = connections.copy()
        if len(connections) == 0:
            return connections
        if connections[-1] == '├':
            connections[-1] = '│'
        elif connections[-1] == '└':
            connections[-1] = ' '
        else:
            raise ValueError('no connection to current node')
        return connections
            
    @staticmethod
    def _print_connections(connections):
        connections_str = ''
        for c in connections:
            if c == ' ':
                connections_str += c*4
            elif c == '│':
                connections_str += c + ' '*3
            elif c in '├└':
                connections_str += c + '─'*2 + ' '
            else:
                raise ValueError("unknown character '{}' in connections list".format(c))
        print(connections_str, end='')
        
    def _prefix_traverse(self, root, connections):
        self._print_connections(connections)
        connections = self._get_connection_lines_for_children(connections)
        if root is not None:
            print(root.key)
            connections_right = connections.copy()
            connections_right.append('├')
            self._prefix_traverse(root.right, connections_right)
            connections_left = connections.copy()
            connections_left.append('└')
            self._prefix_traverse(root.left, connections_left)
        else:
            print('-')
        
    def prefix_traverse(self):
        self._prefix_traverse(self.root, [])
    
    def _rotate_left(self, node):
        r = node.right
        if r is None:
            raise ValueError("no right subtree")
        rl = r.left
        if rl is None:
            raise ValueError("no right-left subtree")
        p = node.parent
        
        if p is None:
            self.root = r
        else:
            if node.is_left_child():
                p.left = r
            else:
                p.right = r
        
        r.parent = p
        r.left = node
        
        node.parent = r
        node.right = rl
        
        rl.parent = node
        
    def _rotate_right(self, node):
        left = node.left
        if left is None:
            raise ValueError("no left subtree")
        lr = left.right
        if lr is None:
            raise ValueError("no left-right subtree")
        p = node.parent
        
        if p is None:
            self.root = left
        else:
            if node.is_left_child():
                p.left = left
            else:
                p.right = left
        
        left.parent = p
        left.right = node
        
        node.parent = left
        node.left = lr
        
        lr.parent = node

Расмотрим вопрос о пересчете балансов при левом вращении.

Узлы будут обозначаться так же, как и на рисунках выше. Высоты поддеревьев будут обозначаться буквой 'H', а балансы узлов буквой 'B', например $H_{rr}$, $B_n$. Высоты и балансы после вращения обозначаются шляпкой: $\hat{H_n}$, $\hat{B_r}$. **Обратите внимание, что названия узлов при вращении не меняются: позиция узла изменяется, но имя остается прежним.**

При левом вращении изменятся балансы узлов $n$ и $r$. Вычислим их.

$$B_n = H_r - H_l$$
$$B_r = H_{rr} - H_{rl}$$
$$\hat{B_n} = H_{rl} - H_l$$
$$\hat{B_r} = H_{rr} - \hat{H_n}$$

Кроме того верны соотношения

$$H_r = \max(H_{lr}, H_{rr}) + 1$$
$$\hat{H_n} = \max(H_l, H_{lr})$$

1. Рассмотрим случай $H_{rr} > H_{lr}$. Тогда $H_r = H_{rr} + 1$.


In [None]:
class AVLNode(BSTNode):
    def __init__(self, key, value, left=None, right=None, parent=None, balance=0):
        super().__init__(key, value, left=None, right=None, parent=None)
        self._balance = balance
        
        
class AVLTree(BST):
    def _rotate_left(self, node):
        right = node.right
        node_balance = node.balance
        right_balance = right.balance
        super()._rotate_left(node)
        
        
    
    def _balance_unbalanced_node(self, node):
        assert node.balance > 1 or node.balance < -1, "node does not need balancing\n{}".format(node)
        if node.balance == -2:
            left = node.left
            assert left.balance != 0, \
                "tree was unbalanced before operation\nnode:\n{}\nleft child:\n{}".format(node, left)
            assert -3 < left.balance < 3, \
                "unsupported balance value in node\n{}".format(left)
            if left.balance == -1:
                self._rotate_right(node)
            else:
                self._rotate_left(left)
                self._rotate_right(node)
        else:
            right = node.right
            assert right.balance != 0, \
                "tree was unbalanced before operation\nnode:\n{}\right child:\n{}".format(node, right)
            assert -3 < right.balance < 3, \
                "unsupported balance value in node\n{}".format(right)
            if right.balance == 1:
                self._rotate_left(node)
            else:
                self._rotate_right(right)
                self._rotate_left(node)
        
    
    def _retrace_insert_my(self, node):
        parent = node.parent
        if parent is None:
            return
        assert -2 < parent.balance < 2, "tree was unbalanced before insertion\n{}".format(parent.balance)
        if node.is_left_child():
            parent.balance -= 1
            if parent.balance == 0:
                return
            if parent.balance == -1:
                self._retrace_insert_my(parent)
            else:
                self._balance_unbalanced_node(parent)
        else:
            parent.balance += 1
            if parent.balance == 0:
                return
            if parent.balance == 1:
                self._retrace_insert_my(parent)
            else:
                self._balance_unbalanced_node(parent)
                
    
    def _insert(self, key, value, root):
        if key == root.key:
            root.value = value
        elif key < root.key:
            if root.left is None:
                root.left = AVLNode(key, value)
                self._retrace_insert_my(root.left)
            else:
                self._insert(key, value, root.left)
        else:
            if root.right is None:
                root.right = AVLNode(key, value)
                self._retrace_insert_my(root.right)
            else:
                self._insert(key, value, root.right)
    
    def insert(self, key, value):
        if self.root is None:
            self.root = AVLNode(key, value)
        else:
            self._insert(key, value, root)

In [30]:
import random

bst = BST()
for _ in range(20):
    i = random.randint(0, 1000)
    bst.insert(i, str(i))
    
print(bst.root)
bst.prefix_traverse()

bst._rotate_right(bst.root)    
print('*************************')
bst.prefix_traverse()

BSTNode(key=707, value='707', left_key=361, right_key=755, parent_key=None)
707
├── 755
│   ├── 863
│   │   ├── -
│   │   └── 814
│   │       ├── -
│   │       └── -
│   └── -
└── 361
    ├── 443
    │   ├── 649
    │   │   ├── 698
    │   │   │   ├── -
    │   │   │   └── -
    │   │   └── 505
    │   │       ├── 573
    │   │       │   ├── -
    │   │       │   └── -
    │   │       └── 486
    │   │           ├── -
    │   │           └── -
    │   └── 401
    │       ├── -
    │       └── -
    └── 175
        ├── 195
        │   ├── 208
        │   │   ├── -
        │   │   └── -
        │   └── -
        └── 97
            ├── 143
            │   ├── -
            │   └── -
            └── 2
                ├── 24
                │   ├── 66
                │   │   ├── -
                │   │   └── -
                │   └── -
                └── -
*************************
361
├── 707
│   ├── 755
│   │   ├── 863
│   │   │   ├── -
│   │   │   └── 814
│   │   │       ├── -
│   │   │

### Упражнение 2. Печать  дерева

Добавьте в класс `BST` метод, печатающий дерево согласно алгоритму in-order traverse. Узел с уровнем `4` должен печататься с отступом в `4*n` пробела. Сначала печатается корень поддерева, затем правое поддерево.

## <font color=green>Вставка узла в АВЛ-дерево. Удаление узла из АВЛ-дерева</font>

Алгоритмы состоят из двух этапов.

1. Обычные вставка и удаление, используемые в двоичных деревьях поиска

2. Ретрейсинг. Проходим по дерево снизу вверх, балансируя дерево.
  
  - Для выполнения этой операции в каждый узел добавляется дополнительный параметр - баланс, который равен разности высот правого и левого дерева.
  
  - В процессе движения вверх исправляется баланс и дерево балансируется. Для балансировки достаточно выполнить одну операцию малого поворота (Rotate-Left, Rotate-Right) или одну операцию большого поворота (Rotate-Right-Left, Rotate-Left-Right)

### Пример 3. Вставка в АВЛ-дерево