## Quardtree

**Quardtree** *(или квадродерево)* - дерево, каждая внутренняя вершина которого содержит 4 ребёнка. Каждой вершине  квадродерева соответствует некоторый квадрат. Если внутренней вершине $v$ соответствует какой-то квадрат $a$, то её детям этой вершины соответствуют четверти квадрата $a$. В нашем случае в листах будут храниться координаты точки на плоскости. 

Пусть дано множество точек $P$, для которого нужно построить квадродерево. Начнём с некоторого квадрата $\sigma$, содержащего все точки из $P$ (eсли он не дан явно, его можно легко найти за линейное время от числа вершин). Пусть $\sigma = \left(x_0, x_1\right] \times \left(y_0, y_1\right]$. Обозначим $x_m = \left(x_0 + x_1 \right) / 2$; $y_m = \left(y_0 + y_1\right) / 2$. Тогда:

* если $P$ не содержит точек, то корнем квадродерева будет лист, в котором в качестве координат точки будет храниться `NULL`;
* если $P$ содержит 1 точку то корнем квадродерева будет лист, в котором хранятся координаты единственной точки из $P$;
* иначе корнем дерева будет вершина $v$, которой соответствует квадрат $\sigma$, а её детям —  $v_{NE}$, $v_{NW}$, $v_{SW}$, $v_{SE}$ будут соответствовать квадраты $\sigma_{NE} = \left(x_m, x_1\right] \times \left(y_m, y_1\right]$, $\sigma_{NW} = \left(x_0, x_m\right] \times \left(y_m, y_1\right]$, $\sigma_{SW} = \left(x_0, x_m\right] \times \left(y_0, y_m\right]$, $\sigma_{SE} = \left(x_m, x_1\right] \times \left(y_0, y_m\right]$. Теперь таким же образом рекурсивно превращаем каждого ребёнка в квадродерево для множества точек, лежащих в соответствующих четвертях.

## Composed Quardtree

Обычное квадродерево может иметь слишком большую глубину независимо от количества точек. Сжатое дерево лишено данного недостатка и имеет глубину $O(n)$

Назовём квадрат **интересным**, если соответствующая ему вершина дерева имеет хотя бы 2 непустых ребёнка (то есть таких, что в их квадратах содержится хотя бы одна точка) или является корнем. Понятно, что любой квадрат, содержащий хотя бы две точки, содержит в себе хотя бы 1 интересный квадрат. Поправка на то, что корень является интерсным квадратом, не обязательна, но на практике удобнее, чтобы дерево содержало хотя бы 1 интересный квадрат.

Сжатое квадродерево получается сжатием обычного таким образом, чтобы остались только интересные квадраты. Пустые дети неинтересных квадратов удаляются. Для каждого интересного квадрата p будем хранить 4 указателя для каждой четверти этого квадрата. Если четверть содержит две или более точки, то указатель ссылается на наибольший интересный квадрат в этой четверти. Если четверть содержит одну точку, то указатель ссылается на эту точку. Наконец, если четверть не содержит точек, то указатель сделаем нулевым.

**Лемма (О высоте сжатого квадродерева) :**
Сжатое квадродерево для $n$ точек имеет $O(n)$ вершин и глубину $O(n)$.

**Док-во**.
Доказать оценку $O(n)$ для числа интересных квадратов. Докажем по индукции, что в квадродереве для $n$ точек количество интересных квадратов меньше либо равно $n$:

* для $n = 1$ это очевидно;
* пусть доказано для квадродерева с $n - 1$ точек. Добавим новую точку $x$: сначала найдём наименьший интересный квадрат $p$, который её содержит. Если $x$ находится в его пустой четверти, то просто добавляем $x$ как лист, не изменив число интересных квадратов. Если же четверть $p$ в которую необходимо вставить $x$, уже содержит точку $y$, то мы можем добавить в дерево интересный квадрат, который будет содержать $x$ и $y$ в разных четвертях. Таким образом, при добавлении точки мы увеличиваем количество интересных квадратов не более, чем на один.

Таким образом, квадродерево для $n$ точек имеет $O(n)$ вершин. Глубина, очевидно, тоже $O(n)$, поскольку на каждом уровне есть хотя бы одна вершина.

### Операции над Composed Quardtree

**Локализация**: Под локализацией подразумевается поиск наименьшего интересного квадрата, где геометрически находится интерсующая точка. Это делается просто: начиная с корня, идём вниз по дереву в те четверти, где геометрически лежит точка.

Работает за высоту дерева, то есть, за $O(n)$.

**Вставка**: Сначала локализуемся, находим наименьший квадрат, в который надо вставиться, понимаем, в какую четверть будем вставляться. Рассмотрим эту четверть:

* Если эта четверь пустая, то просто запоминаем координаты вершины в этом листе.
* Если там есть точка (или интересный квадрат), то заменяем этот лист, на новый интересный квадрат, который в четвертях содержит эти точки (или точку и интересный квадрат). Нам этом шаге, самое главное - правильно вычислить рамки нового квадрата.

**Удаление**: Сначала локализуемся, находим наименьший интресный квадрат, в котором может лежать искомая точка. Если в четвертях храниться указатель на координаты нашей точки - удаляем их. После нашей операции, наш квдарат может перестать быть интересным. При этом, родитель нашего квадрата в любом случае останется интересным. В таком случае нам надо просто заменить наш квадрат на его единственного непустого ребенка.

---

Таким образом, все операции на сжатом квадродерве выполняются за $O(n)$. Это ничем не лучше по ассимптотике, чем хранить точки просто в векторе. Тем не менее, это структура нам понадобиться для реализации **skip quardtree**, 

### Практические задания

Для полного понимая алгоритмов вы можете пройти набор заданий. Прежде чем начать их делать, следует ознакомиться с набором сущностей, которые будут использоваться в заданиях

* Точка на плоскости, обычно называется `point` - кортеж `(x, y)`
* Квадрат на плоскости, обычно называет `bounds` - кортеж `(left, right, bottom, top)`
* Четверть квадрата, обычно называется `quarter` или `qt`. Используется, например, для хранения детей в вершине узла дерева. Реализуется перечислением `Quarter` и имеет 4 значения: `Quarter.LT`, `Quarter.LB`, `Quarter.RT`, `Quarter.RB`.
* Узел квадродерева, обычно называется `node`. Реализуется классом `Node`, имеет следующие аттрибуты:
    
    * `node.data` - точка, хранящаяся в этом узле. 
    * `node.bounds` - квадрат, лежащий в этом узле.
    * `node.children` - дочерние узлы квадродерева. Хранится в виде мапы `Quarter -> Node`.
    * `node.empty()` - тест на пустому узла. Возращает `True`, когда узел пустой
    * `node.simple()` - тест на простоту узла. Возращает `False`, когда в узле храниться интересный квадрат.
    
    Узел должен находится в одном из 3 состояний. При модификации узла необходимо сохранять этот контракт:
      
      * пустой - не лежит ни одной точки. <br>
        `bounds == None`, `children == None`, `data == None`, `simple() == True`, `empty() == True`
      * простой - лежит ровно одна точка. <br>
         `bounds == None`, `children == None`, `data == (x, y)`, `simple() == True`, `empty() == False`
      * нетривиальный - лежит больше одной точки. В случае сжатого дерева верно то, что хотя бы два ребенка не пусты. <br>
         `bounds == (...)`, `children == {...}`, `data == None`, `simple() == False`, `empty() == False`
    
* Квадродерево, обычно называется `tree`. Имеет аттрибут `tree.root` - корень дерева. В нашей реализации корень квадродерева будет считаться нетривиальным в не зависимости от того, сколько точек лежит в дереве. Это упрощает реализацию операций на дереве. Например, локализация всегда вернёт интересный квадрат (кроме того случая, когда точка геометрически не лежит в дереве).
         
Также вам могут понадобится вспомогательные функции:
    
* `contains(bounds, point)` - возращает `True`, если `point` лежит в квадрате `bounds`
* `quarter_by(bounds, point)` - возращает четверть квадрата `bounds`, в которой лежит `point`.
* `quarter_bounds(bounds, quarter)` - возращает квадрат, который является четвертью `quarter` квадрата `bounds`. 

In [None]:
import utils.view as v
import utils.solutions as s
from utils.base import *

In [None]:
def cqtree_localize(root, point):
    """Локализация: возвращает узел, содержащий минимальный интересный квадрат из root, где находится point"""
    return s.cqtree_localize(root, point) # TODO: Напиши свое решение здесь

In [None]:
# Отображает квадродерево в интерактивном режиме
# При нажатия кнопкой мыши происходит локализация
# Набор врешин можно менять в localize_test_ops
# Необходимо презапустить cell'у для правильной работы

%matplotlib notebook

localize_test_ops = [
    ('insert', 9, 9.5),
    ('insert', 3, 2),
    ('insert', 9, 9),
    ('insert', 6, 6),
    ('insert', 8, 3),
    ('insert', 8, 2),
]

localize_tree = s.CQTree((0,10,0,10), cqtree_localize)
v.apply_operations(localize_tree, localize_test_ops)

v.display_cqtree_interactive(localize_tree, 10, 'localize')

In [None]:
def cqtree_insert(tree, point):
    """Вставка точки в квадродерево"""
    node = cqtree_localize(tree.root, point)
    if node is None:
        return
    cqtree_insertInternal(tree, point, node)
    
def cqtree_insertInternal(tree, point, node):
    """Вставка точки в узел квадродерева"""
    return s.cqtree_insertInternal(tree, point, node) # TODO: Напиши свое решение здесь

In [None]:
# Отображает квадродерево в интерактивном режиме
# При нажатия кнопкой мыши добавляется вершина
# Необходимо презапустить cell'у для правильной работы

%matplotlib notebook

insert_tree = s.CQTree((0, 10, 0, 10), cqtree_localize, cqtree_insertInternal)
v.display_cqtree_interactive(insert_tree, 10, 'insert')

In [None]:
def cqtree_remove(tree, point):
    """Удаление точки из квадродерева"""
    node = cqtree_localize(tree.root, point)
    if node is None:
        return
    cqtree_removeInternal(tree, point, node)

def cqtree_removeInternal(tree, point, node):
    """Удаление точки из узла квадродерева"""
    return s.cqtree_removeInternal(tree, point, node) # TODO: Напиши свое решение здесь

In [None]:
# TODO : визуализация удаления

In [None]:
def create_cqtree(bounds):
    return s.CQTree(bounds, cqtree_localize, cqtree_insertInternal, cqtree_removeInternal)

### Наихудший случай

Так же как и в простой реализации бинарного дерева, у сжатого квадродерева высота в наихудшем случае линейно растет от количества точек. Это происходит, когда структура представляет из себя своеобразный "бамбук" - каждая нетривиальная вершина содержит двух детей, один из которых является простым.

In [None]:
%matplotlib inline

worst_case_ops = [
    ('insert', 10, 10),
    ('insert', 13, 13),
    ('insert', 14.5, 14.5),
    ('insert', 15.5, 15.5),
]
    
worst_tree = create_cqtree((0, 16, 0, 16))
v.display_cqtree_dump(worst_tree, worst_case_ops, 4)

## Skip Quardtree

**skip quardtree** - структура данных, основанная на идее структуры **skip list**, позволяющая хранить множество точек и быстро производить над ним операции, такие как локализация, вставка и удаление. Здесь мы рассмотри одну из реализаций - **randomized skip quardtree**.

Построим **randomized skip quardtree** для заданного множества точек $S$:

Рассмотрим последовательность вложенных подмножеств $\{S_i\}$ множества $S$. Пусть $S_0 = S$; $S_i$ - подмножество $S_{i-1}$, причем каждый элемент из $S_{i-1}$ входит в $S_{i}$ с вероятностью $p \in \left(0, 1\right)$. **randomized skip quadtree** для множества $S$ будет состоять из набора $\{Q_i\}$, где $Q_i$ — сжатое квадродерево над множеством $S_i$. Будем называть эти квадродеревья уровнями, при этом нулевой уровень содержит все точки из $S$.

Также мы должны уметь из верншины с i-го уровня перемещаться на соотвестсвущую ей вершину на i-1-ом уровне. Это можно делать несколькими способами:
    
* Просто хранить ссылку внутри вершины.
* Каждый уровень будет хранить ассоциативный массив из масок в вершины. Маску для вершину можно однозначно задать по её коордианатам.

### Локализация

Локализация происходит так же как и в обычных **quardtree**.
Сначала локализуемся в наивысшем уровне, начиная с `root`-вершины. Из полученной вершины переходим в соотвествующую ей вершину на предыдущем уровне. Снова запускаем локализацию, но теперь не из `root`'а, а из вершины, полученной предыдущей локализацией. Повотряем процесс пока не локализуемся в нулевом слое.

Идеологически это похоже на **skip list**: мы пользуемся тем, что локализация в **quardtree** происходит за линейное время (чем меньше точек в квадродереве тем, быстрее проходит операция), и сначала пытаемся локализоваться на том уровне, где меньше всего точек, а потом, при необходимости, спускаемся на уровнень ниже, и продолжаем операцию. Ниже показано, что локализация подобным образом имеет ассимптотику $O(\log n)$.

### Вставка

1. Локализация. В процессе локализации будем для каждого уровня запоминать вершину, на которой остановилась локализация внутри этого уровня.
2. Вставка точки в нулевой слой, в вершину, полученную локализацией из п.1.
3. С вероятностью $p$, переходим на уровень выше к вершине, которую мы запомнили в п.1, вставляем точку в эту вершину.
4. В случае удачи повторяем п.3, в случае неудачи завершаем операцию.
5. Если мы хотим перейти к слою которого нет, создаем новый слой, вствляем туда новую точку и завершаем операцию.

### Удаление

Запускаем локализацию. В процессе локализации будем удалять точку на всех уровнях, где она есть. Если на уровне стало ноль точек - удаляем уровень.

### Оценка времени работы
Такой сложный способ хранения множества точек дает нам бонус в скорости выполнения операций над ним. Из лемм ниже следует что время выполнения локализации оценивается в $O(\log n)$. Вставка и удаление также работает за $O(\log n)$, т.к. на каждом слое происходит не более $O(1)$ операций (добавление / удаление вершины в квадродерево).

**Лемма (О количестве шагов локализации на одном уровне):**
На каждом уровне совершается $O(1)$ шагов локализации для любой точки `x`.

**Док-во:**
Пусть в на `i`-ом уровне поиск точки `x`, начинающийся с корня, проходит по квадратам $p_0, p_1 \dots p_m$. Пусть случайная величина $j$ — количество шагов локализации внутри $Q_i$, тогда $p_{m - j}$ — последний квадрат из $p_0, p_1 \dots p_m$, являющийся интересным в $Q_{i + 1}$.

Оценим мат.ожидание случайной величины $j$. Пусть $T$ - множество встреченных на пути $p_{m - j + 1} \dots p_m$ непустых четвертинок. Чтобы $p_{m - j}$ был последним из $p_0, p_1 \dots p_m$ интересным квадратом в $Q_{i + 1}$ небходимо, чтобы среди $T$ только одна (вероятность этого назовём $Pr_1$) или ноль (вероятность этого назовём $Pr_0$) были непустыми в $Q_{i + 1}$. Иначе, если будет хотя бы пара непустых четвертинок, то их наименьший общий предок в дереве будет интересным квадратом и будет находиться глубже $p_{m - j}$. Таким образом, искомая вероятность не превосходит $Pr_0 + Pr_1$.

Пусть $|T| = t$, $q = 1 - p$.

$Pr_0 = q^t$, потому что $Pr_0$ означает то, что ни одна точка из $T$ не попала на уровень выше.

$Pr_1 = t \cdot pq^{t-1}$, потому что $Pr_1$ означает то, что ровна одна точка из $T$ не попала на уровень выше.

$Ej = \sum\limits_{j = 1}^{m} j \cdot Pr\left(j\right) = \sum\limits_{j = 1}^{m} j \left(q^t + t \cdot pq^{t-1}\right) = \sum\limits_{j = 1}^{m} j ((1-t) \cdot q^t + t \cdot q^{t-1}) $

В интересной вершине как минимум 2 непустые четверти (в одну из которых мы переходим), всего на пути $j$ интересных вершин, следственно, количество вершин в $T$ - хотя бы j. Следственно, количество точек в $T$ - тоже хотя бы j.

$ Ej                                                                         
\leq \sum\limits_{j = 1}^{m} j \left(\left(1-j\right) \cdot q^j + t \cdot q^{j-1}\right)
<    \sum\limits_{j = 1}^{\infty} j \left(\left(1-j\right) \cdot q^j + j \cdot q^{j-1}\right)
<    \sum\limits_{j = 1}^{\infty} \left(2 j \left(j-1\right) \cdot q^{j-1} - j \left(j-1\right) \cdot q^j\right)
<    \sum\limits_{j = 1}^{\infty} 2 j (j-1) \cdot q^{j-1}
=    2 \sum\limits_{j = 1}^{\infty} \left(q^{j+1}\right)''
=    2 \left(\sum\limits_{j = 1}^{\infty} q^{j+1}\right)''
=    \left(\frac{2 q^2}{\left(1 - q\right)}\right)''
=    2p^{-3}
$

Получаем, $Ej < 2p^{-3}$. Следственно, $Ej = O(1)$. 

**Лемма (О количестве уровней):** 
Количество уровней - $O(\log n)$

**Док-во:**
Пусть $h$ - cлучайная величина, обозначающая количество уровней.

Оценим $p(h = k)$. 

$p(h = k) = p(h < k + 1) - p (h < k)$

$p(h < k) = \left(1 - p^k\right)^n$, потому что вероятность того, что при добавлении точка дойдет до уровня $k$ равняется $p^k$.

$p(h = k) = \left(1 - p^{k + 1}\right)^n - \left(1 - p^k\right)^n < 1 - \left(1 - p^k\right)^n < np^k$

Оценим мат.ожидание $h$:

$ Eh
= \sum\limits_{k = 1}^{\infty}k \cdot p(h = k)
= \sum\limits_{k = 1}^{\log_{1/p}(n)}k \cdot p(h = k)
+ \sum\limits_{k = \log_{1/p}(n) + 1}^{\infty}k \cdot p(h = k)
$

Первая сумма:
$ \sum\limits_{k = 1}^{\log_{1/p}(n)}k \cdot p(h = k) 
< \sum\limits_{k = 1}^{\log_{1/p}(n)}\log_{1/p}(n) \cdot p(h = k)
= \log_{1/p}(n) \cdot \sum\limits_{k = 1}^{\log_{1/p}(n)} p(h = k)
= O(\log n)
$

Вторая сумма:
$ \sum\limits_{\log_{1/p}(n) + 1}^{\infty}k \cdot p(h = k)
< \sum\limits_{\log_{1/p}(n) + 1}^{\infty}k \cdot np^k 
< \sum\limits_{\log_{1/p}(n)}^{\infty}k \cdot np^k
= n \cdot \sum\limits_{\log_{1/p}(n)}^{\infty}k p^k
= n p^{\log_{1/p} n} \cdot \sum\limits_0^{\infty} \left(k + \log_{1/p} n\right) \cdot p^k
= n p^{\log_{1/p} n} \cdot \left(\sum\limits_0^{\infty} k p^k + \log_{1/p} n \sum\limits_0^{\infty} p^k\right)
= n p^{\log_{1/p} n} \cdot \left(O(1) + \log_{1/p} n \cdot O(1)\right)
= O(\log n)
$

Cледственно, **skip quardtree** в среднем содержит $O(\log n)$ уровней.

### Оценка памяти

Для хранения **skip quardtree** необходимо $O(n)$ памяти

**Док-во:**
Сжатое квадродерево для $n$ точек занимает $O(n)$ памяти. На нулевом уровне $n$ точек. На следующем уровне $O(p n)$ точек, дальше $O(p^2 n)$ и так далее.
В итоге получаем $\sum\limits_0^{O(\log n)} O\left(p^k n\right) < \sum\limits_0^{\infty} O\left(p^k n\right) = O(n) $.

### Практические задания

In [None]:
def sqtree_insert(tree, point):
    """Вставка точки в skip-квадродереово"""
    return s.sqtree_insert(tree, point) # TODO: Напиши свое решение здесь

In [None]:
def sqtree_remove(tree, point):
    """Удаление точки из skip-квадродерева"""
    return s.sqtree_remove(tree, point) # TODO: Напиши свое решение здесь

In [None]:
class SkipQTree:
    """Реализация skip-квадродерева"""
    
    def __init__(self, bounds):
        self.bounds = bounds
        self.levels = []

    def new_level(self):
        return create_cqtree(self.bounds) 
        
    insert = sqtree_insert
    remove = sqtree_remove

In [None]:
# TODO Тест корректной работы
        
tree = SkipQTree((0, 10, 0, 10))

tree.insert((8, 8))
tree.insert((8, 2))
tree.insert((8, 9))
tree.insert((6, 6))
tree.remove((8, 8))