## Quardtree

**Quardtree** *(или квадродерево)* - дерево, каждая внутренняя вершина которого содержит 4 ребёнка. Каждой вершине  квадродерева соответствует некоторый квадрат. Если внутренней вершине $v$ соответствует какой-то квадрат $a$, то её детям этой вершины соответствуют четверти квадрата $a$. В нашем случае в листах будут храниться координаты точки на плоскости. 

Пусть дано множество точек $P$, для которого нужно построить квадродерево. Начнём с некоторого квадрата $\sigma$, содержащего все точки из $P$ (eсли он не дан явно, его можно легко найти за линейное время от числа вершин). Пусть $\sigma = (x_0, x_1] \times (y_0, y_1]$. Обозначим $x_m = (x_0 + x_1) / 2$; $y_m = (y_0 + y_1) / 2$. Тогда:

* если $P$ не содержит точек, то корнем квадродерева будет лист, в котором в качестве координат точки будет храниться `NULL`;
* если $P$ содержит 1 точку то корнем квадродерева будет лист, в котором хранятся координаты единственной точки из $P$;
* иначе корнем дерева будет вершина $v$, которой соответствует квадрат $\sigma$, а её детям —  $v_{NE}$, $v_{NW}$, $v_{SW}$, $v_{SE}$ будут соответствовать квадраты $\sigma_{NE} = (x_m, x_1] \times (y_m, y_1]$, $\sigma_{NW} = (x_0, x_m] \times (y_m, y_1]$, $\sigma_{SW} = (x_0, x_m] \times (y_0, y_m]$, $\sigma_{SE} = (x_m, x_1] \times (y_0, y_m]$. Теперь таким же образом рекурсивно превращаем каждого ребёнка в квадродерево для множества точек, лежащих в соответствующих четвертях.

## Composed Quardtree

Обычное квадродерево может иметь слишком большую глубину независимо от количества точек. Сжатое дерево лишено данного недостатка и имеет глубину $O(n)$

Назовём квадрат **интересным**, если соответствующая ему вершина дерева имеет хотя бы 2 непустых ребёнка (то есть таких, что в их квадратах содержится хотя бы одна точка) или является корнем. Понятно, что любой квадрат, содержащий хотя бы две точки, содержит в себе хотя бы 1 интересный квадрат.

Сжатое квадродерево получается сжатием обычного таким образом, чтобы остались только интересные квадраты. Пустые дети неинтересных квадратов удаляются. Для каждого интересного квадрата p будем хранить 4 указателя для каждой четверти этого квадрата. Если четверть содержит две или более точки, то указатель ссылается на наибольший интересный квадрат в этой четверти. Если четверть содержит одну точку, то указатель ссылается на эту точку. Наконец, если четверть не содержит точек, то указатель сделаем нулевым.

**Лемма (О высоте сжатого квадродерева) :**
Сжатое квадродерево для $n$ точек имеет $O(n)$ вершин и глубину $O(n)$.

**Док-во**.
Доказать оценку $O(n)$ для числа интересных квадратов. Докажем по индукции, что в квадродереве для $n$ точек количество интересных квадратов меньше либо равно $n$:

* для $n = 1$ это очевидно;
* пусть доказано для квадродерева с $n - 1$ точек. Добавим новую точку $x$: сначала найдём наименьший интересный квадрат $p$, который её содержит. Если $x$ находится в его пустой четверти, то просто добавляем $x$ как лист, не изменив число интересных квадратов. Если же четверть $p$ в которую необходимо вставить $x$, уже содержит точку $y$, то мы можем добавить в дерево интересный квадрат, который будет содержать $x$ и $y$ в разных четвертях. Таким образом, при добавлении точки мы увеличиваем количество интересных квадратов не более, чем на один.

Таким образом, квадродерево для $n$ точек имеет $O(n)$ вершин. Глубина, очевидно, тоже $O(n)$, поскольку на каждом уровне есть хотя бы одна вершина.

### Операции над Composed Quardtree

**Локализация**: Под локализацией подразумевается поиск наименьшего интересного квадрата, где геометрически находится интерсующая точка. Это делается просто: начиная с корня, идём вниз по дереву в те четверти, где геометрически лежит точка.

Работает за высоту дерева, то есть, за $O(n)$.

**Вставка**: Сначала локализуемся, находим наименьший квадрат, в который надо вставиться, понимаем, в какую четверть будем вставляться. Рассмотрим эту четверть:

* Если эта четверь пустая (указатель, где храниться координата == `NULL`), то просто запоминаем координаты вершины в этом листе.
* Если там есть точка (или интересный квадрат), то заменяем этот лист, на новый интересный квадрат, который в четвертях содержит эти точки (или точку и интересный квадрат). Нам этом шаге, самое главное - правильно вычислить рамки нового квадрата.

**Удаление**: Сначала локализуемся, находим наименьший интресный квадрат, в котором может лежать искомая точка. Если в четвертях храниться указатель на координаты нашей точки - удаляем их. После нашей операции, наш квдарат может перестать быть интересным. При этом, родитель нашего квадрата в любом случае останется интересным. В таком случае нам надо просто заменить наш квадрат на точку.

---

Таким образом, все операции на сжатом квадродерве выполняются за $O(n)$. Это ничем не лучше по ассимптотике, чем хранить точки просто в векторе. Тем не менее, это структура нам понадобиться для реализации **skip quardtree**, 

## Skip Quardtree

**skip quardtree** - структура данных, основанная на идее структуры **skip list**, позволяющая хранить множество точек и быстро производить над ним операции, такие как локализация, вставка и удаление. Здесь мы рассмотри одну из реализаций - **randomized skip quardtree**.

Построим **randomized skip quardtree** для заданного множества точек $S$:

Рассмотрим последовательность вложенных подмножеств $\{S_i\}$ множества $S$. Пусть $S_0 = S$; $S_i$ - подмножество $S_{i-1}$, причем каждый элемент из $S_{i-1}$ входит в $S_{i}$ с вероятностью $p \in (0, 1)$. **randomized skip quadtree** для множества $S$ будет состоять из набора $\{Q_i\}$, где $Q_i$ — сжатое квадродерево над множеством $S_i$. Будем называть эти квадродеревья уровнями, при этом нулевой уровень содержит все точки из $S$.

Также мы должны уметь из верншины с i-го уровня перемещаться на соотвестсвущую ей вершину на i-1-ом уровне. Это можно делать несколькими способами:
    
* Просто хранить ссылку внутри вершины.
* Каждый уровень будет хранить ассоциативный массив из масок в вершины. Маску для вершину можно однозначно задать по её коордианатам.

### Локализация

Локализация происходит так же как и в обычных **quardtree**.
Сначала локализуемся в наивысшем уровне, начиная с `root`-вершины. Из полученной вершины переходим в соотвествующую ей вершину на предыдущем уровне. Снова запускаем локализацию, но теперь не из `root`'а, а из вершины, полученной предыдущей локализацией. Повотряем процесс пока не локализуемся в нулевом слое.

Идеологически это похоже на **skip list**: мы пользуемся тем, что локализация в **quardtree** происходит за линейное время (чем меньше точек в квадродереве тем, быстрее проходит операция), и сначала пытаемся локализоваться на том уровне, где меньше всего точек, а потом, при необходимости, спускаемся на уровнень ниже, и продолжаем операцию. Ниже показано, что локализация подобным образом имеет ассимптотику $O(\log n)$.

### Вставка

1. Локализация. В процессе локализации будем для каждого уровня запоминать вершину, на которой остановилась локализация внутри этого уровня.
2. Вставка точки в нулевой слой, в вершину, полученную локализацией из п.1.
3. С вероятностью $p$, переходим на уровень выше к вершине, которую мы запомнили в п.1, вставляем точку в эту вершину.
4. В случае удачи повторяем п.3, в случае неудачи завершаем операцию.
5. Если мы хотим перейти к слою которого нет, создаем новый слой, вствляем туда новую точку и завершаем операцию.

### Удаление

Запускаем локализацию. В процессе локализации будем удалять точку на всех уровнях, где она есть. Если на уровне стало ноль точек - удаляем уровень.

### Оценка времени работы
Такой сложный способ хранения множества точек дает нам бонус в скорости выполнения операций над ним. Из лемм ниже следует что время выполнения локализации оценивается в $O(\log n)$. Вставка и удаление также работает за $O(\log n)$, т.к. на каждом слое происходит не более $O(1)$ операций (добавление / удаление вершины в квадродерево).

**Лемма (О количестве шагов локализации на одном уровне):**
На каждом уровне совершается $O(1)$ шагов локализации для любой точки `x`.

**Док-во:**
Пусть в на `i`-ом уровне поиск точки `x`, начинающийся с корня, проходит по квадратам $p_0, p_1 \dots p_m$. Пусть случайная величина $j$ — количество шагов локализации внутри $Q_i$, тогда $p_{m - j}$ — последний квадрат из $p_0, p_1 \dots p_m$, являющийся интересным в $Q_{i + 1}$.

Оценим мат.ожидание случайной величины $j$. Пусть $T$ - множество встреченных на пути $p_{m - j + 1} \dots p_m$ непустых четвертинок. Чтобы $p_{m - j}$ был последним из $p_0, p_1 \dots p_m$ интересным квадратом в $Q_{i + 1}$ небходимо, чтобы среди $T$ только одна (вероятность этого назовём $Pr_1$) или ноль (вероятность этого назовём $Pr_0$) были непустыми в $Q_{i + 1}$. Иначе, если будет хотя бы пара непустых четвертинок, то их наименьший общий предок в дереве будет интересным квадратом и будет находиться глубже $p_{m - j}$. Таким образом, искомая вероятность не превосходит $Pr_0 + Pr_1$.

Пусть $|T| = t$, $q = 1 - p$.

$Pr_0 = q^t$, потому что $Pr_0$ означает то, что ни одна точка из $T$ не попала на уровень выше.

$Pr_1 = t \cdot pq^{t-1}$, потому что $Pr_1$ означает то, что ровна одна точка из $T$ не попала на уровень выше.

$Ej = \sum\limits_{j = 1}^{m} j \cdot Pr(j) = \sum\limits_{j = 1}^{m} j (q^t + t \cdot pq^{t-1}) = \sum\limits_{j = 1}^{m} j ((1-t) \cdot q^t + t \cdot q^{t-1}) $

В интересной вершине как минимум 2 непустые четверти (в одну из которых мы переходим), всего на пути $j$ интересных вершин, следственно, количество вершин в $T$ - хотя бы j. Следственно, количество точек в $T$ - тоже хотя бы j.

$ Ej                                                                         
\leq \sum\limits_{j = 1}^{m} j ((1-j) \cdot q^j + t \cdot q^{j-1})
<    \sum\limits_{j = 1}^{\infty} j ((1-j) \cdot q^j + j \cdot q^{j-1})
<    \sum\limits_{j = 1}^{\infty}( 2 j (j-1) \cdot q^{j-1} - j (j-1) \cdot q^j)
<    \sum\limits_{j = 1}^{\infty} 2 j (j-1) \cdot q^{j-1}
=    2 \sum\limits_{j = 1}^{\infty} (q^{j+1})''
=    2 (\sum\limits_{j = 1}^{\infty} q^{j+1})''
=    (2 q^2 / (1 - q))''
=    2p^{-3}
$

Получаем, $Ej < 2p^{-3}$. Следственно, $Ej = O(1)$. 

**Лемма (О количестве уровней):** 
Количество уровней - $O(\log n)$

**Док-во:**
Пусть $h$ - cлучайная величина, обозначающая количество уровней.

Оценим $p(h = k)$. 

$p(h = k) = p(h < k + 1) - p (h < k)$

$p(h < k) = (1 - p^k)^n$, потому что вероятность того, что при добавлении точка дойдет до уровня $k$ равняется $p^k$.

$p(h = k) = (1 - p^{k + 1})^n - (1 - p^k)^n < 1 - (1 - p^k)^n < np^k$

Оценим мат.ожидание $h$:

$ Eh
= \sum\limits_{k = 1}^{\infty}k \cdot p(h = k)
= \sum\limits_{k = 1}^{\log_{1/p}(n)}k \cdot p(h = k)
+ \sum\limits_{k = \log_{1/p}(n) + 1}^{\infty}k \cdot p(h = k)
$

Первая сумма:
$ \sum\limits_{k = 1}^{\log_{1/p}(n)}k \cdot p(h = k) 
< \sum\limits_{k = 1}^{\log_{1/p}(n)}\log_{1/p}(n) \cdot p(h = k)
= \log_{1/p}(n) \cdot \sum\limits_{k = 1}^{\log_{1/p}(n)} p(h = k)
= O(\log n)
$

Вторая сумма:
$ \sum\limits_{\log_{1/p}(n) + 1}^{\infty}k \cdot p(h = k)
< \sum\limits_{\log_{1/p}(n) + 1}^{\infty}k \cdot np^k 
< \sum\limits_{\log_{1/p}(n)}^{\infty}k \cdot np^k
= n \cdot \sum\limits_{\log_{1/p}(n)}^{\infty}k p^k
= n p^{\log_{1/p} n} \cdot \sum\limits_0^{\infty} (k + \log_{1/p} n) \cdot p^k
= n p^{\log_{1/p} n} \cdot (\sum\limits_0^{\infty} k p^k + \log_{1/p} n \sum\limits_0^{\infty} p^k)
= n p^{\log_{1/p} n} \cdot (O(1) + \log_{1/p} n \cdot O(1))
= O(\log n)
$

Cледственно, **skip quardtree** в среднем содержит $O(\log n)$ уровней.

### Оценка памяти

Для хранения **skip quardtree** необходимо $O(n)$ памяти

**Док-во:**
Сжатое квадродерево для $n$ точек занимает $O(n)$ памяти. На нулевом уровне $n$ точек. На следующем уровне $O(p n)$ точек, дальше $O(p^2 n)$ и так далее.
В итоге получаем $\sum\limits_0^{O(\log n)} O(p^k n) < \sum\limits_0^{\infty} O(p^k n) = O(n) $.