<font size="4">

# О чем мы сегодня будем говорить

## Основные понятия

- Heap (куча, пирамида)
- Heap Queue, Priority Queue -  очередь с приоритетами
- Heapsort (пирамидальная сортировка)

</font>

<font size="4">

# Heap (куча, невозрастающая/неубывающая пирамида)
<a name="heap"></a>
## Бинарные деревья
<a name="binarytree"></a>


- Бинарное дерево лежит в основе бинарных деревьев поиска, красно-черных деревьев...
- Можно представлять эту структуру данных по-разному. Полее просто определить бинарное дерево рекурсивно</li>
- Также для представления бинарного дерева можно использовать <i>массив</i> и набор функций, который по индексу элемента (узла дерева) позволяет вычислить правый и левый дочерний узлы, а также родительский узел. 

<div style="display:flex">
     <div style="flex:1;padding-right:5px;">
          <img src="files/tree_full.png" width="450">
     </div>
     <div style="flex:1;padding-left:5px;">
          <img src="files/tree_partial.png" width="450">
     </div>
</div>


Если определять бинарное дерево рекурсивно, то получится примерно так (псевдокод):
<pre>
type Tree <T> {
	Left  *Tree
	Value <T>  -- значение, которое хранися в узле
	Right *Tree
}
</pre>

> Какое дерево (левое или правое?) можно _удобно_ представить в виде массива  без дополнительной информации о ссылках, а какое нельзя?


## Представление бинарного дерева в виде массива
<a name="heaprepr"></a>
<font size="4">Для того, чтобы пользоваться heap было удобно, будем представлять дерево в виде массива. Какие функции нам нужно определить для удобства работы?</font>

<img src="files/tree_as_array.png" width="750">

.  
.  
.  
.  
.  


### Процедуры адресации
Необходимые процедуры для работы с пирамидой в виде массива:
<pre>
Parent(i):
    <b>return</b> Floor((i - 1) / 2)

LeftChild(i):
    <b>return</b> i * 2 + 1

RightChild(i):
    <b>return</b> i * 2 + 2
</pre>


## Свойства пирамиды
<a name="heapproperty"></a>
<font size="4">
    Для всех $i$, кроме корневого узла, значения узлов пирамиды удовлетворяют требованиям:
    <ol>
        <li>Невозврастающая пирамида (max-heap): $ Heap[Parent(i)] \geq Heap[i] $ </li>
        <li>Неубывающая пирамида (min-heap): $ Heap[Parent(i)] \leq Heap[i] $ </li>
        <li>Если дочернего узла (узлов) нет, требование считается выполненным для этого узла</li>
    </ol>
</font>

### Пример невозрастающей пирамиды

<div style="display:flex">
     <div style="flex:1;padding-right:5px;">
          <img src="files/non_increasing.png" width="450">
     </div>
     <div style="flex:1;padding-left:5px;">
          <img src="files/non_decreasing.png" width="450">
     </div>
</div>

- Важно: в пирамиде _могут_ быть одинаковые элементы
- Пирамида на основе массива, поэтому заполнена "без пропусков"
- Пирамида - это не бинарное дерево поиска, у которого значение левого ребенка $\leq$ узла-родителя, а правого $\geq$ значению узла-родителя


[В начало](#index)


## Приведение массива к пирамиде 

Давайте определим процедуру, которая приводит любой массив к пирамиде.

### Внимание, рекурсия!
<font size="4">  
- Несмотря на то, что мы взяли за основу массив, пирамида по своей сути _рекурсивна_
- Можно предположить, что удобно применять процедуры рекурсивно
- Если два дочерних дерева узла _удовлетворяют_ свойствам пирамиды, возьмем этот узел дерева (как корневой) и сделаем так, чтобы он и его левое и правое поддеревья удовлетворяли свойствам пирамиды
</font>

### Как это выглядит

#### Сначала "виртуально" выделяем дерево

<img src="files/heapify_0.png" height="400" width="600">

#### Рекурсивно "погружаем" элемент, если это необходимо

<img src="files/heapify_1.png" height="400" width="600">

#### Проверяем результат

<img src="files/heapify_2.png" height="400" width="600">

### Псевдокод процедуры


<br>
Эта процедура предпологает, что левая и правая "под-пирамиды" действительно являются пирамидами!
<pre>
1  Drown(Heap, i, size):  -- (Пирамида, индекс, ограничения на массив)
2      l := Left(i)
3      r := Right(i)
4      <b>if</b> l ≤ size <b>and</b> Heap[l] > Heap[r]  -- первая проверка - выход за пределы
5          largest := l
6      <b>else</b> 
7          largest := i   
8      <b>if</b> r ≤ size <b>and</b> Heap[r] > Heap[largest]
9          largest := r
10     <b>if</b> largest != i
11         Swap(Heap, i, largest)
12         Drown(Heap, largest, size)  -- рекурсия
</pre>


### Создание пирамиды из массива

Теперь нужно приспособить $Drown$ для нашей цели: создания пирамиды из массива.

> С какого элемента пирамиды (массива) можно начинать эту процедуру трансформации массива в пирамиду?

.  
.  
.  
.  
.  


_Эту процедуру можно повторять "снизу вверх", начиная от листьев дерева_

### Псевдокод построения пирамиды
<pre>
1  BuildHeap(Array):
2      <b>for</b> i := Floor((length(Array) - 1) / 2) <b>downto</b> 0
3          Drown(Array, i, size)
</pre>

### Пример построения пирамиды

На примере массива:

> $[9,5,10,8,2,1,0,3,11,4,6,7]$

<img src="files/build_heap_0.png" height="400" width="600">
<img src="files/build_heap_1.png" height="400" width="600">
<img src="files/build_heap_2.png" height="400" width="600">
<img src="files/build_heap_3.png" height="400" width="600">
<img src="files/build_heap_4.png" height="400" width="600">

Результат:

> $[11,9,10,8,6,7,0,3,5,4,2,1]$


## Ассимптотическая сложность

### Память

Процедуры $Drown$ и $BuildHeap$ требуют $O(1)$ дополнительной памяти в случае удачной реализации. Если компилятор не умеет использовать хвостовую рекурсию и выбрана рекурсивная (а не итеративная) реализация, то может потребоваться $O(\log {n})$ вызовов $Drown$, следовательно, $O(\log {n})$ вызовов будет в стеке (дополнительная память).

### Скорость работы

$Drown$ для определенного узла в худшем случае выполняется за $O(\log {n})$

- количество операций на одном уровне константно
- не более $O(\log {n})$ рекурсивных вызовов
- $O(\log {n}) \cdot O(1) = O(\log {n})$

Сложность $BuildHeap$?

.  
.  
.  
.  
.  



$BuildHeap$: все гораздо интереснее. Требует $O(n)$ операций в худшем случае, хотя, казалось бы, необходимо вызвать процедуру с логарифмическим временем работы $n$ раз, что дает. 

Вопросы:
- Сколько "под-пирамид" с определенной высотой $h$?
- Сколько времени обрабатывается каждая "под-пирамида"?

Ответы:
- ~ $ \dfrac{n}{2^{h+1}} $ "под-пирамид"
- каждая обрабатывается $O(h)$

Итак, сложность в терминах высоты $h$:

$$ \sum_{h=0}^{\lfloor log_{2}(n) \rfloor} \dfrac{n}{2^{h+1}} \cdot O(h) = O \bigg(n \cdot \sum_{h=0}^{\lfloor log_{2}(n) \rfloor} \dfrac{h}{2^{h+1}}\bigg) $$

Внутренняя сумма

$$ \sum_{h=0}^{\lfloor log_{2}(n) \rfloor} \dfrac{h}{2^{h+1}} = O(1) < 1$$

> сумма ряда $\dfrac{h}{2^{h+1}}$ сходится к $1$, когда $h \to \inf$

А сложность $BuildHeap$ в худшем случае равна
 
$$ n \cdot O(1) = O(n) \cdot O(1) = O(n) $$


</font>

[В начало](#index)

<font size="4">
  
## Priority Queue

Получив в руки $Heap$, мы можем организовать очередь с приоритетами.

Зачем нужна очередь с приоритетом?

- Чтобы обрабатывать задачи в порядке некорого присвоенного им приоритета
- Наверное, можно еще что-то придумать, но это контринтуитивно :)

### Примеры

- C++: `std::priority_queue`
- Java: `java.util.PriorityQueue`
- Python: `heapq`

### Как заставить Heap работать

Чтобы очередь с приоритетами заработала, нужно, чтобы была возможность выполнять следующие операции:

- Удаление самого приоритетного элемента из очереди
- Добавление нового элемента

### Удаление приоритетного элемента

- "Считать" самый приоритетный элемент
- Поставить самый последний элемент массива на место первого (с натбольшим приоритетом)
- Уменьшить размер пирамиды (длину массива) на один
- "Утопить" новый верхний элемент процедурой $Drown$

### Пример работы

На примере уже знакомого массива $[11,9,10,8,6,7,0,3,5,4,2,1]$:

<img src="files/heap_remove_max_0.png" height="400" width="600">
<img src="files/heap_remove_max_1.png" height="400" width="600">

В результате получили $[10,9,7,8,6,1,0,3,5,4,2]$ - корректный массив.


### Псевдокод удаления элемента

<pre>
1  RemoveMax(Array):
2      <b>if</b> Array.size < 1:
3          <b>raise</b> "Нельзя удалить элемент из пустого массива"
4      max = Array[0]
5      Array[0] = Array[Array.size-1]
6      Array.size -= 1
7      Drown(Array, 0)
8      <b>return</b> max
</pre>

> Сложность удаления элемента - $O(\log {n})$



### Добавление нового элемента


- С какой стороны к массиву мы будем добавлять элемент?
  - с начала?
  - с конца?

.  
.  
.  
.  
.  

> Добавление нового элемента может нарушить (и, скорее всего, нарушит) требования, которые накладываются на пирамиду. Цель алгоритма - исправить эти нарушения.

Добавим к концу массива $[11,9,10,8,6,7,0,3,5,4,2,1]$ значение $11$ и посмотрим, как исправить ситуацию.

<img src="files/insert_element_0.png" height="400" width="600">
<img src="files/insert_element_1.png" height="400" width="600">


Получился массив $[11, 9, 11, 8, 6, 10, 0, 3, 5, 4, 2, 1, 7]$, наверху - самый приоритетный элемент, свойства пирамиды не нарушены.

### Псевдокод добавления элемента

> Можно реализовать удаление через функцию _увеличения_ приоритета задача

<pre>
1  HeapIncreaseKey(Array; i; key):
2     <b>if</b> key < Array[i]:
3          <b>raise Exception</b> “новое значение меньше текущего значения ключа”
4     Array[i] = key
5     <b>while</b> i > 0 and Array[Parent(i)] < Array[i]:
6         Swap(Array, Parent(i), i)
7         i = Parent(i)
</pre>

> Вопрос: как понизить приоритет задачи?

Тогда вставка элемента может быть реализована так:

<pre>
1  HeapInsert(Array, key):
2      Array.push_back(-∞)  -- наименьший возможный элемент
3      HeapIncreaseKey(Array, Array.size - 1, key)
</pre>


### Плюсы, минусы, сложность
- Плюсы подхода: можно менять приоритет произвольных элементов
- Минусы подхода: лишняя функция. Для упрощения можно реализовать все in-line
- Сложность: $O(\log{n})$


</font>

<font size="4">

## Пирамидальная сортировка

Рассмотрев очередь с приоритетами, мы можем модифицировать алгоритм совсем немного и получить пирамидальную сортировку ($HeapSort$)


### Идея

- Меняем корень ("самый приоритетный элемент") и последний местами
- Уменьшаем длину массива (но _не удаляем_) элемент
- Повторяем так $n$ раз

### Пример работы

<img src="files/heap_sort_0.png" height="400" width="600">
<img src="files/heap_sort_1.png" height="400" width="600">

... после еще нескольких итераций ...

<img src="files/heap_sort_2.png" height="400" width="600">

> $[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]$ - массив отсортирован! 

### Псевдокод HeapSort

> $0$-й элемент не нужно отдельно "топить" - он уже на своем месте. 

<pre>
1   HeapSort(Array):
2       BuildHeap(Array)
3       <b>for</b> i = Array.size ... 1:
4           Swap(Array, Array.size - 1, 0)
5           Drown(Array, 0)
</pre>


### Сравнение с другими популярными сортировками

<img src="comparison.png">

</font>

<font size="4">

## Внешняя сортировка с использованием Heap

> Задача: есть массив $N$ записей, хранящияся на диске, но в оперативную память помещается только $M$. Как эффективно отсортировать массив и записать его на диск?

- Разбить массив на $k$ частей, каждая из которых $\leq M$
- Отсортировать каждый из подмассивов, $O \bigg (k \dfrac{N}{k} \log  \bigg (\dfrac{N}{k} \bigg) \bigg)$
- ???
- Использовать $Heap$ размера $k$!
  - Выбираем наибольшие элементы из $k$ массивов, формируем из них в $Heap$ - $O(k)$
  - Извлекаем наибольший элемент, пишем его в буфер размера $M$ - $O(\log {k})$
  - По необходимости, записываем буфер на диск, чтобы освободить память
  - Всего будет нужно $O(N \log {k} )$ операций
- Отсортированный массив на диске готов!

Время всех операций - $O(k) + O \big(N \log {k} \big) + O \bigg (N \log  \bigg (\dfrac{N}{k} \bigg) \bigg)$

> Можно найти по запросу "k-way merge heap"

</font>

# Сложность и корректность
<a name="heapmath"></a>

<font size="4">Чтобы суметь корркетно рассчитать сложность алгоритма и убедиться, что он работает, докажем его корректность.</font>

## Корректность Drown
<a name="drowncorrectness"></a>

<font size="4">

- <i>Инициализация</i>: левая, правая части - пирамиды; само значение может отличаться.
- <i>Сохранение</i>: 
  - если значение в узле максимально, все ок.
  - иначе оно меняется с НАИБОЛЬШИМ из листьев. Для другой ветви свойтсва пирамиды выполнены
  - для той, с которой обменялись - ситуация та же, что и при инициализации
- Завершение</i>: 
  - мы дошли до тривиальной структуры со свойством пирамиды - листа - остановка
</font>


## Корректность BuildHeap
<a name="buildheapcorrectness"></a>

<font size="4">

- <i>Инициализация</i>: мы находимся в $ \bigg\lfloor \dfrac{length(Array) - 1}{2} \bigg\rfloor $, все листья тривиальны и соответсвуют требованиям.
- <i>Сохранение</i>: все узлы с меньшими номерами, чем указанный, также являются пирмаидами. При понижении индекса мы гарантированно проводим процедуру <i>Drown</i> корректно
- <i>Завершение</i>: каждый узел - вершина пирамиды; при этом исполнение завершится, так как каждую индекс декрементируется


## Корректность Heapsort
<a name="heapsortcorrectness"></a>

<font size="4">

- <i>Инициализация</i>: давайте разберем вместе, какие есть шаги
- <i>Сохранение</i>: ...
- <i>Завершение</i>: ...
</font>