# Содержание
<a name="index"></a>
1. [О чем мы сегодня будем говорить](#about)
  1. [Основные понятия](#mainidea)
2. [Heap (куча, невозрастающая/неубывающая пирамида)](#heap)
  1. [Бинарные деревья](#binarytree)
  2. [Свойства пирамиды](#heapproperty)
  3. [Используемое представление](#heaprepr)
  4. [Приведение массива к пирамиде](#heapify)
3. [Heapsort, пирамидальная сортировка](#heapsort)
  1. [Набросок алгоритма](#heapsorttemplate)
  2. [Алгоритм пирамидальной сортировки](#heapsortalgo)
4. [Сложность, корректность](#heapmath)
  1. [Коррекность Drown](#drowncorrectness)
  2. [Корректность BuildHeap](#buildheapcorrectness)
  3. [Корректность Heapsort](#heapsortcorrectness)
  4. [Операции с O-нотацией](#onotation)
  5. [Ассимптотическая сложность BuildHeap](#buildheapcomplexity)
  6. [Ассимптотическая сложность Heapsort](#heapsortcomplexity)
5. [Плюсы, минусы, применение](#realworld)
  1. [Плюсы](#pluses)
  2. [Минусы](#minuses)
  3. [Применение](#usage)
6. [Домашнее задание](#homework)

# О чем мы сегодня будем говорить
<a name="about"></a>
## Основные понятия
<a name="mainidea"></a>

[В начало](#index)

# Heap (куча, невозрастающая/неубывающая пирамида)
<a name="heap"></a>
## Бинарные деревья
<a name="binarytree"></a>
<img src="files/binary_tree.png" height="600" width="600">
### Важные моменты
<br>
<font size="4">
    <ol>
        <li>Используется не только в пирамиде, но и в бинарных деревьях поиска, красно-черных деревьях... </li>
        <li>Можно представлять эту структуру данных по-разному. Мы будем использовать <i>массив</i>
    </ol>

Но _"идеологически"_ это что-то вроде
<pre>
type Tree struct {
	Left  *Tree
	Value int
	Right *Tree
}
</pre>
</font>

## Свойства пирамиды
<a name="heapproperty"></a>
<font size="4">
    Для всех $i$, кроме корневого узла
    <ol>
        <li>Невозврастающая пирамида (max-heap): $ Heap[Parent(i)] \geq Heap[i] $ </li>
        <li>Неубывающая пирамида (min-heap): $ Heap[Parent(i)] \leq Heap[i] $ </li>
    </ol>
</font>
### Пример невозрастающей пирамиды
<font size="4">Обратите внимание! Это _не_ бинарное дерево поиска!</font>
<img src="files/heap.png" height="600" width="600">

## Представление в виде массива
<a name="heaprepr"></a>
<font size="4">Мы будем представлять дерево в виде массива. Какие функции нам нужно определить для удобства работы?</font>
<img src="files/heap_as_array.png" height="600" width="600">

[В начало](#index)
### Процедуры адресации
<font size="4">Необходимые процедуры для работы с пирамидой в виде массива:
<pre>
1  Parent(i):
2      <b>return</b> Floor((i - 1) / 2)
3  
4  LeftChild(i):
5      <b>return</b> i * 2 + 1
6
7  RightChild(i):
8      <b>return</b> i * 2 + 2
</pre>
</font>

## Приведение массива к пирамиде 
<a name="heapify"></a>
<font size="4">
    

</font>

### Внимание, рекурсия!
<font size="4">  
- Несмотря на то, что мы взяли за основу массив, пирамида по своей сути _рекурсивна_
- Можно предположить, что удобно применять процедуры рекурсивно
- Если два дочерних дерева _удовлетворяют_ свойствам пирамиды, возьмем верхушку дерева и приведем все дерево к пирамиде

_Эту процедуру можно повторять "снизу вверх", сортируя дерево_
</font>

### Как это выглядит

<img src="files/heapify_1.png" height="400" width="400">
<img src="files/heapify_2.png" height="400" width="400">
<img src="files/heapify_3.png" height="400" width="400">

### Псевдокод процедуры
<font size="4">
    <br>
Эта процедура предпологает, что левая и правая "под-пирамиды" действительно являются пирамидами!
<pre>
1  Drown(Heap, i, size):  // (Пирамида, индекс, ограничения на массив)
2      l := Left(i)
3      r := Right(i)
4      <b>if</b> l ≤ size <b>and</b> Heap[l] > Heap[r]  // первая проверка - выход за пределы
5          largest := l
6      <b>else</b> 
7          largest := i   
8      <b>if</b> r ≤ size <b>and</b> Heap[r] > Heap[largest]
9          largest := r
10     <b>if</b> largest != i
11         Swap(Heap, i, largest)
12         Drown(Heap, largest, size)  // рекурсия
</pre>
    Справка про size : нужен только затем, чтобы не трогать отсортированную часть
</font>

### Создание пирамиды из массива
<font size="4">
<pre>
1  BuildHeap(Array):
2      <b>for</b> i := Floor((length(Array) - 1) / 2) <b>downto</b> 0
3          Drown(Array, i, size)
</pre>
</font>

<img src="files/build_1.png" height="400" width="400">
<img src="files/build_2.png" height="400" width="400">
<img src="files/build_3.png" height="400" width="400">
<img src="files/build_4.png" height="400" width="400">
<img src="files/build_5.png" height="400" width="400">
<img src="files/build_6.png" height="400" width="400">

[В начало](#index)

# Heapsort, пирамидальная сортировка
<a name="heapsort"></a>
## Набросок алгоритма
<a name="heapsorttemplate"></a>
<font size="4">
Неотсортированный массив преобразовать в пирамиду. <br>
Повторять, пока весь массив не будет отсортирован:
    <ol>  
        <li>Забрать "верхушку" и поместить в "отсортированную" часть, заменив на последний неотсортированный элемент (~как в _selection sort_)</li>
        <li>Превратить все, кроме отсортированной части, в пирамиду</li>
    </ol>
</font>

## Алгоритм пирамидальной сортировки
<a name="heapsortalgo"></a>
<font size="4">
<pre>
1  Heapsort(Array):
2      size := length(Array)
3      BuildHeap(Array)
4      <b>for</b> i := length(Array) - 1 <b>downto</b> 1
5          size := size - 1
6          Swap(Array, 0, i)
7          Drown(Array, 0, size)

</pre>
</font>

### Пример

<img src="files/build_6.png" height="400" width="400">
<img src="files/sort_heap.png" height="400" width="400">


[В начало](#index)

# Сложность и корректность
<a name="heapmath"></a>

<font size="4">Чтобы суметь корркетно рассчитать сложность алгоритма и убедиться, что он работает, докажем его корректность.</font>

## Корректность Drown
<a name="drowncorrectness"></a>

<font size="4">

- <i>Инициализация</i>: левая, правая части - пирамиды; само значение может отличаться.
- <i>Сохранение</i>: 
  - если значение в узле максимально, все ок.
  - иначе оно меняется с НАИБОЛЬШИМ из листьев. Для другой ветви свойтсва пирамиды выполнены
  - для той, с которой обменялись - ситуация та же, что и при инициализации
- Завершение</i>: 
  - мы дошли до тривиальной структуры со свойством пирамиды - листа - остановка
</font>

<img src="files/heapify_1.png" height="500" width="500">
<img src="files/heapify_2.png" height="500" width="500">

## Корректность BuildHeap
<a name="buildheapcorrectness"></a>

<font size="4">

- <i>Инициализация</i>: мы находимся в $ \bigg\lfloor \dfrac{length(Array) - 1}{2} \bigg\rfloor $, все листья тривиальны и соответсвуют требованиям.
- <i>Сохранение</i>: все узлы с меньшими номерами, чем указанный, также являются пирмаидами. При понижении индекса мы гарантированно проводим процедуру <i>Drown</i> корректно
- <i>Завершение</i>: каждый узел - вершина пирамиды; при этом исполнение завершится, так как каждую индекс декрементируется


## Корректность Heapsort
<a name="heapsortcorrectness"></a>

<font size="4">

- <i>Инициализация</i>: давайте разберем вместе, какие есть шаги
- <i>Сохранение</i>: ...
- <i>Завершение</i>: ...
</font>


[В начало](#index)

<font size="4">
Кратко  
    
- BuildHeap: $ O (n) $
- Heapsort: $ O (n log(n)) $
- Поскольку при $ n \rightarrow \inf $ выбирается максимальная сложность, то сложность сортировки будет

$$ O(n) + O(n log(n)) = max(O(n), O(n log (n)) = O(n log(n)) $$ 
</font>

## Опереации с O-нотацией
<a name="onotation"></a>

<font size="4">
При $ n \rightarrow \inf $ функция $ f $ относится к $ O(g(x)) $, если $ | f(x) | < C \cdot | g(x)| $ для некоторого $ C $ 
        
То есть $ f(x) $ растет не быстрее, чем $ g(x) $ 

Правила использования:
<ol>
    <li>$ O(x^n) \cdot O(x^m) = O(x^{m+n}) $</li> 
    <li>$ O(x^n) + O(x^m) = O(x^{max(m, n)}) $ при $ n \rightarrow \inf $ </li>     
</ol>
</font>

## Ассимптотическая сложность BuildHeap
<a name="buildheapcomplexity"></a>
### Начнем с Drown
<font size="4">
    
В следующем блоке кода проводится конечное количество сравнений и операций, $ O(1) $:
<pre>
1      l := Left(i)
2      r := Right(i)
3      <b>if</b> l ≤ size <b>and</b> Heap[l] > Heap[r]  // первая проверка - выход за пределы
4          largest := l
5      <b>else</b> 
6          largest := i   
7      <b>if</b> r ≤ size <b>and</b> Heap[r] > Heap[largest]
8          largest := r
9      <b>if</b> largest != i
10         Swap(Heap, i, largest)
</pre>    

После этого мы смещаемся на "один уровень" в глубину пирамиды и вызываем процедуру рекурсивно. 

Для пирамиды размера $ n $ глубина равна $ \lceil log_{2} (n) \rceil $

В дереве максимум $ 2^{k+1}- 1 $, минимум $ 2^k $ элементов при глубине k: $$ 2^{k+1} = 1 + \sum_{i=0}^{k} 2^i $$


Сложность равна $ O(log(n)) \cdot O (1) = O(log (n)) $ 
<img src="files/heap_height.png" height="400" width="400">


</font>

### Сложность процедуры BuildHeap

<font size="4">
    <br>
    Чуть более сложно. Мы будем опираться на логарифмическую сложность <i>Drown</i> и коичество операций на каждом слое дерева. Пирамида обходится "снизу вверх", т.е. от листьев.<br>
    Поэтому лежащие ниже под-пирамиды уже соответсвуют <i>свойствам пирамиды</i>, и нужен только один вызов <i>Drown</i> на пару.

Вопросы:
- Сколько "под-пирамид" с высотой h?
- Сколько времени вычисляется каждая "под-пирамида"?

Ответы:
- ~ $ \dfrac{n}{2^{h+1}} $ "под-пирамид"
- каждая обрабатывается $ O(h)$

Итак, сложность:

$$ \sum_{h=0}^{log_{2}(n)} \dfrac{n}{2^{h+1}} \cdot O(h) = O \bigg(n \cdot \sum_{h=0}^{log_{2}(n)} \dfrac{h}{2^{h+1}}\bigg) $$

Внутренняя сумма

$$ \sum_{h=0}^{log_{2}(n)} \dfrac{h}{2^{h+1}} = O(1) $$

А сложность
 
$$ n \cdot O(1) = O(n) \cdot O(1) = O(n) $$

</font>

[В начало](#index)

## Ассимптотическая сложность Heapsort
<a name="heapsortcomplexity"></a>
<font size="4">
Складывается из сложности _BuildHeap_ и произведения количества элементов в массиве на сложность _Drown_:
    
$$ O(n) + n \cdot O(log (n)) = O(n \cdot log(n)) $$
</font>

[В начало](#index)

# Плюсы, минусы, применение
<a name="realworld"></a>

## Плюсы
<a name="pluses"></a>

<font size="4">

- Работает быстро, скорость в худшем случае $ O(n \cdot log(n)) $
- Не нужно допольнительной памяти - inplace
- Структура данных пирамида может применяться для других задач
</font>


## Минусы
<a name="minuses"></a>

<font size="4">

- Нестабильная сортировка
- Не совсем простой алгоритм
</font>

## Применение
<a name="usage"></a>

<font size="4">
    
- Для гарантированной $ O(n \cdot log(n)) $ сортировки без выделения памяти
- Для очереди с приоритетами, поиска порядковых статистик, алгоритмов, где нужна очередь с приоритетом, например, [очередь на python](https://docs.python.org/3/library/heapq.html), [на Java](https://docs.oracle.com/javase/7/docs/api/java/util/PriorityQueue.html)
- Сортировка [в линуксе](https://github.com/torvalds/linux/blob/master/lib/sort.c#L53)
</font>

[В начало](#index)

# Домашняя работа
<a name="homework"></a>

<font size="4">

- Реализовать <i>Drown</i> - 1 балл
- Реализовать <i>BuildHeap</i> - 1 балл
- Реализовать алгоритм <i>Heapsort</i> - 1 балл
  - Можно все inline и без отдельных процедур, тогда 3 балла, если все иделаьно работает
  - <i>Heapsort</i> должен работать для получения зачета
- Дополнительно 1: реализовать Drown через стек, а не через рекурсию - 1 балл
- Дополнительно 2: реализовать удаление элемента с сохранением свойст пирамиды - 1 балл
- Дополнительно 3: реализовать очередь с приоритетами при помощи heap, сравнить с тем, что было ранее сделано - без баллов, по своему желанию (т.к. нам сложно гарантировать быструю проверку)
</font>

[В начало](#index)

