# Содержание
<a name="index"></a>
1. [План на сегодня](#agenda)
2. [Еще раз о сложности](#complexity)
  1. [Нотация](#notation)
  2. [Минимально возможная сложность сортировки сравнением](#minimal_complexity)
  3. [Анализ MergeSort](#mergesort_analysis)
2. [Внешняя сортировка](#external_sort)
2. [Алгоритм поиска медианы](#median)
  1. [Краткое описание](#radix_sort_description)
  2. [Историческая справка](#history)
  3. [Алгоритм Radix Sort](#radix_sort_code)
  4. [Trie-based Radix Sort](#radix_sort_trie)
3. [Обзор всех разобранных сортировкок](#bucket_sort)
  1. [Алгоритм](#bucket_sort_algorithm)
  2. [Анализ](#bucket_sort_analysis)
4. [Домашняя работа](#homework)


# План занятия
<a name="agenda"></a>

<font size="4">
Сегодня будут три основные части: 

- Ответы на вопросы, повторение пройденного: минимальная сложность сортировки сравнениями, обход дерева
- Новые материалы: внешняя сортировка, поиск медианы
- Закрепление пройденного: объединение всех материалов
    
</font>

[в начало](#index)

# Еще раз о сложности
<a name="complexity"></a>

## Нотация
<a name="notation"></a>

<font size="4">
    
**$O, \Theta, \Omega$ - нотация**
    
**$O$ - нотация**  
Обычно в оценке сложности алгоритмов ограничиваются именно ей, так как $O(g(n))$ показывает, что функция $f(n)$, описывающая скорость роста алгоритма, растет _не быстрее_, чем заданная $g(n)$.

Отсюда "раcтут" линейный, квадратичный, $n \cdot log\ n$ и другие порядки роста

Математическая формулировка: существют такие $C_1$ и $n_0$, что $0 \leq |f(n)| \leq C_1 \cdot |g(n)| $ для всех $ n > n_0 $

<img src="files/big_o.png" width=400>

**$\Theta$ - нотация**  
Это запись для ограничения роста функции сверху и снизу:

Существют такие константы $C_1$, $C_2$ и $n_0$, что $ 0 \leq C_1 \cdot |g(n)| \leq |f(n)|  \leq C_2 \cdot |g(n)| $ для всех $ n > n_0 $

<img src="files/big_theta.png" width=400>


**$\Omega$ - нотация**   
Ограничение скорости роста "снизу" (наверное, наиболее редкий вариант), может быть полезно при оценке адаптивных алгоритмов:


Есть такие константы $с$ и $n_0$, что $ 0 \leq с \cdot |g(n)| \leq |f(n)| $ для всех $ n > n_0 $

<img src="files/big_omega.png" width=400>
    

Итак, $O$ - это ограничение сверху, $\Theta$ - тот же порядок роста, $\Omega$ - ограничение снизу.

</font>


[в начало](#index)

## Минимально возможная сложность сортировки сравнением
<a name="minimal_complexity"></a>

<font size="4">
    
**Дерево решений**  

Имеется в виду не решающее дерево - алгоритм машинного обучения, но очень похожая структура.

Дерево является бинарным (т.е. из каждого узла выходят по две ветви). В узлах находятся проверки - сравнение двух элементов массива по определенным индексам.

При прохождении узла два элемента сравниваются, скажем, на то, какой из них больше. В зависимости от резултьтата проверки выбирается следующий узел.

<img src="files/decision_tree.png">

Для массива размером $n$ существует $n!$ перестановок. На исслюстрации изображены $3!$ перестановки для массива длиной 3 и пути, ведущие к ним: сравнение разных пар элементов массива.

Дойдя до листа, мы получаем информацию о _порядке_ всех элементов, что необходимо для упорядочивания массива.

Поскольку алгоритм должен корректно обрабатывать _все_ возможные перестановки, для оценки границы снизу $\Omega$ нам нужно ориентироваться на максимальную глубину дерева - максимальное количество сравнений.

$$ n! \leq 2^h,$$где $h$ - высота дерева

При этом, $h \geq log_2(n!) \geq \Omega (n \cdot log\ n))$. Доказательство последнего тождества можно посмотреть [здесь]("http://sites.math.rutgers.edu/~ajl213/CLRS/Ch3.pdf") (задача 3.2-3) либо попробовать самостоятельно доказать c помощью формулы Стирлинга. 

</font>


[в начало](#index)

## Анализ MergeSort
<a name="mergesort_analysis"></a>



<font size="4">

**Как оценить $O()$ для Merge Sort**  

Простой способ:
- посчитать стоимость операций Merge на каждом "уровне" дерева
- Посчитать глубину дерева, сложить стоимость Merge для всех уровней

**Можно применить метод деревьев рекурсии**

(да, деревья и рекурсия очень часто применяются при анализе алгоритмов)

- на верхнем уровне выполняется задача, допустим, за $f(n)$
- она разбивается на $k$ подзадач, выполняющихся за $f(n/d)$
- граничное условие выполняется за $T(1)$ - константное время


<img src="files/rec_tree_method.png" width="500">

> Количество операций, последний уровень - $\Theta(1) \cdot log_d\ k = \Theta(log_d\ k)$

<br>
Общее количество операций в дереве описывается рекуррентным соотношением 

$$ T(n) = kT(n/d) + f(n) $$

Для вычисления сложности методом рекурсии применяются следующие выражения (в Кормене это называется "Основная теорема"):

Для констант $k, d$ и функции $f(n)$ для неотрицательных $n$ определено рекуррентное выражение 

$$ T(n) = kT(n/d) + f(n),$$ где $n/d$ округляется до целого.

Для $Т(n)$ верны следующие ассимптотические границы:

1. Если $f(n) = O(n^{log_d k - \epsilon})$ для константы $\epsilon > 0$, то $T(n) = \Theta(n^{log_d k - \epsilon})$ 
2. Если $f(n) = O(n^{log_d k})$ для константы $\epsilon > 0$, то $T(n) = \Theta(n^{log_d k} \cdot log\ n)$ 
3. Если $f(n) = O(n^{log_d k + \epsilon})$ для константы $\epsilon > 0$, и $kf(n/d) \leq cf(n)$ для $c < 1$, то $T(n) = \Theta(f(n))$ 

<br>
<br>

\- случай Merge Sort - второй, с константами $d = 2, k = 2$, то есть

$$f(n) = O(n^{log_2 2}) = O(n)$$
</font>


[в начало](#index)

# Внешняя сортировка (External sorting)
<a name="external_sort"></a>

<font size="4">

В ситуациях, когда массив обрабатываемых (например, сортируемых) данных не помещается в (быструю) оперативную память, приходится привлекать внешние ресурсы (как правило, это жесткий диск; для многих задач они "неограничены")

**Модель внешней памяти**   

Не физическое представление, а "математическая" модель. 

Важно, что одним из критических мест в производительности становится процесс записи/чтения во внешнюю память.

Будем обозначать ограниченный объем оперативной памяти как $M$, и будем считать, что внешняя память разбита на неогрниченный набор блоков размера $B$.


**Описание процесса сортировки**  

В начала сортировки массив $S$ хранится во внешней памяти, отсортированный массив записывается туда же. 

- Считываем первые $N$ байт данных из внешней памяти, сортируем (напр., _Quicksort_), записываем во внешнюю память отсортированные данные
- Повторяем так $K$ раз ($K\cdot N \geq S$) - получаем $K$ отсортированных массивов во внешней памяти
- Merge!
  - Возьмем из каждого массива $N / (K+1)$  байт c наибольшими значениями, и выделим еще столько же под выходной буфер. 
  - Делаем _K-way merge_
  
 
<img src="files/k_way_merge.png" width="500">

> Вопрос: почему берутся первые $N / (K+1)$ байт?

<img src="files/k_way_merge_merge.png" width="500">


<img src="files/sigh.png">

**K-way merge (без heap'ов)**

Упрощенный вариант, не учитывающий то, что переодически массивы будут обновляться, а данные надо писать в буфер меньшего размера, чем сам массив

<pre>
1  KWayMerge(Sorted, ArrayOfArrays, k):
2      Ptrs = <b>новый</b> массив из k указателей на k массивов, инициализирован 0 
3      <b>for</b> i = 0 <b>to</b> length(Sorted):
4          index_of_array = FindMinArrayIndex(ArrayOfArrays, Ptrs)
5          Sorted[i] = ArrayOfArrays[index_of_array][Ptrs[index_of_array]]
6          Ptrs[index_of_array] += 1

</pre>

`FindMinArrayIndex` возвращает индекс массива, в котором сейчас находится минимальный элемент. `Ptrs` модифицируется далее в коде, чтобы снизить риск сайд-эффектов.

Для упрощения туда не передается набор индексов-ограничений, чтобы случайно не выйти за пределы массива.

Сложность алгоритма $O(n \cdot k)$

**K-way merge (с heap'ами)**

Идея: сделать heap размера k, где _ключами_ будут минимальные элементы каждого из списков, а ассоциированными с ними значениями - списки.

Напоминаю, как выглядит heap:

<img src="files/build_6.png" width="500">

_- только в нашем случае будет не max heap, a min heap_

Сложность:

- BuildHeap за $O(k)$
- Минимальный элемент извлекается за $O(1)$, новый мимнимум в списке, из которого извлекли элемент - тоже
- За $O(log\ k)$ можно восстановить _heap property_
- Наконец, надо извлечь всего $n$ элементов, т.е. повторить перечисленные выше операции $n$ раз. Итого, сложность:

$$O(k) + n \cdot (O(log\ k) + O(1)) = O(k) + O(n \cdot log\ k) = O(n \cdot log\ k) $$

\- это ощутимая экономия при больших значениях k
 
**Наконец, K-way merge разделяй-и-властвуй**

Предлагается использовать стратегию разделяй-и-властвуй для попарного слияния массивов из _массива массивов_ в памяти.

<img src="divide_and_conquer.png" width="450">

В теории, надо сделать $O(n \cdot log\ k)$ операций, сливая попарно массивы (практически полный аналог merge sort). 

> В чем отличия от heap-based K-way merge?

1. Меньше сравнений - процедура восстановления свойсти кучи требует ~ $2 \cdot log\ k$ сравнений, а одна процедура слияния массивов (всех, на одном уровне) - ~ $n$ сравнений, и $log(k)$ уровней. В итоге получается ~ $2n \cdot log\ k$ у heap-based против $n \cdot log\ k$ у divide-and-conquer.
2. Однако способ "разделяй-и властвуй" требует дополнительной памяти; в целом сравнение скорости требует экспериментальных проверок.

Псевдокод Merge:
<pre>
1  Merge(Array, begin, middle, end, Copy):  // ← Copy - это дополнительная память!
2      fst, snd = begin, middle
3      <b>for</b> ptr in range(begin, end)
4          <b>if</b> fst < middle <b>and</b> (snd >= end <b>or</b> Array[fst] <= Array[snd])
5              Copy[ptr] = Array[fst]
6              fst += 1
7          <b>else</b>
8              Copy[ptr] = Array[snd]
9              snd += 1

</pre>

</font>

[в начало](#index)

# Алгоритм поиска медианы
<a name="median"></a>

<font size="4">


</font>

[в начало](#index)