# Содержание

<a name="index"></a>

1. [Анализ Mergesort](#mergesort_analysis)
  1. [На примере MergeSort](#ms_example)
  2. [Основная теорема (Master theorem)](#master_theorem)
2. [Bucket Sort (блочная сортировка)](#bucket_sort)
  1. [Алгоритм](#bucket_sort_algorithm)
  2. [Анализ](#bucket_sort_analysis)
3. [Сортировка подсчетом](#counting_sort)
  1. [Визуализация](#counting_sort_visual)
  2. [Псевдокод сортировки подсчетом](#counting_sort_code)
  3. [Модификация](#counting_sort_mod)
5. [Поразрядная сортировка](#radix_sort)
  1. [Краткое описание](#radix_sort_description)
  2. [Историческая справка](#history)
  3. [Алгоритм Radix Sort](#radix_sort_code)
  4. [Trie-based Radix Sort](#radix_sort_trie)

## Анализ MergeSort
<a name="mergesort_analysis"></a>

<font size="4">

**Как оценить $O()$ для Merge Sort**  

Простой способ:
- посчитать стоимость операций Merge на каждом "уровне" дерева
- Посчитать глубину дерева, сложить стоимость Merge для всех уровней

**Можно применить метод деревьев рекурсии**

- на верхнем уровне выполняется задача, допустим, за $f(n)$
- она разбивается на $k$ подзадач, выполняющихся за $f(n/d)$
- граничное условие выполняется за $T(1)$ - константное время

<img src="files/rec_tree_method.png" width="500">

> Количество операций, последний уровень - $\Theta(1) \cdot n^{log_d\ k} = \Theta(n^{log_d\ k})$

<br>
Общее количество операций в дереве описывается рекуррентным соотношением 

$$ T(n) = kT(n/d) + f(n) $$

### На примере MergeSort
<a name="ms_example"></a>

<pre>
MergeSort(Array, end):
1   Copy = CopyArray(Array)
2   SplitMerge(Copy, 0, n, Array)
  

SplitMerge(Copy, begin, end, Array):
1      <b>if</b> end - begin < 2
2         <b>return</b>
3      middle = (end + begin) // 2
4     SplitMerge(Array, begin, middle, Copy)
5     SplitMerge(Array, middle, end, Copy)
6     Merge(Copy, begin, middle, end, Array)
</pre>


#### Вызовы функций

<img src="files/divide_and_conquer_fns.png" width="500">

#### Часть divide - T, и conquer - f(n)

<img src="files/divide_and_conquer_fns_2.png" width="650">


### Основная теорема (Master theorem)
<a name="master_theorem"></a>

Для вычисления сложности методом рекурсии применяются следующие выражения:

Для констант $k \geq 1, d > 1 $ и функции $f(n)$ для неотрицательных $n$ определено рекуррентное выражение 

$$ T(n) = kT(n/d) + f(n),$$ где $n/d$ округляется до целого.

Выводится $c_{crit} = \log_d{k} = \log (количество\ подпроблем) / (относительный\ размер\ подпроблемы)$


Для $Т(n)$ верны следующие ассимптотические границы:

1. Если $f(n) = O(n^{с})$, $c < c_{crit}$, то $T(n) = \Theta(n^{c_{crit}})$ 
2. Если $f(n) = O(n^{c_{crit}}\log^C{n})$ для константы $\epsilon > 0$ и $C \geq 0$, то $T(n) = \Theta(n^{c_{crit}} \cdot \log^{C+1}{n})$ 
3. Если $f(n) = O(n^{с})$, $c > c_{crit}$, и $kf(n/d) \leq cf(n)$ для $c < 1$, то $T(n) = \Theta(f(n))$ 

<br>
<br>

\- случай Merge Sort - второй, с константами $d = 2, k = 2$, то есть $c_{crit} = \log_2{2} = 1$, и $f(n) = O(n)$, то есть $C = 0$,

$$f(n) = O(n^{log_2 2} \cdot \log^0{n}) = O(n^1 \cdot \log^{0 + 1} n) = O(n \cdot \log{n})$$

[Ссылка на случаи Master theorem](https://en.wikipedia.org/wiki/Master_theorem_(analysis_of_algorithms)#Generic_form)

</font>


[в начало](#index)

# Bucket sort (блочная сортировка)
<a name="bucket_sort"></a>
<font size="4">

- Алгоритм предполагает, что данные взяты из равномерного распределения
- Данные разбрасываются по корзинам (bucket), сортируются внтури них
- Корзины конкатенируются (не через merge, а просто)

Что такое равномерное распределение: если на отрезке $[a, b]$ плотность вероятности слйчайной величины $X$ равна

$$
f_X(x) = \left\{
\begin{matrix}
{1 \over b-a}, & x\in [a,b] \\
0, & x\not\in [a,b]
\end{matrix}
\right..
$$

По-моему, это самый "скучный" из алгоритмов сортировки. С другой стороны, это наш первый вероятностный алгоритм.
</font>


## Алгоритм
<a name="bucket_sort_algorithm"></a>
<font size="4">
<br>
<br>
<br>
<br>
<br>
<br>
Алгоритм для значений в диапазоне $[0..M]$ (можно обобщить на диапазон $[L..M]$):

<br>
<br>
<br>
<br>
<br>
<img src="files/buckets.jpg">

<pre>
BucketSort(Array, k):  // массив, количество корзин 
1   buckets = <b>new</b> array of k empty lists
2   M = Max(Array)
3   <b>for</b> i = 0 <b>to</b> Length(Array)-1
4       insert Array[i] into buckets[Floor(Array[i] / M * k)]  // Floor() нужен для целых
5   <b>for</b> i = 0 <b>to</b> k-1
6       StableSort(buckets[i])
7   <b>return</b> the concatenation of buckets[1], ...., buckets[k]
</pre>
</font>

## Анализ
<a name="bucket_sort_analysis"></a>
<font size="4">

- Стабильность зависит от стабильности сортировки, которая применяется внутри корзины
- Производительность в _худшем_ случае равна производительности внтуренней сортировки ( $O(n \cdot log(n))$ или $O(n^2)$ )
- Среднее время для равномерного распределения: нужно расчитать _ожидаемое_ время сортировки корзины, откуда время работы алгоритма:
$$ O(n + \dfrac{n^2}{k} +k) $$

- Если брать $k = \Theta(n)$, то среднее время сортировки будет равно $O(n)$
</font>

[В начало](#index)

# Сортировка подсчетом
<a name="counting_sort"></a>

<font size="4">
    
Все сортировки в сегодняшнем занятии предполагают, что входные данные ограничены некотором набором правил. За счет этого получается экономить на количесве сравнений и сортировать данные за $O(n)$, однако в ином случае алгоритимы не применимы.
    
**Сортировка подсчетом** работает с последовательностями, в которых содержатся целые числа от $0$ до $k$. При этом, если $k = O(n)$ (речь идет о порядке роста), сортировка выполняется за $\Theta(n) $.

- Эта сортировка использует дополнительные массивы: один ($O(n)$) - для записи отсортированных значений, и второй ($O(k)$) - для промежуточных вычислений
- таким образом, кроме линейного времени получается и линейная память
</font>


## Визуализация
<a name="counting_sort_visual"></a>

<font size="4">Начнем с визуализации (пояснения про "второй", "третий" циклы далее)</font>


<img src="files/count_sorting_counter.png"  width="700">


<img src="files/count_sorting_sorting.png" width="700">

### Все циклы словами

<font size="4">

<ol>
    <li>Первый цикл - инициализация массива - "счетчика"</li>
    <li>Второй цикл - подсчет количества каждого значения от 1 до $k$</li>
    <li>Третий цикл: в вспомогательном массиве сохраняется количество элементов, меньших либо равных значению</li>
    <li>Элементы с конца массива на соответсвующие позиции. Т.е. если для $j$-го элемента есть $Counter[элемент]$ элементов ≤ него, он ставится в новый массив на соответсвующее место. Затем отметить, что элемент "посчитали" </li>
</ol>
</font>


## Псевдокод сортировки подстчетом
<a name="counting_sort_code"></a>

<font size="4">
<pre>
CountingSort(Array, Sorted, k):  // массив, массив для записи отсортированного, k
1  // Примечание: если используется zero indexing, то надо сделать k += 1
2  Counter = <b>new</b> array of size <b>k</b>
3  <b>for</b> i = 0 <b>to</b> k-1: 
4      Counter[i] = 0
5  <b>for</b> j = 0 <b>to</b> length(Array)-1:
6     Counter[Array[j]] = Counter[Array[j]] + 1
7  <b>for</b> i = 1 <b>to</b> k-1:
8     Counter[i] = Counter[i] + Counter[i-1]
9  <b>for</b> j = length(Array)-1 <b>downto</b> 0:
10    Counter[Array[j]] = Counter[Array[j]] - 1
11    Sorted[Counter[Array[j]]] = Array[j]         
</pre>    
</size>


<font size="4">Заметьте, что мы, фактически, **сжали** информацию о массиве до меньшего массива, а затем использовали ее для **"распаковки"**, получив отсортированный массив (при этом отбросив ненужное нам - фактически, данные о положении элементов)</font>

## Модификация
<a name="counting_sort_mod"></a>

<font size="4">
Подсчет элементов можно использовать по-разному, например, можно делать записи в тот же массив
<pre>

CounterValue{value, count} - счетчик значений

СountingSort(Array, k): 
1   k += 1  // из-за zero indexing
2   Counter = <b>new</b> array of size <b>k</b>
3   <b>for</b> i = 0 <b>to</b> k:
4       Counter[i] = CounterValue{i, 0}
5   <b>for</b> i = 0 <b>to</b> length(Array) - 1:
6       Counter[Array[i]].count += 1
7   counter_pointer = 0
8   array_pointer = 0
9   <b>while</b> <b>True</b>:
10      <b>if</b> counter_pointer ≥ k
11          <b>break</b>
12      <b>if</b> Counter[counter_pointer].count == 0:
13          counter_pointer += 1
14      <b>else</b>:
15          Counter[counter_pointer].count -= 1
16          Array[array_pointer] = Counter[counter_pointer].value
17          array_pointer += 1
</pre>

- Будет ли такоой алгоритм работать?
- Какие у него плюсы и минусы по сравнению с предыдущим вариантом?
</size>



# Поразрядная сортировка
<a name="radix_sort"></a>


## Краткое описание
<a name="radix_sort_description"></a>
<font size="4">
**Поразрядная сортировка** (или radix sort) может использоваться для сортировки данных, в которых есть разряды, при этом каждый разряд включает в себя только ограниченное количество значений.
    
Примеры:

- Числа в (например, десятичной) системе счисления
- IP-адреса
- Даты
    
</font>

## Историческая справка
<a name="history"></a>

<font size="4">
Поразрядная сортировка использовалась на машинах с перфокартами.

(На изображинии [SEAC](https://en.wikipedia.org/wiki/SEAC_(computer)), 1950 г., а точнее, его часть - устройство ввода перфокарт)

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/7/7e/SEACComputer_038.jpg/1280px-SEACComputer_038.jpg" width="720">

Схема (устройство для ввода перфокарт справа вверху, **punched card reader**)

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/46/SEACComputer_011.jpg/1280px-SEACComputer_011.jpg" width="720">
Это чудо техники использовалось для обработки изображений, моделирования трафика, физических расчетов и метеорологии
</font>

[в начало](#index)

## Алгоритм Radix Sort
<a name="radix_sort_code"></a>
<font size="4">
- Алгоритм стабилен и работает за $O(k \cdot n)$, где $k$ - число разрядов, $n$ - размер массива
- Есть несколько вариантов реализации этого алгоритма
- Важный вопрос: свойства сортировки для реализации Radix Sort?
</font>

In [2]:
from IPython.display import HTML

# Youtube
HTML('<iframe width="560" height="315" src="https://www.youtube.com/embed/jJH2alRcx4M" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>')

### Least Significant Radix Sort

<font size="4">
<br>
    
- Данная модификация сортировки начинает ее с младшего разряда и идет к все возрастающим
- Алгоритм выглядит так:

<pre>
1  RadixSort(Array, digits):  // массив, максимальный разряд 
2      <b>for</b> i = 0 <b>to</b> digits-1:
3          StableSort(Array sliced on <b>i</b>)
</pre>
</font>

### Разбор корректности алгоритма

<font size="4">
<br>
Корректность алгоритма доказывается <i>по индкукции</i>. В данном случае шаг индукции - увеличение разряда, а база индукции - что можно отсортировать 1 разряд
    
- Покажем, что если мы исопльуем _стабильную_ сортировку для разряда $i+1$, то для $0 \leq i \lt i+1$ значения уже отсортированы.

- Если два элемента не отсортированы по $i+1$, значит, они 
  - обладают разным $i+1$ значением, и оно будет отсортировано (не важно, нарушится или нет порядок для меньших разрядов)
  - $i+1$ значения равны; однако, если они равны, значит, до $i$-го знака значения отсортированы, а благодаря свойствам _стабильной_ сортировки их порядок не нарушится и далее.

</font>


### Most Significant Radix Sort

<font size="4">
<br>
    
- Если сортировать от старших к младшим:

<img src="files/msd_radix_sort.png">


- числа группируются по корзинам, корзины сортируются
- функция вызывается рекурсивно
- корзины объединяются
</font>

[в начало](#index)

## Trie-based Radix sort
<a name="radix_sort_trie"></a>
    
### Структура данных Trie

<font size=4>
    <br>
    
**Trie**, по-русски бор, или префиксное дерево - рекурсивная структура данных.

- Напоминает дерево
- В отличие от "просто" дерева, кроме значений в узлах хранит информацию о том, при каком "условии" переходить в следующий узел
- Используется для "сжатия" наборов последовательностей и для быстрого поиска по ним
- Важен процесс построения _trie_

**Зачем он нужен?**

- Для поиска информации по запросу
- Для алгоритмов сравнения
- Для подстановки (autocomletion)
</font>

### Как строится Trie

<img src="trie.png" width="650">

[в начало](#index)

### Как Trie можно использовать для сортировки?

<img src="trie_sort.png" width="650">

<font size="4">
    
    
<br>

- Заполнить при помощи массива Trie. При этом в листьях должны храниться дополнительные записи - _сколько_ раз при создании Trie этот лист был посещен (или хранить там ссылки на объект)
- Обойти Trie (traverse), посещая наименьшие элементы первыми и записывая их в массив
    - Добавлять значения в массив, пока лист не "опустеет", перейти к следующему листу

</font>


<img src="trie_sort_full.png" width="650">

<font size="4">
    
> При количестве разрядов (глубине префиксного дерева) $k$ для сортировки $n$ элементов потребуется сделать $O(k \cdot n)$ шагов при обходе

k - число разрядов, d - размер алфавита, $\sum_{i=1}^{k} d^i $

</font>

[в начало](#index)

# Алгоритм поиска заданного элемента
<a name="element"></a>

<font size="4">
    
**Описание алгоритма**   

Функция `Select(Array, i)`: Данный алгоритм использует метод "разделяй-и-властвуй".

1. _Разделение_: оригинальный массив делится на $\lceil n/5 \rceil$ частей
2. Для каждого подмассива находится медиана; они объединяются в _массив медиан_
3. В _массиве медиан_ рекурсивно при помощи `Select` ищется медиана медиан, далее $x$
4. Применяется Partition (как в Quicksort) для разделения массива на две части - меньше либо равных $x$, и больших элементов.
   - Получим $k$ "меньших" элементов, и $(n-k)$ "больших".  
5. Если $k = i$, то возвращаем $x$ как целевой элемент.
   - Иначе, ищем либо $i$-й среди меньшей части, либо, если $i > k$, $(i - k)$-й - среди большей

**Как это выглядит**

<img src="files/select.png">

_- в $k$ элементов входит и сам $x$_

$k = 3 \cdot \lceil(n/5)/2\rceil$

$n - k$

$T(n) = T(\lceil n / 5 \rceil) + T(3 \cdot \lceil(n/5)/2\rceil)\ or \ T(\lceil n / 5 \rceil) + T(n - 3 \cdot \lceil(n/5)/2\rceil)$


</font>

[в начало](#index)