## <font color=red>Литература</font>

1. Лекции «Алгоритмы: построение, анализ и реализация на языке программирования Си» - Ворожцов А.В., Винокуров Н.А.. Выложена в канале **#edu_materials**


 # <font color=blue>Алгоритмы сортировки, не использующие сравнение</font>
 
 До сих пор мы рассматривали алгоритмы сортировки, основанные на операции сравнения элементов массива друг с другом. Лучшая возможная эффективность таких алгоритмов - $O(n \cdot \log n)$. Этот результат можно получить следующим образом.
 
1. Если длина массива $A$ равна $n$, то всего существует $n!$ перестановок элементов $A$.

- В процессе сортировки мы определяем, в каком из $n!$ возможных состояний был массив $A$ до сортировки.

- Если выполнить $k$ сравнений элементов массива, то можно получить $2^k$ различных результатов.

- Чтобы с помощью последовательности сравнений элементов $A$ понять, в каком массив находился состоянии, количество возможных результатов должно быть не меньше числа состояний.

- Получаем $2^k \ge n!$. Если применить формулу Стирлинга $n! \ge \sqrt{2 \pi n} \left(\frac{n}{e}\right)^n e^{\frac{1}{12 n + 1}}$ (с [уточнением Робинса](https://www.jstor.org/stable/2308012?origin=crossref&seq=1#page_scan_tab_contents)), получаем $k \ge \log_2 \sqrt{2 \pi} + \frac{1}{2} \log_2 n + n \cdot \left( \log_2 n - \frac{1}{\ln 2} \right) + \frac{1}{(12 n + 1) \ln 2} \ge n \cdot \left( \log_2 n - \frac{1}{\ln 2} \right)$ 


**Однако, если есть дополнительная информация о ключах элементов сортируемого массива $A$, эффективность алгоритма сортировки можно улучшить.**

## <font color=green>Сортировка подсчетом (counting sort)</font>

Если известно, что число различных элементов в массиве мало, то лучшим решением становится сортировка подсчетом. 

1. Определить число элементов каждого вида в сортируемом массиве.

- Определить порядок видов элементов.

- Записать элементы массива в правильном порядке.

Если $n$ - размер массива, а $k$ - число видов элементов, то сортировка может быть выполнена в $(k+1)$ проходов по массиву. 1 проход требуется для подсчета и еще по одному на запись в правильном порядке элементов каждого вида. Если ключ сортировки совпадает со значением элемента, то сортировка выполняется в 1 проход.

### Упражнение 1. Сортировка подсчетом списка целых чисел

Отсортируйте по возрастанию список целых чисел.

In [None]:
import random
L = [random.randint(1, 5) for _ in range(100)]

###  Упражнение 2. Сортировка подсчетом списка слов

Список `L` содежит строки, состоящие из строчных букв. Отсортируйте строки по их первой букве. Равные элементы не должны переставляться между собой. Объем используемой памяти не должно зависеть от размера списка.

In [None]:
import random
import string
L = [''.join(random.sample(string.ascii_lowercase, random.randint(4, 10))) for _ in range(1000)]

## <font color=green>Блочная соритровка (bucket sort)</font>

Блочная сортировка может быть успешно применена, если известно, как распределены ключи. Если ключи равномерно распределены на интервале $\left[0, 1\right)$, то интервал можно разбить на $k$ равных промежутков (блоков или корзин), чтобы распределить по ним элементы сортируемого массива. Далее элементы в каждой из корзин сортируются с помощью другого алгоритма, чаще всего с помощью сортировки вставками. В конце корзины объединяются.

Блочную сортировку можно рассматривать, как обобщение сортировки подсчетом.

### Упражнение 3. Блочная сортировка

Отсортируйте с помощью блочной сортировки список `L`. Определите оптимальное значение числа блоков для сортировки списка из $10^4$ элементов.

In [None]:
import timeit
import random
L = [random.uniform(0, 1) for _ in range(10**4)]

## <font color=green>Поразрядная сортировка (radix sort)</font>

Поразрядная сортировка - это развитие идей сортировки подсчетом и быстрой сортировки. Пусть ключи, по которым осуществляется сортировка - целые числа. Тогда можно разделить массив на корзины по значениям старших разрядов ключей. Затем каждую из получившихся корзин разделить уже по значениям второго по старшинству разряда и так далее. Подход очень похож на быструю сортировку, однако на практике почти всегда под корзины выделяется дополнительная память, что обеспечивает сортировке стабильность.

Поразрядная сортировка есть в двух вариантах: по более значимым цифрам (most significant digit или MSD) и по менее значимым цифрам (least significant digit или LSD)

Этот способ теоретически может оказаться быстрее алгоритма быстрой сортировки, однако в практике такие случаи встречаются нечасто. Чтобы поразрядная сортировка была эффективной требуется, чтобы ключи были равномерно распределены по цифрам в каждом из своих разрядов. Например, требуется отсортировать массив целых чисел 110, 110, 111, 112, 115, 111, 119, 118, 119, 117, 120, 116, 116, 112, 113, 114, 113, 117. В данном случае ключи распределены по цифрам в нулевом разряде следующим образом:
```
'0': 3
'1': 2
'2': 2
'3': 2
'4': 1
'5': 1
'6': 2
'7': 2
'8': 1
'9': 2
```
Во первом разряде используются только два значения: `'1'` и `'2'`, причем последнее встречается лишь один раз, а во втором разряде только значение `'1'`. Получается, что при использовании поразрядной сортировки на двух операциях алгоритм будет "простаивать".

# <font color=blue>Свойства и классификация алгоритмов сортировки</font>

## <font color=green>Устойчивость</font>

Алгоритмы сортировки дялятся на устойчивые и неустойчивые. Устойчивые алгоритмы сохраняют порядок элементов с одинаковыми ключами.

### Пример 2. Устойчивость

Пусть требуется упорядочить слова в списке `["Bob", "Ann", "Angie"]` по первой букве. Ключи слов `"Ann"` и `"Angie"` совпадают и равны `"A"`. Если сортировка устойчива, то гарантируется, что в упорядоченном списке `"Ann"` будет стоять перед `"Angie"`.

### Упражнение 3. Устойчивость сортировки выбором

Почему сортировка выбором в варианте, когда выполняется перестановка элементов, не является устойчивой? Приведите пример. Реализуйте устойчивый вариант сортировки выбором. Для этого нужно вставлять минимальный элемент перед неупорядоченной частью массива.

In [24]:
k = 20

L = [random.uniform(0, 1) for _ in range(10**3)]
buckets = [[] for _ in range(k)]
step = 1 / k
for e in L:
    i = 0
    while e >= i * step:
        i += 1
    buckets[i-1].append(e)
for b in buckets:
    print(len(b))

63
58
41
52
43
50
50
45
58
48
56
53
57
45
53
49
45
41
43
50


### Упражнение 4. Устойчивость сортировки слиянием

Какая неточность в реализации сортировки слиянием приведет к тому, что она станет неустойчивой?

### Упражнение 5. Устойчивость быстрой сортировки

Почему быстрая сортировка неустойчива? Приведите пример. Реализуйте устойчивый вариант быстрой сортировки. Для этого нужно закрепить за каждым элементом массива его индекс в исходном массиве и в случае, когда ключи равны, большим будет считаться элемент с большим индексом.

**Вариант быстрой сортировки, в котором ключ расширяется засчет индекса элемента в исходном массиве требует дополнительно $O(n)$ памяти.**

## <font color=green>Естественность поведения</font>

Алгоритм принято называть естественным, если он эффективно работает на упорядоченных и частично упорядоченных массивах. Алгоритмы сортировки пузырьком и вставками эффективны на частично упорядоченных массивах, в то время как поведение быстрой сортировки и сортировки слиянием не естественно.

## <font color=green>Внутренняя и внешняя сортировка</font>

Сортировка называется **внутренней**, если массив целиком помещается в оперативной памяти и возможен доступ к произвольному элементу массива. Сортировка называется **внешней**, если данные находятся на носителе большого объема с последовательным доступом к памяти. На этом занятии рассматриваются только алгоритмы внутренней сортировки.

### Упражнение 6. Рекламная акция

В сети магазинов "Н-Аудио" проводится рекламная акция. Каждый второй товар – бесплатно. Естественно, кассирам дано указание пробивать товары в таком порядке, чтобы магазин потерял как можно меньше денег.

По списку товаров определите максимальную сумму в чеке.

**Вход**: натуральное число товаров (N < 1000) и далее N натуральных чисел – цены товаров.

**Выход**: одно число – максимальная сумма чека.

<table class=MsoTableGrid border=1 cellspacing=0 cellpadding=0
 style='border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt;
 mso-yfti-tbllook:480;mso-padding-alt:0cm 5.4pt 0cm 5.4pt'>
 <tr style='mso-yfti-irow:0;mso-yfti-firstrow:yes'>
  <td width=121 valign=top style='width:90.45pt;border:solid windowtext 1.0pt;
  mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Вход</p>
  </td>
  <td width=132 valign=top style='width:99.25pt;border:solid windowtext 1.0pt;
  border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
  solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Выход</p>
  </td>
  <td width=385 valign=top style='width:288.85pt;border:solid windowtext 1.0pt;
  border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
  solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Комментарий</p>
  </td>
 </tr>
 <tr style='mso-yfti-irow:1;mso-yfti-lastrow:yes'>
  <td width=121 valign=top style='width:90.45pt;border:solid windowtext 1.0pt;
  border-top:none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;
  padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>5 2 1 10 50 10</p>
  </td>
  <td width=132 valign=top style='width:99.25pt;border-top:none;border-left:
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>70</p>
  </td>
  <td width=385 valign=top style='width:288.85pt;border-top:none;border-left:
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Возможен такой порядок: 10 2 50 1 10</p>
  </td>
 </tr>
</table>


### Упражнение 7. Ровно K обменов

Даны два числа N и К. Вывести перестановку из N чисел (N чисел от 1 до N без повторений) такую чтобы сортировка пузырьком по возрастанию на соответствующем массиве сделала ровно K обменов. Если возможных ответов несколько – выведите любой.

**Вход**: натуральное число N (N < 100) и целое  неотрицательное К. Гарантируется, что для всех наборов тестовых данных решение существует.

**Выход**: ответ на задачу.

<table class=MsoTableGrid border=1 cellspacing=0 cellpadding=0
 style='border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt;
 mso-yfti-tbllook:480;mso-padding-alt:0cm 5.4pt 0cm 5.4pt'>
 <tr style='mso-yfti-irow:0;mso-yfti-firstrow:yes'>
  <td width=177 valign=top style='width:133.0pt;border:solid windowtext 1.0pt;
  mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Вход</p>
  </td>
  <td width=118 valign=top style='width:88.4pt;border:solid windowtext 1.0pt;
  border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
  solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Выход</p>
  </td>
  <td width=343 valign=top style='width:257.15pt;border:solid windowtext 1.0pt;
  border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:
  solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>Комментарий</p>
  </td>
 </tr>
 <tr style='mso-yfti-irow:1;mso-yfti-lastrow:yes'>
  <td width=177 valign=top style='width:133.0pt;border:solid windowtext 1.0pt;
  border-top:none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;
  padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>5 3</p>
  </td>
  <td width=118 valign=top style='width:88.4pt;border-top:none;border-left:
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>3 1 2 5 4</p>
  </td>
  <td width=343 valign=top style='width:257.15pt;border-top:none;border-left:
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;
  mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt'>
  <p class=MsoNormal>В процессе сортировки массива 3 1 2 5 4 будут совершены
  обмены: 1<span style='font-family:Symbol;mso-ascii-font-family:"Times New Roman";
  mso-hansi-font-family:"Times New Roman";mso-char-type:symbol;mso-symbol-font-family:
  Symbol'><span style='mso-char-type:symbol;mso-symbol-font-family:Symbol'>«</span></span>3
  3<span style='font-family:Symbol;mso-ascii-font-family:"Times New Roman";
  mso-hansi-font-family:"Times New Roman";mso-char-type:symbol;mso-symbol-font-family:
  Symbol'><span style='mso-char-type:symbol;mso-symbol-font-family:Symbol'>«</span></span>2
  и 5<span style='font-family:Symbol;mso-ascii-font-family:"Times New Roman";
  mso-hansi-font-family:"Times New Roman";mso-char-type:symbol;mso-symbol-font-family:
  Symbol'><span style='mso-char-type:symbol;mso-symbol-font-family:Symbol'>«</span></span>4.
  Возможны и другие варианты ответа.</p>
  </td>
 </tr>
</table>


### Упражнение 8. Лента Мебиуса

Предположим, что имеется некоторый кусок ленты, разделенный на кадры. Кадры занумерованы с двух сторон. Полоска ленты склеена в лист Мебиуса. Необходимо составить алгоритм упорядочения этой последовательности, предположив, что соседние кадры можно переставлять, (естественно, в упорядоченной последовательности будет один "скачок" от минимального элемента к максимальному). Следует учесть, что при перестановке кадров переставляются числа с обеих сторон кадров. 

Числа на противоположных сторонах кадра могут не совпадать. Всегда ли возможно такое упорядочение?