> Математически доказано, что любой алгоритм сортировки, **основанный на сравнении элементов**, в лучшем случае будет выполнять не менее `O(n log n)` операций.

***
## Сортировка подсчётом

Сортировка подсчётом — не универсальный способ. Он применим для сортировки массивов, в котором точно известен диапазон значений, и этот диапазон не очень велик в сопоставлении с общей длиной массива.

При сортировке подсчётом:

* создаётся вспомогательный массив, количество элементов в котором равно максимально возможному значению в сортируемом массиве: если максимально возможное значение в массиве — 10, то последний элемент массива должен быть с индексом 10.

* в каждый элемент вспомогательного массива записывается значение 0;

* подсчитывается количество уникальных значений в исходном массиве; это количество для каждого значения записывается во вспомогательный массив;

* когда подсчёт выполнен — формируется новый массив.

У нас есть массив, который надо отсортировать. В нём 20 элементов. И мы точно знаем диапазон значений: значение любого элемента не меньше нуля и не больше десяти.

***
```py
# Исходный массив для сортировки
arr = [8, 1, 4, 10, 4, 1, 4, 7, 6, 8, 6, 4, 5, 10, 1, 0, 5, 4, 9, 7]
# Максимальное значение:
maximum = 10
```
***

Первое: создаём вспомогательный массив с числом элементов `maximum + 1`. В каждый элемент записываем 0.

***
```py
# Исходный массив для сортировки
arr = [8, 1, 4, 10, 4, 1, 4, 7, 6, 8, 6, 4, 5, 10, 1, 0, 5, 4, 9, 7]
# Максимальное значение:
maximum = 10
# Вспомогательный массив; индексы в нём - от 0 до 10, 
# как диапазон значений элементов.
count = [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
```
***

Второе: подсчитываем количество значений: смотрим, сколько раз каждое значение встречается в исходном массиве. Результаты подсчёта записываем во вспомогательный массив: количество нулей, которые есть в исходном массиве, пишем в элемент с индексом `[0]`, количество единиц — в элемент с индексом `[1]`, и так для всех.

***
```py
# Исходный массив для сортировки
arr = [8, 1, 4, 10, 4, 1, 4, 7, 6, 8, 6, 4, 5, 10, 1, 0, 5, 4, 9, 7]
# Максимальное значение:
maximum = 10
# Вспомогательный массив.
# Записываем результаты подсчёта: 
# в массиве arr нулей - 1, единиц - 3, двоек - 0, троек - 0, четвёрок - 5...
count = [1, 3, 0, 0, 5, 2, 2, 2, 2, 1, 2]
#        0  1  2  3  4  5  6  7  8  9  10  Индексы
```
***

Третий шаг — генерируем отсортированный массив `sorted_array`.

В массиве `sorted_array`

* индекс элемента из массива `count` будет значением;

* значение элемента из массива `count` будет количеством повторов каждого значения.

***
```py
# Исходный массив для сортировки
arr = [8, 1, 4, 10, 4, 1, 4, 7, 6, 8, 6, 4, 5, 10, 1, 0, 5, 4, 9, 7]
# Максимальное значение:
maximum = 10
# Вспомогательный массив.
# Записываем результаты подсчёта: 
# в массиве arr нулей - 1, единиц - 3, двоек - 0, троек - 0, четвёрок - 5...
count = [1, 3, 0, 0, 5, 2, 2, 2, 2, 1, 2]
#        0  1  2  3  4  5  6  7  8  9  10  Индексы

# Перебираем массив count: 
# count[0] = 1 - значение 0 записываем в sorted_array 1 раз;
# count[1] = 3 - значение 1 записываем в sorted_array 3 раза;
# count[2] = 0 - значение 2 записываем в sorted_array 0 раз;
# ...
sorted_array = [0, 1, 1, 1, 4, 4, 4, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 10, 10]
```
***

## Сортировка подсчётом в коде

В принципе, диапазон может начинаться и с другого значения, и в таком случае реализация будет чуть сложнее. Но если понять основу — будет несложно написать и модифицированную версию.

In [7]:
def counting_sort(array, maximum):
    # Создаём массив для подсчёта вхождений каждого значения.
    count = [0] * (maximum + 1)
    # Перебираем массив по элементам.
    for item in array:
        # Для каждого значения массива array увеличиваем счётчик 
        # в соответствующей ячейке массива count.
        # Например, увидели в array значение 2 - добавляем единицу к значению count[2].
        count[item] += 1

    # Объявляем результирующий список:
    sorted_array = []
    # Перебираем все уникальные элементы в списке count.
    for item in range(maximum + 1):
        # Добавляем в sorted_array уникальный элемент столько раз, 
        # сколько он встретился в исходном массиве.
        sorted_array += [item] * count[item]
    return sorted_array


arr = [8, 1, 4, 10, 4, 1, 4, 7, 6, 8, 6, 4, 5, 10, 1, 0, 5, 4, 9, 7]
result = counting_sort(arr, 10)
print(result)

[0, 1, 1, 1, 4, 4, 4, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8, 9, 10, 10]


***
## Временная сложность сортировки подсчётом

Количество элементов в массиве обозначаем через `n`, а количество уникальных элементов — `r`. Тогда сложность алгоритма будет `O(n + r)`. В оценке сложности этого алгоритма важно учитывать оба параметра. 

Например, если сортировать массив из 128 чисел (`n = 128`), а диапазон возможных значений в массиве будет от нуля до миллиона (`r = 1 000 000`), то в этой ситуации `r` многократно превышает `n`. В результате `O(n + r) = 1 000 128`, и сложность такой сортировки заметно превысит `O(n log n)`, ведь  `n log n = 128 * 7 = 896`.

***
## Голубиная сортировка

Голубиная сортировка работает не просто с массивом элементов, а с массивом структур данных (например, кортежей), которые надо отсортировать по ключу.

Своё название этот алгоритм получил от английского слова *pigeonholing*: *pigeon* — голубь, *hole* — нора, углубление, ячейка. Слово *pigeonholing* на русский можно примерно перевести как «навешивание ярлыков». Каждый голубь усаживается в свою ячейку, каждой вещи навешивается свой ярлык, как-то так.

Шаги сортировки будут состоять в следующем:

1. Представим, что у нас есть 3000 пустых списков, каждый список будет содержать шахматистов с определённым рейтингом. Реальный список будем создавать только когда попадётся шахматист с таким рейтингом.

2. Пройдёмся по общему списку шахматистов и каждого шахматиста добавим в тот список, который соответствует его рейтингу.

3. В конце пройдём по всем спискам в порядке убывания рейтингов (от 3000 к 1) и выпишем шахматистов из каждого очередного списка в результирующий массив.

Для каждого значения рейтинга мы собираем список шахматистов с этим рейтингом. При этом нет необходимости в попарном сравнении рейтингов.

Так мы получим упорядоченный список, причём сортировку можно сделать устойчивой. 

Для реализации сортировки импортируем тип данных `defaultdict` из модуля `collections` — это специальный словарь, элементам которого можно задать значение по умолчанию. При объявлении такого словаря можно указать тип данных, например — целое число:  `defaultdict(int)`. Если обратиться к этому словарю по новому для него ключу, элемент с указанным ключом будет создан, а его значением будет `0`.

В нашем решении значения словаря `defaultdict` должны хранить списки `list`: это будут списки кортежей — шахматистов с одинаковым рейтингом. Значения рейтинга будут ключами словаря.

```py
rating_players = defaultdict(list)
rating_players{
    2780: [('Дин Лижэнь', 2780), ('Хикару Накамура', 2780)],
    ...
}
```

При обращении к элементу словаря по ключу (значению рейтинга), которого еще нет в словаре, словарь вернёт пустой список — и в этот список можно будет добавить шахматистов с соответствующим рейтингом.

In [13]:
from collections import defaultdict


def counting_sort(array, rating_max):
    # Шаг 1. Создаем словарь со значением по умолчанию: пустой список.
    rating_players = defaultdict(list)

    # Шаг 2. Раскладываем игроков в словарь, где ключами служат рейтинги,
    # а в качестве значений - списки игроков с таким рейтингом.
    for player, rating in array:
        rating_players[rating].append((player, rating))

    # Собираем отсортированный массив, перебирая рейтинги в порядке убывания.
    sorted_array = []
    for rating in range(rating_max, 0, -1):
        # Если в словаре рассматриваемый рейтинг непустой, то все шахматисты
        # с этим рейтингом добавляются в итоговый результат.
        if rating_players[rating]:
            sorted_array.extend(rating_players[rating])

    return sorted_array


chess_players = [
    ('Гукеш Доммараджу', 2758),
    ('Фабиано Каруана', 2786),
    ('Уэсли Со', 2753),
    ('Магнус Карлсен', 2839),
    ('Дин Лижэнь', 2780),
    ('Ян Непомнящий', 2771),
    ('Аниш Гири', 2760),
    ('Вишванатан Ананд', 2754),
    ('Алиреза Фирузджа', 2777),
    ('Хикару Накамура', 2780),
]
result = counting_sort(chess_players, 3000)
print(result)

[('Магнус Карлсен', 2839), ('Фабиано Каруана', 2786), ('Дин Лижэнь', 2780), ('Хикару Накамура', 2780), ('Алиреза Фирузджа', 2777), ('Ян Непомнящий', 2771), ('Аниш Гири', 2760), ('Гукеш Доммараджу', 2758), ('Вишванатан Ананд', 2754), ('Уэсли Со', 2753)]


![alt text](S10_75_1696834015.png)

***
## Бонус: сортировка Timsort

В Python реализована ещё одна «неклассическая» сортировка — **Timsort**. Имя ей дали в честь автора — Тима Питерса (кстати, он же — автор Дзен Пайтон). 

**Timsort** — комбинация сортировок слиянием и вставками. В результате сортировка получается стабильной, а работает в среднем быстрее, чем классическая сортировка слиянием, хотя сложность Timsort всё равно составляет `O(n log n)` как в среднем, так и в худшем случае. 

Так же, как и сортировка слиянием, Timsort требует `O(n)` дополнительной памяти.

> Главное о сортировках — в [шпаргалке](https://code.s3.yandex.net/Python-dev/cheatsheets/053-algoritmy-sortirovki-shpora/053-algoritmy-sortirovki-shpora.html).

In [16]:
a = {}
print(type(a))

<class 'dict'>
