# 17.8 Алгоритмы сортировки
Рассмотрим некоторые алгоритмы сортировки:

- Наивная сортировка (чтобы показать, как делать не стоит).
- Сортировка выбором (чуть менее наивный, но далёк от идеала).
- Сортировка пузырьком (пожалуй, самый понятный в реализации, но не самый эффективный).
- Сортировка вставками (неплохо).
- Сортировка слиянием (заметно лучше).
- Быстрая сортировка (почти идеально!).

## Наивная сортировка
Как делать не нужно ни в коем случае!!

In [4]:
import random  # модуль, с помощью которого перемешиваем массив

# пусть имеем массив всего лишь из 9 элементов
array = [2, 3, 1, 4, 6, 5, 9, 8, 7]

is_sort = False  # станет True, если отсортирован
count = 0  # счетчик количества перестановок

while not is_sort:  # пока не отсортирован
    count += 1  # прибавляем 1 к счётчику

    random.shuffle(array)  # перемешиваем массив

    # проверяем, отсортирован ли
    is_sort = True
    for i in range(len(array) - 1):
        if array[i] > array[i + 1]:
            is_sort = False
            break

print(array)
# [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(count)
# 290698

[1, 2, 3, 4, 5, 6, 7, 8, 9]
30725


In [6]:
def factorial(n):
    if n < 2:
        return 1
    else:
        return n * factorial(n - 1)


print(len(str(factorial(100))))

158


## Сортировка выбором
На каждом шаге мы имеем отсортированную (слева) и неотсортированную часть (справа). Ищется минимальный элемент в неотсортированной части и меняется местами с элементом в начале неотсортированной части. И так продолжается, пока не закончится внешний цикл.

Имеет среднюю сложность O(n^2)

In [11]:
# сортировка по возрастанию
array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)
count = 0
for i in range(len(array)):
    idx_min = i
    for j in range(i, len(array)):
        count += 1
        if array[j] < array[idx_min]:
            idx_min = j
    if i != idx_min:
        array[i], array[idx_min] = array[idx_min], array[i]

print(array)
print(count)

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
45


In [12]:
# сортировка по убыванию
array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)
for i in range(len(array)):
    idx_max = i
    for j in range(i, len(array)):
        if array[j] > array[idx_max]:
            idx_max = j
    if i != idx_max:
        array[i], array[idx_max] = array[idx_max], array[i]

print(array)

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[9, 8, 7, 6, 5, 4, 3, 2, 1]


## Сортировка пузырьком
Максимальные элементы шаг за шагом «всплывают» вправо — в отсортированную часть массива. И по ходу совершаются ещё перестановки, если это необходимо, ведь каждый раз мы сравниваем только соседние элементы!

Имеет среднюю сложность O(n^2)

Пузырёк удобен, когда в структуре имеет не очень большой размер и очень важна скорость написания кода. В таком случае пузырёк идеален — два цикла, одно условие и один swap (перестановка двух элементов). Однако на более крупных массивах пузырёк сильно проигрывает другим алгоритмам.

In [14]:
array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)
for i in range(len(array)):
    for j in range(len(array) - i - 1):
        if array[j] > array[j + 1]:
            array[j], array[j + 1] = array[j + 1], array[j]

print(array)

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


## Сортировка вставками
В начале итерации устанавливается ведущий элемент. На первой итерации — самый первый элемент, и по умолчанию он считается уже отсортированным.
Сохраняем ведущий элемент в дополнительную переменную (красный квадрат в анимации).
Далее происходит поиск места, куда должен встать ведущий элемент в уже отсортированной (левой) части массива. Можно, например, использовать цикл while с условием достижения границы и/или успешным нахождением элемента. Пока условие цикла выполняется, происходит сдвиг каждого элемента вправо.
По завершении цикла сохранённое значение переменной помещается на освободившееся место. Алгоритм завершается.

In [18]:
array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)
count = 0

for i in range(1, len(array)):
    x = array[i]
    idx = i
    while idx > 0 and array[idx - 1] > x:
        array[idx] = array[idx - 1]
        idx -= 1
        count += 1
    array[idx] = x

print(array)
print(count)

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
6


## Сортировка слиянием
Имеет общую сложность O(n*log(n))
Сначала делим массив пополам (или почти пополам, если в массиве нечетное количество элементов). И снова пополам. И снова... рекурсивно. А выход из рекурсии случится тогда, когда отделенный кусок массива станет размером 1, т. е. сократится до одного элемента. А один элемент уж точно можно считать отсортированным относительно себя. Полпути сортировки можно считать пройденной.
Дальше — интереснее.

Нам нужно склеивать обратно расщеплённые части массива, потому она и называется сортировкой слиянием. Итак, имеем два одиночных элемента — сравниваем их и возвращаем на предыдущий уровень рекурсии в нужном порядке.

Когда есть больше элементов в каждой из частей, подлежащих слиянию, нужно быть предельно аккуратным:

Сравниваем первые элементы.
В результирующий массив записываем наименьший.
Сравниваем первый элемент в нетронутом и второй элемент — из другой части.
Сравниваем — склеиваем в результат.
И так продолжается, пока не будет достигнут конец одной из частей.
Последний штрих — в результирующий массив записать все элементы из ещё пока не пустой части.
Вернуть результат на предыдущий уровень рекурсии.

In [19]:
array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)

def merge_sort(L):
    if len(L) <= 1:
        return L[:]
    else:
        middle = len(L) // 2
        left = merge_sort(L[:middle])
        right = merge_sort(L[middle:])
        return merge(left, right)

def merge(left, right):
    result = []
    i, j = 0,0

    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1

    while i < len(left):
        result.append(left[i])
        i += 1

    while j < len(right):
        result.append(right[j])
        j += 1

    return result

print(merge_sort(array))

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


## Быстрая сортировка
Алгоритм выполняется рекурсивно следующим образом:

Выбирается ведущий элемент (есть несколько вариантов, о которых поговорим чуть позже).
Две части массива сортируются только на основе этого ведущего элемента.
Происходит последовательный обмен значениями элементов. Вопрос в том, какие элементы обменивать. Сначала происходит поиск слева направо до первого элемента, который превосходит по своему значению ведущий элемент. Затем массив просматривается справа налево в поисках элемента, который меньше ведущего. Когда такие элементы найдены, происходит их обмен.
Таким образом, в левой части массива имеются элементы только меньше ведущего, а в правой — только больше.
Функция рекурсивно применяется к получившимся частям массива, если их размеры превосходят один элемент.

In [21]:
def qsort(array, left, right):
    middle = (left + right) // 2

    p = array[middle]
    i,j = left, right
    while i <= j:
        while array[i] < p:
            i += 1
        while array[j] > p:
            j -= 1
        if i <= j:
            array[i], array[j] = array[j], array[i]
            i += 1
            j -= 1

    if j > left:
        qsort(array, left, j)
    if right > i:
        qsort(array, i, right)

array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)
qsort(array, 0, len(array) - 1)
print(array)

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [22]:
import random

def qsort_random(array, left, right):
    p = random.choice(array[left:right + 1])
    i,j = left, right
    while i <= j:
        while array[i] < p:
            i += 1
        while array[j] > p:
            j -= 1
        if i <= j:
            count += 1
            array[i], array[j] = array[j], array[i]
            i += 1
            j -= 1

    if j > left:
        qsort_random(array, left, j)
    if right > i:
        qsort_random(array, i, right)

array = [2, 3, 1, 4, 6, 5, 9, 8, 7]
print(array)
qsort(array, 0, len(array) - 1)
print(array)

[2, 3, 1, 4, 6, 5, 9, 8, 7]
[1, 2, 3, 4, 5, 6, 7, 8, 9]


## Итоги
Подведём итоги рассмотрения алгоритмов сортировок.

Естественно, это далеко не все существующие алгоритмы сортировки. Нами остались не затронуты:

- Сортировка кучей. Эта сортировка основана на построении двоичного дерева, обладающего некоторыми свойствами.
- Сортировка Шелла.
- Плавная сортировка. Интересная сортировка, основанная на числах Леонардо, которые похожи на числа Фибоначчи.
- Timsort. Обратите на неё особое внимание, потому что именно эта сортировка используется во встроенных сортировках языка Python. Она заслуживает рассмотрения, поскольку учитывает ещё и эмпирические факты.