# Сортировки

## Введение

**Определение:** Задача сортировки (Sorting problem)
Вход: Последовательность из n чисел $\left\langle a_1, ..., a_n \right\rangle$
Выход: Перестановка входной последовательности $\left\langle a'_1, ..., a'_n \right\rangle$, такая что $a_1 \le ... \le a_n$

**Определение:** Сортировка сравнением (Comparison sort) - алгоритм сортировки использующий для упорядочивания только сравнение входных элементов между собой

**Определение:** Устойчивая сортировка (Stable sort) - сортировка сохраняющая порядок эквивалентных по ключу сортировки элементов в отсортированном массиве

**Определение:** Сортировка на месте (Inplace sort) - сортировка требующая не более чем $O(\log(n))$ дополнительной памяти

**Определение:** Инверсия массива $A_n$ - это пара чисел $i < j$ : $A_i > A_j$

Примеры:

1. В массиве \[5, 4, 1, 2, 3\] 7 инверсий: 4 с пятеркой и 3 с четверкой
2. В отсортированном массиве, очевидно, нет инверсий

Пусть, без ограничения общности, все элементы последовательности различны и для сравнения используется только оператор $\le$

**Теорема о нижней границе сортировки сравнением (about lower bound for comparison based sorting)**
Любой алгоритм сортировки сравнением в наихудшем случае требует $\Omega(n\log(n))$ операций сравнения
$\square$
Представим сортировку массива из $n$ элементов как бинарное дерево, листами которого будут перестановки элементов массива, остальные же узлы будут задавать сравнения двух элементов. Пусть его высота равна $h$, а кол-во листьев $l$.

Пример такого дерева для сортировки вставками 3-x элементного массива:
<br/>
<img src="../static/IMG_C6BD55B53A7C-1.jpeg" width="700"/>

В общем случае нам не важно, как выглядит дерево. Но, очевидно, количество его листьев должно быть не меньше, чем число всевозможных перестановок из $n$ элементов (обратное бы значило, что наш алгоритм не умеет сортировать некоторые массивы). Таким образом:
$n! \le l$
С другой стороны, из свойств бинарного дерева вытекает, что
$n! \le l \le 2^h$
Прологарифмируем обе части:
$h \ge log_2(n!)$
Можно доказать, что $log_2(n!) = \Omega(n\log(n))$, таким образом
$h = \Omega(n\log(n))$
По сути h, высота дерева, это длина наибольшего пути из листа, являющегося перестановкой массива, в корневую вершину, т.е. - это и есть количество сравнений в наихудшем случае
$\blacksquare$

**Следствие**
Ни одна сортировка сравнением не может иметь время работы лучше, чем $O(n\log(n))$

### Сортировка вставками (Insertions sort)

**Идея:** Идем по массиву, встречаем инверсию, записываем наименьший элемент в переменную, в результате чего в массиве появляется свободная ячейка — это позволяет сдвинуть элементы и освободить место для вставки.

In [121]:
def insertions_sort(A: list, l: int, r: int) -> list:
    for i in range(l + 1, r):
        j = i - 1
        pivot = A[i]
        while A[j] > pivot and j >= 0:
            A[j + 1] = A[j]
            j -= 1
        A[j + 1] = pivot
    return A

A1 = [5, 3, 1, 2, 4]
insertions_sort(A1, 0, len(A1))
A1

[1, 2, 3, 4, 5]

**Теорема**
insertions_sort сортирует массив на промежутке $[l, r)$
$\square$
Инвариант: префикс массива $A_{l,i + 1}$ отсортирован
Инициализация: префикс $A_{l,l}$ отсортирован
Сохранение: В предположении индукции $A_{l,i + 1}$ отсортирован, при переходе к $i + 2$ есть два случая:

1. $A_{i + 1} < A_{i + 2}$, тогда префикс до $i + 2$ уже отсортирован
2. $A_{i + 1} > A_{i + 2}$, тогда внутренний цикл вставит $A_{i + 2}$ на свою позицию и префикс до $i + 2$ тоже будет отсортирован

Завершение: По завершении функции i = r - 1, т.е. префикс $A_{l,r}$, совпадающий со всем массивом на промежутке $[l, r)$ будет отсортирован
$\blacksquare$
<br/>
**Теорема**
Асимптотика insertions_sort - $\Theta(n + inv)$, где $inv$ - количество инверсий
$\square$
Методом прямого подсчета:
$T(n) = \Theta\bigg(\sum_{i = 0}^{n - 1}(1 + inv(A_i))\bigg) = \Theta\bigg(n + \sum_{i = 0}^{n - 1} inv(A_i)\bigg) = \Theta(n + inv)$
$\blacksquare$
**Следствие**
Асимптотика insertions_sort в худшем случае - $O(n^2)$

**Следствие**
Асимптотика insertions_sort в лучшем случае - $\Omega(n)$ (случай отсортированного массива)

**Следствие**
Асимптотика insertions_sort в среднем случае $\Theta_{avg}(n^2)$
<br/>
**Замечание**: insertions_sort занимает $O(1)$ дополнительной памяти, а значит является inplace сортировкой

**Замечание**: insertions_sort является устойчивой сортировкой. Действительно, она проходится по массиву слева направо и вставляет элемент на самую правую подходящую позицию.

**Замечание**: insertions_sort быстро работает на частично отсортированных массивах. Она часто используется как финальный этап более быстрых сортировок

Чуть подсокращенная версия (но она помедленнее)

In [1]:
def insertions_sort_shortened(A: list, l: int, r: int) -> list:
    for i in range(l + 1, r):
        j = i - 1
        while A[j] > A[j + 1] and j >= 0:
            A[j + 1], A[j] = A[j], A[j + 1]
            j -= 1
    return A

A1 = [5, 3, 1, 2, 4]
insertions_sort_shortened(A1, 0, len(A1))
A1

[1, 2, 3, 4, 5]

## Сортировка слиянием (Merge sort)

**Идея:** Сортировка слиянием - алгоритм сортировки сравнением типа разделяй и властвуй:
Разделение: Разделяем входную последовательность на две примерно равные части
Властвование: Сортируем их отдельно (как правило, с помощью самой же сортировки слиянием)
Комбинирование: Сливаем две отсортированные последовательности в один массив

Разберемся сначала с функцией слияния двух отсортированных массивов. Реализуем ее с помощью метода двух указателей:

In [133]:
def merge(L: list, R: list) -> list:
    i = 0
    j = 0
    M = []
    while i < len(L) and j < len(R):
        if L[i] <= R[j]:
            M.append(L[i])
            i += 1
        else:
            M.append(R[j])
            j += 1

    while i < len(L):
        M.append(L[i])
        i += 1

    while j < len(R):
        M.append(R[j])
        j += 1

    return M

A1 = [1, 2, 5, 7]
B1 = [2, 2, 4, 9]
merge(A1, B1)

[1, 2, 2, 2, 4, 5, 7, 9]

**Теорема**
Функция merge сливает два отсортированных массива в один отсортированный
$\square$
Инвариант цикла: $M$ отсортирован
Инициализация: $M$ - пустой массив, а значит отсортирован
Сохранение: В предположении индукции, при $n = i + j$ $R$ отсортирован, при переходе к $n + 1$ есть два случая:
1. $L_i <= R_j$, тогда $L_i >= M_n$ и $M_{n + 1}$ будет отсортирован
2. $L_i > R_j$, тогда $R_i >= M_n$ и $M_{n + 1}$ будет отсортирован

Завершение: В конце из L и R остается один не закончившийся массив, все его элементы добавляются в M_n
$\blacksquare$

Асимптотика, методом прямого подсчета, - $\Theta(max(n, m))$, где $n$ - длина $A$, $m$ - длина $B$.
Асимптотика по памяти - $\Theta(n + m)$

Перейдем к самой сортировке слиянием:

In [134]:
def merge_sort(A: list) -> list:
    if len(A) == 1:
        return A

    mid = len(A) // 2
    L = merge_sort(A[:mid])
    R = merge_sort(A[mid:])
    return merge(L, R)

A1 = [10, 9, 5, 11, 2, 3, 8, 1]
merge_sort(A1)

[1, 2, 3, 5, 8, 9, 10, 11]

Корректность работы merge_sort вытекает из корректности работы merge.

**Теорема**
Асимптотика merge_sort - $\Theta(n\log(n))$
$\square$
$T(n) = 2 \cdot T\bigg(\frac{n}{2}\bigg) + \Theta(n) = 4 \cdot T\bigg(\frac{n}{4}\bigg) + 2\Theta(n) = ... $
$ ... = \Theta(n\log(n))$
$\blacksquare$

**Следствие**
Т.е. сортировка слиянием достигает теоретического асимптотического минимума сортировки сравнением

**Замечание:** Сортировка слиянием занимает $O(n)$ памяти, то есть является не inplace

**Замечание:** Сортировка слиянием является устойчивой

**Замечание:** Нужно, к слову, заметить, что merge sort работает совершенно одинаково и на полностью случайных массивах, и на частично упорядоченных, в отличии, например, от сортировки вставками

С помощью сортировки слиянием можно легко посчитать количество инверсий в массиве.

**Идея:** При каждом слиянии подмассивов в алгоритме Merge sort мы разрешаем некоторое количество инверсий, которое мы можем подсчитать в функции merge.

In [2]:
def merge_inversions(L: list, R: list) -> (list, int):
    i = 0
    j = 0
    M = []
    I = 0
    while i < len(L) and j < len(R):
        if L[i] <= R[j]:
            M.append(L[i])
            i += 1
        else:
            I += len(L) - i
            M.append(R[j])
            j += 1

    while i < len(L):
        M.append(L[i])
        i += 1

    while j < len(R):
        M.append(R[j])
        j += 1

    return M, I

def merge_sort_inversions(A: list) -> (list, int):
    if len(A) == 1:
        return A, 0

    mid = len(A) // 2
    L, I_l = merge_sort_inversions(A[:mid])
    R, I_r = merge_sort_inversions(A[mid:])
    M, I = merge_inversions(L, R)
    return M, I_l + I_r + I

A1 = [4, 3, 2, 1]
merge_sort_inversions(A1)

([1, 2, 3, 4], 6)

**Теорема**
merge_sort_inversions возвращает количество инверсий
$\square$
Докажем сначала, что merge_inversions возвращает кол-во инверсий в массиве вида L + R:
Действительно, I увеличивается на количество оставшихся элементов в L, каждый раз когда в M добавляется элемент из
R. Так как L и R по отдельности отсортированы, в I и будет количество инверсий L + R.

При комбинации в merge_sort_inversions суммируется количество инверсий левого подмассива, правого подмассива и количество инверсий при их слиянии, что и дает нам итоговое количество инверсий в массиве.
$\blacksquare$

Очевидно, этот алгоритм имеет такие же асимптотические оценки, что и сама сортировка слиянием

## Быстрая сортировка

**Определение:** Быстрая сортировка - алгоритм сортировки сравнением типа разделяй и властвуй:
Разделение: Выбирается опорный элемент. Массив разбивается на два подмассива, элементы первого меньше опорного, элементы второго больше.
Властвование: Подмассивы рекурсивно сортируются с помощью быстрой сортировки
Комбинирование: Не требуется, тк быстрая сортировка выполняется inplace

In [3]:
import random

def partition(A: list, l: int, r: int) -> int:
    pivot = random.randint(l, r - 1)
    A[pivot], A[r - 1] = A[r - 1], A[pivot]
    i = l - 1
    for j in range(l, r):
        if A[r - 1] >= A[j]:
            i += 1
            A[i], A[j] = A[j], A[i]
    return i

partition([2, 3, 3, 3, 1, -2, 4], 0, 6)

5

Асимптотика методом прямого подсчета $O(n)$

Докажем, что partition работает корретно, т.е. перестанавливает элементы массива относительно опорного элемента так, что первые i + 1 членов <= опорного элемента, в оставшиеся > опорного элемента.
$\square$
Инвариант: все элементы <= i меньше или равны опорного элемента
База: при j = 0, i = -1, т.о. инвариант сохраняется
Индукция: при j, i
$\forall n \le i \Rightarrow a_n \le pivot$

При j + 1:
Вариант 1: $pivot < a_{j + 1}$ => инвариант сохраняется без изменения i или массива
Вариант 2: $pivot \ge a_{j + 1}$ => увеличим i на 1 и переставим $a_{j + 1}$ на позицию $a_{i + 1}$ => инвариант сохраняется
$\blacksquare$

In [103]:
def qsort(xs: list, l: int, r: int) -> list:
    global c
    if r - l <= 1:
        return xs
    mid = partition(xs, l, r)
    qsort(xs, l, mid)
    qsort(xs, mid, r)
    return xs

9

Дополнительное

In [None]:
def merge(xs: list, ys: list) -> list:
    for i in range(len(xs)):
        if xs[i] > ys[0]:
            xs[i], ys[0] = ys[0], xs[i]
            first = ys[0]
            k = 1
            while k < len(ys) and ys[k] < first:
                ys[k - 1] = ys[k]
                k += 1
            ys[k - 1] = first

n = int(input())
xs = list(map(int, input().strip().split()))[:n]
m = int(input())
ys = list(map(int, input().strip().split()))[:m]

merge(xs, ys)
print(*(xs + ys))

import random

# [l, r)
# <pivot =pivot >pivot
def partition(xs: list, l: int, r: int) -> list:
    # pivot = xs[random.randint(l, r - 1)]
    pivot = 3
    x = l
    y = l
    for i in range(l, r):
        if xs[i] == pivot:
            xs[i], xs[y] = xs[y], xs[i]
            y += 1
        elif xs[i] < pivot:
            xs[i], xs[x] = xs[x], xs[i]
            if x != y: xs[y], xs[i] = xs[i], xs[y]
            x += 1
            y += 1
    return xs

partition([5, 2, 3, 1, -2, 4], 0, 6)