# Сортировки

Существует много различных, сортировок, например 
1. пузырьком 
2. вставками 
3. слиянием 
4. подсчётом 

Обычно, время работы сортировок составляет $O(n\cdot\log n)$, например, сортировка слиянием. Однако, некоторые работают дольше. К примеру, пузырьком и вставками — $O(n^2)$, а подсчётом - $O(n+m)$, где $n$ — количество чисел, а $m$ — максимальное число

## Сортировка пузырьком

Сортировка пузырьком проходит по массиву много раз и на каждом проходе «выталкивает» самый большой из оставшихся элементов в конец.

1. Последовательно просматриваем массив от начала до конца
2. Для каждой пары соседних элементов сравниваем их
3. Если элементы стоят в неправильном порядке (зависит от того в порядке возрастания или убывания сортируем), меняем их местами
4. После одного полного прохода самый большой элемент оказывается в конце массива
5. Повторяем проходы, каждый раз уменьшая рассматриваемый диапазон, пока массив не станет отсортирован

Получается, что самый большой элемент всплывает вверх, как пузырек

<img src="https://upload.wikimedia.org/wikipedia/commons/c/c8/Bubble-sort-example-300px.gif" style="width: 500px">

**Сложность.** $O(n^2)$, так как у нас получается два вложенных цикла, каждый из которых делает $O(n)$ итераций


In [2]:
# мало где используется
def bubble_sort(a: list[int]) -> list[int]:
    for _ in range(len(a)):
        for j in range(len(a)-1):
            if a[j] > a[j + 1]:
                a[j], a[j + 1] = a[j + 1], a[j]
    return a

print(bubble_sort([9, 8, 7, 3, 4, 6, 2, 5, 1]))

[1, 2, 3, 4, 5, 6, 7, 8, 9]


## Сортировка вставками

Сортировка вставками основывается на предположении, что у нас уже есть отсортированная часть массива.

Пусть дан массив `a = [1, 3, 5, 4, 2, 7, 0]`. Первые три элемента `[1, 3, 5]` уже упорядочены. Берём следующий элемент - `4`, и вставляем его в нужное место внутри отсортированной части:

* сравниваем `4` с предыдущим элементом `5`: так как `4 < 5`, меняем их местами → `[1, 3, 4, 5]`;
* далее сравниваем `4` и `3`: так как `4 > 3`, остановимся - элемент оказался на своём месте.

Получаем массив `a = [1, 3, 4, 5, 2, 7, 0]`.

Аналогично вставляем следующий элемент `2`, двигаясь влево:

* `2 < 5` → `[1, 3, 4, 2, 5]`;
* `2 < 4` → `[1, 3, 2, 4, 5]`;
* `2 < 3` → `[1, 2, 3, 4, 5]`;
* `2 > 1` → останавливаемся.

Теперь массив стал `a = [1, 2, 3, 4, 5, 7, 0]`. Каждый элемент мы проталкиваем на его позицию. В этом сортировка вставками похожа на пузырьковую

**Сложность.** Оценка снизу — $O(n)$, например, когда массив изначально отсортирован. Оценка сверху — $O(n^2)$



In [7]:
def insert_sort(a: list[int]) -> list[int]:
    for i in range(1, len(a)):
        k = i
        while k > 0 and a[k] < a[k - 1]:
            a[k], a[k - 1] = a[k - 1], a[k]
            k -= 1
    return a

print(insert_sort([6, 5, 3, 1, 8, 7, 2, 4]))

[1, 2, 3, 4, 5, 6, 7, 8]


<img src="https://upload.wikimedia.org/wikipedia/commons/0/0f/Insertion-sort-example-300px.gif" style="width: 500px">

## Сортировка слиянием

Пусть есть два отсортированных массива: `a=[1, 4, 7, 9]` и `b=[2, 3, 5, 6, 8]`. Нужно как-то соединить эти массивы, причем так, чтобы итог тоже был отсортированным массивом. Вариант "склеить два массива и запустить сортировку вставками/пузырьком" будет работать долго

Создадим новый массив `c` и заведем два указателя: `i` будет указывать на элемент массива `a`, а `j` — на элемент массива `b`.

Будем идти слева направо по массивам и поэлементно их сравнивать:
- `i=0, j=0`. Сравним: `a[0] < b[0]`, значит кладем в `c` элемент `a[0]`. Увеличиваем `i`
- `i=1, j=0`. Сравним: `a[1] > b[0]`, значит кладем в `c` элемент `b[0]`. Увеличиваем `j`
- `i=1, j=1`. Сравним: `a[1] > b[1]`, значит кладем в `c` элемент `b[1]`. Увеличиваем `j`
- и так далее, на каждом шаге берём меньший из двух текущих элементов `a[i]` и `b[j]`, добавляем его в `c` и сдвигаем соответствующий указатель

In [10]:
def merge(a: list[int], b: list[int]) -> list[int]:
    c = [0] * (len(a) + len(b))
    i = j = 0
    while i < len(a) or j < len(b):
        if i == len(a):
            c[i + j] = b[j]
            j += 1
        elif j == len(b):
            c[i + j] = a[i]
            i += 1
        elif a[i] > b[j]:
            c[i + j] = b[j]
            j += 1
        else:
            c[i + j] = a[i]
            i += 1
    
    return c


print(merge([1, 4, 7, 9], [2, 3, 5, 6, 8]))

[1, 2, 3, 4, 5, 6, 7, 8, 9]


Мы научились сливать массивы за $O(n+m)$, где $n$ - длина массива `a`, $m$ - длина массива `b`

Представим, что у нас есть 8 отсортированных массивов, каждый из которых состоит из 1 элемента - `[7], [2], [1], [4], [3], [5], [8], [6]`. 
- Мы можем сделать 4 массива, слив пары: `[2, 7], [1, 4], [3, 5], [6, 8]`
- Так как каждый из 4 массивов отсортирован по неубыванию, мы можем слить эти массивы в 2 массива: `[1, 2, 4, 7], [3, 5, 6, 8]`
- И, наконец, слить 2 отсортированных массива и получить `[1, 2, 3, 4, 5, 6, 7, 8]`

Это и есть сортировка слиянием. Осталось написать функцию, которая будет разбивать на единичные массивы:
- будем дробить исходный массив на 2 пока в каждом из подмассивов не останется 1 элемент
- далее возвращаемся из рекурсии, сливая отсортированные массивы

**Сложность.** На каждом шаге мы дробим массив на 2, значит $O(\log n)$ шагов, а чтобы слить два массива длиной $n$ нужно $O(n)$. Итого сортировка слиянием работает за $O(n\cdot\log n)$

In [12]:
def merge_sort(a: list[int]) -> list[int]:
    if len(a) < 2:
        return a
    mid = len(a) // 2
    return merge(merge_sort(a[:mid]), merge_sort(a[mid:]))

print(merge_sort([7, 2, 1, 4, 3, 5, 8, 6]))
print(merge_sort([6, 5, 3, 1, 8, 7, 2, 4]))

[1, 2, 3, 4, 5, 6, 7, 8]
[1, 2, 3, 4, 5, 6, 7, 8]


<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif" style="width: 500px">

## Подсчет количества инверсий

Подсчет количества инверсий - найти количество пар, удовлетворяющих какому-то условию.

Пусть есть массив `a=[7, 2, 1, 4, 3, 5, 8, 6]` и нужно найти количество пар, таких что `a[i] > a[j], i < j`

<img src="img/inversions.jpg">

Идем сверху вниз:
- при слиянии `[7]` и `[2]` видим, что в новый подмассив сначала встает `2`, а потом `7`, то есть $2<7$. Когда мы ставим $2$ видим, что в левом массиве (`[7]`) еще есть числа. Это означает, что мы нашли 1 инверсию
- при слиянии `[1]` и `[4]` инверсии нет, так как сначала идет `1`, а потом `4`; аналогично при слиянии `[3]` и `[5]`
- при слиянии `[8]` и `[6]` сначала мы возьмем число $6$, а в левом массиве (`[8]`) еще остается одно число - $8$. Значит, нашли еще одну 1 инверсию
    - то есть когда мы ставим какое-то число из правого массива и в левом массиве есть еще $k$ элементов, это означает, что мы нашли $k$ инверсий

Сольем массивы `[2, 7]` и `[1, 4]`
- сначала пойдет число $1$, смотрим сколько на данный момент есть чисел в левом массиве, которые мы еще не перенесли с новый - две штуки, значит $+2$ инверсии
- далее в новый массив перейдет число $7$, оно из левого подмассива, значит инверсий нет
- потом идет число $4$, в левом подмассиве есть одно число, которое мы не перенесли - $7$. Значит, $+1$ инверсия

При слиянии массивов `[3, 5]` и `[6, 8]` инверсий не будет, так как мы последоватльно добавляем числа

Теперь сольем `[1, 2, 4, 7]` и `3, 5, 6, 8`:
- сначала идет $1$, потом $2$, оба числа из левого подмассива - инверсий нет
- дальше идет $3$, оно из правого подмассива. Смотрим сколько элементов из левого мы еще не перенесли - 2 штуки, значит $+2$ инверсии
- потом переносим $4$, инверсий нет
- переносим $5$, $+1$ инверсия
- переносим $6$, $+1$ инверсия
- переносим $7$, инверсий нет
- переносим $8$, в левом подмассиве чисел нет, а значит инверсий нет

Итого: $2+2+1+2+1+1=9$ инверсий

Чтобы посчитать количество инверсий нужно прибавлять 1 к некоторому счетчику каждый раз, когда мы берем число из правого подмассива

Для этого нужно чуть дополнить функцию `merge()`

In [15]:
cnt = 0

def merge(a: list[int], b: list[int]) -> list[int]:
    global cnt
    c = [0] * (len(a) + len(b))
    i = j = 0
    while i < len(a) or j < len(b):
        if i == len(a):
            c[i + j] = b[j]
            j += 1
        elif j == len(b):
            c[i + j] = a[i]
            i += 1
        elif a[i] > b[j]:
            c[i + j] = b[j]
            cnt += len(a) - i
            j += 1
        else:
            c[i + j] = a[i]
            i += 1

    return c

print(merge_sort([7, 2, 1, 4, 3, 5, 8, 6]))
print(f'Инверсий в данном массиве: {cnt}')


[1, 2, 3, 4, 5, 6, 7, 8]
Инверсий в данном массиве: 9
