In [5]:
from typing import List
import random

**Сортировки со сравнениями**
* сортировка выбором (n итераций по всему массиву вправо с поиском текущего минимума)
* сортировка вставками (можно рассмотреть как онлайн алгоритм с проталкиванием поступившего элемента в нужную позицию)
* сортировка слияниями 
* быстрая сортировка

In [6]:
def test_sort(sort):
    test_examples = [[], [1, 2, 3], [3, 2, 1], [4, 5, 6, 3, 2, 1],
                     [4, 5, 6, 2, 3, 1], [1, 6, 5, 14, 61, 761, 4]]
    test_answers = [[], [1, 2, 3], [1, 2, 3], [1, 2, 3, 4, 5, 6],
                    [1, 2, 3, 4, 5, 6], [1, 4, 5, 6, 14, 61, 761]]
    for i, ex in enumerate(test_examples):
        sort(ex)
        assert test_answers[i] == ex, f'test case {i} error, answer{ex}'
    n = len(test_examples)
    return f'{n}/{n} tests passed'

In [7]:
def random_tester_sort(sort, num_tests=100, len_arr=10):
    for test in range(num_tests):
        ex = []
        for i in range(0, len_arr):
            ex.append(random.randint(0, 100))
        res = sort(ex)
        z = ex.sort()
        assert res == ex
    return f'{num_tests}/{num_tests} tests passed'

In [8]:
def choice_sort(a: List[int]) -> List[int]:
    n = len(a)
    for i in range(n):
        min_ = a[i]
        id_ = i
        for j in range(i + 1, n):
            if a[j] < min_:
                min_ = a[j]
                id_ = j
        a[i], a[id_] = a[id_], a[i]
    return a


test_sort(choice_sort)
random_tester_sort(choice_sort)

'100/100 tests passed'

In [9]:
def insert_sort(a: List[int]) -> List[int]:
    ''' plus: ~ num of inversion operations
    '''
    n = len(a)
    for i in range(1, n):
        j = i
        while j > 0 and a[j - 1] > a[j]:
            a[j], a[j - 1] = a[j - 1], a[j]
            j -= 1
    return a


test_sort(insert_sort)
random_tester_sort(insert_sort)

'100/100 tests passed'

In [10]:
def merge_sort(a: List[int], l=None, r=None) -> List[int]:
    '''
    plus: stability
    minus: ~ 2n memory
    a - int array for sort
    l - left index
    r - right index
    '''
    if l is None:
        l = 0
    if r is None:
        r = len(a)
    if r - l <= 1:
        return a
    m = (l + r) // 2
    merge_sort(a, l, m)
    merge_sort(a, m, r)
    i, j, p = l, m, 0
    t = [0] * (r - l)
    while i < m and j < r:
        if a[i] < a[j]:
            t[p] = a[i]
            i, p = i + 1, p + 1
        else:
            t[p] = a[j]
            j, p = j + 1, p + 1
    while i < m:
        t[p] = a[i]
        p, i = p + 1, i + 1
    while j < r:
        t[p] = a[j]
        p, j = p + 1, j + 1
    for i in range(r - l):
        a[l + i] = t[i]
    return a


test_sort(merge_sort)
random_tester_sort(merge_sort)

'100/100 tests passed'

In [11]:
def partition(a: List[int], l=None, r=None, id_=None):
    '''
    peek random x in arr;
    then partition arr by it;
    
    return id, which satisfies follow inequalities:
        if i<id -> arr[i]<=x; if i>id -> arr[i]>x
    '''
    if l is None:
        l = 0
    if r is None:
        r = len(a)
    assert r - l > 1
    if id_ is None:
        id_ = random.randint(l, r - 1)
    x = a[id_]
    a[l], a[id_] = a[id_], a[l]
    i, j = l + 1, r - 1
    while i <= j:
        if a[i] > x:
            a[j], a[i] = a[i], a[j]
            j -= 1
        else:
            i += 1
    a[l], a[i - 1] = a[i - 1], a[l]
    return i - 1


def quick_sort(a: List[int], l=None, r=None) -> List[int]:
    if l is None:
        l = 0
    if r is None:
        r = len(a)
    if r - l <= 1:
        return a
    ind = partition(a, l, r)
    quick_sort(a, l, ind)
    quick_sort(a, ind, r)
    return a


test_sort(quick_sort)
random_tester_sort(quick_sort)

'100/100 tests passed'

**Сортировки без сравнений**
* counting sort
* digit sort

$counting\_sort$

Работает в ситуации, когда все элементы массива $a_i$  ограничены каким-то числом $C$.

Считая, что аллокация памяти работает за $\mathcal{O}(1)$, алгоритм работает за $\mathcal{O}(C+n)$ памяти и времени.
Важно, что он линеен по количеству элементов, но размер входа все-таки $\mathcal{O}(n\log C)$.


In [14]:
def countsort(a:List[int],C=1000)->List[int]:
    '''
    0<=arr[i]<C
    '''
    n = len(a)
    temp = [0]*C
    for el in a:
        temp[el]+=1
    res = []
    j = 0
    for i, el in enumerate(temp):
        while el>0:
            a[j]=i
            j+=1
            el-=1
    return a
test_sort(countsort)            
random_tester_sort(countsort)

'100/100 tests passed'

Улучшение этой идеи ($digitsort/radixsort$) - сортировка кортежей чисел, по факту это запись в $C$-ичной системе исчисления.

Запускаем $\log_C \max_i |a[i]|$ сортировок подсчетом по конкретной цифре в записи, начиная с самой последней.

Из-за того, что она устойчива, в конце мы получим лексикографически отсортированные числа. По времени это $\mathcal{O}\left((n+C)\cdot\log_C X\right)$, где $X = \max_i |a_i|$. Устойчивость достигается тем, что мы идем с конца списка и уже заранее знаем, сколько каких значений встретим и кладем в нужное место.

In [15]:
def counting_sort(a: List[int], deg: int) -> List[int]:
    n = len(a)
    count, output = [0] * 10, [0] * n
    for i in range(n):
        tail = 10**deg
        val = a[i] // tail
        count[val % 10] += 1

    for i in range(1, 10):
        count[i] += count[i - 1]
    i = n - 1
    while i >= 0:
        tail = 10**deg
        val = a[i] // tail
        index = val % 10
        output[count[index] - 1] = a[i]
        count[index] -= 1
        i -= 1
    for i in range(n):
        a[i] = output[i]
    return


def radix_sort(a: List[int]) -> List[int]:
    if a == []:
        return a
    max_ = max(a)

    exp = 0
    while (10**exp) < max_:
        counting_sort(a, exp)
        exp += 1
    return a


random_tester_sort(radix_sort)
random_tester_sort(radix_sort)

'100/100 tests passed'