# Реализация Insertion Sort и Shell Sort

In [1]:
import random

## 1. Реализация Insertion sort

In [2]:
def sorted_insertion(array):
    array_copy = array[:]
    for i in range(len(array_copy)):
        # выбираем элемент массива
        selected_element = array_copy[i]
        # начальный индекс для сравнения выбранного элемента с элементами в отсортированной части массива
        j = i - 1
        # пока индекс в отсортированной части массива неотрицательный и
        # пока текущий элемент отсортированного массива больше выбранного элемента
        while j >= 0 and array_copy[j] > selected_element:
            # сдвигаем элементы в отсортированной части массива вправо на 1
            array_copy[j + 1] = array_copy[j]
            # уменьшаем индекс на 1, берем элемент с меньшим (или равным) значемением
            j -= 1
        # - если текущий элемент (по индеску j) отсортированного массива меньше или равен выбранному элементу,
        # тогда записываем выбранный элемент в ячейку правее (с индексом j + 1)
        # - если индекс отрицательный - пишем в самое начало
        array_copy[j + 1] = selected_element
    return array_copy

In [3]:
A = [i for i in range(26)]
random.shuffle(A)
A_sorted = sorted_insertion(A)
print(A)
print(A_sorted)

[12, 5, 14, 10, 4, 15, 13, 16, 18, 3, 20, 11, 7, 2, 21, 1, 9, 24, 0, 19, 6, 25, 8, 17, 23, 22]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25]


## 2. Реализация Shell sort

In [4]:
def sorted_shell(array, gap_func):
    gaps = gap_func(len(array))
    array_copy = array[:]    
    for gap in gaps:
        for i in range(0, len(array), gap):
            selected_element = array_copy[i]
            j = i - gap
            while j >= 0 and array_copy[j] > selected_element:
                array_copy[j + gap] = array_copy[j]
                j -= gap
            array_copy[j + gap] = selected_element
    return array_copy

Последовательность Хиббарда (1963). Оценка сложности алгоритма $\Theta(N^{3/2})$

In [5]:
def get_hibbard_gaps(n):
    gaps = []
    k = 1
    while (2**k - 1) < n:
        gaps.append(2**k - 1)
        k += 1
    return list(reversed(gaps))

Последовательность Кнута (1973). Оценка сложности алгоритма $\Theta(N^{3/2})$

In [6]:
def get_knuth_gaps(n):
    gaps = []
    k = 1
    while (3**k - 1) / 2 < n / 3:
        gaps.append(int((3**k - 1) / 2))
        k += 1
    return list(reversed(gaps))

Последовательность Седжвика (1982). Оценка сложности алгоритма $O(N^{4/3})$

In [7]:
def get_sedgewick_gaps(n):
    gaps = [1]
    for k in range(1, n):
        x = 4**k + 3 * 2**(k - 1) + 1
        if x < n:
            gaps.append(x)
        else:
            break
    return list(reversed(gaps))

Последовательность Пратта (1971). Оценка сложности алгоритма $O(N \log^2 N)$

In [8]:
def get_pratt_gaps(n):
    return list(reversed([i for i in range(1, n) if i % 2 == 0 or i % 3 == 0 or i == 1]))

Тест

In [9]:
A = [i for i in range(26)]
random.shuffle(A)

In [10]:
A_sorted = sorted_shell(A, get_hibbard_gaps)
print(A)
print(A_sorted)

[23, 24, 1, 15, 2, 9, 11, 6, 8, 19, 16, 3, 20, 7, 13, 5, 0, 4, 14, 25, 12, 22, 17, 10, 21, 18]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25]


In [11]:
A_sorted = sorted_shell(A, get_knuth_gaps)
print(A)
print(A_sorted)

[23, 24, 1, 15, 2, 9, 11, 6, 8, 19, 16, 3, 20, 7, 13, 5, 0, 4, 14, 25, 12, 22, 17, 10, 21, 18]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25]


In [12]:
A_sorted = sorted_shell(A, get_sedgewick_gaps)
print(A)
print(A_sorted)

[23, 24, 1, 15, 2, 9, 11, 6, 8, 19, 16, 3, 20, 7, 13, 5, 0, 4, 14, 25, 12, 22, 17, 10, 21, 18]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25]


In [13]:
A_sorted = sorted_shell(A, get_pratt_gaps)
print(A)
print(A_sorted)

[23, 24, 1, 15, 2, 9, 11, 6, 8, 19, 16, 3, 20, 7, 13, 5, 0, 4, 14, 25, 12, 22, 17, 10, 21, 18]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25]


## 3. Сравнение эффективности insertion и shell сортировок

In [14]:
def shuffle_part(array, n):
    if type(n) == float:
        num = int(n * len(array))
    if type(n) == int:
        num = n
    indices = [i for i in range(len(array))]
    indices_shuffle = random.sample(indices, num)
    half_1 = indices_shuffle[0:int(len(indices_shuffle) / 2)]
    half_2 = indices_shuffle[int(len(indices_shuffle) / 2):]
    for index_1, index_2 in zip(half_1, half_2):
        array[index_1], array[index_2] = array[index_2], array[index_1]

### Cлучайный массив

In [15]:
A = [i for i in range(10000)]
random.shuffle(A)

In [16]:
%%timeit -n 2 -r 2
sorted_insertion(A)

3.64 s ± 47.9 ms per loop (mean ± std. dev. of 2 runs, 2 loops each)


In [17]:
%%timeit -n 2 -r 2
sorted_shell(A, get_hibbard_gaps)

2.64 s ± 9.08 ms per loop (mean ± std. dev. of 2 runs, 2 loops each)


### Массив, в котором перемешаны 10% элементов

In [18]:
A = [i for i in range(10000)]
shuffle_part(A, 0.1)

In [19]:
%%timeit -n 3 -r 3
sorted_insertion(A)

484 ms ± 5.03 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


In [20]:
%%timeit -n 3 -r 3
sorted_shell(A, get_hibbard_gaps)

333 ms ± 1.82 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


### Почти упорядоченный массив

In [21]:
A = [i for i in range(10000)]
shuffle_part(A, 5)

In [22]:
%%timeit -n 3 -r 3
sorted_insertion(A)

6.55 ms ± 543 µs per loop (mean ± std. dev. of 3 runs, 3 loops each)


In [23]:
%%timeit -n 3 -r 3
sorted_shell(A, get_pratt_gaps)

23.5 ms ± 3.68 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


### Выводы

При сортировке случайного массива и массива, в котором перемешаны 10% элементов, лучше себя показывает Shell sort. В случае почти упорядоченного массива Insertion sort лучше.

## 4. Сравнение эффективности shell сортировок

### Тест на примере случайного массива с 10000 элементами

In [24]:
A = [i for i in range(10000)]
random.shuffle(A)

In [25]:
%%timeit -n 2 -r 2
sorted_shell(A, get_hibbard_gaps)

2.73 s ± 42.2 ms per loop (mean ± std. dev. of 2 runs, 2 loops each)


In [26]:
%%timeit -n 2 -r 2
sorted_shell(A, get_knuth_gaps)

3.08 s ± 36.8 ms per loop (mean ± std. dev. of 2 runs, 2 loops each)


In [27]:
%%timeit -n 2 -r 2
sorted_shell(A, get_sedgewick_gaps)

3.33 s ± 26.8 ms per loop (mean ± std. dev. of 2 runs, 2 loops each)


In [28]:
%%timeit -n 2 -r 2
sorted_shell(A, get_pratt_gaps)

1.8 s ± 10.5 ms per loop (mean ± std. dev. of 2 runs, 2 loops each)


### Выводы

Лучше всех себя показал Shell sort с последовательностью Пратта с оценкой сложности $O(N \log^2 N)$).  
Худше всех Shell sort с последовательностью Седжвика несмотря на заявленную $O(N^{4/3})$.