# Реализация Quick Sort

In [1]:
import random

## Код

In [2]:
def sort_quick(array, randomized=False):
    sort_quick_helper(array, 0, len(array) - 1, randomized)
    

def sort_quick_helper(array, ind_l, ind_r, randomized):
    if ind_l >= ind_r:
        return 
    ind_c = partition(array, ind_l, ind_r, randomized)
    sort_quick_helper(array, ind_l, ind_c - 1, randomized)
    sort_quick_helper(array, ind_c + 1, ind_r, randomized)


def partition(array, ind_l, ind_r, randomized):
    if randomized:
        r = random.randint(ind_l, ind_r)
        array[ind_r], array[r] = array[r], array[ind_r]
    pivot = array[ind_r]
    i = ind_l - 1;
    for j in range(ind_l, ind_r+1):
        if array[j] <= pivot:
            i += 1;
            array[i], array[j] = array[j], array[i]
    return i

Небольшой тест

In [5]:
A = [i for i in range(1000)]
random.shuffle(A)

A_sort_quick_right = A[:]
A_sort_quick_random = A[:]
A_sort_python = A[:]

sort_quick(A_sort_quick_right)
sort_quick(A_sort_quick_random, randomized=True)
A_sort_python.sort()

print(A_sort_quick_right == A_sort_python)
print(A_sort_quick_random == A_sort_python)

True
True


## Сравним время выполнения двух типов Quick Sort

### На примере случайного массива

In [8]:
%%timeit -n 3 -r 3

A = [i for i in range(30000)]
random.shuffle(A)
sort_quick(A)

91.3 ms ± 4.14 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


In [9]:
%%timeit -n 3 -r 3

A = [i for i in range(30000)]
random.shuffle(A)
sort_quick(A, randomized=True)

114 ms ± 3.74 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


### На примере почти упорядоченного массива

In [11]:
def shuffle_part(array, n):
    if type(n) == float:
        num = int(n * len(array))
    if type(n) == int:
        num = n
    indices = [i for i in range(len(array))]
    indices_shuffle = random.sample(indices, num)
    half_1 = indices_shuffle[0:int(len(indices_shuffle) / 2)]
    half_2 = indices_shuffle[int(len(indices_shuffle) / 2):]
    for index_1, index_2 in zip(half_1, half_2):
        array[index_1], array[index_2] = array[index_2], array[index_1]

In [12]:
%%timeit -n 3 -r 3

A = [i for i in range(3000)]
shuffle_part(A, 5)
sort_quick(A)

523 ms ± 48.7 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


In [13]:
%%timeit -n 3 -r 3

A = [i for i in range(3000)]
shuffle_part(A, 5)
sort_quick(A, randomized=True)

9.7 ms ± 1.51 ms per loop (mean ± std. dev. of 3 runs, 3 loops each)


### Выводы

В случае случайного массива оба типа показывают себя примерно одинаково. Но если массив оказывается почти упорядоченным, рандомизированный вариант quick sort показывает себя лучше, вариант с выбором крайнего правого элемента откатывается к квадратичному времени выполнения.