### Сортировка списков

1) Выучить наизусть сортировку пузырьком и быструю сортировку.
2) Реализовать дополнительно 2 любые сортировки кроме вышеуказанных. Написать тесты на эти функции.
3) Создать список из 10000 случайных чисел с плавающей запятой.
4) Замерить и вывести время выполнения, пузырьком, быстрой сортировки, ваших 2 сортировок и встроенной сортировки python.
5) Создать список из 20000 случайных чисел с плавающей запятой. Сравните как изменилось время выполнения. 
(если на вашем компьютере это выполняется слишком долго больше минуты или не хватает памяти возьмите меньшее число элементов, например 2000 / 4000)
6) Сделайте выводы по результатам, они достаточно интересные. Если будут вопросы спросите преподавателя.

In [3]:
import random, time

def timer(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = func(*args, **kwargs)
        finish_time = time.time()
        print(f"Время на выполнение {func.__name__}: {finish_time - start_time} с")
        return result
    return wrapper


test_list_10k = [random.random() for _ in range(10000)]
test_list_20k = [random.random() for _ in range(20000)]

In [17]:
# сортировка пузырьком
@timer
def bubble_sort(arr):
    def swap(i, j):
        arr[i], arr[j] = arr[j], arr[i]

    n = len(arr)
    swapped = True

    x = -1
    while swapped:
        swapped = False
        x = x + 1
        for i in range(1, n - x):
            if arr[i - 1] > arr[i]:  # если элементы стоят в неправильном порядке,
                swap(i - 1, i)  # то меняем их местами, пока не отсортируем arr
                swapped = True


test_arr = [-7, 16, 3, -2, -2, 1, 0, 14, 5]
bubble_sort(test_arr)
assert test_arr == [-7, -2, -2, 0, 1, 3, 5, 14, 16]

Время на выполнение bubble_sort: 1.1920928955078125e-05 с


In [12]:
# быстрая сортировка

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    else:
        q = random.choice(arr)

    lw_arr = [n for n in arr if n < q]
    eq_arr = [q] * arr.count(q)
    hi_arr = [n for n in arr if n > q]

    return quick_sort(lw_arr) + eq_arr + quick_sort(hi_arr)


test_arr = [-7, 16, 3, -2, -2, 1, 0, 14, 5]
test_arr = quick_sort(test_arr)
assert test_arr == [-7, -2, -2, 0, 1, 3, 5, 14, 16]

In [13]:
# сортировка слиянием

def merge_sort(arr):
    def merge(left, right, merged):
        left_cursor, right_cursor = 0, 0
        while left_cursor < len(left) and right_cursor < len(right):

            # Сортируем каждый и помещаем в результат
            if left[left_cursor] <= right[right_cursor]:
                merged[left_cursor + right_cursor] = left[left_cursor]
                left_cursor += 1
            else:
                merged[left_cursor + right_cursor] = right[right_cursor]
                right_cursor += 1

        for left_cursor in range(left_cursor, len(left)):
            merged[left_cursor + right_cursor] = left[left_cursor]

        for right_cursor in range(right_cursor, len(right)):
            merged[left_cursor + right_cursor] = right[right_cursor]

        return merged

    # Последнее разделение массива
    if len(arr) <= 1:
        return arr
    mid = len(arr) // 2
    # Выполняем merge_sort рекурсивно с двух сторон
    left_arr, right_arr = merge_sort(arr[:mid]), merge_sort(arr[mid:])

    # Объединяем стороны вместе
    return merge(left_arr, right_arr, arr.copy())


test_arr = [-7, 16, 3, -2, -2, 1, 0, 14, 5]
test_arr = merge_sort(test_arr)
assert test_arr == [-7, -2, -2, 0, 1, 3, 5, 14, 16]

In [24]:
# сортировка выбором
@timer
def selection_sort(arr):        
    for i in range(len(arr)):
        minimum = i
        
        for j in range(i + 1, len(arr)):
            # находим наименьшее значение
            if arr[j] < arr[minimum]:
                minimum = j

        # помещаем его перед отсортированным концом массива
        arr[minimum], arr[i] = arr[i], arr[minimum]
            
    return arr


test_arr = [-7, 16, 3, -2, -2, 1, 0, 14, 5]
test_arr = selection_sort(test_arr)
assert test_arr == [-7, -2, -2, 0, 1, 3, 5, 14, 16]

Время на выполнение selection_sort: 9.059906005859375e-06 с


In [31]:
# проверяем сортировку пузырьком на 10 и 20 тысячах случайных чисел
test_list_10k = [random.random() for _ in range(10000)]
test_list_20k = [random.random() for _ in range(20000)]

bubble_sort(test_list_10k)
bubble_sort(test_list_20k)

Время на выполнение bubble_sort: 6.947316646575928 с
Время на выполнение bubble_sort: 28.578600645065308 с


Вывод по сортировке пузырьком: при увеличении входных данных в 2 раза, время выполнения увеличилось в 4 раза, что говорит нам о реальной асимптотике O(n^2).

In [26]:
# проверяем сортировку выбором на 10 и 20 тысячах случайных чисел
test_list_10k = [random.random() for _ in range(10000)]
test_list_20k = [random.random() for _ in range(20000)]

selection_sort(test_list_10k)
selection_sort(test_list_20k)
print("Сортировка закончена!")

Время на выполнение selection_sort: 2.7757441997528076 с
Время на выполнение selection_sort: 10.851823091506958 с
Сортировка закончена!


Вывод по сортировке выбором: при увеличении входных данных в 2 раза, время выполнения увеличилось в 4 раза, что говорит нам о реальной асимптотике O(n^2). Но скорость выполнения алгоритма в 2-3 раза выше, чем при сортировке пузырьком.

In [30]:
# проверяем сортировку слиянием на 10 и 20 тысячах случайных чисел
test_list_10k = [random.random() for _ in range(10000)]
test_list_20k = [random.random() for _ in range(20000)]

start_time = time.time()
merge_sort(test_list_10k)
finish_time = time.time()
print(f"Время на выполнение {merge_sort.__name__}: {finish_time - start_time} с")

start_time = time.time()
merge_sort(test_list_20k)
finish_time = time.time()
print(f"Время на выполнение {merge_sort.__name__}: {finish_time - start_time} с")

Время на выполнение merge_sort: 0.028386592864990234 с
Время на выполнение merge_sort: 0.06009554862976074 с


Вывод по сортировке слиянием: при увеличении входных данных в 2 раза, время выполнения увеличилось в 2 раза, что говорит нам о реальной асимптотике O(n). При этом скорость выполнения алгоритма несоизмеримо быстрее, чем у сортировки пузырьком или выбором.

In [32]:
# проверяем быструю сортировку на 10 и 20 тысячах случайных чисел
test_list_10k = [random.random() for _ in range(10000)]
test_list_20k = [random.random() for _ in range(20000)]

start_time = time.time()
quick_sort(test_list_10k)
finish_time = time.time()
print(f"Время на выполнение {quick_sort.__name__}: {finish_time - start_time} с")

start_time = time.time()
quick_sort(test_list_20k)
finish_time = time.time()
print(f"Время на выполнение {quick_sort.__name__}: {finish_time - start_time} с")

Время на выполнение quick_sort: 0.035451412200927734 с
Время на выполнение quick_sort: 0.04287838935852051 с


Вывод по быстрой сортировке: при увеличении входных данных в 2 раза, время выполнения увеличилось незначительно, что говорит нам о реальной асимптотике O(log(n)). При этом скорость выполнения алгоритма несоизмеримо быстрее, чем у сортировки пузырьком или выбором. Если сравнить результаты с сортировкой слиянием, то получается, что на 10к данных быстрее сортировка слиянием, а на 20к быстрее уже быстрая сортировка.

In [34]:
# проверяем встроенный метод сортировки на 10 и 20 тысячах случайных чисел
test_list_10k = [random.random() for _ in range(10000)]
test_list_20k = [random.random() for _ in range(20000)]

start_time = time.time()
test_list_10k.sort()
finish_time = time.time()
print(f"Время на выполнение встроенной сортировкой Python: {finish_time - start_time} с")

start_time = time.time()
test_list_20k.sort()
finish_time = time.time()
print(f"Время на выполнение встроенной сортировкой Python: {finish_time - start_time} с")

Время на выполнение встроенной сортировкой Python: 0.0015671253204345703 с
Время на выполнение встроенной сортировкой Python: 0.002961397171020508 с


Вывод: используйте только встроенную сортировку Python, потому что она написана на плюсах!