### Сортировка списков

`1. Выучить наизусть сортировку пузырьком и быструю сортировку.

2. Реализовать дополнительно 2 любые сортировки кроме вышеуказанных. Написать тесты на эти функции.`

`QuickSort`
1. `QuickSort` имеет среднюю временную сложность `O(n log n)`, что делает его очень эффективным для большинства данных. В худшем случае сложность составляет `O(n^2)`, но это редкость и может быть смягчено правильным выбором опорного элемента `(pivot)`.
2. `QuickSort` является алгоритмом `in-place`
3. Существует множество улучшений и вариаций `QuickSort`, таких как случайный выбор опорного элемента или использование медианы из трёх, которые могут улучшить его производительность на конкретных наборах данных и минимизировать вероятность худшего случая.


In [8]:
import random

def quick_sort(mas) -> list:
    if len(mas) <= 1:
        return mas
    else:
        pivot = random.choice(mas) # рандомный опорный элемент
        left = [i for i in mas if i < pivot]
        right = [i for i in mas if i > pivot]
        middle = [i for i in mas if i == pivot]

    return quick_sort(left) + middle + quick_sort(right)

nums = []
for _ in range(25):
    nums.append(random.randint(0, 99))
    
sort_list = quick_sort(nums)
print(sort_list)


[4, 5, 5, 7, 10, 10, 10, 16, 26, 27, 28, 33, 36, 38, 45, 50, 58, 72, 72, 73, 87, 90, 93, 97, 98]


In [2]:
def test_quick_sort():
    mas = [-1, 3, -8, 5, 30]
    expected = [-8, -1, 3, 5, 30]
    assert quick_sort(mas) == expected
test_quick_sort()

def test_quick_sort2():
    mas = [2, 2, 2, 2, 2]
    expected = [2, 2, 2, 2, 2]
    assert quick_sort(mas) == expected
test_quick_sort2()

def test_quick_sort3():
    mas = []
    expected = []
    assert quick_sort(mas) == expected
test_quick_sort3()


` bubble sort `
1. Сортировка пузырьком является алгоритмом `"in-place"`, то есть не требует дополнительной памяти для хранения копий данных. Все операции происходят внутри оригинального массива.
2. Если на определённой итерации не было сделано ни одного обмена, алгоритм может остановиться досрочно.
3. Для небольших массивов `bubble sort` может быть достаточно быстрой и эффективной из-за своей низкой сложности реализации.


In [14]:
def bubble_sort(nums) -> list:
    n = len(nums)
    for i in range(n - 1):
        swapped = False
        for j in range(n - i - 1):
            #print('i=', i, "iterations", n-i-1, 'j:', nums[j], 'j+1:', nums[j+1], nums[j] > nums[j + 1], nums)
            if nums[j] > nums[j + 1]:
               nums[j], nums[j + 1] = nums[j + 1], nums[j]
               swapped = True

        if not swapped:  # выходим из цикла j если не было ни одного обмена
            break
    return nums
    
nums = []
for _ in range(5):
    nums.append(random.randint(0, 99))    
    
sort_list = bubble_sort(nums)
print(sort_list)


[0, 26, 36, 40, 48]


In [4]:
def test_bubble_sort():
    mas = [-1, 3, -8, 5, 30]
    expected = [-8, -1, 3, 5, 30]
    assert bubble_sort(mas) == expected
test_bubble_sort()

def test_bubble_sort2():
    mas = []
    expected = []
    assert quick_sort(mas) == expected
test_bubble_sort2()


`Сортировка вставками (Insertion Sort)`

Сортировка вставками работает, как сортировка карт в руке: она последовательно берет каждый элемент из несортированного списка и вставляет его в правильное положение в уже отсортированную часть списка.

1. Позводяет досортировывать массив при появлении новых элементов, а не пересортировывать массив по новой.


In [10]:
def insertion_sort(nums):
    n = len(nums)
    for i in range(1, n):
        # на первой итерации i будет указывать на второй элемент списка
        # и будет пробегать до конца массива
        
        for j in range(i, 0, -1):
        # указатель j встает на то же место, что и i, и идет в обратную сторону,
        # сравнивая элементы
            if nums[j] < nums[j - 1]:
                nums[j], nums[j - 1] = nums[j - 1], nums[j]
            else:
                break  # если текущий элемент больше предыдущего, завершаем цикл
    return nums

sort_list = insertion_sort(nums)
print(sort_list)

[0, 5, 10, 10, 12, 16, 20, 20, 21, 26, 32, 53, 59, 60, 64, 64, 65, 68, 74, 89, 90, 93, 95, 96, 97]


In [6]:
def test_insertion_sort():
    mas = [-1, 3, -8, 5, 30]
    expected = [-8, -1, 3, 5, 30]
    assert quick_sort(mas) == expected
test_insertion_sort()

def test_insertion_sort2():
    mas = [2, 2, 2, 2, 2]
    expected = [2, 2, 2, 2, 2]
    assert quick_sort(mas) == expected
test_insertion_sort2()

def test_insertion_sort3():
    mas = []
    expected = []
    assert quick_sort(mas) == expected
test_insertion_sort3()


`Сортировка выбором (Selection Sort)`

Сортировка выбором последовательно находит минимальный элемент из несортированной части списка и меняет его местами с первым элементом этой части. Затем повторяет процесс для оставшейся части списка.

Имеет сложность O(n^2) во всех случаях

In [11]:
def selection_sort(nums):
    n = len(nums)
    for i in range(n):
        min_index = i
        for j in range(i + 1, n):
            # находим наименьшее значение массива
            if nums[j] < nums[min_index]:
                min_index = j
        # помещаем его перед отсортированным концом массива
        nums[i], nums[min_index] = nums[min_index], nums[i]
    return nums


nums = []
for _ in range(25):
    nums.append(random.randint(0, 99))
    
sorted_list = selection_sort(nums)
print(sorted_list)

[0, 7, 14, 15, 16, 20, 20, 21, 29, 44, 52, 57, 60, 61, 71, 74, 75, 76, 77, 83, 84, 87, 92, 94, 96]


`3. Создать список из 10000 случайных чисел с плавающей запятой.`

`4. Замерить и вывести время выполнения, пузырьком, быстрой сортировки, ваших 2 сортировок и встроенной сортировки python.`

In [37]:
import time 

nums = [round(random.uniform(-500, 500), 2) for _ in range(10000)]


def sorted_time(sort_function, data):
    """функция измеряет время выполнения сортировки"""
    start = time.time()
    sort_function(data.copy())  # создаю копию списка, для того что бы алгоритм работал с одинаковыми исх данными 
    end = time.time()
    return start - end

def builtin_sort(nums):
    nums.sort()
    return nums

def builtin_sorted(nums):
    return sorted(nums)

sort_functions = [
    ("Bubble Sort", bubble_sort),
    ("Insertion Sort", insertion_sort),
    ("Selection Sort", selection_sort),
    ("Quick Sort", quick_sort),
    ("Builtin Sort", builtin_sort),
    ("Builtin Sorted", builtin_sorted)
]

# Замер времени выполнения сортировок в цикле
sort_times = [(name, sorted_time(func, nums)) for name, func in sort_functions]

for name, time_sort in sort_times:
    print(f"{name}: {time_sort:.6f} сек.")

Bubble Sort: -6.065166 сек.
Insertion Sort: -3.949607 сек.
Selection Sort: -2.523901 сек.
Quick Sort: -0.021754 сек.
Builtin Sort: -0.001339 сек.
Builtin Sorted: -0.001258 сек.


`5. Создать список из 20000 случайных чисел с плавающей запятой. Сравните как изменилось время выполнения. 
(если на вашем компьютере это выполняется слишком долго больше минуты или не хватает памяти возьмите меньшее число элементов, например 2000 / 4000)`

In [40]:
nums2 = [round(random.uniform(-500, 500), 2) for _ in range(20000)]

# Замер времени выполнения сортировок в цикле
sort_times = [(name, sorted_time(func, nums2)) for name, func in sort_functions]

for name, time_sort in sort_times:
    print(f"{name}: {time_sort:.6f} сек.")

Bubble Sort: -27.230795 сек.
Insertion Sort: -19.424900 сек.
Selection Sort: -12.091986 сек.
Quick Sort: -0.048475 сек.
Builtin Sort: -0.002713 сек.
Builtin Sorted: -0.002694 сек.


`6. Сделайте выводы по результатам, они достаточно интересные. Если будут вопросы спросите преподавателя.`

`Вывод:`

`Сортировка пузырьком (bubble sort)` - Подходит для очень маленьких массивов, обычно до нескольких сотен элементов (до 1000). Сортировка больших массивов станет чрезвычайно медленной. Имеет сложность O(n^2)

`Быстрая сортировка (quick_sort)` - высокая производительность, средняя сложность O(n log n), в худшем случае O(n^2), если неудачно выбран опорный элемент. Подходит для больших массивов, обычно до нескольких миллионов элементов. При использовании подходящего выбора опорного элемента (например, медиана трех) можно эффективно сортировать массивы до десятков миллионов элементов.

`Сортировка вставками (insertion_sort)` - Имеет сложность O(n^2). Подходит для небольших массивов, обычно до нескольких тысяч элементов (до 1000-2000). Частично отсортированные массивы могут быть большего размера, но в общем случае большие массивы сортируются медленно.

`Сортировка выбором (Selection Sort)` - Имеет сложность O(n^2). Подходит для небольших массивов, обычно до нескольких тысяч элементов (до 1000-2000). Для больших массивов становится слишком медленной.

`Встроенная сортировка sort() в Python (Timsort)` - Имеет сложность O(n log n) в любом случае. Очень эффективен и может сортировать массивы до сотен миллионов элементов. Timsort хорошо оптимизирован для работы с большими объемами данных и частично отсортированными массивами.

