In [None]:
import random
import timeit

## **Задание 1**
Написать программу с функциями для быстрой сортировки и сортировки расческой. Оценить время выполнения функций с помощью модуля timeit.

In [None]:
arr = [random.randint(0, 1000) for _ in range(30)]

### **Быстрая сортировка**

Этот алгоритм состоит из трёх шагов. Сначала из массива нужно выбрать один элемент — его обычно называют опорным. Затем другие элементы в массиве перераспределяют так, чтобы элементы меньше опорного оказались до него, а большие или равные — после. А дальше рекурсивно применяют первые два шага к подмассивам справа и слева от опорного значения.

**Достоинства**:

* Это один из самых быстрых известных алгоритмов сортировки.
* Используется во многих языках программирования.
* Не требует дополнительной памяти для сортировки.

**Недостатки**:

* Худшее время выполнения составляет O(n^2) и возможно, если выбор опорного элемента будет неудачным.
* Не устойчив, то есть не сохраняет порядок равных элементов.

**Сложность**:

* Лучшее время выполнения: O(n*log n)
* Среднее время выполнения: O(n*log n)
* Худшее время выполнения: O(n^2)

![image.png](https://upload.wikimedia.org/wikipedia/commons/6/6a/Sorting_quicksort_anim.gif)

In [None]:
def quicksort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)

In [None]:
print(quicksort(arr))

[1, 22, 154, 233, 237, 261, 290, 334, 375, 378, 394, 426, 431, 497, 524, 539, 592, 609, 610, 653, 688, 718, 738, 787, 808, 880, 881, 890, 892, 898]


### **Сортировка расческой**

Её идея состоит в том, чтобы «устранить» элементы с небольшими значения в конце массива, которые замедляют работу алгоритма. Если при пузырьковой и шейкерной сортировках при переборе массива сравниваются соседние элементы, то при «расчёсывании» сначала берётся достаточно большое расстояние между сравниваемыми значениями, а потом оно сужается вплоть до минимального.

**Достоинства**:

* Более быстрый, чем сортировка пузырьком, когда массив частично отсортирован.
* Не использует дополнительную память для сортировки.

**Недостатки**:

* Неустойчивая, то есть не сохраняет порядок равных элементов.
* Сложнее реализовать и понять, чем некоторые другие алгоритмы сортировки.

**Сложность**:

* Лучшее время выполнения: O(n*log n)
* Среднее время выполнения: O(n^2)
* Худшее время выполнения: O(n^2)

![Alt Text](https://upload.wikimedia.org/wikipedia/commons/4/46/Comb_sort_demo.gif)

In [None]:
def combsort(arr):

    gap = len(arr)
    shrink = 1.3
    sorted = False

    while not sorted:
        gap = int(gap / shrink)
        if gap <= 1:
            gap = 1
            sorted = True
        i = 0

        while i + gap < len(arr):
            if arr[i] > arr[i + gap]:
                arr[i], arr[i + gap] = arr[i + gap], arr[i]
                sorted = False
            i += 1

    return arr

In [None]:
print(combsort(arr))

[1, 22, 154, 233, 237, 261, 290, 334, 375, 378, 394, 426, 431, 497, 524, 539, 592, 609, 610, 653, 688, 718, 738, 787, 808, 880, 881, 890, 892, 898]


Сравним время

In [None]:
arr = [random.randint(0, 1000) for _ in range(10000)]

quicksort_time = timeit.timeit(lambda: quicksort(arr), number=100)
combsort_time = timeit.timeit(lambda: combsort(arr), number=100)

print(f"Время выполнения быстрой сортировки: {quicksort_time:.5f} секунд")
print(f"Время выполнения сортировки расческой: {combsort_time:.5f} секунд")

Время выполнения быстрой сортировки: 5.33544 секунд
Время выполнения сортировки расческой: 13.71884 секунд


Можно заметить, что быстрая сортировка в 3 раза быстрее расчески, это связано с тем, что быстрая сортировка имеет сложность **O(n*log(n))**, что делает ее более эффективной, чем сортировка расческой со сложностью **O(n^2)**. Соответственно, быстрая сортировка может справляться с большими массивами данных быстрее, чем сортировка расческой.

## **Задание 2**
​Изучить блочную, пирамидальную и сортировку слиянием. Написать соответствующие программы.

### **Блочная сортировка**
Блочная сортировка основана на идее разбиения исходного списка на несколько блоков, которые затем сортируются отдельно друг от друга. Затем блоки объединяются в единый упорядоченный список. Она может быть эффективна для сортировки больших списков с повторяющимися элементами. 

**Достоинства**:

* Может быть быстрее, чем некоторые другие алгоритмы сортировки, когда у элементов есть определенный диапазон значений.
* Устойчив, то есть сохраняет порядок равных элементов.

**Недостатки**:

* Требует дополнительной памяти для сортировки.
* Неэффективна на элементах с широким диапазоном значений.

**Сложность**:

* Лучшее время выполнения: O(n+k), где k - количество блоков.
* Среднее время выполнения: O(n+k), где k - количество блоков.
* Худшее время выполнения: O(n^2), когда все элементы попадают в один блок.

In [None]:
def bucket_sort(arr, bucket_size=3):
    if len(arr) == 0:
        return arr

    # Находим минимальный и максимальный элементы в списке
    min_value, max_value = min(arr), max(arr)

    # Определяем количество блоков, которые будут использоваться для сортировки
    bucket_count = (max_value - min_value) // bucket_size + 1
    buckets = [[] for _ in range(bucket_count)]

    # Распределяем элементы списка по соответствующим блокам
    for i in range(len(arr)):
        buckets[(arr[i] - min_value) // bucket_size].append(arr[i]) # Вычитаем минимальное значение для того, чтобы избежать ситуации когда индекс выходит за диапазон 

    # Сортируем каждый блок и объединяем их в единый список
    result = []
    for i in range(bucket_count):
        if bucket_size == 1:
            sub_arr = buckets[i]
        else:
            sub_arr = bucket_sort(buckets[i], bucket_size-1)

        result += sub_arr

    return result



In [None]:
arr = [4, 7, 2, 6, 1, 8, 5, 3, 9, 10]
sorted_arr = bucket_sort(arr)
print(sorted_arr)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


### **Сортировка слиянием**
Он состоит в разбиении исходного списка на две равные части, сортировке каждой части отдельно и объединении двух упорядоченных частей в один отсортированный список. Этот процесс повторяется рекурсивно для каждой половины, пока весь список не будет отсортирован. Сложность - **O(n*log n)**

**Достоинства**:

* Устойчив, то есть сохраняет порядок равных элементов.
* Гарантированно работает за O(n*log n) времени в худшем случае.

**Недостатки**:

* Требует дополнительную память для сортировки.
* Может быть менее эффективной, чем быстрая сортировка или пирамидальная сортировка на небольших наборах данных.

**Сложность**:

* Лучшее время выполнения: O(n*log n)
* Среднее время выполнения: O(n*log n)
* Худшее время выполнения: O(n*log n)


![image](https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif)

In [None]:
def merge_sort(arr):
    if len(arr) <= 1:
        return arr

    mid = len(arr) // 2
    left = merge_sort(arr[:mid])
    right = merge_sort(arr[mid:])

    return merge(left, right)

def merge(left, right):
    result = []
    i, j = 0, 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1

    result += left[i:]
    result += right[j:]

    return result

In [None]:
arr = [4, 7, 2, 6, 1, 8, 5, 3, 9, 10]
sorted_arr = merge_sort(arr)
print(sorted_arr)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


### **Пирамидальная сортировка**


**Достоинства**:

* Устойчив, то есть сохраняет порядок равных элементов.
* Эффективна на больших наборах данных и имеет лучшую производительность, чем быстрая сортировка в худшем случае.

**Недостатки**:

* Требует дополнительную память для сортировки.
* Менее эффективна, чем быстрая сортировка на небольших наборах данных.

**Сложность**:

* Лучшее время выполнения: O(n*log n)
* Среднее время выполнения: O(n*log n)
* Худшее время выполнения: O(n*log n)

![image](https://pythonist.ru/wp-content/uploads/2020/05/heap_sort_example.gif)

In [None]:
def heapify(arr, n, i):
    largest = i 
    l = 2 * i + 1     
    r = 2 * i + 2     
  
    if l < n and arr[i] < arr[l]:
        largest = l
  
    if r < n and arr[largest] < arr[r]:
        largest = r
  
    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]  # меняем местами элементы
        heapify(arr, n, largest)
  
  
def heapSort(arr):
    n = len(arr)
  
    for i in range(n, -1, -1):
        heapify(arr, n, i)
  
    for i in range(n-1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i]  # меняем местами первый и последний элементы
        heapify(arr, i, 0)

In [None]:
arr = [4, 7, 2, 6, 1, 8, 5, 3, 9, 10]
heapSort(arr)
print(arr)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


In [None]:
arr = [random.randint(0, 1000) for _ in range(10000)]

bucket_sort_time = timeit.timeit(lambda: bucket_sort(arr), number=100)
merge_sort_time = timeit.timeit(lambda: merge_sort(arr), number=100)
heapsort_time = timeit.timeit(lambda: heapSort(arr), number=100)

print(f"Время выполнения блочной сортировки: {bucket_sort_time:.5f} секунд")
print(f"Время выполнения сортировки слиянием: {merge_sort_time:.5f} секунд")
print(f"Время выполнения пирамидальной сортировки: {heapsort_time:.5f} секунд")

Время выполнения блочной сортировки: 0.79057 секунд
Время выполнения сортировки слиянием: 4.72267 секунд
Время выполнения пирамидальной сортировки: 9.36367 секунд


## **Задание 3**
Оцените достоинства, недостатки и сложность изученных методов сортировок.

In [None]:
arr = [random.randint(0, 1000) for _ in range(10000)]

quicksort_time = timeit.timeit(lambda: quicksort(arr), number=100)
combsort_time = timeit.timeit(lambda: combsort(arr), number=100)

print(f"Время выполнения быстрой сортировки: {quicksort_time:.5f} секунд")
print(f"Время выполнения сортировки расческой: {combsort_time:.5f} секунд")

bucket_sort_time = timeit.timeit(lambda: bucket_sort(arr), number=100)
merge_sort_time = timeit.timeit(lambda: merge_sort(arr), number=100)
heapsort_time = timeit.timeit(lambda: heapSort(arr), number=100)

print(f"Время выполнения блочной сортировки: {bucket_sort_time:.5f} секунд")
print(f"Время выполнения сортировки слиянием: {merge_sort_time:.5f} секунд")
print(f"Время выполнения пирамидальной сортировки: {heapsort_time:.5f} секунд")

Время выполнения быстрой сортировки: 2.11139 секунд
Время выполнения сортировки расческой: 6.42885 секунд
Время выполнения блочной сортировки: 1.14167 секунд
Время выполнения сортировки слиянием: 4.24257 секунд
Время выполнения пирамидальной сортировки: 8.36554 секунд
