In [None]:
import random
test_data = random.sample(range(-100,100), 200)

In [22]:
import math

## Сортрировка пузырьком

Это самый простой алгоритм сортировки. В процессе его выполнения мы перебираем наш список и на каждой итерации сравниваем элементы попарно. При необходимости элементы меняются местами, чтобы больший элемент отправлялся в конец списка. Сложность алгоритма:
O(n<sup>2</sup>)

In [1]:
def buble_sort(arr: list) -> list:
  n = len(arr)
  for i in range(n-1):
    for j in range(n-i-1):
      if arr[j] > arr[j+1]:
        arr[j], arr[j+1] = arr[j+1], arr[j]
  return arr

In [14]:
%%timeit
buble_sort(test_data)

1.02 ms ± 32.2 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


## Сортировка выбором

В этом алгоритме мы создаем два сегмента нашего списка: один отсортированный, а другой несортированный.

В процессе выполнения алгоритма мы каждый раз удаляем самый маленький элемент из несортированного сегмента списка и добавляем его в отсортированный сегмент. Мы не меняем местами промежуточные элементы. Следовательно, этот алгоритм сортирует массив с минимальным количеством перестановок. Сложность алгоритма:
O(n<sup>2</sup>)

In [18]:
def selectionSort(arr: list) -> list:
  for i in range(len(arr)-1):
    min_idx = i
    for idx in range(i + 1, len(arr)-1):
      if arr[idx] < arr[min_idx]:
        min_idx = idx
    arr[i], arr[min_idx] = arr[min_idx], arr[i]
  return arr

In [19]:
%%timeit
selectionSort(test_data)

922 µs ± 195 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


##Сортировка вставками

Подобно алгоритму сортировки выбором, мы делим наш список на две части. Далее мы перебираем неотсортированную часть и вставляем каждый элемент из данного сегмента на его правильное место в отсортированной части списка. Сложность алгоритма: O(n<sup>2</sup>)

In [20]:
def insertionSort(array):
  for i in range(1, len(array)):
    key = array[i]
    j = i-1
    while array[j] > key and j >= 0:
      array[j+1] = array[j]
      j -= 1
    array[j+1] = key
  return array

In [21]:
%%timeit
insertionSort(test_data)

17.4 µs ± 399 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


##Сортировка Шелла

Сортировка Шелла является оптимизированным вариантом сортировки вставками.

Оптимизация достигается путем сравнения не только соседних элементов, но и элементов на определенном расстоянии, которое в течении работы алгоритма уменьшается. На последней итерации это расстояние равно 1. После этого алгоритм становится обычным алгоритмом сортировки вставками, что гарантирует правильный результат сортировки.

Но следует отметить один момент: к тому времени, когда это произойдет, наш массив будет почти отсортирован, поэтому итерации будут выполнятся очень быстро.Худшее время выполнения алгоритма: O(n<sup>2</sup>). Лучшее время выполнения алгоритма: O(n*log<sup>2</sup>n)

In [23]:
def shellSort(array):
  n = len(array)
  k = int(math.log2(n))
  interval = 2**k -1
  while interval > 0:
    for i in range(interval, n):
      temp = array[i]
      j = i
      while j >= interval and array[j - interval] > temp:
        array[j] = array[j - interval]
        j -= interval
      array[j] = temp
    k -= 1
    interval = 2**k -1
  return array

In [24]:
%%timeit
shellSort(test_data)

111 µs ± 25.7 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


##Сортировка кучей

Как и в двух предыдущих алгоритмах, мы создаем два сегмента списка: отсортированный и несортированный.

В данном алгоритме для эффективного нахождения максимального элемента в неотсортированной части списка мы используем структуру данных «куча».

Метод heapify в примере кода использует рекурсию для получения элемента с максимальным значением на вершине. Сложность алгоритма: O(n*log<sup>2</sup>n)

In [25]:
def heapify(array, n, i):
  largest = i
  l = 2 * i + 1
  r = 2 * i + 2

  if l < n and array[i] < array[l]:
    largest = l
  if r < n and array[largest] < array[r]:
    largest = r

  if largest != i:
    array[i], array[largest] = array[largest], array[i]
    heapify(array, n, largest)

def heapSort(array):
  n = len(array)
  for i in range(n//2, -1, -1):
    heapify(array, n, i)
  for i in range(n-1, 0, -1):
    array[i], array[0] = array[0], array[i]
    heapify(array, i, 0)
  return array

In [26]:
%%timeit
heapSort(test_data)

410 µs ± 7.5 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


##Сортировка слиянием

Этот алгоритм работает по принципу «разделяй и властвуй».

Здесь мы делим список ровно пополам и продолжаем это делать, пока в нем не останется только один элемент. Затем мы объединяем уже упорядоченные части нашего списка. Мы продолжаем это делать, пока не получим отсортированный список со всеми элементами несортированного входного списка. Сложность алгоритма: O(n*log<sup>2</sup>n)

In [29]:
def mergeSort(nums: list) -> list:
  if len(nums)==1:
    return nums
  mid = (len(nums) - 1) // 2
  lst1 = mergeSort(nums[:mid+1])
  lst2 = mergeSort(nums[mid+1:])
  result = merge(lst1, lst2)
  return result
def merge(lst1: list, lst2: list) -> list:
  lst = []
  i, j = 0, 0
  while(i <= len(lst1) - 1 and j <= len(lst2) - 1):
    if lst1[i] < lst2[j]:
      lst.append(lst1[i])
      i += 1
    else:
      lst.append(lst2[j])
      j += 1
    if i > len(lst1) - 1:
      while(j <= len(lst2) - 1):
        lst.append(lst2[j])
        j += 1
    else:
      while(i <= len(lst1) - 1):
        lst.append(lst1[i])
        i += 1
    return lst

In [30]:
%%timeit
mergeSort(test_data)

174 µs ± 24.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


##Быстрая сортировка


В этом алгоритме мы разбиваем список при помощи опорного элемента, сортируя значения вокруг него.

В нашей реализации мы выбрали опорным элементом последний элемент массива. Наилучшая производительность достигается тогда, когда опорный элемент делит список примерно пополам. Сложность алгоритма: O(n*log<sup>2</sup>n)

In [31]:
def quickSort(arr: list) -> list:
  if len(arr)> 1:
    pivot=arr.pop()
    grtr_lst, equal_lst, smlr_lst = [], [pivot], []
    for item in arr:
      if item == pivot:
        equal_lst.append(item)
      elif item > pivot:
        grtr_lst.append(item)
      else:
        smlr_lst.append(item)
    return (quickSort(arr) + equal_lst + quickSort(arr))
  else:
    return arr

In [32]:
%%timeit
quickSort(test_data)

85.2 ns ± 2.71 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


##Сортировка подсчетом

Этот алгоритм не производит сравнение элементов. Для сортировки используются математические свойства целых чисел. Мы подсчитываем вхождения числа в массиве и сохраняем результат во вспомогательном массиве, где индексу соответствует значение ключа. Сложность алгоритма: O(n)

In [35]:
def sortArray(nums: list) -> list:
  i_lower_bound , upper_bound = min(nums), max(nums)
  lower_bound = i_lower_bound
  if i_lower_bound < 0:
    lb = abs(i_lower_bound)
    nums = [item + lb for item in nums]
    lower_bound , upper_bound = min(nums), max(nums)

  counter_nums = [0]*(upper_bound-lower_bound+1)
  for item in nums:
    counter_nums[item-lower_bound] += 1
  pos = 0
  for idx, item in enumerate(counter_nums):
    num = idx + lower_bound
    for i in range(item):
      nums[pos] = num
      pos += 1
  if i_lower_bound < 0:
    lb = abs(i_lower_bound)
    nums = [item - lb for item in nums]
  return nums

In [36]:
%%timeit
sortArray(test_data)

2.52 µs ± 30.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


##Поразрядная сортировка

Это алгоритм сортировки, который разделяет числа на разряды (цифры) и сортирует их последовательно по каждому разряду. Процесс начинается с наименее значимого разряда и заканчивается наиболее значимым разрядом.
В каждой итерации поразрядной сортировки числа группируются по значениям определенного разряда, например, единиц, десятков, сотен и так далее. Затем числа сортируются внутри каждой группы, сохраняя исходный порядок внутри группы. Этот процесс повторяется для каждого разряда, пока все разряды не будут рассмотрены.
Поразрядная сортировка эффективна для сортировки чисел с большими разрядностями, так как она выполняет сортировку по одному разряду за раз, и может быть адаптирована для работы с различными системами счисления. Однако она может быть не так эффективна для маленьких массивов или чисел с одинаковыми разрядами. Сложность алгоритма: O(w*n), где w - бит, требуемых для хранения каждого ключа

In [37]:
def radix_sort(arr: list) -> list:
  max_digits = max([len(str(x)) for x in arr])
  base = 10
  bins = [[] for _ in range(base)]
  for i in range(0, max_digits):
    for x in arr:
      digit = (x // base ** i) % base
      bins[digit].append(x)
    arr = [x for queue in bins for x in queue]
  return arr

In [38]:
%%timeit
radix_sort(test_data)

5.73 µs ± 59.7 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)


##Блочная сортировка

это алгоритм сортировки, основанный на подсчете количества элементов с определенными значениями. В отличие от других алгоритмов сортировки, который работают сравнением элементов, блочная сортировка не использует сравнения. Блочная сортировка является эффективным алгоритмом сортировки при наличии ограниченного диапазона значений входных элементов. Однако, она потребляет дополнительную память для хранения групп счетчиков и требует знания диапазона значений элементов заранее. O(n + k), где n - количество элементов во входном массиве, а k - количество уникальных значений в массиве.

In [39]:
def bucket_sort(arr: list) -> list:
  max_value = max(arr)
  size = max_value/len(arr)
  buckets_list= []
  for x in range(len(arr)):
    buckets_list.append([])
  for i in range(len(arr)):
    j = int (arr[i] / size)
    if j != len (arr):
      buckets_list[j].append(arr[i])
    else:
      buckets_list[len(arr) - 1].append(arr[i])
  for z in range(len(arr)):
    insertionSort(buckets_list[z])
  final_output = []
  for x in range(len (arr)):
    final_output = final_output + buckets_list[x]
  return final_output

In [40]:
%%timeit
bucket_sort(test_data)

1.23 µs ± 246 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


#Вывод

Рассмотрев 10 алгоритмов мы можем сделать вывод что с точки зрения скорости наилучшим алгоритмом является блочная сортировка.
