## Квадратичные сортировки.


### Постановка задачи:  
  
Дан массив целых чисел длины $n$. Нужно отсортировать его по неубыванию.  
Рассмотрим несколько подходов решения этой задачи за $O(N^2)$.  
  
Массив $a$ отсортирован по неубыванию, если выполняется следующее условие:  
  
  $a_1\leq a_2\leq a_3 \leq \cdots \leq a_{n-1} \leq a_n$

### 1. Сортировка пузырьком.

Перед тем, как излагать этот метод сортировки, внимательно прислушаемся к одному небольшому примечанию. Массив упорядочен по возрастанию, если **меньшие числа в нем стоят раньше больших**. Чем меньше число, тем раньше оно должно стоять в массиве, чем больше число — тем позже. Другими словами, чем больше число, тем больше его номер в массиве (индекс).

Если мы последовательно рассмотрим все пары соседних чисел, и в каждой из них это свойство выполняется, то массив можно считать упорядоченным.

Именно на этом и базируется основная идея сортировки методом пузырька (также называемого методом обмена). Будем сравнивать пары **соседних** элементов массива. Если в какой-то паре большее число стоит левее меньшего, то их надо поменять местами. 

In [2]:
a = [3, 2, 6, 8, 24, 19, 7]

In [4]:
def BubbleSort(a):
    for j in range(len(a) - 1):
        for i in range(len(a) - 1):
            if a[i] > a[i + 1]:
                a[i], a[i + 1] = a[i + 1], a[i] 


print(a)

[2, 3, 6, 7, 8, 19, 24]


### Модернизация сортировки методом пузырька
Приведем пару соображений по оптимизации написанного кода. Представим себе, что у нас есть массив на два миллиона чисел, и мы уже сделали миллион проходов. Это значит, что как минимум миллион чисел в массиве уже стоят на своих законных местах в конце массива. Следовательно, нет никакого смысла проходить правую половину массива, потому что там никаких изменений точно уже не будет. Итак, если на первом проходе мы делаем $n - 1$  сравнение, то на втором достаточно $n - 2$, на третьем  достаточно  $n - 3$ и так далее по мере увеличения количества чисел, которые стоят на своих местах. Таким образом кусочек программы, отвечающий за сортировку можно переписать так:

In [None]:
def BubbleSort(a):
    for j in range(len(a) - 1):
        for i in range(len(a) - 1 - j):
            if a[i] > a[i + 1]:
                a[i], a[i + 1] = a[i + 1], a[i] 

Второе соображение для оптимизации метода простого обмена основано на таком утверждении: если за полный проход в массиве не сделано ни одной перестановки, то его можно считать отсортированным. Что значит «не сделано ни одной перестановки»? Это значит, что все пары соседних чисел расположены «правильно», то есть большее число идет позже меньшего, поэтому они в перестановках не нуждаются. Это позволяет значительно сократить время в случаях, когда более или менее повезло с исходными данными.

Например, в массиве 8, 1, 2, 3, 4, 5, 6 будет вообще достаточно одного прохода, чтобы вытолкнуть восьмерку на последнее место. 

Существенных изменений в структуре программы не будет – как был двойной цикл, так и остался. Просто внешний цикл будет заменен на цикл с условием. Программа в этом случае может выглядеть, например, так:

In [None]:
def BubbleSort(A):
    j = len(A) - 1
    f = True
    while f:
        f = False
        for i in range(0, j):
            if A[i] > A[i + 1]:
                A[i], A[i + 1] = A[i + 1], A[i]
                f = True
        j -= 1

### 2. Сортировка вставками.

Сортировка вставками использует такой инвариант: первые элементы списка, то есть срез $A[:i]$ уже отсортирован. А вот как устроен алгоритм добавления $i$-го элемента к уже отсортированной части. Здесь берется элемент $A[i]$ и добавляется к уже отсортированной части списка. Например, пусть $i = 5$ и срез $A[:i] = [1, 4, 6, 8, 8]$, а значение $A[i] == 5$. Тогда элемент $A[i] == 5$ нужно поставить после элемента $A[1] == 4$, а все элементы, которые больше $5$, сдвинуть вправо на $1$. Получится cрез $A[:i + 1] = [1, 4, 5, 6, 8, 8]$. Таким образом, при вставке элемента $A[i]$ в срез $A[:i]$ так, чтобы в результате получился упорядоченный срез, все элементы, которые больше $A[i]$ будут двигаться вправо на одну позицию. А в освободившуюся позицию и будет вставлен элемент $A[i]$.
При этом значение $A[i]$ нужно сохранить в переменной, т. к. на место элемента $A[i]$, возможно, будет записан элемент $A[i – 1]$.

Получаем следующий алгоритм:

In [5]:
a = [3, 2, 6, 8, 24, 19, 7]

In [6]:
def InsertionSort(A): 
    for i in range(1, len(A)): 
        new_elem = A[i]                               # В new_elem сохранили значение A[i]  
        j = i - 1                                     # Начиная с элемента A[i - 1]
        while j >= 0 and A[j] > new_elem:             # все элементы, которые больше new_elem  
            A[j + 1] = A[j]                           # сдвигаем вправо на 1
            j -= 1                                     
        A[j + 1] = new_elem                           # На свободное место записываем new_elem

In [8]:
InsertionSort(a)
print(a)

[2, 3, 6, 7, 8, 19, 24]


Посчитаем сложность алгоритма сортировки вставками. Следует отметить, что если массив уже упорядочен, то все элементы останутся на своем месте и вложенный цикл не будет выполнен ни разу. В этом случае сложность алгоритма сортировки вставками — линейная, т. е. $O(N)$ . Аналогично, если массив «почти упорядочен», то есть для превращения его в упорядоченный нужно поменять местами несколько соседних или близких элементов, то сложность также будет линейной.

Но если массив упорядочен в обратном порядке, например, каждый элемент больше следующего, а необходимо добиться обратного порядка, то каждый элемент будет перемещаться максимально влево, т. е. до самой крайней позиции. В этом случае количество выполняемых перемещений будет равно $1 + 2 + 3 + ... + (N - 1) + N = \frac{N\cdot  (N + 1)}{2} = O(N^2)$.

Итак, мы видим, что сложность алгоритма сортировки вставками сильно зависит от того, «насколько хорошо» отсортирован исходный список. В лучшем случае время работы — линейно, в худшем случае — квадратично. Что же происходит «в среднем», когда массив заполнен числами в случайном порядке?

В этом случае математическое ожидание количества перемещений элементов будет равно половине от числа перемещений в худшем случае (каждый элемент в среднем будет перемещаться не до самого начала списка, а только до середины этого пути), то есть математическое ожидание числа перемещений будет равно .

То есть в среднем этот алгоритм также имеет квадратичную сложность.

Преимущество этого алгоритма — возможность добавлять элементы в уже отсортированный массив, пересортировывая его за $O(N)$ для каждого добавляемого элемента.

### 3. Метод минимума.

Сортировка массива выбором осуществляется так:

+ находим номер минимального значения в неотсортированной части массива;
+ производим обмен этого значения со значением первой неотсортированной позиции (обмен не нужен, если минимальный элемент уже находится на данной позиции);
+ продолжаем сортировку оставшегося списка, исключив из рассмотрения еще один элемент.

In [None]:
def SelectionSort(A): 
    for i in range(0, len(A) - 1): 
        idx_min = i 
        for j in range(i + 1, len(A)):            
            if A[j] < A[min_idx]:                                   # Среди элементов A[i:] выбираем наименьший 
                idx_min = j                                         # Сохраняем его индекс в переменной idx_min  
        A[i], A[idx_min] = A[idx_min], A[i]                         # Теперь поставим A[idx_min] на место A[i]


Можно модифицировать алгоритм — не сохранять индекс наименьшего из просмотренных элементов, а при просмотре элементов в срезе $A[i:]$ обменивать очередной элемент $A[j]$ местами с $A[i]$, если $A[j]<A[i]$:

In [None]:
def SelectionSort(A): 
    for i in range(0, len(A) - 1): 
        for j in range(i + 1, len(A)): 
            if A[j] < A[i]: 
                A[i], A[j] = A[j], A[i]

Посчитаем сложность этого алгоритма. Пусть список содержит $n$ элементов. Сначала нужно найти минимум среди $n$ элементов списка, что потребует $n$ операций. Потом нужно найти наименьший из $n-1$ элемента, на это нужно $n-1$ операция. Потом нужно $n-2$ операции и т. д. Общее число операций равно $N + (n - 1) + ... + 3 + 2 + 1= \frac{N\cdot  (N + 1)}{2} = O(N^2)$.

Таким образом, сортировка выбором — квадратичный алгоритм, время его работы пропорционально квадрату от размера списка.
