# Сортировки
Очень часто разработчику требуется каким-либо образом упорядочить набор данных, то есть преобразовать данные таким образом, чтобы любой элемент был больше (или меньше) чем предыдущий.

Есть много различных подходов к решению этой задачи. Здесь мы рассмотрим наиболее популярные алгоритмы сортировок.

# Сортировка вставками
Самым простым для понимания и реализации является алгоритм сортировки вставками.

Суть этого алгоритма такова:
* Если у нас есть уже отсортированный массив, то для того, чтобы вставить в него другое число, достаточно сдвинуть вправо все элементы, которые больше этого числа и в образовавшийся пробел вставить само число. Тогда получившийся массив, очевидно, также будет отсортирован.
* Массив из одного числа, очевидно, отсортирован.
* Итого, мы можем идти по массиву начиная со второго элемента. Далее будем вставлять текущий элемент в подмассив, который оканчивается до этого элемента, как в отсортированный массив. Таким образом, когда мы вставим последний элемент, то мы получим полностью отсортированный массив.


<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/0/0f/Insertion-sort-example-300px.gif/280px-Insertion-sort-example-300px.gif" \>

In [1]:
#include <iostream>
#include <vector>
#include <chrono>
#include <cstdlib>




In [2]:
typedef std::chrono::milliseconds Milliseconds;
typedef std::chrono::steady_clock Clock;
typedef Clock::time_point Time;



In [3]:
srand(time(NULL)); // для генерации чисел

(void) @0x7ffd31d1bc10


In [4]:
void gen(std::vector<int> & array, int n) {
    array.clear();
    for(int i = 0; i < n; i++) {
        array.push_back(rand()%n);
    }
} 



In [5]:
void print(std::vector<int> & array){
    for(auto i : array){
        std::cout << i << ' ';
    }
    std::cout << std::endl;
}
// вспомогательные функции, чтобы удобнее работать с массивом



In [6]:
std::vector<int> data;
gen(data, 10);
print(data);

6 5 4 5 0 5 4 4 5 5 


(void) @0x7ffd31d1bc10


In [7]:
void insert_sort(std::vector<int> & array){
    for(int i = 1; i < array.size(); i++) { // идем начиная со второго элемента
        int inserted_element = array[i]; // вставляемый элемент
        int j = i;
        while(j > 0 and inserted_element < array[j-1]) {
            array[j] = array[j-1]; // сдвигаем все элементы, которые больше вставляемого
            j--;
        }
        array[j] = inserted_element; // в образовавшийся пробел вставляем элемент
    }
}



In [8]:
insert_sort(data);
print(data);

0 4 4 4 5 5 5 5 5 6 


(void) @0x7ffd31d1bc10


In [9]:
gen(data, 10000);
Time start = Clock::now();
insert_sort(data);
unsigned long t = std::chrono::duration_cast<Milliseconds>(Clock::now() - start).count();
std::cout << "Массив из 10000 чисел отсортировался за " << t << " миллисекунд" << std::endl;

Массив из 10000 чисел отсортировался за 11710 миллисекунд


(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fe32d8516e0


Так как алгоритм крайне простой и решает задачу "в лоб", то понятно, что это не самый эффективный алгоритм. Хотя у него есть и некоторые приятные особенности. Давайте проанализируем, сколько действий необходимо сделать алгоритму.

* Если массив находится в обратном порядке, то тогда первый элемент вставится за 1 действие. Второй элемент потребует уже 2 сдвига. 3 - 3 сдвига и так далее. Таким образом всего действий будет 1+2+3+...+N = N\*(N-1)/2. Что уже достаточно много.
* Если массив находится в отсортированном состоянии, то тогда за один проход мы сразу определяем, что массив отсортирован и закончит сортировку. То есть всего N действий. И это очень неплохое свойство алгоритма.
* Во всех остальных будет что-то среднее по количеству действий. Грубо говоря количество действий зависит от степени отсортированности массива.

# Пузырек

Еще одним простым алгоритмом сортировки явояеися алгоритм сортировки пузырьком.

Суть его заключается в следующем:
* Если сравнить два соседних элемента и они будут не в том порядке, то очевидно, их нужно поменять местами
* Если самый большой элемент будет находитсья в начале, то для того, чтобы он оказался в самом конце, где ему и место, необходимо N таких вот обменов (N - размер массива). Таким образом после одного такого прохода по всему массиву, максимальный элемент окажется на своем месте. 
* Осталось проделать эти же действия, только для массива, без последнего элемента. Если сделать так еще N-1 раз, то тогда все элементы окажутся на своих местах

Таким образом, мы можешь отсортировать массив за N*N действий

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/c/c8/Bubble-sort-example-300px.gif/220px-Bubble-sort-example-300px.gif"\>

In [10]:
void bubble_sort(std::vector<int> & array) {
    for(int i = array.size()-1; i>= 0; i--) { // N внешних итераций
        for(int j = 0; j < i+1; j++) { // проход по всему массиву и соответствующий обмен
            if(array[j] > array[j+1]) { // меняем двух соседних, если они стоят в неправильном порядке
                int temp = array[j];
                array[j] = array[j+1];
                array[j+1] = temp;
            }
        }
    }
}



In [11]:
gen(data, 10);
print(data);

2 8 0 2 3 2 5 3 6 8 


(void) @0x7ffd31d1bc10


In [12]:
bubble_sort(data);
print(data); // массив отсортирован

0 2 2 2 3 3 5 6 8 8 


(void) @0x7ffd31d1bc10


In [13]:
gen(data, 10000);
start = Clock::now();
bubble_sort(data);
t = std::chrono::duration_cast<Milliseconds>(Clock::now() - start).count();
std::cout << "Массив из 10000 чисел отсортировался за " << t << " миллисекунд" << std::endl;

Массив из 10000 чисел отсортировался за 21955 миллисекунд


(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fe32d8516e0


# Слияние
Как можно заметить, данный алгоритм очень простой и при этой не слишком эффективный - в данной реализации он всегда работает за $N^2$ действий. Таким образом, его целесообразно использовать, если размер данных очень небольшой.

Другой, более быстрый, но при этом все также не слишком сложный для понимания и реализации алгоритм - сортировка слияением. Основная идея такая:
* Разделим массив на две части.
* Если бы они были отсортированы по отдельности, то не составило бы труда отсортировать весь массив - необходимо было бы просто брать соответствующие элементы из обоих подмассивов (слить). Тогда запустим нашу сортировку на обоих подмассивах.
* Если на вход были поданы всего 2 элемента, то очень просто понять, как именно отсортировать этот массив.

<img src="https://upload.wikimedia.org/wikipedia/commons/c/cc/Merge-sort-example-300px.gif"\>

<img src="http://ok-t.ru/studopediaru/baza5/523649652121.files/image041.png"\>

In [14]:
template<class Iter> // используем итераторы
void merge(Iter begin, Iter middle, Iter end){ // сливаем два отсортированных массива [begin; middle) и [middle; end)
    Iter one = begin;
    Iter two = middle;
    std::vector<int> temp;
    while(one != middle or two != end) { // пока не дойдем до обоих концов
        if(one == middle) { // если уже дошли до конца одного
            temp.push_back(*two);
            two++;
            continue;
        }
        if(two == end) { // если уже дошли до конца одного
            temp.push_back(*one);
            one++;
            continue;
        }
        if(*one < *two) { // берем элемент из первого массива, если он меньше
            temp.push_back(*one);
            one++;
            continue;
        } else {         // и их правого, если он меньше
            temp.push_back(*two);
            two++;
            continue;
        }
    }
    for(auto i : temp) { // копируем в исходный массив
        *begin = i;
        begin++;
    }
}



In [15]:
template<class Iter>
void merge_sort(Iter begin, Iter end) {
    if(end - begin <= 2) { // если дошли до маленького массива
        if(end - begin ==2) {
            if(*begin > *(begin+1)) {
                int temp = *begin;
                *begin = *(begin+1);
                *(begin+1) = temp;
            }
        }
        return;
    }
    Iter middle = begin + (end - begin)/2; // делим попалам
    merge_sort(begin, middle); // сортируем левую часть
    merge_sort(middle, end); // и правую
    merge(begin, middle, end); //сливаем
}



In [16]:
gen(data, 10);
print(data);

7 6 5 7 8 9 8 5 4 7 


(void) @0x7ffd31d1bc10


In [17]:
merge_sort(data.begin(), data.end());
print(data);

4 5 5 6 7 7 7 8 8 9 


(void) @0x7ffd31d1bc10


In [18]:
gen(data, 10000);
start = Clock::now();
merge_sort(data.begin(), data.end());
t = std::chrono::duration_cast<Milliseconds>(Clock::now() - start).count();
std::cout << "Массив из 10000 чисел отсортировался за " << t << " миллисекунд" << std::endl;

Массив из 10000 чисел отсортировался за 226 миллисекунд


(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fe32d8516e0


Как можно заметить, данный алгоритм работает существенно быстрее, чем сортировка пузырьком. Однако теперь он требует дополнительную память для слива двух массивов.

Почему же он оказался быстрее? Необходимо посчитать количество действий, производимых алгоритмом:
* На каждом разбиении алгоритму необходимо слить два подмассива. Так как суммарный размер всех подмассивов равен размеру исходного массива, то на каждое разбиение приходится ровно N сравнений.
* Каждый раз мы делим массив ровно на 2 части. Таким образом после k делений размер минимальной порции будет равен N / 2^k. Мы заканчиваем делить, когда размер порции станет равным 2 => N / 2^k = 2 => k = log_2(N) 
* Таким образом, всего действий N \* log(N), что очевидно меньше чем N\*N

# Быстрая сортировка

Как показал предыдущий пример, идея с разбиением всей задачи на подзадачи может значительно улучшить алгоритм.

На схожей идее основывается еще один алгоритм - алгоритм быстрой сортировки (один из самых быстрых алгоритмов сортировки). Его основная идея следующая:

* Если у нас есть два массива A и B, такие, что все элементы из A меньше чем элементы B, то если бы A и B были отсортированы, то массив состоящий из A и B (вначале все елементы из A, затем B) был бы также отсортирован.
* Выберем какой-то элемент t нашего исходного массива. Относительно его перенесем в начало массива все елементы, которые меньше t, и в конец елементы, которые больше t. Таким образом у нам и получатся два подобных массива A и B, разделенные елементом t.
* Вызовем нашу сортировку на этим подмассивах
* Если нашему алгоритму достанется сортировать массив длиннны 1, то он уже не должен ничего делать

<img src="https://upload.wikimedia.org/wikipedia/commons/6/6a/Sorting_quicksort_anim.gif"\>

<img src="https://www.cs.swarthmore.edu/~soni/cs35/f13/Labs/images/06/quickSort.png"\>

In [19]:
template<class Iter>
Iter partition(Iter begin, Iter end, int t) { // функция для разбиения массива на нужные нам подмассивы
    while(begin != end) { // идем с двух сторон, пока не сойдемся
        while( *begin < t ) { // пропускаем все уже корректно стоящие элементы
            ++begin; 
            if(begin == end) return begin; // если сошлись
        }
        do { // симметрочно двигаемся с конца
            --end;
            if(begin == end) return begin;
        } while(*end > t);
        
        int temp = *begin; // меняем местами неправильно стоящие элементы
        *begin = *end;
        *end = temp;
        
        ++begin;
    }
    return begin; // возвращаем на место опорного элемента t в этом массиве (по сути элемент разделения массива)
}



In [20]:
template<class Iter>
void quick_sort(Iter begin, Iter end) {
    if(end - begin <= 1) return ; // один элемент уже отсортирован
    int distance = end - begin; 
    int t = * (begin +(rand() % distance) ); // берем случайный элемент
    Iter middle = partition(begin, end, t); // разбиваем массив
    quick_sort(begin, middle); // сортируем левую часть
    quick_sort(middle, end); // сортируем правую часть
}



In [21]:
gen(data, 10);
print(data);

1 2 8 0 9 9 2 3 9 6 


(void) @0x7ffd31d1bc10


In [22]:
quick_sort(data.begin(), data.end());
print(data);

0 1 2 2 3 6 8 9 9 9 


(void) @0x7ffd31d1bc10


In [23]:
gen(data, 10000);
start = Clock::now();
quick_sort(data.begin(), data.end());
t = std::chrono::duration_cast<Milliseconds>(Clock::now() - start).count();
std::cout << "Массив из 10000 чисел отсортировался за " << t << " миллисекунд" << std::endl;

Массив из 10000 чисел отсортировался за 89 миллисекунд


(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fe32d8516e0


Как и обещалось, этот способ сортировки оказался самым быстрым. Однако не все так одназначно. Давайте посмотрим на то, сколько операций делает алгоритм.

1. Если массив делится примерно на две части (если опорный элемент близок к медиане), то тогда также как и в сортировке слиянием алгоритм сделает около N * log(N) сравнений. Однако будет делать меньше перестановок и лишних копирований, чем сортировка слиянием, из-за чего он и работает быстрее.

2. Однако, если случится так, что мы каждый раз в качестве опорного элемента будем выбирать максимальный (или минимальный), то тогда мы будем делить массив на подмассивы размеров N-1 и 1. Таким образом, алгоритм будет очень похож на сортировку пузырьком и делать около N\*N сравнений, что медленно.

Таким образом, в большинстве случаев, этот алгоритм является оптимальным решением. Однако иногда он может сильно проседать по скорости. Если некоторые оптимизированные версии этого алгоритма, однако в данной лекции они не будут рассматриваться.

Резонно задаться вопросом - насколько быстрым алгоритм сортировки может быть?

Если сортировка работает на сравнениях двух элементов (наиболее общий случай), то современная наука говорит, что быстрее чем N\*log(N) сравнений сделать нельзя. Таким образом, сортировка слияением или быстрая сортировка - это оптимальные алгоритмы для работы с произвольными данными.

# Сортировка подсчетом

Однако, в некоторых случаях, если известны некоторые факты о данных, с которыми мы работает, то можно сортировать гораздо быстрее.

Например, мы знаем, что нам необходимо сортировать натуральные числа. Причем эти числа не очень большие. Тогда можно заметить следующее:

* За один проход по всему массиву можно подсчитать количество каждого элемента в этом массиве
* Натуральные числа упорядочены сами по себе. Таким образом, зная количество каждого числа в массиве, мы можем сразу составить отсортированный массив. Для этого просто пойдем по натуральным числам и для каждого числа добавим его в массив столько раз, сколько он встретился в исходном массиве. В итоге у нас сразу получится отсортированный массив

In [24]:
void count_sort(std::vector<int> & array){
    int maxe = array[0];
    for(int i = 0; i < array.size(); i++) if(array[i] > maxe) maxe = array[i]; // максимальный элемент
    std::vector<int> counts(maxe+1, 0); // массив с подсчетами
    for(int i = 0; i < array.size(); i++) counts[array[i]]++; // подсчитываем
    
    int c = 0;
    for(int i = 0; i < counts.size(); i++) {
        for(int j = 0; j < counts[i]; j++) { // восстанавливаем массив
            array[c] = i;
            c++;
        }
    }
}



In [25]:
gen(data, 10);
print(data);

3 7 3 0 3 4 4 5 7 3 


(void) @0x7ffd31d1bc10


In [26]:
count_sort(data);
print(data);

0 3 3 3 3 4 4 5 7 7 


(void) @0x7ffd31d1bc10


In [27]:
data.clear();
for(int i = 0; i < 10000; i++) {
    data.push_back(rand()%100); // числа небольшие
}
start = Clock::now();
count_sort(data);
t = std::chrono::duration_cast<Milliseconds>(Clock::now() - start).count();
std::cout << "Массив из 10000 чисел отсортировался за " << t << " миллисекунд" << std::endl;

Массив из 10000 чисел отсортировался за 27 миллисекунд


(std::basic_ostream<char, std::char_traits<char> >::__ostream_type &) @0x7fe32d8516e0


Эта сортировка работает быстрее быстрой сортировки, однако она очень узкоспециализирована.
За один проход, она находит максимальный элемент. И еще за один проход она восстанавливает отсортированный массив.
Таким образом всего около 2\*N действий