# Алгоритм Quick Select

Алгоритм Quick Select - алгоритм, решающий задачу о нахождении N-ного наименьшего/наибольшего числа в неотсортированном массиве.

Самым простым способом решения данной задачи является сортировка и последующее извлечение числа с заданным индексом из масссива. 
Время работы такого алгоритма составляет O(n * log n)

В свою очередь, время работы Quick Select в худшем случае составляет O(n^2), а в лучшем - O(n).

Quick Select применяется для решения следующих задач:
1) Нахождение медианы статистических данных
2) Нахождение k-того процентиля
3) Отбор значимых признаков для машинного обучения
4) Вычисление метрик (составление рейтингов игроков)

Алгоритм Quick Select состоит из нескольких шагов (рассматривается поиск k-того большего элемента, для наглядности индексирование элементов начинается с 1):
1) Выбираем "элемент-разделитель" (aka <code>pivot</code>, aka опорный элемент, обычно последний элемент массива);
2) Переставляем элементы массива так, чтобы все элементы, большие разделителя, оказались слева от него, а меньшие - справа; (мысленно разделяем массив на два подмассива)
3) Если "разделитель" оказался на <code>k</code>-той позиции - выводим данный элемент;
4) Если "разделитель" оказался на месте < <code>k</code>, тогда повторяем вышеописанные процедуры для подмассива элементов справа от "разделителя", уменьшив на <code>k</code> его позицию. (Например мы нашли 2 больший элемент, а нам нужен 5 - тогда ищем начиная с третьего элемента при <code>k</code>=3)
5) Если "разделитель" оказался на месте > <code>k</code>, тогда ищем в подмассиве элементов слева от него. (Например мы нашли 7 наибольший, а искали 5. Тогда ищем до 7 элемента с <code>k</code>=5)

Quick Select имеет общую с алгоритмом Quick Sort функцию <code>partition</code>, которая передвигает элементы относительно <code>pivot</code>. Логично, ведь автором этих двух алгоритмов является один и тот же человек, а в сборниках алгоритмов их номера зачастую отличаются лишь на единицу. Для начала рассмотрим работу функции <code>partition</code>.

## Partition-функция

Данная функция несёт в себе интересный смысл: она переставляет все элементы так, чтобы элемент <code>pivot</code> оказался на месте, которое бы он занял в полностью отсортированном массиве.

На вход данная функция принимает три аргумента: 
1) <code>arr</code> - исходный массив;
2) <code>b</code> - начало подмассива;
3) <code>e</code> - конец подмассива;
   
Вкратце, Partition-функция выполняет обход подмассива исходного массива в заданном промежутке и перестанавливает местами элементы подмассива так, чтобы по правую сторону от <code>pivot</code> оказались элементы меньшие, чем сам <code>pivot</code>, а слева - большие. При этом между собой элементы не отсортированы по возрастанию или убыванию.<br>
Например в результате работы данного алгоритма из [15, 10, 4, 3, 20, **7**] получится [15, 10, 20, **7**, 4, 3].

Далее будут использоваться следующие обозначения:<br>
<code>b</code> - начало подмассива <br>
<code>e</code> - конец подмассива <br>
<code>i</code> - индекс потенциального элемента для перестановки (его смысл: элемент продшествующий данному **точно** большe pivot)<br>
<code>j</code> - индекс текущего элемента при обходе подмассива<br>

1) Назначаем переменной <code>pivot</code> значение последнего элемента подмассива, а переменной <code>i</code> назначаем индекс первого элемента подмассива
2) Проходим по каждому элементу подмассива
3) Если данный элемент больше или равен <code>pivot</code>, то меняем местами этот элемент с <code>i</code>-тым элементом. Затем увеличиваем индекс <code>i</code>.
4) Пройдя все элементы подмассива меняем местами <code>pivot</code> и <code>i</code>-тый элемент

### Код функции

In [64]:
# considers the last element (e) as pivot  
# and moves all smaller elements to rigth of  
# it and greater elements to left 
def partition(arr, b, e): 
    pivot = arr[e] 
    i = b 
    for j in range(b, e): 
        if arr[j] >= pivot: 
            arr[i], arr[j] = arr[j], arr[i] 
            i += 1
              
    arr[i], arr[e] = arr[e], arr[i] 
    return i 

## Реализация алгоритма Quick Select

### Код алгоритма Quick Select

In [71]:
# arr - array
# b - first element's index in observated massive (begin)
# e - last element's index in observated massive (end)
# k - number of k-th largest element
def quickSelect(arr, b, e, k): 
    # if k is smaller than number of 
    # elements in array 
    if (k > 0 and k <= e - b + 1): 
  
        # Partition the array around last 
        # element and get position of pivot 
        # element in sorted array 
        index = partition(arr, b, e) 
  
        # if position is same as k 
        if (index - b == k - 1): 
            return arr[index] 
  
        # If position is more, recur  
        # for left subarray  
        if (index - b > k - 1): 
            return quickSelect(arr, b, index - 1, k) 
  
        # Else recur for right subarray  
        return quickSelect(arr, index + 1, e,  
                            k - index + b - 1) 
    print("Index out of bound") 

## Решение прикладной задачи

Дан массив со значениями почасовой зарплаты 7-ми сотрудников. Найти вторую по величине зарплату.

In [72]:
arr = [200, 300, 500, 100, 10, 400, 200]
n = len(arr) - 1 
k = 2

print ("Изначальный массив:", arr)
print("Отсортированный массив:", sorted(arr), end='\n\n') #Для наглядности
ans = quickSelect(arr, 0, n, k)
print(f"Вторая по величине зарплата:", ans) 


Изначальный массив: [200, 300, 500, 100, 10, 400, 200]
Отсортированный массив: [10, 100, 200, 200, 300, 400, 500]

Вторая по величине зарплата: 400
