# Разделяй и властвуй

Общий алгоритм:
- задача разбивается на несколько более простых подзадач
- подзадачи решаются рекурсивно
- из ответов для подзадач строится ответ для исходной задачи

## Бинарный поиск
https://docs.python.org/3/library/bisect.html

### Поиск в неупорядоченном массиве
Описание задачи:
- вход: массив А[1...n], k - искомый ключ
- выход: индекс i, такой что A[i]=k, или -1, если такого i нет

Описание алгоритма решения:
```
для i от 1 до n:
    если A[i] = k:
        вернуть i
вернуть -1
```

### Поиск в упорядоченном массиве
Описание задачи:
- вход: упорядоченный массив А[1...n] $(A[1] \leq A[2] \leq ... \leq A[n])$, k - искомый ключ
- выход: индекс i, такой что A[i]=k, или -1, если такого i нет

Описание алгоритма бинарного поиска (выполняется за log(n)):
>    
{A - упорядочен}          
l = 1, r = n              
пока l <= r   
&emsp;&emsp;m = $\lfloor \frac{l+r}{2} \rfloor$      
&emsp;&emsp;если A[m]=k:   
&emsp;&emsp;&emsp;&emsp;вернуть m        
&emsp;&emsp;иначе если A[m]>k:           
&emsp;&emsp;&emsp;&emsp;r=m-1        
&emsp;&emsp;иначе:       
&emsp;&emsp;&emsp;&emsp;l=m+1        
вернуть -1      
            


## Умножение чисел

Описание алгоритма (Multiply(x, y))     
Временная сложноть - $O(n^2)$
> {Вход: 2 n-битовых целых числа $x\geq 0$ и $y \geq 0$}     
{Выход: x*y}    
если y=0:    
&emsp;&emsp;вернуть 0          
z = Multiply(x, $\lfloor \frac{y}{2} \rfloor$)    
если y четно:          
&emsp;&emsp;вернуть 2z          
иначе:          
&emsp;&emsp;вернуть x+2*z          

Алгоритм Карацубы (karatsuba(x,y))    
Временная сложноть - $O(n^{1.6})$
> {Вход: целые числа $x\geq 0$ и $y \geq 0$, в двоичной записи}       
{Выход: x*y}          
n = max(размер x, размер y)       
если n=1:         
&emsp;&emsp;вернуть xy       
$x_L,x_R$ = левые $\lceil \frac{l+r}{2} \rceil$, правые $\lfloor \frac{l+r}{2} \rfloor$     
$y_L,y_R$ = левые $\lceil \frac{l+r}{2} \rceil$, правые $\lfloor \frac{l+r}{2} \rfloor$        
$P_1$ = karatsuba($x_L,y_L$)     
$P_2$ = karatsuba($x_R,y_R$)    
$P_3$ = karatsuba($x_L+x_R,y_L+y_R$)     
вернуть $P_1*2^{2*(\lceil \frac{n}{2} \rceil)}+(P_3-P_1-P_2)+P_2$     

## Умножение матриц

Определение: $Z[i,j]=\sum_{k=1}^{n}X[i,k]*Y[k,j]$. Сложность алгоритма - $O(n^3)$

Используем алгоритм Штрассена. Идея аналогична предыдущему алгоритму - разбиваем матрицу на 4 части и далее рекурсивно делаем разбиения. По итогу нужно сделать 8 рекурсивных вызовов, но более оптимально - 7. Возникает логарифм от дроби. Сумма выходит меньше чем кубическое.
Более точно $O(n^{2.807})$


## Сортировки

### Постановка задачи
- Сортировка
    - Вход: массив A[1...n]
    - Выход: перестановка A'[1...n] элементов массива A[1...n], в которой элементы упорядочены по неубыванию: $A'[1]\leq A'[2]\leq ... \leq A'[n]$
- Замечания
    - Алгоритм имеет доступ к оракулу сравнения. Сравнение занимает константное время
    - Если A=A', то алгоритм сортирует на месте
    
### Сортировка вставками
- Время работы $O(n^2)$
- массив сортируется на месте

> insertion_sort(A[1...n]):     
&emsp;&emsp;для i от 2 до n:         
&emsp;&emsp;j = i      
&emsp;&emsp;пока j>1 и A[j]<A[j-1]:      
&emsp;&emsp;&emsp;&emsp;обменять A[j] c A[j-1]     
&emsp;&emsp;j = j-1   

```python
def insertion_sort(arr: list):
    for i in range(1, len(arr)):
        j = i
        while j>0 and arr[j]<arr[j-1]:
            arr[j], arr[j-1] = arr[j-1], arr[j]
            j -= 1
    return arr
```

### Сортировка слиянием
- Время работы $O(nlogn)$
> merge_sort(A,l,m):       
&emsp;&emsp;если l<r:      
&emsp;&emsp;&emsp;&emsp;$m=\lfloor \frac{l+r}{2} \rfloor$       
&emsp;&emsp;&emsp;&emsp;merge(merge_sort(A,l,m), merge_sort(A,m+1,r))

Процедура merge:
- сливает 2 упорядоченных массива в один
- работает за линейное время от длины массивов

```python
def merge(arr1: list, arr2: list):
    i, j = 0, 0
    answer = []
    while i<len(arr1) and j<len(arr2):
        if arr1[i]<arr2[j]:
            answer.append(arr1[i])
            i += 1
        else:
            answer.append(arr2[j])
            j += 1
            
    if i == len(arr1) and j<len(arr2):
        answer += arr2[j:]
    elif i < len(arr1) and j==len(arr2):
        answer += arr1[i:]
    return answer


def merge_sort(arr: list):

    if len(arr)>1:
        m = len(arr)//2
        return merge(merge_sort(arr[0:m]), merge_sort(arr[m:]))
    else:
        return arr
```

### Итеративная сортировка слиянием
> iterative_merge_sort(A[1...n]):       
&emsp;&emsp;Q=[] {пустая очередь}        
&emsp;&emsp;для i от 1 до n:           
&emsp;&emsp;&emsp;&emsp;push_back(Q, A[i])         
&emsp;&emsp;пока |Q|>1:          
&emsp;&emsp;&emsp;&emsp;push_back(Q,merge(pop_front(Q), pop_front(Q))    
&emsp;&emsp;вернуть pop_front(Q)   

```python
import heapq


def iterative_merge_sort(arr: list):
    arr = [[i] for i in arr]
    heapq.heapify(arr)
    while len(arr)>1:
        val1 = heapq.heappop(arr)
        val2 = heapq.heappop(arr)
        heapq.heappush(arr, val1+val2)
    return arr[0]
```

### Нижняя оценка для сортировки сравнениями
Любой корректный алгоритм сортировки, основанный на сравнениях элементов, делает $\Omega(nlogn)$ сравнений в худшем случае на массиве размера n


### Проверка сортировок
```python
import random


for _ in range(1000):
    arr = []
    n = random.randint(1, 100)
    for i in range(n):
        arr.append(random.randint(-10**6, 10**6))
    arr = insertion_sort(arr)
    a_true = sorted(arr)
    assert id(arr) != id(a_true)
    assert insertion_sort(arr) == sorted(arr)
```

## Быстрая сортировка
https://neerc.ifmo.ru/wiki/index.php?title=Быстрая_сортировка

Весь алгоритм О(nlogn)
> quick_sort(A, l, r):        
&emsp;&emsp;если $l \leq r$      
&emsp;&emsp;&emsp;&emsp; return       
&emsp;&emsp;m=partition(A,l,r)      
&emsp;&emsp;quick_sort(A, l, m-1)      
&emsp;&emsp;quick_sort(A, m+1, r)        

Скорость функции O(n)
> partition(A, l, r):      
&emsp;&emsp;x=A[l]       
&emsp;&emsp;j=l      
&emsp;&emsp;for i in range(l+1, r):      
&emsp;&emsp;&emsp;&emsp;if $A[i]\leq x$:        
&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;j=j+1    
&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;A[j], A[i] = A[i] ,A[j]      
&emsp;&emsp;A[l], A[j] = A[j], A[l]    
&emsp;&emsp;return j      

Основные идеи по разбиению:
- $x=A[l]$- опорный элемент
- двигаем i от (l+1) до r, поддерживая следующий инвариант
    - $A[k]\leq x$ для всех $l+1 \leq k \leq j$
    - $A[k]>x$ для всех $j+1 \leq k \leq i$
- пусть i увеличился, тогда если A[i]>x, то не делаем ничего, иначе - меняем A[i] с A[j+1] и увеличиваем j

Если массив уже отсортирован, то скорость $O(n^2)$

### Теорема о скорости работы 
Пусть все элементы массива A[1...n] различны и разделитель выбирается равномерно случайным образом. Тогда среднее время работы алгоритма quick_sort(A, l, r) есть O(nlogn), в то время как время работы в худшем случае есть $O(n^2)$     
Усреднение берется по случайным числам алгоритма, а не по входам

Заключение:
- Если все элементы массива равны между собой, то реализация алгоритма будет работать квадратичное время => нужно разбивать на 3 части по сравнею с числом
- Элиминация хвостовой рекурсии позволяет сделать так, чтобы алгоритм быстрой сортировки использовал не более O(logn) дополнительной памяти


### Интроспективная сортировка
- запуск быстрой сортировки с простой эвристикой выбора разделителя ( медиана из первого, среднего и последенго элементов)
- если глубина рекурсии превышает порого с logn, быстрая сортировка прерывается и запускается алгоритм с гарантированным временем O(nlogn) в худшем случае

## Порядковые статистики
https://neerc.ifmo.ru/wiki/index.php?title=Поиск_k-ой_порядковой_статистики

Постановка задачи:
- Вход: массив A[1...n]
- Выход: k-й элемнт упорядоченного по неубыванию массива 

> random_select(A,l,r,k):        
&emsp;&emsp;если $l\geq r$: вернуть A[l]           
&emsp;&emsp;выбрать случайный элемент x из A[1...l]         
&emsp;&emsp;разбить A[1...l] на A[1...m1], A[m1+1...m2], A[m2+1...r] (<x, =x, >x соответсвенно)      
&emsp;&emsp;если $l\leq k \leq m1$:    
&emsp;&emsp;&emsp;&emsp;вернуть random_select(A,l,m1,k)     
&emsp;&emsp;иначе если $m1+1\leq k \leq m2$:   
&emsp;&emsp;&emsp;&emsp;вернуть x   
&emsp;&emsp;иначе:       
&emsp;&emsp;&emsp;&emsp;вернуть random select(A,m2+1,r,k)      

Среднее время работы алгоритма O(n)

```python
# из-заиндексации с 0 нужно искать (k-1) статистику
def find_kth_statistic(arr: list, k: int):
    left, right = 0, len(arr)-1
    while True:
        middle = partition(arr, left, right)
        if middle == k:
            return arr[middle]
        elif k<middle:
            right = middle
        else:
            left = middle+1
    

def partition(arr: list, l_index: int, r_index: int):
    sup_el = arr[(l_index+r_index)//2]
    i = l_index
    gt = r_index
    lt = l_index
    while i <= gt:
        if arr[i] < sup_el:
            arr[i], arr[lt] = arr[lt], arr[i]
            i += 1
            lt += 1
        elif arr[i] > sup_el:
            arr[i], arr[gt] = arr[gt], arr[i]
            gt -= 1
        else:
            i += 1
    return lt
```

## Сортировка кучей
https://neerc.ifmo.ru/wiki/index.php?title=Сортировка_кучей

Сортировка выбором (работает за $O(n^2)$):
>selection_sort(A[1...n])    
&emsp;&emsp;для i от 1 до n:     
&emsp;&emsp;&emsp;&emsp;k=i     
&emsp;&emsp;&emsp;&emsp;для j от i+1 до n:     
&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;если A[j]<A[k]:     
&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;&emsp;k=j       
&emsp;&emsp;&emsp;&emsp;обменять A[i] c A[k]     
```python
def selection_sort(arr: list):
    for i in range(len(arr)):
        k = i
        for j in range(i+1, len(arr)):
            if arr[j]<arr[k]:
                k = j
        arr[i], arr[k] = arr[k], arr[i]
```

Сортировка кучей
>heap_sort(A[1...n]):     
&emsp;&emsp;H=[] - мин-куча       
&emsp;&emsp;для i от 1 до n:       
&emsp;&emsp;&emsp;&emsp;insert(H, A[i])      
&emsp;&emsp;для i от 1 до n:      
&emsp;&emsp;&emsp;&emsp;A'[i]=extract_min(H)    
```python
def heap_sort(arr: list):
    import heapq
    
    heapq.heapify(arr)
    
    answer = []
    while arr:
        answer.append(heapq.heappop(arr))
    return answer
```

Сортировка кучей на месте
>heap_sort(A[1...n]):      
&emsp;&emsp;build_max_heap(A)      
&emsp;&emsp;size=n       
&emsp;&emsp;для i от n до 2:      
&emsp;&emsp;&emsp;&emsp;обменять A[size] c A[1]     
&emsp;&emsp;&emsp;&emsp;size=size-1     
&emsp;&emsp;&emsp;&emsp;sift_down(A,1) - восстановление свойства кучи     

## Сортировки основанные не на сравнениях
https://neerc.ifmo.ru/wiki/index.php?title=Сортировка_подсчётом

Стабильная сортировка подсчетом (Скорость работы - O(n+M))
>count_sort(A[1...n]):     
{массив А содержит целые числа от 1 до М}       
&emsp;&emsp;создать массив В[1...M]=[0...0]       
&emsp;&emsp;для j от 1 до n:      
&emsp;&emsp;&emsp;&emsp;B[A[j]]=B[A[j]]+1        
&emsp;&emsp;для i от 2 до M:        
&emsp;&emsp;&emsp;&emsp;B[i]=B[i]+B[i-1]     
&emsp;&emsp;для j от n до 1:     
&emsp;&emsp;&emsp;&emsp;A'[B[A[j]]]=A[j]  
&emsp;&emsp;&emsp;&emsp;B[A[j]]=B[A[j]]-1     

```python
def count_sort(arr: list):
    M = max(arr)+1
    d_uniq = [0 for i in range(M)]
    new_arr = [0 for i in range(len(arr))]
    
    for j in arr:
        d_uniq[j] += 1
        
    for i in range(1, M):
        d_uniq[i] += d_uniq[i-1]
    
    j = len(arr)-1
    while j>=0:
        new_arr[d_uniq[arr[j]]-1] = arr[j]
        d_uniq[arr[j]] -= 1
        j -= 1
    return new_arr     
```

https://neerc.ifmo.ru/wiki/index.php?title=Цифровая_сортировка

Цифровая сортировка - сортировка по разрядам числа. Вызывается на каждый разряд стабильная сортировка подсчетом. Скорость работы - O(nd), d- число разрядов во входных числах

## Рекуррентные соотношения

Теорема:
- Пусть есть алгоритм, основанный на методе "разделяй и властвуй", который для решения задачи размера n делает a рекурсивных вызовов для задач размера n/b и тратит время $O(n^d)$ на то, чтобы подготовить рекурсивные вызовы и чтобы собрать из их ответов ответ для исходно задачи: $T(n)=aT(\frac{n}{b})+O(n^d)$, где $a>0,b>1,d\leq 0$. Тогда

$
A_{m,n} = 
 \begin{cases}
  O(n^d),         & d>log_b a \\
  O(n^dlogn),     & d=log_b a \\
  O(n^{log_b a}), & d<log_b a
 \end{cases}
$

Примеры вычислений:
- $T(n)=2T(\frac{n}{2})+O(n):$ $T(n)=O(nlogn)$ (a=2,b=2,d=1)
- $T(n)=2T(\frac{n}{2})+O(1):$ T(n)=O(log n) (a=1,b=2,d=0)
- $T(n)=5T(\frac{n}{4})+O(n):$ $T(n)=O(n^{log_4 5})$, (a=5,b=4,d=1)
- $T(n)=5T(\frac{n}{4})+O(n^2):$ $T(n)=O(n^2)$, (a=5,b=4,d=2)

Примеры соотношений, не покрываемых теоремой:
- $T(n)=T(\frac{n}{3})+T(\frac{2n}{3})+O(n)$ T(n)=O(nlogn)
- T(n)=2T(n-1)+O(1), T(n)=O($2^n$)
- $T(n)=T(\sqrt(n))+O(1):$ $T(n)=O(log log n)$

### Задачи на расположение рекуррентных соотношений

$
\begin{matrix}
  T(n)=T(\frac{n}{2})+O(1) & (a=1,b=2,d=0) (0=log_2 1)  & T(n)=O(log n)\\
  T(n)=2T(\frac{n}{3})+O(1) & (a=2,b=3,d=0) (0=log_3 2)  & T(n)=O(n^{log_3 2})\\
  T(n)=2T(\frac{n}{2})+O(n) & (a=2,b=2,d=1) (1=log_2 2) & T(n)=O(nlogn)\\
  T(n)=5T(\frac{n}{4})+O(n) & (a=5,b=4,d=1) (1=log_4 5) & T(n)=O(n^{log_4 5})\\
  T(n)=3T(\frac{n}{2})+O(n) & (a=3,b=2,d=1) (1=log_2 3)  & T(n)=O(n^{log_2 3})\\
  T(n)=5T(\frac{n}{4})+O(n^2) & (a=5,b=4,d=2) (2=log_4 5)  & T(n)=O(n^2)\\
  T(n)=9T(\frac{n}{3})+O(n^2) & (a=9,b=3,d=2) (2=log_3 9) & T(n)=O(n^2logn)\\
  T(n)=5T(\frac{n}{2})+O(n) & (a=5,b=2,d=1) (1=log_2 5)  & T(n)=O(n^{log_2 5})\\
  T(n)=6T(\frac{n}{4})+O(n^3) & (a=6,b=4,d=3) (3=log_4 6)  & T(n)=O(n^{3})\\
 \end{matrix}
$

$
\begin{matrix}
  T(n)=T(n-1)+n^2 & T(n)=O(n^3)\\
  T(n)= T(\sqrt(n))+1 & T(n)=O(log log n) \\
  T(n)= T(\frac{n}{5})+T(\frac{3n}{5})+n& T(n)=O(n)\\
  T(n)= 9T(\frac{n}{3})+n^2 & T(n)=n^2logn \\
  T(n)= 5T(\frac{n}{4})+n & T(n)=O(n^{log_4 5})\\
  T(n)= nT(n-1) & T(n)=O(n!) \\
  T(n)= T(n-1)+3^n & T(n)=O(3^n)\\
  T(n)= T(\frac{n}{5})+T(\frac{4n}{5})+n & T(n)=O(nlogn) \\
  T(n)= 2T(n-1)+1 & T(n)=O(2^n)\\
  T(n)= 3T(n-3)+1& T(n)=O(3^{\frac{n}{3}})\\
 \end{matrix}
$

## Наивная быстрая сортировка 

При гарантированном добавлении одинаковых элементов скорость сортировки резко падает - с 0.2 до 8 секунд

In [3]:
def quick_sort(arr: list, l: int, r: int):
    if l < r:
        m = partition(arr, l, r)
        quick_sort(arr, l, m)
        quick_sort(arr, m + 1, r)


def partition(arr: list, l: int, r: int):
    x = arr[l]
    j = l
    for i in range(l + 1, r):
        if arr[i] <= x:
            j = j + 1
            arr[i], arr[j] = arr[j], arr[i]
    arr[l], arr[j] = arr[j], arr[l]
    return j

import random
import time
from tqdm import tqdm
for i in tqdm(range(100)):
    arr = []
    n = random.randint(50000, 50000)
    for i in range(n):
        arr.append(random.randint(-10**8, 10**8))
    arr1 = arr.copy()
    arr2 = arr.copy()
    
    t = time.time()
    quick_sort(arr1, 0, len(arr1))
    t1 = time.time()-t
    assert t1<=0.5, "Time limit"
    
    t = time.time()
    arr2 = sorted(arr2)
    t2 = time.time()-t
#     print(t2, t1)
    
    assert arr1 == arr2
    
    
# for i in tqdm(range(100)):
#     arr = []
#     n = random.randint(50000, 50000)
#     for i in range(n):
#         arr.append(random.randint(-10, 10))
#     arr1 = arr.copy()
#     arr2 = arr.copy()
    
#     t = time.time()
#     quick_sort(arr1, 0, len(arr1))
#     t1 = time.time()-t
#     assert t1<=0.5, f"Time limit {t1} s"
    
#     t = time.time()
#     arr2 = sorted(arr2)
#     t2 = time.time()-t
# #     print(t2, t1)
    
#     assert arr1 == arr2




## Быстрая сортировка с учетом одинаковых элементов и выбором среднего значения

In [2]:
def partition(arr: list, l_index: int, r_index: int):
    sup_el = arr[(l_index+r_index)//2]
    i = l_index
    gt = r_index
    lt = l_index
    while i <= gt:
        if arr[i] < sup_el:
            arr[i], arr[lt] = arr[lt], arr[i]
            i += 1
            lt += 1
        elif arr[i] > sup_el:
            arr[i], arr[gt] = arr[gt], arr[i]
            gt -= 1
        else:
            i += 1
    return lt, gt


def quick_sort(arr: list, l: int = 0, r: int = None):
    if r is None:
        r = len(arr)-1
    if l >= r:
        return
    left, right = partition(arr, l, r)
    quick_sort(arr, l, left - 1)
    quick_sort(arr, right + 1, r)
    
    
import random
import time
from tqdm import tqdm
for i in tqdm(range(100)):
    arr = []
    n = random.randint(50000, 50000)
    for i in range(n):
        arr.append(random.randint(-10**8, 10**8))
    arr1 = arr.copy()
    arr2 = arr.copy()
    
    t = time.time()
    quick_sort(arr1)
    t1 = time.time()-t
    assert t1<=0.5, "Time limit"
    
    t = time.time()
    arr2 = sorted(arr2)
    t2 = time.time()-t
#     print(t2, t1)
    
    assert arr1 == arr2
    
    
for i in tqdm(range(100)):
    arr = []
    n = random.randint(50000, 50000)
    for i in range(n):
        arr.append(random.randint(-10, 10))
    arr1 = arr.copy()
    arr2 = arr.copy()
    
    t = time.time()
    quick_sort(arr1)
    t1 = time.time()-t
    assert t1<=0.5, f"Time limit {t1} s"
    
    t = time.time()
    arr2 = sorted(arr2)
    t2 = time.time()-t
#     print(t2, t1)
    
    assert arr1 == arr2




KeyboardInterrupt: 