# Sortowanie przez scalanie (merge sort)

Używa techniki dziel i zwyciężaj.

## Algorytm
- podziel tablicę na dwie połowy
- posortuj połowy (rekurencja)
- scal posortowane połowy (w ten sposób aby całość była posortowana)
- bazowy przypadek: 
    - pojedyncza liczba (lub pusta tablica) już jest posortowany
    - opcjonalnie więcej liczb sortowanych inną znaną metodą (np. sortowanie przez scalanie)
    
Przykład z wizualizacja:
https://www.geeksforgeeks.org/sorting-algorithm-visualization-merge-sort/?ref=leftbar-rightbar

Więcej szczegółów:
https://en.wikipedia.org/wiki/Merge_sort



## Pamięć


Krok scalania wymaga kopiowania danych do nowego bufora pamięci. 
Stąd zapotrzebowanie na pamięć jest wprost proporcjonalne do wielkości danych wejściowych:

$O(N)$


#### Jakie zapotrzebowanie na pamięć mają algorytmy: sortowanie przez wstawianie (insertion sort) lub sortowanie szybkie (quicksort)?

## Wydajność

Zakładając K liczb wchodzących do funkcji sortującej, każde wywołanie rekurencyjne generuje:
- dwa nowe zadania sortowania na połowie danych $(^K/_2)$
- operacja scalania - proporcjonalna do ilości danych wejściowych $(K)$

Ilość zagłębień rekurencji dla N liczb:

$log_{2}(N)$

(każde wywołanie rekurencyjne dostaje dwa razy mniej danych)


Podsumowując:
- i-ty poziom rekurencji wymaga $O(N)$ operacji
    - $2^i$ operacji scalenia, 
    - każde scalenie wymaga $^N/_{2^i}$ porównań i kopiowań
- jest $log_{2}(N)$ poziomów

### Złożoność obliczeniowa algorytmu sortowania przez scalanie: 

### $O(Nlog_{2}(N))$


Dla małej ilości danych inne algorytmy sortowania mogą być szybsze. 
Można łączyć sortowanie przez scalanie z innymi rodzajami sortowania dla uzyskania bardziej efektywnego algorytmu.

In [1]:
def merge_sort(numbers):
    # tymczasowa lista o rozmiarze N
    tmp = [0] * len(numbers)
    merge_sort_r(numbers, tmp, 0, len(numbers))
    return

def merge_sort_r(numbers, tmp, start, end):
    # krok 1 - przypadek "bazowy" 
    if (start >= end-1):
        return

    # krok 2 - podział na mniejsze podproblemy i rekurencja
    mid = (start + end) // 2
    #print ("start: ", start, "end: ", end, "mid: ", mid)
    
    merge_sort_r(numbers, tmp, start, mid)
    merge_sort_r(numbers, tmp, mid, end)
    
    # krok 3 - scalenie wyników
    merge(numbers, tmp, start, mid, end)

    return

def merge(numbers, tmp, start, mid, end):
    tmp[start:end] = numbers[start:end]

    l = start # lewa połówka
    r = mid   # prawa połówka

    for i in range(start, end):
        #print ("l:",l, "r:",r)
        if (tmp[l] > tmp[r]):
            numbers[i] = tmp[l]
            l += 1
            if (l == mid) :
                break
        else:
            numbers[i] = tmp[r]
            r += 1
            if (r == end) :
                break

    # kopiowanie pozostałych elementów
    if l < mid:
        numbers[i+1: end] = tmp[l:mid]
    elif r<end:
        numbers[i+1: end] = tmp[r:end]
    
    return




In [2]:
x = [ 1,2,3,4,5, 6, 7, 8, 100, 20, 10, 1000]
merge_sort(x)
print(x)



[1000, 100, 20, 10, 8, 7, 6, 5, 4, 3, 2, 1]
