# Sortowanie przez scalanie

1. Opis słowny działania algorytmu.
2. Algorytm zapisany w pseudokodzie lub schemacie blokowym.
3. Przykład działania algorytmu.
4. Oszacowanie złożoności czasowej i pamięciowej.

## Opis algorytmu

dla danych wejjściopwych o długości N:
1. Znajdź środek m = $\lfloor \frac{N}{2} \rfloor$ i podziel tablicę na dwie cześci **L** i **R** o długości **l** i **k** tak by $l + k = N$ 
2. Wywołaj procedurę sortowania przez scalanie dla danych zawartych w tablicy **L** (ponowne wywołanie pkt 1) tak długo aż długośc $R = 1$
3. Wywołaj procedurę sortowania przez scalanie dla danych zawartych w tablicy **R** (ponowne wywołanie pkt 1)  tak długo aż długośc $L = 1$
4. Scal posortowane tablice **L** i **R** poprzez porównywanie kolejno $1,2,...$ elementów mędzy tablicą **R** i **L** i wstawiane do nowej tablicy o długości $N$

## Pseudokod

```
posortuj(A):
    jeśli ilość elementów w A jest równa 1:
        zwróć A
    ## Oblicz środek
    m := A.length / 2
    ## Przedziały prawostronnie otwarte indeksowanie w notacji amerykańskiej rozpoczynające się od 0
    L := A[0 : m]
    R := A[m : n]
    L_posortowana := sortuj(L)
    R_posortowana := sortuj(R)
    
    zwróć scal(L_posortowana, R_posortowana)

scal(L, R):
    ## Stworzenie buforu
    B := [] o długości L.length + R.length
    l_index := 0
    r_index := 0
    b_index
    ## skopiowanie do utworzonego bufora danych, tak długo jak w L i R są dane
    pętla tak długo jak L i R posiadają elementy:
        jeśli L[0] < R[0]:
            dodaj L[0] na koniec B
            usuń element L[0] z L
            ## np. L := [1,2] po usunieciu L[0] => [2]
        else:
            dodaj R[0] na koniec B
            usuń element R[0] z R
            
        ## skopiowanie pozostałych elementów
        pętlka tak długo jak L posiada elementy:
            dodaj L[0] na koniec B
            usuń L[0] z L
            
        pętlka tak długo jak R posiada elementy:
            dodaj R[0] na koniec B
            usuń R[0] z R
    zwróć B
```

## Przykład działania algorytmu

![Sortowanie przez scalanie](./data/img/merge_sort.png "Sortowanie przez scalanie")

## Przykładowa implementacja

In [1]:
from typing import List
## algorytm przy sortoweaniu korzysta ze stosu programu, nie rekomendowana implementacja do użytku poza nauka
def sort(A: List) -> List:
    if len(A) == 1:
        return A
    m = len(A) // 2
    L = A[:m]
    R = A[m:]
    L_sorted = sort(L)
    R_sorted = sort(R)
    
    return merge(L_sorted, R_sorted)

def merge(L, R) -> List:
    B = []
    while len(L) > 0 and len(R) > 0:
        if L[0] < R[0]:
            B.append(L[0])
            L.pop(0)
        else:
            B.append(R[0])
            R.pop(0)
    
    for i in range(len(L)):
        B.append(L[0])
        L.pop(0)
    for i in range(len(R)):
        B.append(R[0])
        R.pop(0)

    return B

In [2]:
unsorted_list = [14, 15, 12, 11, 17] 
sorted_list = sort(unsorted_list)

print(f'nieposortowana tablica: {unsorted_list}')
print(f'posortowana tablica: {sorted_list}')

nieposortowana tablica: [14, 15, 12, 11, 17]
posortowana tablica: [11, 12, 14, 15, 17]


## Złożoność algorytmu
$$
\begin{align}
    T(n) & = 2T(\frac{n}{2}) + n = \\
    & = 2T(2T(\frac{n}{4}) + \frac{n}{2}) + n \\
    & = 2T(2T(2T(\frac{n}{8}) + \frac{n}{4}) + \frac{n}{2}) + n \\
    & = 2T(...2T(\frac{n}{2 \cdot 2^{i}}) + \frac{n}{2^{i}}) \\
    & = 2T((2T(...2T(1) + 2) ...) + \frac{n}{2}) + n \\
\end{align}
$$
$$
n = 2k \; k \in \mathbb{N}
$$
Co daje:

$$ T(n) = nlog(n)$$
Tak więc złożoność obliczeniowa algorytmu sortowania przez scalanie wynosi $O(nlog(n))$
Nalży jednak zwrócić uwage że sortowanie przez scalanie ma większy stały czynnik *n* niż np. sortowqanie przez wstawianie czy wybieranie. Jenak jest on istoptny tylko przy mniejszych *n*.

### Złożonośc pamięciowa

Złozonośc pamięciowa jest zależna od użytej struktury danych. Przy najprostrzej wersji algorytmu wynosi ona n. Co oznacza że przy sortopwaniu metoda musi zaalokować pamięć równą rozmiarowi tablicy do posortopwania. Jednak przy użyciu listy jako struktury danych złożonośc pamięciowa spada, a dokładniej nie ma potrzeby alokowania dodatkowej pamięci.

### Literatura:
- Maciej M. Sysło: *Algorytmy. Gliwice* : Helion, 2016 ISBN 978-83-283-0357-7
- Thomas H. Cormen: *Algorytmy bez Tajemnic* : Helion 2013 ISBN 978-83-246-7482-4   

#### Inne materiałý:

- [MIT Opencurseware Math for Computer Science Lecture 14: Divide and Conquer Recurrences notes](https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-042j-mathematics-for-computer-science-fall-2010/readings/MIT6_042JF10_chap10.pdf) [s.9]
- [MIT Opencurseware Math for Computer Science Lecture 14: Divide and Conquer Recurrences : video](https://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-042j-mathematics-for-computer-science-fall-2010/video-lectures/lecture-14-divide-and-conquer-recurrences/) [Merg Sort - 20:40]
- [MIT Opencurseware Introduction to Algorithm Lecture 3](https://youtu.be/Kg4bqzAqRBM?t=1500)