# Řazení

In [2]:
%%html
<iframe width="560" height="315" src="https://www.youtube.com/embed/kPRA0W1kECg" frameborder="0" allowfullscreen></iframe>

https://en.wikipedia.org/wiki/Sorting_algorithm

Vstup: seznam $n$ čísel  
Výstup: seznam $n$ čísel tak, že pro všechna sousední $a,b$ platí $a\le b$

Asi je třeba alespoň $n$ kroků (i kdyby byl seřazený vstup, tak na kontrolu).

- Jednoduché algoritmy mohou trvat řádově $n^2$ kroků (BubbleSort, SelectSort)
- Lepší algoritmy mají $n \log n$ kroků v každém případě (MergeSort)
- Ve speciálních případech lze dosáhnout i něčeho jako $n$ kroků (RadixSort)

Teoretický výsledek: pokud řazení funguje pomocí porovnání a prohození dvou prvků (běžné sorty), nejhorší případ má alespoň $\log n! \approx n \log n$ kroků.

Stabilita: prvky $a,b$, pokud $a=b$, jsou po seřazení ve stejné vzájemné pozici (např. stejné karty různé barvy, barvy se neprohodí)

## Mergesort

- Rozděl seznam na poloviny, ty seřaď a dvě seřazené části spoj dohromady.
    - Jak seřadit poloviny? Stejným způsobem! (rekurze, volání téže funkce)
    - Nakonec se dostaneme na seznamy s jedním prvkem (případně prázdné), a ty už jsou seřazené triviálně.
    - Při následném spojování ber vždy menší prvek ze začátku obou seznamů.
- $n \log n$ kroků v každém případě, ale vyžaduje pomocný seznam délky $n$
- Řazení v Pythonu, Javě je kombinace mergesortu a insertsortu (pro malá data)

In [32]:
def merge_sort(data):
    print("merge_sort", data)
    n = len(data)
    
    if n <= 1:
        return data
    else:
        left, right = data[:n//2], data[n//2:]
        sorted_left = merge_sort(left)
        sorted_right = merge_sort(right)
        return merge(sorted_left, sorted_right)

def merge(left, right):
    print("merging", left, "and", right, end=" ")
    output = []
    
    while left and right:
        if left[0] <= right[0]:
            output.append(left.pop(0))
        else:
            output.append(right.pop(0))
    
    output += left
    output += right
    
    print("into", output)
    return output


merge_sort([1,-5,2,0,5,4])

merge_sort [1, -5, 2, 0, 5, 4]
merge_sort [1, -5, 2]
merge_sort [1]
merge_sort [-5, 2]
merge_sort [-5]
merge_sort [2]
merging [-5] and [2] into [-5, 2]
merging [1] and [-5, 2] into [-5, 1, 2]
merge_sort [0, 5, 4]
merge_sort [0]
merge_sort [5, 4]
merge_sort [5]
merge_sort [4]
merging [5] and [4] into [4, 5]
merging [0] and [4, 5] into [0, 4, 5]
merging [-5, 1, 2] and [0, 4, 5] into [-5, 0, 1, 2, 4, 5]


[-5, 0, 1, 2, 4, 5]

## Quicksort

- Vyber jeden prvek (pivot), rozděl seznam na dvě části podle velikosti vůči pivotu.
    - Pivot se dostane na správné místo, stejným způsobem seřaď dvě části.
- Ideální případ: jako pivot vybereme medián, seznam se rozdělí na dvě stejně velké části $\to n\log n$ kroků
- Nejhorší případ: jako pivot vybereme minimum/maximum, bude to probíhat podobně jako Insertion Sort $\to n^2$ kroků

Jak vybrat pivot, aby se seznam rozpadl na dvě rozumně velké části?

- Vždycky první prvek v seznamu ... seřazený vstup vede na nejhorší případ, to není vhodné
- Vždycky prvek v seznamu uprostřed ... ideální pro seřazený vstup, ale obecně to není o nic lepší než první prvek
- "Náhodně" ... pravděpodobnost, že se trefíme do minima/maxima/mediánu je nepatrná
    - I "průměrně dobrý" pivot, když rozdělí seznam na 1/10 a 9/10 prvků, je pořád rychlý
    - V praxi: náhodně vybrat několik (5, 7) prvků a z nich vzít medián ... poměrně robustní, rozumný odhad