# 05: Radenie

Zoraďovanie prvkov poľa je častou úlohou, ku ktorej riešeniu existuje množstvo možných prístupov. V Pythone nám typicky môže stačiť zavolať metódu `list.sort`:

In [None]:
import random

In [None]:
a = list(range(10))
random.shuffle(a)
print('Original: {}'.format(a))

a.sort()
print('Sorted: {}'.format(a))

My si však skúsime naprogramovať zoraďovanie poľa sami, bez využitia zabudovaných zoraďovacích metód.

Najskôr si zadefinujme funkciu, ktorá nám vráti nezoradené pole. To len preto, aby sme mali na čom neskôr naše zoraďovanie skúšať.

In [None]:
def get_unsorted(length=100):
    """
    Unsorted array of integers.
    
    Args:
        length (int): Number of elements in the returned array. *Default: 100.*
    
    Returns:
        list[int]: An array full of random integers ranging from -100 to 100 (100 not included).
    """
    return [random.randrange(-100, 100) for i in range(length)]

## Zoraďovanie polí

- *Poľom* nazveme akúkoľvek reprezentáciu usporiadanej $n$-tice **rovnakého dátového typu**.
    - Zoraďovací predpis, samozrejme, možno definovať i pre $n$-ticu zloženú z rôznych dátových typov. Pre názornosť ale takéto prípady vynecháme. Platia na ne rovnaké algoritmy ako na homogénne $n$-tice, teda polia v našom ponímaní.
    - Pre jednoduchosť budeme pracovať s *reálnymi číslami*
        - Prirodzene definované operátory `<`, `>`, `<=`, `>=`, `==`
    
- Cieľ: Usporiadať hodnoty v poli
    - *Vzostupne*
        - Zostupné usporiadanie je založené na rovnakom princípe, iba zmysel porovnaní bude opačný
   
--------
### Bubble sort

<img src="bubble_sort.gif" width=800 />

- Jeden beh:
    - Okienko o dvoch susedných hodnotách $a$ a $b$
    - Pokiaľ $a > b$, nastane zmena pozícií
    - Posun okienka o jeden prvok vpravo
    
- Pri každom behu sa na správnu pozíciu dostane aspoň jedna hodnota.
    - Pre $n$-prvkové pole teda treba $n - 1$ behov
        - Pri každom z nich $n - 1$ porovnaní

- Asymptotická zložitosť algoritmu $\mathcal{O}(n^2)$
- Schopnosť detekovať, že pole je už zoradené
    - V najlepšom prípade (už zoradené pole) je zložitosť $\mathcal{O}(n)$ (Prebehne iba 1 beh)

In [None]:
a = get_unsorted()
        
def bubble_sort(a):
    # TODO

%time bubble_sort(a)
print(a)

-----------

### Insertion sort

<img src="insertion_sort.gif" width=800 />

- Prvý prvok poľa je sám o sebe zoradeným poľom.
- Zoberieme 2. prvok a zaradíme ho do poľa vľavo
    - Tým získame dvojprvkové zoradené pole na začiatku celého poľa
- Zoberieme 3. prvok a zaradíme ho do dvojprvkového zoradeného poľa
    - Tým získame trojprvkové zoradené pole na začiatku celého poľa
- ...a pokračujeme až po posledný prvok celkového poľa.


- Prechádzame $n-1$ prvkov
    - Pre prvý 1 porovnanie
    - Pre druhý najviac 2 porovnania
    - Pre tretí najviac 3 porovnania atď.
- V najhoršom prípade teda celkovo $\sum_{k=1}^{n-1}k$ porovnaní

In [None]:
from sympy import *

In [None]:
k, n = symbols('k n')
Sum(k, (k, 1, n - 1)).doit()

* Asymptotická zložitosť $\mathcal{O}(n^2)$

In [None]:
a = get_unsorted()

def insertion_sort(a):
    # TODO
        
%time insertion_sort(a)
print(a)

-----------

### Quicksort

- Patrí do skupiny algoritmov typu *rozdeľ a panuj*.
- Zaraďuje sa do triedy zložitosti $\mathcal{O}(n\log n)$
- Využitie *rekurzie*

> #### Rekurzia
>
> - Pokiaľ nie je splnená ukončovacia podmienka, funkcia **volá samú seba**.

* Algoritmus quicksort:


> * Vyber **pivot** (napr. prvý prvok poľa)
>
> * Prejdi celé pole a **preusporiadaj** ho tak, aby naľavo od pivota boli iba prvky **menšie než pivot** a napravo od neho iba prvky, ktoré sú **väčšie než pivot**.
>
> * **Zoraď pomocou *quicksort*** pole vľavo od pivota i pole vpravo od pivota.

In [None]:
a = get_unsorted()

def quick_sort(a):
    # TODO    

%time a = quick_sort(a)
print(a)

-----------
### Bogosort

In [None]:
a = get_unsorted(5)

def issorted(a):
    # TODO

def bogo_sort(a):
    # TODO

%time bogo_sort(a)

print(a)

------------
* Zoraďovacích algoritmov existuje ešte omnoho viac $-$ viď napr. [Wikipedia](https://en.wikipedia.org/wiki/Sorting_algorithm)

### Zabudované zoraďovacie funkcie Pythonu

* `list.sort()` ([Dokumentácia](https://docs.python.org/3/library/stdtypes.html#list.sort))$~\to ~$ Zoradenie zoznamu *na mieste*

    * Parameter `reverse` (bool): `list.sort()` defaultne[<sup>1</sup>](#foot01) zoraďuje zoznam *vzostupne*. Pokiaľ je hodnota argumentu pre parameter `reverse` nastavená na  `True`, zmysel porovnávaní bude zmenený a pole bude zoradené v *zostupnom* zmysle (*default* `False`)
    
    * Parameter `key` (callable): Funkcia, ktorá transformuje hodnoty zoznamu na kľúče, ktoré majú vstúpovať do porovnávaní (*default* `None`)
        * Príklad:

In [None]:
l = [7, 'foo', 'Whale', 'Foo', 'whale', '7', 'seven', [1, 2, 3]]
# l.sort() # Error
l.sort(key=str)
print(l)

l = [7, 'foo', 'Whale', 'Foo', 'whale', '7', 'seven', [1, 2, 3]]
l.sort(key=lambda x: str(x).lower())
print(l)

* `sorted()` [Dokumentácia](https://docs.python.org/3/library/functions.html#sorted) $~\to ~$ Vytvorenie zoradeného poľa z iterovateľného objektu, ktorý je jej povinným parametrom
    * Parametre `key` a `reverse` majú rovnaký význam, ako v metóde `list.sort()`

----------
## Všeobecné úlohy

1. Napíšte funkciu `my_find(a, b)`, ktorá v reťazci `a` hľadá reťazec `b` (nepoužívajte zabudovanú funkciu `str.find()`)
    * Pokiaľ je reťazec nájdený, funkcia vráti index jeho prvého výskytu *zľava*.
    * Pokiaľ reťazec nenájde, vráti -1.
    * Efektívna implementácia: [Boyer-Moore-Horspool algoritmus](https://en.wikipedia.org/wiki/Boyer%E2%80%93Moore%E2%80%93Horspool_algorithm).

In [None]:
# The Python find(a, b) function:
a = 'mechanotherapy'
b = 'another'

print(a.find(b))
print(a.find('that'))

In [None]:
def my_find(a, b):
    # TODO
    
a = 'mechanotherapy'
b = 'another'

print(my_find(a, b))
print(my_find(a, 'that'))

2. Napíšte funkciu `my_replace(a, b, c)`, ktorá v reťazci `a` nahradí všetky výskyty reťazca `b` reťazcom `c`. 

In [None]:
# The Python str.replace(a, b) function:
a = 'mechanotherapy'
b = 'mechano'
c = 'hydro'

print(a.replace(b, c))

In [None]:
def my_replace(a, b, c):
    # TODO
    
a = 'mechanotherapy mechanotherapy'
b = 'mechano'
c = 'hydro'

print(my_replace(a, b, c))

# a = 'mechanotherapy'
# b = 'physio'
# c = 'hydro'

# print(my_replace(a, b, c))

3. Napíšte program, ktorý načíta štandardný vstup a v načítanom reťazci zamení slovo `Hello` za slovo `Hi`. Pokiaľ sa vo vstupnom reťazci objaví slovo `End`, program skončí.