Úvod
----

Triedenie je základná operácia v informatike a zohráva kľúčovú úlohu v rôznych aplikáciách, od jednoduchých úloh správy dát po komplexné algoritmické problémy. V jeho podstate triedenie znamená usporiadanie kolekcie položiek podľa určitých kritérií, obvykle vzostupne alebo zostupne.

### Dôležitosť triedenia

Význam triediacich algoritmov vyplýva z ich všadeprítomného použitia v každodennom živote a ich nevyhnutnej úlohy v počítačovom programovaní a vývoji softvéru. Tu sú niektoré kľúčové dôvody, prečo je triedenie dôležité:

1.  Organizácia dát: Triedenie umožňuje organizáciu dát v štruktúrovanej forme, čím uľahčuje ich rýchlejšie vyhľadávanie, získavanie a analýzu.

2.  Získavanie informácií: Triedené dáta uľahčujú rýchlejšie vyhľadávacie a získavacie operácie. Napríklad vyhľadávanie v triedenom zozname je efektívnejšie, pretože môžeme použiť efektívne vyhľadávacie algoritmy ako napríklad binárne vyhľadávanie.

3.  Návrh algoritmov: Mnohé algoritmy a techniky riešenia problémov závisia od triedenia ako predspracovania alebo ako súčasť ich implementácie.

4.  Používateľská skúsenosť: V aplikáciách určených pre používateľa, poskytovanie informácií v triedenom poradí zlepšuje používateľskú skúsenosť.

### Rozsah triediacich algoritmov

Triediace algoritmy sa líšia v zložitosti, efektívnosti a vhodnosti pre rôzne typy dát a veľkosti problémov. Môžu byť klasifikované podľa ich základných princípov, ako aj podľa ich časovej a priestorovej zložitosti.

Existujú rôzne triediace algoritmy, od jednoduchých a intuitívnych metód ako Bubble sort a Insert sort po sofistikovanejšie metódy ako Merge sort, Quick sort atď.

* * * * *

Typy triediacich algoritmov
---------------------------

### Porovnávacie triediace algoritmy

Porovnávacie triediace algoritmy sú najbežnejším typom a pracujú porovnávaním jednotlivých prvkov vstupnej kolekcie a ich postupným presúvaním do správneho poradia. Tu sú niektoré z najznámejších porovnávacích triediacich algoritmov:

- Bubble Sort
- Selection Sort
- Insertion Sort
- Merge Sort
- Quick Sort
- Heap Sort


#### Testovacia funkcia

In [None]:
import random

generated_data = [random.randint(1, 100) for _ in range(100)]

def test(func):
    data = generated_data.copy()
    print(data)
    func(data)
    print(data)


#### Bubble Sort
Bubble Sort je jednoduchý algoritmus, ktorý opakovane prechádza cez zoznam a porovnáva susedné prvky. Ak sú v nesprávnom poradí, vymenia sa. Tento proces sa opakuje, kým nie sú všetky prvky usporiadané.

Tento algoritmus má časovú zložitosť O(n^2). Je vhodný pre malé zoznamy ale nie je efektívny pre veľké množstvo dát.

In [None]:
def bubble_sort(arr):
    n = len(arr)
    for i in range(n-1):
        for j in range(0, n - i - 1):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]

test(bubble_sort)


#### Selection Sort
Selection Sort funguje tak, že v každom kroku nájde najmenší prvok a presunie ho na správnu pozíciu. Tento proces sa opakuje, kým nie je celý zoznam usporiadaný.

Časová zložitosť tohto algoritmu je tiež O(n^2), ale môže byť v praxi efektívnejší ako bublinkové triedenie pre veľké zoznamy, pretože má menej výmen.

In [None]:
def selection_sort(arr):
  for step in range(len(arr)):
    min_idx = step

    for i in range(step + 1, len(arr)):
      if arr[i] < arr[min_idx]:
        min_idx = i
    (arr[step], arr[min_idx]) = (arr[min_idx], arr[step])

test(selection_sort)

#### Insertion Sort
Insertion Sort funguje tak, že postupne vkladá prvky zoznamu do už usporiadaného poľa tak, aby výsledný zoznam zostal usporiadaný. Tento proces sa opakuje, kým nie sú všetky prvky vložené.

Tento algoritmus má tiež časovú zložitosť O(n^2), ale je efektívnejší pre zoznamy, ktoré sú už čiastočne usporiadané.

In [None]:
def insertion_sort(arr):
    for i in range(1, len(arr)):
        key = arr[i]
        j = i - 1
        while j >= 0 and key < arr[j]:
            arr[j + 1] = arr[j]
            j -= 1
        arr[j + 1] = key

test(insertion_sort)

#### Merge Sort
Merge Sort je efektívny algoritmus, ktorý využíva princíp rozdelenia a zlúčenia. Postupne delí zoznam na polovice, triedi ich a potom zlúči do výsledného usporiadaného zoznamu.

Tento algoritmus má časovú zložitosť O(n log n), čo ho robí efektívnym pre veľké zoznamy. Jeho hlavnou nevýhodou je potreba dodatočnej pamäte pre zlúčenie podzoznamov.

In [None]:
def merge_sort(arr):
    if len(arr) > 1:
        mid = len(arr) // 2
        L = arr[:mid]
        R = arr[mid:]
        merge_sort(L)
        merge_sort(R)
        i = j = k = 0
        while i < len(L) and j < len(R):
            if L[i] <= R[j]:
                arr[k] = L[i]
                i += 1
            else:
                arr[k] = R[j]
                j += 1
            k += 1
        while i < len(L):
            arr[k] = L[i]
            i += 1
            k += 1
        while j < len(R):
            arr[k] = R[j]
            j += 1
            k += 1

test(merge_sort)

#### Quick Sort
Quick Sort je založené na princípe rozdelenia a zjednotenia podľa pivotu. Zoznam je rozdelený na dve podmnožiny na základe pivotu a potom sú obe podmnožiny triedené rekurzívne.

Tento algoritmus má priemernú časovú zložitosť O(n log n) a je často jedným z najrýchlejších triediacich algoritmov. Jeho efektivita však môže klesať v prípade, že je zoznam veľmi nevyvážený.

In [None]:
def partition(array, low, high):
  pivot = array[high]
  i = low - 1
  for j in range(low, high):
    if array[j] <= pivot:
      i = i + 1
      (array[i], array[j]) = (array[j], array[i])

  (array[i + 1], array[high]) = (array[high], array[i + 1])
  return i + 1


def quick_sort(array, low, high):
  if low < high:
    pi = partition(array, low, high)
    quick_sort(array, low, pi - 1)
    quick_sort(array, pi + 1, high)

test(lambda arr: quick_sort(arr, 0, len(arr) - 1))

#### Heap Sort
Heap Sort je založené na štruktúre dát známej ako heap, ktorá umožňuje efektívne extrahovať a vkladať prvky. Princípom triedenia heapom je postupné odstraňovanie najvyššieho prvku a znovupostavenie heapu.

Tento algoritmus má časovú zložitosť O(n log n) a nevyžaduje dodatočnú pamäť ako Merge sort. Je vhodný pre triedenie veľkých dátových množín.

In [None]:
def heapify(arr, N, i):
    largest = i
    l = 2 * i + 1
    r = 2 * i + 2

    if l < N and arr[largest] < arr[l]:
        largest = l

    if r < N and arr[largest] < arr[r]:
        largest = r

    if largest != i:
        arr[i], arr[largest] = arr[largest], arr[i]

        heapify(arr, N, largest)


def heap_sort(arr):
    N = len(arr)

    for i in range(N // 2 - 1, -1, -1):
        heapify(arr, N, i)

    for i in range(N - 1, 0, -1):
        arr[i], arr[0] = arr[0], arr[i]
        heapify(arr, i, 0)


test(heap_sort)

Vizualizácia triediacich algoritmov
-----------------------------------

Vizualizácia triediacich algoritmov je užitočný nástroj na pochopenie ich fungovania a porovnanie ich efektivity.

In [None]:
from matplotlib.animation import FuncAnimation
import matplotlib.pyplot as plt
import random
import matplotlib as mp
from helper import *

n = 30
delay = 100
a = [i for i in range(1, n + 1)]
random.shuffle(a)

data_normalizer = mp.colors.Normalize()
color_map = mp.colors.LinearSegmentedColormap(
    "my_map",
    {
        "red": [(0, 1.0, 1.0), (1.0, 0.5, 0.5)],
        "green": [(0, 0.5, 0.5), (1.0, 0, 0)],
        "blue": [(0, 0.50, 0.5), (1.0, 0, 0)],
    },
)


def show(generator):
    plt.style.use("fivethirtyeight")
    plt.rcParams["animation.html"] = "jshtml"
    # plt.rcParams["figure.dpi"] = 150
    # plt.ioff()

    fig, ax = plt.subplots()
    rects = ax.bar(
        range(n), a, align="edge", color=color_map(data_normalizer(range(n)))
    )

    ax.set_xlim(0, n)
    ax.set_ylim(0, int(1.1 * n))

    text = ax.text(0.01, 0.95, "", transform=ax.transAxes)

    iteration = [0]

    def animate(A, rects, iteration):
        for rect, val in zip(rects, A):
            rect.set_height(val)

        text.set_text(f"iterations : {iteration[0]}")
        iteration[0] += 1

    return FuncAnimation(
        fig,
        func=animate,
        fargs=(rects, iteration),
        frames=generator(a.copy()),
        interval=delay,
        cache_frame_data=False,
    )


#### Vizualizácia Bubble Sortu

In [None]:
show(bubblesort)

#### Vizualizácia Selection Sortu

In [None]:
show(selectionsort)

#### Vizualizácia Insertion Sortu

In [None]:
show(insertionsort)

#### Vizualizácia Merge Sortu

In [None]:
show(lambda a: mergesort(a, 0, len(a) - 1))

#### Vizualizácia Quick Sortu

In [None]:
show(lambda a: quicksort(a, 0, len(a) - 1))

#### Vizualizácia Heap Sortu

In [None]:
show(heapsort)

Benchmarking a porovnanie
-------------------------

Benchmarking je dôležitý proces pri hodnotení výkonnosti triediacich algoritmov. Pomáha porovnať rôzne algoritmy podľa ich efektivity a vhodnosti pre konkrétne použitie.

### Úvod do benchmarkingu

Benchmarking zahŕňa vykonávanie rôznych experimentov s triediacimi algoritmami a zaznamenávanie ich výkonnosti podľa rôznych metrík, ako sú čas trvania triedenia, pamäťové nároky a stabilita algoritmu.

### Návrh benchmarkových experimentov

Dôležitou súčasťou benchmarkingu je správne navrhnutie experimentov. To zahŕňa vytvorenie rôznych testovacích sád s rôznymi typmi vstupných dát, ako aj rôznymi veľkosťami vstupov.

### Implementácia benchmarkingu

Po navrhnutí experimentov je potrebné implementovať benchmarkingový kód, ktorý spustí rôzne triediace algoritmy na testovacích dátach a zaznamená ich výsledky.

### Porovnanie výsledkov

Po vykonaní benchmarkingových experimentov je čas na porovnanie výsledkov a zhodnotenie výkonnosti jednotlivých algoritmov. Pri porovnávaní algoritmov by sa malo zohľadniť niekoľko faktorov, vrátane:

- Čas triedenia.
- Pamäťové nároky.
- Stabilita a robustnosť.

Implementácia
-------------

### Importy

In [None]:
import time
from statistics import mean
import pandas as pd
import matplotlib.pyplot as plt
from tqdm import tqdm

### Nastavenie testovacích dát

In [None]:
velkosti_testovacich_sad = [x for x in range(0, 3200, 200)]
pocet_opakovani_pre_jednu_velkost = 1

### Vytvorenie dataframe-u a testovacích dát

In [None]:
df = pd.DataFrame()
df["Velkost sady"] = velkosti_testovacich_sad
test_arrays = {
    i: [random.randint(1, 5000) for _ in range(i)] for i in velkosti_testovacich_sad
}

### Visualizačná funkcia

In [None]:
def visualise(name):
    global df
    # plt.figure(figsize=(10, 7))
    plt.plot(df["Velkost sady"], df[name], label=name)
    plt.legend()
    plt.title("Porovnanie časových náročností rôznych triedianích algoritmov")
    plt.xlabel("Veľkosť sady (n)")
    plt.ylabel("Čas (s)")
    plt.show()


### Benchmarkovacia funkcia

In [None]:
def benchmark(func, name):
    global velkosti_testovacich_sad, test_arrays, df

    times = []
    temp = []
    print(f"Benchmark pre {name}")
    for i in tqdm(velkosti_testovacich_sad, desc="Prebieha benchmarkovanie:"):
        for _ in range(pocet_opakovani_pre_jednu_velkost):
            start = time.time()
            func(test_arrays[i].copy())
            end = time.time()
            temp.append(end - start)
        times.append(mean(temp))
        temp = []
    df[name] = times
    visualise(name)


#### Benchmark Bubble Sortu

In [None]:
benchmark(bubble_sort, 'Bubble Sort')

#### Benchmark Selection Sortu

In [None]:
benchmark(selection_sort, "Selection Sort")

#### Benchmark Insertion Sortu

In [None]:
benchmark(insertion_sort, "Insertion Sort")

#### Benchmark Merge Sortu

In [None]:
benchmark(merge_sort, "Merge Sort")

#### Benchmark Quick Sortu

In [None]:
benchmark(lambda arr: quick_sort(arr, 0, len(arr) - 1), "Quick Sort")

#### Benchmark Heap Sortu

In [None]:
benchmark(heap_sort, "Heap Sort")

#### Uloženie výsledkov do data.csv

In [None]:
df.to_csv("data.csv", index=False)

#### Ich celkové porovnanie

In [None]:
df = pd.read_csv('data.csv')

plt.figure(figsize=(10, 7))
for i in df.columns[1:]:
    plt.plot(df["Velkost sady"], df[i], label=i)
plt.legend()
plt.title("Porovnanie časových náročností rôznych triedianích algoritmov")
plt.xlabel("Veľkosť sady (n)")
plt.ylabel("Čas (s)")
plt.show()


# Ďakujem za pozornosť!