# RAuT2
## Sortiranje - 2

#### Aleksandar Minja <br> Novembar 2019

U prošlom predavanju smo videli da možemo dizajnirati algoritam za sortiranje čija je kompleksnost $\Theta(N \log N)$. Takođe smo videli da insertion sort ima kompleksnost $\Theta(N^2)$. Upotrebom binarne pretrage, možemo smanjiti broj poređenja na $\Theta(N \log N)$, ali broj pomeraja je i dalje $\Theta(N^2)$. 

### Merge Sort

Jedan od najznačajnih algoritama za sortiranje jeste Merge sort (sr. sortiranje spajanjem) algoritam, koji deli niz na podnizove dužine $1$ (koji se smatraju da su sortirani), i zatim rekurzivno spaja podnizove u veće sortirane podnizove, sve dok ne dobije sortirani niz dužine $N$.

![](https://upload.wikimedia.org/wikipedia/commons/thumb/e/e6/Merge_sort_algorithm_diagram.svg/1236px-Merge_sort_algorithm_diagram.svg.png)

Merge sort procedura je veoma jednostavna:
1. ako je ulaz niz dužine 1, vrati niz, 
2. u suportnom podeli niz na dva podniza i rekurzivno pozovi proceduru za svaki od njih.  
3. spoji dva podniza i vrati rezultat

Centralni deo algoritma jeste `merge` procedura.

In [None]:
var x = new int[10];
var r = new Random();
for(var i = 0; i < 10; ++i)
    x[i] = r.nextInt(10);

for(var xx : x)
    System.out.print(xx + " ");
    
int[] y = Arrays.copyOfRange(x, 0, 3);

System.out.print("\n");
for(var yy : y)
    System.out.print(yy + " ");

In [None]:
int[] merge(int L[], int R[]) {
    var sl = L.length; //size left
    var sr = R.length; //size right
    
    int res[] = new int[sl + sr];
    
    var cntL = 0; //count left
    var cntR = 0; //count right
    for(var i = 0; i < sl + sr; ++i) {
        if(cntL < sl && cntR < sr)
            if(L[cntL] < R[cntR])
                res[i] = L[cntL++];
            else
                res[i] = R[cntR++];
        else
            if(cntL < sl)
                res[i] = L[cntL++];
            else
                res[i] = R[cntR++];
    }
    
    return res;
}

In [None]:
import java.util.Arrays; 
int[] mergeSort(int[] arr) {
    if(arr.length == 1)
        return arr;
    
    int m = arr.length/2; 
            
    var L = mergeSort(Arrays.copyOfRange(arr, 0, m));
    var R = mergeSort(Arrays.copyOfRange(arr, m, arr.length));
        
    return merge(L, R);
}

In [None]:
var a = mergeSort(x);

In [None]:
for(var aa : a)
    System.out.print(aa + " ");

Merge procedura spaja dva podniza u veći niz i ima kompleksnost $\Theta(N)$. Kako svaki put delimo niz na dva podniza, ukupna kompleksnost je $\Theta(N \log N)$.

$$T(N) = \Theta(1) + 2\cdot T(N/2) + \Theta(N)$$

Da li možemo da ubrzamo merge rutinu upotrebom binarne pretrage?

### QuickSort

Slično kao i Merge Sort, i ovaj algoritam deli problem sortiranja na manje podprobleme i onda njih rešava. QuickSort je veoma značajan algoritam koji se koristi u većini programskih jezika. Osnovna ideja QuickSort algoritma jeste da odaberemo jedan element - *pivot* i zatim da poređamo sve manje elemente sa njegove leve strane, a sve veće elemente sa desne strane - ova operacija se zove **partition**, i radi se u linearnom vremenu. Postoji nekoliko načina da odaberemo pivot, npr:
1. Uvek biramo najveći element
2. Uvek biramo najmanji element
3. Biramo element na slučaj 
4. Biramo medijan

![](https://www.geeksforgeeks.org/wp-content/uploads/gq/2014/01/QuickSort2.png)

In [None]:
var x = new int[10];
for(var i = 0; i < 10; ++i)
    x[i] = r.nextInt(10);

for(var xx : x)
    System.out.print(xx + " ");


In [None]:
void swap(int x[], int i, int j) {
    var pom = x[i];
    x[i] = x[j];
    x[j] = pom;
}

int partition(int arr[], int lo, int hi) {
    var pivot = arr[hi];
    var i = lo - 1;
    for(var j = lo; j < hi; ++j) {
        if(arr[j] < pivot){
            ++i;
            swap(arr, i, j);
        }
    }
    swap(arr, i + 1, hi);
    return i + 1;
}

In [None]:
void quickSort(int x[], int lo, int hi) {
    if(lo < hi){
        var p = partition(x, lo, hi);
        quickSort(x, lo, p - 1);
        quickSort(x, p + 1, hi);
    }
}

In [None]:
quickSort(x, 0, x.length - 1);
for(var xx : x)
    System.out.print(xx + " ");

Kolika je komplkesnost quickSort algoritma?
Od čega zavisi kompleksnost? 

$$T(N) = T(k) + T(N-K-1) + \Theta(N)$$

U gornjoj formuli, k predstavlja indeks pivota.

Ukoliko uvek biramo najveći ili najmanji element za pivota, tada imamo:

$$T(N) = T(0) + T(N-1) + \Theta(N)$$

Ukoliko uvek biramo srednji element u nizu, imamo:

$$T(N) = 2 \cdot T(N/2) + \Theta(N)$$

Kako je moguće ubrzati QuickSort algoritam?

### TimSort

Izmisljen 1993, a prvi put implementiran 2004 za potrebe python programskog jezika. Danas je glavni algoritam za sortiranje nizova u JAVA i python programskom jeziku. TimSort kombinuje insertion sort i merge sort algoritme, tako što niz delije na male podnizove, unapred definisane dužine, koji se nazivaju run-s, koje zatim sortira pomoću insertion sort algoritma. Nakon sortiranja, iterativno spaja manje podnizove u veće pomoću **merge** procedure. Insertion sort, iako ima $\Theta(N^2)$ kompleksnost, veoma je efikasan za sortiranje malih nizova, dok je **merge** veoma efikasan za spajanje dva sortirana podniza u novi sortirani niz.



In [None]:
void insertionSort(int x[], int l, int h) {
    for (var i = l + 1; i <= h; i++)  
    { 
        var key = x[i];
        var j = i - 1;

        while(j >= l && x[j] > key){
            x[j+1] = x[j];
            --j;
        }
        x[j+1] = key;
    }
}

void merge(int arr[], int l, int m, int r) { 
    int n1 = m - l + 1; 
    int n2 = r - m; 

    int L[] = new int [n1]; 
    int R[] = new int [n2]; 

    for (int i=0; i<n1; ++i) 
        L[i] = arr[l + i]; 
    for (int j=0; j<n2; ++j) 
        R[j] = arr[m + 1+ j]; 

    int i = 0, j = 0; 

    int k = l; 
    while (i < n1 && j < n2) 
    { 
        if (L[i] <= R[j]) 
        { 
            arr[k] = L[i]; 
            i++; 
        } 
        else
        { 
            arr[k] = R[j]; 
            j++; 
        } 
        k++; 
    } 

    while (i < n1) 
    { 
        arr[k] = L[i]; 
        i++; 
        k++; 
    } 

    while (j < n2) 
    { 
        arr[k] = R[j]; 
        j++; 
        k++; 
    } 
}

In [None]:
var x = new int[32];
for(var i = 0; i < 32; ++i)
    x[i] = r.nextInt(10);

for(var xx : x)
    System.out.print(xx + " ");

In [None]:
var RUN = 4;
for (int i = 0; i < x.length; i += RUN)  
{ 
    insertionSort(x, i, Math.min((i + RUN-1), (x.length - 1))); 
} 

for (int size = RUN; size < x.length; size = 2 * size)  
{ 
    for (int left = 0; left < x.length; left += 2 * size)  
    { 
        int mid = left + size - 1; 
        int right = Math.min((left + 2 * size - 1), (x.length - 1)); 
        
        merge(x, left, mid, right); 
    } 
} 

for(var xx : x)
    System.out.print(xx + " ");

Ako je dužina run-a $R$, konstanta, tada je kompleksnost insertion sort koraka 

$$O\left(L\cdot L \cdot \frac{N}{L}\right) = O(L\cdot N) = O(N)$$

Merge procedura takođe ima linearnu kompleksnost. 

Koliko puta će se pozvati merge procedura? 

Koja je kompleksnost TimSort algoritma?



#### Reference i slike:
1. https://en.wikipedia.org/wiki/Merge_sort
2. https://www.geeksforgeeks.org/merge-sort/
3. https://www.geeksforgeeks.org/iterative-merge-sort/
4. https://www.geeksforgeeks.org/quick-sort/
5. https://www.geeksforgeeks.org/iterative-quick-sort/
6. https://www.geeksforgeeks.org/timsort/