In [None]:
from typing import List
import numpy
import time

## Selection Sort

Selection sort is een simpel, maar inefficient sorteeralgoritme. Als je een lijst probeert te sorteren in oplopende volgorde, moet het eerste element altijd het kleinste element zijn. In de eerste iteratie van selection sort selecteert het het kleinste element in de array en verwisselt deze met het eerste element van de array. De tweede iteratie selecteert het tweede kleinste item (deze is kleiner dan alle overige items in de array) en verwisselt deze met het tweede item van de array. Het algoritme gaat zo door tot het in de laatste iteratie het een-na-grootste element van de array met het item op de een-na-laatste plek van de array verwisselt.

In [None]:
def selection_sort(data: List[int]) -> None:
    """Sort an array using selection sort"""
    # loop over len(data) -1 elements
    for index1 in range(len(data)-1):
        smallest = index1 # first index of remaining array

        # loop to find index of smallest element
        for index2 in range(index1 + 1, len(data)):
            if data[index2] < data[smallest]:
                smallest = index2

        # swap smallest element into position
        data[smallest], data[index1] = data[index1], data[smallest]

## Insertion Sort

Insertion sort is een ander simpel, maar inefficient sorteeralgoritme. In de eerste iteratie van dit algoritme neemt het het tweede element van de array en verwisselt dit met het eerste element als het kleiner is dan het eerste element. In de tweede iteratie bekijkt het het derde element, en plaatst dit (insert) op de juiste plek tussen de eerste twee elementen. De eerste drie elementen zijn nu gesorteerd. Dit blijft het doen tot het alle overige elementen van de array heeft bekeken en op de juiste plek heeft gezet.

In [None]:
def insertion_sort(data: List[int]) -> None:
    """Sorting an array in place using insertion sort."""
    # loop over len(data) - 1 elements
    for next in range(1, len(data)):
        insert = data[next] # value to insert
        move_item = next    # location to place element

        # search for place to put current element
        while move_item > 0 and data[move_item - 1] > insert:
            # shift element right one slot
            data[move_item] = data[move_item - 1]
            move_item -= 1

        data[move_item] = insert # place inserted element

## Merge Sort

Merge sort is een efficient sorteeralgoritme, maar is conceptueel complexer om te begrijpen dan selection sort of insertion sort. Het merge sort algoritme sorteert door de array te splitsen in twee (ongeveer) evengrote subarrays. Het sorteert beide subarrays, en voegt ze dan samen in één grote array. De lastigheid zit natuurlijk in het samenvoegen. Neem aan dat het algoritme twee kleiner arrays heeft gesorteerd: 

 array1: 14  30  34  56  77

 array2: 15  20  51  52  93

Merge sort combineert deze twee arrays tot één grote, gesorteerde array. Het neemt daarvoor het kleinste element van het begin van beide subarrays, en plaatst dat in de resultaat array; dit herhaalt het tot beide subarrays leeg zijn. In het bovenstaande voorbeeld, neemt het dus eerst 14 uit array1, dan 15 uit array2, dan 20 uit array2, dan 30 uit array1, etc.

In [None]:
def merge_sort(xs: List[int]) -> None:
    """In place merge sort of array without recursive. The basic idea
    is to avoid the recursive call while using iterative solution.
    The algorithm first merge chunk of length of 2, then merge chunks
    of length 4, then 8, 16, .... , until 2^k where 2^k is large than
    the length of the array
    """

    unit = 1
    while unit <= len(xs):
        h = 0
        for h in range(0, len(xs), unit * 2):
            l, r = h, min(len(xs), h + 2 * unit)
            mid = h + unit
            # merge xs[h:h + 2 * unit]
            p, q = l, mid
            while p < mid and q < r:
                # use <= for stable merge merge
                if xs[p] <= xs[q]:
                    p += 1
                else:
                    tmp = xs[q]
                    xs[p + 1: q + 1] = xs[p:q]
                    xs[p] = tmp
                    p, mid, q = p + 1, mid + 1, q + 1

        unit *= 2

def merge_arrays(array1: List[int], array2: List[int]) -> List[int]:
    """Recursively merge two arrays into one sorted array"""
    if len(array1) == len(array2) == 0: # done when both arrays are empty
        return []
    else:
        if len(array1) == 0: # if either array is empty
            head, *tail = array2
            return [head] + merge_arrays(array1, tail) # merge the remainder of the non-empty list
        elif len(array2) == 0: # idem for the other array
            head, *tail = array1
            return [head] + merge_arrays(tail, array2)
        else: # when both still have elements
            head1, *tail1 = array1
            head2, *tail2 = array2
            if head1 < head2: # select the smallest
                return [head1] + merge_arrays(tail1, array2) # and merge with the remainder
            else:
                return [head2] + merge_arrays(array1, tail2) # idem for when array 2 had the smaller element

# Complexitiet analyse

Een analyse van de complexiteit

In [None]:
def personal_timer(sort_algorime,list_of_list_to_sort):
   list_with_times = []
   for current_list in list_of_list_to_sort:
      start = time.perf_counter()
      sort_algorime(current_list)
      end = time.perf_counter()
      list_with_times.append(f"{end - start :0.4f}")

   return list_with_times

In [None]:
random_duizend        = numpy.random.rand(1000)
random_tienduizend    = numpy.random.rand(10000)
random_dertigduizend  = numpy.random.rand(30000)

list_with_times_to_sort = [random_duizend,random_tienduizend,random_dertigduizend]

selection_random = personal_timer(selection_sort,list_with_times_to_sort)
insertion_random = personal_timer(insertion_sort,list_with_times_to_sort)
merge_random     = personal_timer(merge_sort,list_with_times_to_sort)


print("""
                  Random
               1000    |    10000    |    30000
Selection |   {}   |   {}   |   {}
Merge     |   {}   |   {}    |   {}
Insertion |   {}   |   {}    |   {}

""".format(selection_random[0],selection_random[1],selection_random[2],
           merge_random[0],merge_random[1],merge_random[2],
           insertion_random[0],insertion_random[1],insertion_random[2]))



#Question 2 reverse the list
  
reversed_duizend = random_duizend[::-1]
reversed_tienduizend = random_tienduizend[::-1]
reversed_dertigduizend = random_dertigduizend[::-1]

reversed_list_to_sort = [reversed_duizend,reversed_tienduizend,reversed_dertigduizend]

selection_random = personal_timer(selection_sort,reversed_list_to_sort)
insertion_random = personal_timer(insertion_sort,reversed_list_to_sort)
merge_random     = personal_timer(merge_sort,reversed_list_to_sort)


print("""
                 everse R
               1000    |    10000    |    30000
Selection |   {}   |   {}   |   {}
Merge     |   {}   |   {}    |   {}
Insertion |   {}   |   {}    |   {}

""".format(selection_random[0],selection_random[1],selection_random[2],
           merge_random[0],merge_random[1],merge_random[2],
           insertion_random[0],insertion_random[1],insertion_random[2]))



Big O

Selection sort

    Best case    = O(n^2)
    Average case = O(n^2)
    Worst case   = O(n^2)

Insertion sort

    Best case    = O(n)
    Average case = O(n^2)
    Worst case   = O(n^2)

Merge
    
    Best case    = O(n log n)
    Average case = O(n log n)
    Worst case   = O(n log n)


## Vraag: Maakt het voor de complexiteit (Big O) van een algoritme uit of je een iteratieve of een recursieve versie beschouwd?

Nee voor Big O maakt het niet uit. De hoeveelheid operaties is (theoretisch) nogsteeds het zelfde. Voor andere vormen van complexittiet maakt het wel uit bij bijvoorbeeld memory complexiteit

