# Complexiteit van sorteren
Er zijn diverse soorten sorteer-algoritmen. 
In deze opgave gaan we een aantal van deze algoritmen op hun run time efficiëntie vergelijken; 
eerst door het draaien van een paar tests, vervolgens door analyse van de code (complexiteitsanalyse).
Bron: https://canvas.hu.nl/courses/7560/assignments/69747 

In [20]:
import numpy as np
import pandas as pd
from typing import List
import sys
import timeit
sys.path.append('/Users/wolfsinem/High-Performanced-Programming/functions/')

from sort_functions import selection_sort, recursive_selection_sort, insertion_sort, recursive_insertion_sort, merge_sort2, recursive_merge_sort, merge_arrays, recursive_insertion
# %load_ext line_profiler #load line profiler extension
# %lprun -f selection_sort selection_sort(lijst_1)

#### Random lijsten genereren om de tests op uit te voeren

In [2]:
def random_list(num_steps):
    return list(np.random.sample(num_steps))

list1 = random_list(1000)
list2 = random_list(10000)
list3 = random_list(30000)

lists = [list1,list2,list3]

In [3]:
"""function that can be used for each algorithm to measure the execution time"""
def set_time(function,list_):
    for i in list_:
        start_time = timeit.default_timer()
        function(i)
        print('This algorithm took {:.4f} seconds'.format((timeit.default_timer() - start_time)))

In [9]:
# sorted list
sorted_list = [np.arange(1,30001,1)]

# reversed list
reversed_list = sorted_list[::-1]

### Selection sort

In [5]:
set_time(selection_sort,lists)

This algorithm took 0.0435 seconds
This algorithm took 3.8715 seconds
This algorithm took 35.4964 seconds


- selection sort with sorted list

In [10]:
set_time(selection_sort,sorted_list)

This algorithm took 138.1180 seconds


- selection sort with reversed list 

In [11]:
set_time(selection_sort,reversed_list)

This algorithm took 136.6490 seconds


### Insertion sort

In [16]:
set_time(insertion_sort,lists)

This algorithm took 0.0002 seconds
This algorithm took 0.0030 seconds
This algorithm took 0.0080 seconds


- insertion sort with sorted list

In [17]:
set_time(insertion_sort,sorted_list)

This algorithm took 0.0146 seconds


- insertion sort with reversed list

In [18]:
set_time(insertion_sort,reversed_list)

This algorithm took 0.0139 seconds


### Merge sort

In [21]:
set_time(merge_sort2,lists)

This algorithm took 0.0015 seconds
This algorithm took 0.0203 seconds
This algorithm took 0.0498 seconds


- merge sort with sorted list

In [24]:
set_time(merge_sort2,sorted_list)

This algorithm took 0.1028 seconds


- merge sort with reversed list

In [25]:
set_time(merge_sort2,reversed_list)

This algorithm took 0.1071 seconds


### Tabel met alle uitkomsten

| list | selection_sort | insertion_sort | merge_sort |
|------:|----------------|----------------|------------|
| 1000  | 0.0435              | 0.0002              | 0.0015          |
| 10000 | 3.8715              | 0.0030              | 0.0203          |
| 30000 | 35.4964              | 0.0080              | 0.0498          |



| list | selection_sort | insertion_sort | merge_sort |
|------:|----------------|----------------|------------|
| sorted  | 138.1180              | 0.0146              | 0.1028          |
| reversed | 136.6490              | 0.0139              | 0.1071          |


## Theorie
<i> Bekijk / bepaal aan de hand van de algoritmes (en beschrijvingen) hierboven, wat de theoretische run time efficiëntie (Big O) van elk van deze algoritmes is. Bepaal hiervoor 'best case', 'worst case' en 'average case' run time efficiëntie. </i>

### selection_sort
- best case: O(n^2)
- worst case: O(n^2) 
- average case: O(n^2)

De methode werkt als volgt:
- zoekt de kleinste waarde in de lijst
- verwisselt het met de eerste waarde in de lijst
- herhaalt de bovenstaande stappen met de rest van de lijst

----

### insertion_sort
- best case: O(n)
- worst case: O(n^2)
- average case: O(n^2)

De methode werkt als volgt:
- de eerste twee elementen uit de set worden gesorteerd
- als deze op de plaats staan wordt het derde element toegevoegd
- bovenstaande stappen worden herhaald totdat alle elementen op hun plaats zijn gezet

----

### merge_sort
- best case: O(nlog(n))
- worst case: O(nlog(n)) 
- average case: O(nlog(n))

De methode werkt als volgt:
- een lijst met getallen wordt in twee gelijke delen verdeeld (kan ook oneven zijn)
- de sub-lijsten worden vervolgens ook verdeeld totdat je twee elementen met elkaar vergelijkt en op de juiste plaats zet
- de sub-lijsten worden elk gesorteerd en op het eind worden de twee sub-lijsten samengevoegd 

Er worden altijd 2n verplaatsingen van array-elementen gedaan.


<b>Maakt het voor de complexiteit (Big O) van een algoritme uit of je een iteratieve of een recursieve versie beschouwt?</b>

Hoewel er een verschil zit in gebruik van een iteratieve en recursieve methode maakt het voor de Big O complexiteit niet uit welke methode je beschouwt. De tijd complexiteit blijft enigszins hetzelfde maar zal het verschil meer liggen in 'space complexity'.

- Stel je maakt gebruik van een algoritme, dan zal deze dezelfde volgordelijke stappen ondernemen voor zowel een iteratieve als recursieve methode.