# Algoritmische technieken: strategiën om gegevens te sorteren

#### De complexiteit van een algoritme
De complexiteit van een algoritme geeft aan hoe efficiënt een functie is in tijd en ruimte. Meestal wordt gebruik gemaakt van een asymptotische notatie, de <b>Big-O</b> notatie, die het worst-case scenario beschrijft. 
##### Tijdcomplexiteit
Wanneer je het hebt over tijdcomplexiteit gaat het over het aantal vergelijkingsopdrachten en het doorlopen van de lussen in jouw implementatie, en hoe dat aantal toeneemt bij een toenemend aantal elementen in de invoer. Waneer bijvoorbeeld een lus twee keer volledig wordt doorlopen zoals in het codestukje hieronder spreek je over een complexiteit $O(n^2)$.

In [1]:
def een_functie(n):
    iteraties = 0
    for i in range(n):
        for j in range(n):
            iteraties = iteraties + 1
            
    print("n² =", n**2)
    print("Aantal iteraties =", iteraties)

een_functie(10)

n² = 100
Aantal iteraties = 100


#### Ruimtecomplexiteit
Ruimtecomplexiteit bespreekt, het asymptotische maximum van het geheugengebruik van een functie in vergelijking tot het aantal elementen in de invoer. Wordt er geen extra geheugen toegewezen, spreek je van ruimtecomplexiteit $O(1)$. Dit kan enkel het geval zijn bij iteratieve algoritmen, waardoor deze algoritmen het meest geschikt zijn voor platformen waar geheugengebruik een belangrijk aandachtspunt is zoals embedded systemen.

### Enkele algoritmen voor het sorteren van gegevens
Lineair zoeken is de enige oplossing wanneer je werkt met niet gesorteerde gegevens, wil je sneller zoeken in de gegevens dan moet je beschikken over gesorteerde gegevens. Het sorteren op zich gaat steeds gepaard met een complexiteit die in de meest ideale gevallen neerkomt op $O\left(n\cdot \text{log}(n) \right)$. Het is dus niet altijd verstandig om de gegevens te sorteren wanneer je slechts een beperkt aantal keer moet zoeken in de gegevens.  
#### Eenvoudig bubbel-sorteren
Een eenvoudig sorteeralgoritme is het bubbelsorteeralgoritme, het dankt zijn naam aan het effect dat de grootste waarden in de gegevenslijst naar boven borrelen zoals de bubbels in een glas frisdrank. Mede dankzij zijn eenvoud is het algoritme echter niet efficiënt en is de tijdscomplexiteit opgegeven als $O(n^2)$.
Het bubbelsorteeralgoritme itereert door de gegevens en vergelijkt $L[n]$ en $L[n+1]$ is de waarde met index $n$ groter dan die met index $n+1$ worden beiden van plaats verwisseld. Vervolgens wordt de iterator n opgehoogt. en herhaalt de cyclus. Na de eerste volledige iteratie staat de allergrootste waarde uit de lijst achteraan in de lijst. Dat deel van de lijst is dan geordend, en wordt tijdens de daarop volgende iteratie niet meer doorlopen.  Onderstaande animatie verduidelijkt de werkwijze.
<p style="text-align:center;"><img src="Sorting_bubblesort_anim.gif"></p>

In [32]:
def bubbel_sort(lijst):
    iteraties = 0
    print("Start", iteraties, "iteraties: \t", lijst )

    # Laat j waarden aannemen van 1 tot de lengte van de lijst 
    for j in range(1, len(lijst)):
        for i in range(len(lijst)-j):
            if lijst[i] > lijst[i+1]:
                lijst[i], lijst[i+1] = lijst[i+1], lijst[i]

            iteraties += 1
            print("Na", iteraties, "iteraties: \t", lijst )
    return lijst

In [33]:
bubbel_sort([5,4,3,2,1])

Start 0 iteraties: 	 [5, 4, 3, 2, 1]
Na 1 iteraties: 	 [4, 5, 3, 2, 1]
Na 2 iteraties: 	 [4, 3, 5, 2, 1]
Na 3 iteraties: 	 [4, 3, 2, 5, 1]
Na 4 iteraties: 	 [4, 3, 2, 1, 5]
Na 5 iteraties: 	 [3, 4, 2, 1, 5]
Na 6 iteraties: 	 [3, 2, 4, 1, 5]
Na 7 iteraties: 	 [3, 2, 1, 4, 5]
Na 8 iteraties: 	 [2, 3, 1, 4, 5]
Na 9 iteraties: 	 [2, 1, 3, 4, 5]
Na 10 iteraties: 	 [1, 2, 3, 4, 5]


[1, 2, 3, 4, 5]

Het bubbel sorteer algoritme wordt hierboven geïllustreerd met een korte ongesorteerde lijst. <br> Het moet gezegd, dat ondanks de eerder nadelige tijdcomplexiteit van het algoritme, de geheugenimpact van het algoritme met $O(1)$ het beste in zijn soort is. Dit kan je makkelijk inzien omdat er geen nieuwe lijsten worden aangemaakt en alle bewerkingen in de bestaande lijst worden uitgevoerd.

#### Een ander eenvoudig sorteeralgoritme: insertion sort
Een ander, intuïtief, eenvoudig sorteeralgoritme is het insertion sort algoritme. Dit algoritme of het bubbelsortalgoritme is overigens het algoritme dat programmeursleerlingen opstellen als je hen de opdracht geeft een algoritme uit te werken om een lijst van 10 waarden te sorteren. 
<p style="text-align:center;"><img src="insertionsort.png"></p>
Bovenstaande figuur illustreert de werking van het insertion sort algoritme. De werking is net zoals bij bubble sort gebaseerd op twee geneste lussen maar waar het bubblesort van het begin tot het einde itereert met de grootste overblijvende waarden itereert insertionsort tot er een waarde gevonden wordt die kleiner is dan voorgaande. Dan start een tweede iteratie van de huidige positie in de lijst tot die waarde op zijn correcte locatie staat. 

Het framework van de insertionsortfunctie is vergelijkbaar met dat van bubble_sort:
````python
def insertion_sort(lijst):
    # Itereer door alle waarden van de lijst
    for j in range(1, len(lijst)):
        # Als elmement i < i - 1, verwissel beiden van plaats
````
Maar in de tweede iteratie zal je, waar bubble_sort de grootste waarde naar achteren in de lijst verplaatst, nu de kleinere waarden naar vooraan verplaatsen. De lijst wordt daarom van beneden naar boven gesorteerd, terwijl bij bubble de grootste waarden naar achteren bubbelen en daar de gesorteerde lijst ontstaat. Onderstaande animatie verduidelijkt de werking van insertion_sort.
<p style="text-align:center;"><img src="insertion_sort.gif"></p>

#### Oefening: schrijf zelf een implementatie voor insertion_sort
Ga je ook even na:
<ul>
    <li>Hoeveel iteraties insertion_sort gebruikt voor een bijna gesorteerde lijst,</li>
    <li>Wat is het worst case voor zowel bubble_sort als insertion_sort,</li>
    <li>Welk van beide algoritmen presteert over het algemeen het beste.</li>
</ul>

### Recursief sorteren
Naast iteratief sorteren bestaan er ook recursieve algoritmen die het aantal iteraties drastisch reduceren, al gaat het reduceren van de iteraties dan wel gepaard met recursies (hier later meer over). 
#### Quick_sort
Het quick_sort algoritme draait om het opdelen van de datastructuur rond een pivot (spil) 
<p style="text-align:center;"><img src="quick_sort_hoare.gif"></p>
Vervolgens wordt de lijst verdeeld rond de spil. Een deel van de lijst dat kleiner of gelijk is aan de spil en een deel dat groter is dan de spil.<br>
Daarop worden de beide bekomen lijsten opnieuw gesorteerd met de quick_sort functie.
De resultaat lijst is de concatenatie van de "kleiner of gelijk aan spil" lijst, de spil en de "groter dan spil" lijst.

### Oefening
<ol>
    <li>Zoek op het intenet een ander sorteeralgoritme op en schrijf een implementatie voor dat algoritme, vergelijk het algoritme met de besproken algoritmen.</li>
    <li>Ga na hoe efficiënt de besproken algoritmen zijn in tijd en ruimte.</li>
    <li>...</li>
</ol>