# Threaded Merge Sort

- Ontwerp op papier (a.h.v. een voorbeeld van een array van, zeg, 8 getallen) hoe je door middel van 1, 2, 4, 8 cores/processen/threads/... via het merge sort algoritme een lijst kan sorteren. Denk hierbij goed na over hoe je de data distribueert over de verschillende processen, en hoe je de resultaten ook weer efficient samen brengt.

![threaded_merge_sort.png](attachment:threaded_merge_sort.png)

![different_threads.png](attachment:different_threads.png)

- Analyseer je ontwerp, en bepaal wat de complexiteit van deze implementatie van merge sort is. Is deze vergelijkbaar met die we vorige keer hebben bepaald? Zo nee, waar ligt dat aan?
        
        - Het principe van de merge sort blijft vrijwel hetzelfde omdat de hoofd-lijst 
        nog steeds wordt gesplitst in meerdere sub-lijsten. Echter wordt er nu gebruik 
        gemaakt van verschillende threads over deze verschillende splitsingen wat
        eigenlijk het proces van het algoritme versnelt en deze nu efficienter is dan
        de vorige merge sort. 
        
        - Merge sort neemt merge-stappen van log n omdat elke merge stap de lijst-grootte verdubbelt. 
        De tijdscomplexiteit is daarom O(n log n)
        
        - Conclusie: run-time van het algoritme wordt versneld maar de tijdscomplexiteit 
        blijft hetzelfde. 
       

- Bepaal de communicatie overhead van je ontwerp: als je aanneemt dat elke opsplitsing van de lijst, elke verplaatsing van data naar een ander process en elke samenvoeging van lijsten even lang duren (allemaal een bepaalde tijd eenheid), hoe verhoudt de hoeveelheid communicatie zich dan tot het aantal ingezette processoren en tot de grootte van de lijst?
                - Het merge-sort algoritme kan een array verdelen in N/P elementen. N staat voor
                  de grootte van de lijst en P voor het aantal processen/threads.
                              - bv. lijst van 8 integers en 2 processen = 8/2 = 4
                  Het gebruiken van meerdere threads zorgt voor betere resultaten,
                  de totale tijd reduceert namelijk. Echter zal er er een kantel-moment komen
                  waarin meerdere processen zorgen voor een communicatie overhead. Dit gebeurt wanneer
                  de gesorteerde sub-lijsten weer gemerged worden tot een geheel nieuwe gesorteerde
                  lijst. Door meerdere processen te gebruiken is de risico op zo'n communicatie overhead
                  daarom groter.
                  
                  Bron: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.91.1604&rep=rep1&type=pdf

- Maak een PoC implementatie in Python door middel van de threading of multiprocessing module. Bepaal testmatig wat de run-time complexiteit van je implementatie is bij gebruik van 1, 2, 4, ... threads/processen. Plot deze in een grafiek.

# Proof of Concept - Threaded Merge Sort

In [31]:
from random import randint
from typing import List
from threading import Thread
import numpy as np

In [15]:
def generate_array(size=8,max=100):
    """Create an array of lenght 'size' containing random numbers from the range 0 up to 'max' """
    return [randint(0,max) for _ in range(size)]

In [3]:
def merge(left: int, right: int):
    "Merge the sublists"
    lijst = []
    
    l=0
    r=0
    
    while l < len(left) and r < len(right):
        if left[l] <= right[r]:
            lijst.append(left[l])
            l += 1
        else:
            lijst.append(right[r])
            r += 1
    if l == len(left):
        lijst.extend(right[r:])
    else:
        lijst.extend(left[l:])
    
    return lijst

In [5]:
def merge_sort(lijst: List[int])-> None:
    """Merge sort"""
    if len(lijst) <=1: 
        return lijst

    left = merge_sort(lijst[:len(lijst) // 2 ])
    right = merge_sort(lijst[len(lijst) // 2:])

    return merge(left,right)

In [39]:
def threaded_merge_sort(lijst):
    threads = [1,2,4,8]
    for i in threads:
        lists = np.array_split(lijst,i)
        
    