# Multiprocessing in Python
## Mapping: Gebruik al je processor cores voor snellere code!

In tijden waarin meer berekening meer geld betekent is het van essentieel belang dat de code die je uitvoerd zo optimaal mogelijk is! Het bekende gezegde: tijd is geld, geldt in deze tijd ook. Met gebruik van mapping is het mogelijk om taken te verdelen over alle processor cores. Moet je voorstellen dat je één taak hebt zoals tuinieren met je nieuwe tuinbroek. In totaal heb je 4 tuinieren, zou je dan 1 tuinier willen gebruiken terwijl de andere koffie kunnen leuten of zou je alle tuinieren aan het werk willen zetten zodat de klus sneller geklaard is. <br>
Hetzelfde geld voor je cores. Als je er 4 beschikbaar hebt, dan wil je er toch ook 4 gebruiken (of misschien 3 als je nog meer processen aan het uitvoeren bent). Dit is het doel van mapping. <br>
<br>
    Stel we hebben de volgende simpele taak. We willen alle getallen van 0 tot 100 kwadrateren en bij elkaar optellen. Dit willen we 100000 keer doen. Daarvoor krijg je de volgende code.

In [2]:
from time import time
def f(n):
    s = 0
    for x in range(100):
        s += x*x
    return s

n = 100000
t1 = time()
results = []
for i in range(n):
    results.append(f(i))
print("Serial processing took: {:.3f}s".format(time()-t1))

Serial processing took: 1.602s


Dit duurt ongeveer 3 seconden om alle berekeningen achter elkaar te doen. Als we dit paralel willen doen, dan krijgen we de volgende code:

In [3]:
import multiprocessing as mp
from f import f # in jupyter moet de functie in een .py bestand staan. Dit hoeft niet in spyder of visualstudio

if __name__ == "__main__":
    t2 = time()
    # maak Pool class aan
    p = mp.Pool(4) #input = aantal processors
    results2 = p.map(f, range(n)) # input = (functie, iterator)
    p.close()
    p.join()
    print("Paralel processing took: {:.3f}s".format(time()-t2))

Paralel processing took: 7.667s


Er is wel wat verschil te zien, maar die is niet super groot. Dit komt omdat de Pool library wat "opstarttijd" nodig heeft. Bij meer berekeningen zal het verschil groter worden!

In [4]:
n = 10000
iterat = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
if __name__ == "__main__":
    t2 = time()
    # maak Pool class aan
    p = mp.Pool(4) #input = aantal processors
    results2 = p.map(f, iterat) # input = (functie, iterator)
    p.close()
    p.join()
    print("Paralel processing took: {:.3f}s".format(time()-t2))
    
    t1 = time()
    results = []
    for i in range(n):
        results.append(f(i))
    print("Serial processing took: {:.3f}s".format(time()-t1))

KeyboardInterrupt: 