<a href="https://colab.research.google.com/github/BaseKan/optimisation_workshop/blob/main/vectorisatie.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Setup

In [1]:
import os
import numpy as np
from math import sin,tan,cos

We definieren eerst een decorator functie om het geheugengebruik en de gebruikte tijd te meten.

Een decorator is een functie die een andere functie als invoer gebruikt en een aangepaste versie van die functie teruggeeft.

In dit geval wordt voor en na de functie aanroep de tijd en het geheugengebruik gemeten, waarna het verschil wordt geprint. Het resultaat van de originele functie wordt aan het einde teruggegeven.

In [2]:
!pip install memory_profiler

Collecting memory_profiler
  Downloading https://files.pythonhosted.org/packages/8f/fd/d92b3295657f8837e0177e7b48b32d6651436f0293af42b76d134c3bb489/memory_profiler-0.58.0.tar.gz
Building wheels for collected packages: memory-profiler
  Building wheel for memory-profiler (setup.py) ... [?25l[?25hdone
  Created wheel for memory-profiler: filename=memory_profiler-0.58.0-cp37-none-any.whl size=30180 sha256=0ba0fc2e2c59682943b9fe36778e1266d84eb340b250b28493caa549f25f09ff
  Stored in directory: /root/.cache/pip/wheels/02/e4/0b/aaab481fc5dd2a4ea59e78bc7231bb6aae7635ca7ee79f8ae5
Successfully built memory-profiler
Installing collected packages: memory-profiler
Successfully installed memory-profiler-0.58.0


In [3]:
import memory_profiler
import time

def time_mem_decorator(func):                                                                                            
    def out(*args, **kwargs):                                                                                            
        m1 = memory_profiler.memory_usage()
        t1 = time.time()
        
        result = func(*args, **kwargs)
        
        t2 = time.time()
        m2 = memory_profiler.memory_usage()
        time_diff = t2 - t1
        mem_diff = m2[0] - m1[0]
        print(f"It took {time_diff} Secs and {mem_diff} Mb to execute this function.")
        return(result)
    return out  

# Berekening met een for loop

We definieren een berekening die moet worden uitgevoerd voor alle waardes in een array.

In [4]:
@time_mem_decorator
def double_array(a):
  for i in range(len(a)):
    a[i] *= 2

  return a

In [5]:
a = np.arange(0,1000000) 
a = double_array(a)

It took 0.5255157947540283 Secs and 0.18359375 Mb to execute this function.


Dit soort simpele operaties kunnen in veel talen in 1 keer worden uitgevoerd over alle waardes in de array. Je computer heeft hier vector operaties voor, waardoor waardoor een operatie voor meerdere waardes in een vector (array) parallel wordt uitgevoerd. 

In [6]:
@time_mem_decorator
def double_array_vec(a):
  return a * 2

In [7]:
a = np.arange(0,1000000) 
a = double_array_vec(a)

It took 0.004512310028076172 Secs and 0.0 Mb to execute this function.


# Vectorizeren van een Functie

Voor deze opdracht voeren we een ingewikkeldere berekening uit met twee grote numpy arrays.

In [8]:
def complicated_calculation(x,y):
  if x > 0.5*y and y < 0.3:
      res = sin(x-y)
  elif x < 0.5*y:
      res = tan(x+y)
  elif x > 0.2*y:
      res = sin(x)*np.sin(y)
  else:
      res = cos(x/(0.1+abs(y)))
  return res

In [9]:
@time_mem_decorator
def get_results(x,y):
    results = []
    for i in range(len(x)):
        x_val = x[i]
        y_val = y[i]
        results.append(complicated_calculation(x_val,y_val))
    return results

In [10]:
x = np.random.randn(int(1e6))
y = np.random.randn(int(1e6))

In [11]:
res = get_results(x,y)

It took 1.3677394390106201 Secs and 47.8203125 Mb to execute this function.


Door gebruik te maken van numpy kan het veel sneller. Probeer het zelf!

Hint: https://numpy.org/doc/stable/reference/generated/numpy.vectorize.html


In [None]:
@time_mem_decorator
def get_results_fast(x,y):

In [None]:
res_fast = get_results_fast(x, y)