#Universal functions (UFunc)
We hebben in het begin gezien dat berekeningen met NumPy sneller zijn dan berekeningen met Python. Achter deze snelheidswinst zit *vectorisatie*. Het woord 'vector' moeten we hier interpreteren als "een reeks getallen" (een array dus in NumPy-termen)

Om een berekening te doen in NumPy geven we ineens de volledige array door. NumPy voert de berekening uit op de volledige array met behulp van de snelle C-code en geeft het resultaat terug aan Python.

Belangrijk: NumPy is alleen sneller wanneer we vectorisatie gebruiken. En dat is wat we zien in de volgende code:
```
In Python: [x * 2 for x in lijst]
475 µs ± 142 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
In NumPy: arr * 2
6.76 µs ± 62.9 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
In NumPy met ufunc: np.multiply(arr, 2)
8.56 µs ± 1.97 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)
De trage manier: [x * 2 for x in arr]
1.41 ms ± 409 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
```
Opmerking: `arr * 2` is hetzelfde als `np.multiply(arr, 2)`. De functie np.multiply is een *Universal Function* of *UFunc*

De naam 'universal' slaat op het feit dat ze een universele of algemene manier bieden om per element bewerkingen uit te voeren op arrays van willekeurige vorm en grootte.

In [None]:
import numpy as np
lijst = list(range(10_000))
arr = np.array(lijst)
print('In Python: [x * 2 for x in lijst]')
%timeit [x * 2 for x in lijst]
print('In NumPy: arr * 2')
%timeit arr * 2
print('In NumPy met ufunc: np.multiply(arr, 2)')
%timeit np.multiply(arr, 2)
print('De trage manier: [x * 2 for x in arr]')
%timeit [x * 2 for x in arr]

##UFunc's in NumPy
Een UFunc is een Pythonfunctie die NumPy arrays als argumenten heeft. In de functie worden de argumenten uitgevoerd met C-code.

Belangrijk: let op met for-lussen in Python die een NumPy array overlopen. Er is meestal een UFunc die dezelfde actie veel sneller kan uitvoeren.

##UFuncs en operatoren
In Python kunnen we operatoren gebruiken (+, -, \*, /, ...). Maar achter de schermen gebruikt Python de correcte *magical method* (of *dunder method*): \_\_add\_\_, \_\_subtract\_\_, \_\_multiply\_\_, \_\_divide\_\_, ...

In NumPy gebeurt hetzelfde:
*   np.add: +
*   np.subtract: -
*   np.multiply: *
*   np.divide: /
*   np.power: **



In [None]:
import numpy as np
arr1 = np.arange(5)
arr2 = np.full_like(arr1, 2)
print('arr1:', arr1)
print('arr2:', arr2)
print('De som: arr1 + arr2')
print(np.add(arr1, arr2))
print('Het verschil: arr1 - arr2')
print(np.subtract(arr1, arr2))
print('Het product: arr1 * arr2')
print(np.multiply(arr1, arr2))
print('Het quotiënt: arr1 / arr2')
print(np.divide(arr1, arr2))
print('Het kwadraat: arr1 ** arr2')
print(np.power(arr1, arr2))

## += operator
Bekijk de volgende code in [Python Tutor](https://pythontutor.com/)

Voor de optelling van integers is er geen verschil tussen beide functies. Dat komt omdat een integer in Python *immutable* is: elke toewijzing (=) maakt een nieuwe integer.

Een list is echter *mutable*: een bestaande lijst kan gewijzigd worden met +=

In [None]:
def add(a, b):
  a = a + b
def add_is(a, b):
  a += b

x = 1
y = 2
add(x, y)
print('x na add(x, y):', x)
add_is(x, y)
print('x na add_is(x, y):', x)
lijst1 = [1, 2, 3]
lijst2 = [4, 5, 6]
add(lijst1, lijst2)
print('lijst1 na add(x, y):',lijst1)
add_is(lijst1, lijst2)
print('lijst1 na add_is(x, y):', lijst1)

Een array in NumPy is ook *mutable*. Deze UFunc maakt gebruikt van de out-parameter. Het resultaat van de functie wordt bewaard in de bestaande array. Omdat er geen nieuwe array moet gemaakt worden, besparen we geheugen.

Wanneer we de oorspronkelijke inhoud van arr1 nog nodig hebben, is dit natuurlijk een slecht idee.

In [None]:
import numpy as np
arr1 = np.arange(5)
arr2 = np.full_like(arr1, 2)
print(f'{arr1=}')
print(f'{arr2=}')
return_waarde = np.add(arr1, arr2)
print('\nreturn_waarde = arr1 + arr2')
print(f'{return_waarde=}')
print(f'{arr1=}')
return_waarde = np.add(arr1, arr2, out=arr1)  #hetzelfde als arr1 += arr2
print('\narr1 += arr2')
print(f'{return_waarde=}')
print(f'{arr1=}')

##Het where-argument
Met *where* kunnen we een filter definiëren. De functie wordt alleen uitgevoerd voor de elementen waarvoor de filter True is. De elementen waarvoor de filter False is, blijven ongewijzigd.

In [None]:
import numpy as np
arr1 = np.arange(5)
arr2 = np.full_like(arr1, 2)
print(f'{arr1=}')
np.add(arr1, arr2, out=arr1, where=arr1 % 2 == 0)
print('2 optellen bij de even getallen in arr1:', arr1)

##Andere UFunc's
Er is een lijst van *Universal functions* terug te vinden op [de website van NumPy](https://numpy.org/doc/stable/reference/ufuncs.html#available-ufuncs)

Maar daarnaast zijn er nog een hele reeks andere UFuncs in bijvoorbeeld het SciPy package

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as stats

x = np.linspace(-5, 5, 100)
y = stats.norm.pdf(x)
plt.gca().spines.bottom.set_position('zero')
plt.gca().spines.left.set_position('zero')
plt.gca().spines.top.set_visible(False)
plt.gca().spines.right.set_visible(False)
plt.plot(x, y)
plt.title('Gauss-curve (klokcurve) of "normaalverdeling"')
plt.show()

##Methodes van UFuncs
###reduce
In Python is een functie een object en een object kan methodes hebben. Sommige Ufuncs hebben bijvoorbeeld een *reduce*-functie.
De *reduce*-functie vermindert de dimensie van de array met 1. Een array met als dimensie (5,) krijgt als dimensie () (dat is dus 1 getal).

De *reduce*-functie bestaat alleen voor UFuncs die met 2 arrays werken, zoals bijvoorbeeld de *add*-functie

De functie add.reduce(arr) gebruikt de add-functie om de elementen van de array op te tellen. Het resultaat is 1 getal (dimensie ())

In de meeste gevallen zal men natuurlijk gebruik maken van np.sum(arr)

In [None]:
import numpy as np
arr1 = np.arange(5)
print('arr1: ', arr1)
print('De som van alle getallen in arr1:', np.add.reduce(arr1)) #hetzelfde als np.sum(arr1)

###accumulate
De *accumulate*-functie past de UFunc één voor één cumulatief toe op de verschillende elementen van de array. Het resultaat is een array met dezelfde dimensie als de input array.

Een voorbeeld zal het duidelijker maken: np.add.accumulate(arr) is hetzelfde als np.cumsum(arr) (*cumulatieve sum*)

In [None]:
import numpy as np
arr1 = np.arange(5)
print('arr1:', arr1)
#hetzelfde als np.cumsum
print('De lopende som van de getallen in arr1:', np.add.accumulate(arr1))

###outer
De *outer*-functie past de UFunc toe op alle combinaties van de elementen in de twee arrays. In SQL zouden we dat ook een *cross-join* noemen.

Bijvoorbeeld de tafel van vermenigvuldiging van de getallen van 1 tot 10:

In [None]:
import numpy as np
arr = np.arange(1,11)
np.multiply.outer(arr, arr)

###at
Met de *at*-functie kunnen we de UFunc toepassen op arrays van verschillende grootte. Ik wil bijvoorbeeld een array van drie elementen optellen bij de eerste drie elementen van een array van 5 elementen.

Maar het hoeven natuurlijk niet de 3 eerste elementen te zijn. Het kunnen ook het eerste, het derde en het vijfde element zijn.

In [None]:
import numpy as np
arr1 = np.arange(1, 6)
print('arr1: ', arr1)
arr2 = np.arange(1, 4)
print('arr2:', arr2)
np.add.at(arr1,[0, 1, 2], arr2)
print('np.add.at(arr1,[0, 1, 2], arr2):', arr1)
arr1 = np.arange(1, 6)
np.add.at(arr1,[0, 2, 4], arr2)
print('np.add.at(arr1,[0, 2, 4], arr2):', arr1)

###reduceat
De *reduceat*-functie past de reduce-operatie toe op stukjes van de array. Die stukjes worden aangegeven door grenzen die in een tweede array zijn gedefinieerd. In tegenstelling tot bij *at* moeten de grenzen hier door paren van indices worden aangegeven: van-(vlak voor)tot.

De *grenzen* [0, 2, 4, 6, 8] willen dus zeggen:
*  van 0 tot vlak voor 2
*  van 2 tot vlak voor 4
*  van 4 tot vlak voor 6
*  van 6 tot vlak voor 8
*  (speciale situatie voor het laatste element) van 8 tot aan het einde.

In [None]:
import numpy as np
arr1 = np.arange(1, 11)
grenzen = np.array([0, 2, 4, 6, 8])
print('arr1:', arr1)
print('grenzen:', grenzen)
print('np.add.reduceat(arr1, grenzen):', np.add.reduceat(arr1, grenzen))