#Extra manieren om arrays te maken
Eerst een kleine herhaling:
*  In Python kunnen we lists gebruiken om een reeks gegevens bij te houden
*  In NumPy doen we dat met een ndarray (N-dimensional array)
*  Alle elementen in een NumPy array moeten van hetzelfde type zijn

In [None]:
import numpy as np
arr = np.array([1, 2, 3])
print(arr, arr.dtype)
arr = np.arange(1, 4)
print(arr, arr.dtype)
arr = np.zeros(3)
print(arr, arr.dtype)
arr = np.ones((2, 3))
print(arr, arr.dtype)
arr = np.full(3, 127)
print(arr, arr.dtype)
arr = np.full_like(arr, 1701)
print(arr, arr.dtype)

## Array met meer dimensies

De *shape* van een array vertelt ons hoe het zit met de rijen en de kolommen. Met de *reshape()* functie kunnen we de *shape* wijzigen.

Tussendoortje: we hebben gezien dat de *append()*-functie in NumPy niet bij een array hoort, maar rechtstreeks in de *numpy* (np)-namespace. Dat geeft aan dat er een nieuwe array wordt gemaakt.

Belangrijke achtergrond informatie: door de shape te veranderen van een array, verandert er niets in het geheugen. Er wordt geen nieuwe array gemaakt. Vandaar dat de *reshape()*-functie bij een array hoort. (verwarrend: er is ook een identieke functie [die in de numpy-namespace staat](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.reshape.html#numpy.ndarray.reshape))

In [None]:
import numpy as np
arr = np.arange(9)
print('arr:',arr)
print('arr.shape:', arr.shape)
aantal_rijen = 3
aantal_kolommen = 3
arr2 = arr.reshape(aantal_rijen, aantal_kolommen) #np.reshape() bestaat ook, maar is dezelfde functie
print(f'arr.reshape({aantal_rijen}, {aantal_kolommen}):\n', arr2)
print('arr.shape:', arr2.shape)
rijnr = 1
arr2[rijnr, 0] = 10
print('De tweede rij van arr2:', arr2[rijnr, :])
print('De tweede rij van arr:', arr[rijnr * aantal_kolommen : (rijnr + 1) * aantal_kolommen])



## Een copy en een 'view'
Met de *copy()* maken we een nieuwe kopie van een array (waarom niet np.copy()? Dat volgt de logica van numpy-functies maken een nieuwe array en array-functie veranderen de array. Misschien omdat de naam van de functie duidelijk maakt dat er een kopie wordt gemaakt)

In [None]:
import numpy as np
arr = np.arange(9)
print('arr:', arr)
arr2 = arr
arr2[0] = 100
print('arr2:', arr2)
print('arr:', arr)
print("De view-functie doet hetzelfde (maar ze heeft een specifieke toepassing)")
arr = np.arange(9)
arr2 = arr.view()
arr2[0] = 100
print('arr2:', arr2)
print('arr:', arr)
print('En nu met de copy()-functie:')
arr = np.arange(9)
arr2 = arr.copy()
arr2[0] = 100
print('arr2:', arr2)
print('arr:', arr)


##Om verwarring te zaaien: de view()-functie
De view()-functie wordt vooral gebruikt om het type van de array te veranderen. Maar let op: een int8-array omzetten naar een int16-array doet misschien niet wat je verwacht had.

Een view is een manier om een array te bekijken:
*   int8: bekijk de 4 geheugenlocaties van de array als 4 int8 integers
*   int16: bekijk de 4 geheugenlocaties van de array als 2 int16 integers

De int16 integers worden gelezen als 0 * 1 + 1 * 256 en 2 * 1 + 3 * 256


In [None]:
import numpy as np
arr = np.arange(4, dtype=np.int8)
arr2 = arr.view(dtype=np.int16)
print('arr:', arr)
print('arr2:', arr2)
arr2[0] = arr2[0] + 1
print('na arr2[0] = arr2[0] + 1:')
print('arr:', arr)
print('arr2:', arr2)

##Random waarden
Wanneer we data willen om iets uit te proberen, is het handig om (semi)-willekeurige getallen te hebben. In moderne NumPy gebruiken we hiervoor een *random generator*: [np.random.default_rng()](https://numpy.org/doc/stable/reference/random/generator.html)

Aangezien een computer geen willekeurige waarden kan genereren, moet men op een andere manier te werk gaan. Er wordt een 'random'-functie gedefinieerd die één voor één waarden kan teruggeven (een generator in Python termen).

In tegenstelling tot bij 'klassieke' generatorfuncties (denk aan de range()-functie) kunnen we de volgende waarde niet 'raden'. De opeenvolging van de waarden ligt vast, maar we kunnen wel een 'beginpunt' meegeven. Dan zullen we altijd dezelfde reeks van 'willekeurige' waarden terugkrijgen. Dat 'beginpunt' noemen we ook de *seed*.

Dat is de waarde die we meegeven aan np.random.default_rng(). Wanneer we die seed weglaten, kiest NumPy zelf een beginpunt op basis van een aantal waarden (bijvoorbeeld: hoe lang staat de computer al aan).

In deze code maken we:
*   een (3, 4) array met willekeurige integers tussen 0 en 10 (niet inbegrepen)
*   een (3, ) array met willekeurige floats
*   een (10, ) array met willekeurige waarden uit de array voorbeeld. Na een element gekozen te hebben wordt het terug in de array voorbeeld gezet, zodat het opnieuw kan gekozen worden (vgl met de lottotrekking)
*   tenslotte worden de elementen in de array *voorbeeld* dooreen gehaald.



In [None]:
import numpy as np
rng = np.random.default_rng(42) #vaste seed -> altijd dezelfde reeks (random) waarden
arr = rng.integers(0, 10, size=(3, 4))  #endpoint = False is de default
print(f'{arr.size} random integers van 0 tot en met 9:')
print(arr)
arr = rng.random(size=3) #drie random float tussen 0.0 en 1.0
print(f'{arr.size} random floats tussen 0.0 en 1.0: [0.0, 1.0)')
print(arr)
voorbeeld = np.array([3, 7, 9, 12, 10, 14, 8])
arr = rng.choice(voorbeeld, size=10, replace=True) # replace=True: zet de gekozen waarde terug in de array
print(f'{arr.size} random waarden uit {voorbeeld}:')
print(arr)
voorbeeld = np.arange(10)
print(f'De array {voorbeeld} dooreengeschud:')
rng.shuffle(voorbeeld) #'schud' de array
print(voorbeeld)

##np.linspace() vs np.arange()
Met np.arange(begin, einde, [step]) maken we een array met de waarden tussen begin  en einde (niet inbegrepen). Met de optionele step-waarde kunnen we de stapgrootte bepalen. Om te weten hoeveel elementen er gegenereerd worden, moeten we rekenen (einde- begin)/step.

Het verschil tussen arange en linspace:
*   linspace: eindpunt is inbegrepen
*   linspace: laatste parameter = aantal getallen ('stapgrootte' wordt berekend)


In [None]:
import numpy as np
arr = np.arange(10, 21, 2)
print('De getallen in stappen van 2 tussen 10 en 21: [10, 21)')
print(arr)
arr = np.linspace(10, 20, 6, dtype=np.int64)
print('6 getallen tussen 10 en 20: [10, 20]')
print(arr)

linspace is vooral handig bij het maken van grafieken waar we controle willen over het aantal x-waarden.

Ik wil de volgende functie in een grafiek zetten: $y = 2x$

Een grafiek noemen we een *axis* in matplotlib.

Met plt.gca() vragen we de huidige grafiek op (*get current axis*)

De *spines* de assen die getekend worden. Er zijn er vier: bottom, left, top en right.

We willen maar 2 assen tonen en ze moeten op het nulpunt staan in de grafiek.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(-10, 10, 100)
y = 2 * x
plt.gca().spines.bottom.set_position('zero')
plt.gca().spines.left.set_position('zero')
plt.gca().spines.top.set_visible(False)
plt.gca().spines.right.set_visible(False)
plt.plot(x, y)
plt.show()

Omdat het resultaat een rechte was, maakte het niet veel uit in het vorige voorbeeld hoeveel x-waarden we lieten genereren. Het wordt natuurlijk anders bij de functie $y = x^{2}$

In [None]:
import numpy as np
import matplotlib.pyplot as plt
def generate_splines():
  plt.gca().spines.bottom.set_position('zero')
  plt.gca().spines.left.set_position('zero')
  plt.gca().spines.top.set_visible(False)
  plt.gca().spines.right.set_visible(False)
x = np.linspace(-10, 10, 10)
y = x ** 2
generate_splines()
plt.plot(x, y)
plt.show()

Een 'tussendoortje': de afgeleide van de sinus is de cosinus. Maar in NumPy moeten we dat niet weten om de afgeleide te kunnen berekenen. We kunnen hiervoor de *gradient*-functie gebruiken.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
x = np.arange(0, 2 * np.pi + 0.1, 0.2)
y = np.sin(x)
generate_splines()
plt.plot(x, y, label="sinus")
#voor de wiskundigen: de afgeleide van de sinus is de cosinus
plt.plot(x, np.gradient(y, x), label='afgeleide van de sinus')
#plt.legend(loc='upper right', bbox_to_anchor=(1.5, 1))
plt.legend(loc=(1.0, 0.9))
plt.show()

Een grafiek in 3 dilensies (x-, y- en z-coördinaten) kunnen we ook voorstellen met een contourplot. Enig idee wat *np.meshgrid* doet?

In [None]:
import numpy as np
import matplotlib.pyplot as plt
x_val = np.linspace(-1, 1, 100)
y_val = np.linspace(-1, 1, 100)
x, y = np.meshgrid(x_val, y_val)
z = x**2 + y**2

plt.contourf(x, y, z, levels=10)
plt.colorbar()
plt.show()

Hoe kunnen we arrays combineren? Door ze boven elkaar te zetten, bijvoorbeeld.

In [None]:
import numpy as np
arr1 = np.arange(1, 6)
arr2 = np.arange(11, 16)
np.vstack([arr1, arr2])

Met *np.hstack* kunnen we ze naast elkaar zetten. Maar is dit wat je verwacht had?

In [None]:
import numpy as np
arr1 = np.arange(1, 6)
arr2 = np.arange(11, 16)
np.hstack([arr1, arr2])

Om *np.hstack* te laten werken zoals je het misschien verwacht had, moeten we er kolomarrays van maken:

In [None]:
import numpy as np
arr1 = np.arange(1, 6).reshape(-1, 1)
arr2 = np.arange(11, 16).reshape(-1, 1)
np.hstack([arr1, arr2])

Een alternatief is gebruik maken van *np.column_stack*

In [None]:
import numpy as np
arr1 = np.arange(1, 6)
arr2 = np.arange(11, 16)
np.column_stack((arr1, arr2))

Het omgekeerde van stacking is splitting. We kunnen een list meegeven met de indexen waarop gesplitst moet worden:

In [None]:
import numpy as np
arr = np.arange(10)
arr1, arr2, arr3 = np.split(arr, [2, 5])
print(arr1)
print(arr2)
print(arr3)

We kunnen ook één getal meegeven. In dit geval willen we de array opdelen in 2 gelijke delen:

In [None]:
import numpy as np
arr = np.arange(10).reshape(2, -1)
arr1, arr2 = np.split(arr, 2) #verschil tussen array en integer
print(arr1)
print(arr2)

Dat is niet hetzelfde als dit:

In [None]:
import numpy as np
arr = np.arange(10).reshape(2, -1)
arr1= np.split(arr, [2])
print(arr1)

Om nog eens iets wiskundig te doen, kunnen we een stelsel van vergelijkingen oplossen. De volgende vergelijking:
$$x_1 + x_2 = 3\\3x_1 - 2x_2=4$$
kunnen we voorstellen onder de vorm van 2 arrays. Een 2-dimensionele array met de coëfficiënten en een 1-dimensionele array met de resultaten. Vervolgens gebruiken we de eliminatiemethode van Gauss-Jordan.

We kunnen de twee arrays samenvoegen tot 1 matrix:

$$\begin{bmatrix}1 && 1 &&3\\3 && -2 && 4\end{bmatrix}$$

In de eerste stap kunnen we 3 x de eerste rij aftrekken van de tweede:
$$\begin{bmatrix}1 && 1 &&3\\0 && -5 && -5\end{bmatrix}$$
In een tweede stap delen we de tweede rij door -5:
$$\begin{bmatrix}1 && 1 &&3\\0 && 1 && 1\end{bmatrix}$$
In de laatste stap trekken we 1x de tweede rij af van de eerste:
$$\begin{bmatrix}1 && 0 &&2\\0 && 1 && 1\end{bmatrix}$$
Het resultaat: $x_1=2$ en $x_2=1$

In [None]:
import numpy as np
arr_A = np.array([1, 1, 3, -2], dtype=np.float64).reshape(2, -1)
print(arr_A)
vec_y = np.array([3, 4])
print(vec_y.reshape(2, -1))

arr_mat = np.column_stack([arr_A, vec_y])
print('stap0: rij1 = rij1 / 1')
print(arr_mat)
print('stap 1: rij2 = rij2 - 3 * rij1')
arr_mat[1] -= arr_mat[1, 0] * arr_mat[0]
print('na stap 1\n', arr_mat)
print('stap 2: rij2 = rij2 / -5')
arr_mat[1] /= arr_mat[1, 1]
print('na stap 2\n', arr_mat)
print('stap3: rij1 = rij1 - rij2')
arr_mat[0] -= arr_mat[0, 1] * arr_mat[1]
print('na stap 3\n', arr_mat)
print(f'x1={arr_mat[0, -1]}, x2= {arr_mat[1, -1]}')
oplossing = arr_mat[:, -1]
print('controle')
for index in range(oplossing.shape[0]):
  print( (arr_A[index] * oplossing).sum())

Voor de controle moeten we twee vermenigvuldigingen uitvoeren: één voor elke rij (vandaar de for-lus met range(oplossing.shape[0])

NumPy kent echter ook een aparte operator om dat in één keer te doen: @. Dat noemen we een [matrixvermenigvuldiging](https://nl.wikipedia.org/wiki/Matrixvermenigvuldiging) ( [youtube](https://www.youtube.com/watch?v=HmngGKVzdic)):


In [None]:
arr_A @ oplossing

##De methode van Cramer
Een vergelijking oplossen met de methode van Cramer (om eens iets anders te doen). Bij de methode van Cramer moeten we de determinant van een matrix kunnen berekenen. Dat is geen probleem in NumPy omdat we daarvoor een functie hebben: numpy.linalg.det(arr).


1) Bereken de determinant van de matrix met de coëffiënten. (det)
1) Vervang in de matrix met de coëfficiënten de eerste kolom door de kolom met de resultaten en bereken de determinant van die matrix (detx)
1) Vervang in de matrix met de coëfficiënten de tweede kolom door de kolom met de resultaten en bereken de determinant van die matrix (dety)
1) de x-waarde is detx/det
1) de y-waarde is dety/det

##Toegepast op ons voorbeeld

De matrix met de coëfficiënten:
$$\begin{bmatrix}1 && 1\\3 && -2\end{bmatrix}$$

De determinant (det): -5

Vervanging van de eerste kolom:
$$\begin{bmatrix}3 && 1\\4 && -2\end{bmatrix}$$

De determinant (detx): -10

Vervanging van de tweede kolom:
$$\begin{bmatrix}1 && 3\\3 && 4\end{bmatrix}$$

De determinant (dety): -5

x= detx / det = -10 / -5 = 2

y= dety / det = -5/-5 = 1

En nu proberen we dat in NumPy:


In [None]:
import numpy as np
arr_A = np.array([1, 1, 3, -2], dtype=np.float64).reshape(2, -1)
vec_y = np.array([3, 4])
det = np.linalg.det(arr_A)
arr_x = np.copy(arr_A)  #wijzig de oorspronkelijke array niet
arr_x[:, 0] = vec_y
detx = np.linalg.det(arr_x)
arr_y = np.copy(arr_A)
arr_y[:, 1] = vec_y
dety = np.linalg.det(arr_y)
print(f'x={detx/det}, y={dety/det}')

##De inverse van een matrix
We zouden de vergelijking ook als een matrix vermenigvuldiging kunnen schrijven:
$$Ax = y$$
Wanneer we dit met gewone getallen schrijven, bijvoorbeeld:
$$2x = 4$$
Dan kunnen we dit oplossen door aan beide kanten te delen door 2:
$$x = 2$$
We kunnen niet delen door een matrix, maar we kunnen wel de inverse van een matrix berekenen. Een matrix vermenigvuldigd met zijn inverse geeft de eenheidsmatrix terug:
$$\begin{bmatrix}1 && 0\\0 && 1\end{bmatrix}$$
en die mogen we weglaten bij een vermendigvuldiging.

Dus om x op te lossen kunnen de vergelijking als volgt schrijven:
$$A^{-1} A x = A^{-1} y$$
of (aangezien $A^{-1} A$ gelijk is aan de eenheidsmatrix en weggelaten mag worden)
$$x = A^{-1}y$$

Belangrijk detail: om twee matrices te vermenigvuldigen, moeten we in NumPy de @-operator gebruiken. De inverse berekenen, kunnen we overlaten aan NumPy (*np.linalg.inv()*):

In [None]:
import numpy as np
arr_A = np.array([1, 1, 3, -2], dtype=np.float64).reshape(2, -1)
vec_y = np.array([3, 4])
print('A:', arr_A)
print('y:', vec_y)
arr_A_inv = np.linalg.inv(arr_A)
print('De inverse van A:\n',arr_A_inv)
print('A * A**(-1):\n',arr_A @ arr_A_inv)
print('A**(-1) * y:\n',arr_A_inv @ vec_y)

##Tenslotte: zo doen we het echt
In NumPy is er een aparte functie om een stelsel van vergelijkingen op te lossen: *np.linalg.solve()*

In [None]:
import numpy as np
arr_A = np.array([1, 1, 3, -2], dtype=np.float64).reshape(2, -1)
vec_y = np.array([3, 4])
oplossing = np.linalg.solve(arr_A, vec_y)
print('oplossing:\n',oplossing)
print('controle:\n', arr_A @ oplossing)