# Les 2: Vectoren en Matrices - Data als Wiskundige Objecten

**Mathematical Foundations - IT & Artificial Intelligence**

---

## 2.0 Recap en Overzicht

In de vorige les hebben we gezien dat een neuraal netwerk gebouwd is op drie wiskundige pijlers: lineaire algebra, calculus en statistiek. Vandaag starten we met de eerste pijler, lineaire algebra, die ons de taal geeft om data te representeren en te manipuleren.

Lineaire algebra is overal in Machine Learning. Wanneer je een afbeelding in een neuraal netwerk invoert, wordt die afbeelding voorgesteld als een verzameling getallen. Wanneer het netwerk berekeningen uitvoert, gebeurt dit via matrixoperaties. Wanneer we de gewichten van het netwerk opslaan, zijn dit matrices en vectoren.

In deze les leren we de fundamentele bouwstenen: scalars, vectoren, matrices en tensors. We zien hoe verschillende soorten data, van spreadsheets tot afbeeldingen en video, worden omgezet naar deze wiskundige structuren. Tot slot leren we essentiële operaties zoals het dot product, dat de kern vormt van berekeningen in neurale netwerken.

## 2.1 Leerdoelen van deze les

Na het doorwerken van deze les ben je in staat om de begrippen scalar, vector, matrix en tensor te definiëren en van elkaar te onderscheiden. Je kan vectoren optellen, aftrekken en vermenigvuldigen met een scalar. Je kan de norm van een vector berekenen en begrijpt wat deze geometrisch betekent. Je kan het dot product berekenen en de geometrische betekenis ervan uitleggen. Je kan verschillende soorten data representeren als tensoren in NumPy. Tot slot kan je een MNIST-afbeelding transformeren tussen vector- en matrixvorm.

In [None]:
# Importeer de benodigde libraries
import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_openml

# Stel enkele opties in voor mooiere output
np.set_printoptions(precision=3, suppress=True)

print("Libraries geladen!")

## 2.2 Van Getallen naar Datastructuren

### Scalars: het enkelvoudige getal

Een scalar is het eenvoudigste wiskundige object: één enkel getal. Dit kan een geheel getal zijn, een kommagetal, of zelfs een complex getal. In de context van Machine Learning zijn scalars vaak meetwaarden zoals temperatuur, prijs, of de waarde van één enkele pixel.

Hoewel een scalar simpel lijkt, speelt het een belangrijke rol in Machine Learning. De learning rate in gradient descent is een scalar die bepaalt hoe groot de stappen zijn die we nemen tijdens het optimaliseren. De output van een loss functie is een scalar die samenvat hoe goed of slecht het model presteert. Wanneer we zeggen dat een model een accuracy van 0.95 heeft, is dat een scalar.

In wiskundige notatie gebruiken we vaak kleine letters voor scalars, zoals $a$, $b$, of $\alpha$ (alpha). In Python is elk gewoon getal een scalar.

In [None]:
# Scalars in Python
temperatuur = 21.5
aantal_pixels = 784
learning_rate = 0.01

print(f"Temperatuur: {temperatuur} (type: {type(temperatuur).__name__})")
print(f"Aantal pixels: {aantal_pixels} (type: {type(aantal_pixels).__name__})")
print(f"Learning rate: {learning_rate} (type: {type(learning_rate).__name__})")

# In NumPy kunnen we expliciet een scalar maken met een specifiek datatype
learning_rate_np = np.float64(0.01)
print(f"\nNumPy scalar: {learning_rate_np} (type: {type(learning_rate_np).__name__})")

### Vectoren: geordende lijsten van getallen

Een vector is een geordende verzameling van getallen. De volgorde is belangrijk: de vector [1, 2, 3] is niet hetzelfde als [3, 2, 1]. Elk getal in de vector noemen we een element of component, en we kunnen elk element aanspreken via zijn index.

Vectoren zijn overal in Machine Learning. Een MNIST-afbeelding van 784 pixels wordt voorgesteld als een vector met 784 elementen. De gewichten die één neuron verbinden met alle inputs vormen een vector. De output van een classificatienetwerk, met een kans per klasse, is een vector van 10 elementen.

We kunnen vectoren op twee manieren visualiseren. Algebraïsch is een vector gewoon een lijst van getallen, bijvoorbeeld $\mathbf{v} = [3, 1, 4]$. Geometrisch is een vector een pijl in een ruimte, met een richting en een lengte. Een 2D-vector kunnen we tekenen als een pijl in het platte vlak, een 3D-vector als een pijl in de ruimte. Deze dubbele interpretatie maakt vectoren zo krachtig.

De dimensie van een vector is het aantal elementen dat hij bevat. Een vector met 784 elementen is een 784-dimensionale vector. In Machine Learning werken we routinematig met vectoren van honderden of duizenden dimensies.

In [None]:
# Een vector als NumPy array
v = np.array([3, 1, 4, 1, 5])

print(f"Vector v: {v}")
print(f"Aantal elementen (dimensie): {len(v)}")
print(f"Shape: {v.shape}")
print()
print(f"Eerste element (index 0): {v[0]}")
print(f"Derde element (index 2): {v[2]}")
print(f"Laatste element (index -1): {v[-1]}")
print(f"Elementen 1 tot 3: {v[1:4]}")

In [None]:
# Geometrische visualisatie van een 2D-vector
v2d = np.array([3, 2])

plt.figure(figsize=(8, 6))
plt.quiver(0, 0, v2d[0], v2d[1], angles='xy', scale_units='xy', scale=1, color='blue', width=0.02)
plt.xlim(-1, 5)
plt.ylim(-1, 4)
plt.grid(True, alpha=0.3)
plt.axhline(y=0, color='k', linewidth=0.5)
plt.axvline(x=0, color='k', linewidth=0.5)
plt.xlabel('x', fontsize=12)
plt.ylabel('y', fontsize=12)
plt.title(f'Vector v = [{v2d[0]}, {v2d[1]}] als pijl in 2D', fontsize=14)
plt.text(v2d[0] + 0.1, v2d[1] + 0.1, f'v = ({v2d[0]}, {v2d[1]})', fontsize=12)
plt.gca().set_aspect('equal')
plt.show()

print("De vector wijst van de oorsprong (0,0) naar het punt (3,2).")
print("De richting en lengte van de pijl zijn de essentiële eigenschappen.")

### Matrices: tabellen van getallen

Een matrix is een rechthoekige tabel van getallen, georganiseerd in rijen en kolommen. We beschrijven de grootte van een matrix als "m bij n", waarbij m het aantal rijen is en n het aantal kolommen. Een matrix met 3 rijen en 4 kolommen noemen we een 3×4 matrix.

In Machine Learning zijn matrices alomtegenwoordig. Een grijswaarden afbeelding is een matrix van pixelwaarden. De gewichten tussen twee lagen van een neuraal netwerk vormen een matrix. Een batch van trainingsvoorbeelden wordt vaak voorgesteld als een matrix waarbij elke rij één voorbeeld is.

De relatie tussen vectoren en matrices is belangrijk om te begrijpen. Een vector kan worden gezien als een speciale matrix. Een kolomvector is een matrix met n rijen en 1 kolom. Een rijvector is een matrix met 1 rij en n kolommen. In NumPy maken we dit onderscheid meestal niet expliciet, maar het is wiskundig relevant.

Om een element in een matrix aan te spreken, gebruiken we twee indices: de rij-index en de kolom-index. Het element op rij i en kolom j van matrix M noteren we als $M_{ij}$. In NumPy schrijven we dit als `M[i, j]}`, waarbij de indices beginnen bij 0.

In [None]:
# Een 3x4 matrix
M = np.array([
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
])

print("Matrix M:")
print(M)
print()
print(f"Shape: {M.shape}")
print(f"Dit betekent: {M.shape[0]} rijen en {M.shape[1]} kolommen")
print()
print(f"Element op rij 0, kolom 0: {M[0, 0]}")
print(f"Element op rij 1, kolom 2: {M[1, 2]}")
print(f"Element op rij 2, kolom 3: {M[2, 3]}")

In [None]:
# Rijen en kolommen selecteren
print("Matrix M:")
print(M)
print()

print(f"Eerste rij (index 0): {M[0]}")
print(f"Tweede rij (index 1): {M[1]}")
print()

print(f"Eerste kolom (index 0): {M[:, 0]}")
print(f"Derde kolom (index 2): {M[:, 2]}")
print()

# Submatrix selecteren
print("Submatrix (rijen 0-1, kolommen 1-2):")
print(M[0:2, 1:3])

### Tensors: de generalisatie naar hogere dimensies

Een tensor is de generalisatie van scalars, vectoren en matrices naar willekeurig veel dimensies. We kunnen dit systematisch bekijken: een scalar is een 0-dimensionale tensor (een enkel getal), een vector is een 1-dimensionale tensor (een rij getallen), een matrix is een 2-dimensionale tensor (een tabel van getallen). Een 3-dimensionale tensor kun je visualiseren als een "kubus" of "stapel" van matrices.

In deep learning werken we vaak met tensors van hogere dimensies. Een kleurenafbeelding heeft drie dimensies: hoogte, breedte en kleurkanalen. Een batch van kleurenafbeeldingen heeft vier dimensies: batchgrootte, hoogte, breedte en kanalen. Een video voegt daar nog een tijdsdimensie aan toe.

De naam "TensorFlow", een van de populairste deep learning frameworks, verwijst rechtstreeks naar deze datastructuur. De "flow" in TensorFlow beschrijft hoe tensors door het netwerk stromen en getransformeerd worden bij elke laag. PyTorch, een ander populair framework, heeft zelfs zijn basisdatatype "torch.Tensor" genoemd.

Het is belangrijk om te begrijpen dat de term "tensor" in Machine Learning vaak iets losser wordt gebruikt dan in de wiskunde. In ML bedoelen we meestal gewoon een multidimensionale array van getallen.

In [None]:
# Overzicht van tensor dimensies
scalar = np.array(42)
vector = np.array([1, 2, 3, 4])
matrix = np.array([[1, 2, 3], [4, 5, 6]])
tensor_3d = np.array([[[1, 2], [3, 4]], [[5, 6], [7, 8]]])

print("Overzicht van tensor dimensies:\n")
print(f"Scalar (0D tensor): {scalar}")
print(f"  Shape: {scalar.shape}, Dimensies: {scalar.ndim}")
print()
print(f"Vector (1D tensor): {vector}")
print(f"  Shape: {vector.shape}, Dimensies: {vector.ndim}")
print()
print(f"Matrix (2D tensor):")
print(matrix)
print(f"  Shape: {matrix.shape}, Dimensies: {matrix.ndim}")
print()
print(f"3D Tensor:")
print(tensor_3d)
print(f"  Shape: {tensor_3d.shape}, Dimensies: {tensor_3d.ndim}")

In [None]:
# Een 3D tensor visualiseren als "stapel" van matrices
tensor_3d = np.array([
    [[1, 2, 3, 4],
     [5, 6, 7, 8],
     [9, 10, 11, 12]],
    
    [[13, 14, 15, 16],
     [17, 18, 19, 20],
     [21, 22, 23, 24]]
])

print(f"Shape van 3D tensor: {tensor_3d.shape}")
print(f"Dit is een tensor met {tensor_3d.shape[0]} 'pagina's',")
print(f"elk bestaande uit {tensor_3d.shape[1]} rijen en {tensor_3d.shape[2]} kolommen.")
print()

print("Eerste 'pagina' (index 0):")
print(tensor_3d[0])
print()

print("Tweede 'pagina' (index 1):")
print(tensor_3d[1])
print()

print(f"Element op pagina 1, rij 2, kolom 3: {tensor_3d[1, 2, 3]}")

## 2.3 Data als Tensoren: Van de Echte Wereld naar Getallen

Voordat een Machine Learning model data kan verwerken, moet die data worden omgezet naar tensoren. Dit proces heet "encoding" of "representatie". Elk type data heeft zijn eigen manier om te worden voorgesteld als een tensor. In deze sectie bekijken we hoe verschillende veelvoorkomende datatypes worden omgezet.

### Gestructureerde data: tabellen en spreadsheets

Gestructureerde data is data die netjes georganiseerd is in rijen en kolommen, zoals je zou zien in een Excel-spreadsheet of een database. Elke rij is een observatie of voorbeeld, elke kolom is een kenmerk of feature.

Dit type data wordt rechtstreeks voorgesteld als een 2D-matrix. Als je dataset 1000 huizen bevat met elk 5 kenmerken (oppervlakte, aantal kamers, bouwjaar, afstand tot centrum, prijs), dan krijg je een matrix van shape (1000, 5). Het eerste getal is altijd het aantal voorbeelden, het tweede is het aantal kenmerken.

Een belangrijke uitdaging bij gestructureerde data is dat niet alle kolommen numeriek zijn. Categorische variabelen zoals "type woning" (appartement, rijhuis, vrijstaand) moeten worden omgezet naar getallen. Een veelgebruikte techniek hiervoor is one-hot encoding, waarbij elke categorie een aparte binaire kolom wordt.

In [None]:
import pandas as pd

# Voorbeeld: huizendata
data = {
    'oppervlakte_m2': [120, 85, 200, 95, 150],
    'aantal_kamers': [4, 2, 5, 3, 4],
    'bouwjaar': [1990, 2005, 1975, 2018, 2000],
    'afstand_centrum_km': [5.2, 1.3, 12.0, 3.5, 7.8],
    'prijs_euro': [320000, 195000, 425000, 285000, 375000]
}

df = pd.DataFrame(data)
print("Oorspronkelijke data als DataFrame:")
print(df)
print()

# Converteer naar NumPy matrix (tensor)
X = df.values
print(f"Als matrix (tensor): shape {X.shape}")
print(X)
print()
print("Elke rij is één huis, elke kolom is één kenmerk.")
print("Dit is een 2D tensor met shape (aantal_voorbeelden, aantal_kenmerken).")

In [None]:
# Data met categorische variabele
data_cat = {
    'oppervlakte_m2': [120, 85, 200, 150],
    'type_woning': ['appartement', 'appartement', 'vrijstaand', 'rijhuis'],
    'prijs_euro': [320000, 195000, 425000, 375000]
}
df_cat = pd.DataFrame(data_cat)

print("Data met categorische kolom:")
print(df_cat)
print()

# One-hot encoding voor 'type_woning'
df_encoded = pd.get_dummies(df_cat, columns=['type_woning'])
print("Na one-hot encoding:")
print(df_encoded)
print()

X_encoded = df_encoded.values
print(f"Als matrix: shape {X_encoded.shape}")
print("De categorische kolom is nu omgezet naar drie binaire kolommen.")
print("Elk huis heeft een 1 in precies één van deze kolommen.")

### Grijswaarden afbeeldingen: MNIST als matrix

Een grijswaarden afbeelding is een natuurlijke matrix. Elke cel bevat de helderheid van één pixel, typisch een waarde tussen 0 (zwart) en 255 (wit). De positie in de matrix correspondeert met de positie van de pixel in de afbeelding.

Voor MNIST is elke afbeelding een matrix van 28 rijen en 28 kolommen. Het element op rij i en kolom j is de helderheid van de pixel op die locatie. Deze matrixrepresentatie is intuïtief omdat het de ruimtelijke structuur van de afbeelding bewaart: pixels die naast elkaar liggen in de afbeelding, liggen ook naast elkaar in de matrix.

Voor een neuraal netwerk is het vaak handiger om de afbeelding voor te stellen als een vector. We "flatten" de matrix door alle rijen achter elkaar te plaatsen. Een 28×28 matrix wordt zo een vector met 784 elementen. Deze transformatie verliest de expliciete 2D-structuur, maar behoudt alle informatie.

In [None]:
# Laad MNIST
print("MNIST laden...")
mnist = fetch_openml('mnist_784', version=1, as_frame=False)
X_mnist, y_mnist = mnist.data, mnist.target.astype(int)
print(f"Geladen: {len(X_mnist)} afbeeldingen")
print()

# Neem één afbeelding
afbeelding_vector = X_mnist[0]
afbeelding_matrix = afbeelding_vector.reshape(28, 28)

print(f"Als vector: shape {afbeelding_vector.shape}")
print(f"Als matrix: shape {afbeelding_matrix.shape}")
print()
print("De vector en matrix bevatten exact dezelfde informatie,")
print("alleen anders georganiseerd.")

In [None]:
# Visualiseer de twee representaties
fig, axes = plt.subplots(1, 3, figsize=(14, 4))

# Matrix weergave
axes[0].imshow(afbeelding_matrix, cmap='gray')
axes[0].set_title(f'Als matrix (28×28)\nLabel: {y_mnist[0]}', fontsize=12)
axes[0].axis('off')

# Vector weergave (als lange strip)
axes[1].imshow(afbeelding_vector.reshape(1, -1), cmap='gray', aspect='auto')
axes[1].set_title('Als vector (1×784)', fontsize=12)
axes[1].set_xlabel('Index')
axes[1].set_yticks([])

# Vector weergave als lijnplot
axes[2].plot(afbeelding_vector, linewidth=0.5)
axes[2].set_title('Pixelwaarden als functie van index', fontsize=12)
axes[2].set_xlabel('Index')
axes[2].set_ylabel('Pixelwaarde')
axes[2].set_xlim(0, 784)

plt.tight_layout()
plt.show()

print("De pieken in de lijnplot corresponderen met de witte pixels van het cijfer.")

In [None]:
# Conversie tussen matrix en vector
print("Conversie tussen matrix en vector:\n")

# Van matrix naar vector: flatten
matrix_origineel = afbeelding_matrix.copy()
vector_flatten = matrix_origineel.flatten()
print(f"matrix.flatten() -> shape {vector_flatten.shape}")

# Of met reshape
vector_reshape = matrix_origineel.reshape(-1)  # -1 betekent: bereken automatisch
print(f"matrix.reshape(-1) -> shape {vector_reshape.shape}")

vector_reshape2 = matrix_origineel.reshape(784)  # Expliciet 784
print(f"matrix.reshape(784) -> shape {vector_reshape2.shape}")
print()

# Van vector naar matrix: reshape
terug_naar_matrix = vector_flatten.reshape(28, 28)
print(f"vector.reshape(28, 28) -> shape {terug_naar_matrix.shape}")
print()

# Verifieer dat de conversie geen data verliest
print(f"Zijn ze identiek? {np.allclose(terug_naar_matrix, matrix_origineel)}")

### Kleurenafbeeldingen: drie dimensies van kleur

Een grijswaarden afbeelding zoals MNIST is een 2D-matrix. Een kleurenafbeelding heeft een extra dimensie: de kleurkanalen. De meeste kleurenafbeeldingen gebruiken het RGB-systeem met drie kanalen voor Rood, Groen en Blauw.

Een kleurenafbeelding van 224×224 pixels wordt voorgesteld als een 3D-tensor met shape (224, 224, 3) of (3, 224, 224), afhankelijk van de conventie. De eerste conventie noemen we "channels last" en wordt gebruikt door TensorFlow en Keras. De tweede conventie noemen we "channels first" en wordt gebruikt door PyTorch.

Elke pixel heeft nu drie waarden in plaats van één. De kleur geel is bijvoorbeeld een combinatie van veel rood, veel groen, en weinig blauw: (255, 255, 0). Zwart is (0, 0, 0) en wit is (255, 255, 255).

In [None]:
# Maak een kleine kleurenafbeelding (8x8 pixels)
hoogte, breedte = 8, 8
afbeelding_rgb = np.zeros((hoogte, breedte, 3), dtype=np.uint8)

# Vul met kleuren: links rood, midden groen, rechts blauw
afbeelding_rgb[:, :3, 0] = 255      # Linker kolommen: rood kanaal hoog
afbeelding_rgb[:, 3:5, 1] = 255     # Middelste kolommen: groen kanaal hoog  
afbeelding_rgb[:, 5:, 2] = 255      # Rechter kolommen: blauw kanaal hoog

print(f"Shape van kleurenafbeelding: {afbeelding_rgb.shape}")
print(f"Dit is een 3D tensor: (hoogte, breedte, RGB_kanalen)")
print()

# Visualiseer
fig, axes = plt.subplots(1, 4, figsize=(14, 3))

axes[0].imshow(afbeelding_rgb)
axes[0].set_title('Volledige RGB afbeelding', fontsize=11)

axes[1].imshow(afbeelding_rgb[:, :, 0], cmap='Reds', vmin=0, vmax=255)
axes[1].set_title('Rood kanaal', fontsize=11)

axes[2].imshow(afbeelding_rgb[:, :, 1], cmap='Greens', vmin=0, vmax=255)
axes[2].set_title('Groen kanaal', fontsize=11)

axes[3].imshow(afbeelding_rgb[:, :, 2], cmap='Blues', vmin=0, vmax=255)
axes[3].set_title('Blauw kanaal', fontsize=11)

for ax in axes:
    ax.axis('off')

plt.tight_layout()
plt.show()

In [None]:
# Maak een kleurverloop als voorbeeld van een grotere afbeelding
x = np.linspace(0, 1, 256)
y = np.linspace(0, 1, 256)
X_grid, Y_grid = np.meshgrid(x, y)

# RGB kanalen gebaseerd op positie
R = (X_grid * 255).astype(np.uint8)
G = (Y_grid * 255).astype(np.uint8)
B = ((1 - X_grid) * 255).astype(np.uint8)

kleur_afbeelding = np.stack([R, G, B], axis=2)

print(f"Kleurenafbeelding shape: {kleur_afbeelding.shape}")
print(f"Dit is een 3D tensor met:")
print(f"  - {kleur_afbeelding.shape[0]} pixels hoog")
print(f"  - {kleur_afbeelding.shape[1]} pixels breed")
print(f"  - {kleur_afbeelding.shape[2]} kleurkanalen (RGB)")
print()

# Eén specifieke pixel bekijken
pixel_100_100 = kleur_afbeelding[100, 100]
print(f"Pixel op positie (100, 100): R={pixel_100_100[0]}, G={pixel_100_100[1]}, B={pixel_100_100[2]}")

plt.figure(figsize=(6, 6))
plt.imshow(kleur_afbeelding)
plt.title('Kleurenafbeelding: elke pixel is een vector van 3 waarden', fontsize=12)
plt.xlabel('X positie (bepaalt R en B)')
plt.ylabel('Y positie (bepaalt G)')
plt.show()

In [None]:
# Batch van afbeeldingen als 4D tensor
# In de praktijk verwerken we meerdere afbeeldingen tegelijk (een "batch")

batch_size = 32
hoogte, breedte, kanalen = 224, 224, 3

# Simuleer een batch van 32 kleurenafbeeldingen
batch_afbeeldingen = np.random.randint(0, 256, size=(batch_size, hoogte, breedte, kanalen), dtype=np.uint8)

print(f"Batch shape: {batch_afbeeldingen.shape}")
print(f"Dit is een 4D tensor: (batch_size, hoogte, breedte, kanalen)")
print()
print(f"De tensor bevat:")
print(f"  - {batch_afbeeldingen.shape[0]} afbeeldingen in de batch")
print(f"  - {batch_afbeeldingen.shape[1]} pixels hoog per afbeelding")
print(f"  - {batch_afbeeldingen.shape[2]} pixels breed per afbeelding")
print(f"  - {batch_afbeeldingen.shape[3]} kleurkanalen per pixel")
print()
print(f"Totaal aantal getallen in de batch: {batch_afbeeldingen.size:,}")

### Video: de tijd als extra dimensie

Een video is een reeks van afbeeldingen die snel na elkaar worden getoond. Als elke frame een kleurenafbeelding is, dan is een video een 4D-tensor met dimensies voor tijd (aantal frames), hoogte, breedte en kleurkanalen.

Een video van 10 seconden aan 30 frames per seconde, met een resolutie van 1920×1080 pixels, bevat 300 frames. Als 4D-tensor heeft dit shape (300, 1080, 1920, 3), wat neerkomt op meer dan 1.8 miljard getallen. Dit illustreert waarom videoprocessing zo rekenintensief is en waarom video's worden gecomprimeerd voor opslag.

In [None]:
# Simuleer een korte video met een bewegend vierkant
frames = 30          # 1 seconde aan 30 fps
hoogte = 64          # Kleine resolutie voor het voorbeeld
breedte = 64
kanalen = 3

# Maak een video waar een vierkant beweegt
video = np.zeros((frames, hoogte, breedte, kanalen), dtype=np.uint8)

for t in range(frames):
    # Achtergrond: donkerblauw
    video[t, :, :, 2] = 50
    
    # Bewegend rood vierkant
    x_pos = int(5 + t * 1.5)  # Beweegt naar rechts
    if x_pos + 15 < breedte:
        video[t, 20:35, x_pos:x_pos+15, 0] = 255  # Rood vierkant

print(f"Video tensor shape: {video.shape}")
print(f"Dit is een 4D tensor: (frames, hoogte, breedte, kanalen)")
print()
print(f"De tensor bevat:")
print(f"  - {video.shape[0]} frames")
print(f"  - {video.shape[1]}×{video.shape[2]} pixels per frame")
print(f"  - {video.shape[3]} kleurkanalen")
print()
print(f"Totaal aantal getallen: {video.size:,}")

In [None]:
# Visualiseer enkele frames
fig, axes = plt.subplots(1, 6, figsize=(15, 3))
frame_indices = [0, 5, 10, 15, 20, 25]

for ax, idx in zip(axes, frame_indices):
    ax.imshow(video[idx])
    ax.set_title(f'Frame {idx}', fontsize=11)
    ax.axis('off')

plt.suptitle('Video: opeenvolgende frames tonen beweging', fontsize=14)
plt.tight_layout()
plt.show()

In [None]:
# Typische video dimensies in de praktijk
print("Video dimensies en geheugengebruik (ongecomprimeerd):\n")
print(f"{'Beschrijving':<30} {'Shape':<28} {'Geheugen':<12}")
print("-" * 70)

voorbeelden = [
    ("YouTube 1080p, 1 minuut", 30*60, 1080, 1920, 3),
    ("TikTok video, 30 sec", 30*30, 1920, 1080, 3),
    ("Webcam 720p, 10 sec", 30*10, 720, 1280, 3),
    ("Surveillance 24 uur", 10*3600*24, 480, 640, 3),
]

for beschrijving, num_frames, h, w, c in voorbeelden:
    shape = f"({num_frames}, {h}, {w}, {c})"
    totaal_bytes = num_frames * h * w * c
    
    if totaal_bytes > 1e9:
        geheugen = f"{totaal_bytes / 1e9:.1f} GB"
    else:
        geheugen = f"{totaal_bytes / 1e6:.1f} MB"
    
    print(f"{beschrijving:<30} {shape:<28} {geheugen:<12}")

print()
print("Dit verklaart waarom video's altijd worden gecomprimeerd!")

### Tekst: van woorden naar getallen

Tekst is fundamenteel anders dan afbeeldingen omdat woorden geen natuurlijke numerieke representatie hebben. Het woord "kat" is niet inherent groter of kleiner dan het woord "hond". Er zijn verschillende strategieën om tekst om te zetten naar tensoren.

De eenvoudigste methode is one-hot encoding op woordniveau. Elk woord krijgt een index in een vocabulaire, en wordt voorgesteld als een vector met een 1 op die positie en nullen elders. Een zin wordt dan een 2D-matrix waar elke rij een woord is.

Het probleem met one-hot encoding is dat de vectoren enorm groot zijn (de grootte van het vocabulaire, vaak tienduizenden woorden) en dat ze geen semantische informatie bevatten: de vectoren voor "koning" en "koningin" lijken niet meer op elkaar dan "koning" en "fiets".

Moderne systemen gebruiken daarom word embeddings: geleerde vectoren van typisch 100-300 dimensies die semantische relaties vastleggen. Woorden met vergelijkbare betekenis krijgen vergelijkbare vectoren. Dit is ook hoe grote taalmodellen zoals GPT werken.

In [None]:
# Voorbeeld zin
zin = "de kat zit op de mat"
woorden = zin.split()

# Bouw vocabulaire
vocabulaire = sorted(set(woorden))
woord_naar_index = {woord: i for i, woord in enumerate(vocabulaire)}

print(f"Zin: '{zin}'")
print(f"Woorden: {woorden}")
print(f"Uniek vocabulaire: {vocabulaire}")
print(f"Vocabulaire grootte: {len(vocabulaire)}")
print()
print("Woord naar index mapping:")
for woord, idx in woord_naar_index.items():
    print(f"  '{woord}' -> {idx}")

In [None]:
# One-hot encoding
vocab_grootte = len(vocabulaire)
zin_lengte = len(woorden)

# Shape: (aantal_woorden, vocabulaire_grootte)
one_hot_matrix = np.zeros((zin_lengte, vocab_grootte))

for i, woord in enumerate(woorden):
    j = woord_naar_index[woord]
    one_hot_matrix[i, j] = 1

print(f"One-hot matrix shape: {one_hot_matrix.shape}")
print(f"Dit is een 2D tensor: (zin_lengte, vocabulaire_grootte)")
print()
print("One-hot matrix:")
print(f"{'Woord':<10} {vocabulaire}")
print("-" * 50)
for i, woord in enumerate(woorden):
    print(f"{woord:<10} {one_hot_matrix[i].astype(int)}")

print()
print("Elk woord is nu een vector met één 1 en verder nullen.")
print("Let op: 'de' komt twee keer voor maar heeft dezelfde representatie.")

In [None]:
# Probleem met one-hot: geen semantische informatie

def one_hot_vector(woord, vocab_dict, vocab_size):
    vec = np.zeros(vocab_size)
    if woord in vocab_dict:
        vec[vocab_dict[woord]] = 1
    return vec

# Groter vocabulaire voor demonstratie
groot_vocab = ['kat', 'hond', 'dier', 'auto', 'fiets', 'voertuig', 'de', 'een']
groot_vocab_dict = {w: i for i, w in enumerate(groot_vocab)}

vec_kat = one_hot_vector('kat', groot_vocab_dict, len(groot_vocab))
vec_hond = one_hot_vector('hond', groot_vocab_dict, len(groot_vocab))
vec_auto = one_hot_vector('auto', groot_vocab_dict, len(groot_vocab))

print("One-hot vectoren:")
print(f"  'kat':  {vec_kat.astype(int)}")
print(f"  'hond': {vec_hond.astype(int)}")
print(f"  'auto': {vec_auto.astype(int)}")
print()

# Bereken afstanden (dot products)
print("Dot products (maat voor gelijkenis):")
print(f"  'kat' · 'hond' = {vec_kat @ vec_hond} (beide dieren, maar dot product is 0!)")
print(f"  'kat' · 'auto' = {vec_kat @ vec_auto} (niet gerelateerd, ook 0)")
print()
print("One-hot encoding bevat geen semantische informatie.")
print("'kat' en 'hond' lijken niet meer op elkaar dan 'kat' en 'auto'.")

In [None]:
# Word embeddings: dense vectoren met semantische betekenis
# In de praktijk worden deze geleerd, hier simuleren we ze

embedding_dim = 4

# Gesimuleerde embeddings (in werkelijkheid komen deze uit training)
embeddings = {
    'kat': np.array([0.8, -0.5, 0.6, 0.1]),      # Dier, huisdier
    'hond': np.array([0.7, -0.4, 0.5, 0.2]),     # Ook een dier - lijkt op kat!
    'auto': np.array([-0.6, 0.8, -0.3, 0.5]),    # Voertuig
    'fiets': np.array([-0.5, 0.7, -0.2, 0.4]),   # Ook voertuig - lijkt op auto!
    'de': np.array([0.1, 0.1, 0.0, -0.1]),       # Functiewoord
    'zit': np.array([0.2, 0.3, 0.8, -0.2]),      # Werkwoord
}

print("Word embeddings (dense vectoren met 4 dimensies):")
print()
for woord, vector in embeddings.items():
    print(f"  '{woord}': {vector}")

In [None]:
# Nu kunnen we semantische gelijkenis meten met cosine similarity

def cosine_similarity(u, v):
    return (u @ v) / (np.linalg.norm(u) * np.linalg.norm(v))

print("Cosine similarity met word embeddings:")
print()

# Dieren onderling
sim_kat_hond = cosine_similarity(embeddings['kat'], embeddings['hond'])
print(f"  'kat' en 'hond':  {sim_kat_hond:.3f} (beide huisdieren - hoge gelijkenis!)")

# Voertuigen onderling
sim_auto_fiets = cosine_similarity(embeddings['auto'], embeddings['fiets'])
print(f"  'auto' en 'fiets': {sim_auto_fiets:.3f} (beide voertuigen - hoge gelijkenis!)")

# Dier vs voertuig
sim_kat_auto = cosine_similarity(embeddings['kat'], embeddings['auto'])
print(f"  'kat' en 'auto':  {sim_kat_auto:.3f} (niet gerelateerd - lage/negatieve gelijkenis)")

print()
print("Embeddings vangen semantische relaties: vergelijkbare woorden hebben vergelijkbare vectoren.")

In [None]:
# Zin als matrix van embeddings
zin_woorden = ['de', 'kat', 'zit']
zin_embeddings = np.array([embeddings[w] for w in zin_woorden])

print(f"Zin: {zin_woorden}")
print(f"Als embedding matrix: shape {zin_embeddings.shape}")
print(f"Dit is een 2D tensor: (zin_lengte, embedding_dimensie)")
print()
print("Matrix:")
print(zin_embeddings)
print()
print("Elke rij is het embedding van één woord.")
print("Dit is de input voor moderne taalmodellen.")

In [None]:
# Overzicht van alle datatypes en hun tensor shapes
print("OVERZICHT: Datatypes en hun tensor representaties")
print("=" * 75)
print()
print(f"{'Datatype':<25} {'Tensor dimensies':<20} {'Voorbeeld shape':<20}")
print("-" * 75)

datatypes = [
    ("Gestructureerde data", "2D", "(1000, 10)"),
    ("Grijswaarden afbeelding", "2D", "(28, 28)"),
    ("MNIST als vector", "1D", "(784,)"),
    ("Kleurenafbeelding", "3D", "(224, 224, 3)"),
    ("Batch afbeeldingen", "4D", "(32, 224, 224, 3)"),
    ("Video", "4D", "(300, 1080, 1920, 3)"),
    ("Batch video's", "5D", "(8, 300, 224, 224, 3)"),
    ("Tekst (one-hot)", "2D", "(100, 10000)"),
    ("Tekst (embeddings)", "2D", "(100, 256)"),
    ("Batch tekst", "3D", "(32, 100, 256)"),
]

for dtype, dims, shape in datatypes:
    print(f"{dtype:<25} {dims:<20} {shape:<20}")

print()
print("Let op: bij batches wordt altijd een extra dimensie toegevoegd vooraan.")

## 2.4 Operaties op Vectoren

Nu we weten hoe data wordt voorgesteld als vectoren en matrices, leren we de fundamentele operaties die we kunnen uitvoeren. Deze operaties vormen de bouwstenen van alle berekeningen in neurale netwerken.

### Vectoroptelling

Twee vectoren van dezelfde lengte kunnen worden opgeteld door de overeenkomstige elementen op te tellen. Als u = [1, 2, 3] en v = [4, 5, 6], dan is u + v = [1+4, 2+5, 3+6] = [5, 7, 9]. De vectoren moeten dezelfde dimensie hebben, anders is de optelling niet gedefinieerd.

Geometrisch kun je vectoroptelling visualiseren met de "kop-aan-staart" methode. Plaats de staart van de tweede vector aan de kop van de eerste, en het resultaat is de vector van de oorsprong naar de kop van de tweede. Dit is intuïtief als je vectoren ziet als verplaatsingen: eerst ga je in de richting van u, dan in de richting van v.

In Machine Learning gebruiken we vectoroptelling wanneer we een bias toevoegen aan de output van een laag. De bias is een vector die bij elke output wordt opgeteld, waardoor het netwerk de output kan verschuiven.

In [None]:
u = np.array([1, 2, 3])
v = np.array([4, 5, 6])

som = u + v

print(f"u = {u}")
print(f"v = {v}")
print(f"u + v = {som}")
print()
print("Element voor element: [1+4, 2+5, 3+6] = [5, 7, 9]")

In [None]:
# Geometrische visualisatie van vectoroptelling in 2D
u_2d = np.array([3, 1])
v_2d = np.array([1, 2])
som_2d = u_2d + v_2d

plt.figure(figsize=(8, 8))

# Teken vector u (blauw)
plt.quiver(0, 0, u_2d[0], u_2d[1], angles='xy', scale_units='xy', scale=1, 
           color='blue', width=0.015, label=f'u = {u_2d}')

# Teken vector v vanaf de kop van u (rood)
plt.quiver(u_2d[0], u_2d[1], v_2d[0], v_2d[1], angles='xy', scale_units='xy', scale=1, 
           color='red', width=0.015, label=f'v = {v_2d}')

# Teken de som vector (groen)
plt.quiver(0, 0, som_2d[0], som_2d[1], angles='xy', scale_units='xy', scale=1, 
           color='green', width=0.015, label=f'u + v = {som_2d}')

plt.xlim(-0.5, 5.5)
plt.ylim(-0.5, 4.5)
plt.grid(True, alpha=0.3)
plt.axhline(y=0, color='k', linewidth=0.5)
plt.axvline(x=0, color='k', linewidth=0.5)
plt.legend(fontsize=11)
plt.title('Vectoroptelling: kop-aan-staart methode', fontsize=14)
plt.gca().set_aspect('equal')
plt.show()

print("De groene vector (som) gaat van de oorsprong naar waar v eindigt.")

### Scalaire vermenigvuldiging

Een vector kan worden vermenigvuldigd met een scalar door elk element met die scalar te vermenigvuldigen. Als v = [1, 2, 3] en c = 2, dan is c·v = [2, 4, 6].

Geometrisch verandert scalaire vermenigvuldiging de lengte van de vector zonder de richting te veranderen (tenzij de scalar negatief is). Een scalar groter dan 1 maakt de vector langer, een scalar tussen 0 en 1 maakt hem korter. Een negatieve scalar keert de richting om.

In neurale netwerken zijn de gewichten scalars die de input signalen schalen. Een groot gewicht versterkt een signaal, een klein gewicht verzwakt het, en een negatief gewicht keert het om.

In [None]:
v = np.array([1, 2, 3])

print(f"Originele vector v = {v}")
print()
print(f"2 × v = {2 * v}  (verdubbeld)")
print(f"0.5 × v = {0.5 * v}  (gehalveerd)")
print(f"-1 × v = {-1 * v}  (omgekeerd)")
print(f"0 × v = {0 * v}  (nulvector)")

In [None]:
# Geometrische visualisatie van scalaire vermenigvuldiging
v = np.array([2, 1])

fig, axes = plt.subplots(1, 3, figsize=(14, 4))

scalars = [2, 0.5, -1]
titles = ['c = 2 (verlengen)', 'c = 0.5 (verkorten)', 'c = -1 (omkeren)']
colors = ['red', 'orange', 'purple']

for ax, c, title, color in zip(axes, scalars, titles, colors):
    # Originele vector
    ax.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1, 
              color='blue', width=0.02, label=f'v = {v}')
    
    # Geschaalde vector
    scaled = c * v
    ax.quiver(0, 0, scaled[0], scaled[1], angles='xy', scale_units='xy', scale=1, 
              color=color, width=0.02, label=f'{c}·v = {scaled}')
    
    ax.set_xlim(-3, 5)
    ax.set_ylim(-2, 3)
    ax.grid(True, alpha=0.3)
    ax.axhline(y=0, color='k', linewidth=0.5)
    ax.axvline(x=0, color='k', linewidth=0.5)
    ax.legend(fontsize=10)
    ax.set_title(title, fontsize=12)
    ax.set_aspect('equal')

plt.tight_layout()
plt.show()

### De norm: lengte van een vector

De norm van een vector is een maat voor de "grootte" of lengte van de vector. De meest gebruikte norm is de Euclidische norm of L2-norm, die overeenkomt met de gewone afstand in de ruimte.

Voor een vector v = [v₁, v₂, ..., vₙ] is de L2-norm: ||v|| = √(v₁² + v₂² + ... + vₙ²)

Dit is een generalisatie van de stelling van Pythagoras naar hogere dimensies. In 2D is de norm de lengte van de schuine zijde van een rechthoekige driehoek. In 3D is het de afstand van de oorsprong tot een punt in de ruimte.

De norm is belangrijk in Machine Learning voor meerdere doeleinden. We gebruiken het om vectoren te normaliseren, zodat ze lengte 1 hebben. We gebruiken het voor regularisatie, waarbij we grote gewichten bestraffen. We gebruiken het om afstanden tussen punten te berekenen.

In [None]:
# Het bekende 3-4-5 driehoek voorbeeld
v = np.array([3, 4])

# Handmatige berekening
norm_handmatig = np.sqrt(v[0]**2 + v[1]**2)

# Met NumPy
norm_numpy = np.linalg.norm(v)

print(f"Vector v = {v}")
print()
print("Berekening van de L2-norm:")
print(f"||v|| = √(3² + 4²) = √(9 + 16) = √25 = {norm_handmatig}")
print()
print(f"Met NumPy: np.linalg.norm(v) = {norm_numpy}")
print()
print("Dit is het bekende 3-4-5 rechthoekige driehoek!")

In [None]:
# Visualisatie van de norm als lengte
v = np.array([3, 4])

plt.figure(figsize=(8, 8))

# Teken de vector
plt.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1, 
           color='blue', width=0.02)

# Teken de rechthoekige driehoek
plt.plot([0, v[0]], [0, 0], 'r--', linewidth=2, label=f'horizontaal = {v[0]}')
plt.plot([v[0], v[0]], [0, v[1]], 'g--', linewidth=2, label=f'verticaal = {v[1]}')

# Markeer de hoek
angle = np.arctan2(v[1], v[0])
theta = np.linspace(0, angle, 20)
r = 0.5
plt.plot(r * np.cos(theta), r * np.sin(theta), 'k-', linewidth=1)

plt.xlim(-0.5, 5)
plt.ylim(-0.5, 5)
plt.grid(True, alpha=0.3)
plt.axhline(y=0, color='k', linewidth=0.5)
plt.axvline(x=0, color='k', linewidth=0.5)
plt.legend(fontsize=11)
plt.title(f'Stelling van Pythagoras: ||v|| = √(3² + 4²) = 5', fontsize=14)
plt.text(1.5, 2.2, f'||v|| = {np.linalg.norm(v):.0f}', fontsize=14, color='blue')
plt.gca().set_aspect('equal')
plt.show()

In [None]:
# Norm in hogere dimensies
v_3d = np.array([1, 2, 2])
v_hoog = np.array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1])  # 10 dimensies

print("De norm werkt in elke dimensie:")
print()
print(f"3D vector: {v_3d}")
print(f"||v|| = √(1² + 2² + 2²) = √(1 + 4 + 4) = √9 = {np.linalg.norm(v_3d)}")
print()
print(f"10D vector: {v_hoog}")
print(f"||v|| = √(1² + 1² + ... + 1²) = √10 = {np.linalg.norm(v_hoog):.4f}")

### Normalisatie: vectoren met lengte 1

Een genormaliseerde vector of eenheidsvector is een vector met norm 1. We kunnen elke niet-nul vector normaliseren door hem te delen door zijn norm: û = v / ||v||

Het resultaat is een vector die dezelfde richting heeft als de originele vector, maar met lengte 1. Genormaliseerde vectoren zijn handig wanneer we alleen geïnteresseerd zijn in de richting, niet in de grootte.

In word embeddings vergelijken we vaak de richtingen van vectoren om semantische gelijkenis te meten, ongeacht hoe "sterk" de embeddings zijn. In neurale netwerken wordt batch normalization gebruikt om de activaties te normaliseren, wat het trainen stabieler maakt.

In [None]:
v = np.array([3, 4])
norm_v = np.linalg.norm(v)
v_genormaliseerd = v / norm_v

print(f"Originele vector: v = {v}")
print(f"Norm van v: ||v|| = {norm_v}")
print()
print(f"Genormaliseerde vector: v / ||v|| = {v} / {norm_v} = {v_genormaliseerd}")
print()
print(f"Norm van genormaliseerde vector: {np.linalg.norm(v_genormaliseerd):.10f}")
print()
print("De genormaliseerde vector heeft exact lengte 1.")

In [None]:
# Visualisatie van normalisatie
vectoren = [
    np.array([3, 4]),
    np.array([1, 1]),
    np.array([4, 1]),
]

plt.figure(figsize=(10, 8))

colors = ['blue', 'green', 'red']

for v, color in zip(vectoren, colors):
    # Originele vector (licht)
    plt.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1, 
               color=color, alpha=0.3, width=0.015)
    
    # Genormaliseerde vector (donker)
    v_norm = v / np.linalg.norm(v)
    plt.quiver(0, 0, v_norm[0], v_norm[1], angles='xy', scale_units='xy', scale=1, 
               color=color, width=0.015, label=f'{v} → {v_norm.round(2)}')

# Teken eenheidscirkel
theta = np.linspace(0, 2*np.pi, 100)
plt.plot(np.cos(theta), np.sin(theta), 'k--', linewidth=1, alpha=0.5, label='Eenheidscirkel')

plt.xlim(-1.5, 5)
plt.ylim(-1.5, 5)
plt.grid(True, alpha=0.3)
plt.axhline(y=0, color='k', linewidth=0.5)
plt.axvline(x=0, color='k', linewidth=0.5)
plt.legend(fontsize=10, loc='upper right')
plt.title('Normalisatie: alle vectoren worden teruggebracht tot lengte 1', fontsize=14)
plt.gca().set_aspect('equal')
plt.show()

print("De lichte pijlen zijn de originele vectoren.")
print("De donkere pijlen zijn de genormaliseerde vectoren (allemaal op de eenheidscirkel).")

## 2.5 Het Dot Product

### Definitie en berekening

Het dot product (ook wel inwendig product of scalair product genoemd) is een fundamentele operatie die twee vectoren combineert tot één enkel getal (een scalar). Voor vectoren u = [u₁, u₂, ..., uₙ] en v = [v₁, v₂, ..., vₙ] is het dot product:

u · v = u₁v₁ + u₂v₂ + ... + uₙvₙ

Je vermenigvuldigt de overeenkomstige elementen en telt ze op. Het resultaat is één enkel getal. Dit lijkt simpel, maar het dot product is misschien wel de belangrijkste operatie in Machine Learning. Vrijwel elke berekening in een neuraal netwerk is uiteindelijk gebaseerd op dot producten.

In [None]:
u = np.array([1, 2, 3])
v = np.array([4, 5, 6])

# Handmatige berekening
dot_handmatig = u[0]*v[0] + u[1]*v[1] + u[2]*v[2]

# Met NumPy functie
dot_numpy = np.dot(u, v)

# Met de @ operator (aanbevolen in moderne Python)
dot_operator = u @ v

print(f"u = {u}")
print(f"v = {v}")
print()
print("Dot product berekening:")
print(f"u · v = 1×4 + 2×5 + 3×6 = 4 + 10 + 18 = {dot_handmatig}")
print()
print(f"Met np.dot(u, v): {dot_numpy}")
print(f"Met u @ v: {dot_operator}")

### Geometrische interpretatie

Het dot product heeft een prachtige geometrische betekenis. Het is gelijk aan het product van de lengtes van de vectoren en de cosinus van de hoek θ tussen hen:

u · v = ||u|| × ||v|| × cos(θ)

Dit leidt tot belangrijke inzichten over de relatie tussen twee vectoren:

Als de vectoren in dezelfde richting wijzen (θ = 0°), is cos(θ) = 1, en het dot product is maximaal positief. Als de vectoren loodrecht op elkaar staan (θ = 90°), is cos(θ) = 0, dus het dot product is 0. Als de vectoren in tegengestelde richting wijzen (θ = 180°), is cos(θ) = -1, en het dot product is maximaal negatief.

Het dot product meet dus in zekere zin hoeveel twee vectoren "op elkaar lijken" qua richting. Dit is precies waarom het zo nuttig is in Machine Learning: we kunnen het gebruiken om de gelijkenis tussen datapunten te meten.

In [None]:
# Demonstratie van de geometrische interpretatie
fig, axes = plt.subplots(1, 3, figsize=(14, 4))

scenarios = [
    (np.array([1, 0]), np.array([1, 0]), 'Zelfde richting (θ = 0°)'),
    (np.array([1, 0]), np.array([0, 1]), 'Loodrecht (θ = 90°)'),
    (np.array([1, 0]), np.array([-1, 0]), 'Tegengesteld (θ = 180°)')
]

for ax, (u, v, title) in zip(axes, scenarios):
    # Bereken dot product
    dot = u @ v
    
    # Teken vectoren
    ax.quiver(0, 0, u[0], u[1], angles='xy', scale_units='xy', scale=1, 
              color='blue', width=0.03, label='u')
    ax.quiver(0, 0, v[0], v[1], angles='xy', scale_units='xy', scale=1, 
              color='red', width=0.03, label='v')
    
    ax.set_xlim(-1.5, 1.5)
    ax.set_ylim(-0.5, 1.5)
    ax.set_aspect('equal')
    ax.grid(True, alpha=0.3)
    ax.axhline(y=0, color='k', linewidth=0.5)
    ax.axvline(x=0, color='k', linewidth=0.5)
    ax.legend(fontsize=10)
    ax.set_title(f'{title}\nu · v = {dot}', fontsize=11)

plt.tight_layout()
plt.show()

print("Het teken van het dot product vertelt ons over de hoek tussen de vectoren:")
print("  - Positief: hoek < 90° (vectoren wijzen min of meer dezelfde kant op)")
print("  - Nul: hoek = 90° (vectoren staan loodrecht op elkaar)")
print("  - Negatief: hoek > 90° (vectoren wijzen min of meer tegengesteld)")

In [None]:
# De hoek berekenen uit het dot product
u = np.array([1, 2])
v = np.array([3, 1])

# Bereken dot product en normen
dot_product = u @ v
norm_u = np.linalg.norm(u)
norm_v = np.linalg.norm(v)

# cos(θ) = (u · v) / (||u|| × ||v||)
cos_theta = dot_product / (norm_u * norm_v)

# θ = arccos(cos(θ))
theta_radialen = np.arccos(cos_theta)
theta_graden = np.degrees(theta_radialen)

print(f"u = {u}, ||u|| = {norm_u:.4f}")
print(f"v = {v}, ||v|| = {norm_v:.4f}")
print()
print(f"u · v = {dot_product}")
print(f"cos(θ) = {dot_product} / ({norm_u:.4f} × {norm_v:.4f}) = {cos_theta:.4f}")
print(f"θ = arccos({cos_theta:.4f}) = {theta_graden:.2f}°")

### Dot product in neurale netwerken

In een neuraal netwerk is het dot product de kernoperatie. Wanneer een neuron zijn output berekent, neemt het het dot product van de input vector met zijn gewichten vector, en telt daar een bias bij op:

output = (inputs · weights) + bias

Dit betekent dat elk gewicht bepaalt hoeveel de corresponderende input bijdraagt aan de output. Een groot positief gewicht versterkt die input, een groot negatief gewicht keert het effect om, en een gewicht dicht bij nul negeert die input grotendeels.

Als de input vector en de gewichten vector in dezelfde "richting" wijzen (positief dot product), wordt de output groot. Als ze tegengesteld zijn (negatief dot product), wordt de output klein of negatief. Het neuron "activeert" dus wanneer de input lijkt op wat de gewichten coderen.

In [None]:
# Simulatie van één neuron
inputs = np.array([0.5, 0.3, 0.8, 0.1])   # 4 input waarden
weights = np.array([0.2, -0.5, 0.9, 0.1])  # 4 gewichten
bias = 0.1

# De output van het neuron (voor activatie)
weighted_sum = inputs @ weights
output = weighted_sum + bias

print("Neuron berekening:")
print()
print(f"Inputs:  {inputs}")
print(f"Weights: {weights}")
print(f"Bias:    {bias}")
print()
print("Stap 1: Dot product van inputs en weights")
print(f"  {inputs[0]}×{weights[0]} + {inputs[1]}×{weights[1]} + {inputs[2]}×{weights[2]} + {inputs[3]}×{weights[3]}")
print(f"  = {inputs[0]*weights[0]:.2f} + {inputs[1]*weights[1]:.2f} + {inputs[2]*weights[2]:.2f} + {inputs[3]*weights[3]:.2f}")
print(f"  = {weighted_sum:.4f}")
print()
print(f"Stap 2: Tel bias op")
print(f"  {weighted_sum:.4f} + {bias} = {output:.4f}")
print()
print(f"Output van het neuron: {output:.4f}")

In [None]:
# Demonstratie: het neuron reageert op bepaalde patronen
weights = np.array([1.0, 1.0, 0.0, 0.0])  # Reageert op de eerste twee inputs
bias = -0.5

test_inputs = [
    np.array([1.0, 1.0, 0.0, 0.0]),  # Matcht de gewichten
    np.array([0.0, 0.0, 1.0, 1.0]),  # Tegengesteld aan de gewichten
    np.array([0.5, 0.5, 0.5, 0.5]),  # Neutraal
    np.array([1.0, 0.0, 1.0, 0.0]),  # Gedeeltelijke match
]

print(f"Gewichten: {weights}")
print(f"Bias: {bias}")
print()
print("Dit neuron 'zoekt' naar activatie in de eerste twee inputs.\n")

for inp in test_inputs:
    output = inp @ weights + bias
    print(f"Input: {inp} → Output: {output:.2f}")

## 2.6 Toepassing: Gelijkenis tussen Afbeeldingen

We kunnen het dot product en cosine similarity gebruiken om te meten hoe "gelijkend" twee MNIST-afbeeldingen zijn. Dit is een vereenvoudigde versie van wat een neuraal netwerk doet: de gewichten van een getraind netwerk bevatten "templates" van kenmerken, en het netwerk berekent hoe goed de input overeenkomt met deze templates via dot producten.

### Dot product als gelijkenismaat

In [None]:
# Selecteer voorbeelden van verschillende cijfers
idx_3_a = np.where(y_mnist == 3)[0][0]  # Eerste 3
idx_3_b = np.where(y_mnist == 3)[0][1]  # Tweede 3
idx_8 = np.where(y_mnist == 8)[0][0]    # Eerste 8
idx_1 = np.where(y_mnist == 1)[0][0]    # Eerste 1

afb_3_a = X_mnist[idx_3_a]
afb_3_b = X_mnist[idx_3_b]
afb_8 = X_mnist[idx_8]
afb_1 = X_mnist[idx_1]

# Visualiseer de afbeeldingen
fig, axes = plt.subplots(1, 4, figsize=(12, 3))
images = [(afb_3_a, '3 (a)'), (afb_3_b, '3 (b)'), (afb_8, '8'), (afb_1, '1')]

for ax, (img, label) in zip(axes, images):
    ax.imshow(img.reshape(28, 28), cmap='gray')
    ax.set_title(f'Cijfer {label}', fontsize=12)
    ax.axis('off')

plt.tight_layout()
plt.show()

In [None]:
# Bereken dot products
print("Dot products tussen MNIST afbeeldingen:")
print()

dot_3a_3a = afb_3_a @ afb_3_a
dot_3a_3b = afb_3_a @ afb_3_b
dot_3a_8 = afb_3_a @ afb_8
dot_3a_1 = afb_3_a @ afb_1

print(f"3(a) met zichzelf: {dot_3a_3a:,.0f}")
print(f"3(a) met 3(b):     {dot_3a_3b:,.0f}")
print(f"3(a) met 8:        {dot_3a_8:,.0f}")
print(f"3(a) met 1:        {dot_3a_1:,.0f}")
print()
print("Het dot product met zichzelf is het grootst (maximale gelijkenis).")
print("De dot producten zijn moeilijk te vergelijken omdat de afbeeldingen")
print("verschillende 'helderheden' kunnen hebben.")

### Cosine similarity: genormaliseerde gelijkenis

Om een eerlijkere vergelijking te maken, gebruiken we cosine similarity. Dit normaliseert voor de lengte van de vectoren en geeft een waarde tussen -1 en 1:

cosine_similarity(u, v) = (u · v) / (||u|| × ||v||)

Een waarde van 1 betekent dat de vectoren in exact dezelfde richting wijzen, 0 betekent dat ze loodrecht staan, en -1 betekent dat ze in tegengestelde richting wijzen. Voor afbeeldingen met alleen positieve pixelwaarden zal de cosine similarity altijd tussen 0 en 1 liggen.

In [None]:
def cosine_similarity(u, v):
    """Bereken de cosine similarity tussen twee vectoren."""
    return (u @ v) / (np.linalg.norm(u) * np.linalg.norm(v))

print("Cosine similarity tussen MNIST afbeeldingen:")
print()

sim_3a_3a = cosine_similarity(afb_3_a, afb_3_a)
sim_3a_3b = cosine_similarity(afb_3_a, afb_3_b)
sim_3a_8 = cosine_similarity(afb_3_a, afb_8)
sim_3a_1 = cosine_similarity(afb_3_a, afb_1)

print(f"3(a) met zichzelf: {sim_3a_3a:.4f} (perfecte gelijkenis)")
print(f"3(a) met 3(b):     {sim_3a_3b:.4f} (beide drieën)")
print(f"3(a) met 8:        {sim_3a_8:.4f} (verschillende cijfers)")
print(f"3(a) met 1:        {sim_3a_1:.4f} (zeer verschillend)")
print()
print("De 3 lijkt meer op een andere 3 dan op een 8 of 1!")
print("Dit is de basis van patroonherkenning.")

In [None]:
# Maak een heatmap van gelijkenis tussen gemiddelde cijfers
print("Berekenen van gemiddelde afbeelding per cijfer...")

gemiddelde_cijfers = []
for cijfer in range(10):
    mask = y_mnist == cijfer
    gemiddelde = X_mnist[mask].mean(axis=0)
    gemiddelde_cijfers.append(gemiddelde)

gemiddelde_cijfers = np.array(gemiddelde_cijfers)
print(f"Shape: {gemiddelde_cijfers.shape}")

In [None]:
# Bereken similarity matrix
similarity_matrix = np.zeros((10, 10))

for i in range(10):
    for j in range(10):
        similarity_matrix[i, j] = cosine_similarity(gemiddelde_cijfers[i], gemiddelde_cijfers[j])

# Visualiseer
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Gemiddelde cijfers
for i in range(10):
    ax_sub = fig.add_axes([0.02 + i*0.045, 0.55, 0.04, 0.35])
    ax_sub.imshow(gemiddelde_cijfers[i].reshape(28, 28), cmap='gray')
    ax_sub.set_title(str(i), fontsize=10)
    ax_sub.axis('off')

axes[0].axis('off')
axes[0].set_title('Gemiddelde afbeelding per cijfer', fontsize=14, pad=80)

# Heatmap
im = axes[1].imshow(similarity_matrix, cmap='YlOrRd', vmin=0.5, vmax=1)
axes[1].set_xticks(range(10))
axes[1].set_yticks(range(10))
axes[1].set_xlabel('Cijfer', fontsize=12)
axes[1].set_ylabel('Cijfer', fontsize=12)
axes[1].set_title('Cosine similarity tussen gemiddelde cijfers', fontsize=14)
plt.colorbar(im, ax=axes[1], label='Similarity')

# Voeg waarden toe aan de cellen
for i in range(10):
    for j in range(10):
        color = 'white' if similarity_matrix[i, j] > 0.75 else 'black'
        axes[1].text(j, i, f'{similarity_matrix[i, j]:.2f}', 
                    ha='center', va='center', color=color, fontsize=8)

plt.tight_layout()
plt.show()

In [None]:
# Vind de meest en minst gelijkende paren
print("Analyse van de similarity matrix:\n")

# Maak een lijst van alle paren (zonder diagonaal en duplicaten)
paren = []
for i in range(10):
    for j in range(i+1, 10):
        paren.append((i, j, similarity_matrix[i, j]))

# Sorteer op similarity
paren_gesorteerd = sorted(paren, key=lambda x: x[2], reverse=True)

print("Meest gelijkende paren:")
for i, j, sim in paren_gesorteerd[:5]:
    print(f"  {i} en {j}: {sim:.4f}")

print()
print("Minst gelijkende paren:")
for i, j, sim in paren_gesorteerd[-5:]:
    print(f"  {i} en {j}: {sim:.4f}")

print()
print("Dit verklaart waarom sommige cijfers vaker worden verward dan andere!")

## 2.7 Samenvatting en Vooruitblik

### Kernconcepten van deze les

We hebben de fundamentele datastructuren van lineaire algebra verkend. Een scalar is een enkel getal, een vector is een geordende lijst van getallen, een matrix is een 2D-tabel, en een tensor generaliseert naar hogere dimensies. Deze structuren stellen ons in staat om data zoals tabellen, afbeeldingen, video's en tekst wiskundig te representeren.

We hebben gezien hoe verschillende soorten data worden omgezet naar tensoren. Gestructureerde data wordt een 2D-matrix met rijen voor voorbeelden en kolommen voor kenmerken. Grijswaarden afbeeldingen zijn 2D-matrices, kleurenafbeeldingen zijn 3D-tensors, en video's zijn 4D-tensors. Tekst wordt via one-hot encoding of word embeddings omgezet naar matrices.

Vectoroperaties zoals optelling, scalaire vermenigvuldiging en het berekenen van de norm geven ons tools om met deze data te werken. Het dot product is bijzonder belangrijk: het combineert twee vectoren tot een scalar en vormt de basis van berekeningen in neurale netwerken. De geometrische interpretatie van het dot product als maat voor gelijkenis tussen richtingen is essentieel voor het begrijpen van hoe neurale netwerken patronen herkennen.

### Link naar het neurale netwerk

De input van ons MNIST-netwerk is een vector van 784 pixels. Elk neuron in de eerste laag heeft 784 gewichten, ook een vector. De output van dat neuron is het dot product van input en gewichten, plus een bias. Dit proces herhaalt zich door alle lagen van het netwerk. In essentie is elk neuron een patroonherkennner die meet hoe goed de input overeenkomt met de geleerde gewichten.

### Volgende les

In les 3 breiden we uit naar matrixoperaties. We leren hoe matrixvermenigvuldiging werkt en hoe dit ons in staat stelt om een hele laag van het netwerk in één operatie te berekenen. We introduceren ook het concept van lineaire transformaties en bekijken speciale matrixeigenschappen zoals de inverse en determinant.

### Checklist leerdoelen

Neem even de tijd om te reflecteren over wat je hebt geleerd. Kan je de volgende vragen beantwoorden?

1. Wat is het verschil tussen een scalar, vector, matrix en tensor?

2. Hoe wordt een kleurenafbeelding voorgesteld als tensor? En een video?

3. Wat is de geometrische betekenis van de norm van een vector?

4. Wat is het dot product en waarom is het belangrijk in neurale netwerken?

5. Hoe meet cosine similarity de gelijkenis tussen twee vectoren?

Als je deze vragen kan beantwoorden, ben je klaar voor de volgende les!

---

**Mathematical Foundations** | Les 2 van 12 | IT & Artificial Intelligence

---