# Les 7: Labo - Oefeningen

**Mathematical Foundations - IT & Artificial Intelligence**

---

In dit labo implementeer je backpropagation en train je een neuraal netwerk op MNIST.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

np.set_printoptions(precision=4, suppress=True)
np.random.seed(42)

print("Libraries geladen!")

---

## Oefening 1: Computational Graph Tekenen

*Geschatte tijd: 10 minuten*

### Opdracht 1a

Teken de computational graph voor de volgende expressies. Identificeer alle tussenresultaten.

1. f(x, y) = (x + y) * (x - y)
2. g(x, w, b) = σ(wx + b) waar σ de sigmoid is
3. h(x, W1, b1, W2, b2) = W2 @ ReLU(W1 @ x + b1) + b2

*Jouw antwoord (teken of beschrijf de graphs):*

1. f(x, y):

2. g(x, w, b):

3. h(x, W1, b1, W2, b2):


---

## Oefening 2: Lokale Gradiënten

*Geschatte tijd: 20 minuten*

### Opdracht 2a

Implementeer de volgende operaties met `forward` en `backward` methodes:

1. **Add**: z = x + y
2. **Multiply**: z = x * y
3. **Power**: z = x^n

In [None]:
class Add:
    def forward(self, x, y):
        # Jouw code hier
        pass
    
    def backward(self, dout):
        # Return (dx, dy)
        pass

class Multiply:
    def forward(self, x, y):
        # Jouw code hier
        pass
    
    def backward(self, dout):
        # Return (dx, dy)
        pass

class Power:
    def __init__(self, n):
        self.n = n
    
    def forward(self, x):
        # Jouw code hier
        pass
    
    def backward(self, dout):
        # Return dx
        pass

# Test


### Opdracht 2b

Implementeer de sigmoid en tanh activatiefuncties met forward en backward.

In [None]:
class Sigmoid:
    def forward(self, x):
        # Jouw code hier
        pass
    
    def backward(self, dout):
        pass

class Tanh:
    def forward(self, x):
        # Jouw code hier
        pass
    
    def backward(self, dout):
        pass

# Test


---

## Oefening 3: Backprop met de Hand

*Geschatte tijd: 25 minuten*

### Opdracht 3a

Gegeven het volgende mini-netwerk en concrete waarden:

```
x = 2
w1 = 0.5, b1 = 0.1
w2 = -0.3, b2 = 0.2
y_target = 0.5

h = ReLU(w1*x + b1)
y = sigmoid(w2*h + b2)
L = (y - y_target)²
```

Bereken met de hand (en verifieer met code):
1. Alle tussenresultaten in de forward pass
2. ∂L/∂y, ∂L/∂h, ∂L/∂w2, ∂L/∂b2, ∂L/∂w1, ∂L/∂b1

In [None]:
# Jouw uitwerking hier

# Gegeven waarden
x = 2
w1, b1 = 0.5, 0.1
w2, b2 = -0.3, 0.2
y_target = 0.5

# Forward pass
# ...

# Backward pass
# ...


---

## Oefening 4: Gradient Checking

*Geschatte tijd: 15 minuten*

### Opdracht 4a

Implementeer een `gradient_check` functie die de analytische gradiënt vergelijkt met de numerieke gradiënt. De functie moet het relatieve verschil teruggeven.

In [None]:
def gradient_check(f, x, analytic_grad, h=1e-5):
    """
    Vergelijk analytische gradiënt met numerieke gradiënt.
    
    Parameters:
    - f: functie die een scalar teruggeeft
    - x: punt waar we de gradiënt controleren
    - analytic_grad: analytisch berekende gradiënt
    - h: stapgrootte voor numerieke gradiënt
    
    Returns:
    - relative_error: relatieve fout tussen beide gradiënten
    """
    # Jouw code hier
    pass

# Test met f(x) = x²


### Opdracht 4b

Gebruik gradient checking om te verifiëren dat je sigmoid backward implementatie correct is.

In [None]:
# Jouw code hier


---

## Oefening 5: Layer Class met Backward

*Geschatte tijd: 25 minuten*

### Opdracht 5a

Implementeer een `LinearLayer` class met forward en backward methodes. De laag berekent: z = X @ W + b

In [None]:
class LinearLayer:
    def __init__(self, input_dim, output_dim):
        # Initialiseer W en b
        # Jouw code hier
        pass
    
    def forward(self, X):
        # X shape: (batch_size, input_dim)
        # Return shape: (batch_size, output_dim)
        # Sla X op voor backward!
        pass
    
    def backward(self, dout):
        # dout shape: (batch_size, output_dim)
        # Bereken self.dW en self.db
        # Return dX shape: (batch_size, input_dim)
        pass

# Test
layer = LinearLayer(3, 2)
X = np.random.randn(4, 3)  # 4 samples, 3 features
# ...

### Opdracht 5b

Implementeer een `ReLULayer` class.

In [None]:
class ReLULayer:
    def forward(self, X):
        pass
    
    def backward(self, dout):
        pass

# Test


---

## Oefening 6: Mini-netwerk Trainen

*Geschatte tijd: 25 minuten*

### Opdracht 6a

Train een netwerk met 1 hidden layer op een XOR-achtig probleem:
- Input: 2D punten
- Output: 1 als punt in kwadrant 1 of 3, 0 anders

In [None]:
# Genereer XOR-achtige data
np.random.seed(42)
n_samples = 200

X = np.random.randn(n_samples, 2)
y = ((X[:, 0] > 0) == (X[:, 1] > 0)).astype(float)  # XOR-achtig

# Visualiseer
plt.figure(figsize=(8, 6))
plt.scatter(X[y==0, 0], X[y==0, 1], c='blue', label='Klasse 0')
plt.scatter(X[y==1, 0], X[y==1, 1], c='red', label='Klasse 1')
plt.xlabel('x1')
plt.ylabel('x2')
plt.title('XOR-achtig probleem')
plt.legend()
plt.grid(True, alpha=0.3)
plt.show()

In [None]:
# Bouw en train je netwerk
# Jouw code hier


---

## Oefening 7: MNIST Trainen

*Geschatte tijd: 30 minuten*

### Opdracht 7a

Train een neuraal netwerk op MNIST. Gebruik de layer classes die je hebt geïmplementeerd.

In [None]:
# Laad MNIST
from sklearn.datasets import fetch_openml

print("MNIST laden...")
mnist = fetch_openml('mnist_784', version=1, as_frame=False, parser='auto')
X, y = mnist.data / 255.0, mnist.target.astype(int)

X_train, X_test = X[:60000], X[60000:]
y_train, y_test = y[:60000], y[60000:]

print(f"Training: {X_train.shape}, Test: {X_test.shape}")

In [None]:
# Softmax en Cross-Entropy (gegeven)
def softmax(x):
    exp_x = np.exp(x - np.max(x, axis=1, keepdims=True))
    return exp_x / np.sum(exp_x, axis=1, keepdims=True)

def cross_entropy_loss(probs, y_true):
    N = probs.shape[0]
    return -np.sum(np.log(probs[np.arange(N), y_true] + 1e-10)) / N

def cross_entropy_gradient(probs, y_true):
    N = probs.shape[0]
    grad = probs.copy()
    grad[np.arange(N), y_true] -= 1
    return grad / N

# Jouw netwerk en training loop hier


### Opdracht 7b

Experimenteer met hyperparameters:
- Probeer verschillende hidden layer sizes (64, 128, 256)
- Probeer verschillende learning rates (0.1, 0.5, 1.0)
- Wat geeft de beste test accuracy?

In [None]:
# Jouw experimenten hier


---

## Oefening 8: Hyperparameter Experimenten

*Geschatte tijd: 20 minuten*

### Opdracht 8a

Maak een systematische vergelijking van:
1. Effect van batch size (16, 32, 64, 128)
2. Effect van learning rate (0.01, 0.1, 0.5, 1.0)

Plot de learning curves.

In [None]:
# Jouw experimenten hier


---

## Bonusoefening: Tweede Hidden Layer

*Geschatte tijd: 25 minuten*

### Bonus

Breid je netwerk uit met een tweede hidden layer:
784 → 256 → 128 → 10

Train op MNIST en vergelijk de accuracy met het netwerk met 1 hidden layer.

In [None]:
# Jouw code voor de bonusoefening


---

## Klaar!

Je hebt nu backpropagation geïmplementeerd en een neuraal netwerk getraind op MNIST! Dit is een belangrijke mijlpaal - je begrijpt nu wat er onder de motorkap van deep learning frameworks gebeurt.

---

**Mathematical Foundations** | Les 7 Labo | IT & Artificial Intelligence

---