# Les 12: Labo - Capstone Project

**Mathematical Foundations - IT & Artificial Intelligence**

---

In dit finale labo voer je zelfstandig een machine learning project uit. Kies Ã©Ã©n van de projecten hieronder en volg de stappen.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

np.set_printoptions(precision=4, suppress=True)
np.random.seed(42)

# Importeer de library uit les12_theorie of kopieer deze hier
print("Klaar voor het capstone project!")

---

## Project Opties

Kies **Ã©Ã©n** van de volgende projecten:

### Project A: Regressie - Huizenprijzen Voorspellen
Bouw een netwerk dat huizenprijzen voorspelt op basis van kenmerken.

### Project B: Classificatie - Iris Dataset
Classificeer bloemen in 3 soorten op basis van 4 kenmerken.

### Project C: Binary Classification - Spam Detectie
Classificeer berichten als spam of niet-spam.

### Project D: Multi-label - Digit Sum Prediction
Gegeven twee MNIST cijfers, voorspel hun som.

---

## Project A: Huizenprijzen Regressie

### Stap 1: Data Laden

In [None]:
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# Laad data
housing = fetch_california_housing()
X, y = housing.data, housing.target

print(f"Features: {housing.feature_names}")
print(f"Shape: {X.shape}")
print(f"Target (huisprijs in $100k): min={y.min():.2f}, max={y.max():.2f}")

### Stap 2: Data Preprocessing

Normaliseer de features en split in train/test.

In [None]:
# Jouw code: normaliseer en split


### Stap 3: Model Ontwerpen

Ontwerp een netwerk voor regressie. Denk na over:
- Hoeveel hidden layers?
- Welke activatiefuncties?
- Welke loss functie? (Hint: MSE voor regressie)

In [None]:
# Jouw model hier


### Stap 4: Training

In [None]:
# Jouw training loop


### Stap 5: Evaluatie

Bereken MSE en RÂ² score op de test set. Visualiseer predicted vs actual.

In [None]:
# Jouw evaluatie


---

## Project B: Iris Classificatie

### Stap 1: Data Laden

In [None]:
from sklearn.datasets import load_iris

iris = load_iris()
X, y = iris.data, iris.target

print(f"Features: {iris.feature_names}")
print(f"Classes: {iris.target_names}")
print(f"Shape: {X.shape}")

### Stap 2-5: Implementeer je project

Volg dezelfde stappen als Project A:
1. Preprocessing
2. Model ontwerp
3. Training
4. Evaluatie

In [None]:
# Jouw implementatie


---

## Project C: Spam Detectie

### Stap 1: Data Laden

In [None]:
# Genereer synthetische spam data
np.random.seed(42)

n_samples = 2000
n_features = 20

# Features: word frequencies
X_spam = np.random.exponential(0.5, (n_samples//2, n_features)) + 0.3
X_ham = np.random.exponential(0.3, (n_samples//2, n_features))

X = np.vstack([X_spam, X_ham])
y = np.array([1] * (n_samples//2) + [0] * (n_samples//2))

# Shuffle
idx = np.random.permutation(n_samples)
X, y = X[idx], y[idx]

print(f"Shape: {X.shape}")
print(f"Spam ratio: {np.mean(y):.2f}")

### Stap 2-5: Implementeer je project

In [None]:
# Jouw implementatie
# Hint: gebruik Sigmoid output + BinaryCrossEntropyLoss


---

## Project D: Digit Sum Prediction

### Stap 1: Data Genereren

Combineer twee MNIST cijfers en voorspel hun som (0-18).

In [None]:
from sklearn.datasets import fetch_openml

# Laad MNIST
mnist = fetch_openml('mnist_784', version=1, as_frame=False, parser='auto')
X_mnist, y_mnist = mnist.data / 255.0, mnist.target.astype(int)

# Genereer paren
n_pairs = 10000
idx1 = np.random.randint(0, len(X_mnist), n_pairs)
idx2 = np.random.randint(0, len(X_mnist), n_pairs)

X = np.hstack([X_mnist[idx1], X_mnist[idx2]])  # Concatenate images
y = y_mnist[idx1] + y_mnist[idx2]  # Sum of digits

print(f"Input shape: {X.shape}")
print(f"Output range: {y.min()} - {y.max()}")

### Stap 2-5: Implementeer je project

In [None]:
# Jouw implementatie
# Hint: 19 output classes (0-18)


---

## Reflectie Vragen

Beantwoord de volgende vragen over je project:

1. **Welke wiskundige concepten heb je gebruikt?**

2. **Waarom koos je deze architectuur (aantal lagen, activaties)?**

3. **Welke problemen kwam je tegen en hoe loste je ze op?**

4. **Wat zou je anders doen als je meer tijd had?**

*Jouw antwoorden hier:*

1. 

2. 

3. 

4. 


---

## Bonusopdracht: Vergelijk Optimizers

Train hetzelfde model met SGD, SGD+Momentum en Adam. Plot de learning curves en vergelijk.


In [None]:
# Jouw vergelijking


---

## Inleveren

Je project is compleet als je hebt:

- [ ] Data geladen en gepreprocessed
- [ ] Model ontworpen en gebouwd
- [ ] Model getraind
- [ ] Resultaten geÃ«valueerd en gevisualiseerd
- [ ] Reflectievragen beantwoord

---

**Gefeliciteerd met het voltooien van Mathematical Foundations!** ðŸŽ‰

---

**Mathematical Foundations** | Les 12 Labo | IT & Artificial Intelligence

---