# Les 9: Labo - Oefeningen

**Mathematical Foundations - IT & Artificial Intelligence**

---

In dit labo oefen je met verwachtingswaarde, variantie en hun toepassingen in machine learning.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.set_printoptions(precision=4, suppress=True)
np.random.seed(42)

print("Libraries geladen!")

---

## Oefening 1: Verwachtingswaarde Berekenen

*Geschatte tijd: 15 minuten*

### Opdracht 1a

Bereken de verwachtingswaarde voor de volgende discrete verdelingen:

1. X met P(X=1)=0.2, P(X=2)=0.5, P(X=3)=0.3
2. Y ~ Binomiaal(n=10, p=0.3)
3. Z ~ Poisson(λ=5)

In [None]:
# Jouw code hier


### Opdracht 1b

Gegeven een functie g(X) = X², bereken E[g(X)] = E[X²] voor de verdeling in 1a punt 1.

Verifieer dat E[X²] ≠ (E[X])² in het algemeen.

In [None]:
# Jouw code hier


---

## Oefening 2: Variantie Berekenen

*Geschatte tijd: 15 minuten*

### Opdracht 2a

Bereken de variantie voor dezelfde verdelingen als oefening 1:

1. X met P(X=1)=0.2, P(X=2)=0.5, P(X=3)=0.3
2. Y ~ Binomiaal(n=10, p=0.3)
3. Z ~ Poisson(λ=5)

In [None]:
# Jouw code hier


### Opdracht 2b

Verifieer empirisch dat Var(aX + b) = a²·Var(X) door samples te genereren en de variantie te berekenen.

In [None]:
# Jouw code hier


---

## Oefening 3: Steekproefgemiddelde en Steekproefvariantie

*Geschatte tijd: 20 minuten*

### Opdracht 3a

Implementeer functies voor het berekenen van:
1. Steekproefgemiddelde (sample mean)
2. Steekproefvariantie (sample variance) met Bessel's correctie (N-1)

In [None]:
def sample_mean(x):
    """Bereken het steekproefgemiddelde."""
    # Jouw code hier
    pass

def sample_variance(x, ddof=1):
    """Bereken de steekproefvariantie met Bessel's correctie."""
    # Jouw code hier
    pass

# Test


### Opdracht 3b

Onderzoek de bias van de steekproefvariantie. Trek herhaaldelijk kleine samples (n=5) uit N(0,1) en bereken de variantie met en zonder Bessel's correctie. Welke is dichter bij de echte variantie (σ²=1)?

In [None]:
# Jouw code hier


---

## Oefening 4: Covariantie en Correlatie

*Geschatte tijd: 20 minuten*

### Opdracht 4a

Implementeer functies voor covariantie en correlatie.

In [None]:
def covariance(x, y):
    """Bereken de steekproef-covariantie."""
    # Jouw code hier
    pass

def correlation(x, y):
    """Bereken de Pearson correlatie."""
    # Jouw code hier
    pass

# Test


### Opdracht 4b

Genereer data met verschillende correlaties en visualiseer. Maak een 2x2 grid met correlaties: 0.9, 0.5, 0, -0.7.

In [None]:
# Jouw code hier


---

## Oefening 5: Batch Normalization

*Geschatte tijd: 25 minuten*

### Opdracht 5a

Implementeer een complete BatchNorm class met forward en backward pass.

In [None]:
class BatchNorm:
    def __init__(self, n_features, epsilon=1e-5, momentum=0.9):
        self.epsilon = epsilon
        self.momentum = momentum
        
        # Leerbare parameters
        self.gamma = np.ones(n_features)
        self.beta = np.zeros(n_features)
        
        # Running statistics (voor inference)
        self.running_mean = np.zeros(n_features)
        self.running_var = np.ones(n_features)
    
    def forward(self, x, training=True):
        """Forward pass."""
        # Jouw code hier
        pass
    
    def backward(self, dout):
        """Backward pass."""
        # Jouw code hier
        pass

# Test


### Opdracht 5b

Test je BatchNorm op data met extreem gemiddelde en variantie. Controleer dat de genormaliseerde output gemiddelde ≈ 0 en variantie ≈ 1 heeft.

In [None]:
# Jouw code hier


---

## Oefening 6: Weight Initialisatie

*Geschatte tijd: 20 minuten*

### Opdracht 6a

Implementeer Xavier en He initialisatie functies.

In [None]:
def xavier_init(n_in, n_out):
    """Xavier initialisatie voor tanh/sigmoid."""
    # Jouw code hier
    pass

def he_init(n_in, n_out):
    """He initialisatie voor ReLU."""
    # Jouw code hier
    pass

# Test


### Opdracht 6b

Vergelijk de variantie van activaties door een 10-laags netwerk met:
1. Random N(0, 1) initialisatie
2. Random N(0, 0.01) initialisatie
3. He initialisatie

Gebruik ReLU activaties. Plot de variantie per laag.

In [None]:
# Jouw code hier


---

## Oefening 7: Standaardisatie van Data

*Geschatte tijd: 15 minuten*

### Opdracht 7a

Implementeer een StandardScaler class die data transformeert naar z-scores: z = (x - μ) / σ

In [None]:
class StandardScaler:
    def fit(self, X):
        """Bereken mean en std van de training data."""
        # Jouw code hier
        pass
    
    def transform(self, X):
        """Transformeer data naar z-scores."""
        # Jouw code hier
        pass
    
    def fit_transform(self, X):
        self.fit(X)
        return self.transform(X)
    
    def inverse_transform(self, Z):
        """Transformeer z-scores terug naar originele schaal."""
        # Jouw code hier
        pass

# Test op data met verschillende schalen


---

## Oefening 8: Wet van Grote Aantallen

*Geschatte tijd: 15 minuten*

### Opdracht 8a

Demonstreer de Wet van Grote Aantallen: het steekproefgemiddelde convergeert naar de verwachtingswaarde als n → ∞.

Trek samples uit Exp(λ=2) (E[X] = 0.5) en plot het cumulatieve gemiddelde als functie van n.

In [None]:
# Jouw code hier


---

## Bonusoefening: Variance Reduction

*Geschatte tijd: 20 minuten*

### Bonus

In Monte Carlo simulatie willen we vaak de variantie van onze schattingen verlagen. Implementeer "antithetic variates" als variance reduction techniek.

Als U ~ Uniform(0,1), dan is 1-U ook Uniform(0,1). Door zowel f(U) als f(1-U) te middelen, kunnen we de variantie verlagen.

Vergelijk de variantie van het schatten van E[e^U] met en zonder antithetic variates.

In [None]:
# Jouw code hier


---

## Klaar!

Je hebt geoefend met verwachtingswaarde, variantie en hun toepassingen. Deze concepten zijn fundamenteel voor het begrijpen van machine learning.

---

**Mathematical Foundations** | Les 9 Labo | IT & Artificial Intelligence

---