# Les 10: Labo - Oefeningen

**Mathematical Foundations - IT & Artificial Intelligence**

---

In dit labo oefen je met Maximum Likelihood Estimation en Cross-Entropy Loss.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.set_printoptions(precision=4, suppress=True)
np.random.seed(42)

print("Libraries geladen!")

---

## Oefening 1: MLE voor Bernoulli

*Geschatte tijd: 15 minuten*

### Opdracht 1a

Je gooit een (mogelijk oneerlijke) munt 20 keer en krijgt 14 keer kop.

1. Schrijf de likelihood functie L(p)
2. Schrijf de log-likelihood functie
3. Vind de MLE van p analytisch (met de hand)
4. Verifieer numeriek door de log-likelihood te plotten

In [None]:
# Jouw code hier
n = 20  # aantal worpen
k = 14  # aantal keer kop

# Plot de log-likelihood


### Opdracht 1b

Implementeer een functie die de MLE van p vindt voor willekeurige Bernoulli data.

In [None]:
def bernoulli_mle(data):
    """
    Vind de MLE van p voor Bernoulli data.
    
    Parameters:
    - data: array van 0's en 1's
    
    Returns:
    - p_mle: MLE van de succeskans
    """
    # Jouw code hier
    pass

# Test


---

## Oefening 2: MLE voor Normale Verdeling

*Geschatte tijd: 20 minuten*

### Opdracht 2a

Implementeer functies die de MLE van μ en σ² vinden voor normaal verdeelde data.

In [None]:
def normal_mle(data):
    """
    Vind de MLE van μ en σ² voor normaal verdeelde data.
    
    Returns:
    - mu_mle, sigma2_mle
    """
    # Jouw code hier
    pass

# Test met gesimuleerde data


### Opdracht 2b

De MLE van σ² is biased (verwacht waarde ≠ echte waarde). Demonstreer dit met simulaties en vergelijk met de unbiased schatter (met N-1 in de noemer).

In [None]:
# Jouw code hier


---

## Oefening 3: Cross-Entropy Loss

*Geschatte tijd: 20 minuten*

### Opdracht 3a

Implementeer de cross-entropy loss voor multi-class classificatie.

In [None]:
def cross_entropy_loss(y_pred, y_true):
    """
    Bereken cross-entropy loss.
    
    Parameters:
    - y_pred: (n_samples, n_classes) - softmax outputs
    - y_true: (n_samples,) - class indices
    
    Returns:
    - loss: scalar
    """
    # Jouw code hier
    pass

# Test


### Opdracht 3b

Implementeer ook de gradiënt van cross-entropy loss naar de logits (vóór softmax).

Hint: Voor softmax + cross-entropy is de gradiënt elegant: ∂L/∂z = softmax(z) - y_onehot

In [None]:
def cross_entropy_gradient(y_pred, y_true):
    """
    Bereken gradiënt van CE loss naar logits.
    
    Parameters:
    - y_pred: (n_samples, n_classes) - softmax outputs
    - y_true: (n_samples,) - class indices
    
    Returns:
    - gradient: (n_samples, n_classes)
    """
    # Jouw code hier
    pass

# Test met numerieke gradiënt verificatie


---

## Oefening 4: Binary Cross-Entropy

*Geschatte tijd: 15 minuten*

### Opdracht 4a

Implementeer binary cross-entropy loss en zijn gradiënt.

In [None]:
def binary_cross_entropy(y_pred, y_true):
    """
    Binary cross-entropy loss.
    
    Parameters:
    - y_pred: (n_samples,) - predicted probabilities
    - y_true: (n_samples,) - true labels (0 or 1)
    """
    # Jouw code hier
    pass

def binary_cross_entropy_gradient(y_pred, y_true):
    """
    Gradiënt van BCE naar y_pred.
    """
    # Jouw code hier
    pass

# Test


---

## Oefening 5: MLE = Minimaliseren van Loss

*Geschatte tijd: 20 minuten*

### Opdracht 5a

Demonstreer dat het minimaliseren van MSE loss equivalent is aan MLE onder Gaussische aannames.

Genereer regressie data en vind de optimale parameters via:
1. Directe MSE minimalisatie
2. MLE (maximaliseer Gaussische log-likelihood)

Verifieer dat beide dezelfde parameters geven.

In [None]:
# Jouw code hier


---

## Oefening 6: Softmax Temperature

*Geschatte tijd: 15 minuten*

### Opdracht 6a

Implementeer softmax met temperature parameter en onderzoek het effect op:
1. De verdeling (entropy)
2. De gradiënten

In [None]:
def softmax_temperature(z, T=1.0):
    """
    Softmax met temperature.
    """
    # Jouw code hier
    pass

def entropy(probs):
    """
    Bereken de entropy van een verdeling.
    """
    # Jouw code hier
    pass

# Onderzoek effect van T


---

## Oefening 7: Logistische Regressie

*Geschatte tijd: 25 minuten*

### Opdracht 7a

Implementeer logistische regressie from scratch met gradient descent en cross-entropy loss.

In [None]:
class LogisticRegression:
    def __init__(self, n_features, n_classes):
        # Jouw code hier
        pass
    
    def softmax(self, z):
        pass
    
    def forward(self, X):
        pass
    
    def compute_loss(self, y_true):
        pass
    
    def backward(self, X, y_true):
        pass
    
    def update(self, lr):
        pass
    
    def fit(self, X, y, lr=0.1, n_epochs=100):
        pass
    
    def predict(self, X):
        pass
    
    def accuracy(self, X, y):
        pass

# Test op sklearn digits dataset


---

## Oefening 8: Vergelijk Loss Functions

*Geschatte tijd: 20 minuten*

### Opdracht 8a

Train een neuraal netwerk voor classificatie met zowel MSE als cross-entropy loss. Vergelijk:
1. Convergentiesnelheid
2. Finale accuracy
3. Gradiënt stabiliteit

In [None]:
# Jouw code hier


---

## Bonusoefening: Label Smoothing

*Geschatte tijd: 20 minuten*

### Bonus

Label smoothing is een regularisatie techniek waarbij we de harde labels (one-hot) vervangen door "zachte" labels:

y_smooth = (1 - ε) · y_onehot + ε / K

waarbij ε de smoothing factor is en K het aantal klassen.

Implementeer cross-entropy loss met label smoothing en vergelijk de training.

In [None]:
def cross_entropy_with_label_smoothing(y_pred, y_true, n_classes, epsilon=0.1):
    """
    Cross-entropy loss met label smoothing.
    """
    # Jouw code hier
    pass

# Test


---

## Klaar!

Je hebt nu de theoretische basis van loss functions begrepen. MLE verklaart waarom we cross-entropy gebruiken voor classificatie en MSE voor regressie.

---

**Mathematical Foundations** | Les 10 Labo | IT & Artificial Intelligence

---