# College 2: Discrete en Continue Kansvariabelen

## Overzicht
In dit college gaan we:
- Het verschil tussen **discrete** en **continue** kansvariabelen uitleggen.
- Begrippen als **kansfunctie** en **kansdichtheidsfunctie** introduceren.
- Bespreken hoe je kansen, verwachtingswaarde en variantie kunt berekenen voor discrete en continue kansverdelingen.

## Leerdoelen
Na dit college kun je:
1. Het verschil tussen een discrete en continue kansvariabele uitleggen.
2. De kansfunctie en kansdichtheidsfunctie interpreteren en gebruiken.
3. De verwachtingswaarde en variantie berekenen voor verschillende kansverdelingen.

## 1. Inleiding tot Kansvariabelen

Een **kansvariabele** is een variabele die waarden aanneemt op basis van de uitkomst van een kansexperiment. Kansvariabelen kunnen worden onderverdeeld in:
- **Discrete kansvariabelen**: nemen een eindig of aftelbaar aantal waarden aan.
- **Continue kansvariabelen**: nemen oneindig veel waarden aan binnen een bepaald interval.

In dit college zullen we deze concepten verder onderzoeken.

## 2. Discrete Kansvariabelen

### Voorbeeld en Definities

Discrete kansvariabelen kunnen slechts specifieke waarden aannemen (zoals 0, 1, 2, ...). Voor een discrete kansvariabele gebruiken we een **kansfunctie** om de waarschijnlijkheid van elke mogelijke waarde te beschrijven.

#### Kansfunctie
De **kansfunctie** van een discrete kansvariabele \( X \), genoteerd als \( P(X = x) \), geeft de kans dat \( X \) precies de waarde \( x \) aanneemt.

### Code Voorbeeld: Kansfunctie voor een Discrete Kansvariabele

Hieronder berekenen we de kansen voor een discrete kansvariabele die bijvoorbeeld het aantal keer "kop" geeft bij drie worpen van een eerlijke munt.

Om onderstaande codecel uit te voeren, klik met je muis ergens binnen het codeblock en druk daarna op "shift+enter"

In [76]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import binom
import ipywidgets as widgets

def plot_binomiale_verdeling(n, p):
    x = np.arange(0, n+1)  # Mogelijke waarden van k
    y = binom.pmf(x, n, p)  # Bereken de waarschijnlijkheid voor elke waarde van k
    
    plt.figure(figsize=(10, 6))
    plt.stem(x, y, linefmt='skyblue', markerfmt='bo', basefmt='black')    
    plt.title(f'Kansfunctie voor de binomiale verdeling (n={n}, p={p:.2f})')
    plt.xlabel(r'$k$')
    plt.ylabel(r'Kans $\mathbb{P}(K = k)$')
    
    plt.ylim(0, 1.1 * max(y))
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.show()

# Sliders voor n en p
n_slider = widgets.IntSlider(value=10, min=1, max=50, step=1, description='n')
p_slider = widgets.FloatSlider(value=0.5, min=0, max=1, step=0.01, description='p')

# Interactieve plot
widgets.interact(plot_binomiale_verdeling, n=n_slider, p=p_slider)

interactive(children=(IntSlider(value=10, description='n', max=50, min=1), FloatSlider(value=0.5, description=…

<function __main__.plot_binomiale_verdeling(n, p)>

### Uitleg code
In de bovenstaande code hebben we een interactieve plot gecreerd met sliders voor de parameters $n$ en $p$ voor de binomiale verdeling. Hiermee kun je door te schuiven met de sliders zien wat de effecten zijn van beide parameters op de kansverdeling. De situatie met $p = \frac{1}{2}$ kun je gebruiken om een kansverdeling te vinden voor $k=0,1,2,3$ keer "kop" als je $n$ keer een zuivere munt opgooit. 

## 3. Continue Kansvariabelen

### Voorbeeld en Definities

Continue kansvariabelen kunnen elke waarde aannemen binnen een bepaald interval (bijvoorbeeld elke reele waarde tussen 0 en 1).
Voor continue kansvariabelen gebruiken we een **kansdichtheidsfunctie** of in het Engels **probability density function (pdf)** in plaats van een kansfunctie.

#### Kansdichtheidsfunctie
Een **kansdichtheidsfunctie $f(x)$** geeft de relatieve waarschijnlijkheid van elke waarde binnen een continu bereik. 
Let op dat de kans voor een enkele specifieke waarde in een continue verdeling gelijk aan nul is; in plaats daarvan berekenen we kansen over intervallen.

### Code voorbeeld: kansdichtheidsfunctie voor een continue kansvariable
Hieronder plotten we de kansdichtheidsfunctie van een normale verdeling met gemiddelde $\mu = 0$ en standaardafwijking $\sigma=1$

In [75]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import norm
import ipywidgets as widgets
from ipywidgets import interact

# Functie om de normale verdeling te plotten
def plot_normale_verdeling(mu, sigma):
    x = np.linspace(mu - 4*sigma, mu + 4*sigma, 1000)  # x-waarden rond het gemiddelde
    y = norm.pdf(x, mu, sigma)  # Waarschijnlijkheidsdichtheid
    
    plt.figure(figsize=(10, 6))
    plt.plot(x, y, color='skyblue')
    plt.title(f'Kansdichtheid voor normale verdeling ($\mu={mu}$, $\sigma={sigma:.2f}$)')
    plt.xlabel(r'$x$')
    plt.ylabel(r'Kansdichtheid $f(x)$')
    plt.ylim(0, 0.5)
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    plt.show()

# Sliders voor mu en sigma
mu_slider = widgets.IntSlider(value=0, min=-10, max=10, step=1, description=r'$\mu$')
sigma_slider = widgets.FloatSlider(value=1, min=0.1, max=10, step=0.1, description=r'$\sigma$')

# Interactieve plot
interact(plot_normale_verdeling, mu=mu_slider, sigma=sigma_slider)

interactive(children=(IntSlider(value=0, description='$\\mu$', max=10, min=-10), FloatSlider(value=1.0, descri…

<function __main__.plot_normale_verdeling(mu, sigma)>

### Uitleg code
De code hierboven toont een interactieve plot van de kansdichtheidsfunctie voor een normale verdeling. Hier zien we dat de kansdichtheid rond het gemiddelde $\mu$ het hoogst is, wat duidt op een grotere kans om waarden dicht bij het gemiddelde te observeren. Zodra de standaardafwijking $\sigma$ stijgt, wordt de belkromme meer uitgespreid en platter.

## Kansen, verwachtingswaarde en variantie berekenen

### Verwachtingswaarde en Variantie van een Discrete Kansvariabele
De **verwachtingswaarde** $\mathbb{E}[\underline{k}]$ en de **variantie** $\textrm{Var}(\underline{k})$ van een discrete kansvariabele $\underline{k}$ kunnen als volgt worden berekend:

\begin{align}
\mathbb{E}[\underline{k}]&=\sum\limits_k k \cdot P(\underline{k}=k)\\
\textrm{Var}(\underline{k})&= \sum\limits_k \left(k - E[\underline{k}]\right)^2 \cdot P(\underline{k}=k)
\end{align}

#### Code Voorbeeld
Hier berekenen we de verwachtingswaarde en variantie van onze eerdere binomiale verdeling.

In [87]:
# Verwachtingswaarde en variantie berekenen
n = 50
p = 0.5
k_binomiaal = np.arange(0, n+1)  # Mogelijke waarden van k
kansen_binomiaal = binom.pmf(k_binomiaal, n, p)  # Bereken de waarschijnlijkheid voor elke waarde van k

verwachtingswaarde = np.sum(k_binomiaal * kansen_binomiaal)
variantie = np.sum((x_binomiaal - verwachtingswaarde)**2 * kansen_binomiaal)

print(f"Verwachtingswaarde E[X]: {verwachtingswaarde}")
print(f"Variantie Var(X): {variantie}")

Verwachtingswaarde E[X]: 24.999999999999986
Variantie Var(X): 12.499999999999996


Merk op dat met de `scipy.stats`-bibliotheek deze berekening kan worden opgelost met behulp van de functies `binom.mean` en `binom.var`

In [88]:
verwachtingswaarde = binom.mean(n=n, p=p)
variantie = binom.var(n=n, p=p)

print(f"Verwachtingswaarde E[X]: {verwachtingswaarde}")
print(f"Variantie Var(X): {variantie}")

Verwachtingswaarde E[X]: 25.0
Variantie Var(X): 12.5


### Verwachtingswaarde en Variantie van een Continue Kansvariabele
Voor continue kansvariabelen $\underline{x}$ wordt de verwachtingswaarde $\mathbb{E}[\underline{x}]$ en de variantie $\textrm{Var}(\underline{x})$ berekend door te integreren over de kansdichtheidsfunctie:
\begin{align}
\mathbb{E}[\underline{x}]&=\int x \cdot f(x) dx \\
\textrm{Var}(\underline{x})&= \int (x - E[\underline{x}])^2 f(x) dx
\end{align}
De `scipy`-bibliotheek biedt methodes om deze integralen numeriek te benaderen, bijvoorbeeld met behulp van de functie `quad` uit de `scipy.integrate` module.
Hier berekenen we de verwachtingswaarde en variantie van onze eerdere normale verdeling.

#### Code Voorbeeld
Hier berekenen we de verwachtingswaarde en variantie van een continue kansvariabele $\underline{x}$ waarvoor de kansdichtheidsfunctie $f(x)$ is gedefinieerd als:
$$
f(x) = \begin{cases}
10\cdot e^{-10\cdot x} & \text{als } x > 0 \\
0 & \text{anders.}
\end{cases}
$$

In [93]:
from scipy.integrate import quad
import math

# Verwachtingswaarde en variantie berekenen
mu = 0
sigma = 1

# Kansdichtheidsfunctie zoals hierboven gedefinieerd
pdf = lambda x: 10*math.exp(-10*x) if x > 0 else 0

# Verwachtingswaarde: E(X)
expected_value, _ = quad(lambda x: x * pdf(x), -np.inf, np.inf)

# Variantie: Var(X)
variance, _ = quad(lambda x: (x - expected_value)**2 * pdf(x), -np.inf, np.inf)

print(f"Verwachtingswaarde (E(X)): {expected_value}")
print(f"Variantie (Var(X)): {variance}")

Verwachtingswaarde (E(X)): 0.09999999999999999
Variantie (Var(X)): 0.010000000000000004


## 5. Oefening (optioneel)

### Oefening
1. Pas de parameters $n$ en $p$ in de binomiale verdeling aan en observeer hoe de kansfunctie verandert.
2. Plot de kansdichtheidsfunctie van een normale verdeling met verschillende waarden voor $\mu$ en $\sigma$

## 6. Samenvatting
- Discrete kansvariabelen nemen specifieke waarden aan, met een kansfunctie om de kansen te beschrijven.
- Continue kansvariabelen nemen oneindig veel waarden binnen een interval, beschreven door een kansdichtheidsfunctie.
- De verwachtingswaarde en variantie zijn belangrijke eigenschappen van zowel discrete als continue kansvariabelen en kunnen worden berekend met respectievelijk sommen of integralen.