## Theoretische Häufigkeitsverteilungen

<!-- ## Der Forschungsprozess {.hcenter-slide}

```yaml { .animate src="images/scientific_process.svg"}
setup:
    - element: "#inference"
      modifier: function() { this.node.style.fill = 'green'; }
    - element: "#inferencebg"
      modifier: function() { this.node.style.fill = '#d8ffe2';}
``` -->


:::: {.columns}
::: {.column width="70%"}
In der letzten Vorlesung haben wir erarbeitet, dass sich die Stichprobenverteilung durch eine Normalverteilung der Form

$$
f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}
$$

beschreiben lässt (wobei die Variable $x$ im Fall der Stichprobenverteilung der Stichprobenkennwert $\hat{\theta}$ ist).

:::
::: {.column width="30%"}
![](images/noselength_probability_density_f_x.png){style="margin-top:-60px !important"}
:::
::::

- Eine theoretische Häufigkeitsverteilung wie die Normalverteilung gibt für *jeden beliebigen Wert* $x$ des Merkmals $X$ eine Häufigkeit $f(x)$ an.
- Eine wichtige Frage haben wir bislang jedoch nicht beantwortet: was für eine Art von Häufigkeit ist $f(x)$ an? Wie ist also die y-Achse im Diagramm rechts oben zu interpretieren?



## Rückblick: das Histogramm

:::: {.columns}
::: {.column width="70%"}


:::{.nonincremental}
- Um die Bedeutung von $f(x)$ zu verstehen, gehen wir zunächst zurück zum **Histogramm**.
- Histogramme stellen die Häufigkeit der Merkmalsvariable $X$ in einer Stichprobe oder Population dar. Wird die **relative Häufigkeit** aufgetragen, so ordnet das Histogramm jedem Intervall auf der x-Achse eine relative Häufigkeit dar, die z.B. in Prozent angegeben werden kann.
:::
:::
::: {.column width="30%"}
![](images/noselength_normal_relative.png)
:::
::::

- Die Breite des Intervalls &ndash; die [**Kategorienbreite *d***]{color="navy"} &ndash; ist dabei ein Kompromiss zweier Faktoren:
    1. **Auflösung:** je schmaler das Intervall, desto feiner wird das Merkmal X unterteilt.
    2. **Fallzahl:** je breiter das Intervall, desto höher die Zahl der Fälle im Intervall, desto präziser die Schätzung des Häufigkeitswertes im Intervall.
- Die Gesamtsumme aller Säulen im Histogramm mit relativer Häufigkeit ist immer 1 (oder 100%).


In [None]:
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import norm

np.random.seed(0)

fontsize = 14

mu = 5
std = 1.5
fig = plt.figure(figsize=(10, 2.3))

w = 0.01
xf = np.arange(w/2, 10, w)
yf = norm.pdf(xf, mu, std)
yf /= np.sum(yf)

for i, w in enumerate([2, 1, 0.5, 0.2]): 
    x = np.arange(w/2, 10, w)
    y = norm.pdf(x, mu, std)
    y /= np.sum(y)
    plt.subplot(1, 4, i+1)
    plt.bar(x, y, width=w, ec='w', fc='#783c00')
    plt.plot(xf, yf, 'k-')
    # plt.plot(x, y, 'ko', markersize=4)
    if i == 0:
        plt.ylabel('Relative Häufigkeit', fontsize=fontsize)
    plt.xticks(np.arange(0,10.1,2), fontsize=fontsize-2)
    plt.yticks(fontsize=fontsize-2)
    plt.title(f'Kategorienbreite $d={w}cm$', fontsize=fontsize-2)

fig.text(0.5, -0.03, 'Nasenlänge (cm)', fontsize=fontsize, ha='center')

plt.tight_layout()
plt.savefig('images/probability_density_demo2.png', bbox_inches='tight')

## Rückblick: das Histogramm

:::{.nonincremental}
- Wir nehmen nun an, dass wir das Histogramm auf Basis einer unendlich großen Population bilden, in der die Verteilung von Nasenlängen durch eine Normalverteilung ($\mu=5cm, \sigma=X$) beschrieben wird.

Egal, wie fein wir die Kategorienbreite wählen, gibt es also genug Datenpunkte für eine präzise Schätzung der relativen Häufigkeit.
- Es gilt: je kleiner die Kategorienbreite, desto mehr Säulen gibt es, desto kleiner die relativen Häufigkeitswerte jeder einzelnen Säule.
:::

![](images/probability_density_demo.png){style="margin-bottom:-3px"}

- Beispiel: 
    - Im ersten Plot gilt $d=2cm$. Die relative Häufigkeit, dass ein Merkmal etwa im Intervall $[6cm; 8cm]$ liegt ist ca. $0.22$ (oder 22%).
    - Im zweiten Plot gilt $d=1cm$. Nun wird etwa das Intervall $[6cm; 8cm]$ aufgeteilt in zwei relative Häufigkeiten für die Bereiche $[6cm; 7cm]$ und $[7cm; 8cm]$, die jeweils beide geringer sind (ca. $0.16$ und $0.06$).


## Rückblick: das Histogramm


- Nun scheint ein Brückenschlag naheliegend: ist die theoretische Häufigkeitsverteilung $f(x)$, die Funktionswerte für beliebige $x$-Werte ausgibt, gleich einem Histogramm, bei dem die Kategorienbreite gegen Null geht?

![](images/probability_density_demo.png){style="margin-bottom:-3px"}

- Im Prinzip ja, allerdings gibt es noch ein Problem: geht die Kategorienbreite $d$ gegen $0$, gehen die relativen Häufigkeitswerte des Histogramms ebenfalls gegen Null!
- Würde die theoretische Häufigkeitsverteilung $f(x)$ also relative Häufigkeiten angeben, so wäre $f(x)$ für jedes $x$ Null. Das ist natürlich sinnlos.
- **Theoretische Häufigkeitsverteilungen $f(x)$ geben aus diesem Grund keine relative Häufigkeit an**.
- Bleibt die Frage: was stattdessen?

<!-- - Beispiel: die Wahrscheinlichkeit ist **Null**, dass Nasen eine bestimmte, bis auf die "unendlichste" Nachkommastelle angegebene, Länge haben (z.B. $4{,}318264812357218735....cm$). -->



<!----------------->
<!--- New slide --->
<!----------------->
## Von der Wahrscheinlichkeit zur Wahrscheinlichkeitsdichte


Zunächst ein Hinweis zur Nomenklatur: 

::: {.definition}
<!---  Definition--->
|||
|:-:|-|
|||
| ![](images/definition.svg){height=70px} | Wir verwenden den Begriff **relative Häufigkeiten** bei empirischen Daten und meinen damit den Anteil einer Merkmalsausprägung relativ zu allen Datenpunkten. Beispiel: in einer Stichprobe von 100 Würfelversuchen lag die relative Häufigkeit von Zahlen größer 3 bei $0.48$ oder $48 \%$. | 
|||
: {tbl-colwidths="[10, 90]"}
:::

::: {.definition}
<!---  Definition--->
|||
|:-:|-|
|||
| ![](images/definition.svg){height=70px} | Wir verwenden den Begriff **Wahrscheinlichkeit**, wenn die theoretische Häufigkeitsverteilung eines Merkmals bekannt ist, und meinen damit den Anteil einer Merkmalsausprägung laut Theorie. Beispiel: bei einem perfekten Würfel ist die Wahrscheinlichkeit einer Zahl größer 3 exakt $0.5$. | 
|||
: {tbl-colwidths="[10, 90]"}
:::

- Im Kontext von theoretischen Häufigkeitsverteilungen können wir daher von **Wahrscheinlichkeiten** sprechen.
- Klar ist auch: durch die Nomenklaturänderung *relative Häufigkeit* &rarr; *Wahrscheinlichkeit* ist noch nichts gewonnen.

## Von der Wahrscheinlichkeit zur Wahrscheinlichkeitsdichte

<div class="vspace-large"></div>

Der entscheidende Trick theoretischer Häufigkeitsverteilungen ist der **Übergang von Wahrscheinlichkeiten zu Wahrscheinlichkeitsdichten**. 

::: {.colorbox .fragment}
Ist das Merkmal $X$ eine kontinuierliche Variable (z.B. Nasenlänge in $cm$), so geben theoretische Häufigkeitsverteilungen $f(x)$ eine [**Wahrscheinlichkeitsdichte**]{color="navy"} an.
:::

<div class="vspace-large"></div>

Wie kann man sich "Wahrscheinlichkeitsdichte" vorstellen?
    
- Wir kennen das Konzept der "Dichte" bei Stoffen: z.B. ist die Dichte von Eis ist ca. $1\stackrel{g}{}\!\!\unicode{x2215}_{\!\unicode{x202f}cm^3}$, d.h. dass sich eine Masse von $1g$ in einem Kubikzentimeter ($1cm^3$) befindet.
- Eine Dichte ist also immer eine bestimmte Masse *pro* Maßeinheit.

## Von der Wahrscheinlichkeit zur Wahrscheinlichkeitsdichte

<div class="vspace-large"></div>

Wir können daher Wahrscheinlichkeitsdichte wie folgt definieren:

::: {.definition .fragment}
<!---  Definition--->
|||
|:-:|-|
|||
| ![](images/definition.svg){height=70px} | $\text{Wahrscheinlichkeitsdichte} = \text{Wahrscheinlichkeits(masse) }pro\text{ Maßeinheit}$ | 
|||
: {tbl-colwidths="[10, 90]"}
:::

<div class="vspace-large"></div>

- In Abgrenzung zur Wahrscheinlichkeits*dichte* wird die Wahrscheinlichkeit selbst tatsächlich auch als Wahrscheinlichkeits*masse* bezeichnet (engl. *probability mass*).
    - Jedoch ist Wahrscheinlichkeit bzw. Wahrscheinlichkeitsmasse im Gegensatz zur physikalischen Masse einheitslos.
- Die Einheit der Wahrscheinlichkeitsdichte wiederum ist Wahrscheinlichkeit pro Maßeinheit: Wahrscheinlichkeit *pro* Zentimeter Nasenlänge, Wahrscheinlichkeit *pro* IQ-Punkt, Wahrscheinlichkeit *pro* Fragebogenpunkt.




<!----------------->
<!--- New slide --->
<!----------------->
## Wahrscheinlichkeitsdichte

- Theoretische Häufigkeitsverteilungen $f(x)$ für kontinulierliche Merkmale $X$ werden auch als [**Wahrscheinlichkeitsdichtefunktion**]{color="navy"} bezeichnet (engl. *probability density function*).
- Wie bei Histogrammen mit relativen Häufigkeiten ist die *gesamte Wahrscheinlichkeitsmasse* von Wahrscheinlichkeitsdichtefunktionen $f(x)$ immer 1. 
- Anders gesagt: Wahrscheinlichkeitsdichtefunktion $f(x)$ sind immer so normalisiert, dass ihr Flächeninhalt den Wert 1 hat.

Beispiel Normalverteilung:
$$
f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}
$$


<div class="vspace-medium"></div>

:::: {.columns}
::: {.column width="65%"}
Der Normalisierungsfaktor $\frac{1}{\sigma\sqrt{2\pi}}$ sorgt in diesem Fall dafür, dass die Fläche unter der Normalverteilung gleich 1 ist:
$$
\int_{-\infty}^{\infty} f(x) dx = 1
$$
:::
::: {.column width="35%"}
:::{.fragment}
![](images/integral_of_pdf_is_1.png){height=222px style="margin-top:-40px !important"}
:::
:::
::::

<!-- ```{python}

``` -->
<!-- ```{python}
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import norm

np.random.seed(0)

fontsize = 12

mu = 5
std = 1.5
x = np.linspace(0, 10, 100)
y = norm.pdf(x, mu, std)

plt.figure(figsize=(4, 2.5))
plt.plot(x, y, color='#783c00', lw=2)
plt.fill_between(x,y, where= (2 < x)&(x < 4), color="b", alpha=0.2)
plt.annotate('Wahrscheinlichkeit,\n dass sich das\n Merkmal im Bereich\n [2cm;4cm] befindet', xy=(3, 0.05), xytext=(7.5,0.12), arrowprops=dict(arrowstyle='->'))
plt.xlabel('Nasenlänge (cm)', fontsize=fontsize)
plt.ylabel('Wahrscheinlichkeitsdichte', fontsize=fontsize)
plt.xticks(bins[::2], fontsize=fontsize-2)
plt.yticks(fontsize=fontsize-2)
plt.ylim(0, 0.28)
plt.xlim(-0.5, 15)
plt.savefig('images/density_integral.png', bbox_inches='tight')
``` -->


<!----------------->
<!--- New slide --->
<!----------------->
## [Von der Wahrscheinlichkeitsdichte zurück zur Wahrscheinlichkeit]{style="font-size: 41px"}


<!-- Analogie Dichte von Eis: bei eine Dichte von Eis $0{,}918\frac{g}{cm^3}$ können wir ausrechnen, dass sich in einem 10x10x10cm Eiswürfel $918g$ Eis befinden: $Gewicht = Volumen \cdot Dichte = 1000cm^3 \cdot 0{,}918\frac{g}{cm^3}=918g$ -->

<div class="vspace-small"></div>

:::: {.columns .fragment}
::: {.column width="62%"}
:::{.nonincremental}
- Um aus einer Wahrscheinlichkeits*dichte* eine Wahrscheinlichkeit zu erhalten, muss die Dichte über einen bestimmten **Wertebereich $[x_0; x_1]$** des Merkmals summiert (integriert) werden.
- Mathematisch beschreiben wir diese Operation als ein Integral:
:::

$$
P(x_0<x<x_1) = \int_{x_0}^{x_1} f(x) dx
$$

- $P$ ist die Wahrscheinlichkeit, dass das Merkmal einen Wert zwischen $x_0$ (Untergrenze) und $x_1$ (Obergrenze) aufweist.
- Das Integral setzt die *Wahrscheinlichkeitsdichte* $f(x)$ mit der *Wahrscheinlichkeit* $P(x_0<x<x_1)$ in Verbindung.
:::
::: {.column width="38%"}
<div class="vspace-large"></div>
![Berechnung einer Wahrscheinlichkeit $P$ auf Basis einer Wahrscheinlichkeitsdichtefunktion $f(x)$ (hier der Normalverteilung).](images/density_integral.png)
:::
::::    

<!----------------->
<!--- New slide --->
<!----------------->
## Wahrscheinlichkeitsdichte: Beispiel 1

:::: {.columns}
::: {.column width="63%"}

Nehmen wir an, dass Nasenlängen in der Population *normalverteilt* sind, mit Mittelwert $\mu=5$ und Standardabweichung $\sigma=1{,}5$. 

**Frage:** wie hoch ist die Wahrscheinlichkeit, dass eine zufällig gezogene Nase aus der Population eine Länge zwischen $2cm$ und $4cm$ hat?
:::
::: {.column width="37%"}
![](images/density_integral.png)
:::
::::



:::{.fragment}
$$
P(2\le x\le 4) = \int_2^4 f(x)dx = \frac{1}{\sigma\sqrt{2\pi}}\int_2^4\text{exp}\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)dx = \\
= \frac{1}{1{,}5\sqrt{2\pi}}\int_2^4\text{exp}\left(-\frac{(x-5)^2}{2\cdot1{,}5^2}\right)dx \overset{(Computer!)}{\approx} 0{,}23
$$
:::

<!----------------->
<!--- New slide --->
<!----------------->
<!-- ## Theoretische Wahrscheinlichkeitsverteilung
- Je nach Forschungsfrage kann das Ziel einer Stichprobe sein
    1. Rückschlüsse auf die Population zu ziehen (wie gerade gesehen), oder
    2. Rückschlüsse auf die [**theoretische Wahrscheinlichkeitsverteilung**]{color="navy"} zu ziehen.
- Die theoretische Wahrscheinlichkeitsverteilung ist von Interesse, wenn wir die Ursachen oder Mechanismen eines psychologischen Phänomens beschreiben und verstehen wollen.
    - In diesem Fall ist die spezifische Population nicht das primäre Interesse &mdash; selbst die Population ist im Prinzip nur eine (großen) Stichprobe aus der Wahrscheinlichkeitsverteilung.
    - Stattdessen wollen wir mechanistisch und quantitativ verstehen, wie naturwissenschaftliche Prozesse (biologisch, psychisch, sozial) bestimmte psychologische Phänomene "generieren".
- In der Psychologie ist das primäre Interesse häufig der Mechanismus und damit die theoretische Wahrscheinlichkeitsverteilung eines Merkmals; in der Politologie, Soziologie, Ökonomie ist dagegen häufig die Verteilung in der Population relevant (z.B. "Sonntagsfrage").
- Auch wenn diese Unterscheidung konzeptionell wichtig ist, ist sie in der Praxis häufig nicht relevant, da Populationen i.d.R. so groß sind, dass sie nahezu perfekt mit der theoretischen Wahrscheinlichkeitsverteilung übereinstimmen. -->



<!-- ```{python}

``` -->
<!-- ```{python}
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import norm

np.random.seed(0)

fontsize = 12

mu = 5
std = 1.5
x = np.linspace(0, 10, 100)
y = 0.1*np.ones(100)

plt.figure(figsize=(4, 2.5))
plt.plot(x, y, color='#783c00', lw=2)
plt.plot([0, 0], [0, 0.1], color='#783c00', lw=2)
plt.plot([10, 10], [0, 0.1], color='#783c00', lw=2)
plt.fill_between(x,y, where= (2 < x)&(x < 4), color="b", alpha=0.2)
plt.annotate('Wahrscheinlichkeit,\n dass sich das\n Merkmal im Bereich\n [2cm;4cm] befindet', xy=(3, 0.05), xytext=(7.5,0.16), arrowprops=dict(arrowstyle='->'))
plt.xlabel('Nasenlänge (cm)', fontsize=fontsize)
plt.ylabel('Wahrscheinlichkeitsdichte', fontsize=fontsize)
plt.xticks(range(0, 11,), fontsize=fontsize-2)
plt.yticks(fontsize=fontsize-2)
plt.ylim(0, 0.28)
plt.xlim(0, 15)
plt.savefig('images/density_integral_uniform.png', bbox_inches='tight')
``` -->

<!----------------->
<!--- New slide --->
<!----------------->
## Wahrscheinlichkeitsdichte: Beispiel 2


:::: {.columns}
::: {.column width="63%"}

Nehmen wir nun an, dass Nasenlängen in der Population *uniform zwischen 0 und 10 cm verteilt* sind.

**Gleiche Frage:** wie hoch ist die Wahrscheinlichkeit, dass eine zufällig gezogene Nase aus der Population eine Länge zwischen $2cm$ und $4cm$ hat?
:::
::: {.column width="37%"}
![](images/density_integral_uniform.png)
:::
::::

Wir wissen: die Fläche unter der Verteilung muss 1 sein. Daher muss die Wahrscheinlichkeitsdichte für jeden Wert zwischen $0cm$ und $10cm$ gleich $0.1cm^{-1}$ betragen ($10cm\cdot 0.1cm^{-1} = 1$).

Die Berechnung des Flächeninhalts im Intervall $[2cm; 4cm]$ geht in diesem Fall ohne Integration, denn er entspricht der Fläche eines Rechteckes mit Breite $2cm$ und Höhe $0.1cm^{-1}$. Es gilt:

$$
\begin{aligned}
Wahrscheinlichkeit&=Intervallbreite \cdot Wahrscheinlichkeitsdichte =\\
&= 2cm \cdot 0.1cm^{-1} = 0.2
\end{aligned}
$$




<!----------------->
<!--- New slide --->
<!----------------->
## Verteilungsfunktion

:::: {.columns}
::: {.column width="63%"}
Die Integration einer Wahrscheinlichkeitsdichte *bis zu einem bestimmten Wert $x$* ist ein sehr häufiger Fall im Umgang mit Wahrscheinlichkeitsdichten. Daher definieren wir dafür eine eigene Funktion, die [**Verteilungsfunktion**]{color="navy"} $F(x)$:

$$
F(x) = \int_{-\infty}^{x} f(x') dx'
$$
:::
::: {.column width="37%"}
![](images/verteilungsfunktion_x.png)
:::
::::



Die Verteilungsfunktion $F$ gibt uns den Flächeninhalt der Dichtefunktion $f$ "links von $x$" an.

<div class="vspace-medium"></div>

<!---  Example --->
::: {.example .fragment}
:::: {.columns}
::: {.column width="10%"}
::: {style="margin-top: 10px"}
![](images/example.png){height=70px}
:::
:::
::: {.column width="60%"}
Nehmen wir wieder die normalverteilte Nasenlängen-Population an mit Mittelwert $\mu=5$ und Standardabweichung $\sigma=1{,}5$.
Die Wahrscheinlichkeit, dass eine zufällig gezogene Nase eine Länge kleiner $4cm$ hat, ist gegeben durch den Wert $F(4)$ der Verteilungsfunktion dieser Normalverteilung:

$$
F(4) = \int_{-\infty}^{4} f(x') dx' = \\
=\frac{1}{1{,}5\sqrt{2\pi}}\int_{-\infty}^4\text{exp}\left(-\frac{(x'-5)^2}{2\cdot1{,}5^2}\right)dx' \overset{(Computer!)}{\approx} 0{,}25
$$

:::
::: {.column width="30%"}
![](images/verteilungsfunktion.png)
:::
::::
:::



<!----------------->
<!--- New slide --->
<!----------------->
## Verteilungsfunktion

:::: {.columns}
::: {.column width="63%"}
Mithilfe der Verteilungsfunktion, lässt sich nun das Integral

$$
P(x_0<x<x_1) = \int_{x_0}^{x_1} f(x) dx
$$

mit dem wir die Fläche zwischen einer Untergrenz $x_0$ und Obergrenze $x_1$ berechnen, auch folgendermaßen aufstellen:
<div class="vspace-small"></div>

$$
P(x_0<x<x_1) = F(x_1) - F(x_0)
$$
:::
::: {.column width="37%"}
![](images/verteilungsfunktion_general.png)
:::
::::

<div class="vspace-xlarge"></div>

<!---  Example --->
::: {.example .fragment}
:::: {.columns}
::: {.column width="10%"}
::: {style="margin-top: 10px"}
![](images/example.png){height=70px}
:::
:::
::: {.column width="55%"}
Die eingezeichnete Fläche aus unserem vorherigen Beispiel lässt sich berechnen als:

$$
P(2<x<4) = F(4) - F(2) \overset{(Computer!)}{\approx} 0{,}23
$$
:::

::: {.column width="35%"}
![](images/density_integral.png)
:::
::::
:::




<!----------------->
<!--- New slide --->
<!----------------->
## Verteilungsfunktion und Stammfunktion

![](images/verteilungsfunktion_f_F.png)

- $F(x)$ ist eine Stammfunktion von $f(x)$ wenn gilt: $\frac{dF}{dx}=f(x)$ bzw. $F(x) = \int_a^x f(x')dx'$.
- Die Verteilungsfunktion $F(x)$ entspricht der Stammfunktion $\int_a^x f(x')dx'$ mit $a=-\infty$.


<!----------------->
<!--- New slide --->
<!----------------->
## 68-95-99.7-Prozentregel

Mithilfe der Verteilungsfunktion lassen sich charakteristische Flächeninhalte der Normalverteilung berechnen. Als Faustregel ergibt sich die **68-95-99.7-Prozentregel**:


:::{.nonincremental}
- Der Bereich Mittelwert $\pm$ eine Standardabweichung ($\mu\pm1\sigma$) umfasst **68%** der Daten
- Der Bereich Mittelwert $\pm$ zwei Standardabweichungen ($\mu\pm2\sigma$) umfasst **95%** der Daten
- Der Bereich Mittelwert $\pm$ drei Standardabweichungen ($\mu\pm3\sigma$) umfasst **99.7%** der Daten
:::

![](images/normal_68_95_99.png)


<!----------------->
<!--- New slide --->
<!----------------->
## Vorschau

<div class="vspace-small"></div>


Im nächsten Schritt kehren wir zurück zur **theoretischen Stichprobenverteilung**. Die Erkenntnisse zur Wahrscheinlichkeitsdichte und Verteilungsfunktion lassen sich auf die theoretische Stichprobenverteilung übertragen und eröffnen so zwei wesentliche Methoden der Inferenzstatistik:

:::{.nonincremental}
- **Hypothesentestung** bzw. **Signifikanztestung** (u.a. auch Idee des p-Wertes)
- **Konfidenzintervalle** (Verallgemeinerung des Standardfehlers)
:::

<div class="vspace-medium"></div>

![](images/stichprobenverteilung.png){height=370px}
