# Stichprobenverteilung


<!----------------->
<!--- New slide --->
<!----------------->
## Verteilung

- **Verteilungen** kennen wir bereits aus der Vorlesung 04 zu Lage- und Streuungsmaßen.
- Wir unterscheiden zwischen **empirischen Verteilungen**, die etwa in der Form von Histogrammen dargestellt werden...

:::{style="margin-top: -15px"}
![](images/histogram_example.png){height=230px}
:::

- ... und **theoretischen Verteilungen**, die durch eine mathematische Funktion $f(x)$ definiert sind und für jede Merkmalsausprägung $x$ die Häufigkeit $f(x)$ angeben:

:::: {.columns}

::: {.column width="20%"}
:::
::: {.column width="30%"}
![](images/normal_sigma_notext.png){height=190px}
:::
::: {.column width="30%"}

**Normalverteilung:**
$$
f(x) = \frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}
$$
:::
::: {.column width="20%"}
:::
::::



<!----------------->
<!--- New slide --->
<!----------------->
## Stichprobenverteilung

<div class="vspace-xlarge"></div>


Empirische und theoretische Verteilungen gibt es **nicht nur für Merkmale $X$, sondern auch für statistische Kennwerte**, die für das Merkmal $X$ bestimmt wurden &mdash; zum Beispiel Mittelwert $\bar{x}$.

<div class="vspace-large"></div>


Prinzip: wir nehmen nicht nur eine einzelne Studie an, sondern viele Studien $i=1...k$, die jeweils Mittelwerte $\bar{x}_i$ bestimmt haben. Die Mittelwerte $\bar{x}_i$ folgen ebenfalls einer Verteilung &mdash; der [**Stichprobenverteilung**]{color="navy"}. Dieses Prinzip gilt nicht nur für den Mittelwert, sondern für alle statistischen Kennwerte (Median, Varianz, Kovarianz, Korrelation, usw.).

<!----------------->
<!--- New slide --->
<!----------------->
## Stichprobenverteilung

:::: {.columns}
::: {.column width="69%"}

:::{.fragment}
[**Empirische Stichprobenverteilung**]{color="navy"}
:::

- Führe ich dieselbe Studie mehrmals durch und notiere jeweils den statistischen Kennwert (z.B. Mittelwert), erhalte ich eine empirische Stichprobenverteilung.
- Dies ist die Idee der **Metaanalyse**, die eine Vielzahl empirischer Studien zusammenfasst und analysiert (&rArr; Vorlesung 13).

<!-- **Zur Erinnerung:**

- Bei der **Metaanalyse** ging es um die Verlässlichkeit der Schätzung von Parametern in Bezug auf die Population
- Das gemittelte, gewichtete Ergebnis vieler Studien liefert eine bessere Schätzung, als die Ergebnisse einzelner Studien.
- Die Metaanalyse basiert auf der **empirischen Stichprobenverteilung**. -->

:::{.fragment}
[**Theoretische Stichprobenverteilung**]{color="navy"}
:::

- Ich habe nur *eine* Studie, aber überlege, was theoretisch passieren würde, wenn ich diese Studie immer wieder wiederholen würde.
- Die resultierende Verteilung ist die theoretische Stichprobenverteilung.
- Die theoretische Stichprobenverteilung erlaubt uns eine Einschätzung darüber, wie stabil unser Ergebnis bei einer (hypothetischen) Wiederholung der Studie sein würde.
- Dies ist der Ansatz der **Inferenzstatistik**.

:::
::: {.column width="31%"}

:::{.fragment}
![Die empirische Stichprobenverteilung besteht aus tatsächlich erhobenen Studien. Die Verteilung empirischer Stichprobenkenn-<br>werte folgt im Idealfall (u.a. kein Publikationsbias, großes $n$ pro Stichprobe) einer Normalverteilung.](images/stichprobenverteilung_empirisch.png){style="margin-top:-35px"}
:::
:::{.fragment}

![Die theoretische Stichprobenverteilung ist durch eine Funktion gegeben. Ist die Stichprobengröße $n$, für die die theoretische Stichprobenverteilung angenommen wird, groß, folgt die Stichprobenverteilung einer Normalverteilung.](images/stichprobenverteilung_theoretisch.png)
:::

:::
::::




<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung: Beispiel

<div class="vspace-medium"></div>

:::{.fragment}
**Gedankenexperiment:** Wir nehmen an, die Population besteht nur aus 9 Männern und wir kennen von allen Männern die Nasenlänge:
:::

<div class="vspace-small"></div>

:::{.fragment}
![](images/inference1_annot.png)
:::

<div class="vspace-small"></div>

:::{.fragment}
In diesem Gedankenexperiment kennen wir also den wahren Mittelwert der Population. Er beträgt $\mu = 6cm$.
:::

<div class="vspace-small"></div>

:::{.fragment}
Nun betrachten wir eine Studie, in der 3 Männer untersucht werden. Wir ziehen also eine zufällige **Stichprobe $n=3$** aus der Population.
:::


<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung: Beispiel

<div class="vspace-medium"></div>

![](images/inference2_annot.png)

In [None]:
from itertools import combinations
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import norm

fontsize=15

ls = [7, 5, 9, 3, 5, 4, 6, 8, 7]

means = [np.mean(l) for l in list(combinations(ls, 3))]
print(min(means), max(means))
bins = [4, 5, 6, 7, 8, 9]

plt.figure(figsize=(4, 3))
plt.hist(means, width=1, bins=bins, facecolor='#783c00', ec='w')
for i in range(0, 32):
    plt.plot([4, 9], [i, i], 'w')

mean = np.mean(means)
se = np.std(ls, ddof=1) / np.sqrt(3)
x = np.linspace(mean - 3*se, mean + 3*se, 1000)
plt.plot(x, 84*norm.pdf(x, mean, se), 'k-', lw=2)

plt.xlabel('Nasenlänge (cm)', fontsize=fontsize)
plt.ylabel('Absolute Häufigkeit', fontsize=fontsize)
plt.xticks(fontsize=fontsize-2)
plt.yticks(fontsize=fontsize-2)
plt.savefig('images/noselength_example.png', bbox_inches='tight')

<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung: Beispiel

<div class="vspace-medium"></div>

![](images/inference3_annot.png)

... und so weiter

<div class="vspace-small"></div>

:::{.fragment}
Es gibt insgesamt 84 Möglichkeiten aus dieser Population von 9 Männern zufällig drei Männer auszuwählen.
:::

:::: {.columns .fragment}
::: {.column width="70%"}
&rarr;&nbsp;Jeder Mittelwert wäre eine Schätzung für den wahren Populationswert.

&rarr;&nbsp;Die Abbildung rechts zeigt die Verteilung aller möglichen 84 Mittelwerte.
:::
::: {.column width="30%"}
![](images/noselength_example.png)
:::
::::



<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung: Beispiel

<div class="vspace-medium"></div>

**Was lernen wir aus dieser Verteilung?**

:::{.nonincremental}
- Obwohl es nur einen *wahren Mittelwer*t gibt, weichen die *einzelnen Studienergebnisse* mehr oder weniger davon ab.
- Die Studienergebnisse haben also eine *Bandbreite*, in der offensichtlich eine Aussage über die Genauigkeit der Schätzung (von einer einzelnen Stichprobe auf die Population) steckt.
- Die Stichprobenergebnisse *schwanken zufällig* um den wahren Wert (siehe auch Metaanalyse).
:::

![](images/noselength_example.png){height=300px}


<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung

<div class="vspace-medium"></div>

**Übertragen wir nun das Gedankenexperiment auf die Realität:**

- Population seien nun **alle Männer in Deutschland**.
- Sie haben eine einzelne Studie durchgeführt (also eine Stichprobe aus der Population gezogen).

:::{.fragment}
![](images/noselength_sample_absolute.png){height=300px}
:::

- Ihnen ist nun klar, dass das Ergebnis der Studie nur *eines von vielen möglichen Ergebnissen* ist.
- Beim Wiederholen derselben Studie würde also – rein zufallsbedingt – ein etwas anderes Ergebnis herauskommen.


<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung

<div class="vspace-small"></div>
Wie sieht die zu erwartende Stichprobenverteilung aus, wenn ich, anders als im Gedankenexperiment, die Population *nicht kenne*?

:::{.fragment}
Dies führt uns zur [**theoretischen Stichprobenverteilung**]{color="navy"}. Wie sich herausstellt, können wir anhand einer einzelnen Studie Aussagen darüber machen, wie die Verteilung von Stichprobenkennwerten erwartbar aussehen würde, würden wir die Studie &ndash; rein hypothetisch &ndash; **unendlich oft wiederholen**.

<div class="vspace-medium"></div>

![](images/inference6.png)
:::


<!----------------->
<!--- New slide --->
<!----------------->
## Theoretische Stichprobenverteilung

<div class="vspace-medium"></div>

Wie gelangt man zu dieser theoretischen Stichprobenverteilung (obwohl man ja meist nur eine einzige Studie durchgeführt hat)?

:::: {.columns}
::: {.column width="58%"}

Dazu benötigen wir drei Informationen:

1. Wie sieht die **Form** der Verteilung aus?
2. Was ist der **Mittelwert** der Verteilung?
3. Was ist die Breite (**Streuung**) der Verteilung?

:::
::: {.column width="42%"}
![](images/stichprobenverteilung_theoretisch.png)
:::
::::

<!----------------->
<!--- New slide --->
<!----------------->
## Form der theoretischen Stichprobenverteilung

:::: {.columns}
::: {.column width="77%"}
- Wir haben bereits den **zentralen Grenzwertsatz** kennengelernt, demzufolge viele Merkmale in der Psychologie normalverteilt sind, weil sie sich aus einer Summe von Zufallseffekten (Genetik, Umwelt, Erziehung, usw.) zusammensetzen.
- Eine wesentliche Erkenntnis ist, dass statistische Kennwerte wie Mittel-<br>wert oder Varianz ebenfalls auf Summen von Zufallseffekten basieren.
:::
::: {.column width="23%"}
<div class="vspace-large"></div>

:::{.fragment}
Beispiel Mittelwert: 

$$
\quad\bar{x} = \frac{1}{n}\sum x_i
$$
:::
:::
::::


:::{.fragment}
:::{style="margin-top: -15px"}
Mit anderen Worten: ziehen wir sehr viele Stichproben aus der Population, berechnen für jede Stichprobe einen statistischen Kennwert (in Bezug auf die betrachtete Merkmalsvariable), so sind diese Kennwerte **normalverteilt** &mdash; und zwar unabhängig von der Verteilung der ursprünglichen Merkmalsvariable in der Population!
:::
<div class="vspace-small"></div>


![](images/central_limit_theorem_average.png){height=275px}
:::


<!----------------->
<!--- New slide --->
<!----------------->
## [Form der theoretischen Stichprobenverteilung: Würfelexperiment]{style="font-size: 39px"}


<!-- Jeder Student bringt einen Würfel mit. 

Runde 1: alle würfeln, Mittelwert wird notiert

Runde 2: ""

...

Runde n

Alle Mittelwerte werden als Histogramm aufgetragen -> Normalverteilung?

(Beachte: die originale Verteilung ist uniform!) -->

<!----------------->
<!--- New slide --->
<!----------------->
## Form der theoretischen Stichprobenverteilung

<div class="vspace-small"></div>

:::: {.columns}
::: {.column width="65%"}
Die Form der theoretischen Stichprobenverteilung (SV) ist also geklärt:

$$
X \sim \mathcal{N}(\mu_\text{SV},\,\sigma_\text{SV})
$$

[(in Worten: *wir nehmen an, dass unser Merkmal $X$ aus einer Normalverteilung $\mathcal{N}$ mit Mittelwert $\mu_\text{SV}$ und Standardabweichung $\sigma_\text{SV}$ gezogen ist*)]{style="font-size: 20px"}

:::
::: {.column width="35%"}
![](images/inference7_annot.png)
:::
::::




<div class="vspace-medium"></div>

::: {.merke .fragment style="font-size: 21px !important"}
:::: {.columns}
::: {.column width="5%"}
::: {style="margin-top: 18px"}
![](images/merke.png){height="55px"}
:::
:::
::: {.column width="95%"}
Auch wenn wir in den Beispielen vornehmlich den Mittelwert als Stichprobenkennwert betrachten, sind alle statistischen Kennwerte, die wir bis jetzt kennengelernt haben ($\bar{x}$, $s$, $r$, usw), zumindest *im Grenzfall* $n\rightarrow\infty$ normalverteilt. <br>
Für unterschiedliche Kennwerte gibt es dabei unterschiedliche Faustregeln, ab welcher Stichprobengröße von einer Normalverteilung ausgegangen werden kann. Für den Mittelwert ist eine häufig genannte Regel $n=30$.
:::
::::
:::


<!----------------->
<!--- New slide --->
<!----------------->
## Mittelwert der theoretischen Stichprobenverteilung

Die beste Schätzung $\hat{\mu}_\text{SV}$ für den wahren Mittelwertsparameter $\mu_\text{SV}$ der Stichprobenverteilung (und damit den Mittelwert der Population) ist häufig der statistische Kennwert selbst (z.B. $\bar{x}, s$)!

<div class="vspace-medium"></div>

::: {.merke .fragment style="font-size: 24px !important"}
:::: {.columns}
::: {.column width="5%"}
::: {style="margin-top: 18px"}
![](images/merke.png){height="55px"}
:::
:::
::: {.column width="95%"}
**Wichtig:** diese Annahme gilt nur, wenn die Stichprobenverteilung tatsächlich einer Normalverteilung folgt!<br><br>Für den Mittelwert kann man diese Normalverteilungs-Näherung bereits bei kleinem $n$ annehmen (~30). Bei anderen Größen, v.a. solchen, die auf einen endlichen Bereich beschränkt sind (z.B. Korrelation −1 bis +1, relative Häufigkeiten 0 bis 1), gilt die Normalverteilungs-Näherung bei kleineren Stichprobengrößen nicht ohne Weiteres.<br>In diesem Fall werden andere Funktionen für die Stichprobenverteilung angenommen, bei denen der wahrscheinlichste Wert (Modus) dann u.U. *nicht* der statistische Kennwert selbst ist. (&rArr; Vorlesung 12)
:::
::::
:::

<div class="vspace-large"></div>

::: {.fragment .example style="font-size: 23px !important"}
:::: {.columns}
::: {.column width="10%"}
::: {style="margin-top: 10px"}
![](images/example.png){height=70px}
:::
:::
::: {.column width="65%"}

**Beispiel Mittelwert.** Ist der Mittelwert der betrachtete statistische Stichprobenkennwert so gilt: 

:::{style="margin-top: -10px"}
$$
\hat{\mu}_\text{SV} = \bar{x}
$$
:::

&xrarr; Die theoretische Stichprobenverteilung wird also in diesem Fall um den Stichprobenmittelwert $\bar{x}$ herum konstruiert. Der Mittelwert ist die beste Schätzung für den Mittelwert der Stichprobenverteilung *auch dann* wenn die Stichprobengröße sehr klein ist und nicht mehr von einer Normalverteilung ausgegangen werden kann.

:::
::: {.column width="25%"}
![](images/inference8_annot.png){height=200px}
:::
::::
:::





<!----------------->
<!--- New slide --->
<!----------------->
## Streuung der theoretischen Stichprobenverteilung


Bleibt die Frage nach dem Streuungsparameter $\sigma_\text{SV}$: woher wissen wir, wie die Ergebnisse von hypothetischen Stichproben streuen würden?

:::: {.columns .fragment }
::: {.column width="32%"}
Gehen wir dazu zu unserem Gedankenexperiment zurück:
:::
::: {.column width="68%"}
![](images/inference1_annot.png)
:::
::::

:::{.fragment}
**Was würde die Streuung der möglichen Ergebnisse verkleinern?**
:::

1. Wir ziehen nicht 3 Personen in unserer Studie, sondern 6<br>&xrarr; damit lägen fast alle Stichproben näher am wahren Mittelwert!

2. Wir hätten in der Population grundsätzlich eine geringere Streuung der Werte<br>&xrarr; damit würden auch die Mittelwerte einzelner Studien weniger streuen.

:::{.fragment}
Der Streuungsparameter $\sigma_\text{SV}$ der theoretischen Stichprobenverteilung muss also eine Funktion der Stichprobengröße $n$ und der Streuung $\sigma$ in der Population sein. 
:::

<div class="vspace-xsmall"></div>

:::{.fragment}
$$
\hat{\sigma}_\text{SV} = \hat{se} = f(n, \sigma)
$$
:::

<div class="vspace-xsmall"></div>

:::{.fragment}
Als Begriff für die Streuung der Stichprobenverteilung hat sich [**Standardfehler**]{color="navy"} (engl. *standard error*) eingebürgert.
:::


<!----------------->
<!--- New slide --->
<!----------------->
## Beispiel: Standardfehler des Mittelwertes

:::: {.columns}
::: {.column width="68%"}

:::{.nonincremental}
- Ein für Statistik 1 besonders wichtiger Standardfehler ist der Standardfehler des Kennwertes *Mittelwert*.
- Er wird als **Standardfehler des Mittelwertes** oder engl. *standard error of the mean* (*SEM*) bezeichnet.
- Er berechnet sich als die Standardabweichung der Population $\sigma$ geteilt durch die Wurzel aus der Stichprobengröße $n$ ("Wurzel-N-Gesetz"):
:::

:::
::: {.column width="32%"}
![](images/stichprobenverteilung.png)
:::
::::


::: {.fragment style="margin-top: -5px"}
$$
\text{Standardfehler des Mittelwertes:}\qquad\hat{\sigma}_\text{SV} = \hat{se} = \frac{\hat{\sigma}}{\sqrt{n}}
$$
:::

- Da der wahre Streuungsparameter $\sigma$ der Population unbekannt ist, verwenden wir die Schätzung $\hat{\sigma}$ auf Basis der Streuung der Stichprobendaten (&rarr; dazu kommen wir gleich noch einmal).
- Intuitiv sagt der Standardfehler des Mittelwertes aus, wie sicher wir uns bei der Bestimmung des Mittelwertes sein können
    - Großer Standardfehler: Gemessener Mittelwert ist eher unsicher
    - Kleiner Standardfehler: Gemessener Mittelwert ist eher sicher

<!----------------->
<!--- New slide --->
<!----------------->
## Beispiel: Standardfehler des Mittelwertes


::: {.merke .vcenter}
:::: {.columns}
::: {.column width="5%"}
::: {style="margin-top: 18px"}
![](images/merke.png){height="55px"}
:::
:::
::: {.column width="95%"}
**Beachte:** der Standardfehler des Mittelwertes allein sagt nichts über die tatsächliche Streubreite des Merkmals. Der Standardfehler kann klein sein, obwohl die Standardabweichung $\sigma$ des gemessenen Merkmals groß ist, wenn im Gegenzug die Stichprobengröße $n$ groß ist. Umgekehrt kann ein Standardfehler groß sein, obwohl die Standardabweichung $\sigma$ klein ist, wenn $n$ klein ist.
:::
::::
:::

<!----------------->
<!--- New slide --->
<!----------------->
## [Herleitung des Standardfehlers]{color="darkred"}

![](images/kein_klausurstoff.png){.absolute bottom=0 right=0 height=130px}

:::{.nonincremental}
- Der Standardfehler ist ein Maß für die **Variabilität der Stichprobenmittelwerte** $\bar{x}$ &mdash; dies können wir zunächst über die Varianz zum Ausdruck bringen:
:::

$$
se^2 = Var(\bar{x})
$$

:::{.nonincremental}
- Wir wissen, dass $\bar{x} = \frac{1}{n}\sum X_i$, also:
:::

$$
se^2 = Var(\bar{x}) = Var\left(\frac{1}{n}\sum X_i\right)
$$

:::{.nonincremental}
- Um das $\frac{1}{n}$ aus der Varianz herausziehen zu können, versichern wir uns einer kleinen Rechenregel:
:::

$$
Var(aX) = \frac{1}{n}\left(aX_i-a\bar{x}\right)^2 = \frac{a^2}{n}\left(X_i-\bar{x}\right)^2 = a^2Var(X)
$$

:::{.nonincremental}
- Daraus folgt:
:::

$$
se^2 = \frac{1}{n^2}Var\left(\sum X_i\right)
$$


<!----------------->
<!--- New slide --->
<!----------------->
## [Herleitung des Standardfehlers]{color="darkred"}

![](images/kein_klausurstoff.png){.absolute bottom=0 right=0 height=130px}

$$
\text{Zwischenergebnis}\qquad se^2 = \frac{1}{n^2}Var\left(\sum X_i\right) 
$$

:::{.nonincremental}
- Die Summe in der Varianz stört noch. Glücklicherweise gilt, dass die Varianz der Summe von unabhängigen Zufallsvariablen $X_i$ gleich der Summe der Varianzen ist, d.h. 
:::

$$
Var\left(\sum X_i\right)=\sum Var(X_i)
$$

:::{.nonincremental}
- Daraus folgt:
:::

$$
se^2 = \frac{1}{n^2}\sum Var(X_i) = \frac{1}{n^2}\big(n\cdot Var(X_i)\big) = \frac{1}{n}Var(X_i)
$$

:::{.nonincremental}
- Nun sind wir fast am Ziel. Da die Varianz der $X_i$ nichts anderes als die quadrierte Standardabweichung $\sigma^2$ ist, gilt:
:::

$$
se^2 = \frac{\sigma^2}{n} \qquad \text{bzw.} \qquad se = \frac{\sigma}{\sqrt{n}}
$$


<!----------------->
<!--- New slide --->
<!----------------->
## [Übersicht Standardfehler]{color="darkred"}

![](images/kein_klausurstoff.png){.absolute bottom=0 right=0 height=110px}


<!---  Table --->
|Maß|Standardfehler|Einschränkung|
|-|-|-|
| Mittelwert | $\hat{se}(\bar{x}) = \frac{\hat{\sigma}}{\sqrt{n}}$ |  |
| Median | $\hat{se}(\tilde{x}) = \sqrt{\frac{\pi}{2}}\frac{\hat{\sigma}}{\sqrt{n}}$ | Annahme: Normalverteilung von $X$|
| Varianz | $\hat{se}(s^2) = \sqrt{\frac{2}{n-1}}\hat{\sigma}^2$ | Annahme: Normalverteilung von $X$ |
| Standardabweichung | $\hat{se}(s) = \frac{\hat{\sigma}}{\sqrt{2(n-1)}}$ | Näherung; Annahme: Normalverteilung von $X$ |
|Korrelation|$\hat{se}(r) = \sqrt{\frac{1-r^2}{n-2}}$|Näherung; Hinweis: laut neuerer Forschung ist $\hat{se}(r) = \sqrt{\frac{1-r^2}{n-3}}$ sogar ein noch besserer Schätzer^[Gnambs T. A Brief Note on the Standard Error of the Pearson Correlation. https://psyarxiv.com/uts98/]|
|Cohen's d (abhängige Messungen)|$\hat{se}(d) = \sqrt{\frac{1}{n}+\frac{d^2}{2n}}$|Näherung|
|Cohen's d (unabhängige Messungen)|$\hat{se}(d) = \sqrt{\frac{n_1+n_2}{n_1n_2}+\frac{d^2}{2(n_1+n_2)}}$|Näherung; Quelle^[n^[https://stats.stackexchange.com/questions/495015/what-is-the-formula-for-the-standard-error-of-cohens-d]:]|
: {tbl-colwidths="[25, 20, 55]"}

Nützliches Paper^[Harding B, Tremblay C, Cousineau D (2014) Standard errors: A review and evaluation of standard error estimators using Monte Carlo simulations. TQMP 10:107–123.]

<!----------------->
<!--- New slide --->
<!----------------->
## Zwischenfazit

::: {.colorbox .fragment style="margin-bottom:15px"}
Die theoretische Stichprobenverteilung folgt einer **Normalverteilung** (falls n groß genug) mit einem **Mittelwert, der dem statistischen Kennwert entspricht**, und einer Standardabweichung, die sich aus der Populationsstreuung $\sigma$ und der Stichprobengröße $n$ berechnet (der sog. **Standardfehler**).
:::

- Der Standardfehler gibt darüber Auskunft, wie verlässlich unsere Schätzung des statistischen Kennwertes ist.
- Wie wir noch sehen werden umfasst $1 \hat{se}$ die mittleren 68% der möglichen Ergebnisse in der theoretischen Stichprobenverteilung.

<!---  Example --->
::: {.example .fragment}
:::: {.columns}
::: {.column width="10%"}
::: {style="margin-top: 10px"}
![](images/example.png){height=70px}
:::
:::
::: {.column width="55%"}
Nehmen wir an, die Nasenlängen der Männer in unserer Studie weisen eine durchschnittliche Länge von $6cm$ auf und einen Standardfehler (des Mittelwertes) von $0{,}5cm$. 

Wir können damit sagen, dass der Bereich

$$
\bar{x}\pm\hat{se} = 6\pm 0{,}5 = [5{,}5; 6{,}5]
$$

68% der Stichprobenverteilung umfasst. 

[In Vorlesung 12 werden wir noch feststellen, dass wir (leider) [nicht]{.underline} schlussfolgern können, dass der wahre Populationsmittelwert $\mu$ mit 68% Wahrscheinlichkeit in diesem Intervall liegt.]{style="font-size: 18px"}


:::
::: {.column width="35%"}
![](images/sem_example.png){height=280px}
:::
::::
:::




<!----------------->
<!--- New slide --->
<!----------------->
## Interpretation des Standardfehlers

<div class="vspace-medium"></div>

**Wie kann man den Wert eines Standardfehlers interpretieren?**

- Lässt sich pauschal nicht beantworten, da der Standardfehler von der Messskala abhängt
    - Er ist keine standardisierte Größe wie z.B. der Korrelationskoeffizient.
- Prinzipiell gilt: je kleiner, desto besser (d.h. desto präziser ist unsere Kennwertschätzung)
- Anhaltspunkt: Vergleich/Verhältnis zur Skala (besonders einfach bei Ratingskalen wie 1-10) oder zur Standardabweichung in der Stichprobe:

<div class="vspace-large"></div>

<!---  Example --->
::: {.example .fragment}
:::: {.columns}
::: {.column width="10%"}
::: {style="margin-top: 10px"}
![](images/example.png){height=70px}
:::
:::
::: {.column width="90%"}
Nehmen wir wieder unser Nasenlängen-Beispiel mit $\bar{x}=6cm$ und $\hat{se}=0{,}5cm$, und nehmen wir an, die Standard*abweichung* von Nasenlängen in der Stichprobe betrug $5cm$. In diesem Fall hätten wir den Mittelwert mit einer Präzision von 10% der Streubreite in der Stichprobe geschätzt, was einer recht guten/präzisen Schätzung entspricht.

(Als kleine Übung: wie hoch müsste in diesem Beispiel die Stichprobenzahl gewesen sein? (Antwort: $n=100$)
:::
::::
:::

<!----------------->
<!--- New slide --->
<!----------------->
## Verwendung des Standardfehlers in der Praxis

- Im Text wird der Standardfehler des Mittelwertes oft in folgender Form angegeben: $M = 3 \pm 0,6 \,\,(\text{SEM})$. 
    - Wichtig: es sollte prinzipiell immer angegeben werden, um was für ein Streuungsmaß es sich handelt (SEM ist hier die geläufige englische Abkürzung für *standard error of the mean*).
- In Abbildungen wird der Standardfehler ähnlich wie die Standardabweichung häufig in Form von Fehlerbalken dargestellt:

<div class="vspace-small"></div>

:::{.fragment}
![](images/sem_praxis.png){height=270px}
:::

- Ist das Hauptinteresse ob sich Experimentalbedingungen **in ihrem Mittelwert unterscheiden**, ist der **Standardfehler aussagekräftiger** als die Varianz oder Standardabweichung
    - Aus diesem Grund ist der Standardfehler des Mittelwertes das vielleicht häufigste Streuungsmaß in der Psychologie


<!----------------->
<!--- New slide --->
<!----------------->
##
:::: {.columns}
::: {.column width="9%"}
::: {style="margin-top:-15px"}
![](images/summary.png){width=60px}
:::
:::
::: {.column width="91%"}
::: {.summary}
- Im Zuge der Inferenzstatistik wird untersucht, wie gut **Schätzungen von Parametern in der Population** auf Basis von **Stichprobenkennwerten** sind.
- Es geht also um die **Verallgemeinerbarkeit** von Stichprobendaten auf die Population
- Generelle Idee: Was würde passieren, wenn die Studie immer wieder durchgeführt und der Kennwert bestimmt würde?
- Diese Idee wird durch die **theoretische Stichprobenverteilung** repräsentiert.
- Die Stichprobenverteilung von Kennwerten ist laut dem Zentralen Grenzwertsatz **normalverteilt**.
- Die Standardabweichung dieser Stichprobenverteilung wird **Standardfehler** genannt.
:::
:::
::::



<!----------------->
<!--- New slide --->
<!----------------->
## {.center}

![Bildnachweis^[http://www.peaya.com/peaya.php?comicsid=1005]](images/peaya_sem.png)



<!-- {{< include 01_law_of_large_numbers.qmd >}} -->