## Die Intervall-Schätzung
----------------------------------------

In [1]:
from scipy.stats import norm

Anstatt einem Grundgesamtheitsparameter einen einzelnen Wert zuzuordnen, gibt eine **Intervallschätzung** eine probabilistische Aussage, die das gegebene Intervall mit der Wahrscheinlichkeit in Beziehung setzt, dass dieses Intervall tatsächlich den wahren (unbekannten) Grundgesamtheitsparameter enthält.

Das **Konfidenzniveau** wird a priori gewählt und hängt somit von den Präferenzen des Nutzers ab. Es wird bezeichnet durch

$$ 100(1-\alpha)\% $$

Obwohl jeder beliebige Wert für das Konfidenzniveau gewählt werden kann, sind die gebräuchlichsten Werte $90 \%, 95 \%$ und $99 \%$. Wird das Konfidenzniveau als Wahrscheinlichkeit ausgedrückt, wird es als **Konfidenzkoeffizient** bezeichnet und mit $(1-\alpha)$. Die gebräuchlichsten Vertrauenskoeffizienten sind $0,90$, $0,95$ bzw. $0,99$.

Ein $100(1-α) \%$-iges <a href="https://de.wikipedia.org/wiki/Konfidenzintervall">Konfidenzintervall</a> ist eine Intervallschätzung um einen Populationsparameter $\theta$ (hier ist der griechische Buchstabe $\theta$ ein Platzhalter für einen beliebigen Populationsparameter von Interesse, wie z. B. den Mittelwert $\mu$ oder die Standardabweichung $\sigma$), von dem bei wiederholten Stichproben der Größe $N$ erwartet wird, dass er den wahren Wert von $\theta$ in $100(1-α) \%$ der Fälle einschließt ({cite:p}`fahrmeirstatistik` s.358).

Die tatsächliche Zahl, die zur Punktschätzung addiert oder von ihr subtrahiert wird, wird als Fehlermarge bezeichnet.

$$CI: \text{Punktschätzung} \pm \text{Fehlermarge}$$

Die Fehlermarge besteht aus zwei Elementen. Zum einen aus dem so genannten **kritischen Wert** und zum anderen aus einem Maß für die Variabilität der <a href="https://de.wikipedia.org/wiki/Sch%C3%A4tzfunktion">Stichprobenverteilung</a>. Der kritische Wert ist ein numerischer Wert, der dem a priori festgelegten Vertrauensniveau entspricht. Er wird manchmal als $z^*$ oder $z^*_{\alpha/2}$ bezeichnet. Das Maß für die Variabilität ist der <a href="https://de.wikipedia.org/wiki/Standardfehler">Standardfehler</a>, der als $\frac{\sigma}{\sqrt{n}}$ bezeichnet wird.

Die Fehlermarge ($FM$) wird also ausgedrückt als

$$FM = z^*_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}$$

Schauen wir uns zum besseren Verständnis eine Abbildung an.

![Alt-Text](marginoferror.png)

Dementsprechend lautet die vollständige Gleichung für das Konfidenzintervall wie folgt

$$CI: \text{Punktschätzung} \pm z^*_{\alpha/2} \times \frac{\sigma}{\sqrt{n}}$$

Um den entsprechenden Wert für $z^*_{\alpha/2}$ zu erhalten, kann man ihn in einer <a href="https://de.wikipedia.org/wiki/Standardnormalverteilungstabelle">Tabelle</a> nachschlagen oder die Funktion `norm.ppf()` in Python verwenden. Lassen Sie uns zur Übung einige Konfidenzintervalle konstruieren.

**Konfidenzniveau von** $90 \% (\alpha=0,1)$

In [2]:
norm.ppf(0.05)

-1.6448536269514729

In [3]:
norm.ppf(0.95)

1.6448536269514722

Die untere und obere Grenze des Intervalls, das einen Bereich von $90 \%$ um den Mittelwert abdeckt, wird durch die $z$-Werte $-1,64$ bzw. $1,64$ angegeben.

Bei einem Konfidenzniveau von $90 \% (\alpha=0,1)$ ergibt sich aus der obigen Gleichung

$$CI_{90\%}: \text{Punktschätzung} \pm 1,64 \times \frac{\sigma}{\sqrt{n}}$$

**Konfidenzniveau von** $95 \% (\alpha=0,05)$

In [4]:
norm.ppf(0.025)

-1.9599639845400545

In [5]:
norm.ppf(0.975)

1.959963984540054

Die untere und obere Grenze des Intervalls, das einen Bereich von $90 \%$ um den Mittelwert abdeckt, wird durch die $z$-Werte $-1,96$ bzw. $1,96$ angegeben.

Bei einem Konfidenzniveau von $95 \% (\alpha=0,05)$ ergibt sich aus der obigen Gleichung

$$CI_{95\%}: \text{Punktschätzung} \pm 1,96 \times \frac{\sigma}{\sqrt{n}}$$

**Konfidenzniveau von** $99 \% (\alpha=0,01)$

In [6]:
norm.ppf(0.005)

-2.575829303548901

In [7]:
norm.ppf(0.995)

2.5758293035489004

Die untere und obere Grenze des Intervalls, das einen Bereich von $90 \%$ um den Mittelwert abdeckt, wird durch die $z$-Werte $-2,58$ bzw. $2,58$ angegeben.

Bei einem Konfidenzniveau von $99 \% (\alpha=0,01)$ ergibt sich aus der obigen Gleichung

$$CI_{99\%}: \text{Punktschätzung} \pm 2,58 \times \frac{\sigma}{\sqrt{n}}$$