# Konstruktion Vertrauensintervall beim t-Test

Das *Vertrauensinterall (Konfidenzintervall)* bei einem Hypothesentest beinhaltet alle Werte der Teststatistik, bei denen die Nullhypothese **nicht** verworfen wird. Das sind also alle Werte des Parameters in der Nullhyothese, die als verträglich mit den gegebenen Daten angesehen werden. Mit anderen Worten ist es das Intervall, in dem der  Wert des wahren Parameters mit hoher Wahrscheinlichkeit liegt. Der Wert dieser Wahrscheinlichkeit ist dabei $1-\alpha$, wobei $\alpha$ das Signifikanzniveau ist.

Bei einem $t$-Test geht man von $n$ unabhängigen Messwerten aus, die alle der gleichen Verteilung folgen:
$$ X_1,\ldots,X_n \sim \mathcal{N}(\mu,\sigma^2) $$
Hierbei ist $\mu$ der unbekannte Erwartungswert und $\sigma$ die unbekannte Standardabweichung. Die Standardabweichung wird aus den Daten geschätzt:
$$ \hat{\sigma}^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i-\overline{X}_{n})^2 \qquad \text{und}\qquad \hat{\sigma}=\sqrt{\hat{\sigma}^2}$$
Das zweiseitige $(1-\alpha)$-Vertrauensintervall kann man wie folgt berechnen:
$$ I=\left[\overline{X}_n - t_{\rm krit}\cdot \frac{\hat{\sigma}}{\sqrt{n}}, \overline{X}_n + t_{\rm krit}\cdot \frac{\hat{\sigma}}{\sqrt{n}}\right]$$
Hierbei ist $t_{\rm krit}$ der *kritische $t$-Wert*, welcher beim zweiseitigen Test das $(1-\frac{\alpha}{2})$-Quantil der $t$-Verteilung mit $n-1$ Freiheitsgraden ist.

## Beispiel: Schmelzwärme

Wir betrachten als Beispiel die Messreihe der Schmelzwärme mit Methode A. Wir schätzen $\mu$ und $\sigma$ aus den Daten.

In [None]:
import numpy as np
from pandas import Series
from scipy.stats import t

x = Series([79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04,
            79.97, 80.05,80.03, 80.02, 80.00, 80.02])
n = x.size
alpha=0.05
x_bar = x.mean()
sigma_hat = x.std()
print("n: ", n)
print("x_bar: ", np.round(x_bar,4))
print("sigma_hat: ",np.round(sigma_hat,4))

Wir berechnen den kritischen $t$-Wert und das Konfidenzintervall mit obigen Formeln.

In [None]:
# Vertrauensintervall (Konfidenzintervall)
t_crit = t.ppf(q=1-alpha/2, df=n-1)
print("Kritischer t-Wert: ", np.round(t_crit,4))
I = x_bar+np.array([-1,1])*t_crit*sigma_hat/np.sqrt(n)
print("Konfidenzintervall: ", np.round(I,4))

Alternativ kann man das Konfidenzintervall auch bequem mit einem Befehl berechnen:

In [None]:
I = t.interval(confidence=1-alpha, df=n-1, loc=x_bar, scale=sigma_hat/np.sqrt(n))
print(np.round(I,4))