# Aufgabe 6.1

Ein Weinhändler behauptet, dass die von ihm gefüllten Weinflaschen 70 Zentiliter
enthalten. Ein skeptischer Konsument vermutet aber, dass der Weinhändler zu wenig
Wein abfüllt und will diese Behauptung überprüfen. Deshalb kauft er 12 Weinflaschen
und misst ihren Inhalt. Er findet:

$$71, 69, 67, 68, 73, 72, 71, 71, 68, 72, 69, 72\ (in\ Zentiliter)$$

Nehmen Sie zunächst an, dass die Standardabweichung der Abfüllung im Voraus bekannt ist. Sie beträgt $σ = 1.5$ Zentiliter. Da die Standardabweichung der Messungen bekannt ist, können wir einen z-Test durchführen. Führen Sie den (einseitigen; in
welche Richtung?) Test auf dem 5 %- Signifikanzniveau durch.

Geben Sie die Modellannahmen, $H_0$, $H_A$, den Verwerfungsbereich, den Wert der Teststatistik und das Testergebnis explizit an.

Formulieren Sie in einem Satz die Schlussfolgerung für den kritischen Konsumenten.

In [13]:
import numpy as np
from scipy.stats import norm

sample = np.array([71, 69, 67, 68, 73, 72, 71, 71, 68, 72, 69, 72])
n = sample.size # 12
a = 0.05
mu = 70
sigma = 1.5

- Anzahl Messungen: $n = 12$
- Signifikanzniveau: $\alpha = 5 \%$

**Modell**: 

$X_i \sim \mathcal{N}(\mu,\,\sigma^{2}),\ \mu = 70,\ \sigma = 1.5$

**Null- / Alternativhypothese:**

- $H_0$: $\mu = 70$
- $H_A$: $\mu < 70$

**Teststatistik** unter $H_0$: 

$\bar{X}_{12} \sim \mathcal{N}\Big(70,\frac{1.5^2}{12}\Big)$


In [14]:
norm.ppf(q=0.05, loc=70, scale=1.5/np.sqrt(n))

69.28775748677653

**Verwerfungsbereich** für die Teststatistik: $[-\infty, 69.29]$

In [15]:
sample.mean()

70.25

**Testergebnis**:

$$70.25 \notin [-\infty, 69.29]$$

Dieser Wert ist ausserhalb des Verwerfungsbereichs, die Nullhypothese kann somit _nicht_ verworfen werden.

**Schlussfolgerung**:

Aufgrund der Stichprobe muss man davon ausgehen, dass der Weinhändler nicht zuwenig Wein abgefüllt hat.

# Aufgabe 6.2

Ein Weinhändler behauptet, dass die von ihm gefüllten Weinflaschen 70 Zentiliter
enthalten. Ein skeptischer Konsument vermutet aber, dass der Weinhändler zu wenig
Wein abfüllt und will diese Behauptung überprüfen. Deshalb kauft er 12 Weinflaschen
und misst ihren Inhalt. Er findet:

$$71, 69, 67, 68, 73, 72, 71, 71, 68, 72, 69, 72\ (in\ Zentiliter)$$

Die Standardabweichung der Abfüllungen ist nicht bekannt. Man muss sie also aus
den gemachten Stichproben schätzen:

$$ \hat{\sigma}_{x}^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}-\overline{x}\right)^{2} \approx 1.96^{2} $$

Da die Standardabweichung geschätzt wurde und nicht mehr exakt bekannt ist, kann
der z-Test nicht durchgeführt werden. Verwenden Sie nun den t-Test auf dem 5 %-
Signifikanzniveau.

Geben Sie die Modellannahmen, $H_0$, $H_A$, den Verwerfungsbereich, den Wert der Teststatistik und das Testergebnis explizit an.

**Modell**: $$X_i \sim \mathcal{N}(\mu,\,\sigma^{2}),\ \mu = 70,\ \sigma =\ unbekannt$$

**Nullhypothese $H_0$**: $\mu = 70$

**Alternativhypothese $H_A$**: $\mu < 70$

**Teststatistik**: t-Verteilung mit Freiheitsgrad 11

**Signifikanzbereich**: $\alpha = 5\%$

**$\hat{\sigma}$**: 1.96

In [17]:
from scipy.stats import t

print("std: " + str(sample.std()))

t.ppf(q=0.05, df=n-1, loc=70, scale=sample.std()/np.sqrt(n))

std: 1.8763883748662837


69.02722905653552

**Verwerfungsbereich**: $[-\infty, 69.03]$

**Testergebnis:**

In [12]:
sample.std()

1.8763883748662837

# Aufgabe 6.3

Unterhalb einer Kläranlage wurden 16 unabhängige Wasserproben aus einem Fluss
entnommen und jeweils deren Ammoniumkonzentration $X_i$ (in $μg$ NH_4-N/l) mit
einem Messgerät bestimmt. Der Mittelwert der Proben ergab $\bar{x}_{16} = 204.2$.

Wir wollen nun wissen, ob mit diesem Experiment eine Überschreitung des Grenzwerts
von 200 $μg$ NH_4-N/l nachgewiesen werden kann (auf dem 5% Niveau).

**a) Nehmen Sie an, die Standardabweichung der Messungen sei im Voraus aufgrund
früherer Studien bekannt. Sie betrage 10 μg NH_4-N/l.**

**Führen Sie unter dieser Annahme einen z-Test durch, um zu prüfen, ob eine
Grenzwertüberschreitung nachgewiesen werden kann.**

**Geben Sie die Modellannahmen, $H_0$, $H_A$, den Verwerfungsbereich, den Wert
der Teststatistik und das Testergebnis explizit an.**

- **Modell**: $X_i \sim \mathcal{N}(\mu,\,\sigma^{2}),\ \sigma =\ 10$
- **Nullhypothese** $H_0 : \mu_0 = 200$
- **Alternativhypothese** $H_A : \mu > 200$ (einseitiger Test nach oben)
- **Verteilung der Teststatistik unter $H_0$**: t-Verteilung mit 15 Freiheitsgraden

$$ T \sim t_{15}$$

- **Signifikanz-Niveau**: $\alpha = 0.05$

In [8]:
import numpy as np
from scipy.stats import norm

norm.ppf(q=0.95, loc=200, scale=10/np.sqrt(16))

204.1121340673787

- **Verwerfungbereich** $K = [204.11, \infty)$

* **Testentscheid**: $\bar{x}_{16} = 204.2 \in K$

    Die Nullhypothese wird also verworfen. Ein Überschreitung des Grenzwertes ist (mit einem Signifikanz-Niveau von 5%) nachgewiesen.

**b)  Wie wahrscheinlich ist es, dass man mit 16 unabhängigen Wasserproben eine Grenzwertüberschreitung nachweisen kann, wenn die wahre Ammoniumkonzentration tatsächlich über dem Grenzwert, und zwar bei 205 μg NH_4-N/l
liegt?**

In [2]:
import numpy as np
from scipy.stats import norm
1-norm.cdf(x=204.11, loc=205, scale=10/np.sqrt(16))

0.6390797174095532

Bei einem wahren Mittelwert von 205 sind etwa 63.9% der Werte höher als der gemessene Mittelwert $\bar{x}_{16} = 204.2$. Der Test hat also eine Macht von rund 64%.

**c) Wie wahrscheinlich ist es, dass man mit 16 unabhängigen Wasserproben fälschlicherweise eine Grenzwertüberschreitung nachweist, obwohl die wahre Ammoniumkonzentration bei 200 μg NH-4-N/l liegt und den Grenzwert somit genau einhält?**

Dies entspricht gerade dem Signifikanz-Niveau (5%).

**d) Nehmen Sie an, dass die Standardabweichung von 10 μg/l aus den 16 Proben geschätzt worden ist. Deshalb ist nun ein t-Test (Nullhypothese $μ_0 = 200$ μg/l) und nicht ein z-Test angebracht. Führen Sie den t-Test durch.**

- **Modell**: $X_i \sim \mathcal{N}(\mu,\,\sigma^{2}),\ \hat{\sigma} =\ 10$
- **Nullhypothese** $H_0 : \mu_0 = 200$
- **Alternativhypothese** $H_A : \mu > 200$ (einseitiger Test nach oben)
- **Verteilung der Teststatistik unter $H_0$**:

$$ \bar{X}_{16} \sim \mathcal{N}(200, \frac{10^2}{16})$$

- **Signifikanz-Niveau**: $\alpha = 0.05$

In [9]:
import numpy as np
from scipy.stats import t

t.ppf(q=0.95, loc=200, df=15, scale=10/np.sqrt(16))

204.38262588923138

- **Verwerfungbereich** $K = [204.38, \infty)$
* **Testentscheid**: $\bar{x}_{16} = 204.2 \notin K$

Die Nullhypothese wird **nicht** verworfen. Ein Überschreitung des Grenzwertes ist (mit einem Signifikanz-Niveau von 5%)  **nicht** nachgewiesen.


**e) Welche Annahmen des t-Testes könnte verletzt sein und dazu führen, dass der
t-Test schlechte Macht hat?**

Die Stichprobe ist zu klein. Je grösser die Stichprobe, desto besser ist der t-Test.