# Mathematik für Biologiestudierende II

Sommersemester 2024

09.04.2024

&copy; 2024 Prof. Dr. Rüdiger W. Braun 

# Tests für Erwartungswerte

## Verbundene und unverbundene Stichproben

* Zwei Versuchsreihen liefern Messergebnisse.  Der Test soll entscheiden, ob sich diese Ergebnisse signifikant unterscheiden.

* *Unverbundene Stichproben:* Die Messerergebnisse werden an verschiedenen Populationen gewonnen.

# Z-Test zum Vergleich zweier Erwartungswerte bei verbundenen Stichproben

* Gegeben sind Zufallsvariable $X_1, \dots, X_n$ und $Y_1, \dots, Y_n$
* Verteilungsvoraussetzungen:
  * Alle $X_j$ sind normalverteilt mit unbekanntem Erwartungswert $\mu_1$ und *bekannter* Varianz $\sigma^2$
  * Alle $Y_j$ sind normalverteilt mit unbekanntem Erwartungswert $\mu_2$ und *bekannter* Varianz $\sigma^2$
  * Die beiden Varianzen müssen also gleich und bekannt sein (unrealistisch)
* Ziel: $\mu_1$ und $\mu_2$ sollen verglichen werden

* $x_j$ und $ _j$ seien Realisierungen (d.h., die Daten)
* $z_j = x_j - y_j$ seien die Differenzen
* Bestimme arithmetischen Mittelwert
$$      \overline z = \frac1n \sum_{j=1}^n z_j   $$

* Die *Teststatistik* ist
$$        t = \frac{\overline z}\sigma \cdot \sqrt{n}  $$
* Die Teststatistik wird mit einem Quantil der Standardnormalverteilung verglichen 

* $\phi$ ist die Verteilungsfunktion der Standardnormalverteilung
* $q_\alpha$ ist das Quantil der Standardnormalverteilung zum Wert $\alpha$
* das bedeutet $\Phi(q_\alpha) = \alpha$

## Ein- und zweiseitige Tests

* Tests können ein- oder zweiseitig sein
* Es sind $\mu_1$ und $ \mu_2 $ die unbekannten wahren Erwartungswerte der beiden Stichproben
* Bei zweiseitigen Tests ist die Nullhypothese von der Form $H_0 =  \{\mu_1 = \mu_2\}$
* Beim einseitigen unteren Test ist die Nullhypothese von der Form $H_0 = \{\mu_1 \ge \mu_2\}$, d.h. die Alternativhypothese ist $\mu_1 < \mu_2$
* Beim einseitigen oberen Test ist die Nullhypothese von der Form $H_0 = \{\mu_1 \le \mu_2\}$, d.h. die Alternativhypothese ist $\mu_1 > \mu_2$

### Entscheidungsregel

* Das Signifikanzniveau sei $\alpha$
* Beim Z-Test müssen die Quantile der Standardnormalverteilung verwendet werden

\begin{align*}
      &q_{1-\alpha/2} &&\text{beim zweiseitigen Test} \\
      &q_{1-\alpha} &&\text{bei einem einseitigen Test}
\end{align*}

* $z_j = x_j - y_j$ und Teststatistik
$$      t = \frac{\overline z}\sigma \cdot \sqrt{n}  $$

* Entscheidung:
  * $H_0 = \{\mu_1=\mu_2\} $: Die Nullhypothese $H_0$ wird abgelehnt, wenn $\left|t\right| > q_{1-\alpha/2}$
  * $H_0 = \{\mu_1\le\mu_2\}$: Die Nullhypothese $H_0$ wird abgelehnt, wenn $t > q_{1-\alpha}$
  * $H_0 = \{\mu_1\ge\mu_2\}$: Die Nullhypothese $H_0$ wird abgelehnt, wenn $t < -q_{1-\alpha}$

* Der Z-Test wird auch als Gauß-Test bezeichnet
* Um ihn anzuwenden, muss die Varianz der Daten bekannt sein.  Das ist unrealistisch.
* Für grobe Überschlagsrechnungen hat der Z-Test aber seine Berechtigung
* in `scipy.stats` ist der Z-Test nicht implementiert

# t-Tests für Mittelwerte

Wiederholung aus dem Wintersemester

* Ein Medikament soll bei einer fortschreitenden Bewegungserkrankung die Verschlechterung aufhalten
* 900 Patienten bekommen das Verum, weitere 900 ein Placebo
* Zu den Zeitpunkten $t_0$ (Anfangszeitpunkt) und $t_1$ (Endzeitpunkt) wird die Beweglichkeit durch geschultes Personal auf einer Skala von 1 (schlecht) bis 100 (perfekt) eingeordnet.  

In [None]:
import pandas as pd
from scipy import stats

In [None]:
df = pd.read_csv('treatment.csv', index_col=0)
df

* In der Spalte "Difference" steht die Differenz zwischen den beiden Zeitpunkten.  Idealerweise ist sie positiv, wenn das Medikament die Verschlechterung sogar umkehrt.
* Jedenfalls soll der Test zeigen, dass die Differenz bei den Probanden mit Verum im Mittel größer als bei den anderen ist
* Einseitiger, unverbundener Test

In [None]:
dfv = df[df.Treatment=='Verum']
dfv.describe()

In [None]:
dfp = df[df.Treatment=='Placebo']
dfp.describe()

* Aus der Gruppe der Probanden mit Verum sind 13 Leute ausgeschieden
* aus der anderen 18

In [None]:
stats.ttest_ind(dfv.Difference, dfp.Difference, alternative='greater')

Die Nullhypothese, dass das Medikament nicht besser wirkt als Placebo, kann zum Signifikanzniveau $\alpha=0.011$ abgelehnt werden. 

# Effektstärke

Beim Vergleich zweier Mittelwerte kann "Cohen's d" zur Messung der Effektstärke verwendet werden.  

$$
    d = \left| \frac{\overline x - \overline y}s \right|
$$

wobei $\overline x$ und $\overline y$ die beiden Mittelwerte, $s$ die Stichprobenstreuung und $|a|$ der Betrag von $a$ bezeichnet.

* Bei verbundenen Stichproben verwendet man die Stichprobenstreuung der Differenz
* Bei unverbundenen Stichproben verwendet man die Standardabweichung der gepoolten Stichproben (s. Lektion 12)

In [None]:
import numpy as np

In [None]:
n1 = dfv.Difference.count()
n2 = dfp.Difference.count()
xq = dfv.Difference.mean()
yq = dfp.Difference.mean()
sx = dfv.Difference.std()
sy = dfp.Difference.std()

In [None]:
zaehler = (n1-1)*sx**2 + (n2-1)*sy**2
nenner = n1+n2-2
sq = np.sqrt(zaehler/nenner)
sq

In [None]:
d = (xq - yq) / sq
d

### Interpretation der Effektgröße

| d-Wert | Interpretation   |
|--------|------------------|
| 0.2    | geringer Effekt  |
| 0.5    | mittlerer Effekt |
| 0.8    | starker Effekt   |

Wir haben also einen geringen Effekt beobachtet

# Power-Analyse

Bauer Pillenhuber wird verdächtigt, seine Bio-Hühnchen mit Antibiotika vollzudröhnen.  Wir wollen das durch Blutuntersuchungen nachweisen.  

* Es handelt sich um den Vergleich mit einem Referenzwert, also einen verbundenen t-Test
* Er ist einseitig

* Wie viele Tiere müssen untersucht werden?
* Wir erwarten einen starken Effekt, sagen wir d=0.7
* Wir verlangen ein Signifikanzniveau von $\alpha=0.01$, um niemanden zu Unrecht zu verdächtigen

In [None]:
import statsmodels.stats.power as smp   

In [None]:
import seaborn as sns
sns.set_theme()        

In [None]:
poweranalyse = smp.TTestPower()

In [None]:
poweranalyse.power(effect_size=0.7, alpha=0.01, nobs=10)

In [None]:
poweranalyse.plot_power(effect_size=[0.7], alpha=0.01, nobs=np.arange(2,100), 
                         alternative='larger');

Wir sollten 35 Hühner untersuchen

In [None]:
poweranalyse.power(effect_size=0.7, alpha=0.01, nobs=35, alternative='larger')

## Power-Analyse für unverbundene t-Tests

* Sie wollen wissen, ob auf sandigem Boden das Verhältnis von Kiefern zu Fichten ein anderes als auf lehmigem ist
* Sie erwarten einen mittleren Effekt
* Sie wählen den Standardwert $\alpha=0.05$

* Es handelt sich um einen unverbundenen Test
* Sie wählen $n_1$ sandige und $n_2=n_1$ lehmige Waldparzellen aus
* Wie groß müssen $n_1$ und $n_2$ sein?

In [None]:
poweranalyse = smp.TTestIndPower()  # Ind = Independent

In [None]:
poweranalyse.plot_power(effect_size=[0.5], alpha=0.05, nobs=np.arange(2,150));

Sie müssen ca 100 Parzellen von jeder Sorte ansehen, um eine Power von knapp 95% zu erreichen

In [None]:
poweranalyse.power(effect_size=0.5, alpha=0.05, nobs1=100, ratio=1)

* `ratio` ist das Vehältnis $\frac{n_2}{n_1}$
* Man plant eingentlich immer mit `ratio=1`
* Dann kann man diese Angabe bei `poweranalyse.power` weglassen