# Mathematik für Biologiestudierende II

Sommersemester 2024

07.04.2024

&copy; 2024 Prof. Dr. Rüdiger W. Braun 

In [None]:
import numpy as np
import pandas as pd
from scipy import stats
import seaborn as sns
sns.set_theme()

# Heteroskedastizität

* Die ANOVA vergleicht die Varianzen innerhalb der einzelnen Gruppen mit der Varianz im gesamten Datensatz, um die Unterschiede zwischen den Gruppen zu untersuchen
* À priori geht das erstmal nur, wenn die Varianzen innerhalb der Gruppen gleich sind

* Ein Datensatz ist *heteroskedastisch*, wenn die verschiedenen Gruppen unterschiedlich Varianz haben

# Der Levene-Test

Der Levene-Test testet auf Gleichheit der Varianzen

Beispiel:  Meerschweinchenzähne

* Drei Gruppen von Meerschweinchen, je nach täglicher Gabe an Vitamin C
  * kleine Dosis
  * mittlerer Dosis
  * große Dosis
* Nach 42 Tagen wird die Zahnlänge bestimmt

Quelle: The Statistics of Bioassay

In [None]:
small_dose = np.array([
    4.2, 11.5, 7.3, 5.8, 6.4, 10, 11.2, 11.2, 5.2, 7,
    15.2, 21.5, 17.6, 9.7, 14.5, 10, 8.2, 9.4, 16.5, 9.7
])

medium_dose = np.array([
    16.5, 16.5, 15.2, 17.3, 22.5, 17.3, 13.6, 14.5, 18.8, 15.5,
    19.7, 23.3, 23.6, 26.4, 20, 25.2, 25.8, 21.2, 14.5, 27.3
])

large_dose = np.array([
    23.6, 18.5, 33.9, 25.5, 26.4, 32.5, 26.7, 21.5, 23.3, 29.5,
    25.5, 26.4, 22.4, 24.5, 24.8, 30.9, 26.4, 27.3, 29.4, 23
])

Test auf Heteroskedastizität

In [None]:
stats.levene(small_dose, medium_dose, large_dose)

* Der p-Wert ist 0.53.  Hetereskedastizizät kann nicht nachgewiesen werden.

* Wir fahren mit der ANOVA fort

In [None]:
stats.f_oneway(small_dose, medium_dose, large_dose)

* Gabe von Vitamin C hat Einfluss auf das Zahnwachstum
* Als nächstes würde man eine post-hoc Analyse machen

Dasselbe für den Taxi-Datensatz

In [None]:
df = sns.load_dataset('taxis')
dm = df[df.dropoff_borough=='Manhattan'].tip
dx = df[df.dropoff_borough=='Bronx'].tip
dq = df[df.dropoff_borough=='Queens'].tip
db = df[df.dropoff_borough=='Brooklyn'].tip

In [None]:
stats.levene(dm, dx, dq, db)

# Probleme beim Test auf Heteroskedastizität

* Die Nullhypothese beim Levene-Test ist 

> $H_0$:  Die Daten sind homoskedastisch

* Ein Hypothesentest "beweist" nie die Nullhypothese
  * bei starken Indizien dagegen lehnt er sie ab
  * bei starken Indizien dafür behält er sie bei
  * bei unklaren Indizien behält er sie auch bei 

* um zu erkennen, ob der Levene-Test Heteroskedastizität überhaupt erkennen kann, wäre eine Poweranalyse für den Levene-Test nötig, das ist aber unrealistisch

* auch das andere Extrem ist möglich:  Der Stichprobenumfang ist so groß, dass kleine Unterschiede schon signifikant werden

Alternative:

👁️ Eyeballing (engl. für "scharfes Hingucken")

In [None]:
small_dose.std()

In [None]:
medium_dose.std()

In [None]:
large_dose.std()

Für die Taxis:

In [None]:
dm.std()

In [None]:
dq.std()

In [None]:
dx.std()

In [None]:
db.std()

Passende Bilder:

In [None]:
df1 = pd.DataFrame()
df1['standard'] = [small_dose.std(), medium_dose.std(), large_dose.std()]

In [None]:
sns.scatterplot(x = np.arange(3), y = df1.standard);

## Einschub:  Lügen mit Statistik

In [None]:
ax = sns.scatterplot(x=['klein', 'mittel', 'groß'], y=df1.standard)
ax.set_ylim(0,5);

In [None]:
df2 = pd.DataFrame()
df2['standard'] = [dm.std(), db.std(), dx.std(), dq.std()]
ax = sns.scatterplot(x=['Manhattan', 'Brooklyn', 'Bronx', 'Queens'], y = df2.standard)
ax.set_ylim((0, 4));

Grenzwertig

Alternativen zum Levene-Test

* Bartlett-Test `stats.bartlett` (wenn völlig klar ist, dass die Daten normalverteilt sind)
* Brown-Forsyth-Test `stats.levene` mit `center=trimmed` (ähnlich`zum Levene-Test)
* Fligner-Test `stats.fligner` (nicht-parametrisch)

# Alexander-Govern-Test

Wenn die Daten heteroskedastisch, aber normalverteilt sind, dann rechnet man einen Alexander-Govern-Test

In [None]:
stats.alexandergovern(small_dose, medium_dose, large_dose)

In [None]:
stats.alexandergovern(dm, dq, dx, db)

# Post-hoc Analyse

* Der t-Test kann nur gerechnet werden, wenn die Varianzen der zu vergleichenden Datensätze übereinstimmen
* Im heteroskedastischen Fall stimmt das nicht
* Man rechnet dann einen Welch-Test
* In scipy ist der Welch-Test wie folgt implementiert

In [None]:
stats.ttest_ind(a, b, equal_var=False)

* Problem:  Arbeitet nicht mit `MultiComparison` zusammen

In [None]:
# unser erstes Programm

def welch(x, y):
    return stats.ttest_ind(x, y, equal_var=False)

In [None]:
from statsmodels.sandbox.stats.multicomp import MultiComparison

In [None]:
df_dropped = df.dropna()

In [None]:
muc = MultiComparison(df_dropped.tip, df_dropped.dropoff_borough)

In [None]:
muc.allpairtest(welch, method='holm')[0]

Normalverteilt sind die Trinkgelder leider auch nicht:

Auch der Alexander-Govern-Test ist nicht gerechtfertigt