# Mathematik für Biologiestudierende II

Sommersemester 2025

08.04.2025

&copy; 2025 Prof. Dr. Rüdiger W. Braun 

In [1]:
import numpy as np
np.set_printoptions(legacy='1.21')
from scipy import stats
import pandas as pd
import seaborn as sns
sns.set_theme()

# Themen

* Diversitätsindex nach Simpson
* Data Snooping
* Multiples Testen

# Diversitätsindex nach Simpson

## Wahrscheinlichkeit

* Wahrscheinlichkeitsverteilungen sind Modellannahmen

* Beispielsweise wollen wir in der Statistik die Wahrscheinlichkeit einer falschen Antwort minimieren

#### Diversitätsindex

Beispiel:  Wir haben zwei Bienenpopulationen aus je 1000 Individuen

* Population 1 umfasst 900 Honigbienen, 80 rote Mauerbienen und 20 Löcherbienen
* Population 2 umfasst 600 rote und 400 gehörnte Mauerbienen

Welche von beiden Artengemeinschaften hat die größere Artenvielfalt?

* Der *Diversitätsindex* nach Simpson ist die Wahrscheinlichkeit, dass zwei aus einer Artengemeinschaft zufällig ausgewählte Individuen derselben Art angehören.  

* Je kleiner er ist, umso größer ist die Diversität.

* Es gibt auch noch andere Definitionen des Diversitätsindex.  Wir verwenden immer die von Simpson.

### Beispiel Population 1

Es gibt

In [2]:
gesamt = 1000 * 999
gesamt

999000

Paare verschiedener Bienen

Es gibt

In [3]:
honig = 900*899
honig

809100

Paare von Honigbienen

Es gibt

In [4]:
mauer = 80*79
mauer

6320

Paare von Mauerbienen

Es gibt

In [5]:
loecher = 20*19
loecher

380

Paare von Löcherbienen

Das bedeutet, dass es 

In [6]:
paare_gleich_pop1 = honig + mauer + loecher
paare_gleich_pop1

815800

Paare gibt, bei denen beide Bienen der selben Art angehören

Der Diversitätsindex ist

In [7]:
d1 = paare_gleich_pop1 / gesamt
d1

0.8166166166166167

### Jetzt dasselbe für die andere Population

Es gibt

In [8]:
rot = 600*599
rot

359400

Paare von roten Mauerbienen

Es gibt

In [9]:
gehoernt = 400*399
gehoernt

159600

Paare von gehörnten Mauerbienen

Also gibt es 

In [10]:
paare_gleich_pop2 = rot + gehoernt
paare_gleich_pop2

519000

Paare, bei denen beide Bienen der selben Art angehören

Der Diversitätsindex der zweiten Population beträgt 

In [11]:
d2 = paare_gleich_pop2 / gesamt
d2

0.5195195195195195

Nach Simpson ist die zweite Artengemeinschaft diverser als die erste.

# Data Snooping 

Wir kommen zurück zur schließenden Statistik

* "Snooping" = "Schnüffeln"
* Data Snooping bedeutet, dass man den Test für dieselben Daten rechnet, die man auch für die Formulierung der Hypothese benutzt hat 

* Jemand stellt fest, dass in einer Stadt von 50 Neugeborenen 35 weiblich sind.
* Wir machen den entsprechenden Binomialtest

In [13]:
stats.binomtest?

In [12]:
stats.binomtest(35, 50)

BinomTestResult(k=35, n=50, alternative='two-sided', statistic=0.7, pvalue=0.006600447966810918)

* Die Nullhypothese, dass die Wahrscheinlichkeiten von Jungs- und Mädchengeburten gleich sind, kann abgelehnt werden.  Der $p$-Wert beträgt $0.0066$



* Was bedeutet das?



### Szenario 1

* *Theorie:* Bekanntlich werden die Babies von den Weißstörchen gebracht.  Eine neue Theorie besagt, dass Schwarzstörche das zwar auch tun, aber nicht im korrekten Geschlechterverhältnis.
* *Vorgehen:* Die Forscher wählen daher einen Ort mit einer großen Population an Schwarzstörchen aus und untersuchen dort das Verhältnis von Mädchen- zu Jungsgeburten.
* *Bewertung:* Wenn dort das Zahlenverhältnis 35:15 beträgt, ist die Theorie zum Signifikanzniveau $p = 0.0066$ bestätigt.

## Szenario 2

* *Theorie:* Keine.  Man will bloss mal gucken.
* *Vorgehen:* In 100 Gemeinden mit mehr als 50 Geburten wird das Verhältnis zwischen Mädchen- und Jungsgeburten untersucht. Tatsächlich findet sich eine Gemeinde mit dem Zahlenverhältnis 35:15
* *Bewertung:* Das ist **Data Snooping**, weil die Hypothese aus denselben Daten generiert worden ist, mit denen anschließend der Test gerechnet wird.

### Warum ist Data Snooping schlecht?

* Wir haben ein Experiment, welches nur mit einer Wahrscheinlichkeit $ p = 0.0066 $ gelingt.
* Wir wiederholen dieses Experiment 100 mal.

Mit welcher Wahrscheinlichkeit gelingt das Experiment in mindestens einem dieser Fälle?

Das ist eine Wiederholung eines ja/nein-Experiments mit folgenden Daten

* Erfolgswahrscheinlichkeit im Einzelfall $p=0.0066$
* Stichpropenumfang $n=100$

Zugehörige Binomialverteilung

In [15]:
P = stats.binom(100, 0.0066)

Wahrscheinlichkeit, dass es keinen einzigen Erfolg gibt

In [16]:
p0 = P.pmf(0)
p0

0.5157218904013275

Wahrscheinlichkeit, dass es mindestens einen Erfolg gibt

In [17]:
1 - p0

0.48427810959867246

#### Fazit

Wenn ein Test, der nur mit Wahrscheinlichkeit 0.0066 ein überraschendes Ergebnis bringt, 100 mal wiederholt wird, dann ist die Wahrscheinlichkeit mindestens eines überraschendenen Ergebnisses fast gleich 50%

## Multiple Vergleiche

Möglichkeiten für korrektes Vorgehen 

* Versuchsplanung
  * Pilotversuch

* statistische Verfahren
  * Bonferroni-Korrektur
  * Bonferroni-Holm-Korrektur
  * False Discovery Rate

# Bonferroni-Korrektur

* Wenn man simultan $n$ Vergleiche durchführt, dann schreibt die Bonferroni-Korrektur vor, dass man jeden einzelnen Vergleich zum Signifikanzniveau $\frac\alpha n$ durchführt, um insgesamt das Signifikanzniveau $\alpha$ zu erreichen

* Im Beispiel der Schwarzstörche hätte für jeden Einzeltest das Signifikanzniveau $\frac{0.05}{100} =  0.0005$ gewählt werden müssen

## Bonferroni-Holm-Korrektur 

erkläre ich, nachdem ich die Bonferroni-Korrektur für die ANOVA vorgemacht habe

## False Discovery Rate

* Beispiel Bilddaten: 20 Magnetresonanztomographie-Aufnahmen (MRT) von gesunden Gehirnen und 20 MRT-Aufnahmen von erkrankten Gehirnen, wobei die Gehirne auf einen Standardatlas normalisiert werden
* In dem Standardatlas werden alle Voxel (3D-Pixel) markiert, bei denen der Eisengehalt der Gruppe der Erkrankten signifikant über dem der Gruppe der Gesunden liegt

* Wenn der Bildausschnit $100 mm \times 100mm \times 100mm$ beträgt und die Auflösung des MRT bei 1.5mm liegt, dann haben wir

In [18]:
100/1.5

66.66666666666667

Voxel für eine Seitenlänge, also insgesamt

In [19]:
66 * 66 * 66

287496

d.h. knapp 290000 Voxel.  Damit ist eine Bonferroni-Korrektur undenkbar.

* Alternative: False Discovery Rate
* FDR von 1% sagt: im Schnitt sind nur 1% aller markierten Voxel falsch
* Zum Vergleich: Ein multipler Test zum Signifikanzniveau 5% sagt: Die Wahrscheinlichkeit, dass auch nur ein einziges Voxel zu Unrecht markiert ist, beträgt höchstens 5%

# Gruppenvergleiche

* An fünf verschiedenen Messstellen wurde die Konzentration eines Schadstoffs gemessen
* Hat die Messstelle einen Einfluss auf die Konzentration?

* Wir könnten die Konzentrationen an je zwei Messstellen vergleichen
* Das sind $\begin{pmatrix} 5 \\ 2 \end{pmatrix} = 10$ Vergleiche
* Wir müssen dann entsprechend Bonferroni korrigieren

* nicht optimal
* Solche Gruppenvergleichesind das Einsatzgebiet der ANOVA
* ANOVA = Analysis of Variance