# Mathematik für Biologiestudierende

Wintersemester 2025/26

19.11.2025

&copy; 2025 Prof. Dr. Rüdiger W. Braun 

## Wiederholung (interaktiv)

Gehen Sie auf die Website

* https://pingo.coactum.de

und geben Sie folgende Zugangsnummer ein

* **670719**

oder scannen Sie den QR-Code

![QR-Code](bilder/qr02.png)

## Themen heute


* Kochrezepte für Binomialtests
* Der *p*-Wert
* Power eines Tests

In [1]:
import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd
from scipy import stats  # <--------------  neu hinzugekommen

# Fehler erster und zweiter Art

* *Der Fehler 1. Art* ist die fälschliche Ablehnung der Nullhypothese.
* *Der Fehler 2. Art* ist die fälschliche Beibehaltung der Nullhypothese 

Die Priorität liegt auf der Vermeidung des Fehlers 1. Art.  Diese Asymmetrie ist ein entscheidendes Merkmal der Testtheorie.

|                     | $H_0$ wird beibehalten | $H_0$ wird abgelehnt  |
|---------------------|:----------------------:|:---------------------:|
| $H_0$ **trifft zu** | richtige Entscheidung  | Fehler 1. Art         |
| $H_1$ **trifft zu** | Fehler 2. Art          | richtige Entscheidung |

* Fehlerwahrscheinlichkeit 1. Art soll kleiner sein als das Signifikanzniveau $\alpha$
* Die Komplementärwhrscheinlichkeit der Fehlerwahrscheinlichkeit 2. Art ist die Power

# Kochrezepte für Binomialtests

# Ein- und zweiseitige Tests

* Ein ja/nein-Experiment mit unbekannter Erfolgswahrscheinlichkeit $p$ wird $n$-mal wiederholt
* Ziel:  Aussage über $p$ relativ zu einem Referenzwert $p_0$ 
* verschiedene Nullhypothesen sind denkbar
  * $H_0 : p \ge p_0$: einseitiger unterer Test
  * $H_0 : p \le p_0$: einseitiger oberer Test
  * $H_0 : p = p_0$: zweiseitiger Test
* Die Nullhypothese $H_0 \colon p \ne p_0$ macht keinen Sinn

## Einseitiger unterer Binomialtest zum Niveau  $\alpha$

* Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
* Verglichen werden soll mit einem Referenzwert $p_0$
* Getestet wird die Nullhypothese $H_0 = \{p \ge p_0\}$ gegen die Alternative $H_1 = \{p < p_0\}$
* `P` ist die Binomialverteilung $B_{n,p_0}$
* Der Wert $c$ ist so zu wählen, dass `P.cdf(c-1)`$\le\alpha$ und `P.cdf(c)`$>\alpha$
* $c$ heißt *kritischer Wert*

### Entscheidungsregel:

* Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt kleiner als $c$ ist
* Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge mindestens $c$ ist

#### Beispiel zum unteren Binomialtest

* 20% der Fahrradfahrerinnen und Fahrradfahrer haben eine defekte Lichtanlage
* Die Polizei startet eine Aufklärungskampagne
* Nach Ablauf der Kampagne werden 100 Fahrräder kontrolliert, um die folgende Frage zum Signifikanzniveau $\alpha=0.02$ zu beantworten

>  Ist der Anteil der Fahrräder mit defekter Lichtanlage gefallen

* Referenzwahrscheinlichkeit $p_0 = 0.2$
* Nullhypothese $H_0 = \{p \ge p_0\}$
* Binomialverteilung

In [2]:
P = stats.binom(100, 0.2)

* kritischer Wert $c$ bestimmt durch `P.cdf(c-1)` &leq; 0.02 und `P.cdf(c)` > 0.02

In [3]:
c = P.ppf(0.02)
c

12.0

Probe:

In [4]:
P.cdf(11)

0.012574876348121796

In [5]:
P.cdf(12)

0.02532875322139711

Wenn 11 oder weniger Fahrräder eine defekte Lichtanlage haben, dann ist der Nachweis der Wirksamkeit der Aktion zum Signifikanzniveau $\alpha=0.02$ gelungen

## Einseitiger oberer Binomialtest zum Niveau $\alpha$

* Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein
Signifikanzniveau $\alpha$
* Verglichen werden soll mit einem Referenzwert $p_0$
* Getestet wird die Nullhypothese $H_0 = \{p \le p_0\}$ gegen die Alternative $H_1 = \{p > p_0\}$
* `P` ist die Binomialverteilung $B_{n,p_0}$
* Der kritische Wert $c$ ist so zu wählen, dass `P.cdf(c-1)`$<1-\alpha$ und `P.cdf(c)`$\ge1-\alpha$

### Entscheidungsregel:

* Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
* Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist

#### Beispiel: Mutationen

* In einer Population weist normalerweise jedes 250te Individuum eine gewisse Mutation auf.  
* Bei einer Untersuchung von 2000 Individuen werden nun aber sogar 12 Träger der Mutation gefunden,
* $2000/250=8$, man hätte also 8 Träger von Mutationen erwartet

Zwei Interpretationen sind denkbar

* Eine Steigerung der Mutationshäufigkeit um 50% wurde entdeckt
* Unter 2000 Individuen wurden gerade mal vier Ausreißer entdeckt

#### Statistics to the rescue!

* Bevor wir diese Entdeckung an die Presse geben, wollen wir sicher sein, dass die Mutationsrate tatsächlich gestiegen ist
* Sicherheit ist relativ.  Mit einem Irrtumsrisiko von 5% können wir leben

#### Binomialtest für das Beispiel

* Wir machen einen Binomialtest.  Die Referenzwahrscheinlichkeit ist $p_0 = 0.004$
* Die Nullhypothese ist $H_0 = \{ p \le p_0 \}$
    * Es handelt sich um einen einseitigen, oberen Binomialtest
    * Das Signifikanzniveau beträgt $\alpha = 0.05$

* Der kritische Wert $c$ ist so zu wählen, dass `P.cdf(c-1)`$<1-\alpha$ und `P.cdf(c)`$\ge1-\alpha$

* Entscheidungsregel:
     * Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
     * Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist

In [6]:
P = stats.binom(2000, 0.004)
alpha = 0.05

In [7]:
c = P.ppf(1-alpha)
c

13.0

Probe:

In [8]:
P.cdf(c-1)   #  muss kleiner als 0.95 sein

0.9365883630330971

In [9]:
P.cdf(c)   #  muss größer als 0.95 sein

0.9661155504516327

#### Mutation: Entscheidung

* Die Rechnung ergibt $c = 13$
* Bei bis zu 13 Erfolgen (einschließlich) wird die Nullhypothese beibehalten
* Wir haben nur 12 Mutationen beobachtet:  Nullhypothese wir beibehalten
* Keine signifikante Erhöhung beobachtet

# Maschinelle Auswertung und der *p*-Wert

# Der *p*-Wert

* Der $p$-Wert ist das kleinste Signifikanzniveau, zu dem die Daten den Test noch bestehen würden.
* Der $p$-Wert beantwortet die Frage
>  Wie knapp wurde das vorgeschriebene Signifikanzniveau eingehalten bzw. verfehlt?
* Wenn $\alpha$ das Signifikanzniveau ist
  * $p \le \alpha$: Nullhypothese wird abgelehnt 
  * $p > \alpha$: Nullhypothese wird beibehalten

Software gibt immer den $p$-Wert aus

In [10]:
res = stats.binomtest(12, 2000, 0.004, alternative="greater")
res

BinomTestResult(k=12, n=2000, alternative='greater', statistic=0.006, pvalue=0.1114898591368222)

In [11]:
res.pvalue

0.1114898591368222

In [12]:
res.statistic

0.006

In [13]:
res.statistic == 12/2000

True

Der Begriff der Teststatistik spielt erst bei den später zu besprechenden Tests eine Rolle

> `stats.binomtest(k, n, p0, alternative)`

* `k` ist die beobachtete Anzahl
* `n` ist der Stichprobenumfang
* `p0` ist die Referenzwahrscheinlichkeit
* `alternative` legt fest, ob ein oberer, unterer oder zweiseitiger Test gerechnet wird
  * `alternative="greater"` bedeutet:  oberer Test
  * `alternative="less"` bedeutet: unterer Test
  * `alternative="two-sided"` bedeutet:  zweiseitiger Test
  * keine Angabe:  zweiseitiger Test

### Alternative

* `alternative="greater"` heißt:  wir behaupten, dass die tatsächliche Erfolgswahrscheinlichkeit größer als die Referenzwahrscheinlichkeit ist

# Power und Fehlerwahrscheinlichkeit zweiter Art

Wir fassen das Experiment mit den Mutationen noch einmal zusammen:

* 2000 Individuen
* Referenzwahrscheinlichkeit $p_0=0.004$
* Signifikanzniveau $\alpha=0.05$
* Nullhypothese $H_0=\{p \le p_0\}$
* $c=13$
* Die Nullhypothese wird abgelehnt bei 14 oder mehr Mutationen

* Wie groß ist bei diesem Test die Fehlerwahrscheinlichkeit zweiter Art?

* Das ist keine gute Frage
* Wenn die Wahrscheinlichkeit einer Mutation nur um ein Winziges steigt, dann ist das praktisch nicht nachzuweisen
* Sinnvoll ist folgende Frage

>  Angenommen, die Mutationswahrscheinlichkeit steigt von 0.4% auf 0.6%, mit welcher Wahrscheinlichkeit wird unser Test diese Änderung entdecken?

* Wenn $q$ die Fehlerwahrscheinlichkeit zweiter Art ist, dann bezeichnet man $ 1 - q $ als *Power* des Tests
* Die Power hängt also davon ab, welche Annahme man über den Abstand zwischen Nullhypothese und Alternative macht

#### Power des Tests

* Wir wollen eine Erhöhung der Mutationsrate um 50%, also von $p_0=0.004$ auf $p=0.006$ entdecken
* Was ist dann die Power des Tests?
* Die Power ist die Wahrscheinlichtkeit für die richtige Entscheidung, wenn die Alternative tatsächlich zutrifft

* $H_0$ wird abgelehnt bei mindestens 14 Erfolgen

In [14]:
Q = stats.binom(2000, 0.006)  #  W'keit unter der Alternative

* Wenn 13 oder weniger Erfolge beobachtet werden, mache ich den Fehler zweiter Art
* Also ist die Fehlerwahrscheinlichkeit zweiter Art gleich

In [15]:
Q.cdf(13)

0.6818540941767756

und die Power ist gleich

In [16]:
1 - Q.cdf(13)

0.31814590582322444

## Poweranalyse

* Vor der Durchführung eines Experiments sollte man sich überzeugen, dass der Test ausreichende Power hat.  Es besteht sonst die Gefahr, dass die Alternative nicht nachgewiesen werden kann, obwohl sie zutrifft

* Ein Test kann nie die Nullhypothese zeigen.  Wenn die Power groß ist, dann ist die Beibehaltung der Nullhypothese aber ein Indiz ihrer Korrektheit