# Mathematik für Biologiestudierende

Wintersemester 2025/26

19.11.2025

&copy; 2025 Prof. Dr. Rüdiger W. Braun 

## Wiederholung (interaktiv)

Gehen Sie auf die Website

* https://pingo.coactum.de

und geben Sie folgende Zugangsnummer ein

* **670719**

oder scannen Sie den QR-Code

![QR-Code](bilder/qr02.png)

## Themen heute


* Binomialtest

In [2]:
import numpy as np
np.set_printoptions(legacy='1.21')
import seaborn as sns
sns.set_theme()
sns.set_context('talk')
import pandas as pd
from scipy import stats  # <--------------  neu hinzugekommen

# Fehler erster und zweiter Art

* *Der Fehler 1. Art* ist die fälschliche Ablehnung der Nullhypothese.
* *Der Fehler 2. Art* ist die fälschliche Beibehaltung der Nullhypothese 

Die Priorität liegt auf der Vermeidung des Fehlers 1. Art.  Diese Asymmetrie ist ein entscheidendes Merkmal der Testtheorie.

|                     | $H_0$ wird beibehalten | $H_0$ wird abgelehnt  |
|---------------------|:----------------------:|:---------------------:|
| $H_0$ **trifft zu** | richtige Entscheidung  | Fehler 1. Art         |
| $H_1$ **trifft zu** | Fehler 2. Art          | richtige Entscheidung |

* Fehlerwahrscheinlichkeit 1. Art soll kleiner sein als das Signifikanzniveau $\alpha$
* Die Komplementärwhrscheinlichkeit der Fehlerwahrscheinlichkeit 2. Art ist die Power

## Ein- und zweiseitige Tests

* Ein ja/nein-Experiment mit unbekannter Erfolgswahrscheinlichkeit $p$ wird $n$-mal wiederholt
* Ziel:  Aussage über $p$ relativ zu einem Referenzwert $p_0$ 
* verschiedene Nullhypothesen sind denkbar
  * $H_0 : p\ge p_0$: einseitiger unterer Test
  * $H_0 : p \le p_0$: einseitiger oberer Test
  * $H_0 : p = p_0$: zweiseitiger Test

* einseitige Tests kennen wir aus der vorigen Lektion
* zweiseitige folgen in dieser

* vorher noch ein einseitiger

#### Beispiel: Mutationen

* In einer Population weist normalerweise jedes 250te Individuum eine gewisse Mutation auf.  
* Bei einer Untersuchung von 2000 Individuen werden nun aber sogar 12 Träger der Mutation gefunden,
* $2000/250=8$, man hätte also 8 Träger von Mutationen erwartet

Zwei Interpretationen sind denkbar

* Eine Steigerung der Mutationshäufigkeit um 50% wurde entdeckt
* Unter 2000 Individuen wurden gerade mal vier Ausreißer entdeckt

#### Statistics to the rescue!

* Bevor wir diese Entdeckung an die Presse geben, wollen wir sicher sein, dass die Mutationsrate tatsächlich gestiegen ist
* Sicherheit ist relativ.  Mit einem Irrtumsrisiko von 5% können wir leben

#### Binomialtest für das Beispiel

* Wir machen einen Binomialtest.  Die Referenzwahrscheinlichkeit ist $p_0 = 0.004$
* Die Nullhypothese ist $H_0 = \{ p \le p_0 \}$
    * Es handelt sich um einen einseitigen, oberen Binomialtest
    * Das Signifikanzniveau beträgt $\alpha = 0.05$

* Der kritische Wert $c$ ist so zu wählen, dass `P.cdf(c-1)`$<1-\alpha$ und `P.cdf(c)`$\ge1-\alpha$

* Entscheidungsregel:
     * Die Nullhypothese wird abgelehnt, falls die Anzahl der Erfolge echt größer als $c$ ist
     * Die Nullhypothese wird beibehalten, falls die Anzahl der Erfolge höchstens $c$ ist

In [4]:
P = stats.binom(2000, 0.004)
alpha = 0.05

In [5]:
P.ppf(1-alpha)

13.0

#### Mutation: Entscheidung

* Die Rechnung ergibt $c = 13$
* Bei bis zu 13 Erfolgen (einschließlich) wird die Nullhypothese beibehalten
* Wir haben nur 12 Mutationen beobachtet:  Nullhypothese wir beibehalten
* Keine signifikante Erhöhung beobachtet

# Maschinelle Auswertung und der *p*-Wert

# Der *p*-Wert

* Der $p$-Wert ist das kleinste Signifikanzniveau, zu dem die Daten den Test noch bestehen würden.
* Der $p$-Wert beantwortet die Frage
>  Wie knapp wurde das vorgeschriebene Signifikanzniveau eingehalten bzw. verfehlt?
* Wenn $\alpha$ das Signifikanzniveau ist
  * $p \le \alpha$: Nullhypothese wird abgelehnt 
  * $p > \alpha$: Nullhypothese wird beibehalten

Software gibt immer den $p$-Wert aus

In [8]:
res = stats.binomtest(12, 2000, 0.004, alternative="greater")
res

BinomTestResult(k=12, n=2000, alternative='greater', statistic=0.006, pvalue=0.1114898591368222)

In [9]:
res.pvalue

0.1114898591368222

In [10]:
res.statistic

0.006

In [11]:
res.statistic == 12/2000

True

Der Begriff der Teststatistik spielt erst bei den später zu besprechenden Tests eine Rolle

> `stats.binomtest(k, n, p0, alternative)`

* `k` ist die beobachtete Anzahl
* `n` ist der Stichprobenumfang
* `p0` ist die Referenzwahrscheinlichkeit
* `alternative` legt fest, ob ein oberer, unterer oder zweiseitiger Test gerechnet wird
  * `alternative="greater"` bedeutet:  oberer Test
  * `alternative="less"` bedeutet: unterer Test
  * `alternative="two-sided"` bedeutet:  zweiseitiger Test
  * keine Angabe:  zweiseitiger Test

### Alternative

* `alternative="greater"` heißt:  wir behaupten, dass die tatsächliche Erfolgswahrscheinlichkeit größer als die Referenzwahrscheinlichkeit istm

#### Power des Tests

* Wir wollen eine Erhöhung der Mutationsrate um 50%, also von $p_0=0.004$ auf $p=0.006$ entdecken
* Was ist dann die Power des Tests?
* Die Power ist die Wahrscheinlichtkeit für die richtige Entscheidung, wenn die Alternative tatsächlich zutrifft

* $H_0$ wird abgelehnt bei mindestens 14 Erfolgen

In [12]:
Q = stats.binom(2000, 0.006)

* Wenn 13 oder weniger Erfolge beobachtet werden, mache ich den Fehler zweiter Art
* Also ist die Fehlerwahrscheinlichkeit zweiter Art gleich

In [13]:
Q.cdf(13)

0.6818540941767756

und die Power ist gleich

In [14]:
1 - Q.cdf(13)

0.31814590582322444

## Zweiseitiger Binomialtest zum Niveau  $\alpha$

* Gegeben sind unabhängige $B(1, p)$-verteilte Zufallsvariable $X_1, \dots, X_n$ mit unbekanntem $p$ sowie ein Signifikanzniveau $\alpha$
* Verglichen werden soll mit einem Referenzwert $p_0$
* Getestet wird die Nullhypothese $H_0 = \{p = p_0\}$ gegen die Alternative $H_1 = \{p \ne p_0\}$
* `P` ist die Binomialverteilung $B_{n,p_0}$

* Der *untere kritische Wert* $c_1$ ist so zu wählen, dass `P.cdf(c1 - 1)`$\le\frac\alpha2$ und `P.cdf(c1)`$>\frac\alpha2$

* Der *obere kritische Wert* $c_2$ ist so zu wählen, dass `P.cdf(c2 - 1)`$<1-\frac\alpha2$ und `P.cdf(c2)`$\ge1-\frac\alpha2$

Der zweiseitige Binomialtest besteht also aus einem unteren und einem oberen einseitigen Binomialtest, die aber beide zum halben Signifikanzniveau durchgeführt werden

#### Zweiseitiger Binomialtest, Beispiel

* Bei 250 Würfen eines Würfels fiel 55 mal eine Sechs.  Kann man zu 95% sicher sein, dass der Würfel gezinkt ist?
* Sei $p$ die unbekannte Wahrscheinlichkeit des Würfels für eine Sechs
* Zweiseitiger Binomialtest mit
  * Nullhypothese: $H_0 = \left\{ p = \frac16 \right\}$
  * Alternative: $H_1 = \left\{ p \ne \frac16 \right\}$
  * Signifikanzniveau ist $\alpha = 0.05$

In [17]:
P = stats.binom(250, 1/6)
alpha = 0.05

In [18]:
c1 = P.ppf(alpha/2)
c1

30.0

In [19]:
c2 = P.ppf(1-alpha/2)
c2

54.0

Punktrechnung vor Strichrechnung

Achtung:  keine Seite der HHU: https://www.spiegel.de/spiegel/print/index-2023.html

#### Beispiel, Fortsetzung

* $c_1 = 30$ und $c_2 = 54$
* Die Nullhypothese kann zum Niveau $\alpha = 0.05$ abgelehnt werden, wenn höchstens 29 oder mindestens 55 Sechsen fallen
* Bei 55 Sechsen kann die Nullhypothese also abgelehnt werden
* Wir können mit 95% Sicherheit sagen, dass der Würfel gezinkt ist

<img src="https://www.math.uni-duesseldorf.de/~braun/bio2526/b250.svg" alt="Fehler zweiter Art für das Würfelbeispiel" width="55%"/>

Orange Balken zeigen Fehlentscheidungen

### *p*-Wert des zweiseitigen Tests

In [20]:
res = stats.binomtest(55, 250, 1/6)  # "zweiseitig" ist die Standardeinstellung
res.pvalue

0.02718643157092374

### Power des zweiseitigen Tests

* Wir wollen erkennen können, wenn der Würfel so stark gezinkt ist,  dass die Wahrscheinlichkeit für eine Sechs 20% beträgt.  Was ist dann die Power des Tests?

* Die Wahrscheinlichkeit der richtigen Entscheidung ist
$$  \sum_{k=0}^{29} B_{250,\,0.2}(k) + \sum_{k=55}^{250} B_{250,\,0.2}(k) $$

In [21]:
Q = stats.binom(250, 0.2)

In [22]:
erste_summe = Q.cdf(29)
erste_summe

0.0002997560505954973

In [23]:
zweite_summe = 1 - Q.cdf(54)
zweite_summe

0.2359822558674649

In [24]:
power = erste_summe + zweite_summe
power

0.2362820119180604