# Mathematik für Biologiestudierende

Wintersemester 2023/24

22. November 2023

&copy; 2023 Prof. Dr. Rüdiger W. Braun 

## Binomialverteilung

## Binomialverteilung

* $B_{n,p}(k)$ ist die Wahrscheinlichkeit von genau $k$ Erfolgen, wenn ein ja/nein-Experiment mit     Erfolgswahrscheinlichkeit $p$ genau $n$-mal unabhängig wiederholt wird
$$
      B_{n,p}(k) =
      \begin{pmatrix}
        n \\ k
      \end{pmatrix}
      \cdot p^k \cdot (1-p)^{n-k} $$
* $B_{n,p}$ bezeichnet man als *Binomialverteilung*

# Beispiel Parasiten

Bestimmte Fische erkranken mit 15% Wahrscheinlichkeit an einem Parasiten.

Wir beobachten 47 Fische.  Mit welcher Wahrscheinlichkeit erkranken genau 5 Fische?

\begin{align*}
    B_{47, 0.15}(5)
    &= \begin{pmatrix}  47 \\ 5 \end{pmatrix} \cdot 0.15^5 \cdot 0.85^{42} \\
    &= 1533939 \cdot 0.0000759375 \cdot \cdot 0.0018541 \\
    &= 0.126433
\end{align*}

In [None]:
from scipy import stats

In [None]:
P = stats.binom(47, 0.15)

In [None]:
P.pmf(5)

# Kumulierte Verteilung

Die interessantere Frage ist:  Mit welcher Wahrscheinlichkeit erkranken höchstens 5 Fische?

| $$k$$    | $$B_{47, 0.15}(k)$$ |
|----------|---------------------|
| 0        | 0.00048             |
| 1        | 0.00399             |
| 2        | 0.01621             |
| 3        | 0.04292             |
| 4        | 0.08331             |
| 5        | 0.12643             |
| $$\sum$$ | 0.27335             |

* Das ist umständlich.
* Mit `P.cdf` erhält man die kumulierten Werte der Binomialverteilung

"cdf": cumulative function

In [None]:
P = stats.binom(47, 0.15)   # an dieser Stelle redundant

In [None]:
P.cdf(5)

<img src="bilder/bar47.svg" alt="Graph der Binomialverteilung B(47, 0.15)" width="150%"/>

Wir haben die orange Fläche im Bild ausgerechnet.

Mit welcher Wahrscheinlichkeit erkranken mindesten 6 Fische?

* "Mindestens 6" ist das Gegenteil von "höchstens 5"
* Antwort $1-0.27335 = 0.72665$

## Fische in saubererem Wasser

* Es gelingt, die Erkrankungsraten der Fische um 5 Prozentpunkte auf 80% zu senken 
* Wie hoch ist nun die Wahrscheinlichkeit, dass höchstens 5 Fische erkranken?

In [None]:
P = stats.binom(47, 0.10)
P.cdf(5)

<img src="bilder/bar47_b.svg" alt="Graph der Binomialverteilung B(47, 0.10)" width="150%"/>

# Beispiel zur Binomialverteilung: $L$-Bakterien

* Chiralität:  Manche Moleküle kommen bei gleicher chemischer Zusammensetzung in zwei verschiedenen geometrischen Formen vor.  Man bezeichnet dann eine von beiden als ``rechtsdrehend'', die andere als ``linksdrehend''
* Von einem bestimmten Bodenbakterium gibt es zwei Varianten, je nachdem ob ein bestimmtes Molekül in der linksdrehenden oder der rechtsdrehenden Version bevorzugt aufgenommen wird.  Wir nennen die beiden Varianten $L$-Bakterium und $R$-Bakterium.  

* In ungestörtem Boden befinden sich 75% $L$-Bakterien und 25% $R$-Bakterien.  

* Die Bakterien werden einem Pestizid ausgesetzt.  Nach einigen Generationen werden die Nachkommen getestet, ob sie rechts- oder linksdrehende Varianten aufnehmen
* 13 der 27 Nachkommen sind $R$-Bakterien.  Ist dieses Ergebnis so ungewöhnlich, dass man einen Einfluss des Pestizids vermuten muss?

## $L$-Bakterien: Fortsetzung 

* Mit Wahrscheinlichkeit
    \begin{equation*}
      B_{27,\,0.75}(14) =
      \begin{pmatrix}
        27 \\
        14
      \end{pmatrix}
      \cdot 0.75^{14} \cdot 0.25^{13}
      = 0.005326
    \end{equation*}
    sind 14 von 27 Bakterien $L$-Bakterien
* Das ist aber nicht die richtige Frage.

## $L$-Bakterien: Fortsetzung

* Wenn weniger als 14 der Bakterien $L$-Bakterien gewesen wären, hätten wir das noch ungewöhnlicher gefunden
* Wir suchen also die Wahrscheinlichkeit, dass von 27 Bakterien **höchstens** 14 $L$-Bakterien sind,
* d. h. wir suchen
    \begin{equation*}
      \sum_{k=0}^{14} B_{27,\,0.75}(k)
    \end{equation*}
* Wir suchen also einen kumulierten Wert der Binomialverteilung

In [None]:
P = stats.binom(27, 0.75)
P.cdf(14)

# Versuchsplanung

## Extinktionsexperiment

* Ein Extinktionsexperiment wird geplant, bei dem die Versuchstiere eine einmal erlernte Aufgabe wieder verlernen   sollen.  Dazu sollen zuerst mindestens 50 Tiere diese Handlung erlernen.  Aus früheren Versuchen weiß man, dass dies nur bei 80% der Versuchstiere gelingt. 

* Wenn man also zu Beginn der Verlernphase 50 Tiere haben will, welche die Aufgabe gelernt haben, dann muss man deutlich mehr als diese 50 Tiere trainieren.
* Wie viele?

* Hier muss man zweistufig vorgehen:  Für jedes feste $n$ schaut man nach, wie hoch die Wahrscheinlichkeit ist, dass 50 oder mehr Tiere die Aufgabe erlernt haben.  Als Antwort gibt man das kleinste $n$, bei dem diese Wahrscheinlichkeit groß genug ist.

* Wie viele Versuchstiere werden benötigt, damit mit einer Wahrscheinlichkeit von mindestens 90% die Zahl der Versuchstiere, welche die Aufgabe gelernt haben, mindestens gleich 50 ist?

In [None]:
P = stats.binom(100, 0.80)
P.cdf(49)   # muss kleiner 0.1  sein

In [None]:
P = stats.binom(50, 0.80)
P.cdf(49)  

In [None]:
P = stats.binom(70, 0.80)
P.cdf(49)  

In [None]:
P = stats.binom(65, 0.80)
P.cdf(49)   

In [None]:
P = stats.binom(68, 0.80)
P.cdf(49)   # muss kleiner 0.5  sein

In [None]:
P = stats.binom(67, 0.80)
P.cdf(49)   # muss kleiner 0.5  sein

Wir brauchen 68 Tiere

Und wir können das mit `python` ausrechnen, ohne eine `for`-Schleife zu programmieren

Geht auch grafisch mit `seaborn`

In [None]:
import seaborn as sns
import numpy as np

In [None]:
k = np.arange(50, 80)
P = stats.binom(k, 0.80)
B = P.cdf(49)

In [None]:
ax = sns.scatterplot(x=k, y=B)
ax.grid(True)