# Mathematik für Biologiestudierende

Wintersemester 2023/24

17.01.2024

&copy; 2024 Prof. Dr. Rüdiger W. Braun 

# Standard-Normalverteilung

* Die Dichte der Standardnormalverteilung ist die *Gaußsche Glockenkurve*
$$  \varphi(x) = \frac1{\sqrt{2\pi}} \exp\!\left( -\frac{x^2}2 \right)  $$
* Die Verteilungsfunktion ist
$$   \Phi(u) = \frac1{\sqrt{2\pi}} \int_{-\infty}^u \exp\!\left( -\frac{x^2}2 \right) dx $$
* Eine explizitere Formel gibt es nicht

In [None]:
from scipy import stats
Phi = stats.norm()   # Normalverteilung
Phi.cdf(-1.8)

## Normalverteilung

* Die Standard-Normalverteilung ist nicht flexibel genug
* Wir benötigen Varianten
* diese unterscheiden sich in Erwartungswert und Varianz

# Erwartungswert einer kontinuierlichen Zufallsvariablen

* Der Erwartungswert einer diskreten Zufallsvariablen $X$ ist definiert als
$$  E(X) = \sum_k k \cdot P(X=k)    $$ 
  wobei $k$ alle möglichen Werte von $X$ durchläuft

* Der Erwartungswert einer kontinuierlichen Zufallsvariablen $X$ mit Dichte $f$ ist definiert als
$$  E(X) = \int x \cdot f(x)\; dx  $$
wobei sich der Integrationsbereich über alle möglichen Werte von $X$ erstreckt

# Varianz einer kontinuierlichen Zufallsvariablen

* Die Varianz einer diskreten Zufallsvariablen X ist definiert als
$$ \text{Var}(X) = \sum_{k} (k-\mu)^2 P(X=k)  $$
wobei $\mu = E(X) $ und $k$ alle möglichen Werte von $X$ durchläuft

* Die Varianz einer kontinuierlichen Zufallsvariablen $X$ mit Dichte $f$ ist definiert als
$$  \text{Var}(X) = \int (x-\mu)^2 \cdot f(x)\; dx  $$
  wobei $\mu=E(X)$  und der Integrationsbereich sich über alle möglichen Werte von $X$ erstreckt

## Streuung

Die Standardabweichung oder Streuung eine Zufallsvariablen ist die Quadratwurzel aus der Varianz

$$ \sigma(X) = \sqrt{\text{Var}(X)} $$

# Erwartungswert und Streuung der Standard-Normalverteilung

Die Zufallsvariable $X$ sei standard-normalverteilt
* $E(X) = 0$
* $\text{Var}(X) = 1$

In [None]:
P = stats.norm()
P.mean()

In [None]:
P.var()

Streuung (engl.: standard deviation)

In [None]:
P.std()

Es gelten dieselben Rechenregeln wie im diskreten Fall

## Rechenregeln für den Erwartungswert ##

* Für jede Zahl $c$ und jede Zufallsvariable $X$ ist $E(c \cdot X) = c \cdot E(X)$
* Für Zufallsvariablen $X_1, \dots, X_n$ ist $E(X_1 + \dots + X_n) = E(X_1) + \dots + E(X_n)$
* $X$ und $Y$ **unabhängige** Zufallsvariable.  Dann
$$   E(X \cdot Y) = E(X) \cdot E(Y)  $$

## Rechenregeln für die Varianz

* Für jede Zahl $a$ und jede Zufallsvariable $X$ gilt $\text{Var}(a + X) = \text{Var}(X)$
* Für jede Zahl $c$ und jede Zufallsvariable $X$ gilt $\text{Var}(c \cdot X) = c^2 \cdot \text{Var}(X)$
* $X$ und $Y$ **unabhängige** Zufallsvariable.  Dann
$$     \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)  $$

# Normalverteilungen

* Die Zufallsvariable $X$ heißt *normalverteilt* zum Erwartungswert $\mu$ und der Varianz $\sigma^2$, wenn 
$$       Y = \frac{X-\mu}\sigma  $$
  standard-normalverteilt ist.  Man sagt dann, $X$ sei $N(\mu, \sigma^2)$-verteilt

* Normalverteilungen werden beispielsweise zur Modellierung von Messfehlern benutzt
* Normalverteilungen können
  \end{itemize}

## Umrechnung auf Standardnormalverteilung

Die Zufallsvariable $X$ sei $N(\mu, \sigma^2)$-verteilt.  Dann ist $\displaystyle \frac{X-\mu}\sigma$ standard-normalverteilt und für $a < b$ gelten
  \begin{align*}
    P(a < X \le b) &= \Phi\!\left(\frac{b-\mu}\sigma\right) -
    \Phi\!\left(\frac{a-\mu}\sigma\right)  \\
    P(a < X) &= 1 - \Phi\!\left(\frac{a-\mu}\sigma\right)  \\
    P(X \le b) &= \Phi\!\left(\frac{b-\mu}\sigma\right) 
  \end{align*}

In [None]:
mu = 10
sigma = 3
P = stats.norm(mu, sigma)

In [None]:
P.mean()

In [None]:
P.std()

Achtung:  $N(\mu,\sigma^2)$  wird aufgerufen als <code>stats.norm(mu, sigma)</code>

## Beispiel: natürliche Variabilitäten

* Roggenpflanzen erreichen unter Laborbedingungen eine mittlere Höhe von 0.98m.  Dabei streut die Höhe um 19cm.  Welcher Prozentsatz aller Pflanzen erreicht mindestens 1.10m Höhe?
* $X$ = Höhe der Pflanze
* Wir rechnen in Metern.  Dann $E(X) = 0.98$ und $\sigma = 0.19$
* Wir suchen
  $$    P\!\left( 1.1 < X \right) = 1 - P(X \le 1.1)  $$

In [None]:
P = stats.norm(0.98, 0.19)
P.cdf(1.1)

In [None]:
1 - P.cdf(1.1)

26% aller Pflanzen sind höher als 1.1m

### Kritische Betrachtung des Modells

* Das Modell erlaubt auch den unsinnigen Fall, dass Roggenpflanzen eine negative Höhe aufweisen
* Mit welcher Wahrscheinlichkeit geschieht das?

In [None]:
P.cdf(0)

In [None]:
1 / P.cdf(0)

Das Modell sagt für jeweils eine unter 8 Millionen Pflanzen eine negative Höhe voraus.

* Normalverteilung
  * bsp Roggen
  * bsp IQ
* Erwartungswert und Varianz
* standardisierte ZV
* zentraler GWS
* Quantile
* QQ-Plot