## Bestimmung des z-Wertes, bei bekannter Fläche unter der Normalverteilungskurve
----------------------------------------

In [2]:
from scipy.stats import norm

Bisher haben wir $z$-Scores verwendet, um die Fläche unter der Kurve zu berechnen. Jetzt machen wir es andersherum. Wir berechnen den oder die $z$-Score(s), die einer bestimmten Fläche unter der Standardnormalkurve entsprechen. Das Auffinden des $z$-Scores, der eine bestimmte Fläche hat, ist so häufig, dass es eine spezielle Notation gibt. Das Symbol $z_{\alpha}$ wird verwendet, um den $z$-Score zu bezeichnen, der eine Fläche von $ \alpha $ (alpha) zu seiner Rechten unter der Standardnormalkurve aufweist.

Ermitteln wir $z_{0,05}$, den $z$-Wert, der unter der Standardnormalkurve eine Fläche von $0,05$ zu seiner Rechten hat. Der Wert von $\alpha$ entspricht der Wahrscheinlichkeit, einen bestimmten Wert zu erhalten, der dem Intervall $[z \ $,$ \ \infty[$entspricht. Denn die Fläche rechts davon ist $0,05$. Die Fläche links davon ist $1-0,05=0,95$, was dem Intervall $]- \alpha \ $,$ \ z]$ (siehe Grafik unten).

![Alt-Text](normalcdfstand_005.png)

Um den entsprechenden $z$-Score zu erhalten, kann man ihn in einer Wahrscheinlichkeitstabelle nachschlagen oder Python verwenden. Daher wenden wir die Funktion `norm.ppf` an. Die `norm.ppf`-Funktion wird geschrieben als `norm.ppf`(p, mean = 0, scale = 1, loc = 0). Wir behalten die Standardwerte für die Argumente `mean`, `sd` und `loc` bei. Allerdings müssen wir vorsichtig sein auf welchen Bereich der Fläche unter der Normalverteilung wir uns beziehen. Für `norm.ppf(p)` erhalten wir den z-Score, bei dem das p-Argument der Bereich links von z ist. Wenn wir dagegen `norm.ppf(1-p)` berechnen, erhalten wir den z-Score, bei dem das p-Argument der Bereich rechts von z ist. Wenden wir uns an Python um dies zu verdeutlichen.

In [31]:
norm.ppf(0.05)

-1.6448536269514729

In [32]:
norm.ppf(0.95)

1.6448536269514722

Es ist interessant zu erwähnen das die Perzentile Punkt Funktion `norm.ppf` die inverse Funktion der kumulativen Wahrscheinlichkeitsfunktion `norm.cdf` ist

In [3]:
norm.cdf(norm.ppf(0.95))

0.95

Da die Standardnormalverteilung symmetrisch ist, erhalten wir zweimal die gleiche Zahl, aber mit einem anderen Vorzeichen. Das bedeutet, dass bei einem z-Wert von etwa $1,64 \ $  $ 95 \%$ aller Werte links von $z_{0,05}$ und $5 \%$ aller Werte rechts davon liegen. Im Gegensatz dazu liegen für einen $z$-Wert von etwa $-1,64 \ $ $5 \%$ aller Werte links von $z_{0,05}$ und 95% aller Werte rechts davon. Kombiniert man diese, erhält man das Intervall $z \in [-1,64 \ $,$ \ 1,64 ]$, das $90 \%$ aller Werte abdeckt.

![Alt-Text](ppfnorm.png)