# Quantile und Boxplots

In der Statistik sind Quantile bestimmte Werte (Grenzen), die festlegen, welcher Teil der Datenreihe unterhalb und oberhalb des bestimmtes Wertes liegt.
Der bereits kennen gelernte Median ist ebenfalls ein Quantil, denn er unterteilt eine Datenreihe in zwei gleich große Bereiche. Der Median bekommt die Bezeichnung `0,5-Quantil`, weil sowohl über dem Median als auch unter dem Median $p=0,5=50\%$ der Merkmalsausprägungen liegen.

## Definition des p-Quantils

Das p-Quantil $x_p$ ist eine Zahl, welche eine der Größe nach geordnete Datenreihe in zwei Teile spaltet. Links vom p-Quantil liegt der Anteil $p$ der Daten, die kleiner oder gleich $x_p$ sind. Rechts von $x_p$ liegt der Rest der Daten, die größer oder gleich $x_p$ sind ($1-p$).
<br>
<br>
Ähnlich der Berechnungsvorschrift für den Medians wird auch die Berechnungsvorschrift für das p-Quantil festgelegt:

> Definition: $$x_{p}=\begin{cases}x_{[n\cdot{p}]+1}&{\text{falls }n\cdot{p}\text{ nicht ganzzahlig ist}}\\\frac{x_{n\cdot{p}}+x_{n\cdot{p}+1}}{2}&\text{falls }n\cdot{p} \text{ ganzzahlig ist}\end{cases}$$
> Die Klammer um "$n\cdot{p}$" bedeutet dass auf die nächstkleinere ganze Zahl abgerundet werden soll! 

## Beispiele zur Berechnung

Schauen wir uns einige Beispiele an, um den Umgang der Formel $x_p$ zu üben.

### 1. Beispiel

Bei den Olympischen Spielen 1916 in Rio de Janeiro gab es im Weitsprungfinale der Frauen folgende Weiten:<br>
`6,58; 6,61; 6,63; 6,69; 6,74; 6,79; 6,81; 6,95; 7,08; 7,15; 7,17`
<br>
<br>
**Gesucht ist das 0,75-Quantil:**
- Es sind $n=11$ Datenpunkte vorhanden
- $n\cdot{p}=11\cdot{0,75}=8,25$
- $8,25$ ist nicht ganzzahlig, somit berechnet man: $[n\cdot{p}+1]=[8,25]+1=9$
- $x_{0,75}=x_{[n\cdot{p}]+1}=x_9=7,08$

### 2. Beispiel

Bei den Olympischen Spielen 2016 in Rio de Janeiro gab es im Weitsprungfinale der Männer folgende Weiten:<br>
`7,82; 7,86; 7,87; 7,97; 8,05; 8,06; 8,1; 8,17; 8,25; 8,3; 8,37; 8,38`
<br>
<br>
**Gesucht ist das 0,75-Quantil:**
- Es sind $n=12$ Datenpunkte vorhanden
- $n\cdot{p}=12\cdot{0,75}=9$
- $9$ ist ganzzahlig, somit berechnet man: $x_{0,75}=\frac{x_{n\cdot{p}}+x_{n\cdot{p}+1}}{2}=\frac{x_{9}+x_{10}}{2}=8,275$

## Perzentile und weitere Bezeichnungen

Eine weitere Bezeichnung für Quantile ist Perzentile. Bei dieser Bezeichnung gibt man $p$ in Prozent an. Somit ist z.B. das 0,75-Quantil das 75te-Perzentil.
<br>
<br>
Weitere Bezeichnungen sind:
- Quartil:
  Quantile, welche das obere bzw. untere Viertel der Datenpunkte abschneiden, heißen Quartile.
- Dezil:
  Dezile geben $p$ in Zehntelwerten an, z.B. das 0,2-Quantil ist das 2. Dezil.

Häufig verwendete Quantile sind:

| Quantil      | Bezeichnung             |
| ------------ | ----------------------- |
| 0-Quantil    | 0. Quartil oder Minimum |
| 0,25-Quantil | 1. Quartil              |
| 0,5-Quantil  | 2. Quartil oder Median  |
| 0,75-Quantil | 3. Quartil              |
| 1-Quantil    | 4. Quartil oder Maximum |
| 0,1-Quantil  | 1. Dezil                |
| ...          | ...                     |
| 0,9-Quantil  | 9. Dezil                |

## Der Boxplot

Für die grafische Darstellung der Quantile wird das sogenannte Boxplot genutzt, andere Bezeichnungen dafür sind auch Kastendiagramm oder Box-Whisker-Plot. Boxplots bieten eine schnelle Möglichkeit die vorliegenden Daten grafisch Darzustellen, um einen Überblick über die Verteilung der Daten zu gewinnen. 

### Erstellung enes Boxplots

Um einen Boxplot zu zeichnen, geht man folgendermaßen vor:
1. Sortieren der Daten aufsteigend
2. Berechnung der fünf Quartile der Datenreihe
3. Einen Kasten zeichnen, der sich vom 1. Quartil bis zum 3. Quartil erstreckt
4. Auf der Höhe des Medians eine waagerechte Linie im Kasten einzeichnen
5. Einzeichnen der Antennen (Whiskers), welche sich vom Ende des Kastens zum Minimum bzw. vom Anfang des Kastens zum Maximum erstrecken

**Beispiel:**

Bei den olympischen Spielen 1916 in Rio de Janeiro gab es im Weitsprungfinale der Frauen folgende Weiten:<br>
`6,58; 6,61; 6,63; 6,69; 6,74; 6,79; 6,81; 6,95; 7,08; 7,15; 7,17`

Berechnungen ergeben:
- Maximum: $7,17$
- $3$. Quartil: $7,08$
- Median: $6,79$
- $1$. Quartil: $6,63$
- Minimum: $6,58$