<style>
    /* Design für Blockquote */
    .important-box {
        background-color: #023047; 
        padding: 20px;
        max-width: 600px;
        border-radius: 8px;
        box-shadow: 0 2px 10px rgba(0, 0, 0, 0.1);
        font-family: 'Open Sans', sans-serif;
        font-size: 1em; 
        margin: 20px;
    }

    .important-title {
        font-size: 1.2em;
        font-weight: 600; 
        color: #ffff99;
        margin-bottom: 10px; 
        display: flex;
        align-items: center;
    }

    .important-title::before {
        content: "💡"; 
        margin-right: 10px; 
    }

    .main-title {
        font-size: 1.1em;
        color: #ffff99;
        font-weight: 500;
        margin-bottom: 15px;
    }

    .text {
        font-size: 1em;
        color: #D3D3D3;
        line-height: 1.6em;
        padding-bottom: 20px;
    }

</style>

# 4.3 Darstellung quantitativ stetiger Daten

Die Darstellung von quantitativ stetigen Daten erfolgt oft durch Histogramme, die einen klaren grafischen Überblick über die Verteilung der Daten bieten.
<br>
<br>
Viele Merkmale in der Statistik, wie physikalische Messgrößen oder Verteilungen natürlicher Prozesse, werden als stetige Daten modelliert. Diese können theoretisch unendlich viele Ausprägungen annehmen, was ihre Analyse kompliziert macht. In der Praxis werden die Messungen jedoch häufig gerundet oder mit einer bestimmten Genauigkeit erfasst, sodass sie diskrete Werte annehmen. Dennoch behandelt man sie häufig wie stetige Daten, um eine aussagekräftigere und anschaulichere Darstellung zu erhalten.
<br>
<br>
In diesem Kapitel lernen wir, wie quantitativ stetige Daten mithilfe von Histogrammen effektiv dargestellt werden und warum die Berechnung der Häufigkeitsdichte bei diesem Prozess von entscheidender Bedeutung ist.

## Einführungsbeispiel

Wir betrachten die Sprungweite von $30$ Springern der Skiflugweltmeisterschaft im Jahre 2018. Die Sprungweiten aller $n=60$ Sprünge sind in der folgenden Tabelle zusammengefasst:

| 1. Sprung | 2. Sprung | 1. Sprung | 2. Sprung | 1. Sprung | 2. Sprung |
| --------- | --------- | --------- | --------- | --------- | --------- |
| 227,5     | 218       | 208,5     | 210,5     | 181,5     | 196       |
| 234,5     | 222,5     | 193       | 210       | 190       | 204       |
| 222,5     | 217       | 185,5     | 216       | 188       | 201,5     |
| 215,5     | 229       | 195       | 219,5     | 181,5     | 180,5     |
| 220       | 211       | 217,5     | 197       | 171,5     | 177,5     |
| 220       | 211,5     | 188,5     | 220,5     | 186,5     | 186,5     |
| 207       | 215       | 205,5     | 210,5     | 185       | 185,5     |
| 211,5     | 214,5     | 188,5     | 204       | 183,5     | 188       |
| 214       | 203       | 185       | 214,5     | 185,5     | 162,5     |
| 195,5     | 214       | 183       | 215,5     | 169,5     | 179,5     |

Die Sprungweiten der Springer sind in der Regel kontinuierliche, reelle Zahlen, was sie zu einem stetigen Merkmal macht. In diesem Fall wurden die Sprungweiten jedoch nur auf halbe Meter genau gemessen, wodurch es sich streng genommen um quantitativ diskrete Daten handelt. Aufgrund der Vielzahl unterschiedlicher Messwerte und der geringen Rundungsschritte (halber Meter) behandeln wir diese Daten jedoch wie stetige Daten. Diese Annäherung ist sinnvoll, da die feinen Abstufungen der Werte nahezu stetig erscheinen und eine solche Darstellung die Analyse und Interpretation der Verteilung der Daten erleichtert.
<br>
<br>
Wir entscheiden uns eine Klasseneinteilung durchzuführen mit einer Klassenbreite von $d=5$. Es werden dadurch $15$ Klassen gebildet, die letzte Spalte kann zunächst ignoriert werden:

| Klasse       | Klassenmitte $x_i$ | Absolute Häufigkeit $n_i$ | Relative Häufigkeit $h(x_i)=n_i/n$ | Säulenhöhe $h(x_i)/d$ |
| ------------ | ------------------ | ------------------------- | ---------------------------------- | --------------------- |
| `[160; 165)` | 162,5              | 1                         | 0,01667                            | 0,00333               |
| `[165; 170)` | 167,5              | 1                         | 0,01667                            | 0,00333               |
| `[170; 175)` | 172,5              | 1                         | 0,01667                            | 0,00333               |
| `[175; 180)` | 177,5              | 2                         | 0,03333                            | 0,00667               |
| `[180; 185)` | 182,5              | 5                         | 0,08333                            | 0,01667               |
| `[185; 190)` | 187,5              | 11                        | 0,18333                            | 0,03667               |
| `[190; 195)` | 192,5              | 2                         | 0,03333                            | 0,00667               |
| `[195; 200)` | 197,5              | 4                         | 0,06667                            | 0,01333               |
| `[200; 205)` | 202,5              | 4                         | 0,06667                            | 0,01333               |
| `[205; 210)` | 207,5              | 3                         | 0,05                               | 0,01                  |
| `[210; 215)` | 212,5              | 10                        | 0,16667                            | 0,03333               |
| `[215; 220)` | 217,5              | 8                         | 0,13333                            | 0,02667               |
| `[220; 225)` | 222,5              | 5                         | 0,08333                            | 0,01667               |
| `[225; 230)` | 227,5              | 2                         | 0,03333                            | 0,00667               |
| `[230; 235)` | 232,5              | 1                         | 0,01667                            | 0,00333               |

## Häufigkeitsdichte

In der Tabelle wurde die neue Größe `Säulenhöhe` eingetragen. Man möchte die relativen Klassenhäufigkeiten durch Rechtecksäulen graphisch darstellen. Dabei stellt die Breite einer Säule die Klassenbreite $d$ dar. 
<br>
<br>
Die Höhe der Säule wird so gewählt, dass der Flächeninhalt der jeweiligen Säule als relative Häufigkeit der Klasse interpretiert werden kann:

<img src="../img/Balken_goehe.png" alt="Bild vom Balken" width="400">

Durch folgende Berechnungen kommt man auf die Säulenhöhe:

$A_{\text{Säule}}={\text{Höhe}}\cdot{Breite}$ $\rightarrow$ $A_{Säule}={h_{\text{Säule}}\cdot}{d}$ 

Umstellen nach $h_{\text{Säule}}$ liefert: 

$h_{Säule}=\frac{A_{\text{Säule}}}{d}$

Die Fläche der Säule soll ja der relativen Häufigkeit $h(x_i)$ entsprechen, somit folgt mit $A_{\text{Säule}}=h(x_i)$

$h_{\text{Säule}}=\frac{h(x_i)}{d}$

Man bezeichnet die Rechtecks Höhe bzw. Säulenhöhe $h_{\text{Säule}}$ auch als Häufigkeitsdichte $f(x_i)$ , mit $h_{\text{Säule}}=f(x_i)$ folgt:

$$f(x_i)=\frac{h(x_i)}{d}$$