# Übung 4 – Gruppenvergleich mit nicht normalverteilten Daten (Titanic)

## Lernziele
- Schiefe Verteilungen erkennen und analysieren
- Den passenden Gruppenvergleich für nicht-normalverteilte Daten auswählen
- Kruskal-Wallis Test als nicht-parametrische Alternative zur ANOVA durchführen
- Rangbasierte Post-hoc Tests (Dunn Test) anwenden
- False Discovery Rate (FDR) Korrektur nach Benjamini-Hochberg durchführen
- Medianwerte und robuste Statistiken nutzen

---

## Fragestellung

Prüfen Sie, ob sich die Ticketpreise (**Fare**) zwischen den drei Passagierklassen unterscheiden:

- 1st class (Erste Klasse)
- 2nd class (Zweite Klasse)
- 3rd class (Dritte Klasse)

---

## Importiere notwendige Bibliotheken

Führe diese Zelle aus, bevor du mit den Aufgaben beginnst:

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from scipy import stats
from scipy.stats import kruskal
import scikit_posthocs as sp

from statsmodels.stats.multitest import fdrcorrection

In [None]:
# Einstellungen für bessere Plots und Pandas Optionen
plt.rcParams['figure.figsize'] = (10, 6)

pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)
pd.set_option('display.precision', 4)

---

# Teil 1 – Aufbereiteter Datensatz wird gegeben

### Datensatz laden

In [None]:
df = sns.load_dataset("titanic")

### Überblick über die Daten

In [None]:
df.head()

In [None]:
# Deskriptive Statistiken nach Klasse
print("Deskriptive Statistiken nach Passagierklasse:\n")
summary = df.groupby('pclass')['fare'].describe()
print(summary)

In [None]:
# Anzahl Beobachtungen pro Klasse
print("\nAnzahl Passagiere pro Klasse:")
print(df['pclass'].value_counts().sort_index())

---

# Teil 2 – Explorative Analyse

## Aufgabe 1 – Verteilungen visualisieren und analysieren (Wiederholung)

**Ziel:** Die Verteilung der Ticketpreise pro Klasse untersuchen und Schiefe sowie Ausreißer identifizieren.

**Aufgaben:**

a. Erstelle einen Boxplot der Ticketpreise nach Passagierklasse

b. Erstelle ein Histogramm für jede Klasse

c. Berechne Schiefe (Skewness) für jede Klasse

d. Beantworte die Interpretationsfragen

### a. Boxplot nach Passagierklasse

In [None]:
plt.figure(figsize=(12, 6))

# Erstelle Boxplot


### b. Histogramm für jede Klasse

In [None]:
fig, axes = plt.subplots(1, 3, figsize=(16, 5))

# Erstelle Histogramm für jede Klasse


### c. Schiefe berechnen

In [None]:
# Berechne Schiefe (stats.skew)


### d. Interpretation

**Fragen zur Interpretation:**

1. **Was beobachten Sie bezüglich der Verteilungsform der Ticketpreise?**


2. **Sind die Daten normalverteilt? Begründen Sie mit Bezug auf Skweness-Werte.**


3. **Ist ANOVA sinnvoll? Wenn nicht, warum?**


4. **Welche Klasse hat die höchste Variabilität in den Ticketpreisen?**


5. **Gibt es sichtbare Ausreißer? In welchen Klassen?**



---

# Teil 3 – Globaler Test

## Aufgabe 2 – Kruskal-Wallis Test durchführen

**Ziel:** Prüfen, ob sich die Ticketpreise zwischen den drei Passagierklassen unterscheiden.

**Hintergrund:**
- Der Kruskal-Wallis Test ist ein nicht-parametrischer Test für den Vergleich von mehr als zwei Gruppen
- Er basiert auf Rängen statt auf den eigentlichen Werten
- Robust gegenüber Nicht-Normalität und Ausreißern

**Hypothesen:**
- H₀: Alle drei Klassen haben die gleiche Verteilung der Ticketpreise
- H₁: Mindestens eine Klasse unterscheidet sich von den anderen

**Aufgaben:**

a. Führe den Kruskal-Wallis Test durch

b. Interpretiere das Ergebnis (α = 0.05)

### a. Kruskal-Wallis Test durchführen

In [None]:
# Separiere die Daten nach Klasse


In [None]:
print(f"Gruppengrößen:")
print(f"  1. Klasse: n = {len(group_1st)}")
print(f"  2. Klasse: n = {len(group_2nd)}")
print(f"  3. Klasse: n = {len(group_3rd)}")

In [None]:
# Führe Kruskal-Wallis Test durch


In [None]:
print("\n" + "="*60)
print("KRUSKAL-WALLIS TEST ERGEBNISSE")
print("="*60)
print(f"H-Statistik: {h_statistic}")
print(f"p-Wert: {p_value}")
print("="*60)

In [None]:
# Entscheidung
alpha = 0.05
if p_value < alpha:
    print("H0 wird...")
    print("→ H₀ wird VERWORFEN")
    print("→ Es gibt signifikante Unterschiede zwischen den Klassen.")
    print("→ Post-hoc Tests sind erforderlich!")
else:
    print("H0 wird...")

### b. Interpretation

**Ergebnis:**

Der Kruskal-Wallis Test zeigt einen ________________ Unterschied zwischen den Ticketpreisen der drei Passagierklassen.



**Wird die Nullhypothese verworfen?**
- Antwort:


**Sagt der Test welche Klassen sich unterscheiden? Wenn nicht was ist der nächste Schritt**
- Antwort:

**Was bedeutet der Wert für H-Statistik?**
- Antwort:

**Was bedeutet der p-Wert**
- Antwort:

---

# Teil 4 – Post-hoc Tests

## Aufgabe 3 – Dunn Test durchführen

**Ziel:** Paarweise Vergleiche zwischen den Klassen durchführen.

**Hintergrund:**
- Der Dunn Test ist ein rangbasierter Post-hoc Test für Kruskal-Wallis
- Er vergleicht alle Gruppenpaare miteinander
- Bei 3 Gruppen ergeben sich 3 Vergleiche (3 p-Werte)

**Aufgaben:**

a. Führe den Dunn Test durch (ohne p-Wert-Korrektur)

b. Zeige die rohen p-Werte für alle Paarvergleiche

c. Diskutiere das Problem des multiplen Testens

### a. Dunn Test durchführen

In [None]:
# Führe Dunn Test durch
dunn_result =

In [None]:
print("\n" + "="*60)
print("DUNN TEST ERGEBNISSE (rohe p-Werte)")
print("="*60)
print(dunn_result)
print("="*60)

### b. Paarvergleiche extrahieren und anzeigen

In [None]:
# Extrahiere die paarweisen p-Werte
p_1vs2 =
p_1vs3 =
p_2vs3 =

In [None]:
# Erstelle Übersichtstabelle


### c. Problem des multiplen Testens

**Was ist das Problem wenn man mehrere Hypothesentest gleichzeitig durchführt?**
- Antwort:


**Wie löst man das Problem? Was sind mögliche Methoden?**
- Antwort:

---

# Teil 5 – Fehlerkontrolle

## Aufgabe 4 – False Discovery Rate (FDR) Korrektur

**Ziel:** Die p-Werte mit dem Benjamini-Hochberg Verfahren korrigieren.

**Hintergrund:**
- **FDR (False Discovery Rate)**: Kontrolliert den erwarteten Anteil an Falschentdeckungen unter den als signifikant deklarierten Tests
- **Benjamini-Hochberg Verfahren**: Weniger konservativ als Bonferroni, mehr statistische Power

**Aufgaben:**

a. Wende die Benjamini-Hochberg Korrektur auf die drei p-Werte an

b. Vergleiche rohe und korrigierte p-Werte

c. Entscheide, welche Vergleiche signifikant sind

### a. Benjamini-Hochberg Korrektur anwenden

In [None]:
# Sammle alle rohen p-Werte

# Wende Benjamini-Hochberg Korrektur an


In [None]:
print("\n" + "="*70)
print("FDR KORREKTUR (Benjamini-Hochberg)")
print("="*70)
print(f"Signifikanzniveau (α): 0.05")
print(f"Anzahl Tests: {len(raw_pvalues)}")
print("="*70)

### b. Vergleichstabelle erstellen (Roher p-wert, Korrigierter p-wert, Signifikanz, Median Differenz)

In [None]:
# Erweitere die Vergleichstabelle


In [None]:
print("\nVergleichstabelle mit FDR-Korrektur:")
print("="*100)
print(comparison_df.to_string(index=False))
print("="*100)

### c. Zusammenfassung der Ergebnisse

In [None]:
# Zähle signifikante Vergleiche
n_significant = sum(rejected)

print(f"\n{'='*60}")
print("ZUSAMMENFASSUNG")
print("="*60)
print(f"Anzahl durchgeführter Vergleiche: {len(raw_pvalues)}")
print(f"Anzahl signifikanter Vergleiche (nach FDR): {n_significant}")
print("="*60)

if n_significant > 0:
    print("\nSignifikante Unterschiede gefunden bei:")
    for i, (comp, is_sig) in enumerate(zip(comparison_df['Vergleich'], rejected)):
        if is_sig:
            print(f"  ✓ {comp} (p_korr = {corrected_pvalues[i]:})")
else:
    print("\nKeine signifikanten Unterschiede nach FDR-Korrektur.")

**Interpretation:**

Die FDR-Korrektur nach Benjamini-Hochberg zeigt, welche Paarvergleiche auch nach Korrektur für multiples Testen signifikant bleiben.

**Erwartetes Muster:**
- 1. Klasse zahlt deutlich mehr als 2. und 3. Klasse → signifikant
- 2. Klasse zahlt mehr als 3. Klasse → signifikant
- Alle drei Klassen unterscheiden sich signifikant voneinander

**Hinweis:** Die korrigierten p-Werte können größer sein als die rohen p-Werte, sind aber immer noch interpretierbar als adjustierte Signifikanzniveaus.

---

# Teil 6 – Interpretation

## Aufgabe 5 – Ergebnisse interpretieren

**Ziel:** Das Muster der Unterschiede beschreiben

**Aufgaben:**

a. Beschreibe das Muster der Unterschiede

b. Diskutiere die praktische vs. statistische Signifikanz

### a. Beschreibung des Musters (Lücken ausfüllen)

**Zusammenfassung der Ergebnisse:**

Die statistische Analyse zeigt _____________ .

1. **Globaler Test (Kruskal-Wallis)**:
   - __________ Unterschied zwischen den drei Passagierklassen (p < 0.001)
   - Die Verteilung der Ticketpreise _______________ zwischen den Klassen

2. **Post-hoc Tests (Dunn mit FDR-Korrektur)**:
   - **1. Klasse vs. 2. Klasse**: ______________
   - **1. Klasse vs. 3. Klasse**: ______________
   - **2. Klasse vs. 3. Klasse**: _____________
   
3. **Größe der Effekte (Mediane)**:
   - 1.Klasse:
   - 2.Klasse:
   - 3.Klasse:
   - Die 1. Klasse ist etwa ____ teurer als die 3. Klasse


### b. Praktische vs. statistische Signifikanz (Lücken ausfüllen)

**Diskussion:**

**Statistische Signifikanz:**
- Alle Paarvergleiche sind ________________ (p < 0.05 nach FDR-Korrektur)
- Die Wahrscheinlichkeit, dass diese Unterschiede durch Zufall entstanden sind, ist ________

**Praktische Signifikanz:**
- Die **Effektgrößen sind _________**: Die 1. Klasse kostet 3-4x mehr als die 3. Klasse
- Die Unterschiede spiegeln die historische Realität der Titanic wider:
  - Erste Klasse: Luxuriöse Suiten, exklusiver Service
  - Dritte Klasse: Einfache Unterkünfte, Basis-Service

**Methodische Erkenntnisse:**
- Der nicht-parametrische Ansatz (Kruskal-Wallis + Dunn) war die ________ Wahl. ANOVA wäre in diesem Kontext ____________ .
- Die FDR-Korrektur verhindert _____________ Ergebnisse bei multiplen Tests
- Trotz starker Rechtsschiefe und Ausreißern konnten wir robuste Schlüsse ziehen



---