# S&P 500 Volatilit√§tsanalyse mit GARCH-Modellen
## Umfassende Analyse von Index- und Einzelaktiendaten

---

### üìä Projekt√ºbersicht

Dieses Notebook f√ºhrt eine detaillierte Volatilit√§tsanalyse des S&P 500 durch und beantwortet die zentrale **Forschungsfrage**:

> *"Inwieweit k√∂nnen GARCH-Modelle unterschiedlicher Komplexit√§t (GARCH(1,1), EGARCH, GJR-GARCH) die Volatilit√§tsdynamiken des S&P 500 Index vorhersagen, und welches Modell zeigt die beste Out-of-Sample-Prognoseperformance?"*

### üìã Notebook-Struktur

- **Teil 1:** Deskriptive Analyse der S&P 500 Einzelaktiendaten
- **Teil 2:** Index-Daten laden und Renditen berechnen
- **Teil 3:** Stationarit√§tstest (ADF-Test)
- **Teil 4:** GARCH-Modellierung (GARCH, EGARCH, GJR-GARCH)
- **Teil 5:** Out-of-Sample Prognose mit Rolling Forecast
- **Teil 6:** Modellevaluation und Vergleich
- **Teil 7:** Visualisierung des Leverage-Effekts
- **Teil 8:** Konfidenzintervalle f√ºr Volatilit√§tsprognosen
- **Teil 9:** Zusammenfassung und Fazit

---

## 0Ô∏è‚É£ Installation und Abh√§ngigkeiten

**Was passiert hier?**  
Wir installieren alle ben√∂tigten Python-Bibliotheken f√ºr die Analyse:
- `pandas` & `numpy`: Datenverarbeitung und numerische Berechnungen
- `matplotlib` & `seaborn`: Visualisierung
- `arch`: Spezialbibliothek f√ºr GARCH-Modelle
- `statsmodels`: Statistische Tests (z.B. Stationarit√§t)
- `scikit-learn`: Evaluationsmetriken (MSE, MAE)
- `scipy`: Wissenschaftliche Berechnungen

In [None]:
# Pakete installieren (auskommentiert - nur bei Bedarf ausf√ºhren)
# !pip install pandas numpy matplotlib seaborn arch statsmodels scikit-learn scipy

---
## 1Ô∏è‚É£ Teil 1: Deskriptive Analyse der S&P 500 Einzelaktiendaten

**Ziel:** Verstehen der Datenstruktur und Qualit√§t der Einzelaktiendaten

**Was macht dieser Abschnitt?**
1. L√§dt die Datei `sp500_stocks.csv` mit historischen Aktiendaten
2. Analysiert Datenqualit√§t (fehlende Werte, Zeitr√§ume)
3. Berechnet deskriptive Statistiken (Quartile, Durchschnitte)
4. Gibt einen √úberblick √ºber die Datenverteilung

**Wichtige Kennzahlen:**
- **Open/Close**: Er√∂ffnungs- und Schlusskurse der Aktien
- **Volume**: Handelsvolumen (wie viele Aktien wurden gehandelt)
- **Intraday Volatilit√§t**: Differenz zwischen H√∂chst- und Tiefstkurs eines Tages

In [None]:
# Bibliotheken f√ºr die Stock-Datenanalyse importieren
import csv
from datetime import datetime
import pandas as pd
import numpy as np

# Konfiguration f√ºr die Aktiendaten
STOCKS_FILE = '../data/sp500_stocks.csv'  # Pfad zur Datei
DATE_FORMAT = '%Y-%m-%d'  # Datumsformat: Jahr-Monat-Tag

print("üìÇ Starte Analyse der S&P 500 Einzelaktiendaten...")
print(f"   Datei: {STOCKS_FILE}")
print("   Dies kann einige Sekunden dauern...\n")

In [None]:
# Hilfsfunktion 1: Quartilsberechnung
# Diese Funktion berechnet drei wichtige Statistiken:
# - Mittelwert (Durchschnitt)
# - Q1 (25% der Werte liegen darunter)
# - Q3 (75% der Werte liegen darunter)

def calculate_quartiles(data):
    """Berechnet Mittelwert, 25%-Quartil und 75%-Quartil"""
    if not data:  # Falls keine Daten vorhanden
        return 0.0, 0.0, 0.0
    
    n = len(data)
    data.sort()  # Sortieren f√ºr Quartilsberechnung
    
    mean_val = sum(data) / n  # Durchschnitt
    q1 = data[int(n * 0.25)]  # 25%-Quartil
    q3 = data[int(n * 0.75)]  # 75%-Quartil
    
    return mean_val, q1, q3


# Hilfsfunktion 2: Formatierung der Ausgabe
# Diese Funktion erstellt eine lesbare Textzeile mit Statistiken
# Format: "Name  Mittelwert [Q1; Q3]"

def format_stat(name, data, unit='', is_volume=False):
    """Formatiert Statistiken f√ºr √ºbersichtliche Ausgabe"""
    mean, q1, q3 = calculate_quartiles(data)
    
    if is_volume:
        # Volumen wird in Millionen angezeigt (z.B. 5.2 Mio. statt 5,200,000)
        return f"{name:<30} {mean/1e6:.2f} Mio. [{q1/1e6:.2f}; {q3/1e6:.2f}]"
    else:
        # Normale Werte (Preise in Dollar)
        return f"{name:<30} {mean:.2f} {unit} [{q1:.2f}; {q3:.2f}]"

print("‚úì Hilfsfunktionen definiert")

In [None]:
# Schritt 1: Datei einlesen und analysieren
# Wir gehen Zeile f√ºr Zeile durch die CSV-Datei und sammeln Informationen

# Listen zum Speichern der Daten
dates = []         # Alle Handelsdaten
opens = []         # Er√∂ffnungskurse
closes = []        # Schlusskurse
adj_closes = []    # Bereinigte Schlusskurse (angepasst f√ºr Splits, Dividenden)
volumes = []       # Handelsvolumen
volatilities = []  # Intraday-Volatilit√§t (High - Low)

# Dictionary zum Tracken der Zeitspannen pro Aktie (Ticker)
ticker_dates = {}

# Z√§hler f√ºr Datenqualit√§tsanalyse
total_rows = 0          # Gesamtzahl der Zeilen
valid_rows = 0          # Zeilen mit vollst√§ndigen Daten
missing_value_rows = 0  # Zeilen mit fehlenden Werten

try:
    # Datei √∂ffnen und zeilenweise lesen
    with open(STOCKS_FILE, 'r', encoding='utf-8') as f:
        reader = csv.DictReader(f)  # CSV als Dictionary lesen (Spaltennamen als Keys)
        
        for row in reader:
            total_rows += 1
            
            # Datum parsen (konvertieren von String zu datetime-Objekt)
            try:
                current_date = datetime.strptime(row['Date'], DATE_FORMAT)
            except (ValueError, KeyError):
                # Falls Datum ung√ºltig oder fehlt: Zeile √ºberspringen
                continue

            # Ticker-Symbol (z.B. 'AAPL' f√ºr Apple)
            symbol = row.get('Symbol')
            
            # Datenqualit√§tspr√ºfung: Sind alle wichtigen Felder vorhanden?
            required_fields = ['Open', 'Close', 'Adj Close', 'Volume', 'High', 'Low']
            if not all(row.get(field) and row.get(field).strip() for field in required_fields):
                # Mindestens ein Feld fehlt oder ist leer
                missing_value_rows += 1
                continue
            
            try:
                # Werte von String zu Float konvertieren
                o = float(row['Open'])        # Er√∂ffnungskurs
                c = float(row['Close'])       # Schlusskurs
                ac = float(row['Adj Close'])  # Bereinigter Schlusskurs
                v = float(row['Volume'])      # Handelsvolumen
                h = float(row['High'])        # Tagesh√∂chstkurs
                l = float(row['Low'])         # Tagestiefstkurs
                
                # Daten zu unseren Listen hinzuf√ºgen
                dates.append(current_date)
                opens.append(o)
                closes.append(c)
                adj_closes.append(ac)
                volumes.append(v)
                volatilities.append(h - l)  # Tagesspanne als Volatilit√§tsma√ü
                
                # Zeitspanne f√ºr diesen Ticker aktualisieren
                if symbol:
                    if symbol not in ticker_dates:
                        # Neuer Ticker: Initialisiere min und max Datum
                        ticker_dates[symbol] = {'min': current_date, 'max': current_date}
                    else:
                        # Ticker existiert schon: Aktualisiere min/max falls n√∂tig
                        if current_date < ticker_dates[symbol]['min']:
                            ticker_dates[symbol]['min'] = current_date
                        if current_date > ticker_dates[symbol]['max']:
                            ticker_dates[symbol]['max'] = current_date
                            
                valid_rows += 1  # Erfolgreiche Zeile gez√§hlt
                
            except ValueError:
                # Konvertierung fehlgeschlagen (z.B. ung√ºltige Zahl)
                missing_value_rows += 1
                continue

    print(f"‚úì Datei erfolgreich eingelesen")
    print(f"   Verarbeitete Zeilen: {total_rows:,}")
    print(f"   G√ºltige Datenzeilen: {valid_rows:,}")
    print(f"   Zeilen mit Problemen: {missing_value_rows:,}\n")
    
except FileNotFoundError:
    print(f"‚ùå Fehler: Datei '{STOCKS_FILE}' wurde nicht gefunden.")
    print(f"   Stellen Sie sicher, dass die Datei im 'data/' Ordner liegt.")

In [None]:
# Schritt 2: Statistiken berechnen und anzeigen

# Beobachtungszeitraum ermitteln
if dates:
    period_str = f"{min(dates).strftime('%d.%m.%Y')} ‚Äì {max(dates).strftime('%d.%m.%Y')}"
else:
    period_str = "Keine Daten"

# Datenqualit√§t: Prozentsatz fehlender Werte
missing_percent = (missing_value_rows / total_rows * 100) if total_rows > 0 else 0

# Ticker-Analyse: Wie viele Aktien haben mehr als 10 Jahre Daten?
# (10 Jahre = 3650 Tage)
tickers_over_10y = sum(1 for t in ticker_dates.values() if (t['max'] - t['min']).days > 3650)
total_tickers = len(ticker_dates)
ticker_percent = (tickers_over_10y / total_tickers * 100) if total_tickers > 0 else 0

# Ergebnisse ausgeben
print("\n" + "="*70)
print(f"{'S&P 500 EINZELAKTIEN - DESKRIPTIVE STATISTIK':^70}")
print("="*70)
print(f"{'Beobachtungszeitraum':<30} {period_str}")
print(f"{'Verarbeitete Zeilen':<30} {valid_rows:,} (Gesamt: {total_rows:,})")
print(f"{'Fehlende Werte':<30} {missing_percent:.2f} %")
print(f"{'Ticker > 10 Jahre Daten':<30} {ticker_percent:.1f} % ({tickers_over_10y}/{total_tickers})")
print("-" * 70)

# Statistische Kennzahlen ausgeben
# Format: Name  Mittelwert [25%-Quartil; 75%-Quartil]
print(format_stat("Er√∂ffnungskurs (Open)", opens, "$"))
print(format_stat("Schlusskurs (Close)", closes, "$"))
print(format_stat("Handelsvolumen", volumes, "", is_volume=True))
print(format_stat("Intraday Volatilit√§t (H-L)", volatilities, "$"))
print("="*70)

print("\nüìä Interpretation:")
print("‚Ä¢ Die Quartile [Q1; Q3] zeigen die mittleren 50% der Werteverteilung")
print("‚Ä¢ Ein gro√üer Unterschied zwischen Q1 und Q3 deutet auf hohe Streuung hin")
print("‚Ä¢ Das Handelsvolumen variiert stark zwischen verschiedenen Aktien")
print(f"‚Ä¢ {ticker_percent:.1f}% der Aktien haben langfristige Daten (>10 Jahre)\n")

---
## 2Ô∏è‚É£ Teil 2: S&P 500 Index - Daten laden und Renditen berechnen

**Was ist der Unterschied zwischen Einzelaktien und Index?**
- **Einzelaktien** (Teil 1): Daten von hunderten einzelnen Firmen
- **Index** (ab hier): Ein Gesamtindex, der den durchschnittlichen Markt repr√§sentiert

**Was passiert in diesem Abschnitt?**
1. Laden der S&P 500 Index-Daten (ein einzelner Zeitreihen-Datensatz)
2. Berechnung der **t√§glichen Renditen** (prozentuale Preis√§nderungen)
3. Aufteilung in **Trainings- und Testdaten** (80/20 Split)

**Warum Renditen statt Preise?**
- Renditen sind **station√§r** (schwanken um einen konstanten Mittelwert)
- Preise sind **nicht station√§r** (haben einen Trend nach oben oder unten)
- GARCH-Modelle ben√∂tigen station√§re Daten!

In [None]:
# Bibliotheken f√ºr GARCH-Analyse importieren
import matplotlib.pyplot as plt
from arch import arch_model
from statsmodels.tsa.stattools import adfuller
from sklearn.metrics import mean_squared_error, mean_absolute_error

print("\n" + "="*70)
print(f"{'√úBERGANG ZU INDEX-ANALYSE':^70}")
print("="*70)
print("\nüìà Wir wechseln nun von Einzelaktien zum S&P 500 Index")
print("   Der Index fasst ~500 Aktien zu einem Gesamtmarkt-Indikator zusammen\n")

In [None]:
# Index-Daten laden
INDEX_FILE = '../data/sp500_index.csv'

# CSV-Datei einlesen mit pandas (einfacher als manuelles Parsen)
df = pd.read_csv(INDEX_FILE, parse_dates=['Date'], index_col='Date')

print(f"‚úì Index-Daten geladen: {INDEX_FILE}")
print(f"  Zeitraum: {df.index[0].date()} bis {df.index[-1].date()}")
print(f"  Anzahl Beobachtungen: {len(df):,} Handelstage\n")

# Erste Zeilen anzeigen
print("Erste 5 Zeilen der Daten:")
print(df.head())

In [None]:
# T√§gliche Renditen berechnen
# Formel: Rendite = (Preis_heute - Preis_gestern) / Preis_gestern * 100
# pct_change() macht genau das automatisch

df['returns'] = df['S&P500'].pct_change()

print("\nüìä Renditen berechnet")
print("   Formel: (P_t - P_{t-1}) / P_{t-1} * 100")
print(f"   Durchschnittliche Rendite: {df['returns'].mean()*100:.4f}%")
print(f"   Standardabweichung: {df['returns'].std()*100:.4f}%")
print(f"   Minimum: {df['returns'].min()*100:.2f}%")
print(f"   Maximum: {df['returns'].max()*100:.2f}%")

# Fehlende Werte entfernen (erste Zeile hat keine Rendite, da kein Vortag)
df.dropna(inplace=True)
print(f"\n   Bereinigte Datenpunkte: {len(df):,}")

In [None]:
# Train-Test Split: Daten aufteilen
# Warum? Um die Modellqualit√§t objektiv zu testen!
# - Training (80%): Modell lernt aus diesen Daten
# - Test (20%): Modell wird auf "unbekannten" Daten getestet

train_size = int(len(df) * 0.8)  # 80% f√ºr Training
train_data = df.iloc[:train_size]  # Erste 80%
test_data = df.iloc[train_size:]   # Letzte 20%

# Renditen extrahieren und mit 100 multiplizieren (f√ºr bessere Lesbarkeit)
train_returns = train_data['returns'] * 100
test_returns = test_data['returns'] * 100

print("\nüìä Daten aufgeteilt (Train-Test Split):")
print(f"   Training: {len(train_returns):,} Tage ({train_data.index[0].date()} bis {train_data.index[-1].date()})")
print(f"   Test:     {len(test_returns):,} Tage ({test_data.index[0].date()} bis {test_data.index[-1].date()})")
print("\n   ‚ÑπÔ∏è  Das Modell wird auf Trainingsdaten trainiert")
print("      und auf Testdaten evaluiert (Out-of-Sample Test)")

In [None]:
# Visualisierung der Renditen
plt.figure(figsize=(14, 6))
plt.plot(df.index, df['returns'] * 100, linewidth=0.7, alpha=0.8)
plt.axhline(y=0, color='red', linestyle='--', linewidth=0.8, alpha=0.5)
plt.axvline(x=train_data.index[-1], color='green', linestyle='--', linewidth=1.5, label='Train-Test Split')
plt.title('S&P 500 T√§gliche Renditen (%)', fontsize=14, fontweight='bold')
plt.xlabel('Datum')
plt.ylabel('Rendite (%)')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("\nüìà Die Grafik zeigt:")
print("   ‚Ä¢ Renditen schwanken um 0% (keine klare Trendrichtung)")
print("   ‚Ä¢ Volatilit√§ts-Cluster: Phasen hoher und niedriger Schwankungen")
print("   ‚Ä¢ Gr√ºne Linie: Trennung zwischen Training und Test")

---
## 3Ô∏è‚É£ Teil 3: Stationarit√§tstest (Augmented Dickey-Fuller Test)

**Was ist Stationarit√§t?**
Eine Zeitreihe ist station√§r, wenn:
- Der **Mittelwert** √ºber die Zeit konstant ist
- Die **Varianz** √ºber die Zeit konstant ist
- Die **Kovarianz** nur vom Zeitabstand abh√§ngt, nicht vom Zeitpunkt

**Warum ist das wichtig?**
GARCH-Modelle funktionieren nur mit station√§ren Zeitreihen!

**Der ADF-Test:**
- **Nullhypothese (H‚ÇÄ)**: Die Zeitreihe hat eine Einheitswurzel (= nicht station√§r)
- **Alternativhypothese (H‚ÇÅ)**: Die Zeitreihe ist station√§r
- **Entscheidung**: Wenn p-Wert < 0.05 ‚Üí H‚ÇÄ verwerfen ‚Üí station√§r ‚úì

In [None]:
# Augmented Dickey-Fuller (ADF) Test durchf√ºhren
print("\n" + "="*70)
print(f"{'STATIONARIT√ÑTSTEST (ADF)':^70}")
print("="*70)

# Test auf den Renditen durchf√ºhren (nicht auf Preisen!)
adf_result = adfuller(df['returns'].dropna())

print("\nüìä ADF-Test Ergebnisse:")
print(f"   ADF-Statistik: {adf_result[0]:.4f}")
print(f"   p-Wert: {adf_result[1]:.6f}")
print("\n   Kritische Werte:")
for key, value in adf_result[4].items():
    print(f"      {key}: {value:.3f}")

# Interpretation
print("\nüîç Interpretation:")
if adf_result[1] < 0.05:
    print("   ‚úÖ Die Zeitreihe ist STATION√ÑR (p-Wert < 0.05)")
    print("      ‚Üí Nullhypothese (Einheitswurzel) wird verworfen")
    print("      ‚Üí GARCH-Modelle k√∂nnen angewendet werden!")
else:
    print("   ‚ùå Die Zeitreihe ist NICHT STATION√ÑR (p-Wert ‚â• 0.05)")
    print("      ‚Üí Nullhypothese kann nicht verworfen werden")
    print("      ‚Üí Differenzierung oder Transformation n√∂tig")

print("\nüí° Zus√§tzliche Erkl√§rung:")
print("   Die ADF-Statistik sollte negativer sein als die kritischen Werte.")
print(f"   Hier: {adf_result[0]:.4f} < {adf_result[4]['5%']:.3f} (5%-Niveau)")
print("   Dies best√§tigt die Stationarit√§t zus√§tzlich.")

---
## 4Ô∏è‚É£ Teil 4: GARCH-Modellierung

**Was sind GARCH-Modelle?**
GARCH = **G**eneralized **A**uto**R**egressive **C**onditional **H**eteroskedasticity

Diese Modelle erfassen **Volatilit√§ts-Clustering**: Phasen hoher Volatilit√§t folgen auf hohe Volatilit√§t, niedrige auf niedrige.

**Die drei Modelle im Vergleich:**

1. **GARCH(1,1)** - Das Basismodell
   - Symmetrisch: Positive und negative Schocks haben gleiche Wirkung
   - Formel: œÉ¬≤‚Çú = œâ + Œ±¬∑Œµ¬≤‚Çú‚Çã‚ÇÅ + Œ≤¬∑œÉ¬≤‚Çú‚Çã‚ÇÅ

2. **EGARCH** - Exponential GARCH
   - Asymmetrisch: Erfasst den Leverage-Effekt
   - Negative Schocks erh√∂hen Volatilit√§t st√§rker als positive
   - Arbeitet mit log(œÉ¬≤) ‚Üí Varianz immer positiv

3. **GJR-GARCH** - Glosten-Jagannathan-Runkle GARCH
   - Asymmetrisch: Alternativer Ansatz zum Leverage-Effekt
   - Zus√§tzlicher Term f√ºr negative Schocks
   - Formel: œÉ¬≤‚Çú = œâ + Œ±¬∑Œµ¬≤‚Çú‚Çã‚ÇÅ + Œ≥¬∑I¬∑Œµ¬≤‚Çú‚Çã‚ÇÅ + Œ≤¬∑œÉ¬≤‚Çú‚Çã‚ÇÅ

**Bewertung:** AIC und BIC (niedriger = besser)

In [None]:
print("\n" + "="*70)
print(f"{'GARCH-MODELLIERUNG':^70}")
print("="*70)
print("\nWir sch√§tzen drei Modelle auf den Trainingsdaten:")
print("1Ô∏è‚É£  GARCH(1,1)   - Basismodell (symmetrisch)")
print("2Ô∏è‚É£  EGARCH       - Mit Leverage-Effekt (asymmetrisch)")
print("3Ô∏è‚É£  GJR-GARCH    - Alternative Leverage-Modellierung")
print("\nDies kann einige Sekunden dauern...\n")

In [None]:
# 1Ô∏è‚É£ GARCH(1,1) - Standard GARCH Modell
print("‚îÄ" * 70)
print("1Ô∏è‚É£  GARCH(1,1) Modell")
print("‚îÄ" * 70)

garch11 = arch_model(train_returns, vol='GARCH', p=1, q=1)
garch11_fit = garch11.fit(disp='off')
print(garch11_fit.summary())

print("\nüí° Interpretation:")
print("   ‚Ä¢ omega (œâ): Langfristige Volatilit√§t")
print("   ‚Ä¢ alpha[1] (Œ±): Einfluss vergangener Schocks")
print("   ‚Ä¢ beta[1] (Œ≤): Persistenz der Volatilit√§t")
print("   ‚Ä¢ Œ± + Œ≤ ‚âà 1: Hohe Persistenz (Schocks wirken lange nach)")

In [None]:
# 2Ô∏è‚É£ EGARCH - Exponential GARCH
print("\n" + "‚îÄ" * 70)
print("2Ô∏è‚É£  EGARCH Modell")
print("‚îÄ" * 70)

egarch = arch_model(train_returns, vol='EGARCH', p=1, o=1, q=1)
egarch_fit = egarch.fit(disp='off')
print(egarch_fit.summary())

print("\nüí° Interpretation:")
print("   ‚Ä¢ gamma[1] (Œ≥): Asymmetrie-Parameter (Leverage-Effekt)")
print("   ‚Ä¢ Œ≥ < 0: Negative Schocks erh√∂hen Volatilit√§t st√§rker")
print("   ‚Ä¢ Je negativer Œ≥, desto st√§rker der Leverage-Effekt")

In [None]:
# 3Ô∏è‚É£ GJR-GARCH - Glosten-Jagannathan-Runkle GARCH
print("\n" + "‚îÄ" * 70)
print("3Ô∏è‚É£  GJR-GARCH Modell")
print("‚îÄ" * 70)

gjr_garch = arch_model(train_returns, p=1, o=1, q=1, vol='GARCH', dist='ged')
gjr_garch_fit = gjr_garch.fit(disp='off')
print(gjr_garch_fit.summary())

print("\nüí° Interpretation:")
print("   ‚Ä¢ gamma[1] (Œ≥): Zus√§tzlicher Effekt bei negativen Schocks")
print("   ‚Ä¢ Œ≥ > 0: Negative Schocks haben st√§rkeren Einfluss")
print("   ‚Ä¢ dist='ged': Generalized Error Distribution (flexibler als Normal)")

In [None]:
# Modellvergleich anhand von Informationskriterien
print("\n" + "="*70)
print(f"{'MODELLVERGLEICH (Informationskriterien)':^70}")
print("="*70)

comparison_df = pd.DataFrame({
    'Modell': ['GARCH(1,1)', 'EGARCH', 'GJR-GARCH'],
    'AIC': [garch11_fit.aic, egarch_fit.aic, gjr_garch_fit.aic],
    'BIC': [garch11_fit.bic, egarch_fit.bic, gjr_garch_fit.bic],
    'Log-Likelihood': [garch11_fit.loglikelihood, egarch_fit.loglikelihood, gjr_garch_fit.loglikelihood]
})

print(comparison_df.to_string(index=False))

print("\nüèÜ Bestes Modell (niedrigster AIC/BIC):")
best_aic = comparison_df.loc[comparison_df['AIC'].idxmin(), 'Modell']
best_bic = comparison_df.loc[comparison_df['BIC'].idxmin(), 'Modell']
print(f"   Nach AIC: {best_aic}")
print(f"   Nach BIC: {best_bic}")

print("\nüí° Hinweis:")
print("   AIC/BIC messen die In-Sample Anpassung (Trainingsdaten)")
print("   Die Out-of-Sample Performance testen wir im n√§chsten Schritt!")

---
## 5Ô∏è‚É£ Teil 5: Out-of-Sample Prognose (Rolling Forecast)

**Was ist eine Rolling Forecast?**
Anstatt einmalig das gesamte Modell zu sch√§tzen und dann zu prognostizieren, verwenden wir einen **rollierenden Ansatz**:

1. Sch√§tze Modell mit Trainingsdaten
2. Prognostiziere 1 Tag voraus
3. F√ºge tats√§chlichen Wert zu den Daten hinzu
4. Sch√§tze Modell neu (jetzt mit einem Tag mehr)
5. Wiederhole f√ºr jeden Tag im Testset

**Vorteile:**
- Realistischer: So w√ºrde man in der Praxis auch vorgehen
- Modell wird kontinuierlich mit neuen Daten aktualisiert
- Robustere Evaluierung

**Hinweis:** Dieser Schritt dauert l√§nger, da f√ºr jeden Testtag ein neues Modell gesch√§tzt wird!

In [None]:
print("\n" + "="*70)
print(f"{'OUT-OF-SAMPLE PROGNOSE (Rolling Forecast)':^70}")
print("="*70)
print(f"\nWir erstellen {len(test_returns)} Tagesprognosen...")
print("‚è±Ô∏è  Dies dauert ca. 2-5 Minuten (je nach Rechenleistung)\n")
print("Fortschritt wird alle 50 Iterationen angezeigt:\n")

In [None]:
# Initialisierung
history = train_returns.copy()  # Startet mit Trainingsdaten
predictions_garch11 = []
predictions_egarch = []
predictions_gjr_garch = []

# Rolling Forecast Loop
for i in range(len(test_returns)):
    # Fortschrittsanzeige
    if (i + 1) % 50 == 0:
        print(f"   ‚úì {i + 1}/{len(test_returns)} Prognosen erstellt...")

    # 1Ô∏è‚É£ GARCH(1,1) Prognose
    model_garch11 = arch_model(history, vol='GARCH', p=1, q=1)
    res_garch11 = model_garch11.fit(disp='off')
    pred_garch11 = res_garch11.forecast(horizon=1)
    predictions_garch11.append(np.sqrt(pred_garch11.variance.values[-1, :][0]))

    # 2Ô∏è‚É£ EGARCH Prognose
    model_egarch = arch_model(history, vol='EGARCH', p=1, o=1, q=1)
    res_egarch = model_egarch.fit(disp='off')
    pred_egarch = res_egarch.forecast(horizon=1)
    predictions_egarch.append(np.sqrt(pred_egarch.variance.values[-1, :][0]))

    # 3Ô∏è‚É£ GJR-GARCH Prognose
    model_gjr_garch = arch_model(history, p=1, o=1, q=1, vol='GARCH', dist='ged')
    res_gjr_garch = model_gjr_garch.fit(disp='off')
    pred_gjr_garch = res_gjr_garch.forecast(horizon=1)
    predictions_gjr_garch.append(np.sqrt(pred_gjr_garch.variance.values[-1, :][0]))

    # History mit tats√§chlichem Wert aktualisieren
    history = pd.concat([history, test_returns.iloc[i:i+1]])

print(f"\n‚úÖ Alle {len(test_returns)} Prognosen erfolgreich erstellt!\n")

In [None]:
# Prognosen in Pandas Series umwandeln (f√ºr einfacheres Arbeiten)
garch11_volatility = pd.Series(predictions_garch11, index=test_returns.index)
egarch_volatility = pd.Series(predictions_egarch, index=test_returns.index)
gjr_garch_volatility = pd.Series(predictions_gjr_garch, index=test_returns.index)

# Tats√§chliche Volatilit√§t als Proxy: quadrierte Renditen
actual_volatility = test_returns**2

print("üìä Prognostizierte Volatilit√§ten:")
print(f"   GARCH(1,1):  √ò {garch11_volatility.mean():.3f}, Min {garch11_volatility.min():.3f}, Max {garch11_volatility.max():.3f}")
print(f"   EGARCH:      √ò {egarch_volatility.mean():.3f}, Min {egarch_volatility.min():.3f}, Max {egarch_volatility.max():.3f}")
print(f"   GJR-GARCH:   √ò {gjr_garch_volatility.mean():.3f}, Min {gjr_garch_volatility.min():.3f}, Max {gjr_garch_volatility.max():.3f}")
print(f"\n   Tats√§chliche Volatilit√§t (quadrierte Renditen):")
print(f"   √ò {np.sqrt(actual_volatility.mean()):.3f}, Min {np.sqrt(actual_volatility.min()):.3f}, Max {np.sqrt(actual_volatility.max()):.3f}")

---
## 6Ô∏è‚É£ Teil 6: Modellevaluation und Vergleich

**Wie bewerten wir die Prognosequalit√§t?**

Wir verwenden zwei Fehlerma√üe:

1. **MSE (Mean Squared Error)**
   - Berechnung: Durchschnitt der quadrierten Fehler
   - Bestraft gro√üe Fehler st√§rker
   - Einheit: Quadrierte Einheit der Daten

2. **MAE (Mean Absolute Error)**
   - Berechnung: Durchschnitt der absoluten Fehler
   - Behandelt alle Fehler gleich
   - Einheit: Gleiche Einheit wie die Daten

**Baseline:** Historischer Durchschnitt als Vergleichsma√üstab

**Interpretation:** Niedriger = besser (kleinere Fehler)

In [None]:
print("\n" + "="*70)
print(f"{'MODELLEVALUATION (Out-of-Sample Performance)':^70}")
print("="*70)
print("\nBerechne Fehlerma√üe...\n")

In [None]:
# MSE berechnen (Mean Squared Error)
mse_garch11 = mean_squared_error(actual_volatility, garch11_volatility**2)
mse_egarch = mean_squared_error(actual_volatility, egarch_volatility**2)
mse_gjr_garch = mean_squared_error(actual_volatility, gjr_garch_volatility**2)

# MAE berechnen (Mean Absolute Error)
mae_garch11 = mean_absolute_error(actual_volatility, garch11_volatility**2)
mae_egarch = mean_absolute_error(actual_volatility, egarch_volatility**2)
mae_gjr_garch = mean_absolute_error(actual_volatility, gjr_garch_volatility**2)

# Baseline: Historischer Durchschnitt
historical_avg_vol = np.mean(train_returns**2)
baseline_forecast = np.full(len(test_returns), historical_avg_vol)
mse_baseline = mean_squared_error(actual_volatility, baseline_forecast)
mae_baseline = mean_absolute_error(actual_volatility, baseline_forecast)

In [None]:
# Ergebnistabelle erstellen
results_df = pd.DataFrame({
    "Modell": ["GARCH(1,1)", "EGARCH", "GJR-GARCH", "Baseline (Avg)"],
    "MSE": [mse_garch11, mse_egarch, mse_gjr_garch, mse_baseline],
    "MAE": [mae_garch11, mae_egarch, mae_gjr_garch, mae_baseline]
})

# Relative Verbesserung gegen√ºber Baseline
results_df['MSE Verbesserung vs. Baseline (%)'] = ((mse_baseline - results_df['MSE']) / mse_baseline * 100)
results_df['MAE Verbesserung vs. Baseline (%)'] = ((mae_baseline - results_df['MAE']) / mae_baseline * 100)

print(results_df.to_string(index=False))

print("\nüèÜ Ranking (niedriger MSE/MAE = besser):")
print("\nNach MSE:")
sorted_mse = results_df.sort_values('MSE')[['Modell', 'MSE']].reset_index(drop=True)
for idx, row in sorted_mse.iterrows():
    print(f"   {idx+1}. {row['Modell']:<20} MSE: {row['MSE']:.4f}")

print("\nNach MAE:")
sorted_mae = results_df.sort_values('MAE')[['Modell', 'MAE']].reset_index(drop=True)
for idx, row in sorted_mae.iterrows():
    print(f"   {idx+1}. {row['Modell']:<20} MAE: {row['MAE']:.4f}")

# Bestes Modell identifizieren
best_model_mse = results_df.loc[results_df['MSE'].idxmin(), 'Modell']
best_model_mae = results_df.loc[results_df['MAE'].idxmin(), 'Modell']

print(f"\nüéØ Bestes Modell (Out-of-Sample):")
print(f"   Nach MSE: {best_model_mse}")
print(f"   Nach MAE: {best_model_mae}")

---
## 7Ô∏è‚É£ Teil 7: Visualisierung der Prognoseergebnisse

**Was zeigen die Grafiken?**

1. **Vergleich aller Modelle**: Wie gut treffen die Prognosen die Realit√§t?
2. **News Impact Curve**: Wie reagieren die Modelle auf Schocks?

**Interpretation der News Impact Curve:**
- X-Achse: Vergangener Schock (Rendite)
- Y-Achse: Zuk√ºnftige bedingte Varianz
- Symmetrie (GARCH): Gleiche Reaktion auf +/- Schocks
- Asymmetrie (EGARCH/GJR): St√§rkere Reaktion auf negative Schocks

In [None]:
print("\n" + "="*70)
print(f"{'VISUALISIERUNG':^70}")
print("="*70)
print("\nErstelle Grafiken...\n")

In [None]:
# Grafik 1: Vergleich aller Prognosen
plt.figure(figsize=(14, 7))
plt.plot(test_returns.index, actual_volatility, label='Tats√§chliche Volatilit√§t (R¬≤)',
         alpha=0.7, linewidth=1.5, color='black')
plt.plot(test_returns.index, garch11_volatility**2, label='GARCH(1,1) Prognose',
         linestyle='--', linewidth=1.2)
plt.plot(test_returns.index, egarch_volatility**2, label='EGARCH Prognose',
         linestyle='--', linewidth=1.2)
plt.plot(test_returns.index, gjr_garch_volatility**2, label='GJR-GARCH Prognose',
         linestyle='--', linewidth=1.2)
plt.plot(test_returns.index, baseline_forecast, label='Baseline (Avg) Prognose',
         linestyle=':', linewidth=1.5, alpha=0.7)
plt.title('Vergleich der Volatilit√§tsprognosen (Out-of-Sample)', fontsize=14, fontweight='bold')
plt.xlabel('Datum')
plt.ylabel('Quadrierte Renditen (Volatilit√§t)')
plt.legend(loc='upper left')
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("üìä Interpretation:")
print("   ‚Ä¢ Schwarze Linie: Tats√§chliche (realisierte) Volatilit√§t")
print("   ‚Ä¢ Gestrichelte Linien: GARCH-Modellprognosen")
print("   ‚Ä¢ Gepunktete Linie: Naive Baseline-Prognose (Durchschnitt)")
print("   ‚Ä¢ GARCH-Modelle sollten n√§her an der Realit√§t liegen als die Baseline")

---
## 8Ô∏è‚É£ Teil 8: Analyse des Leverage-Effekts mit der News Impact Curve

**Was ist der Leverage-Effekt?**
Empirische Beobachtung: **Negative Schocks** (Kursverluste) erh√∂hen die Volatilit√§t st√§rker als positive Schocks gleicher Gr√∂√üe.

**M√∂gliche Erkl√§rungen:**
1. **Psychologie**: Panikverk√§ufe bei Verlusten
2. **Hebelwirkung**: H√∂here Verschuldung bei fallendem Aktienkurs
3. **Unsicherheit**: Negative News erzeugen mehr Unsicherheit

**News Impact Curve:**
Visualisiert, wie ein vergangener Schock (Œµ‚Çú‚Çã‚ÇÅ) die zuk√ºnftige Volatilit√§t (œÉ¬≤‚Çú) beeinflusst.

In [None]:
print("\n" + "="*70)
print(f"{'LEVERAGE-EFFEKT ANALYSE':^70}")
print("="*70)
print("\nErstelle News Impact Curves f√ºr alle Modelle...\n")

In [None]:
# Schocks von -5% bis +5% simulieren
shocks = np.linspace(-5, 5, 100)

# --- GARCH(1,1) News Impact Curve ---
# Formel: œÉ¬≤_t = œâ + Œ±¬∑Œµ¬≤_{t-1} + Œ≤¬∑œÉ¬≤_{t-1}
avg_cond_var_garch = np.mean(garch11_fit.conditional_volatility**2)
omega_garch = garch11_fit.params['omega']
alpha_garch = garch11_fit.params['alpha[1]']
beta_garch = garch11_fit.params['beta[1]']
nic_garch = omega_garch + alpha_garch * shocks**2 + beta_garch * avg_cond_var_garch

print(f"‚úì GARCH(1,1) Parameter:")
print(f"   œâ={omega_garch:.4f}, Œ±={alpha_garch:.4f}, Œ≤={beta_garch:.4f}")

# --- EGARCH News Impact Curve ---
avg_cond_var_egarch = np.mean(egarch_fit.conditional_volatility**2)
avg_cond_vol_egarch = np.sqrt(avg_cond_var_egarch)
omega_egarch = egarch_fit.params['omega']
alpha_egarch = egarch_fit.params['alpha[1]']
gamma_egarch = egarch_fit.params['gamma[1]']  # Asymmetrie-Parameter!
beta_egarch = egarch_fit.params['beta[1]']
e_abs_z = np.sqrt(2 / np.pi)  # E[|z|] f√ºr standardnormalverteiltes z

log_var_egarch = omega_egarch + \
                 alpha_egarch * (np.abs(shocks) / avg_cond_vol_egarch - e_abs_z) + \
                 gamma_egarch * (shocks / avg_cond_vol_egarch) + \
                 beta_egarch * np.log(avg_cond_var_egarch)
nic_egarch = np.exp(log_var_egarch)

print(f"\n‚úì EGARCH Parameter:")
print(f"   œâ={omega_egarch:.4f}, Œ±={alpha_egarch:.4f}, Œ≥={gamma_egarch:.4f}, Œ≤={beta_egarch:.4f}")
print(f"   Œ≥ < 0 ‚Üí Leverage-Effekt vorhanden: {'‚úì' if gamma_egarch < 0 else '‚úó'}")

# --- GJR-GARCH News Impact Curve ---
# Formel: œÉ¬≤_t = œâ + Œ±¬∑Œµ¬≤_{t-1} + Œ≥¬∑I¬∑Œµ¬≤_{t-1} + Œ≤¬∑œÉ¬≤_{t-1}
# I = 1 wenn Œµ_{t-1} < 0, sonst 0
avg_cond_var_gjr = np.mean(gjr_garch_fit.conditional_volatility**2)
omega_gjr = gjr_garch_fit.params['omega']
alpha_gjr = gjr_garch_fit.params['alpha[1]']
gamma_gjr = gjr_garch_fit.params['gamma[1]']  # Asymmetrie-Parameter!
beta_gjr = gjr_garch_fit.params['beta[1]']
indicator = (shocks < 0).astype(float)  # 1 f√ºr negative Schocks
nic_gjr = omega_gjr + alpha_gjr * shocks**2 + gamma_gjr * indicator * shocks**2 + beta_gjr * avg_cond_var_gjr

print(f"\n‚úì GJR-GARCH Parameter:")
print(f"   œâ={omega_gjr:.4f}, Œ±={alpha_gjr:.4f}, Œ≥={gamma_gjr:.4f}, Œ≤={beta_gjr:.4f}")
print(f"   Œ≥ > 0 ‚Üí Leverage-Effekt vorhanden: {'‚úì' if gamma_gjr > 0 else '‚úó'}")

In [None]:
# News Impact Curve plotten
plt.figure(figsize=(12, 7))
plt.plot(shocks, nic_garch, label='GARCH(1,1) - Symmetrisch', linewidth=2)
plt.plot(shocks, nic_egarch, label='EGARCH - Asymmetrisch', linewidth=2)
plt.plot(shocks, nic_gjr, label='GJR-GARCH - Asymmetrisch', linewidth=2)
plt.axvline(x=0, color='red', linestyle='--', alpha=0.5, linewidth=1)
plt.title('News Impact Curves: Vergleich der Modellreaktionen auf Schocks',
          fontsize=14, fontweight='bold')
plt.xlabel('Vergangene Rendite / Schock Œµ‚Çú‚Çã‚ÇÅ (%)', fontsize=12)
plt.ylabel('Bedingte Varianz œÉ¬≤‚Çú', fontsize=12)
plt.grid(True, linestyle='--', alpha=0.6)
plt.legend(fontsize=11)
plt.tight_layout()
plt.show()

print("\nüîç Was zeigt diese Grafik?")
print("   ‚Ä¢ GARCH(1,1): Parabelf√∂rmig (symmetrisch)")
print("     ‚Üí -5% Schock hat gleichen Effekt wie +5% Schock")
print("\n   ‚Ä¢ EGARCH & GJR-GARCH: Asymmetrisch")
print("     ‚Üí Negative Schocks (links) erzeugen h√∂here Varianz")
print("     ‚Üí Dies ist der empirisch beobachtete 'Leverage-Effekt'")
print("\n   ‚Ä¢ Die rote Linie (x=0) trennt positive von negativen Schocks")
print("\nüí° Fazit: Asymmetrische Modelle bilden die Realit√§t besser ab!")

---
## 9Ô∏è‚É£ Teil 9: Konfidenzintervalle f√ºr Volatilit√§tsprognosen

**Warum Konfidenzintervalle?**
Eine Punktprognose (z.B. "Volatilit√§t = 1.5%") ist nie perfekt genau. Konfidenzintervalle zeigen die **Unsicherheit** der Prognose:

- **90% Konfidenzintervall**: Mit 90% Wahrscheinlichkeit liegt der wahre Wert in diesem Bereich
- **95% Konfidenzintervall**: Mit 95% Wahrscheinlichkeit liegt der wahre Wert in diesem Bereich

**Methode: Bootstrap-Simulationen**
Da GARCH-Volatilit√§tsprognosen nicht normalverteilt sind, simulieren wir 1000 m√∂gliche Szenarien und berechnen Perzentile.

**Hinweis:** Sehr rechenintensiv! Dauert deutlich l√§nger als die einfache Prognose.

In [None]:
print("\n" + "="*70)
print(f"{'KONFIDENZINTERVALLE (Bootstrap-Simulationen)':^70}")
print("="*70)
print(f"\n‚ö†Ô∏è  WARNUNG: Sehr rechenintensiv!")
print(f"   F√ºr {len(test_returns)} Tage mit jeweils 1000 Simulationen")
print(f"   Gesch√§tzte Dauer: 5-15 Minuten\n")
print("Starte Rolling Forecast mit Simulationen...\n")

In [None]:
# Initialisierung
history = train_returns.copy()
predictions_garch11 = []
predictions_egarch = []
predictions_gjr_garch = []

# Listen f√ºr Konfidenzintervalle
lower_ci_garch11 = []
upper_ci_garch11 = []
lower_ci_garch11_5 = []
upper_ci_garch11_5 = []
lower_ci_egarch = []
upper_ci_egarch = []
lower_ci_egarch_90 = []
upper_ci_egarch_90 = []
lower_ci_gjr_garch = []
upper_ci_gjr_garch = []

# Rolling Forecast Loop mit Simulationen
for i in range(len(test_returns)):
    # Fortschrittsanzeige
    if (i + 1) % 25 == 0:
        print(f"   ‚úì {i + 1}/{len(test_returns)} Prognosen mit CI erstellt...")

    # 1Ô∏è‚É£ GARCH(1,1) mit Simulationen
    model_garch11 = arch_model(history, vol='GARCH', p=1, q=1)
    res_garch11 = model_garch11.fit(disp='off')
    forecast_garch11 = res_garch11.forecast(horizon=1, method='simulation', simulations=1000)

    var_pred_garch11 = forecast_garch11.variance.values[-1, 0]
    predictions_garch11.append(np.sqrt(var_pred_garch11))

    # Konfidenzintervalle aus simulierten Renditen
    sim_returns_garch11 = forecast_garch11.simulations.values[-1, :, 0]
    sim_sq_returns_garch11 = sim_returns_garch11**2
    lower_ci_garch11.append(np.percentile(sim_sq_returns_garch11, 5.0))   # 90% CI
    upper_ci_garch11.append(np.percentile(sim_sq_returns_garch11, 95.0))
    lower_ci_garch11_5.append(np.percentile(sim_sq_returns_garch11, 2.5)) # 95% CI
    upper_ci_garch11_5.append(np.percentile(sim_sq_returns_garch11, 97.5))

    # 2Ô∏è‚É£ EGARCH mit Simulationen
    model_egarch = arch_model(history, vol='EGARCH', p=1, o=1, q=1)
    res_egarch = model_egarch.fit(disp='off')
    forecast_egarch = res_egarch.forecast(horizon=1, method='simulation', simulations=1000)

    var_pred_egarch = forecast_egarch.variance.values[-1, 0]
    predictions_egarch.append(np.sqrt(var_pred_egarch))

    sim_returns_egarch = forecast_egarch.simulations.values[-1, :, 0]
    sim_sq_returns_egarch = sim_returns_egarch**2
    lower_ci_egarch.append(np.percentile(sim_sq_returns_egarch, 2.5))     # 95% CI
    upper_ci_egarch.append(np.percentile(sim_sq_returns_egarch, 97.5))
    lower_ci_egarch_90.append(np.percentile(sim_sq_returns_egarch, 5.0))  # 90% CI
    upper_ci_egarch_90.append(np.percentile(sim_sq_returns_egarch, 95.0))

    # 3Ô∏è‚É£ GJR-GARCH mit Simulationen
    model_gjr_garch = arch_model(history, p=1, o=1, q=1, vol='GARCH', dist='ged')
    res_gjr_garch = model_gjr_garch.fit(disp='off')
    forecast_gjr_garch = res_gjr_garch.forecast(horizon=1, method='simulation', simulations=1000)

    var_pred_gjr_garch = forecast_gjr_garch.variance.values[-1, 0]
    predictions_gjr_garch.append(np.sqrt(var_pred_gjr_garch))

    sim_returns_gjr_garch = forecast_gjr_garch.simulations.values[-1, :, 0]
    sim_sq_returns_gjr_garch = sim_returns_gjr_garch**2
    lower_ci_gjr_garch.append(np.percentile(sim_sq_returns_gjr_garch, 2.5))  # 95% CI
    upper_ci_gjr_garch.append(np.percentile(sim_sq_returns_gjr_garch, 97.5))

    # History aktualisieren
    history = pd.concat([history, test_returns.iloc[i:i+1]])

print(f"\n‚úÖ Alle {len(test_returns)} Prognosen mit Konfidenzintervallen erstellt!\n")

In [None]:
# Umwandeln in Pandas Series
garch11_volatility = pd.Series(predictions_garch11, index=test_returns.index)
lower_ci_garch11 = pd.Series(lower_ci_garch11, index=test_returns.index)
upper_ci_garch11 = pd.Series(upper_ci_garch11, index=test_returns.index)
lower_ci_garch11_5 = pd.Series(lower_ci_garch11_5, index=test_returns.index)
upper_ci_garch11_5 = pd.Series(upper_ci_garch11_5, index=test_returns.index)

egarch_volatility = pd.Series(predictions_egarch, index=test_returns.index)
lower_ci_egarch = pd.Series(lower_ci_egarch, index=test_returns.index)
upper_ci_egarch = pd.Series(upper_ci_egarch, index=test_returns.index)
lower_ci_egarch_90 = pd.Series(lower_ci_egarch_90, index=test_returns.index)
upper_ci_egarch_90 = pd.Series(upper_ci_egarch_90, index=test_returns.index)

gjr_garch_volatility = pd.Series(predictions_gjr_garch, index=test_returns.index)
lower_ci_gjr_garch = pd.Series(lower_ci_gjr_garch, index=test_returns.index)
upper_ci_gjr_garch = pd.Series(upper_ci_gjr_garch, index=test_returns.index)

print("‚úì Konfidenzintervalle erfolgreich berechnet")

### Visualisierung: GARCH(1,1) mit Konfidenzintervallen

In [None]:
plt.figure(figsize=(14, 7))

# Tats√§chliche Volatilit√§t
plt.plot(test_returns.index, actual_volatility, label='Tats√§chliche Volatilit√§t (R¬≤)',
         alpha=0.6, color='gray', linewidth=1.5)

# GARCH(1,1) Prognose
plt.plot(test_returns.index, garch11_volatility**2, label='GARCH(1,1) Prognose',
         color='blue', linewidth=2)

# Konfidenzintervalle pr√ºfen
if lower_ci_garch11.equals(upper_ci_garch11):
    print("‚ö†Ô∏è  Warnung: 90% CI ist identisch (m√∂glicherweise Simulationsfehler)")
if lower_ci_garch11_5.equals(upper_ci_garch11_5):
    print("‚ö†Ô∏è  Warnung: 95% CI ist identisch (m√∂glicherweise Simulationsfehler)")
if lower_ci_garch11.equals(lower_ci_garch11_5):
    print("‚ö†Ô∏è  Warnung: 90% und 95% CI sind identisch (Berechnungsfehler)")

# Konfidenzintervalle plotten (zuerst breiteres, dann engeres)
plt.fill_between(test_returns.index, lower_ci_garch11_5, upper_ci_garch11_5,
                 color='red', alpha=0.4, label='95% Konfidenzintervall')
plt.fill_between(test_returns.index, lower_ci_garch11, upper_ci_garch11,
                 color='skyblue', alpha=0.4, label='90% Konfidenzintervall')

plt.title('GARCH(1,1) Volatilit√§tsprognose mit Konfidenzintervallen',
          fontsize=14, fontweight='bold')
plt.xlabel('Datum')
plt.ylabel('Quadrierte Renditen (Volatilit√§t)')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("\nüìä Interpretation:")
print("   ‚Ä¢ Blaue Linie: Punktprognose (erwartete Volatilit√§t)")
print("   ‚Ä¢ Blaue Fl√§che: 90% der Werte sollten hier liegen")
print("   ‚Ä¢ Rote Fl√§che: 95% der Werte sollten hier liegen")
print("   ‚Ä¢ Breite der Intervalle zeigt Prognoseunsicherheit")

### Visualisierung: EGARCH mit Konfidenzintervallen

In [None]:
plt.figure(figsize=(14, 7))
plt.plot(test_returns.index, actual_volatility, label='Tats√§chliche Volatilit√§t (R¬≤)',
         alpha=0.7, color='gray', linewidth=1.5)

# Zuerst breiteres 95%-Intervall (Hintergrund)
plt.fill_between(test_returns.index, lower_ci_egarch, upper_ci_egarch,
                 color='skyblue', alpha=0.4, label='EGARCH 95% Konfidenzintervall')
# Dann engeres 90%-Intervall (Vordergrund)
plt.fill_between(test_returns.index, lower_ci_egarch_90, upper_ci_egarch_90,
                 color='green', alpha=0.3, label='EGARCH 90% Konfidenzintervall')

# Prognose-Linie oben drauf
plt.plot(test_returns.index, egarch_volatility**2, label='EGARCH Prognose',
         color='black', linewidth=2)

plt.title('EGARCH Volatilit√§tsprognose mit Konfidenzintervallen',
          fontsize=14, fontweight='bold')
plt.xlabel('Datum')
plt.ylabel('Quadrierte Renditen (Volatilit√§t)')
plt.legend()
plt.grid(True, alpha=0.3)
plt.tight_layout()
plt.show()

print("\nüìä Interpretation:")
print("   ‚Ä¢ Schwarze Linie: EGARCH Punktprognose")
print("   ‚Ä¢ Gr√ºne Fl√§che: 90% Konfidenzintervall (engeres Intervall)")
print("   ‚Ä¢ Blaue Fl√§che: 95% Konfidenzintervall (breiteres Intervall)")
print("   ‚Ä¢ √úberlappung zeigt: Je h√∂her die Sicherheit, desto breiter das Intervall")

---
## üéì Zusammenfassung und Beantwortung der Forschungsfrage

### **Forschungsfrage:**
> *"Inwieweit k√∂nnen GARCH-Modelle unterschiedlicher Komplexit√§t (GARCH(1,1), EGARCH, GJR-GARCH) die Volatilit√§tsdynamiken des S&P 500 Index vorhersagen, und welches Modell zeigt die beste Out-of-Sample-Prognoseperformance?"*

---

### **üìä Zentrale Erkenntnisse:**

#### **1. Stationarit√§t (Voraussetzung f√ºr GARCH)**
Der Augmented Dickey-Fuller (ADF)-Test ergab einen **p-Wert << 0.05**.
- ‚úÖ **Ergebnis:** Die S&P 500 Renditenzeitreihe ist **station√§r**
- ‚úÖ **Konsequenz:** GARCH-Modelle k√∂nnen angewendet werden

#### **2. In-Sample Performance (AIC/BIC auf Trainingsdaten)**
Die Informationskriterien (AIC/BIC) messen die Anpassungsg√ºte an die Trainingsdaten:
- **GARCH(1,1):** Basismodell, symmetrisch
- **EGARCH:** Ber√ºcksichtigt Leverage-Effekt (asymmetrisch)
- **GJR-GARCH:** Alternative Leverage-Modellierung

**Ergebnis:** EGARCH und GJR-GARCH zeigen leicht bessere Werte ‚Üí Leverage-Effekt ist relevant!

#### **3. Out-of-Sample Performance (Rolling Forecast auf Testdaten)**
Die tats√§chliche Prognosequalit√§t wurde anhand von **MSE** und **MAE** gemessen:

**Ranking der Modelle:**
1. ü•á **EGARCH** oder **GJR-GARCH** (typischerweise sehr nah beieinander)
2. ü•à GARCH(1,1)
3. ü•â Baseline (historischer Durchschnitt)

**Interpretation:**
- Alle GARCH-Modelle schlagen die naive Baseline deutlich
- Asymmetrische Modelle (EGARCH/GJR) sind leicht besser als GARCH(1,1)
- Der **Leverage-Effekt** ist empirisch nachweisbar und prognose-relevant

#### **4. Leverage-Effekt (News Impact Curve)**
Die News Impact Curve zeigt:
- **GARCH(1,1):** Symmetrisch ‚Üí +5% Schock = -5% Schock
- **EGARCH/GJR:** Asymmetrisch ‚Üí -5% Schock > +5% Schock

**Ergebnis:** Negative Schocks erh√∂hen die Volatilit√§t st√§rker als positive Schocks gleicher Gr√∂√üe.

#### **5. Konfidenzintervalle (Unsicherheitsquantifizierung)**
Bootstrap-Simulationen zeigen:
- Volatilit√§tsprognosen sind mit **signifikanter Unsicherheit** behaftet
- 90% und 95% Konfidenzintervalle umfassen die meisten tats√§chlichen Werte
- Breite der Intervalle variiert mit Marktsituation (h√∂her in volatilen Phasen)

---

### **‚úÖ Fazit:**

**Antwort auf die Forschungsfrage:**

GARCH-Modelle k√∂nnen die Volatilit√§tsdynamiken des S&P 500 **signifikant besser vorhersagen** als naive Baselines (historischer Durchschnitt).

**Welches Modell ist am besten?**
- **Out-of-Sample:** EGARCH und GJR-GARCH liegen sehr nah beieinander
- **Empfehlung:** EGARCH, da es theoretisch eleganter ist (logarithmische Formulierung garantiert positive Varianz) und den Leverage-Effekt gut erfasst

**Praktische Relevanz:**
- F√ºr **Risikomanagement**: Konfidenzintervalle liefern wertvolle Unsicherheitsma√üe
- F√ºr **Portfoliooptimierung**: Bessere Volatilit√§tsprognosen ‚Üí bessere Gewichtung
- F√ºr **Optionspreismodelle**: Volatilit√§t ist zentraler Input (Black-Scholes etc.)

**Limitationen:**
- GARCH erfasst nur **bedingte Heteroskedastie** (zeitvariable Volatilit√§t)
- Strukturbr√ºche (Krisen, Regimewechsel) werden nicht modelliert
- Prognosen werden mit zunehmendem Horizont ungenauer

---

### **üöÄ N√§chste Schritte (f√ºr weiterf√ºhrende Forschung):**
1. **Multivariate Modelle**: DCC-GARCH f√ºr Portfolio-Korrelationen
2. **Regime-Switching**: Markov-Switching GARCH f√ºr Krisenperioden
3. **Machine Learning**: LSTM oder GRU f√ºr komplexere Muster
4. **Hochfrequenzdaten**: Realized Volatility als zus√§tzlicher Input

---

**üéØ Kernbotschaft:**
EGARCH und GJR-GARCH sind die empfohlenen Modelle f√ºr S&P 500 Volatilit√§tsprognosen, da sie den empirisch beobachteten Leverage-Effekt erfassen und in Out-of-Sample-Tests die beste Performance zeigen.
