# Projekt: Aktien-Analyse-Dashboard - DAV

Dieses Notebook ist für die Präsentation der Beschaffung, Verarbeitung und Anreicherung von Aktienkursdaten zuständig. Die hier erzeugten CSV-Dateien dienen als Datenquelle für mein interaktives Tableau-Dashboard. Es wurde als Projekt Arbeit für den Kurs "Datenaufbereitung und -verarbeitung" (Menden/ Butscher) THWS 2025 erstellt.

**Prozess-Schritte:**
1.  **Konfiguration:** Definition der Aktien (Ticker), des Zeitraums und technischer Parameter.
2.  **Datenabruf:** Abruf der Kursdaten und Unternehmensinformationen via `yfinance`.
3.  **Feature Engineering:** Berechnung von über 30 Kennzahlen und Signalen (z.B. gleitende Durchschnitte, RSI, MACD, Volatilität).
4.  **Datenbereinigung:** Sicherstellung der Datenqualität für die Visualisierung.
5.  **Speicherung:** Export der aufbereiteten Daten in zwei CSV-Dateien.

# Bibliotheken

**yfinance:** Erste Berührungspunkte in Taipeh bei der eigenständigen Erstellung von Backtesting-Programmen für Trading-Algorithmen.

**pandas:** Die Nutzung war erforderlich und auch notwendig, da es sich um die wichtigste Bibliothek für die Datenverarbeitung handelt.

**numpy:** Ebenfalls zwingend erforderlich und wurde für komplexere Berechnungen eingesetzt.

In [4]:
import yfinance as yf
import pandas as pd
import numpy as np

ModuleNotFoundError: No module named 'yfinance'

# 1. Konfiguration
Hier werden alle zentralen Parameter definiert. Das macht den Code flexibel und leicht anpassbar, ohne die Logik ändern zu müssen.

In [None]:
TICKERS = ['AAPL', 'MSFT', 'TSLA', 'NVDA', 'GOOGL', 'AMZN']
START_DATE = '2020-01-01'
END_DATE = '2024-12-31'

MA_WINDOWS = [12, 21, 50, 100, 200]
RSI_PERIOD = 14
MACD_FAST = 12
MACD_SLOW = 26
MACD_SIGNAL = 9
BOLLINGER_WINDOW = 20
BOLLINGER_STD = 2
VOLATILITY_WINDOW = 20
VOLATILITY_HISTORY = 252

# 2. Hilfsfunktionen
Wir definieren unsere Logik in wiederverwendbaren Funktionen. Das hält den Hauptteil des Skripts sauber und lesbar.
- `get_ticker_info`: Holt Stammdaten wie Name, Sektor etc.
- `calculate_indicators`: Das Herzstück – hier werden alle technischen Kennzahlen berechnet.
- `classify_signals`: Übersetzt die Kennzahlen in einfach verständliche Signale (z.B. "Überkauft", "Stabiler Aufwärtstrend").

In [None]:
def get_ticker_info(ticker_symbol):
    try:
        ticker = yf.Ticker(ticker_symbol)
        info = ticker.info
        return {
            'Ticker': ticker_symbol,
            'Name': info.get('longName', 'N/A'),
            'Sektor': info.get('sector', 'N/A'),
            'Branche': info.get('industry', 'N/A'),
            'Land': info.get('country', 'N/A'),
            'Website': info.get('website', 'N/A')
        }
    except Exception as e:
        return {
            'Ticker': ticker_symbol,
            'Name': 'N/A', 'Sektor': 'N/A', 'Branche': 'N/A', 'Land': 'N/A', 'Website': 'N/A'
        }


def calculate_indicators(df):
    for window in MA_WINDOWS:
        df[f'MA{window}'] = df['Close'].rolling(window=window).mean()

    # Tägliche Rendite und Volatilität
    df['Return'] = df['Close'].pct_change()

    # Rollierende Standardabweichung der täglichen Renditen
    rolling_std = df['Return'].rolling(window=VOLATILITY_WINDOW).std()
    # Annualisieren
    df['Volatility'] = rolling_std * np.sqrt(252)

    # RSI (Relative Strength Index)
    delta = df['Close'].diff()
    gain = (delta.where(delta > 0, 0)).rolling(window=RSI_PERIOD).mean()
    loss = (-delta.where(delta < 0, 0)).rolling(window=RSI_PERIOD).mean()
    rs = gain / loss
    df['RSI'] = 100 - (100 / (1 + rs))

    # MACD (Moving Average Convergence Divergence)
    ema_fast = df['Close'].ewm(span=MACD_FAST, adjust=False).mean()
    ema_slow = df['Close'].ewm(span=MACD_SLOW, adjust=False).mean()
    df['MACD'] = ema_fast - ema_slow
    df['MACD_Signal'] = df['MACD'].ewm(span=MACD_SIGNAL, adjust=False).mean()
    df['MACD_Hist'] = df['MACD'] - df['MACD_Signal']

    # Bollinger Bänder
    df['Bollinger_Mid'] = df['Close'].rolling(window=BOLLINGER_WINDOW).mean()
    df['Bollinger_Std'] = df['Close'].rolling(window=BOLLINGER_WINDOW).std()
    df['Bollinger_Upper'] = df['Bollinger_Mid'] + (df['Bollinger_Std'] * BOLLINGER_STD)
    df['Bollinger_Lower'] = df['Bollinger_Mid'] - (df['Bollinger_Std'] * BOLLINGER_STD)

    # Normalisierter Kurs
    df['Norm_Close'] = df['Close'] / df['Close'].iloc[0] * 100

    return df


def classify_signals(df):

    # Golden Cross / Death Cross Signal (mit NaN-Behandlung)
    df['Trend_Signal'] = np.nan
    df.loc[df['MA50'] > df['MA200'], 'Trend_Signal'] = 'Bullish (Golden Cross)'
    df.loc[df['MA50'] < df['MA200'], 'Trend_Signal'] = 'Bearish (Death Cross)'

    # RSI Status
    df['RSI_Status'] = 'Neutral'
    if 'RSI' in df.columns:
        df.loc[df['RSI'] > 70, 'RSI_Status'] = 'Überkauft'
        df.loc[df['RSI'] < 30, 'RSI_Status'] = 'Überverkauft'

    df['Sentiment'] = 'Seitwärts / Neutral'

    if 'Volatility' in df.columns:
        vol_q75 = df['Volatility'].rolling(window=VOLATILITY_HISTORY, min_periods=1).quantile(0.75)
        vol_q25 = df['Volatility'].rolling(window=VOLATILITY_HISTORY, min_periods=1).quantile(0.25)

        conditions = [
            (df['Trend_Signal'] == 'Bullish (Golden Cross)') & (df['Volatility'] < vol_q25),
            (df['Trend_Signal'] == 'Bullish (Golden Cross)') & (df['Volatility'] > vol_q75),
            (df['Trend_Signal'] == 'Bearish (Death Cross)') & (df['Volatility'] > vol_q75),
            (df['Trend_Signal'] == 'Bearish (Death Cross)') & (df['Volatility'] < vol_q25)
        ]
        choices = [
            'Stabiler Aufwärtstrend',
            'Volatiler Aufwärtstrend',
            'Panischer Abwärtstrend',
            'Schwacher Abwärtstrend'
        ]

        mask = df['Trend_Signal'].notna() & df['Volatility'].notna() & vol_q25.notna() & vol_q75.notna()

        df.loc[mask, 'Sentiment'] = np.select(
            [c[mask] for c in conditions],
            choices,
            default='Seitwärts / Neutral'
        )

    return df

# 3. Daten-Pipeline ausführen
Jetzt werden die Funktionen in einer Schleife für jeden Ticker auf aufgerufen. Der Fortschritt wird live ausgegeben.

In [None]:
all_data = []
all_info = []

for ticker in TICKERS:
    # Statische Infos abrufen
    info_data = get_ticker_info(ticker)
    all_info.append(info_data)

    # Historische Kursdaten abrufen
    try:
        yf_ticker = yf.Ticker(ticker)
        data = yf_ticker.history(start=START_DATE, end=END_DATE, auto_adjust=True)
    except Exception as e:
        print(f"Fehler beim Download für {ticker}: {e}")
        continue

    if not isinstance(data, pd.DataFrame) or data.empty:
        print(f" Keine gültigen DataFrame-Daten für {ticker} empfangen - überspringe.")
        continue

    data.reset_index(inplace=True)

    cols_to_numeric = ['Open', 'High', 'Low', 'Close', 'Volume']

    for col in cols_to_numeric:
        if col in data.columns:
            try:
                data[col] = pd.to_numeric(data[col], errors='coerce')
            except TypeError:
                print(f"TICKER: {ticker}, SPALTE: '{col}'")
                print(f"Der Datentyp des 'data'-Objekts ist: {type(data)}")
                print(f"Die Spalten des 'data'-Objekts sind: {data.columns.to_list()}")
                print(f"Der Datentyp der problematischen Spalte '{col}' ist: {type(data[col])}")
                print(data[col].head())
                raise
        else:
            print(f"Hinweis: Spalte '{col}' wurde in den Daten für {ticker} nicht gefunden.")

    original_rows = len(data)
    data.dropna(subset=['Close'], inplace=True)
    if len(data) < original_rows:
        print(f" {original_rows - len(data)} fehlerhafte Zeile(n) für {ticker} entfernt.")

    # Indikatoren berechnen
    data = calculate_indicators(data)

    # Signale klassifizieren
    data = classify_signals(data)

    # Daten für Zusammenführung vorbereiten
    data['Ticker'] = ticker
    all_data.append(data)

# 4. Finale Daten zusammenführen und speichern
Die individuellen Daten der Ticker werden in zwei finale DataFrames kombiniert und als CSV-Dateien gespeichert.

In [None]:
# Erzeuge finale DataFrames
final_df = pd.concat(all_data, ignore_index=True)
info_df = pd.DataFrame(all_info)

# Bereinige Spalten
final_df.drop(columns=['Bollinger_Std'], inplace=True, errors='ignore')

# Speichere die Ergebnisse als CSV-Dateien
final_df.to_csv("aktien_dashboard_enhanced.csv", index=False, float_format="%.4f")
info_df.to_csv("ticker_info_dynamic.csv", index=False)