# Modellierung: Goldpreisänderung vorhersagen

## 1. Datenvorbereitung

In [15]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

In [16]:
import pandas as pd
import os

def load_and_prepare_safe(file_path, date_format=None):
    """
    Lädt eine CSV-Datei, benennt die erste Spalte in 'Date' um, konvertiert sie in Datumsformat,
    entfernt fehlerhafte Zeilen und gibt ein vorbereitetes DataFrame zurück.

    Parameter:
    file_path : str – Pfad zur CSV-Datei
    date_format : str – optionales Datumsformat (z. B. '%Y-%m-%d')

    Rückgabe:
    DataFrame oder None bei Fehler
    """
    if not os.path.exists(file_path):
        print(f"❌ Datei nicht gefunden: {file_path}")
        return None

    try:
        df = pd.read_csv(file_path)
        first_col = df.columns[0]
        df.rename(columns={first_col: 'Date'}, inplace=True)
        df['Date'] = pd.to_datetime(df['Date'], format=date_format, errors='coerce').dt.date
        df.dropna(subset=['Date'], inplace=True)
        print(f"✔️ {len(df)} Zeilen erfolgreich geladen und vorbereitet.")
        return df
    except Exception as e:
        print(f"❗ Fehler beim Laden/Verarbeiten der Datei: {e}")
        return None


In [17]:
df_gold = load_and_prepare_safe("gold_bereit - Kopie.csv")

❌ Datei nicht gefunden: gold_bereit - Kopie.csv


In [None]:
merged_df_updated.columns

In [3]:
class Normalizer:
    def __init__(self):
        self.mu = None
        self.sd = None

    def fit_transform(self, x):
        """
        Führt Normalisierung (Standardisierung) der Eingabedaten durch:
        (x - Mittelwert) / Standardabweichung
        """
        self.mu = np.mean(x, axis=0, keepdims=True)
        self.sd = np.std(x, axis=0, keepdims=True)
        normalized_x = (x - self.mu) / self.sd
        return normalized_x

    def transform(self, x):
        """
        Wendet die zuvor berechneten Normalisierungsparameter an.
        """
        return (x - self.mu) / self.sd

    def inverse_transform(self, x):
        """
        Wandelt normalisierte Daten zurück in die Originalskala:
        (x * Standardabweichung) + Mittelwert
        """
        return (x * self.sd) + self.mu

In [4]:
# Angenommen X enthält die Features, y die Zielwerte (z. B. gold_tagesrendite)
X_train, X_test, y_train, y_test = train_test_split(
    X, y, 
    test_size=0.2,         # 20 % Testdaten
    random_state=42,       # für Reproduzierbarkeit
    shuffle=True           # wichtig für Zeitreihen nur wenn kein Zeitbezug!
)


NameError: name 'X' is not defined

## 2.Funktion zum CSV-Export und lokalen Download