In [5]:
# Bibliotheken importieren
import sys
import os
import pandas as pd
import numpy as np

# Pfad zum Projektverzeichnis hinzufügen
sys.path.append(os.path.abspath(".."))

# Verbindung zur Datenbank herstellen
from database.db_connection import DatabaseConnector

# Datenbankverbindung aufbauen
db_connector = DatabaseConnector()
engine = db_connector.get_engine()  # SQLAlchemy Engine holen

# SQL-Queries zum Laden der Daten
query_forecast = "SELECT * FROM historical_forecast;"
query_weather = "SELECT * FROM historical_weather;"

# Daten laden
forecast_df = pd.read_sql(query_forecast, engine)
weather_df = pd.read_sql(query_weather, engine)

# Überblick über die Forecast-Daten
print("=== Forecast DataFrame ===")
print(forecast_df.info())  # Struktur der Daten
print(forecast_df.head())  # Erste 5 Zeilen anzeigen

# Überblick über die Wetter-Daten
print("\n=== Weather DataFrame ===")
print(weather_df.info())  # Struktur der Daten
print(weather_df.head())  # Erste 5 Zeilen anzeigen


=== Forecast DataFrame ===
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 336 entries, 0 to 335
Data columns (total 21 columns):
 #   Column                  Non-Null Count  Dtype         
---  ------                  --------------  -----         
 0   id                      336 non-null    int64         
 1   datetime                336 non-null    datetime64[ns]
 2   temperature_2m          336 non-null    float64       
 3   relative_humidity_2m    336 non-null    float64       
 4   precipitation           336 non-null    float64       
 5   rain                    336 non-null    float64       
 6   snowfall                336 non-null    float64       
 7   snow_depth              336 non-null    float64       
 8   weather_code            336 non-null    float64       
 9   pressure_msl            336 non-null    float64       
 10  surface_pressure        336 non-null    float64       
 11  cloud_cover             336 non-null    float64       
 12  cloud_cover_low        

In [6]:
# Fehlende Werte prüfen
print("\nFehlende Werte in Forecast-Daten:")
print(forecast_df.isnull().sum())  # Anzahl fehlender Werte pro Spalte

print("\nFehlende Werte in Weather-Daten:")
print(weather_df.isnull().sum())  # Anzahl fehlender Werte pro Spalte


Fehlende Werte in Forecast-Daten:
id                        0
datetime                  0
temperature_2m            0
relative_humidity_2m      0
precipitation             0
rain                      0
snowfall                  0
snow_depth                0
weather_code              0
pressure_msl              0
surface_pressure          0
cloud_cover               0
cloud_cover_low           0
cloud_cover_mid           0
cloud_cover_high          0
visibility                0
wind_speed_10m            0
wind_direction_10m        0
wind_gusts_10m            0
soil_temperature_0cm      0
soil_moisture_0_to_1cm    0
dtype: int64

Fehlende Werte in Weather-Daten:
id                            0
datetime                      0
temperature_2m                0
relative_humidity_2m          0
precipitation                 0
rain                          0
snowfall                      0
snow_depth                   23
weather_code                  0
pressure_msl                  0
surface_pr

In [7]:
# Duplikate prüfen
print("\nAnzahl Duplikate in Forecast-Daten:")
print(forecast_df.duplicated().sum())  # Anzahl der Duplikate

print("\nAnzahl Duplikate in Weather-Daten:")
print(weather_df.duplicated().sum())  # Anzahl der Duplikate



Anzahl Duplikate in Forecast-Daten:
0

Anzahl Duplikate in Weather-Daten:
0


In [8]:
# Statistische Kennzahlen der Forecast-Daten
print("\nStatistische Zusammenfassung der Forecast-Daten:")
print(forecast_df.describe())  # Deskriptive Statistiken

# Statistische Kennzahlen der Weather-Daten
print("\nStatistische Zusammenfassung der Weather-Daten:")
print(weather_df.describe())  # Deskriptive Statistiken



Statistische Zusammenfassung der Forecast-Daten:
               id             datetime  temperature_2m  relative_humidity_2m  \
count  336.000000                  336      336.000000            336.000000   
mean   168.500000  2024-12-20 23:30:00        2.382738             84.967262   
min      1.000000  2024-12-14 00:00:00       -2.700000             56.000000   
25%     84.750000  2024-12-17 11:45:00        0.500000             80.000000   
50%    168.500000  2024-12-20 23:30:00        2.300000             86.000000   
75%    252.250000  2024-12-24 11:15:00        3.900000             92.000000   
max    336.000000  2024-12-27 23:00:00        9.500000            100.000000   
std     97.139076                  NaN        2.648187              9.099227   

       precipitation        rain    snowfall  snow_depth  weather_code  \
count     336.000000  336.000000  336.000000  336.000000    336.000000   
mean        0.117560    0.103571    0.006042    0.002262     20.321429   
min    