In [24]:
import numpy as np # type: ignore
import pandas as pd # type: ignore
import seaborn as sns # type: ignore
import matplotlib.pyplot as plt # type: ignore
import os

In [25]:
def addTimeInformation(df):
    df['Time'] = df['Datum'].dt.time
    df['Month'] = df['Datum'].dt.strftime('%b')
    df['Year Month'] = df['Datum'].dt.strftime('%Y %m')
    df['Year Month Day'] = df['Datum'].dt.strftime('%Y %m %d')
    df['Day'] = df['Datum'].dt.strftime('%d')
    df['Year'] = df['Datum'].dt.strftime('%Y')
    df['Weekday'] = df['Datum'].dt.strftime('%u')
    df['Week'] = df['Datum'].dt.strftime('%W')
    return df

In [26]:
def read_SMARD_data(path):
    df = pd.read_csv(path,delimiter= ';', thousands='.', decimal=',', dayfirst ="True") #, parse_dates=[[0,1]]

    #Herauslöschen der Spalte Datum bis, da diese keine zusätzlichen Informationen bietet
    df.drop(columns=["Datum bis"], inplace=True)

    #Umbenennung der Spalten
    df.rename(columns= {
        "Datum von":"Datum",
        "Gesamt (Netzlast) [MWh] Originalauflösungen":"Gesamtverbrauch",
        "Residuallast [MWh] Originalauflösungen":"Residuallast",
        "Pumpspeicher [MWh] Originalauflösungen":"Pumpspeicher",  
    }, inplace = True)

    #Formatierung der Datumstpalte
    df['Datum'] = pd.to_datetime(df['Datum'], format= '%d.%m.%Y %H:%M')
    #addTimeInformation(df)

    
    return df

In [27]:
def getData():
    dataFrames = {} # Dictionary für die df für jedes Jahr
    path_var = "CSV/Verbrauch/" #Pfad auf den Ordner, um später durch die Datein zu navigieren

    #Schleife für die Jahre 2015-2023 und Einlesen der Datei
    for year in range(2023,2024): # hier könnte man später sich die Jahre auch vom User geben lassen, welche Jahre er gerne eingelesen haben möchte
        #Dateipfad für das entsprechende Jahr
        file_path = os.path.join(path_var, f"Realisierter_Stromverbrauch_{year}01010000_{year+1}01010000_Viertelstunde.csv")
        if os.path.exists(file_path):   #Falls dieser zusammengesetze Pfad existiert,...
            dataFrames[year] = read_SMARD_data(file_path)   #... soll dieser eingelesen werden
            print(f"Data für {year} loaded succsessfully.")
        else:
            print(f"File for {year} not found at path: {file_path}") #... anstonsten nicht

    
    return dataFrames   #Rückgabe der eingelesenen Date als DataFrame

In [28]:
energy_consumption = getData();
print(energy_consumption)

Data für 2023 loaded succsessfully.
{2023:                     Datum  Gesamtverbrauch  Residuallast  Pumpspeicher
0     2023-01-01 00:00:00          9673.00       1842.50        482.00
1     2023-01-01 00:15:00          9593.50       1691.50        469.25
2     2023-01-01 00:30:00          9562.00       1442.50        546.25
3     2023-01-01 00:45:00          9517.50       1598.50        525.50
4     2023-01-01 01:00:00          9433.25       1325.50        192.75
...                   ...              ...           ...           ...
35035 2023-12-31 22:45:00         10780.75       1706.75        373.50
35036 2023-12-31 23:00:00         10752.25       1701.00        426.50
35037 2023-12-31 23:15:00         10605.50       1610.25        476.75
35038 2023-12-31 23:30:00         10494.25       1470.25        468.25
35039 2023-12-31 23:45:00         10288.00       1338.00        540.75

[35040 rows x 4 columns]}
