# Einführung in Python, Pandas und Matplotlib mit dem Füllungsgrad der Schweizer Speicherseen

In diesem Notebook analysieren wir den Füllungsgrad der Schweizer Speicherseen mithilfe von Pandas und Matplotlib.

In [1]:
# Erste Schritte: Bibliotheken importieren
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns  # Für schönere Visualisierungen

# Stil für Matplotlib einstellen (optional)
sns.set_theme()

## 📥 Datensatz herunterladen und einlesen

In [2]:
url = 'https://www.uvek-gis.admin.ch/BFE/ogd/17/ogd17_fuellungsgrad_speicherseen.csv'

# CSV-Datei in ein DataFrame laden
df = pd.read_csv(url, delimiter=',')

# Erste fünf Zeilen des Datensatzes anzeigen
df.head()

## 🛠 Spaltennamen und Datenstruktur überprüfen

In [3]:
print("Spaltennamen:")
print(df.columns)

print("\nDatentypen:")
print(df.dtypes)

## 🔄 Datenbereinigung

In [17]:
# Spalte "Datum" in ein Datetime-Format konvertieren
df['Datum'] = pd.to_datetime(df['Datum'], format='%Y-%m-%d')

# Füllungsgrad in % manuell berechnen
df['Füllungsgrad in %'] = (df['TotalCH_speicherinhalt_gwh'] / df['TotalCH_max_speicherinhalt_gwh']) * 100

# Berechnung der Gesamtenergie in GWh als Summe der regionalen Speicherinhalte
df['Energie in GWh'] = (
    df['Wallis_speicherinhalt_gwh'] +
    df['Graubuenden_speicherinhalt_gwh'] +
    df['Tessin_speicherinhalt_gwh'] +
    df['UebrigCH_speicherinhalt_gwh']
)

# Übersicht über die bereinigten Daten
df.head()

## 📊 Analysen und Visualisierungen

### 🔹 Entwicklung des Füllungsgrades über die Zeit

In [4]:
# Durchschnittlicher Füllungsgrad pro Datum
df_grouped = df.groupby(['Datum'])['Füllungsgrad in %'].mean().reset_index()

# Liniendiagramm erstellen
plt.figure(figsize=(12, 6))
plt.plot(df_grouped['Datum'], df_grouped['Füllungsgrad in %'], label='Durchschnittlicher Füllungsgrad', color='blue')
plt.xlabel('Datum')
plt.ylabel('Füllungsgrad in %')
plt.title('Entwicklung des durchschnittlichen Füllungsgrades der Schweizer Speicherseen')
plt.legend(loc='best')
plt.grid(True)
plt.show()

### 🔹 Vergleich des Füllungsgrades nach Region

In [5]:
# DataFrame aufschmelzen
df_melted = df.melt(
    id_vars=['Datum', 'Füllungsgrad in %'], 
    value_vars=['Wallis_speicherinhalt_gwh', 'Graubuenden_speicherinhalt_gwh', 'Tessin_speicherinhalt_gwh', 'UebrigCH_speicherinhalt_gwh'],
    var_name='Region',
    value_name='Speicherinhalt_GWh'
)

# Regionennamen bereinigen
df_melted['Region'] = df_melted['Region'].str.replace('_speicherinhalt_gwh', '')

# Ergebnisse anzeigen
print(df_melted.head())

In [6]:
# Boxplot erstellen
plt.figure(figsize=(12, 6))
df_melted.boxplot(column='Füllungsgrad in %', by='Region', grid=False)
plt.xlabel('Region')
plt.ylabel('Füllungsgrad in %')
plt.title('Verteilung des Füllungsgrades nach Region')
plt.suptitle('')
plt.show()

## 🎉 Fazit

Herzlichen Glückwunsch! 🎉 Sie haben erfolgreich den Datensatz geladen, bereinigt, analysiert und visualisiert. Experimentieren Sie weiter, um neue Erkenntnisse aus den Daten zu gewinnen! 🚀