# 📊 Einführung in Python, Pandas und Matplotlib mit dem Füllungsgrad der Schweizer Speicherseen

In diesem Notebook analysieren wir den Füllungsgrad der Schweizer Speicherseen mithilfe von Pandas und Matplotlib.

---

In [None]:
# 🚀 Erste Schritte: Bibliotheken importieren
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns  # Für schönere Visualisierungen

# Stil für Matplotlib einstellen (optional)
sns.set_theme()

In [None]:
# 📥 Datensatz herunterladen und einlesen
url = 'https://www.uvek-gis.admin.ch/BFE/ogd/17/ogd17_fuellungsgrad_speicherseen.csv'

# CSV-Datei in ein DataFrame laden
df = pd.read_csv(url, delimiter=';')

# 🔍 Erste fünf Zeilen des Datensatzes anzeigen
df.head()

In [None]:
# 🛠 Spaltennamen und Datenstruktur überprüfen
print("Spaltennamen:")
print(df.columns)

print("\nDatentypen:")
print(df.dtypes)

In [None]:
# ✨ Datenbereinigung

# Spalte "Datum" in ein Datetime-Format konvertieren
df['Datum'] = pd.to_datetime(df['Datum'], format='%d.%m.%Y')

# Prozentzeichen in "Füllungsgrad in %" entfernen und als Float speichern
df['Füllungsgrad in %'] = df['Füllungsgrad in %'].str.replace('%', '').str.replace(',', '.').astype(float)

# "Energie in GWh" ebenfalls in einen numerischen Typ umwandeln
df['Energie in GWh'] = df['Energie in GWh'].str.replace(',', '.').astype(float)

# Übersicht über die bereinigten Daten
df.head()

In [None]:
# 📊 Analyse und Visualisierungen

# 1️⃣ Entwicklung des Füllungsgrades über die Zeit
# Durchschnittlicher Füllungsgrad pro Datum
df_grouped = df.groupby('Datum')['Füllungsgrad in %'].mean().reset_index()

# Liniendiagramm erstellen
plt.figure(figsize=(12, 6))
plt.plot(df_grouped['Datum'], df_grouped['Füllungsgrad in %'], label='Durchschnittlicher Füllungsgrad', color='blue')
plt.xlabel('Datum')
plt.ylabel('Füllungsgrad in %')
plt.title('Entwicklung des durchschnittlichen Füllungsgrades der Schweizer Speicherseen')
plt.legend(loc='best')
plt.grid(True)
plt.show()

In [None]:
# 2️⃣ Vergleich des Füllungsgrades nach Region
# Boxplot erstellen
plt.figure(figsize=(12, 6))
df.boxplot(column='Füllungsgrad in %', by='Region', grid=False)
plt.xlabel('Region')
plt.ylabel('Füllungsgrad in %')
plt.title('Verteilung des Füllungsgrades nach Region')
plt.suptitle('')
plt.show()

# 🎉 Fazit
Herzlichen Glückwunsch! 🎉 Sie haben erfolgreich den Datensatz geladen, bereinigt, analysiert und visualisiert. Experimentieren Sie weiter, um neue Erkenntnisse aus den Daten zu gewinnen! 🚀