# üìä Einf√ºhrung in Python, Pandas und Matplotlib mit dem F√ºllungsgrad der Schweizer Speicherseen

In diesem Notebook analysieren wir den F√ºllungsgrad der Schweizer Speicherseen mithilfe von Pandas und Matplotlib.

---

In [None]:
# üöÄ Erste Schritte: Bibliotheken importieren
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns  # F√ºr sch√∂nere Visualisierungen

# Stil f√ºr Matplotlib einstellen (optional)
sns.set_theme()

In [None]:
# üì• Datensatz herunterladen und einlesen
url = 'https://www.uvek-gis.admin.ch/BFE/ogd/17/ogd17_fuellungsgrad_speicherseen.csv'

# CSV-Datei in ein DataFrame laden
df = pd.read_csv(url, delimiter=';')

# üîç Erste f√ºnf Zeilen des Datensatzes anzeigen
df.head()

In [None]:
# üõ† Spaltennamen und Datenstruktur √ºberpr√ºfen
print("Spaltennamen:")
print(df.columns)

print("\nDatentypen:")
print(df.dtypes)

In [None]:
# ‚ú® Datenbereinigung

# Spalte "Datum" in ein Datetime-Format konvertieren
df['Datum'] = pd.to_datetime(df['Datum'], format='%d.%m.%Y')

# Prozentzeichen in "F√ºllungsgrad in %" entfernen und als Float speichern
df['F√ºllungsgrad in %'] = df['F√ºllungsgrad in %'].str.replace('%', '').str.replace(',', '.').astype(float)

# "Energie in GWh" ebenfalls in einen numerischen Typ umwandeln
df['Energie in GWh'] = df['Energie in GWh'].str.replace(',', '.').astype(float)

# √úbersicht √ºber die bereinigten Daten
df.head()

In [None]:
# üìä Analyse und Visualisierungen

# 1Ô∏è‚É£ Entwicklung des F√ºllungsgrades √ºber die Zeit
# Durchschnittlicher F√ºllungsgrad pro Datum
df_grouped = df.groupby('Datum')['F√ºllungsgrad in %'].mean().reset_index()

# Liniendiagramm erstellen
plt.figure(figsize=(12, 6))
plt.plot(df_grouped['Datum'], df_grouped['F√ºllungsgrad in %'], label='Durchschnittlicher F√ºllungsgrad', color='blue')
plt.xlabel('Datum')
plt.ylabel('F√ºllungsgrad in %')
plt.title('Entwicklung des durchschnittlichen F√ºllungsgrades der Schweizer Speicherseen')
plt.legend(loc='best')
plt.grid(True)
plt.show()

In [None]:
# 2Ô∏è‚É£ Vergleich des F√ºllungsgrades nach Region
# Boxplot erstellen
plt.figure(figsize=(12, 6))
df.boxplot(column='F√ºllungsgrad in %', by='Region', grid=False)
plt.xlabel('Region')
plt.ylabel('F√ºllungsgrad in %')
plt.title('Verteilung des F√ºllungsgrades nach Region')
plt.suptitle('')
plt.show()

# üéâ Fazit
Herzlichen Gl√ºckwunsch! üéâ Sie haben erfolgreich den Datensatz geladen, bereinigt, analysiert und visualisiert. Experimentieren Sie weiter, um neue Erkenntnisse aus den Daten zu gewinnen! üöÄ