# EinfÃ¼hrung in Python, Pandas und Matplotlib mit dem FÃ¼llungsgrad der Schweizer Speicherseen

In diesem Notebook analysieren wir den FÃ¼llungsgrad der Schweizer Speicherseen mithilfe von Pandas und Matplotlib.

In [1]:
# Erste Schritte: Bibliotheken importieren
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns  # FÃ¼r schÃ¶nere Visualisierungen

# Stil fÃ¼r Matplotlib einstellen (optional)
sns.set_theme()

## ðŸ“¥ Datensatz herunterladen und einlesen

In [2]:
url = 'https://www.uvek-gis.admin.ch/BFE/ogd/17/ogd17_fuellungsgrad_speicherseen.csv'

# CSV-Datei in ein DataFrame laden
df = pd.read_csv(url, delimiter=',')

# Erste fÃ¼nf Zeilen des Datensatzes anzeigen
df.head()

## ðŸ›  Spaltennamen und Datenstruktur Ã¼berprÃ¼fen

In [3]:
print("Spaltennamen:")
print(df.columns)

print("\nDatentypen:")
print(df.dtypes)

## ðŸ”„ Datenbereinigung

In [17]:
# Spalte "Datum" in ein Datetime-Format konvertieren
df['Datum'] = pd.to_datetime(df['Datum'], format='%Y-%m-%d')

# FÃ¼llungsgrad in % manuell berechnen
df['FÃ¼llungsgrad in %'] = (df['TotalCH_speicherinhalt_gwh'] / df['TotalCH_max_speicherinhalt_gwh']) * 100

# Berechnung der Gesamtenergie in GWh als Summe der regionalen Speicherinhalte
df['Energie in GWh'] = (
    df['Wallis_speicherinhalt_gwh'] +
    df['Graubuenden_speicherinhalt_gwh'] +
    df['Tessin_speicherinhalt_gwh'] +
    df['UebrigCH_speicherinhalt_gwh']
)

# Ãœbersicht Ã¼ber die bereinigten Daten
df.head()

## ðŸ“Š Analysen und Visualisierungen

### ðŸ”¹ Entwicklung des FÃ¼llungsgrades Ã¼ber die Zeit

In [4]:
# Durchschnittlicher FÃ¼llungsgrad pro Datum
df_grouped = df.groupby(['Datum'])['FÃ¼llungsgrad in %'].mean().reset_index()

# Liniendiagramm erstellen
plt.figure(figsize=(12, 6))
plt.plot(df_grouped['Datum'], df_grouped['FÃ¼llungsgrad in %'], label='Durchschnittlicher FÃ¼llungsgrad', color='blue')
plt.xlabel('Datum')
plt.ylabel('FÃ¼llungsgrad in %')
plt.title('Entwicklung des durchschnittlichen FÃ¼llungsgrades der Schweizer Speicherseen')
plt.legend(loc='best')
plt.grid(True)
plt.show()

### ðŸ”¹ Vergleich des FÃ¼llungsgrades nach Region

In [5]:
# DataFrame aufschmelzen
df_melted = df.melt(
    id_vars=['Datum', 'FÃ¼llungsgrad in %'], 
    value_vars=['Wallis_speicherinhalt_gwh', 'Graubuenden_speicherinhalt_gwh', 'Tessin_speicherinhalt_gwh', 'UebrigCH_speicherinhalt_gwh'],
    var_name='Region',
    value_name='Speicherinhalt_GWh'
)

# Regionennamen bereinigen
df_melted['Region'] = df_melted['Region'].str.replace('_speicherinhalt_gwh', '')

# Ergebnisse anzeigen
print(df_melted.head())

In [6]:
# Boxplot erstellen
plt.figure(figsize=(12, 6))
df_melted.boxplot(column='FÃ¼llungsgrad in %', by='Region', grid=False)
plt.xlabel('Region')
plt.ylabel('FÃ¼llungsgrad in %')
plt.title('Verteilung des FÃ¼llungsgrades nach Region')
plt.suptitle('')
plt.show()

## ðŸŽ‰ Fazit

Herzlichen GlÃ¼ckwunsch! ðŸŽ‰ Sie haben erfolgreich den Datensatz geladen, bereinigt, analysiert und visualisiert. Experimentieren Sie weiter, um neue Erkenntnisse aus den Daten zu gewinnen! ðŸš€