## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **ewz_bruttolastgang_stadt_zuerich**

## Dataset
# **Viertelstundenwerte zum Bruttolastgang elektrische Energie der Stadt Zürich, seit 2019**

## Description


Diese Datensätze beinhalten den totalen Bruttolastgang der abgegebenen elektrischen Energie in der Stadt Zürich als 15-Minuten Zeitreihe seit dem 1.1.2019.

Sie beinhalten die elektrische Energie aller Endverbraucher, die am Netz und am nachgelagerten Netz angeschlossen sind abzüglich der Verluste. Der Eigenbadarf eines Kraftwerkes sowie für den Antrieb von Pumpen in Pumpspeicherkraftwerken ist ausgenommen.


**Zu beachten:**


Der Bruttolastgang wird basierend auf zahlreichen Messungen zur Einspeisung und zum Verbrauch berechnet. Einzelne Messungen können dabei fehlen und müssen nachträglich nochmals eingepflegt werden. Daher sind die in dieser Datei vorliegenden Viertelstundenwerte der letzten Tage noch nicht ganz als definitiv der Realität entsprechend zu interpretieren. Sie können entsprechend im Verlaufe der Zeit - bis max. 6 Monate zurück - noch nachträglich angepasst werden.

Das Attribut **Status** gibt einen Hinweis dazu:

- Wenn der Wert auf `W - wahre Werte` gesetzt ist, kann man die Werte als der Realität entsprechend interpretieren. Sie werden nicht mehr angepasst und bleiben stabil.
- Beim Status `F` fehlen noch Messwerte zur korrekten Berechnung des Bruttolastgangs. Die angegebenen Werte werden  noch angepasst werden müssen.
- Beim Status `E` wurden weitere Messwerte aufgenommen und der Bruttolastgang entsprechend angepasst. Weitere Anpassungen werden aber noch vorgenommen werden müssen, bis der Status W erreicht werden kann.



[]()

**Arbeiten mit diesen Daten:**

Im Rahmen eines Tutorials für PowerBI haben die Fachleute des ewz auch diese Datensätze verwendet. Dabei wird anschaulich beschrieben, wie Sie mit diesen Datensätzen arbeiten können und worauf Sie achten sollten. Sie finden das Tutorial  unter [«Crashkurs für Datenanalysen mit Power BI»](https://opendatazurich.github.io/crashkurs-dataviz-powerbi/#bruttolastgang) oder auf unserem [Github-Account](https://github.com/opendatazurich/crashkurs-dataviz-powerbi).



[]()

**Kilo, Giga, Tera: Watt?!**


Nicht nur Ingenieurinnen verwenden diese Einheiten: Kilowatt und Gigawattstunden haben auch Einzug in unsere alltägliche Kommunikation gehalten. Doch wie ordnen wir diese Grössen ein? Dieser kurze Webartikel hilft Dir bei der Einordnung:[** Link**](https://www.powernewz.ch/2020/kilo-giga-tera-watt/).


[]()



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/ewz_bruttolastgang_stadt_zuerich)

https://data.stadt-zuerich.ch/dataset/ewz_bruttolastgang_stadt_zuerich/download/2023_ewz_bruttolastgang.csv<br>


## Metadata
- **Publisher** `Elektrizitätswerk der Stadt Zürich, Departement der Industriellen Betriebe`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Energie`
- **Tags** `['energie', 'sachdaten', 'tabelle', 'zeitreihe']`
- **Metadata_created** `2020-04-29T12:20:06.601621`
- **Metadata_modified** `2025-10-19T03:01:25.887743`


## Imports and helper functions

In [None]:
import matplotlib.pyplot as plt
import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    """
    Return pandas df if url is parquet or csv file. Return None if not.
    """
    extension = url.rsplit(".",1)[-1]
    if extension == 'parquet':
        data = pd.read_parquet(url)
    elif extension == 'csv':
        data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        # if dataframe only has one column or less the data is not comma separated, use ";" instead
        if data.shape[1] <= 1:
            data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
            if data.shape[1] <= 1:
                print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    else:
        print("Cannot load data! Please provide an url with csv or parquet extension.")
        data = None
    return data

## Load the data

In [None]:
df = get_dataset('https://data.stadt-zuerich.ch/dataset/ewz_bruttolastgang_stadt_zuerich/download/2023_ewz_bruttolastgang.csv')

## Analyze the data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch