## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **umw_heizgradtage_standort_jahr_monat_od1031**

## Dataset
# **Heizgradtage für verschiedene Standorte in der Stadt Zürich**

## Description

Der Datensatz enthält die monatlichen Heiztgradtage für die Standorte Stampfenbachstrasse, Schimmelstrasse und Rosengartenstrasse.

**Heizgradtage:**


Heizgradtage sind ein Mass für den Einfluss des Wetters auf den Heizenergieverbrauch eines Gebäudes. Heizgradtage sind die Differenz zwischen der gewünschten Raumtemperatur (20°C) und der mittleren Aussentemperatur eines Tages, falls diese Aussentemperatur unter einer bestimmten Heizgrenze liegt. Für die Berechnung der Tabellenwerte wird die Heizgrenze 12 °C verwendet. Bei einer mittleren Tagestemperatur von 2°C ergeben sich 18 Heizgradtage (20°C – 2°C). Je kälter die mittlere Tagestemperatur in einem Monat ist, desto höher sind die Heizgradtage.


[]()

**Akkumulierte Temperaturdifferenzen**


Wie die Heizgradtage ist die akkumulierte Temperaturdifferenz ein Mass für den Einfluss des Wetters auf den Heizenergieverbrauch eines Gebäudes. Die akkumulierten Temperaturdifferenzen werden mit der Differenz zwischen der Basistemperatur (12°C) und dem Tagesmittel der Aussentemperatur berechnet. Bei einer mittleren Tagestemperatur von 2°C ergebt sich eine akkumulierte Temperaturdifferenz von 10  (12°C – 2°C). Je kälter die mittlere Tagestemperatur in einem Monat ist, desto höher sind die akkumulierten Temperaturdifferenzen.


[]()

**Standort Stampfenbachstrasse:**

Adresse: Stampfenbachstrasse 144, 8006 Zürich
Koordinaten: 2683140 / 1249040
Höhe über Meer: 445 m.ü.M.
Strassenabstand: 2 m
Höhe über Boden: 6 m
Standorttyp: Stadtzentrum, mässig befahrene Strasse, Wohnquartier, geschlossene Bebauung (einseitig) 

[]()

**Standort Schimmelstrasse**

Adresse: Schimmelstrasse 83, 8003 Zürich
Koordinaten: 2681950 / 1247250
Höhe über Meer: 413 m.ü.M.
Strassenabstand: 3 m
Höhe über Boden: 3 m
Standorttyp: Stadtzentrum, stark befahrene Strasse, Wohnquartier, geschlossene Bebauung 

[]()

**Standort Rosengartenstrasse**

Adresse: Rosengartenstrasse
Koordinaten: 2682095 / 1249940
Höhe über Meer: 433 m.ü.M.
Strassenabstand: 6 m
Höhe über Boden: 2 m
Standorttyp: Starke Verkehrsexposition an Hauptverkehrsachse. Stadtzentrum, geschlossene Bebauung

[]()

**Fehlende Werte**

Der Monatswert wird bei einer Datenverfügbarkeit von 80 Prozent ausgewiesen.

[]()



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/umw_heizgradtage_standort_jahr_monat_od1031)

https://data.stadt-zuerich.ch/dataset/umw_heizgradtage_standort_jahr_monat_od1031/download/UMW103OD1031.csv<br>


## Metadata
- **Publisher** `Fachbereich Labor, Umwelt- und Gesundheitsschutz, Gesundheits- und Umweltdepartement`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Energie`
- **Tags** `['energie', 'sachdaten', 'sasa', 'tabelle', 'zeitreihe']`
- **Metadata_created** `2024-12-01T11:40:38.213242`
- **Metadata_modified** `2025-05-22T07:03:22.069869`


## Imports and helper functions

In [None]:
import matplotlib.pyplot as plt
import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    """
    Return pandas df if url is parquet or csv file. Return None if not.
    """
    extension = url.rsplit(".",1)[-1]
    if extension == 'parquet':
        data = pd.read_parquet(url)
    elif extension == 'csv':
        data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        # if dataframe only has one column or less the data is not comma separated, use ";" instead
        if data.shape[1] <= 1:
            data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
            if data.shape[1] <= 1:
                print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    else:
        print("Cannot load data! Please provide an url with csv or parquet extension.")
        data = None
    return data

## Load the data

In [None]:
df = get_dataset('https://data.stadt-zuerich.ch/dataset/umw_heizgradtage_standort_jahr_monat_od1031/download/UMW103OD1031.csv')

## Analyze the data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch