## Open Government Data, provided by **Canton Zurich**
*Auto-generated Python starter code for dataset with identifier* **1363@awel-kanton-zuerich**

## Dataset
# **Luftschadstoffemissionen im Kanton Zürich**

## Description

Emissionen der wichtigsten Luftschadstoffe (BC, CO, NH3, NMVOC, NOx, PM10, PM2.5, SO2) im Kanton Zürich. Die Emissionsbilanzierung liegt bis auf Stufe Gemeinde und für verschiedene Zeitstände vor. Die Emissionsdaten der Stickoxide (NOx), Feinstaub (PM10 und PM2.5) sowie Russ (BC) wurden im Rahmen einer schweizweiten Aktualisierung der Karten für Luftschadstoffimmissionen Schweiz und Liechtenstein 2015, 2020, 2030 in Hektarrasterauflösung bilanziert. Die Datengrundlagen für die Emissionen bildet das Emissionsinformations-System Schweiz (EMIS) – die Datenbank des Bundesamts für Umwelt BAFU mit den nationalen Luftschadstoff- und Treibhausgasemissionen - zum Zeitpunkt Mitte 2019. In einer Ergänzungsstudie im Auftrag des BAFU wurden für dieselben Emittentengruppen anschliessend auch Emissionskataster in Hektarrasterauflösung für weitere Luftschadstoffe und Treibhausgase erstellt. Im Anschluss an die genannten Arbeiten hat die 'Luftqualitätsüberwachung der Ostschweizer Kantone und des Fürstentums Liechtenstein' (OSTLUFT) die Arbeitsgemeinschaft INFRAS/Meteotest damit beauftragt, die Emissionen aller genannten Substanzen auf Stufe Gemeinden des OSTLUFT-Gebiets zu aggregieren und die Daten in geeigneter Form aufzubereiten mit dem Ziel, für die OSTLUFT-Gemeinden eine mit dem schweizerischen Emissionskataster konsistente Datengrundlage zur Verfügung zu haben. Eine Aktualisierung der Daten wurde mit gleicher Methodik aber basierend auf den Datengrundlagen aus dem Emissionsinformations-System Schweiz (EMIS) zu den Zeitpunkten Mitte 2023 und 2025 durchgeführt. Die unterschiedlichen Datengrundlagen sind über das Attribut [stand] (stand == 'sub_19': Daten aus Submission 2019 | stand == 'sub_23': Daten aus Submission 2023 | stand == 'sub_25': Daten aus Submission 2025) filterbar. Hinweis: Die Städte Winterthur und Zürich verfügen über eigenen Bilanzierungen der Luftschadstoffe auf ihrem Gebiet. Detailliertere Angaben dazu sind unter 'weitere Informationen' verlinkt.

## Dataset links

[Direct data shop link for dataset](https://www.zh.ch/de/politik-staat/statistik-daten/datenkatalog.html#/datasets/1363@awel-kanton-zuerich)

## Metadata
- **Issued** `2022-07-06T22:00:00`
- **Modified** `2026-01-16T16:13:10`
- **Startdate** `1990-01-01`
- **Enddate** `2025-12-31`
- **Theme** `['http://publications.europa.eu/resource/authority/data-theme/ENVI', 'http://publications.europa.eu/resource/authority/data-theme/HEAL']`
- **Keyword** `['ammoniak', 'emissionen', 'feinstaub', 'gemeinden', 'immissionen', 'kanton_zuerich', 'kohlenmonoxid', 'luft', 'luftqualitaet', 'luftschadstoffe', 'ogd', 'russ', 'schadstoffbelastung', 'stickstoffdioxid']`
- **Publisher** `['Amt für Abfall, Wasser, Energie und Luft des Kantons Zürich']`
- **Landingpage** `https://www.zh.ch/de/umwelt-tiere/luft-strahlung/daten-karten.html`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd

In [None]:
# Helper function for reading datasets with proper separator
def get_dataset(url):
    if url[-3:] != "csv":
        print("The dataset URL has no proper 'CSV' extension. Reading the dataset might not have worked as expected.\nPlease check the dataset link and adjust pandas' read_csv() parameters accordingly.")
    data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
    # If dataframe only has one column or less the data is not comma separated, use ";" instead
    if data.shape[1] <= 1:
        data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        if data.shape[1] <= 1:
            print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    return data

## Load data

- The dataset has **`1` distribution(s)** in CSV format.
- All available CSV distributions are listed below and can be read into a pandas dataframe.

In [None]:
# Distribution 0
# Ktzhdistid               : 6729
# Title                    : Luftschadstoffemissionen im Kanton Zürich ab 1990
# Description              : Emissionen der wichtigsten Luftschadstoffe (NOx, PM10, PM2.5, Russ, Ammoniak, NMVOC, CO und SO2) im Kanton Zürich.  Die aufgeführten Luftschadstoffemissionen sind nach dem Territorialprinzip bilanziert und werden in Tonnen pro Jahr ausgewiesen.  Die Emissionen liegen als jährliche Zeitreihe ab 1990 vor.  Mehr Informationen zum Inhalt der Daten sind in der Ressource "Datenbeschreibung Luftschadstoffemissionen im Kanton Zürich" enthalten.
# Issued                   : 2026-01-12T14:42:25
# Modified                 : 2026-01-19T08:50:22

df = get_dataset('https://daten.statistik.zh.ch/ogd/daten/ressourcen/KTZH_00001363_00006729.csv')



## Analyze data

In [None]:
# Drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# Display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# Describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except Exception:
    print("No categorical data in dataset.")

In [None]:
# Describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except Exception:
    print("No numerical data in dataset.")

In [None]:
# Check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# Plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except Exception:
    print("No numerical data to plot.")

In [None]:
# Continue your code here...

**Questions about the data?** Amt für Abfall, Wasser, Energie und Luft des Kantons Zürich | Abteilung Luft, Klima und Strahlung | gian-marco.alt@bd.zh.ch

## Open Government Data, provided by **Canton Zurich**
*Auto-generated Python starter code for dataset with identifier* **1363@awel-kanton-zuerich**

## Dataset
# **Luftschadstoffemissionen im Kanton Zürich**

## Description

Emissionen der wichtigsten Luftschadstoffe (BC, CO, NH3, NMVOC, NOx, PM10, PM2.5, SO2) im Kanton Zürich. Die Emissionsbilanzierung liegt bis auf Stufe Gemeinde und für verschiedene Zeitstände vor. Die Emissionsdaten der Stickoxide (NOx), Feinstaub (PM10 und PM2.5) sowie Russ (BC) wurden im Rahmen einer schweizweiten Aktualisierung der Karten für Luftschadstoffimmissionen Schweiz und Liechtenstein 2015, 2020, 2030 in Hektarrasterauflösung bilanziert. Die Datengrundlagen für die Emissionen bildet das Emissionsinformations-System Schweiz (EMIS) – die Datenbank des Bundesamts für Umwelt BAFU mit den nationalen Luftschadstoff- und Treibhausgasemissionen - zum Zeitpunkt Mitte 2019. In einer Ergänzungsstudie im Auftrag des BAFU wurden für dieselben Emittentengruppen anschliessend auch Emissionskataster in Hektarrasterauflösung für weitere Luftschadstoffe und Treibhausgase erstellt. Im Anschluss an die genannten Arbeiten hat die 'Luftqualitätsüberwachung der Ostschweizer Kantone und des Fürstentums Liechtenstein' (OSTLUFT) die Arbeitsgemeinschaft INFRAS/Meteotest damit beauftragt, die Emissionen aller genannten Substanzen auf Stufe Gemeinden des OSTLUFT-Gebiets zu aggregieren und die Daten in geeigneter Form aufzubereiten mit dem Ziel, für die OSTLUFT-Gemeinden eine mit dem schweizerischen Emissionskataster konsistente Datengrundlage zur Verfügung zu haben. Eine Aktualisierung der Daten wurde mit gleicher Methodik aber basierend auf den Datengrundlagen aus dem Emissionsinformations-System Schweiz (EMIS) zu den Zeitpunkten Mitte 2023 und 2025 durchgeführt. Die unterschiedlichen Datengrundlagen sind über das Attribut [stand] (stand == 'sub_19': Daten aus Submission 2019 | stand == 'sub_23': Daten aus Submission 2023 | stand == 'sub_25': Daten aus Submission 2025) filterbar. Hinweis: Die Städte Winterthur und Zürich verfügen über eigenen Bilanzierungen der Luftschadstoffe auf ihrem Gebiet. Detailliertere Angaben dazu sind unter 'weitere Informationen' verlinkt.

## Dataset links

[Direct data shop link for dataset](https://www.zh.ch/de/politik-staat/statistik-daten/datenkatalog.html#/datasets/1363@awel-kanton-zuerich)

## Metadata
- **Issued** `2022-07-06T22:00:00`
- **Modified** `2026-01-16T16:13:10`
- **Startdate** `1990-01-01`
- **Enddate** `2025-12-31`
- **Theme** `['http://publications.europa.eu/resource/authority/data-theme/ENVI', 'http://publications.europa.eu/resource/authority/data-theme/HEAL']`
- **Keyword** `['ammoniak', 'emissionen', 'feinstaub', 'gemeinden', 'immissionen', 'kanton_zuerich', 'kohlenmonoxid', 'luft', 'luftqualitaet', 'luftschadstoffe', 'ogd', 'russ', 'schadstoffbelastung', 'stickstoffdioxid']`
- **Publisher** `['Amt für Abfall, Wasser, Energie und Luft des Kantons Zürich']`
- **Landingpage** `https://www.zh.ch/de/umwelt-tiere/luft-strahlung/daten-karten.html`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd 

In [None]:
# Helper function for reading datasets with proper separator
def get_dataset(url):
    if url[-3:] != "csv":
        print("The dataset URL has no proper 'CSV' extension. Reading the dataset might not have worked as expected.\nPlease check the dataset link and adjust pandas' read_csv() parameters accordingly.")
    data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
    # If dataframe only has one column or less the data is not comma separated, use ";" instead
    if data.shape[1] <= 1:
        data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        if data.shape[1] <= 1:
            print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    return data

## Load data

- The dataset has **`1` distribution(s)** in CSV format.
- All available CSV distributions are listed below and can be read into a pandas dataframe.

In [None]:
# Distribution 0
# Ktzhdistid               : 6729
# Title                    : Luftschadstoffemissionen im Kanton Zürich ab 1990
# Description              : Emissionen der wichtigsten Luftschadstoffe (NOx, PM10, PM2.5, Russ, Ammoniak, NMVOC, CO und SO2) im Kanton Zürich.  Die aufgeführten Luftschadstoffemissionen sind nach dem Territorialprinzip bilanziert und werden in Tonnen pro Jahr ausgewiesen.  Die Emissionen liegen als jährliche Zeitreihe ab 1990 vor.  Mehr Informationen zum Inhalt der Daten sind in der Ressource "Datenbeschreibung Luftschadstoffemissionen im Kanton Zürich" enthalten.
# Issued                   : 2026-01-12T14:42:25
# Modified                 : 2026-01-19T08:50:22

df = get_dataset('https://daten.statistik.zh.ch/ogd/daten/ressourcen/KTZH_00001363_00006729.csv')



## Analyze data

In [None]:
# Drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# Display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# Describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# Describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numerical data in dataset.")

In [None]:
# Check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# Plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numerical data to plot.")

In [None]:
# Continue your code here...

**Questions about the data?** Amt für Abfall, Wasser, Energie und Luft des Kantons Zürich | Abteilung Luft, Klima und Strahlung | gian-marco.alt@bd.zh.ch