## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **ugz_primaerenergiebilanz**

## Dataset
# **Primärenergiebilanz Stadt Zürich, ohne Klimakorrektur, 1990 - 2016**

## Description


Primärenergiebilanz Stadt Zürich, inkl. internationalem Flugverkehr, ohne Klimakorrektur [Watt/Person].


**Definition Primärenergie:**


Als **Primärenergie** wird in der 2000-Watt-Methodik die gesamte Energie bezeichnet, die im ursprünglichen Energieträger enthalten ist, zuzüglich der Energie, die für die Gewinnung, Umwandlung und Nutzung aufgewendet werden muss.

Die Primärenergie wird aus der Endenergiebilanz berechnet, mithilfe der sogenannten Primärenergiefaktoren, welche für jede einzelne Form von Endenergie definiert sind (siehe auch Bilanzierungskonzept der 2000-Watt-Gesellschaft). Die Zahlen werden nicht klimakorrigiert.

Als **erneuerbare Energien** gelten beispielsweise Sonnenenergie, Windkraft und nachwachsende Biomasse. Der Primärenergiebedarf berücksichtigt nur die direkt für energetische Zwecke eingesetzte Energie (Heizung, Warmwasser, Prozessenergie, Strom und Treibstoffe).

Gemäss Bilanzierungsvorgaben ist in diesem Indikator die Primärenergie aus nicht-energetischen Nutzungen (z. B. Konsum, Nahrung) nicht einbezogen. Die Zahlen dafür können für Zürich nicht ermittelt werden. Es gibt aber Abschätzungen auf nationaler Ebene, welche auf Basis der Import-Exportstatistik der Schweiz berechnet wurden.

Die Daten werden **alle zwei Jahre aktualisiert**.


[]()

**Erläuterung zur Entwicklung der Stromwerte:**


Die **Veränderung, die bei beim Stromanteil** in der Primärenergiebilanz um das Jahr 2002 zu erkennen ist, ist auf einen **Systemwechsel** bei der Bilanzierungsmethodik zurückzuführen. 

Vor 2006 basierte die Elektrizitätsstatistik der Stadt Zürich auf dem ewz-Produktionsmix. Für die dort enthaltene Rubrik «Übrige» wurde rechnerisch der europäische Strommix (sog. ENTSO-E Mix European Network of Transmission System Operators for Electricity) eingesetzt, welcher einen erheblichen Anteil an fossil erzeugtem Strom enthält.

Erst mit der Einführung der Herkunftsdeklaration im Strombereich im Jahr 2006 konnte die Statistik in der Stadt Zürich auf die effektiv bezogenen Stromqualitäten abgestützt werden. 


[]()

**Einheit **Watt/Person**:**


Watt Dauerleistung pro Person. 

**Beispiel**: Durchschnitt der letzten 5 Jahre: 3900 Watt/Person (Dauerleistung).  Umrechnung auf Jahresenergieverbrauch: 3900 Watt x 24 h x 365 Tage / 1000 = 34164 kWh/Person.

**Ziel**: 2000 Watt pro Person – der Primärenergiebedarf, ausgedrückt in Dauerleistung, soll auf 2000 Watt pro Person reduziert werden.


[]()

**Datenquellen:**


Die Daten der einzelnen Energieträger stammen von den einzelnen Werken (ewz, ERZ, Energie 360°AG, UGZ) und werden von UGZ Fachbereich 2000-Watt-Gesellschaft ausgewertet.


[]()

**Weitere Informationen:**


Finden Sie im [Monitoring Energiepolitik](https://www.stadt-zuerich.ch/de/umwelt-und-energie/energie/planung-strategien/monitoring.html).


[]()



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/ugz_primaerenergiebilanz)

https://data.stadt-zuerich.ch/dataset/ugz_primaerenergiebilanz/download/ugz_primaerenergiebilanz.csv<br>
{{ DATASHOP_LINK_ORGANIZATION }}

## Metadata
- **Publisher** `Fachbereich 2000-Watt-Gesellschaft, Umwelt- und Gesundheitsschutz, Gesundheits- und Umweltdepartement`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Energie,Umwelt`
- **Tags** `['primaerenergie', 'primaerenergieverbrauch', 'sachdaten', 'tabelle', 'zeitreihe']`
- **Metadata_created** `2019-07-29T13:36:27.258683`
- **Metadata_modified** `2025-05-21T10:49:07.777779`


## Imports and helper functions

In [None]:
import matplotlib.pyplot as plt
import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    """
    Return pandas df if url is parquet or csv file. Return None if not.
    """
    extension = url.rsplit(".",1)[-1]
    if extension == 'parquet':
        data = pd.read_parquet(url)
    elif extension == 'csv':
        data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        # if dataframe only has one column or less the data is not comma separated, use ";" instead
        if data.shape[1] <= 1:
            data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
            if data.shape[1] <= 1:
                print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    else:
        print("Cannot load data! Please provide an url with csv or parquet extension.")
        data = None
    return data

## Load the data

In [None]:
df = get_dataset('https://data.stadt-zuerich.ch/dataset/ugz_primaerenergiebilanz/download/ugz_primaerenergiebilanz.csv')

## Analyze the data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch