## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **fd_rpktool**

## Dataset
# **Finanzdaten der Stadt Zürich**

## Description

Die Stadt Zürich mit allen Departementen und Institutionen publiziert für die Geschäfte Budget, Nachtragskredite (I und II), sowie die [Rechnung sämtlicher Konten auf Konzernstufe](https://www.stadt-zuerich.ch/de/politik-und-verwaltung/finanzen/rechnung.html). Diese Daten sind über ein API ab dem Zeitpunkt der Publikation der Zahlen online verfügbar. Dafür benötigen Sie einen **API-Key**, welcher unter «Bemerkungen» aufgeführt ist.

Es sind Daten ab 2012 über das API verfügbar: In den Jahren 2012 – 2018 wurde die Rechnungslegung gemäss HRM1 geführt. Ab dem Jahr 2019 gilt der HRM2-Kontenrahmen. Dadurch ist eine Vergleichbarkeit der Konten zwischen 2018 und 2019 nicht mehr gegeben. Mehr Informationen zu den Anpassungen finden Sie in der Ressource 'Änderungen neue Rechnungslegung.pdf'.


**Weiterführende Informationen**

Weitere Angaben zu den rechtlichen Grundlagen finden Sie auf der [**Website des kantonalen Gemeindeamts**](https://gaz.zh.ch/internet/justiz_inneres/gaz/de/gemeindefinanzen.html) . Das neue Gemeindegesetz und die neue Gemeindeverordnung sind [**in der kantonalen Loseblattsammlung**](https://www.zh.ch/internet/de/rechtliche_grundlagen/gesetze/loseblatt-_und_offiziellesammlung.html?view=list&URL=http://www2.zhlex.zh.ch/appl/zhlex_r.nsf/V?Open%26vn%3dxmlsammlungnachordnungsnr%26l%3d3%26key%3d131.1gemeindegesetz%28gg%29) verfügbar.


[]()

**Anmerkungen**

In den Jahren 2012 – 2018 wurden Institutionen mit Globalbudget nicht über die API veröffentlicht. Jedoch wurden die Beträge in diesen Jahren bis auf die 4-stellige Kontonummer ausgewiesen (siehe Abfrage betragsreihe).
Ab 2019 werden auch Institutionen mit Globalbudget im API angeboten.
Um eine Vergleichbarkeit aller städtischen Institutionen zu ermöglichen werden die Kontonummern nur noch 1- und 2-stellig angeboten (siehe Abfrage  sachkonto1stellig bzw. sachkonto2stellig).
Eine Beschreibung der 1- und 2stelligen Sachkonten befindet sich in der Ressource 'sachkonto_codes.csv'.
Vergleiche über Zeit und Institutionen sind somit erst ab den Daten von 2019 möglich.
Mehr Informationen zur Rechnungslegung sowie die Liste mit den Organisationseinheiten mit Produktegruppen-Globalbudgets finden Sie in der Ressource 'Rechnungslegung und Berichterstattung.pdf'.

Der städtische Budget- und Rechnungsprozess durchläuft eine Reihe von Phasen: Vom Antrag an den Stadtrat, über Nachträge im sogenannten Novemberbrief über das vom Gemeinderat beschlossene Budget sowie zwei Serien mit Nachtragskrediten. Diese Phasen sind im API als Betragstypen abgebildet.

![Budgetprozess](<https://opendatazurich.github.io/rpk-api/budgetprozess.png>)

Beispielabfragen können Sie der Ressource 'finanzdaten_api_swagger.yaml' entnehmen (_Swagger-File_).

Die Daten dieser Schnittstelle sind als Live-Daten zu verstehen. Es gilt nur der jeweils aktuell abgebildete Stand. Eine Argumentation mit zu einem früheren Zeitpunkt gespeicherten Daten ist nicht zulässig.


[]()

**API-Key**


`vopVcmhIMkeUCf8gQjk1GgU2wK+fKihAdlCl0WKJ`


[]()

**Dokumentation der RPK-API auf GitHub:**


Sie finden eine [**ausführliche Dokumentation**](https://opendatazurich.github.io/rpk-api/) zur RPK-API auf Github.
![RPK-API Dokumentation](<https://opendatazurich.github.io/rpk-api/rpk_api_readme.png>)
<br>


[]()

**Beschreibung der API Endpunkte und Parameter:**


Wichtiger Bestandteil der RPK-API-Dokumention ist eine **Swagger-UI-Webseite**, welche ein einfaches [**interaktives Erforschen der verfügbaren Endpunkte und Parameter**](https://opendatazurich.github.io/rpk-api/docs/#/) der RPK-API erlaubt.
![RPK-API Dokumentation](<https://opendatazurich.github.io/rpk-api/rpk_api_swagger-ui.png>)
<br>


[]()

**Programmierbeispiele mit Python:**


Um den Einstieg der API-Abfragen mit einer Programmiersprache zu erleichtern, haben wir nebst typischen Beispiels-Abfragen in der Dokumentation auch noch ein paar Programmierbeispiele mit Python als [**Jupyter-Notebook**](https://github.com/opendatazurich/opendatazurich.github.io/blob/master/rpk-api/RPK-API-Beispiele.ipynb) zur Verfügung gestellt. 

Wir haben dieses Notebook auch auf Binder verfügbar gemacht, damit Sie es auch einfach in ihrem Browser interaktiv laufen lassen können: [![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/opendatazurich/opendatazurich.github.io/master?filepath=rpk-api/RPK-API-Beispiele.ipynb)

![RPK-API Dokumentation](<https://opendatazurich.github.io/rpk-api/rpk_api_binder.png>)


[]()



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/fd_rpktool)

https://data.stadt-zuerich.ch/dataset/fd_rpktool/download/sachkonto_codes.csv<br>


## Metadata
- **Publisher** `Finanzverwaltung, Finanzdepartement`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Finanzen,Politik`
- **Tags** `['budget', 'finanzen', 'rechnung', 'rpk', 'sachdaten', 'tabelle']`
- **Metadata_created** `2019-07-29T13:36:31.293179`
- **Metadata_modified** `2025-05-31T21:08:14.714952`


## Imports and helper functions

In [None]:
import matplotlib.pyplot as plt
import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    """
    Return pandas df if url is parquet or csv file. Return None if not.
    """
    extension = url.rsplit(".",1)[-1]
    if extension == 'parquet':
        data = pd.read_parquet(url)
    elif extension == 'csv':
        data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        # if dataframe only has one column or less the data is not comma separated, use ";" instead
        if data.shape[1] <= 1:
            data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
            if data.shape[1] <= 1:
                print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    else:
        print("Cannot load data! Please provide an url with csv or parquet extension.")
        data = None
    return data

## Load the data

In [None]:
df = get_dataset('https://data.stadt-zuerich.ch/dataset/fd_rpktool/download/sachkonto_codes.csv')

## Analyze the data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch