## Open Government Data, provided by **Canton Zurich**
*Autogenerated Python starter code for data set with identifier* **334@statistisches-amt-kanton-zuerich**

## Dataset
# **ZL-Bezügerquote der Personen ab 65 Jahren [%]**

## Description

Der Datensatz enthält Informationen über die Bezügerquote von Zusatzleistungen zur Altersrente (ZL) für Personen ab 65 Jahren im Kanton Zürich seit 2010. Diese Quote zeigt den Anteil der Rentnerinnen und Rentner, die im Erhebungsjahr während mindestens eines Monats Zusatzleistungen zur Altersrente erhalten haben, im Verhältnis zur Gesamtbevölkerung ab 65 Jahren. Die Zusatzleistungen umfassen Ergänzungsleistungen (EL) gemäss Bundesrecht, kantonale Beihilfen (kBH) und Gemeindezuschüsse (GZ). Kantonale Zuschüsse für Personen mit ausserordentlichem Bedarf in Heimen oder Spitälern sind in dieser Statistik nicht berücksichtigt. 
Die Daten werden jährlich vom Bundesamt für Statistik (BFS) erhoben und stammen von den Sozialdiensten auf Dossier-Ebene. Diese Erhebung ist Teil der Sozialhilfeempfängerstatistik. Die Bevölkerungsdaten, die für die Berechnung der Quoten verwendet werden, stammen aus der kantonalen Bevölkerungserhebung des Statistischen Amtes und beziehen sich auf das jeweilige Jahr. Auch das BFS berechnet Quoten. Es nutzt aber als Referenzpopulation Daten aus dem Vorjahr von der Quelle STATPOP. Die Ergebnisse für den Kanton Zürich werden jeweils im November zusammen mit dem Sozialbericht des Kantons Zürich veröffentlicht. 
Die Datenqualität ist hoch, jedoch gibt es einige Einschränkungen. Bei Gemeinden mit weniger als fünf Fällen wird keine Quote ausgewiesen. Die Daten mussten für 16 Gemeinden im Jahr 2017 und für fünf Gemeinden im Jahr 2020 gewichtet werden, da die Gemeinden nicht für das gesamte Jahr Daten geliefert haben. Der räumliche Bezug des Datensatzes umfasst den Kanton Zürich sowie seine Bezirke und Gemeinden. Die Daten sind auf diese geografischen Einheiten aggregiert.

## Data set links

[Direct data shop link for dataset](https://www.zh.ch/de/politik-staat/statistik-daten/datenkatalog.html#/datasets/334@statistisches-amt-kanton-zuerich)

## Metadata
- **Issued** `2016-01-20T20:16:00`
- **Modified** `2025-09-16T08:15:38`
- **Startdate** `2010-12-31`
- **Enddate** `2023-12-31`
- **Theme** `['http://publications.europa.eu/resource/authority/data-theme/SOCI']`
- **Keyword** `['ahv', 'bezirke', 'gemeinden', 'kanton_zuerich', 'sozialleistungen', 'zusatzrenten', 'quote', 'ogd']`
- **Publisher** `['Statistisches Amt des Kantons Zürich']`
- **Landingpage** `https://www.zh.ch/de/politik-staat/gemeinden/gemeindeportraet.html`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    if url[-3:] != "csv":
        print("The data set URL has no proper 'csv' extension. Reading the dataset might not have worked as expected.\nPlease check the dataset link and adjust pandas' read_csv() parameters accordingly.")
    data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
    # if dataframe only has one column or less the data is not comma separated, use ";" instead
    if data.shape[1] <= 1:
        data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        if data.shape[1] <= 1:
            print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    return data

## Load data

- The dataset has **`1` distribution(s)** in CSV format.
- All available CSV distributions are listed below and can be read into a pandas dataframe.

In [None]:
# Distribution 0
# Ktzhdistid               : 257
# Title                    : ZL-Bezügerquote der Personen ab 65 Jahren [%]
# Description              : None
# Issued                   : 2016-01-21T16:30:35
# Modified                 : 2025-09-16T08:15:38

df = get_dataset('https://www.web.statistik.zh.ch/ogd/data/KANTON_ZUERICH_817.csv')



## Analyze data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Questions about the data?** Statistisches Amt des Kantons Zürich | Data Shop | datashop@statistik.zh.ch