## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **bev_hh_haushaltsform_kinder_od3809**

## Dataset
# **Privathaushalte nach Haushaltsform und Anzahl Kinder**

## Description


Anzahl Privathaushalte der Stadt Zürich nach Haushaltsform, Anzahl Kinder und Jahr.


**Haushalt**

Zu einem Haushalt zählen alle Personen, welche zusammen in der gleichen Wohnung leben. Dazu wird für Personen der wirtschaftliche Wohnsitzbegriff verwendet. Kollektivhaushalte (Heime, Spitäler, Institutionen des Strafvollzugs, Gemeinschaftsunterkünfte für Asylsuchende u.ä.) werden nicht berücksichtigt.


[]()

**Haushaltsformen**

Es werden folgende Haushaltsformen unterschieden:

- **Einpersonenhaushalt**: eine Einzelperson

- **Zweipersonenhaushalt**: Zwei Einzelpersonen ohne registrierte Familienbeziehung. Dies umfasst Zweier-Wohngemeinschaften wie auch Konsensualpaare, aber keine Ehepaare.

- **Ehepaar ohne Kinder**. Ehepaar ohne Kinder.

- **Eingetragenes Paar ohne Kinder**. Eingetragenes Paar ohne Kinder.

- **Ein-Elternhaushalt**: Alleinerziehender Elternteil mit volljährigen oder minderjährigen Kind(ern) im gleichen Haushalt.

- **Ehepaar mit Kind(ern)**: Ehepaar mit volljährigen oder minderjährigen Kind(ern) im Haushalt.

- **Eingetragenes Paar mit Kind(ern)**. Eingetragenes Paar mit volljährigen oder minderjährigen Kind(ern) im Haushalt.

- **Paar mit Kind(ern)**: Zwei (unverheiratete) Einzelpersonen mit mindestens einem anerkannten Kind im gleichen Haushalt. 

- **Patchwork-Haushalt**: Alleinerziehender Elternteil mit Kind(ern) plus eine Einzelperson (unabhängig von Geschlecht und Alter) oder plus eine weitere alleinerziehende Person mit Kind(ern) im gleichen Haushalt. Die zusätzliche Person hat keine registrierte Familienbindung zum alleinerziehenden Elternteil. Sind nur volljährige Kinder mit im Haushalt, wird dieser den Wohngemeinschaften zugeteilt. Auch Alleinerziehende, die mit Verwandten (Tanten, Schwestern, Brüdern) oder einer/einem Bekannten leben, fallen somit unter den Begriff «Patchwork-Haushalt», im Gegensatz zur im Alltag gebräuchlichen Bedeutung. 

- **Wohngemeinschaft ohne Kinder**: Haushalt mit mehreren Familienkernen (oder Einzelpersonen; mindestens drei Personen) ohne registrierte Bindung untereinander. 

- **Wohngemeinschaft mit Kind(ern)**: Haushalt mit mindestens einer Familie mit Kind(ern) plus weitere Einzelpersonen ohne registrierte Bindung untereinander, und/oder plus weitere Familien (mindestens drei Personen). Diese Haushaltsform beinhaltet auch Konstellationen, in denen Familien mit Kindern zusammen mit Hausangestellten oder Au-pairs in einer Wohnung leben.

- **Generationenhaushalt**: Mindestens drei Generationen umfassender Haushalt. 

- **Familien-Verbund**: Seltene Haushalte mit komplexen Familienverbindungen.


[]()

**Datenqualität**

Ab den Jahresdaten für 2024 wird eine neue Auswertungsregel für Haushalte angewendet. Dadurch ändern sich Daten für die gesamte publizierte Zeitreihe.


[]()



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/bev_hh_haushaltsform_kinder_od3809)

https://data.stadt-zuerich.ch/dataset/bev_hh_haushaltsform_kinder_od3809/download/BEV380OD3809.csv<br>


## Metadata
- **Publisher** `Statistik Stadt Zürich, Präsidialdepartement`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Bevölk­erung`
- **Tags** `['bevoelkerungsbestand', 'haushalte', 'kinder', 'sachdaten', 'sasa', 'tabelle', 'zeitreihe']`
- **Metadata_created** `2020-11-19T07:36:09.007107`
- **Metadata_modified** `2025-10-25T20:47:04.890632`


## Imports and helper functions

In [None]:
import matplotlib.pyplot as plt
import pandas as pd 

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    """
    Return pandas df if url is parquet or csv file. Return None if not.
    """
    extension = url.rsplit(".",1)[-1]
    if extension == 'parquet':
        data = pd.read_parquet(url)
    elif extension == 'csv':
        data = pd.read_csv(url, sep=",", on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
        # if dataframe only has one column or less the data is not comma separated, use ";" instead
        if data.shape[1] <= 1:
            data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
            if data.shape[1] <= 1:
                print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    else:
        print("Cannot load data! Please provide an url with csv or parquet extension.")
        data = None
    return data

## Load the data

In [None]:
df = get_dataset('https://data.stadt-zuerich.ch/dataset/bev_hh_haushaltsform_kinder_od3809/download/BEV380OD3809.csv')

## Analyze the data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch