<a href="https://colab.research.google.com/github/ogdtg/starter-code-ogdtg/blob/main/_work/03_Py_Notebooks/pynb_ogdtg@sk-stat-89.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Open Government Data, provided by **Canton Thurgau**
*Autogenerated Python starter code for dataset with the identifier* **sk-stat-89**

[Link to dataset on data.tg.ch](https://data.tg.ch/explore/dataset/sk-stat-89/information/)


## Dataset
# **Wohnungen nach Gebäudekategorie und Politischer Gemeinde (Bestand)**

## Description

<p>Der Datensatz enthält die Anzahl Wohnungen nach Gebäudekategorie und Politischer Gemeinde ab dem Jahr 2009. </p><p>Gebäudekategorien:<br/></p><ul><li>Einfamilienhäuser (WHG_EINF): reine Wohngebäude mit einer Wohnung </li><li>Mehrfamilienhäuser (WHG_MFH): reine Wohngebäude mit mehr als einer Wohnung</li><li>Wohngebäude mit Nebennutzung (WHG_WMN): Gebäude, die hauptsächlich Wohnzwecken dienen. </li><li>Gebäude mit teilweiser Wohnnutzung (WHG_TWN): Gebäude, die hauptsächlich anderen als Wohnzwecken dienen, wie Fabriken, Verwaltungsbauten, Schulen usw., unter der Bedingung, dass diese über mindestens eine Wohnung oder separate Wohnräume verfügen. </li></ul><p>Quellenangabe: Bundesamt für Statistik, Gebäude- und Wohnungsstatistik</p><p>Mehr Informationen zu den Daten finden Sie <a href='https://www.bfs.admin.ch/bfs/de/home/statistiken/bau-wohnungswesen/bautaetigkeit.html' target='_blank'>hier</a>.</p>

## Metadata

- Issued                   : 2021-12-20
- Modified                 : 2024-11-01 08:59:27
- Rights                   : CC BY 4.0
- Keywords                 : Gemeinden , Politische Gemeinde, Wohnungen, Gebäude, Gebäudekategorie, Einfamilienhaus, Mehrfamilienhaus

## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)
import requests
import pandas as pd
import json


In [None]:
# helper function for reading datasets with proper separator
def get_dataset(dataset_id):
    url = f"https://data.tg.ch/api/explore/v2.0/catalog/datasets/{dataset_id}/exports/json"
    response = requests.get(url)
    data = response.json()
    df = pd.DataFrame(data)
    return df

def get_metadata(metadata, dataset_id):
    url = f'https://kantonthurgau.opendatasoft.com/api/explore/v2.0/catalog/datasets?select={metadata}&where=dataset_id%3D%22{dataset_id}%22&offset=0&timezone=UTC'
    headers = {'accept': 'application/json; charset=utf-8'}
    response = requests.get(url, headers=headers)
    json_data = response.json()
    extracted_metadata = json_data['datasets'][0]['dataset'][metadata]
    return extracted_metadata




## Load data


In [None]:
# Read Data
dataset_id = 'sk-stat-89'

df = get_dataset(dataset_id)

df.head()

In [None]:
# Dimensions of the Dataset
dimensions = df.shape
num_rows = dimensions[0]
num_cols = dimensions[1]

print("Number of rows (observations):", num_rows)
print("Number of columns (variables):", num_cols)

Number of rows (observations): 42
Number of columns (variables): 28


## Explore Metadata

In [None]:
# Look at the fields
fields = get_metadata('fields',dataset_id)
fields_df = pd.DataFrame(fields)

fields_df

In [None]:
# Keywords
keyword = get_metadata("keyword", dataset_id)

# Publisher
publisher = get_metadata("publisher", dataset_id)

print(f'Keywords: {keyword}')
print(f'Publisher: {publisher}')

Keywords: ['Bezirk ', 'Diessenhofen ', 'Gemeinde ', 'Wahlen ', 'Kantonale Wahlen', 'Grosser Rat', 'Grossratswahlen ', 'Wahlzettel ', 'Stimmen ', 'Kandidat', 'Kandidatin', 'panaschieren', 'Panaschierstatistik ', 'Kantonsrat']
Publisher: Dienststelle für Statistik Kanton Thurgau


## Analyze data

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.")

In [None]:
# continue your code here...

------------------------------------------------------------------------

## Questions about the data?

Contact us via [Mail](mailto:ogd@tg.ch) or visit our [GitHub presence](https://github.com/ogdtg)


------------------------------------------------------------------------

OGD-Koordinationsstelle Kanton Thurgau | Grabenstrasse 8 | 8510 Frauenfeld
