## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **geo_adressen_stadt_zuerich**

## Dataset
# **Adressen Stadt Zürich**

## Description

Die Gebäudeadressen der Stadt Zürich werden aus den amtlichen Vermessungsdaten erstellt und mit einem Hausnummernsortierschlüssel und mit Informationen (PLZ, Liegenschaften, etc.) ergänzt.

**Zweck**: Diese Daten werden von städtischen Dienstabteilungen in Applikationen mit Adresssuche und Info-Abfragen genutzt.

**Genereller Hinweis zum Geodatensatz:**

Es handelt sich hierbei um einen Geodatensatz, welcher aus mehreren Geodatenelmenten besteht. Diese Geodatenelemente werden hier nicht im Detail beschrieben. Sie finden jedoch sämtliche Informationen - wie beispielsweise die Attributbeschreibungen - [«**Adressen Stadt Zürich»** auf Geocat.ch](https://www.geocat.ch/geonetwork/srv/ger/catalog.search#/metadata/69b679bb-f6e1-9267-354e-05196b272755).
			   

**Informationen zum Datensatz:**

Datenelemente werden nur im Datenformat ESRI SDE GDB beschrieben. 
Zusätzliches Datenformat mit identischem Inhalt: Oracle SDO im Schema GEOZ_SDO. 
Das Attribut OBJECTID ist nur im Datenformat ESRI SDE GDB vorhanden. Tabellen, die nur im Datenformat Oracle SDO vorkommen werden auch beschrieben.

**Datenerfassung:**

Die Daten werden durch GeoZ im System für die amtliche Vermessung nachgeführt. Die Koordinaten der Gebäudeadressen entsprechen nicht der tatsächlichen Lage des Gebäudeeingangs, sondern sind für die Beschriftung auf dem Plan optimierte Koordinaten. Die Koordinaten der Strassennamen entsprechen einem (ausgewählten) Beschriftungspunkt. Neue Gebäudeadressen können entweder durch Neu-, Um- und Anbauten oder auf Verlangen des Eigentümers entstehen. Die Vergabe der Hausnummer ist in der Verordnung über die Gebäudeadressierung und das Anbringen von Strassenschildern (StRB Nr. 73 vom 25. Januar 2006) geregelt.

**Datengrundlage:**

Amtliche Vermessungsdaten der Stadt Zürich sowie mehrere Datenbestände der Stadt Zürich, welche mit den Adressen verschnitten werden. Dazu gehören: BZO, Stadtkreise und weitere.

**Geodatenelemente:**

Die vollständige Metadatenbeschreibung der Geodatenelemente finden Sie ebenfalls unter [«**Adressen Stadt Zürich»** auf Geocat.ch](https://www.geocat.ch/geonetwork/srv/ger/md.viewer#/full_view/69b679bb-f6e1-9267-354e-05196b272755).

***ADRSTZH_ADRESSEN_STZH_P***: 

Alle Gebäudeadressen aus der Stadt Zürich inkl. Verschnitt-Infos für Adresssuche und Info-Abfrage in Applikationen.


***ADRSTZH_STRASSENNAMEN_STZH_P***: 

Alle Strassenamen der Stadt Zürich. Jeder Strassennamen ist einmal inkl. einer Punktkoordinate vorhanden.


***EGID_BB_EO_ADR_TBL***: 

Zusatzinformationen für EGID aus Bodenbedeckung (BB), Einzelobjekten (EO) und Adressen (ADR)




**Statisches Vorschaubild:**

![BildText](https://www.gis.stadt-zuerich.ch/zueriplan_docs/geocat/69b679bb-f6e1-9267-354e-05196b272755.png)



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/geo_adressen_stadt_zuerich)

https://www.stadt-zuerich.ch/geodaten/download/Adressen_Stadt_Zuerich?format=geojson_link<br>
{{ DATASHOP_LINK_ORGANIZATION }}

## Metadata
- **Publisher** `GIS-Zentrum, Geomatik + Vermessung, Tiefbau- und Entsorgungsdepartement`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Basis­karten`
- **Tags** `['adressen', 'geodaten', 'geoportal', 'punktdaten', 'stzh', 'vektordaten']`
- **Metadata_created** `2023-11-06T03:11:24.984365`
- **Metadata_modified** `2025-02-05T04:33:28.893675`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd 

import json
import xml.etree.ElementTree as ET
import requests
import geopandas as gpd
import re

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    # get URL ofs WFS service
    dataset_identifier = re.search(r'\/([^\/\?]+)\?', url).group(1)
    url_geoportal = f"https://www.ogd.stadt-zuerich.ch/wfs/geoportal/{dataset_identifier}"
    print("Getting available layers from:", url_geoportal)
    
    # Parameter for GetCapabilities
    params = {
        "service": "WFS",
        "version": "1.1.0",
        "request": "GetCapabilities"
    }
    
    # send GetCapabilities
    response = requests.get(url_geoportal, params=params)

    # parse XML answer
    root = ET.fromstring(response.content)

    # define Namespace 
    namespace = {'wfs': 'http://www.opengis.net/wfs'}
    
    # Exctract available layers
    layers = [feature_type.find('wfs:Name', namespace).text for feature_type in root.findall('.//wfs:FeatureType', namespace)]
    
    print("Available layers:", layers)
    print("First layer is set as default. To chose another layer set it as typename in the get_dataset() function.")

    # set first layer als typename
    typename = layers[0]
    print("Chosen typename:", typename)

    # Parameter GetFeature request
    params = {
        "service": "WFS",
        "version": "1.1.0",
        "request": "GetFeature",
        "typename": typename,
        "outputFormat": "application/json"
    }
    
    # GetFeature request
    response = requests.get(url_geoportal, params=params)

    # Load GeoJSON in GeoDataFrame
    gdf = gpd.read_file(json.dumps(response.json()))
    return gdf

## Load data

- The dataset has **`{{ DISTRIBUTION_COUNT }}` distribution(s)** in CSV format.
- All available CSV distributions are listed below and can be read into a pandas dataframe.

In [None]:
# name: Adressen_Stadt_Zuerich.json (GeoJSON-Services)
# filename: nan
# format: JSON
# url: https://www.stadt-zuerich.ch/geodaten/download/Adressen_Stadt_Zuerich?format=geojson_link
# id: d1e6bd12-c9fc-4c76-b47d-44766ea6d8ed
# resource_type: api
# package_id: e15219bc-eb02-42a1-98f0-56a977b7507f

gdf = get_dataset('https://www.stadt-zuerich.ch/geodaten/download/Adressen_Stadt_Zuerich?format=geojson_link')


## Analyze data

In [None]:
gdf.plot()

In [None]:
# drop columns that have no values
gdf.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {gdf.shape[0]:,.0f} rows (observations) and {gdf.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {gdf.duplicated().sum()} exact duplicates in the data.')

In [None]:
gdf.info(memory_usage='deep', verbose=True)

In [None]:
gdf.head()

In [None]:
# display a small random sample transposed in order to see all variables
gdf.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(gdf.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(gdf.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# plot a histogram for each numerical feature
try:
    gdf.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch