## Open Government Data, provided by **OpenDataZurich**
*Autogenerated Python starter code for data set with identifier* **geo_gebaeudebrueter**

## Dataset
# **Gebäudebrüter**

## Description

2 Themen:Inventar Gebäudebrüter-&gt; Beobachtung von Nistplatztstandorten der Vogelarten Turmfalke, Mauersegler, Alpensegler, Mehlschwalbe, Schleiereule, Wanderfalke und Rauchschwalbe.
Bauberatung-&gt; Gebäuderenovationen o. Umbauten an Gebäuden mit Nistplatzstandorten.

**Zweck**: Der Datenbestand dient einerseits der homogenen Führung des Gebäudebrüter Inventars, andererseits ist er von Bedeutung für die Beratung bei Bauvorhaben an Gebäuden mit Nistplatzstandorten. Mit dem Inventar können Fragen zur Population von Gebäudebrütern in der Stadt Zürich und deren Verhalten beantwortet werden. Damit, dass die Daten zur Bauberatung einsichtig sind, dient das Inventar als Schutzmassnahme gegen die Zerstörung von Nistplatzstandorten.

**Genereller Hinweis zum Geodatensatz:**


Weitere Informationen zu diesem Datensatz finden sie unter [«**Gebäudebrüter»** auf Geocat.ch](https://www.geocat.ch/geonetwork/srv/ger/catalog.search#/metadata/0bd44405-438a-81ea-103a-d8a244a4f34f).				
			   

**Informationen zum Datensatz:**

Zusammenfassung:
Der Datenbestand 'Gebäudebrüter' beinhaltet zwei Themen. Zum Einen das Inventar der Gebäudebrüter. Dieses Stützt sich auf Beobachtung von Nistplatztstandorten der Vogelarten Turmfalke, Mauersegler, Alpensegler, Mehlschwalbe, Schleiereule, Wanderfalke und Rauchschwalbe. Das Inventar gibt ebenfalls Auskunft über Gebäude, die wegen ihrer Funktion als Nistplatzstandort als KSO-Objekte gelten. Die Nistplatzstandorte sind immer Gebäude in der Stadt Zürich. Zum Anderen ist das Thema 'Bauberatung' ebenfalls in den Datenbestand miteinbezogen. Gebäuderenovationen oder Umbauten an Gebäuden mit Nistplatzstandorten müssen eine Beratung bei GSZ durchlaufen, protokolliert wird diese im Thema 'Bauberatung'.

Bemerkung zur Nachführung:
Die Inventar-Einträge basieren auf Beobachtungen im Feld, welche dort stichwortartig festgehalten und erst im Büro digital erfasst werden. Eine Digitalisierung der Datenerhebung im Feld macht wenig Sinn, da die Beobachtungen spontan und von mehreren Personen erfolgen.

**Datenerfassung:**

Im Inventar der Alpen- und Mauerseglerniststandorte sind Daten aus verschiedenen Bestandeserhebungen und Einzelbeobachtungen zusammengefasst. Erste Erhebungen wurden bereits 1981 durchgeführt, weitere Ergänzugen kamen mit dem Inventar der kommunalen Schutzobjekte (KSO) 1989 und 1997 mit dem umfangreichen Kontrollprojekt der Alpen- und Mauerseglerniststandorte (OR) hinzu.
Der Datenbestand wurde im 2009 aus mehreren original Datenquellen zusammengeführt (FileMaker Datenbank, ESRI Shapefile und ExcelTabelle). In den drei Datenquellen wurden die gleichen Einträge z.T. mehrfach und mit unterschiedlicher Attributierung geführt. Die Originaldaten wurden vom Naturschutz in einen Datenbestand zusammengeführt. Dieser diente als Grundlage für die neue Datenstruktur. Es wurde ein grosser Aufwand zur Datenbereinigung und Qualitätsanalyse betrieben, die umfägliche Zuverlässigkeit der Daten kann aber nicht garantiert werden.

Die ältesten Inventar-Einträge stammen von 1980, die ältesten Bauberatungen sind aus dem Jahr 2001.

Die Lagegenauigkeit liegt im Gebäude-Bereich. Jeder Inventar oder Bauberatungs-Eintrag ist als Punkt auf das betroffenen Gebäude gesetzt worden.

**Datengrundlage:**

Daten der amtlichen Vermessung: (Digitalisier-Grundlage, Attribut-Quelle) Zwei Abhängigkei-ten von den Daten der amtlichen Vermessung: Einerseits werden neue Einträge des Daten-bestandes als Punkte auf die Gebäude der amtlichen Vermessung gesetzt, zum Anderen wird bei der Aufbereitung der GSZ-Intern genutzten Version des Datenbestandes die Geometrie der Gebäude und die Adressen der amtlichen Vermessung übernommen.

**Statisches Vorschaubild:**

![BildText](https://www.gis.stadt-zuerich.ch/zueriplan_docs/geocat/0bd44405-438a-81ea-103a-d8a244a4f34f.png)



## Data set links

[Direct link by OpenDataZurich for dataset](https://data.stadt-zuerich.ch/dataset/geo_gebaeudebrueter)

https://www.stadt-zuerich.ch/geodaten/download/Gebaeudebrueter?format=geojson_link<br>


## Metadata
- **Publisher** `Artenförderung und Schutzgebiete, Grün Stadt Zürich, Tiefbau- und Entsorgungsdepartement`
- **Maintainer** `Open Data Zürich`
- **Maintainer_email** `opendata@zuerich.ch`
- **Keywords** `Umwelt`
- **Tags** `['bauberatung', 'fauna', 'geodaten', 'geoportal', 'infrastruckturinventur', 'lebensraum', 'mauer', 'natur', 'naturschutz', 'polygondaten', 'schutz', 'stzh', 'vektordaten']`
- **Metadata_created** `2023-11-06T03:08:21.936833`
- **Metadata_modified** `2025-09-06T06:32:46.118492`


## Imports and helper functions

In [None]:
import matplotlib.pyplot as plt
import pandas as pd 

import json
import xml.etree.ElementTree as ET
import requests
import geopandas as gpd
import re

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    # get URL ofs WFS service
    dataset_identifier = re.search(r'\/([^\/\?]+)\?', url).group(1)
    url_geoportal = f"https://www.ogd.stadt-zuerich.ch/wfs/geoportal/{dataset_identifier}"
    print("Getting available layers from:", url_geoportal)
    
    # Parameter for GetCapabilities
    params = {
        "service": "WFS",
        "version": "1.1.0",
        "request": "GetCapabilities"
    }
    
    # send GetCapabilities
    response = requests.get(url_geoportal, params=params)

    # parse XML answer
    root = ET.fromstring(response.content)

    # define Namespace 
    namespace = {'wfs': 'http://www.opengis.net/wfs'}
    
    # Exctract available layers
    layers = [feature_type.find('wfs:Name', namespace).text for feature_type in root.findall('.//wfs:FeatureType', namespace)]
    
    print("Available layers:", layers)
    print("First layer is set as default. To chose another layer set it as typename in the get_dataset() function.")

    # set first layer als typename
    typename = layers[0]
    print("Chosen typename:", typename)

    # Parameter GetFeature request
    params = {
        "service": "WFS",
        "version": "1.1.0",
        "request": "GetFeature",
        "typename": typename,
        "outputFormat": "application/json"
    }
    
    # GetFeature request
    response = requests.get(url_geoportal, params=params)

    # Load GeoJSON in GeoDataFrame
    gdf = gpd.read_file(json.dumps(response.json()))
    return gdf

## Load the data

In [None]:
gdf = get_dataset('https://www.stadt-zuerich.ch/geodaten/download/Gebaeudebrueter?format=geojson_link')

## Analyze the data

In [None]:
gdf.plot()

In [None]:
# drop columns that have no values
gdf.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {gdf.shape[0]:,.0f} rows (observations) and {gdf.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {gdf.duplicated().sum()} exact duplicates in the data.')

In [None]:
gdf.info(memory_usage='deep', verbose=True)

In [None]:
gdf.head()

In [None]:
# display a small random sample transposed in order to see all variables
gdf.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(gdf.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(gdf.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# plot a histogram for each numerical feature
try:
    gdf.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Contact**: opendata@zuerich.ch