## Open Government Data, provided by **Statistisches Amt des Kantons Basel-Stadt - Fachstelle OGD**
*Autogenerated Python starter code for data set with identifier* **100357**

## Dataset
# **Baumkronenbedeckung**

## Data set links

[Direct data shop link for dataset](https://data.bs.ch/explore/dataset/100357)

## Metadata
- **Dataset_identifier** `100357`
- **Title** `Baumkronenbedeckung`
- **Description** `<p>Dieser Datensatz zeigt die gesamte durch Bäume beschattete Fläche (Baumkronenbedeckung) im Kanton Basel-Stadt in verschiedenen Jahren. Der Kanton Basel-Stadt erhebt durch Laserabtastung der Oberfläche (LiDAR) Daten zur Baumkronenbedeckung (durch Bäume beschattete Fläche) über die gesamte Kantonsfläche. Die von LiDAR abgeleitete Baumkronenbedeckung und Kennzahlen wurden für 2012 und 2021 berechnet. Die Nachführung wird in Zukunft alle drei Jahre stattfinden (2024 und 2027), so dass die Entwicklung der Baumkronendeckung in Basel genau verfolgt werden kann.</p><p>Der Flug für die Erhebung neuer Daten in 2024 hat bereits stattgefunden, die Daten zu den Bäumen werden ausgewertet und im Herbst publiziert. In Zukunft werden, für ein genaues Monitoring, alle 3 Jahre neue Daten erhoben.</p><p>Die Stadtgärtnerei stellt der interessierten Öffentlichkeit dieses digitale Wissen zur Verfügung: <a href='https://www.stadtgaertnerei.bs.ch/stadtgruen/stadtbaeume/baumkronenbedeckung.html' target='_blank'>Stadtgärtnerei des Kantons Basel-Stadt - Baumkronenbedeckung (https://www.stadtgaertnerei.bs.ch/stadtgruen/stadtbaeume/baumkronenbedeckung.html)</a>
</p><p>

Man kann die LiDAR-Daten in Form einer png- und pgw-Datei in der Tabellenansicht herunterladen. Eine PGW-Datei ist eine Weltdatei, die Georeferenzierungsdaten für ein zugehöriges Bild im PNG-Format enthält, um dessen genaue Positionierung auf einer Karte zu ermöglichen.</p><p>Hier finden Sie die URLs zu den Zip-Dateien, die beide Dateien enthalten:<br> 
<a href='https://data-bs.ch/stata/stadtgaertnerei/Baumkronenbedeckung_2012.zip' target='_blank'>https://data-bs.ch/stata/stadtgaertnerei/Baumkronenbedeckung_2012.zip</a><br><a href='https://data-bs.ch/stata/stadtgaertnerei/Baumkronenbedeckung_2021.zip' target='_blank'>https://data-bs.ch/stata/stadtgaertnerei/Baumkronenbedeckung_2021.zip</a></p><p>Auf der Website des Tiefbauamts können Sie die Daten mit dem GeoViewer betrachten: <a href='https://tiefbauamt-bs.ch/geoviewer/lidar' target='_blank'>https://tiefbauamt-bs.ch/geoviewer/lidar</a></p><p>Detailinformationen zur LiDAR-Technologie finden Sie hier: <a href='https://www.swisstopo.admin.ch/de/lidar-daten-swisstopo' target='_blank'>https://www.swisstopo.admin.ch/de/lidar-daten-swisstopo</a> </p>`
- **Contact_name** `Fachstelle für OGD Basel-Stadt`
- **Issued** `2024-03-23`
- **Modified** `2024-04-04T12:36:57+00:00`
- **Rights** `NonCommercialAllowed-CommercialAllowed-ReferenceRequired`
- **Temporal_coverage_start_date** `2012-12-30T23:00:00+00:00`
- **Temporal_coverage_end_date** `None`
- **Themes** `['Raum und Umwelt', 'Geographie']`
- **Keywords** `['Baum', 'Baumbestand', 'Baumkrone', 'Kronenbedeckung', 'Vegetation', 'LiDAR']`
- **Publisher** `Stadtgärtnerei`
- **Reference** `https://tiefbauamt-bs.ch/geoviewer/lidar`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd
import requests
import os

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    r = requests.get(url, params={'format': 'csv', 'timezone': 'Europe%2FZurich'})
    data_path = os.path.join(os.getcwd(), '..', 'data')
    if not os.path.exists(data_path):
      os.makedirs(data_path)
    csv_path = os.path.join(data_path, '100357.csv')
    with open(csv_path, 'wb') as f:
        f.write(r.content)
    data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
    # if dataframe only has one column or less the data is not ";" separated
    if data.shape[1] <= 1:
        print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    return data

## Load data

The dataset is read into a dataframe

In [None]:
df = get_dataset('https://data.bs.ch/explore/dataset/100357/download')

## Analyze data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Questions about the data?** Fachstelle für OGD Basel-Stadt | opendata@bs.ch