## Open Government Data, provided by **Statistisches Amt des Kantons Basel-Stadt - Fachstelle OGD**
date: 2025-09-12

## Dataset
# **Überwachung Luftqualität Sanierung Areal Walkeweg**

## Data set links

[Direct data shop link for dataset](https://data.bs.ch/explore/dataset/100158)

*Autogenerated Python starter code for data set with identifier* **100158**

## Metadata
- **Dataset_identifier** `100158`
- **Title** `Überwachung Luftqualität Sanierung Areal Walkeweg`
- **Description** `<div>Immobilien Basel-Stadt (IBS) erstellt auf dem Familiengarten Areal Walkeweg Nord in Basel eine Neubebauung mit Wohneigentum und Schule. Bereiche des Neubauprojektes sind im Kataster der belasteten Standorte des Kantons Basel-Stadt geführt. Es handelt sich dabei um eine ehemalige Kiesentnahmestelle (ab ca. 1892), welche in Etappen ab 1917 sukzessive wieder mit Abfall aufgefüllt wurde. Im Rahmen des Projekts ist eine Totalsanierung mit Bodenaustausch am Standort vorgesehen.</div><div>Neben behördlichen Auflagen und Schutzmassnahmen, welche während den baulichen Massnahmen im Untergrund eine Belastung der Umgebung (Schutz der Umwelt und Allgemeinbevölkerung) mindern sollen, sieht das Lufthygieneamt beider Basel (LHA) vor, während der relevanten baulichen Eingriffe die Immissionen mittels Messungen der Luft zu überwachen. Auf Basis der Ergebnisse der technischen Untersuchung des Areals wurde in erster Linie die Staubdeposition (mittels Bergerhoff-Methode) und flüchtige organische Stoffe (mittels Passivsammler) als zu überwachende Parameter ausgewählt. </div><div>Für die vorliegende Überwachung wurden Warn- und Interventionswerte festgelegt. Die Interventionswerte beruhen auf behördlichen Grenzwerten und toxikologischen Studien. Der Warnwert wurde bei jeweils 50 % des Interventionswertes festgelegt.</div><div><br></div><div>Änderungsprotokoll:<br>27.06.2023 - Aktualisierungsintervall von 'MONTHLY' auf 'NEVER' geändert.</div><div>
</div>`
- **Contact_name** `Open Data Basel-Stadt`
- **Issued** `2021-12-15`
- **Modified** `2022-10-04T10:00:53+00:00`
- **Rights** `NonCommercialAllowed-CommercialAllowed-ReferenceRequired`
- **Temporal_coverage_start_date** `2021-02-03T23:00:00+00:00`
- **Temporal_coverage_end_date** `2022-06-26T22:00:00+00:00`
- **Themes** `['Raum und Umwelt']`
- **Keywords** `['Luftqualität']`
- **Publisher** `Lufthygieneamt beider Basel`
- **Reference** `None`


# Load packages

In [None]:
library(tidyverse)

# Load data
The dataset is read into a dataframe

In [None]:
get_dataset <- function(url) {
  # Create directory if it does not exist
  data_path <- file.path(getwd(), '..', 'data')
  if (!dir.exists(data_path)) {
    dir.create(data_path, recursive = TRUE)
  }
  # Download the CSV file
  csv_path <- file.path(data_path , '100158.csv')
  download.file(url, csv_path, mode = "wb")

  # Read the CSV file
  data <- tryCatch(
      read.csv(csv_path, sep = ";", stringsAsFactors = FALSE, encoding = "UTF-8"),
      warning = function(w) NULL,
      error = function(e) NULL
  )
  # if dataframe only has one column or less the data is not ";" separated
  if (is.null(data) || ncol(data) <= 1) {
      stop("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
  }
  return(data)
}

In [None]:
df = get_dataset('https://data.bs.ch/explore/dataset/100158/download')

# Analyze data

In [None]:
glimpse(df)

In [None]:
str(df)

In [None]:
head(df)

In [None]:
tail(df)

In [None]:
# Remove columns that have no values
df <- Filter(function(x) !all(is.na(x)), df)

# Remove rows with missing values (if appropriate)
df <- na.omit(df)

In [None]:
# display a small random sample transposed in order to see all variables
t(sample_n(df, 5))

In [None]:
# the size of the data frame in memory
size <- object.size(df)
#  the size in bytes
print(size)

In [None]:
# describe numerical features
summary(df[, sapply(df, is.numeric)])

In [None]:
# describe non-numerical features
summary(df[, sapply(df, Negate(is.numeric))])

In [None]:
# check missing values
df %>%
  mutate(row = row_number()) %>%
  gather(key = "variable", value = "value", -row) %>%
  ggplot(aes(x = variable, y = row)) +
  geom_tile(aes(fill = is.na(value)), color = "black") +
  scale_fill_manual(values = c("TRUE" = "grey", "FALSE" = "red")) +
  labs(x = "", y = "", fill = "Missing") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

In [None]:
# plot a histogram for each numerical feature
df %>%
  select_if(is.numeric) %>%
  gather() %>%
  ggplot( aes(value)) +
  geom_histogram(bins = 10, color = "white", fill = "red") +
    facet_wrap(~key, scales = 'free_x')

# Continue your code here...

------------------------------------------------------------------------

# Questions about the data?
Fachstelle für OGD Basel-Stadt | opendata@bs.ch