## Open Government Data, provided by **Statistisches Amt des Kantons Basel-Stadt - Fachstelle OGD**
date: 2025-05-12

## Dataset
# **Veränderte Wahlzettel der Grossratswahlen 20. Oktober 2024**

## Data set links

[Direct data shop link for dataset](https://data.bs.ch/explore/dataset/100408)

*Autogenerated Python starter code for data set with identifier* **100408**

## Metadata
- **Dataset_identifier** `100408`
- **Title** `Veränderte Wahlzettel der Grossratswahlen 20. Oktober 2024`
- **Description** `<p>Bei den Grossratswahlen im Kanton Basel-Stadt am 20. Oktober 2024 kandidierten 870 Personen (verfügbar unter <a href='https://data.bs.ch/explore/dataset/100385/' target='_blank'>https://data.bs.ch/explore/dataset/100385/</a>) für insgesamt 100 zu vergebende Sitze.</p><p> Es gingen insgesamt 42 640 gültige Wahlzettel ein, von denen 20 733 verändert wurden. Der Datensatz zeigt diese 20 733 Wahlzettel und jegliche Details dazu. </p><p>Leere Felder bei der Stimme bedeuten, dass das Feld leer gelassen wurde. Felder mit NULL bei der Stimme bedeuten, dass in diesem Wahlkreis weniger Stimmen zur Verfügung standen.</p><p>Die Listennummer 00 bedeutet, dass ein Wahlzettel ohne Bezeichnung ausgefüllt wurde (insgesamt 3 326 Wahlzettel). In diesem Fall werden leere Stimmen nicht gezählt.</p><p>Es gibt zwei Arten wie man einen Wahlzettel verändern kann: <br>Panaschieren bedeutet, dass Kandidierende von anderen Listen auf die ausgewählte Liste übertragen wurden. <br>Kumulieren bezeichnet das Mehrfachnennen eines Kandidierenden, wodurch diese mehr als eine Stimme erhält. <br>Im Datensatz wird 'p' für panaschiert und 'k' für kumuliert verwendet. Wenn ein Wahlzettel sowohl panaschiert als auch kumuliert wurde, wird ebenfalls 'p' ausgewiesen. </p><p><span>Die Wahlergebnisse sind in einem separaten Datensatz (</span><a 255);'='' 255,='' background-color:='' href='https://data.bs.ch/explore/dataset/100399/' rgb(255,='' target='_blank'>https://data.bs.ch/explore/dataset/100399/</a><span>) einsehbar, der die Verteilung der Stimmen und die gewählten Vertreter detailliert darstellt.</span></p>`
- **Contact_name** `Open Data Basel-Stadt`
- **Issued** `2024-12-06`
- **Modified** `2025-04-28T08:23:07+00:00`
- **Rights** `NonCommercialAllowed-CommercialAllowed-ReferenceRequired`
- **Temporal_coverage_start_date** `None`
- **Temporal_coverage_end_date** `None`
- **Themes** `['Politik', 'Bevölkerung']`
- **Keywords** `['Wahlen', 'Abstimmung', 'Demokratie', 'Teilhabe', 'Parlament', 'Grosser Rat', 'Grossrat', 'Grossrätin']`
- **Publisher** `Staatskanzlei`
- **Reference** `https://www.bs.ch/regierungsrat/staatskanzlei/politische-rechte/wahlen-und-abstimmungen`


# Load packages

In [None]:
library(tidyverse)

# Load data
The dataset is read into a dataframe

In [None]:
get_dataset <- function(url) {
  # Create directory if it does not exist
  data_path <- file.path(getwd(), '..', 'data')
  if (!dir.exists(data_path)) {
    dir.create(data_path, recursive = TRUE)
  }
  # Download the CSV file
  csv_path <- file.path(data_path , '100408.csv')
  download.file(url, csv_path, mode = "wb")

  # Read the CSV file
  data <- tryCatch(
      read.csv(csv_path, sep = ";", stringsAsFactors = FALSE, encoding = "UTF-8"),
      warning = function(w) NULL,
      error = function(e) NULL
  )
  # if dataframe only has one column or less the data is not ";" separated
  if (is.null(data) || ncol(data) <= 1) {
      stop("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
  }
  return(data)
}

In [None]:
df = get_dataset('https://data.bs.ch/explore/dataset/100408/download')

# Analyze data

In [None]:
glimpse(df)

In [None]:
str(df)

In [None]:
head(df)

In [None]:
tail(df)

In [None]:
# Remove columns that have no values
df <- Filter(function(x) !all(is.na(x)), df)

# Remove rows with missing values (if appropriate)
df <- na.omit(df)

In [None]:
# display a small random sample transposed in order to see all variables
t(sample_n(df, 5))

In [None]:
# the size of the data frame in memory
size <- object.size(df)
#  the size in bytes
print(size)

In [None]:
# describe numerical features
summary(df[, sapply(df, is.numeric)])

In [None]:
# describe non-numerical features
summary(df[, sapply(df, Negate(is.numeric))])

In [None]:
# check missing values
df %>%
  mutate(row = row_number()) %>%
  gather(key = "variable", value = "value", -row) %>%
  ggplot(aes(x = variable, y = row)) +
  geom_tile(aes(fill = is.na(value)), color = "black") +
  scale_fill_manual(values = c("TRUE" = "grey", "FALSE" = "red")) +
  labs(x = "", y = "", fill = "Missing") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

In [None]:
# plot a histogram for each numerical feature
df %>%
  select_if(is.numeric) %>%
  gather() %>%
  ggplot( aes(value)) +
  geom_histogram(bins = 10, color = "white", fill = "red") +
    facet_wrap(~key, scales = 'free_x')

# Continue your code here...

------------------------------------------------------------------------

# Questions about the data?
Fachstelle für OGD Basel-Stadt | opendata@bs.ch