## Open Government Data, provided by **Statistisches Amt des Kantons Basel-Stadt - DCC Data Competence Center**
date: 2025-10-25

## Dataset
# **Gesammelte PET-Einwegflaschen im Kanton Basel-Stadt**

## Data set links

[Direct data shop link for dataset](https://data.bs.ch/explore/dataset/100465)

*Autogenerated Python starter code for data set with identifier* **100465**

## Metadata
- **Dataset_identifier** `100465`
- **Title** `Gesammelte PET-Einwegflaschen im Kanton Basel-Stadt`
- **Description** `Der Datensatz enthält die jährlich gesammelten Mengen an PET-Einweg-Getränkeflaschen im Kanton Basel-Stadt, gemessen in Kilogramm. Die Daten werden von PET-Recycling Schweiz erhoben und dem Statistischen Amt Basel-Stadt nach Kalenderjahr übermittelt. Abgebildet ist der Zeitraum ab 2014 mit jährlicher Aktualisierung. Erfasst werden ausschliesslich PET-Einweg-Getränkeflaschen, keine Mehrwegflaschen oder andere Kunststoffverpackungen. Die Mengen beruhen auf den Rückmeldungen von Sammelstellen, Detailhandel und Logistikpartnern und stellen aggregierte Jahreswerte für den gesamten Kanton Basel-Stadt dar. Da die PET-Getränkeflaschen in der Schweiz über ein effizientes, optimiertes, nationales Logistiknetzwerk gesammelt und rückgeführt werden, ist eine messerscharfe Eingrenzung auf den Kanton Basel-Stadt nicht möglich. Es kann sein, dass Sammelmengen von Detailhandelsfilialen im Kanton Basel-Stadt in ein Distributionszentrum ausserhalb des Kantons überführt werden und somit in den gemeldeten Daten nicht vorhanden sind. Schwankungen im Zeitverlauf können unter anderem durch veränderte Abfüllpraktiken (leichtere Flaschen, vermehrter Einsatz von Aluminiumdosen), die Verlagerung von Sammelstellen oder gesamtgesellschaftliche Trends in der Abfallvermeidung erklärt werden.`
- **Contact_name** `Open Data Basel-Stadt`
- **Issued** `2025-10-01`
- **Modified** `2025-08-26T13:07:40+00:00`
- **Rights** `NonCommercialAllowed-CommercialAllowed-ReferenceRequired`
- **Temporal_coverage_start_date** `2013-12-31T23:00:00+00:00`
- **Temporal_coverage_end_date** `2024-12-30T23:00:00+00:00`
- **Themes** `['Raum und Umwelt']`
- **Keywords** `['Abfall']`
- **Publisher** `Statistisches Amt`
- **Reference** `https://statistik.bs.ch`


# Load packages

In [None]:
library(tidyverse)

# Load data
The dataset is read into a dataframe

In [None]:
get_dataset <- function(url) {
  # Create directory if it does not exist
  data_path <- file.path(getwd(), '..', 'data')
  if (!dir.exists(data_path)) {
    dir.create(data_path, recursive = TRUE)
  }
  # Download the CSV file
  csv_path <- file.path(data_path , '100465.csv')
  download.file(url, csv_path, mode = "wb")

  # Read the CSV file
  data <- tryCatch(
      read.csv(csv_path, sep = ";", stringsAsFactors = FALSE, encoding = "UTF-8"),
      warning = function(w) NULL,
      error = function(e) NULL
  )
  # if dataframe only has one column or less the data is not ";" separated
  if (is.null(data) || ncol(data) <= 1) {
      stop("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
  }
  return(data)
}

In [None]:
df = get_dataset('https://data.bs.ch/explore/dataset/100465/download')

# Analyze data

In [None]:
glimpse(df)

In [None]:
str(df)

In [None]:
head(df)

In [None]:
tail(df)

In [None]:
# Remove columns that have no values
df <- Filter(function(x) !all(is.na(x)), df)

# Remove rows with missing values (if appropriate)
df <- na.omit(df)

In [None]:
# display a small random sample transposed in order to see all variables
t(sample_n(df, 5))

In [None]:
# the size of the data frame in memory
size <- object.size(df)
#  the size in bytes
print(size)

In [None]:
# describe numerical features
summary(df[, sapply(df, is.numeric)])

In [None]:
# describe non-numerical features
summary(df[, sapply(df, Negate(is.numeric))])

In [None]:
# check missing values
df %>%
  mutate(row = row_number()) %>%
  gather(key = "variable", value = "value", -row) %>%
  ggplot(aes(x = variable, y = row)) +
  geom_tile(aes(fill = is.na(value)), color = "black") +
  scale_fill_manual(values = c("TRUE" = "grey", "FALSE" = "red")) +
  labs(x = "", y = "", fill = "Missing") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

In [None]:
# plot a histogram for each numerical feature
df %>%
  select_if(is.numeric) %>%
  gather() %>%
  ggplot( aes(value)) +
  geom_histogram(bins = 10, color = "white", fill = "red") +
    facet_wrap(~key, scales = 'free_x')

# Continue your code here...

------------------------------------------------------------------------

# Questions about the data?
Open Data Basel-Stadt | opendata@bs.ch