### Wetterdaten für die gewählten Stationen einlesen und verarbeiten

- Pfade für die einzelnen Wetterdateien aus der von 04_daten_herunterladen erzeugten Datei datei_liste.txt einlesen
- Die 10 Dateien mit Wetterdaten einlesen
- Nicht relevante Spalten entfernen
- Datentyp für Spalten anpassen
- Daten auf den Zeitraum von 2014-2024 reduzieren
- Fehlerhafte Daten entfernen
- Daten der letzten 3 Jahre darstellen

In [66]:
# Datei datei_liste.txt einlesen
datei_liste <- readLines("datasets/orte/datei_liste.txt")

# Liste, um die Inhalte der Dateien zu speichern
wetterdaten <- list()

# Jede Datei aus der Liste einlesen
for (i in seq_along(datei_liste)) {
  # Der Pfad zur Datei
  dateipfad <- datei_liste[i]
  
  # Datei einlesen
  wetterdaten[[i]] <- read.table(dateipfad, 
    header = TRUE, 
    sep = ";", 
    fill = TRUE, 
    fileEncoding = "UTF-8")
  
  # Benenne das dataframe in der Liste nach der Stations ID
  name <- paste("station", wetterdaten[[i]]$STATIONS_ID[1], sep = "_")
  names(wetterdaten)[i] <- name
  # Nur relevante Spalten behalten
  wetterdaten[[i]] <- wetterdaten[[i]][, c("STATIONS_ID", "MESS_DATUM", "RSK", "SDK", "TMK")]

  # Datentypen anpassen
  wetterdaten[[i]]$MESS_DATUM <- as.Date(as.character(wetterdaten[[i]]$MESS_DATUM), format = "%Y%m%d")

  # Nur die letzten 10 Jahre behalten
  wetterdaten[[i]] <- tail(wetterdaten[[i]], 3652)

}


In [67]:
# Entfernen von fehlerhaften Daten

for (i in seq_along(wetterdaten)) {
  wetterdaten[[i]] <- subset(wetterdaten[[i]], RSK <= 400.0 & RSK >= 0.0)
  wetterdaten[[i]] <- subset(wetterdaten[[i]], SDK <= 24 & SDK >= 0)
  wetterdaten[[i]] <- subset(wetterdaten[[i]], TMK <= 60 & TMK >= -60)
}

In [81]:
# Verschiedene Informationen zu den Dateien
# durch entfernen der Kommentarzeichen können die einzelnen Informationen ausgegeben werden

for (i in seq_along(wetterdaten)) {
  print(paste("Anzahl der Zeilen", names(wetterdaten[i]), ": ", nrow(wetterdaten[[i]])))
  #print(summary(wetterdaten[[i]]))
  #print(head(wetterdaten[[1]]))
  #print(nrow(wetterdaten[[1]]))
  #boxplot(wetterdaten[[i]]$TMK, main = names(wetterdaten)[i])
  #print(subset(wetterdaten[[i]], RSK > 400.0 | RSK < 0.0))
  #print(subset(wetterdaten[[i]], SDK > 24 | SDK < 0))
  #print(subset(wetterdaten[[i]], TMK > 60 | TMK < -60))
  #plot(wetterdaten[[i]]$MESS_DATUM, wetterdaten[[i]]$TMK, type = "l", col = "blue", xlab = "Datum", ylab = "Temperatur", main = names(wetterdaten)[i])
  #break
}

[1] "Anzahl der Zeilen station_856 :  3634"
[1] "Anzahl der Zeilen station_891 :  3631"
[1] "Anzahl der Zeilen station_1346 :  3474"
[1] "Anzahl der Zeilen station_2290 :  3652"
[1] "Anzahl der Zeilen station_2712 :  3564"
[1] "Anzahl der Zeilen station_3631 :  3636"
[1] "Anzahl der Zeilen station_3730 :  3648"
[1] "Anzahl der Zeilen station_3987 :  3652"
[1] "Anzahl der Zeilen station_4271 :  3609"
[1] "Anzahl der Zeilen station_4625 :  3424"


In [87]:
png("plot.png", width=1280, height=720)
plot(1:10, rnorm(10), main="Beispielplot")
dev.off()

In [91]:
for (i in seq_along(wetterdaten)) {
  start_datum <- as.Date("2021-01-01")
  end_datum <- as.Date("2023-12-31")
  daten_letzten_3_jahre <- subset(wetterdaten[[i]], MESS_DATUM >= start_datum & MESS_DATUM <= end_datum)
  png_name <- paste("plots/", names(wetterdaten)[i], ".png", sep = "")
  png(png_name, width=800, height=400)
  plot(daten_letzten_3_jahre$MESS_DATUM, daten_letzten_3_jahre$TMK, type = "l", col = "blue", xlab = "Datum", ylab = "Temperatur", main = names(wetterdaten)[i])
  dev.off()
  
}

# HIER MORGEN AUCH NOCH DIE ANDEREN PARAMETER PLOTTEN
# UND GUCKEN WAS JETZT ALLES IN DEN TEXT REIN SOLL