### Finden aller potenzieller Orte für die Analyse

- liest die CSV mit allen Wetterstationen ein
- erstellt ein subset mit allen Wetterstationen für die Daten der letzten 10 Jahre vorliegen
- erzeugt daraus die Datei stations.txt 

In [1]:
# Liste mit allen Wetterstationen laden
orte <- read.table("datasets/KL_Tageswerte_Beschreibung_Stationen_UTF8.csv", header = TRUE, sep=",", fill = FALSE, fileEncoding = "UTF-8")
orte$von_datum <- as.Date(as.character(orte$von_datum), format = "%Y%m%d")
orte$bis_datum <- as.Date(as.character(orte$bis_datum), format = "%Y%m%d")

# Anzahl der Orte ausgeben, Liste der Wetterstationen anzeigen und zusammenfassende Statistik
print(paste("Anzahl aller Orte:", nrow(orte)))
head(orte)
summary(orte)

[1] "Anzahl aller Orte: 1359"


Unnamed: 0_level_0,Stations_id,von_datum,bis_datum,Stationshoehe,geoBreite,geoLaenge,Stationsname,Bundesland
Unnamed: 0_level_1,<int>,<date>,<date>,<int>,<dbl>,<dbl>,<chr>,<chr>
1,1,1937-01-01,1986-06-30,478,47.8413,8.8493,Aach,Baden-Württemberg
2,3,1891-01-01,2011-03-31,202,50.7827,6.0941,Aachen,Nordrhein-Westfalen
3,11,1980-09-01,2024-04-09,680,47.9736,8.5205,Donaueschingen(Landeplatz),Baden-Württemberg
4,44,1969-01-01,2024-04-09,44,52.9336,8.237,Großenkneten,Niedersachsen
5,52,1969-01-01,2001-12-31,46,53.6623,10.199,Ahrensburg-Wulfsdorf,Schleswig-Holstein
6,61,1975-07-01,1978-08-31,339,48.8443,12.6171,Aiterhofen,Bayern


  Stations_id      von_datum            bis_datum          Stationshoehe   
 Min.   :    1   Min.   :1781-01-01   Min.   :1915-12-31   Min.   :   0.0  
 1st Qu.: 1509   1st Qu.:1947-03-16   1st Qu.:1991-07-15   1st Qu.:  77.0  
 Median : 3257   Median :1961-01-01   Median :2007-08-31   Median : 250.0  
 Mean   : 3905   Mean   :1964-04-25   Mean   :2004-12-30   Mean   : 303.4  
 3rd Qu.: 5091   3rd Qu.:1986-10-16   3rd Qu.:2024-04-09   3rd Qu.: 455.0  
 Max.   :19911   Max.   :2024-01-01   Max.   :2024-04-09   Max.   :2956.0  
   geoBreite       geoLaenge      Stationsname        Bundesland       
 Min.   :47.40   Min.   : 6.024   Length:1359        Length:1359       
 1st Qu.:49.03   1st Qu.: 8.464   Class :character   Class :character  
 Median :50.57   Median : 9.865   Mode  :character   Mode  :character  
 Mean   :50.65   Mean   :10.023                                        
 3rd Qu.:51.96   3rd Qu.:11.497                                        
 Max.   :55.01   Max.   :14.951     

In [2]:
# Zeitraum definieren
start_datum <- as.Date("2014-01-01")
ende_datum <- as.Date("2023-12-31")

# Subset der Wetterstationen für den 10 Jahres Zeitraum erstellen
orte_subset <- subset(orte, von_datum <= ende_datum & bis_datum >= start_datum)

# Anzahl der Orte im Zeitraum 2014-2024 ausgeben
head(orte_subset)
print(paste("Anzahl der Orte im Zeitraum 2014-2024:", nrow(orte_subset)))


Unnamed: 0_level_0,Stations_id,von_datum,bis_datum,Stationshoehe,geoBreite,geoLaenge,Stationsname,Bundesland
Unnamed: 0_level_1,<int>,<date>,<date>,<int>,<dbl>,<dbl>,<chr>,<chr>
3,11,1980-09-01,2024-04-09,680,47.9736,8.5205,Donaueschingen(Landeplatz),Baden-Württemberg
4,44,1969-01-01,2024-04-09,44,52.9336,8.237,Großenkneten,Niedersachsen
8,71,1986-11-01,2019-12-31,759,48.2156,8.9784,Albstadt-Badkap,Baden-Württemberg
10,73,1959-03-01,2024-04-09,374,48.6183,13.062,Aldersbach-Kramersepp,Bayern
11,78,1961-01-01,2024-04-09,64,52.4853,7.9125,Alfhausen,Niedersachsen
12,90,1988-02-19,2024-04-09,305,50.7557,9.2583,Alsfeld,Hessen


[1] "Anzahl der Orte im Zeitraum 2014-2024: 604"


In [3]:
# Liste der Wetterstationen in eine Textdatei schreiben und speichern
station_names <- orte_subset$Stationsname
writeLines(station_names, "datasets/stations.txt")