# [muenchen.digital](https://muenchen.digital) Adventskalender 2024 - Coding Challenge 2

Über den folgenden Button gelangst du zu einer interaktiven Version dieses Notebooks, in der du die Challenge selbst lösen kannst: 

[![Binder starten](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/it-at-m/advent-coding-challenges-24/HEAD?urlpath=lab%2Ftree%2Fchallenges%2Fchallenge2.ipynb)

## Datensatz

Unser Coding-Adventskalender dreht sich dieses Jahr komplett um Weihnachtsmärkte.

Genauer gesagt, um die Weihnachtsmärkte in München, denn für die gibt es seit diesem Jahr einen frei verfügbaren Datensatz.

Diesen Datensatz wollen wir in den 4 Challenges nutzen, um nach und nach mehr Informationen zu den Weihnachtsmärkten herauszufinden.

Du findest ihn unter folgendem Link: https://opendata.muenchen.de/dataset/weihnachtsmaerkte-muenchen/resource/312260ca-7346-4b85-a357-3764bcadc6dd

Schau dir den Datensatz gerne erst einmal im Browser an, um ihn kennenzulernen.

# Download des Datensatzes

**Der Datensatz wurde inzwischen noch einmal bezüglich der Koordinaten korrigiert, bitte geh sicher dass du die aktuellste Version (v5) verwendest.**

Du kannst den Datensatz entweder [manuell herunterladen](https://opendata.muenchen.de/dataset/92515550-b236-4a08-9259-260513889548/resource/312260ca-7346-4b85-a357-3764bcadc6dd/download/weihnachtsmarkte-muenchen-2024-v5.csv) und wieder in das Notebook hochladen, oder du kannst den folgenden Code-Block ausführen, um den Datensatz direkt in das Notebook zu laden.

In [None]:
import requests

url = "https://opendata.muenchen.de/dataset/92515550-b236-4a08-9259-260513889548/resource/312260ca-7346-4b85-a357-3764bcadc6dd/download/weihnachtsmarkte-muenchen-2024-v5.csv"
response = requests.get(url)

with open("weihnachtsmarkte-muenchen-2024-v5.csv", "wb") as file:
    file.write(response.content)

## Vorbereitung

Zur Vorbereitung laden wir den Datensatz, dieses Mal aber in GeoPandas, um die Koordinaten direkt als Geometrie-Objekte zu haben.

In [1]:
# Pandas importieren
import pandas as pd
import geopandas as gpd

# Datensatz laden
df = pd.read_csv("../challenges/weihnachtsmarkte-muenchen-2024-v5.csv")

# GeoDataFrame erstellen
gdf = gpd.GeoDataFrame(df, geometry=gpd.points_from_xy(df.longitude, df.latitude), crs="EPSG:4326")

# GeoDataFrame plotten
gdf.explore()

# Aufgabenstellung

In der letzten Challenge wollen wir unser gesammeltes Wissen noch einmal kombinieren:

Wir suchen den Weihnachtsmarkt, der am nächsten an einer ÖPNV-Haltestelle liegt.
Dafür müssen wir:

- alle ÖPNV-Haltestellen in München finden
- die Distanzen zwischen allen Weihnachtsmärkten und allen ÖPNV-Haltestellen berechnen
- den Weihnachtsmarkt finden, für den die Distanz zur nächsten ÖPNV-Haltestelle am geringsten ist
- die Märkte und Stationen auf einer Karte visualisieren und den kürzesten Weg einzeichnen

## Hinweise

- Es ist hilfreich, die geopandas-Funktion `distance` zu verwenden, um die Distanz zwischen zwei Geometrien zu berechnen.
- Wenn du das für eine ganze Tabelle als neue Spalte machen möchtest, kannst du die Funktion `apply` auf der Spalte `geometry` verwenden.
- Die Projektion sollte auf EPSG:3857 (Web Mercator) gesetzt werden, um die Distanzen in Metern zu erhalten.
- Mit der Funktion `.min()` findest du den minimalen Wert in einer Spalte.
- Mit der Funktion `.idxmin()` findest du den Index des minimalen Wertes in einer Spalte.
- Mit der Funktion `.describe()` kannst du dir eine Zusammenfassung einer Spalte anzeigen lassen.
- Am Ende kannst du wieder wie in Challenge 2 mit folium eine Karte erstellen und die Weihnachtsmärkte und ÖPNV-Haltestellen als Marker einzeichnen.

Viel Erfolg!

## Weitere Daten

Die ÖPNV-Haltestellen sind Teil des Datensatzes MVG-Fahrplandaten: https://opendata.muenchen.de/dataset/mvg-fahrplandaten-solldaten

Wir haben die Daten der Haltestellen bereits heruntergeladen und in der Datei `stops.txt` abgelegt.

## Musterlösung

Nach Ende des Gewinnspiels findest du auch eine Musterlösung auf der Startseite des Repositorys verlinkt.

## Deine Lösung

Ab hier kannst du mit deiner Lösung beginnen.
Denk daran, die bereits geladene Tabelle `gdf` zu benutzen 😉

In [None]:
# Haltestellen laden
stations = pd.read_csv("stops.txt")

# Haupt-Stationen filtern (nur Stationen wo parent_station leer ist)
stations = stations[stations["parent_station"].isnull()]

# Spalten filtern
stations = stations.filter(["stop_name", "stop_lat", "stop_lon"])

# GeoDataFrame erstellen
stations = gpd.GeoDataFrame(stations, geometry=gpd.points_from_xy(stations.stop_lon, stations.stop_lat), crs="EPSG:4326")

# Projektion ändern
stations = stations.to_crs("EPSG:3857")

# GeoDataFrame plotten
stations.explore()