<div style="text-align: center;">
<img src="images/python-logo.png" alt="python_logo" width=20% >

# Kortdage 2025: Introduktion til Python

</div>

Formålet med workshoppen er at give en introduktion til, hvordan man kan arbejde med geodata i Python 🐍.

Vi starter med en hurtigt introduktion til Python. Dernæst skal vi se eksempler på at arbejde med både vektor og rasterdata.

Der vil undervejs være lidt øvelser i, hvad vi har lært - og er du hurtigt igennem, kan du give dig i kast med udfordringen nederst! 

Er du helt ny til Python kan læringskurven være stejl! ⛰️
Men fortvivl ikke, hvis det er forvirrende i starten - det tager tid at lære et helt nyt 'sprog' - og du kan altid komme tilbage til kursusmaterialerne, hvis du har brug for at brug for at genopfriske noget.

**Indhold:**

* [Introduktion til Python](#introduktion-til-python)
* [Vektordata og Geopandas](#vektor)
* [Udfordring](#udfordring)
* Rasterdata med Python (separat notebook, *raster_eksempel.ipynb*)


Målsætningen med i dag er at komme *i gang* med Python - men det kræver mere end et par timer at lære alle de grundlæggende funktioner!

For en grundigere introduktion til Python, se nogle af de materialer vi har linket til [HER](https://github.com/anerv/python_kortdage/blob/main/inspiration.md).

*Workshoppen er baseret på materialer fra bl.a. [PythonCrashCourse](https://github.com/anastassiavybornova/pythoncrashcourse), [GeoPython](https://geo-python-site.readthedocs.io/en/latest/index.html) og [PythonGIS](https://pythongis.org/index.html).*

## ❓Hvorfor kode?

Man kan gøre sådan ca. det samme med Python som et almindeligt desktop GIS-program, men kodning er særlig velegnet til:

* *Store datasæt* ‼️
* *Automatisering* 🔛
* *Opgaver, der skal gentages igen og igen* 🔁

Kodning hjælper os også med at *dokumentere* vores arbejde (med Python skriver du automatisk alle dine analyse-skridt ned!).

Når man først har lært det grundlæggende, er det ofte også *hurtigere* end at skulle klikke rundt i et desktop-program.


## ❓Hvorfor Python?

* Et af de mest udbredte programmeringssprog - også inden for GIS og geodata 🌐
* Relativt nemt at lære - selvom det ikke altid føles sådan i begyndelsen! 😩

## 💻 Installation osv.

Det kan være lidt tricky første gang man skal installere Python. På denne her workshop bruger vi Google Colab så vi slipper for installationen. 

Hvis du skal installere Python på et senere tidspunkt, kan du finde en guide her: https://pythongis.org/part1/chapter-01/nb/06-installation.html.


<details>
<summary><b>Valg af software til Python</b></summary>

Python er et programmeringssprog, der ikke hører til én bestemt software. Der er derfor mange måde at køre Python-kode på! 

Man kan fx bruge et program, designet til at skrive og køre kode (en IDE), køre sin kode i sin browser med Jupyter Lab eller Google Colab, eller bruge den indbyggede Python-konsol i fx. QGIS.

Vi anbefaler at arbejde i en IDE, fx Visual Studio Code, hvor programmet også kan hjælpe en med syntax og version control.

</details>



***

##  ✨ Introduktion til Python ✨

Filen her er en [Jupyter Notebook](https://jupyter.org/). Notebooks er interaktive filer, der gør det muligt at køre kode og få vist resultatet i den samme fil.

### Python som lommeregner ✖️➗➖➕

En af de mest simple anvendelser af Python er som en lommeregner:

In [None]:
# Vi kan bruge Python til at lave simple beregninger
# Det her er forresten en "kommentar" - hvis man sætter et # foran en linje, så bliver den ignoreret af Python
# Kommentarer er gode til at forklare hvad koden gør

# "Boksen" her er en celle - det er her vi skriver vores kode
# For at køre koden i en celle, tryk Shift + Enter

In [None]:
# Plus

2 + 2

In [None]:
# Minus

10 - 2

In [None]:
# Gange

5 * 3

In [None]:
# Dividere

20 / 4

Vil vi lave mere komplicerede udregninger har vi brug for modulet `math`.

* Python moduler er som "apps" til din telefon - de tilføjer ekstra funktionalitet til Python og vi slipper for at skulle skrive al kode helt fra bunden.
* Vi kan importere et modul med kommandoen "import" og så navnet på modulet.
* Nogen moduler er indbygget i Python, andre skal installeres først.

In [None]:
import math  # math er et indbygget modul, så det behøver vi ikke installere først

# Kvadratrod
math.sqrt(16)

### Datatyper i Python

* Python har flere forskellige *typer* af data.
* Hver type har forskellige metoder og egenskaber.
* De vigtigste er **integer** (heltal), **float** (decimaltal), **string** (tekst) og **boolean** (True/False).

In [None]:
# integer - hele tal

# man kan se typen af en variabel med metoden type()

type(5)

In [None]:
type(2.5)

In [None]:
type("hej!")

In [None]:
# det her er også en string
type("2")

In [None]:
type(True)

Datatyper er bl.a. vigtige, da de afgør, hvad der sker når vi arbejder med vores variable.

Man kan fx plusse både tal og tekst, men med meget forskellige resultater!

In [None]:
2 + 10

In [None]:
"hej" + " med dig"

Hvad sker der hvis man blander datatyper?

In [None]:
2 + "hej"

Cellen ovenfor giver os en **fejlmeddelelse**. Hvis der er fejl i vores kode, der gør at Python ikke kan forstå vores kode, kommer der altid en fejlmeddelse.

Fejlmeddelsen giver os et hint om, hvad fejlen er. Her får vi fx en ``TypeError``, og får at vide at man ikke kan lægge et integer tal og en tekststreng sammen.

**OBS!** Der kommer kun en fejlmeddelelse, hvis koden *ikke* er korrekt *Python-syntaks* 🐍. Hvis vi har lavet fejl, der giver et forkert resultat, men stadig er korrekt Python kommer der *ikke* en fejlmeddelelse.

### Variable i Python

En Python variabel er en "beholder" der kan indeholde data.

Man bestemmer selv navnet på variablen *(variabel-navne kan dog kun indeholde tal, bogstaver og _, og de må ikke starte med et tal*).

En variabel skrives som `navn` = `værdi`.

Fx: `min_variabel = 2025`

* `min_variabel` er *navnet* på variablen.
* `=` er den *operator* vi bruger til at koble navn og værdi.
* `2025` er *værdien* af vores variabel.

Variablen med navnet `min_variabel` indeholder nu en *pointer* der peger på værdien `2025` i din computers hukommelse.


In [None]:
min_variabel = 2025

In [None]:
# Hvis man vil se hvad der er i en variabel kan man printe den!
print(min_variabel)

In [None]:
# man kan overskrive værdien i en variabel
min_variabel = "kortdage2025"

print(min_variabel)

Fordi vi arbejder i en **Jupyter Notebook** får vi automatisk printet resultaterne af den sidste beregning i hver celle ✏️. 

Hvis vi vil printe mere end den sidste udregning (eller arbejder i en standard *.py* Pythonfil) skal vi eksplicit bede Python om at printe resultatet:

In [None]:
13 + 14 + 15

2 + 2

In [None]:
print(13 + 14 + 15)

print(2 + 2)

Hvis du vil vide mere om, hvordan noget virker kan du altid bede om hjælp! 🆘

In [None]:
help(print)

In [None]:
help(str)

### Lister

Man har ofte brug for at gemme mere end én værdi i en variabel.

Python har flere forskellige måder at gøre det på, men den mest udbredte er nok en simpel **liste**.

* En liste er omgivet af *firkantede* parentes-tegn ``[]``
* Værdier adskilles af *komma* `,`

In [None]:
en_liste = [1, 2, 3, 4, 5]

In [None]:
type(en_liste)

Python indexering starter ved **0**!

In [None]:
en_liste[0]

In [None]:
en_liste[6]  # Giver fejl fordi der ikke er noget 7. element i listen

### Loops ➿

En af de bedste grunde til at bruge Python er, at det gør det nemt at gøre den samme ting mange gange i træk - fx ved at bruge et **loop**.

I et `for`-loop itererer vi over et itererbart objet - fx en liste - og for hvert element i listen kører vi vores kode:

```python
for element in iterable_object:
    kode-statement
# i det her loop vil koden blive eksekveret lige så mange gange som vi har elementer i vores iterable objekt .

```

Man bestemmer selv, hvad man kalder elementerne i sin liste. Ofte bruger man blot et bogstav, fx ``for l in list:``.

In [None]:
# Det her er et simpelt eksempel - men man kan putte hvad som helt ind i et loop

for element in en_liste:  # vores liste fra før
    print(element)

I eksemplet ovenfor står ``print`` *indenteret* i forhold til vores ``for``-linje. Her betyder indenteringen at alt der står indenteret ift. *"for element..."* er en del af vores for-loop.

**Indentering** og linjeskift ↩️ er afgørende i Python-kode og hjælper computeren med at forstå koden. Man kan bruge enten 4 mellemrum eller tab-tasten ↔️ til at indentere en linje.

### Gør-det-selv

In [None]:
# print sætningen "jeg er på kortdage2025" med de følgende variable:

x = "jeg"
y = "er"
z = "på kortdage2025"

# NOTE: Det kan gøres med en enkelt linje kode!

# TODO: tilføj din kode her:

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
print(x, y, z)
```

</details>

In [None]:
# loop over en liste med værdier og print hver værdi

min_liste = ["python", "er", "sjovt", "!"]

# NOTE: Du skal bruge et for-loop. Husk indrykning!

# TODO: tilføj din kode her:

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
for element in min_liste: # Vi looper igennem listen
    print(element) # vi printer værdien af hvert element i listen
```

</details>

In [None]:
# gem værdien af den første værdi i listen i en variabel
# prøv også med den sidste værdi i listen!

# NOTE: Her skal du huske, hvordan man tilgår elementer i en liste, og hvordan man laver en ny variabel.
# NOTE: Husk at lister i Python starter ved 0!

# TODO: tilføj din kode her:

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
første_værdi = min_liste[0]
sidste_værdi = min_liste[-1] # eller min_liste[3]. Man kan finde det sidste element i en liste enten ved at bruge elements placering i listen (i dette tilfølde, 3, eller vha. -1. -2 refererer til det næstsidste element, osv.)
```

</details>

In [None]:
# hvilken datatype har 'min_første_variabel'?
# hvad med 'min_anden_variabel'?
# hvorfor har de forskellige datatyper?

min_første_variabel = 1411.25
min_anden_variabel = "1411.25"

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
print(type(min_første_variabel))
print(type(min_anden_variabel))
```

Når vi bruger ``""`` rundt om et tal, bliver variablen til en tekststreng.

Vi bruger ``print()`` for at få resultatet fra begge gange vi kalder type().
</details>

In [None]:
# hvad får du af at lægge min_første_variabel og min_tredje_variabel sammen?

min_tredje_variabel = 100

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
resultat = min_første_variabel + min_anden_variabel
```

</details>

*...find selv på mere!*

***

## GeoPython 🌏

### Vektor

Vektor-data i Python ligner det man kender fra andre GIS-programmer, hvor alle geometrier er enten punkter 🔵, linjer 〽️ eller polygoner 🔳.

Når man arbejder med vektordata i Python bruger de fleste **GeoPandas** 🐼🐼.
GeoPandas er bygget oven på pandas, som er et modul til at håndtere tabulære data (lidt ligesom Excel).

GeoPandas tilføjer funktionalitet til at håndtere geografiske data, så vi også kan arbejde med geometrier, foretage geometriske beregner, lave kort, osv.

<img src="images/pandas_geopandas_relation.png" style="width:700px;">


In [None]:
import geopandas as gpd  # her importerer vi et ekstra bibliotek som hedder geopandas


# vi forkorter det til gpd, så vi ikke behøver skrive geopandas hele tiden

In [None]:
# her installerer vi et ekstra bibliotek som vi skal bruge for at kunne klassficiere vores data her i google colab
!pip install mapclassify
import mapclassify  # bruges til at klassificere numeriske data i klasser

In [None]:
# Man kan indlæse stort set alle typer vektordata med geopandas
# Her indlæser vi et simpelt kort med verdens lande i geojson format fra en URL
url = "https://d2ad6b4ur7yvpq.cloudfront.net/naturalearth-3.3.0/ne_50m_admin_0_countries.geojson"


# gdf står for "geodataframe"
gdf = gpd.read_file(url)

➡️ Vi skriver ``gpd`` for at bruge Geopandas modulet.

➡️ Derefter skriver vi et punktum ``.`` og **navnet** på den Geopandas **metode** vi vil bruge (her ``read_file``). 

➡️ Efter metodenavnet kommer der en ``()``, der indeholder de **parametre** vi skal bruge som input til metoden.

I dette tilfælde har vi kun én parameter - linket til det datasæt vi vil indlæse.

Man kan se, hvilke metoder/funktioner et modul har ved at skrive modulets navn efterfulgt af et punktum og så trykke på tabulatortasten.

In [None]:
gdf.head()  # viser de første 5 rækker i tabellen

In [None]:
gdf.plot()  # laver et simpelt kort af dataene

#### Beregn Danmarks areal

In [None]:
dk = gdf[gdf["admin"] == "Denmark"]

dk

In [None]:
# geopandas dataframes har en crs attribut som fortæller hvilket koordinatsystem dataene er i
dk.crs

➡️ Når vi skriver en *variabels navn* efterfulgt af et *punktum* ``.`` og navnet på en *attribut*, kan vi få adgang til variablens **attribut-værdier**. Du kan se, hvilke attributter og metoder en variabel har, ved at skrive variablens navn efterfulgt af et punktum og så trykke tabulatortasten.

➡️ Du kan se forskel på metoder og attributter ved at kigge på, om der kommer en ``()`` efter navnet eller ej. Metoder har ``()``, attributter har ikke.

In [None]:
# man kan reprojicere sine data ligesom med andre GIS-programmer
dk = dk.to_crs(epsg=25832)  # reprojicerer til UTM32

In [None]:
# hvad er Danmarks areal?
dk.area  # resultater kommer i m2 fordi vi er i UTM32.

#### Luftforurening i København 🏭 🚗

**Hvad hvis vi vil lave et kort over luftforureningen i hvert område i København?**

Vi kunne skrive noget kode for hvert område - eller vi kan skrive en *funktion* der gør det meste af arbejdet for os.

Som vi har set, kommer Python og Python-moduler med en del indbyggede funktioner - fx til at plotte, printe eller beregne areal med Geopandas - men man kan også skrive sine egne!

**En funktion:**

* Har et **navn**
* Skal have noget **input**
* **Gør** noget med det input
* Returnerer noget **output** (for det meste)

````python
def function_name(første_input, anden_input, ...)

    # Noget kode der gør noget med input her

    return resulatet

````

In [None]:
def my_function(x):

    my_result = x * 2

    return my_result


test_result = my_function(10)

test_result

**Først indlæser vi to datasæt, et med luftforurening og et med kvarterer i København**

Lad os kigge lidt nærmere på vores data, inden vi skriver vores nye funktion til at plotte data.

In [None]:
url_luft = "https://kbhkort.kk.dk/media/airview/CAV_25May2021.geojson"
gdf_luft = gpd.read_file(url_luft)  # vores datasæt med luftforureningsmålinger

gdf_luft = gdf_luft[
    gdf_luft["Mixed_UFP"] != -999999
]  # behold kun data hvor der er valide målinger.
# Udtrykket til højre for parentesen vælger de rækker i datasættet hvor Mixed_UFP kolonnen ikke er -999999. Ved at sætte vores navn gdf_luft til venstre for lighedstegnet overskriver vi vores tidligere gdf_luft variabel med den nye filtrerede version.

url_kvarterer = "https://wfs-kbhkort.kk.dk/k101/ows?service=WFS&version=1.0.0&request=GetFeature&typeName=k101:kvarter&outputFormat=json&SRSNAME=EPSG:4326"
gdf_kvart = gpd.read_file(url_kvarterer)  # vores datasæt med københavnske kvarterer

In [None]:
len(
    gdf_luft
)  # len() returnerer længden af fx en liste eller dataframe. Her kan vi se hvor mange rækker vores gdf_luft dataframe har

In [None]:
gdf_luft.head()  # i geometry-kolonnen kan du se at geometritypen er linjer

In [None]:
gdf_kvart.plot()

In [None]:
# det er meget hurtigt at lave et kort!
gdf_luft.plot(
    column="Mixed_UFP",  # hvilken kolonne skal kortlægges?
    cmap="OrRd",  # farveskala
    legend=True,  # indsæt legend
    scheme="quantiles",  # klassificeringsmetode for værdier
    k=5,  # antal klasser
    legend_kwds={
        "loc": "upper left",
        "bbox_to_anchor": (1, 1),
    },  # Styrer placering af legend
)

In [None]:
gdf_kvart.head()

In [None]:
import matplotlib.pyplot as plt  # importerer matplotlib som bruges til at lave figurer og plots


def plot_air_quality(
    gdf_air: gpd.GeoDataFrame,
    gdf_areas: gpd.GeoDataFrame,  # Teksten efter : er valgfri, men giver et hint til brugeren om hvilken type data funktionen forventer
    column_name: str,
    classification_scheme: str = "quantiles",  # man kan sætte standard værdier for input variabler. Hvis brugeren ikke angiver en ny værdi for denne variabel, bruges "quantiles"
    num_classes: int = 5,
):

    for (
        area
    ) in (
        gdf_areas.iterrows()
    ):  # her looper vi over alle rækker i vores gdf_areas geodataframe

        fig, ax = plt.subplots(
            1, 1, figsize=(10, 10)
        )  # laver en figur til kortet med matplotlib
        # fig er selve figuren, ax er det "akse-objekt" vi kan plotte vores data på
        # (1,1) betyder at vi laver 1 række og 1 kolonne af plots i figuren (alså kun et plot i figuren)

        local_air = gdf_air[
            gdf_air.within(area[1].geometry)
        ]  # her udvælger vi kun de luftmålinger som ligger indenfor det aktuelle område
        local_air.plot(
            ax=ax,  # fortæller at vi vil plotte i den figur vi lige har lavet
            column=column_name,  # hvilken kolonne skal kortlægges?
            cmap="OrRd",  # farveskala
            legend=True,  # indsæt legend
            scheme=classification_scheme,  # klassificeringsmetode for værdier
            k=num_classes,  # antal klasser
            legend_kwds={
                "loc": "upper left",
                "bbox_to_anchor": (1, 1),  # Styrer placering af legend
                "frameon": False,  # fjerner boxen rundt om legend
            },
        )
        ax.set_title(
            f"Luftforurening i {area[1].kvarternavn}"
        )  # sætter en titel på kortet med navnet på kvarteret

        ax.set_axis_off()  # fjerner akser fra kortet

        # plt.show()  # viser kortet - fjern # hvis kortet skal vises
        plt.savefig(
            f"resultater/luft_{area[1].kvarternr}.png", bbox_inches="tight"
        )  # gemmer kortet som en png fil med navnet på kvarteret i mappen resultater

        plt.close()  # lukker figuren så vi ikke får en masse figurer liggende i hukommelsen

In [None]:
# Inden vi kalder vores funktion laver vi lige en mappe til vores kort
import os  # importerer os modulet som bruges til at arbejde med filer og mapper

os.makedirs(
    "resultater", exist_ok=True
)  # laver en mappe (directory) der hedder resultater

In [None]:
# Her kalder vi vores funktion og giver den de to geodataframes som input + navnet på den kolonne vi vil kortlægge

plot_air_quality(
    gdf_air=gdf_luft, gdf_areas=gdf_kvart, column_name="Mixed_UFP"
)  # Navnet på input variable behøver ikke at matche hvad de hedder i funktionen. Her angiver vi at gdf_air i funktionen skal være gdf_luft, som vi har indlæst tidligere

### Gør-det-selv

Der er næsten altid er mange måder at løse en opgave på - det er altså helt fint, hvis din løsning ikke er den samme som den vi har lavet!

In [None]:
# skriv en lille funktion der tager to tal som input og returnerer summen af dem

# NOTE: Husk at bruge def til at definere en funktion, og return til at returnere et resultat.
# NOTE: Først skriver du funktionen. Så kalder du funktionen med to tal som input, og gemmer resultatet i en variabel.

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
def my_function(x, y):

    my_result = x + y

    return my_result
    # or just
    # return x + y


result = my_function(1746, 58749)
```

</details>

In [None]:
# indlæs data fra en URL (du kan bruge af en dem dem her)
# undersøg dataene med gdf.head() og gdf.plot() og len(gdf) - hvor mange rækker er der i dataene?

# parkeringspladser i Frederiksberg Kommune
url1 = "https://gc2ekstern.frederiksberg.dk/api/v2/sql/frederiksberg?q=select%20gid,%20ogr_geometry,%20pladstype,%20max_tid,%20max_tid_periode%20from%20mobilitet.parkeringspladser_type_view&format=geojson&srs=4326"
# offentlige toiletter i Frederiksberg Kommune
url2 = "https://gc2ekstern.frederiksberg.dk/api/v2/sql/frederiksberg?format=geojson&q=select%20*%20from%20byrum.toiletter_offentlige&srs=4326"
# trafiktællinger
url3 = "https://webkort.aarhuskommune.dk/spatialmap?page=get_geojson_opendata&datasource=skoledistrikter_fkg"
# "https://webkort.aarhuskommune.dk/spatialmap?page=get_geojson_opendata&datasource=statistikdistrikter_fkg"

In [None]:
# TODO: indlæs data her

In [None]:
# TODO: Udforsk dataene her

In [None]:
# TODO: Lav et simpelt kort af dataene

In [None]:
# TODO: se om du kan lave et kort der viser en af attributterne i dataene

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python

gdf = gpd.read_file(url3)

# simpelt plot:

gdf.plot(column="sluttrin", categorical=True, legend=True)

# lidt mere avanceret plot:

fig, ax = plt.subplots(1, 1, figsize=(5, 5))  # laver en figur til kortet
gdf.plot(
    column="sluttrin",
    categorical=True,  # kategoriske data
    legend=True,
    ax=ax,
    cmap="tab20",  # farveskala
    legend_kwds={
        "loc": "lower left",
        "bbox_to_anchor": (0.7, 0.05),
        "frameon": False,
        "title": "Sluttrin",
    },
)
ax.set_axis_off()  # fjerner akser fra kortet
ax.set_title("Skoledistriktuer i Aarhus Kommune")  # sætter en titel på kortet
# center title
ax.title.set_position([0.6, 0.95])
```

</details>

## Udfordring!

For de hurtige og øvede 🏃.

**1. Find den nærmeste parkeringsplads til hvert offentlig toilet i Frederiksberg Kommune**

<details>
<summary><b>HINT!</b></summary>

Der er mange måder at løse opgaven på! En mulighed er at lave et spatial join der finder den nærmeste parkeringsplads til hvert toilet. Prøv evt. at google "geopandas spatial join nearest" for at finde en metode du kan bruge.

</details>

<details>
<summary><b>TIP!</b></summary>

Et godt tip er at først:

1️⃣ *Bryde opgaven ned i mindre dele.*

2️⃣ *At skrive såkaldt "pseudokode" (dvs. beskrive med kommentarer hvad du vil gøre i koden), og*

3️⃣ *Først derefter skrive koden, der løser hver del af opgaven.*

</details>

In [None]:
# TODO: Tilføj din kode her

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
parking = gpd.read_file(url1)
toilets = gpd.read_file(url2)

toilets = toilets[["id", "adresse", "geometry"]]  # Ved at bruge syntaxen dataframe[[navn på kolonner]] kan vi udvælge et subsæt af kolonner fra datasættet. Her overskriver vi vores data med et udvalg af tre kolonner/attributter.
parking = parking[["gid", "geometry"]]  # og to attributter her
parking.rename(
    columns={"gid": "parkering_id"}, inplace=True
)  # omdøber kolonnen gid til parkering_id - det er ikke nødvendigt men gør det nemmere at forstå dataene

parking = parking.to_crs(epsg=25832) # reprojicer
toilets = toilets.to_crs(epsg=25832)

# Her bruger vi den indbyggede Geopandas metode sjoin_nearest (spatial join) til at joine toiletterne til den nærmeste parkeringsplads. 
joined = toilets.sjoin_nearest(
    parking,
    how="left",
    distance_col="afstand_m", # specificer at afstanden mellem de to objekter skal gemmes i en kolonne kaldet 'afstand_m'
)
```

</details>

**2. Lav et kort med toilettetterne og de nærmeste parkeringspladser.**

<details>
<summary><b>HINT!</b></summary>

For at plotte flere datasæt på det samme kort, skal vi først lave en figur, som vi kan tilføje vores data til. Det bruger vi matplotlib til.

</details>


In [None]:
# TODO: Tilføj din kode her

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
fig, ax = plt.subplots(figsize=(8, 8))

# Plot base polygons
parking.boundary.plot(ax=ax, color="gray", linewidth=1, label="Parking spots")
# Plot all matched polygons (highlighted)
parking.loc[joined["index_right"].unique()].boundary.plot(
    ax=ax, color="blue", linewidth=2, label="Nearest parking spots"
)
# Plot points
joined.plot(ax=ax, color="red", markersize=50, label="Public toilets")

ax.set_axis_off()
ax.legend(frameon=False)

ax.set_title("Toilets and their nearest parking spots")
plt.show()
```

</details>

**3. Se om du kan få et basemap/baggrundskort med.**

**HINT**: Her kan man bruge et modul der hedder *contextily*. For at bruge det skal vi først installere og loade det:*

In [None]:
!pip install contextily
import contextily as cx  # bruges til at hente baggrundskort

In [None]:
# TODO: Tilføj din kode her

<details>
<summary><b>Se løsning</b><i> (men prøv først selv!)</i></summary>

```python
fig, ax = plt.subplots(figsize=(8, 8))  # først skaber vi vores figur
# fig er selve figuren, og ax er det "akse-objekt" vi kan plotte vores data på

# Plot parkerings polygoner
parking.boundary.plot(
    ax=ax,  # specificer at vi vil plotte på vores ax, vi lavede ovenfor
    color="gray",  # vælg farve
    linewidth=1,  # vælg linjetykkelse
    label="Parking spots",  # sæt label til brug i legenden
)
# Plot all matched polygons (highlighted)
parking.loc[joined["index_right"].unique()].boundary.plot(
    ax=ax, color="blue", linewidth=2, label="Nearest parking spots"
)
# Plot punktdata med nærmeste toiletter
joined.plot(
    ax=ax,  # brug samme ax som ovenfor
    color="red",  # sæt farven på punkterne
    markersize=50,  # sæt størrelse på punkter
    label="Public toilets",  # sæt label til brug i legenden
)

ax.set_axis_off()  # valgfri styling, fjerner grid-kanter med koordinater
ax.legend(frameon=False)  # valgfri styling, fjerner kanten på vores legend

ax.set_title("Toilets and their nearest parking spots")  # sæt titel på kortet

cx.add_basemap(
    ax, source=cx.providers.CartoDB.Positron, crs=toilets.crs
)  # Tilføjer et baggrundskort - specificer CRS så baggrundskort og data passer sammen

plt.show()  # vis kortet
```

</details>

***

**Vil du lære mere? Se vores liste over kurser og bøger [HER](https://github.com/anerv/python_kortdage/blob/main/inspiration.md).**