# Introduksjon til automatisering av GIS

Når det kommer til datavitenskap (data science), og spesielt romlig (spatial) datavitenskap og romlig dataanalyse, er Python for tiden det mest nyttige programmerings- eller skriptspråket å lære. På den ene siden er Python-økosystemet, som lar folk enkelt dele bibliotekene sine med andre, veldig rikt, og har pakker for nesten enhver tenkelig oppgave.

Det er flere fordeler mer spesifikt for geografer og romlig data: de fleste stasjonære GIS-programmer (f.eks. QGIS, ESRI ArcGIS e.l.) har programmeringsgrensesnitt mot Python: det betyr at du kan skrive Python-programmer som samhandler med data, biblioteker og brukergrensesnitt for disse programmene, og lage egendefinerte plugins for å utvide funksjonaliteten deres. Utover det, finnes det kraftige Python-pakker for nesten enhver oppgave innenfor romlig datahåndtering og romlig analyse.

I dag får dere en introduksjon til hvordan dere kan bruke Python til GIS-analyser, og til hvordan emnet GMGI221 - Automatisering av GIS-prosesser fungerer. Vi bruker Notebooks, sånn som denne, som består av både Markdown-celler og Python kode-celler

In [None]:
# Dette er en kode-celle, den kan køres i Jupyter Notebook

print("Hello, world!")

<div style="border: 1px solid #ccc; padding: 10px; border-radius: 5px; background-color:rgb(177, 226, 250); color:#000;">
<strong>Spørsmål:</strong><br>
Kjør cellen under for å svare på spørsmålet:
</div>

In [None]:
from IPython.display import IFrame

## SPØRSMÅL om bakgrunnsferdigheter

IFrame("https://haavard-polling.vercel.app/answer/0844ed85-0656-4ee0-9d2c-b044bb0a5119", width=900, height=500)

# Geometriske objekter

`Punkt(Points)`, `Linjer(Lines)` og `Polygoner(Polygons)` er fundamentale geometriske objekter når vi jobber med romlig data i vektor format. I Python er [Shapely](https://shapely.readthedocs.io/en/stable/manual.html) modulen som brukes for å utføre diverse geometriske operasjoner.

**Geometriske objekter består av koordinattuppler hvor:**

-  `Point` -objektet representerer et enkelt punkt i et rom. Punkt kan være enten todimensjonale (x, y) eller tredimensjonale (x, y, z).
-  `LineString` -objektet representerer en sekvens av punkt som er koblet sammen og former en linje. En linje består dermed av en liste med minst to koordinattuppler.
-  `Polygon` -objektet representerer et fyllt område som består av en liste med misnt tre koordinattuppler som utgjør den ytre ringen (og potensielt en liste med "hull-polygoner".
  
<img src="https://pythongis.org/_images/vector_data_model.png" alt="Romlig datamodell" width="800">

# Punkt i polygon

Det å finne ut om et spesifikt punkt befinner seg innenfor eller utenfor et omåde, eller om en linje krysser en annen linje eller et polygon, er fundamentale geografiske operasjoner. Slike romlige spørringer er typisk et av de første stegene i romlige analyser. Kobling av ulike romlige dataset er et av de vanligste stedene hvor punkt i polygon (PIP)-analyser utføres.

Du kan lese mer om den [teoretiske bakgrunnen for PIP-analyse](https://en.wikipedia.org/wiki/Point_in_polygon#Ray_casting_algorithm) hvis du ønsker.

I Shapely er det i hovedsak to måter å utføre en PIP-analyse:

1. Bruk av [within()](https://shapely.readthedocs.io/en/stable/manual.html#object.within) funksjonen som sjekker hvorvidt et punkt befinner seg inni et polygon
2. Bruk av [contains()](https://shapely.readthedocs.io/en/stable/manual.html#object.contains) funksjonen som sjekket om et polygon inneholder et punkt.

Selv om vi her snakker om **punkt** i polygon, er det også mulig å sjekke hvorvidt en linje eller et polygon er innenfor et annet polygon.

La oss lage noen punkt og utforske shapely-funksjonaliteten:

In [None]:
from shapely.geometry import Point, Polygon

# Create Point objects
punkt1 = Point(10.39506,63.43049)
punkt2 = Point(10.39693,63.42692)

La oss lage et polygon fra noen hjørne-koordinater:

In [None]:
koordinater = [(10.39444,63.43090),(10.39427,63.43010),(10.39594,63.43003),(10.39607,63.43084)]
polygon = 

In [None]:
# Check points and polygon


Vi kan nå sjekke hvorvidt punktene er innenfor polygonet vårt:

Altså, det første punktet vårt befinner seg innenfor polygonet, mens det andre punktet ikke gjør det. Faktisk er det første punktet nesten i midten av polygonet vårt, noe vi kan se hvis vi bruker ``centroid`` attributten til polygonet vårt.

Vi kan også bruke motsatt metode for å sjekke hvorvidt polygonet vårt inneholder de to punktene:

<div style="border: 1px solid #ccc; padding: 10px; border-radius: 5px; background-color:rgb(177, 226, 250); color:#000;">
<strong>Spørsmål:</strong><br>
Kjør cellen under for å svare på spørsmålet:
</div>

In [None]:
""" "Hvilken av følgende oppgaver kan løses ved hjelp av en punkt-i-polygon-analyse?"

Alternativer:

Identifisere hvilke tweets som ble postet inne i en park. ✅
Beregne den korteste avstanden mellom to punkter.
Sjekke om to polygoner overlapper.
Finne arealet av et polygon."""

## Punkt i polygon i Geopandas

PIP-analyser kan også gjøres for større datasett av gangen, for eksempel kan vi lese data inn i en GeoDataFrame og utføre en PIP-analyse på den:

In [None]:
import geopandas as gpd
import pandas as pd

bydeler = gpd.read_file('https://github.com/haavardaagesen/gmgi210/raw/refs/heads/main/data/oslo_bydeler.gpkg')
display(bydeler.head())

La oss finne punkter i marka i Oslo:

In [None]:
# Subset data to only one area
marka = 

marka.reset_index(drop=True, inplace=True)

In [None]:
import matplotlib.pyplot as plt

# Create a figure with one subplot
fig, ax = plt.subplots()

# Plot polygons


plt.tight_layout()

La oss laste inn punktdata vi kan gjøre PIP-analysen på. Punktdataene ligger her: `https://github.com/haavardaagesen/gmgi210/raw/refs/heads/main/data/oslo_tweets.gpkg`


In [None]:
# https://github.com/haavardaagesen/gmgi210/raw/refs/heads/main/data/oslo_tweets.gpkg

In [None]:
# Create a figure with one subplot
fig, ax = plt.subplots()

# Plot polygons

plt.tight_layout()

For å filtrere punktene våre, kan vi lage en maske ved å bruke ``within``
funksjonaliteten i sentrums geometrien vår:

Vi kan nå velge punktene fra oslo_tweets, basert på masken vår:

Vi kan nå plotte de ulike lagene våre og se hvilke punkt som har blitt valgt ut:

In [None]:
# Create a figure with one subplot
fig, ax = plt.subplots()

# Plot polygons

# Plot points


plt.tight_layout()

<div style="border: 1px solid #ccc; padding: 10px; border-radius: 5px; background-color:rgb(177, 226, 250); color:#000;">
<strong>Spørsmål:</strong><br>
Kjør cellen under for å svare på spørsmålet:
</div>

In [None]:
"""Kommer du til å ta GMGI221?"""