# üíª Vektor Data I/O

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/GMGI221-2024/forelesninger/blob/main/03_vektor.ipynb)

Et av de f√∏rste trinnene i mange analysearbeidsflyter er √• lese data fra en fil, et av de siste trinnene skriver ofte data til en fil. Til skrekk og gru for mange geoinformatikkforskere, finnes det mange filformater for GIS-data: den gamle og forhatte, men ogs√• elskede og etablerte [ESRI Shapefile](https://en.wikipedia.org/wiki/Shapefile), den universelle [Geopackage (GPKG)](https://en.wikipedia.org/wiki/GeoPackage), og den web-optimaliserte [GeoJSON](https://en.wikipedia.org/wiki/GeoJSON) er bare noen av de mer kjente eksemplene.

De fleste av dagens Python GIS-pakker er avhengige av [GDAL/OGR](https://gdal.org/)-bibliotekene, som det finnes moderne grensesnitt for i form av Python-pakkene [fiona](https://fiona.readthedocs.io) og [rasterio](https://rasterio.readthedocs.io).

I dag skal vi konsentrere oss om vektordata, s√• la oss f√∏rst ta en n√¶rmere titt p√• fionas egenskaper, og deretter importere og eksportere data ved hjelp av [geopandas](https://geopandas.org/), som bruker fiona.


---

:::{admonition} Definere en konstant for datamappen
:class: note

For √• gj√∏re det lettere √• h√•ndtere stiene til inngangs- og utgangsdatafiler, er det en god vane √• [definere en konstant som peker p√• datamappen](03_filstier) √∏verst i en notatbok:

:::

In [None]:
import pathlib 
NOTEBOOK_PATH = 

## Filformater

Fiona kan lese (nesten) alle geospatiale filformater, og skrive mange av dem. For √• finne ut n√∏yaktig hvilke (det kan avhenge av den lokale installasjonen og versjonen), kan vi skrive ut listen over dens filformatdrivere:

In [None]:
import fiona
fiona.supported_drivers

:::{hint}
I denne listen markerer `r` filformater som Fiona kan *l*ese, og `w` formater det kan *s*krive. En `a` markerer formater som Fiona kan *a*ppendere (legge til) nye data til eksisterende filer.

Merk at hver av de listede 'formatene' faktisk er navnet p√• driverimplementasjonen, og mange av driverne kan √•pne flere relaterte filformater.

Mange flere 'eksotiske' filformater kan kanskje ikke vises i denne listen over din lokale installasjon, fordi du m√• installere ekstra biblioteker. Du kan finne en fullstendig liste over filformater som st√∏ttes av GDAL/OGR (og Fiona) p√• nettsiden: [gdal.org/drivers/vector/](https://gdal.org/drivers/vector/).
:::


### Lesing og skriving av romlige data

Fiona gir tilgang til geodatafiler p√• et lavt niv√•. Dette er noen ganger n√∏dvendig, men i typiske analysearbeidsflyter er det mer praktisk √• bruke et h√∏yere-niv√• bibliotek. Den mest brukte for geospatiale/romlige vektordata er [geopandas](https://geopandas.org). Som nevnt ovenfor, bruker den Fiona for lesing og skriving av filer, og st√∏tter dermed de samme filformatene.

For √• lese data fra en *GeoPackage* -fil til en `geopandas.GeoDataFrame` (en romlig versjon av en `pandas.DataFrame`), bruk `geopandas.read_file()`:

In [None]:
import geopandas


√Ö lese en lokal GPKG-fil er mest sannsynlig den enkleste oppgaven for en GIS-pakke. Imidlertid kan geopandas ogs√• lese Shapefiles **innenfor en ZIP-arkiv**, og/eller direkte **fra en Internett-URL**. For eksempel, nedlasting, utpakking og √•pning av et datasett av NUTS-regioner fra [European Union‚Äôs GISCO/eurostat download page](https://ec.europa.eu/eurostat/web/gisco/geodata/reference-data/administrative-units-statistical-units/nuts) er en linje med kode:

In [None]:
#https://gisco-services.ec.europa.eu/distribution/v2/nuts/shp/NUTS_RG_60M_2021_3035.shp.zip


#### Skrive romlige data til en fil

√Ö skrive data til en fil er like enkelt: bruk bare [`to_file()` metoden](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.to_file.html#geopandas.GeoDataFrame.to_file) til en `GeoDataFrame`.

Hvis vi vil beholde en lokal kopi av NUTS-region datasettet vi nettopp √•pnet 'on-the-fly' fra en internettadress kan vi lagre dataene til en GeoJSON-fil (filformatet blir gjettet fra filnavnet). F√∏r vi gj√∏r det m√• vi sikre oss at datatypene er riktig formatert (ofte n√•r data komprimeres, s√•nn som med NUTS-dataene, blir formateringen forenklet). F√∏rst kan vi sjekke hva slags datatype de ulike kolonnene har:

Her ser vi at vi har mange kolonner av typen `object`, noe som b√∏r endres. I dette tilfellet inneholder alle de gjeldende kolonnene tekststrenger, s√• vi kan endre de til `str` f√∏r vi lagrer:

In [None]:
nuts_regions = nuts_regions.astype({col: 'str' for col in nuts_regions.select_dtypes(include='object').columns})

nuts_regions.to_file(DATA_MAPPE / "europe_nuts_regions.geojson")

:::{note}

Lesing og skriving av romlige data fra eller til en fil er nesten identisk for alle filformater som st√∏ttes av geopandas, fiona, og GDAL. Sjekk ut [geopandas‚Äô dokumentasjon](https://geopandas.org/en/stable/docs/user_guide/io.html) for tips om hvordan du kan finjustere lesing eller skriving av en fil, og hvordan du kan bruke forskjellige filtre.
:::


### Lesing og skriving fra og til databaser (RDBMS)

Geopandas har innebygd st√∏tte for lese/skrive-tilgang til PostgreSQL/PostGIS-databaser, ved hjelp av dens [`geopandas.read_postgis()`](https://geopandas.org/en/stable/docs/reference/api/geopandas.read_postgis.html) funksjon og [`GeoDataFrame.to_postgis()`](https://geopandas.org/en/stable/docs/reference/api/geopandas.GeoDataFrame.to_postgis.html) metode. For databasetilkoblingen kan du bruke, for eksempel, `sqlalchemy`-pakken.

In [None]:
# Siden dette ikke er en ekte database, m√• informasjonen endres hvis den skal kj√∏re
'''
import sqlalchemy
DB_CONNECTION_URL = "postgresql://myusername:mypassword@myhost:5432/mydatabase";
db_engine = sqlalchemy.create_engine(DB_CONNECTION_URL)

countries = geopandas.read_postgis(
    "SELECT name, geometry FROM countries",
    db_engine
)
countries.to_postgis(
    "new_table", 
    db_engine
)
'''

### Lesing av data direkte fra en WFS (Web feature service) endepunkt

Geopandas kan ogs√• lese data direkte fra en WFS-endepunkt, som for eksempel geodata-APIene til [Kartverket](https://kartkatalog.geonorge.no/metadata/administrative-enheter-wfs/57c7fca8-c652-44f0-9762-688614891286). √Ö konstruere en gyldig WFS-URI (adresse) er ikke en del av dette kurset (men sjekk, for eksempel, egenskapene til et lag lagt til QGIS).

F√∏lgende kode laster et administrative enheter for Norge. Parameterne kodet inn i WFS-adressen spesifiserer lagets navn og det forespurte referansesystemet.

In [None]:
administrative_enheter = geopandas.read_file(
    "https://wfs.geonorge.no/skwms1/wfs.administrative_enheter?"
    "service=WFS"
    "&version=2.0.0"
    "&request=GetFeature"
    "&srsname=EPSG:25833"
    "&restrictToRequestBBOX=258331"
    "&typename=app:Kommune"
)
administrative_enheter.head()

In [None]:
administrative_enheter.plot()