# Vektor Data I/O

En av de første trinnene i mange analyse-arbeidsflyter er å lese data fra en fil, et av de siste trinnene skriver ofte data til en utdatafil. Til skrekk og gru for mange geoinformatikkforskere, finnes det mange filformater for GIS-data: den gamle og forhatte, men også elskede og etablerte [ESRI Shapefile](https://en.wikipedia.org/wiki/Shapefile), den universelle [Geopackage (GPKG)](https://en.wikipedia.org/wiki/GeoPackage), og den web-optimaliserte [GeoJSON](https://en.wikipedia.org/wiki/GeoJSON) er bare noen av de mer kjente eksemplene.

Frykt ikke, Python kan lese dem alle (ingen garantier, though)! 

De fleste av dagens Python GIS-pakker er avhengige av [GDAL/OGR](https://gdal.org/)-bibliotekene, som det finnes moderne grensesnitt for i form av Python-pakkene [fiona](https://fiona.readthedocs.io) og [rasterio](https://rasterio.readthedocs.io).

I dag skal vi konsentrere oss om vektordata, så la oss først ta en nærmere titt på fionas kapabiliteter, og deretter importere og eksportere data ved hjelp av [geopandas](https://geopandas.org/), som bruker fiona under hetta.

---

:::{admonition} Definere en konstant for datamappen
:class: note

For å gjøre det lettere å håndtere stiene til inngangs- og utgangsdatafiler, er det en god vane å [definere en konstant som peker på datamappen](managing-file-paths) øverst i en notatbok:

:::

In [None]:
import pathlib 
NOTEBOOK_PATH = pathlib.Path().resolve()
DATA_DIRECTORY = NOTEBOOK_PATH / "data"

---

## Filformater

Fiona kan lese (nesten) alle geospatiale filformater, og skrive mange av dem. For å finne ut nøyaktig hvilke (det kan avhenge av den lokale installasjonen og versjonen), kan vi skrive ut listen over dens filformatdrivere:

In [None]:
import fiona
fiona.supported_drivers

:::{hint}
I denne listen markerer `r` filformater som Fiona kan *l*ese, og `w` formater det kan *s*krive. En `a` markerer formater som Fiona kan *a*ppendere nye data til eksisterende filer.

Merk at hver av de listede 'formatene' faktisk er navnet på driverimplementasjonen, og mange av driverne kan åpne flere relaterte filformater.

Mange flere 'eksotiske' filformater kan kanskje ikke vises i denne listen over din lokale installasjon, fordi du må installere ekstra biblioteker. Du kan finne en fullstendig liste over filformater som støttes av GDAL/OGR (og Fiona) på nettsiden: [gdal.org/drivers/vector/](https://gdal.org/drivers/vector/).
:::

### Lesing og skriving av geospatiale data

Fiona gir veldig lavt nivå tilgang til geodatafiler. Dette er noen ganger nødvendig, men i typiske analysearbeidsflyter er det mer praktisk å bruke et høyere nivå bibliotek. Den mest brukte for geospatiale vektordata er [geopandas](https://geopandas.org). Som nevnt ovenfor, bruker den Fiona for lesing og skriving av filer, og støtter dermed de samme filformatene.

For å lese data fra en *GeoPackage* -fil til en `geopandas.GeoDataFrame` (en geospatiale versjon av en `pandas.DataFrame`), bruk `geopandas.read_file()`:

In [None]:
import geopandas
municipalities = geopandas.read_file(
    DATA_DIRECTORY / "finland_municipalities" / "finland_municipalities_2021.gpkg"
)
municipalities.head()

Å lese en lokal GPKG-fil er mest sannsynlig den enkleste oppgaven for en GIS-pakke. Imidlertid, i perfekt Python 'Swiss pocket knife' stil, kan geopandas også lese Shapefiles **innenfor en ZIP-arkiv**, og/eller direkte **fra en Internett-URL**. For eksempel, nedlasting, utpakking og åpning av et datasett av NUTS-regioner fra [European Union’s GISCO/eurostat download page](https://ec.europa.eu/eurostat/web/gisco/geodata/reference-data/administrative-units-statistical-units/nuts) er en linje med kode:

In [None]:
nuts_regions = geopandas.read_file("https://gisco-services.ec.europa.eu/distribution/v2/nuts/shp/NUTS_RG_60M_2021_3035.shp.zip")
nuts_regions.head()