# 游눹 Raster

<div class="alert alert-info">

**Ekstra biblioteker**

Senere i denne notebooken skal vi bruke bibliotekene `xarray` og `rioxarray`, det kan v칝re en god ide 친 installere de allerede n친, s친 det er klart til bruk senere:

`conda install -c conda-forge xarray rioxarray`

</div>

Rasterdata er mye brukt til 친 representere og lagre data om kontinuerlige overflater, der hver piksel inneholder spesifikk informasjon (karakteristikk, utstr친ling, spektralsignaturer) om et spesifikt omr친de av jorden, for eksempel et 10x10 meter omr친de. Denne notebooken gir en introduksjon til behandling av rasterdata i Python, og er basert p친 [kapittel 7 i Python for Geographic Data Analysis](https://pythongis.org/part2/chapter-07/index.html) 

Det er forskjellige grunner til at du kanskje vil lagre dataene dine i rasterformat:

- Det er en enkel datastruktur: En matrise av celler med verdier som representerer informasjon om den observerte overflaten/fenomenene
- Det er en effektiv m친te 친 lagre data fra store sammenhengende flater
- Det er et kraftig format som kan brukes til ulike romlige og statistiske analyser
- Du kan utf칮re raske overlay med flere lag

## Arbeide med rasterdata i Python

Det er en rekke biblioteker som er mye brukt n친r du arbeider med rasterdata i Python:

- `xarray` gir en brukervennlig og intuitiv m친te 친 jobbe med flerdimensjonale rasterdata med koordinater og attributter (noe lik `geopandas` som brukes til vektordatabehandling),
- `rioxarray` gir metoder for 친 utf칮re GIS-relaterte operasjoner med rasterdata (f.eks. lesing/skriving, reprojisering, klipping, resampling),
- "xarray-spatial" gir metoder for 친 analysere rasterdata (f.eks. fokale/sonale operasjoner, overflateanalyse, banefinning),
- `rasterio` kjernebibliotek for arbeid med GIS-rasterdata. `rioxarray` er en utvidelse av dette biblioteket som bringer de samme funksjonalitetene p친 toppen av `xarray`-biblioteket,
- `numpy` er et kjerne-bibliotek i Python for numerisk databehandling som brukes til 친 representere og arbeide med flerdimensjonale arrays. `numpy` har stor innflytelse p친 hvordan de andre rasterbibliotekene fungerer og kan brukes til 친 generere flerdimensjonale arrays fra bunnen av.
- 
## Lage et enkelt rasterlag ved 친 bruke `numpy`

For 친 f친 en bedre f칮lelse av hvordan rasterdataene ser ut, kan vi starte med 친 lage en enkel todimensjonal array i Python ved 친 bruke `numpy`. I det f칮lgende vil vi modifisere rasterlaget til 친 representere et enkelt terreng som har en h칮yde midt i rutenettet. Vi gj칮r dette ved 친 sette h칮yere verdier i midten mens de andre verdiene er representert med verdi 0. La oss starte med 친 importere `numpy` og `matplotlib`-biblioteket som vi bruker for 친 visualisere dataene v친re:

In [None]:
import numpy as np
import matplotlib.pyplot as plt

칀 lage et enkelt 2D-rasterlag (en 2D-matrise) med 10x10-matrise kan enkelt gj칮res ved 친 bruke en `numpy`-metode `.zeros()` med fyller cellene (piksler) med nuller. Hver null representerer en standard pikselverdi (f.eks. 0 h칮yde). Du kan tenke p친 dette som et tomt rasternett:

N친 har vi en enkel 2D-matrise fylt med nuller. Deretter modifiserer vi rasterlaget for 친 representere et enkelt terreng og legger til st칮rre tall i midten av rutenettet ved 친 sette h칮yere verdier i midten. Vi kan gj칮re dette ved 친 *{term}`slice`* numpy-matrisen ved 친 bruke indeksene til matrisen og oppdatere tallene p친 disse stedene til 친 v칝re h칮yere. 칀 skj칝re "numpy"-matriser skjer p친 lignende m친te som n친r du arbeider med Python-lister og f친r tilgang til elementene i en liste (se kapittel 2.2). Men i dette tilfellet gj칮r vi dette i to dimensjoner ved 친 f친 tilgang til verdiene som er lagret i spesifikke rader og kolonner ved 친 f칮lge syntaksen: `[start-rad-idx: end-row-idx, start-col-idx: end-col- idx]`. Dermed kan vi oppdatere verdiene i v친r 2D-matrise som f칮lger:

Her oppdaterte vi f칮rst cellene mellom den fjerde og syvende raden og kolonnen (`[4:7, 4:7]`) til 친 ha en verdi `5`, og deretter oppdaterte vi midten av matrisen til 친 representere toppen av bakken med verdien `10`. Som en Resultatet har vi et enkelt rasterlag som simulerer et enkelt terreng. Vi kan ogs친 plotte dette rasterlaget ved 친 bruke `matplotlib`-biblioteket og dets `.imshow()`-funksjon som kan brukes til 친 visualisere arrays:

# Introduksjon til datastrukturer i xarray

N친 som du har l칝rt litt grunnleggende om rasterdata og hvordan du lager en enkel 2-dimensjonal raster-array ved 친 bruke "numpy", fortsetter vi 친 utforske p친 en mer omfattende m친te hvordan du arbeider med virkelige rasterdata ved 친 bruke "xarray" og `rioxarray`-biblioteker (+ andre relevante biblioteker knyttet til dem). `xarray`-biblioteket er et sv칝rt nyttig verkt칮y for 친 lagre, representere og manipulere rasterdata, mens `rioxarray` gir forskjellige rasterbehandlingsfunksjoner (GIS) p친 toppen av `xarray`-datastrukturene, for eksempel lesing og skriving av flere forskjellige rasterformater og utf칮re ulike geoberegningsoppgaver. Under panseret bruker `rioxarray` et annet Python-bibliotek kalt `rasterio` (som fungerer med N-dimensjonale `numpy`-matriser), men fordelen med `xarray` og `rioxarray` er at de gir en enklere og mer intuitiv m친te 친 jobbe med rasterdatalag, p친 en litt lignende m친te som 친 jobbe med vektordata ved 친 bruke `geopandas`.

N친r du arbeider med rasterdata har du vanligvis ulike lag som representerer ulike geografiske trekk ved verden (f.eks. h칮yde, temperatur, nedb칮r osv.), og disse dataene blir muligens fanget opp p친 ulike tider av 친ret/dagen/timen, noe som betyr at du har longitudinelle observasjoner fra samme omr친de, som utgj칮r tidsseriedata. Oftere enn ikke m친 du kombinere informasjon fra disse lagene for 친 kunne gjennomf칮re meningsfulle analyser basert p친 dataene, for eksempel 친 lage en v칝rmelding. En av de st칮rste fordelene med "xarray" er at du enkelt kan lagre, kombinere og analysere alle disse forskjellige lagene via et enkelt objekt, det vil si et "Dataset", som vist i figur 7.2.

De to grunnleggende datastrukturene som tilbys av 'xarray'-biblioteket er 'DataArray' og 'Dataset' (Figur 7.2). Begge bygger p친 og utvider styrkene til bibliotekene "numpy" og "pandas". 'DataArray' er en merket N-dimensjonal array som ligner p친 'pandas.Series' men fungerer med rasterdata (lagret som 'numpy' arrays). "Datasettet" er igjen en flerdimensjonal array-database i minnet som inneholder flere "DataArray"-objekter. I tillegg til variablene som inneholder observasjonene av et gitt fenomen, har du ogs친 `x`- og `y`-koordinatene til observasjonene lagret i separate lag, samt metadata som gir relevant informasjon om dataene dine, for eksempel Koordinatreferansesystem og /eller tid. Dermed er et "datasett" som inneholder rasterdata veldig likt "geopandas.GeoDataFrame", og faktisk kan forskjellige "xarray"-operasjoner f칮les veldig kjent hvis du har l칝rt det grunnleggende om "pandas" og "geopandas" dekket i kapittel 3 og 6.


![***Figure 7.2.** Key `xarray` data structures. Image source: Xarray Community (2024), lisensiert under Apache 2.0.*](https://docs.xarray.dev/en/stable/_images/dataset-diagram.png)

***Figur 7.2** N칮kkel "xarray" datastrukturer. Bildekilde: [Xarray Community](https://tutorial.xarray.dev/fundamentals/01_data_structures.html) (2024), lisensiert under Apache 2.0.*

Noen av fordelene med "xarray" inkluderer:

- Et mer intuitivt og brukervennlig grensesnitt for 친 jobbe med flerdimensjonale arrays (sammenlignet f.eks. med "numpy")
- Muligheten til 친 velge og kombinere data langs en dimensjon p친 tvers av alle arrays i et "Datasett" samtidig
- Kompatibilitet med et stort 칮kosystem av Python-biblioteker som fungerer med arrays/rasterdata
- Tett integrering av funksjonaliteter fra velkjente Python-dataanalysebiblioteker, som "pandas", "numpy", "matplotlib" og "dask".

## Lese inn en fil

Vi skal n친 bruke `xarray` og `rioaxarray` til 친 lese inn rasterfilen v친r. `xarray` og `rioaxarray` er ikke en del av oppsettet vi satte opp i `conda`-milj칮et i starten av kurset. Hvis du ikke har installert det p친 egenh친nd, kan det derfor v칝re n칮dvendig 친 kj칮re `conda install -c conda-forge xarray rioxarray` for 친 s칮rge for at den neste delen av notebooken fungerer.


In [None]:
import xarray as xr
import rasterio
from osgeo import gdal
import pathlib
NOTEBOOK_PATH = pathlib.Path().resolve()
DATA_MAPPE = NOTEBOOK_PATH / "data"

import rioxarray

url = DATA_MAPPE/"Aas_20240625.tif"


N친 har vi lest GeoTIFF-filen inn i en `xarray.Dataset` datastruktur som vi lagret i en variabel `data`. "Datasettet" inneholder de faktiske dataverdiene for rastercellene, samt annen relevant attributtinformasjon relatert til dataene

In [None]:
# Koordinatene i datasettet


In [None]:
# Projeksjonen til datasettet


In [None]:
# Variabler i datasettet


In [None]:
# Hvor mange og hvilke b친nd


### NDVI

En vanlig operasjon er 친 beregne `NDVI` (Normalized difference vegetation index), noe som ganske enkelt lar seg gj칮re:

In [None]:
NiR=data['band_data'][3,:,:]#Band 4 as counting starts from 0
Red=data['band_data'][2,:,:]#Band 3 as counting starts from 0
NDVI=(NiR-Red)/(NiR+Red)

In [None]:
NDVI

In [None]:
print('The variable type of the data:',type(NDVI))
print('The size of the data (first band):', NDVI.shape)
print('Minimum:', NDVI.min())
print('Maximum:', NDVI.max())
print('Mean:', NDVI.mean())
print('STD:', NDVI.std())
print('Data type of the array:',NDVI.dtype)

Vi kan ogs친 plotte NDVI-utregningen med `plt.imshow()`

In [None]:
plt.imshow(NDVI,vmin=-0.3, vmax=1,cmap='RdBu')

## Videre lesning

Hvis du 칮nsker 친 lese mer om 친 jobbe med rasterdata i Python anbefaler jeg 친 ta en titt p친:

- [Raster operasjoner i `Python for Geographic Data Analysis`](https://pythongis.org/part2/chapter-07/nb/02-common-raster-operations.html)
- [Kapittel 11, 12 og 13 i `Introduction to GIS Programming`](https://geog-312.gishub.org/book/geospatial/rasterio.html)