# üå¨Ô∏è Analyse av luftkvalitetsdata med NILU API
Denne notebooken dokumenterer hele arbeidsflyten for NILU-delen av prosjektet. M√•let er √• rense, transformere og visualisere luftkvalitetsdata (NO‚ÇÇ, O‚ÇÉ, SO‚ÇÇ) for bruk i senere analyse. 

### Datakilde: NILU API

**Kilde**: [api.nilu.no](https://api.nilu.no/)  
**Leverand√∏r**: Norsk institutt for luftforskning (NILU)  
**Datakvalitet**: H√∏y ‚Äì data fra offisielle m√•lestasjoner  
**Tilgjengelighet**: √Öpen (ingen API-n√∏kkel n√∏dvendig for grunnleggende tilgang)  
**Brukervennlighet**: God, med REST-endepunkter og dokumentasjon

Valget av NILU API er basert p√• f√∏lgende kriterier:

- Kildeautoritet: NILU er en ledende institusjon innen luftkvalitetsforskning.
- Datakvalitet: M√•linger fra sertifiserte og kalibrerte m√•lestasjoner.
- Tilgjengelighet: Tilgjengelig for allmennheten uten behov for API-n√∏kkel.
- Brukervennlighet: Strukturert respons i JSON og fleksible parametere.
---

### ‚òÅÔ∏è Henting og prosessering av luftkvalitetsdata (NILU API)

I denne delen av prosjektet benyttes **NILU API** for √• hente luftkvalitetsdata for Oslo og n√¶rliggende omr√•der. Dataene struktureres og lagres i JSON-format.


#### Funksjonalitet

1. **Henting av luftkvalitetsdata**:
   - Geografisk omr√•de: Oslo
   - Koordinater: `59.9139`, `10.7522`
   - Radius: `20 km`
   - Periode: 2010-01-01 til 2016-04-02
   - Endepunkt: `https://api.nilu.no/stats/day/{from_date}/{to_date}/{latitude}/{longitude}/{radius}`

2. **Prosessering og lagring av data**:
   - Bearbeiding av JSON-respons
   - Strukturert dataeksport til:
     - Mappe: `../../data/raw_data/`
     - Filnavn: `raw_air_quality_nilu_oslo.json`

#### Viktige funksjoner

| Funksjon | Beskrivelse |
|---------|-------------|
| `get_air_quality_nilu_oslo()` | Setter opp og gjennomf√∏rer hele henteprosessen |
| `fetch_air_quality_nilu()` | Utf√∏rer selve API-kallet og lagrer strukturerte data som JSON |

#### Forutsetninger

- Python installert med n√∏dvendige biblioteker: `requests`, `json`, `os`, `pathlib`
- Tilgang til [NILU API](https://api.nilu.no/)
- Skrivetilgang til katalogen: `../../data/raw_data/`


In [1]:
#Globale paramtere for niluAPI
import sys
import numpy as np
import pandas as pd
from pandasql import sqldf
import seaborn as sns
import matplotlib.pyplot as plt

base_url = "https://api.nilu.no/stats/day/"
from_date = "2010-04-02"
to_date = "2016-12-31"
radius=20

#Oslo kordinater
latitude= 59.9139
longitude=10.7522


In [2]:
sys.path.insert(0, '../../src')
from niluAPI.data_niluAPI import get_raw_data_niluAPI

get_raw_data_niluAPI()

Gruppert data er lagret under ../../data/raw_data/raw_air_quality_nilu_oslo.json


---
### üßº Rensing og klargj√∏ring av NILU-data

Denne delen av prosjektet h√•ndterer rensing og forbedring av luftkvalitetsdata hentet fra **NILU API**. Fokus ligger p√• √• fjerne uteliggere, interpolere manglende data, og korrigere skjevheter i datafordelingen for √• gj√∏re datasettet klarere og mer p√•litelig for videre analyser.

#### Funksjonalitet

##### Fjerning av outliers og interpolering

- Leser r√•data fra JSON-fil.
- Fjerner outliers p√• utvalgte gasser: `Verdi_NO2`, `Verdi_O3`, `Verdi_SO2`.
- Interpolerer manglende verdier for √• opprettholde kontinuerlig dataserie.
- Lagrer renset data som JSON-fil.

##### Skjevhetskorreksjon av data

- Analyserer datasett for skjevhet i fordeling.
- Bruker Yeo-Johnson transformasjon for √• normalfordele variablene.
- Lagrer korrigerte data for videre analyse.

#### Viktige funksjoner

##### `clean_raw_data()`

| Funksjon                | Beskrivelse                                                       |
|------------------------|------------------------------------------------------------------|
| **Laster inn r√•data**    | Leser r√• luftkvalitetsdata fra `raw_air_quality_nilu_oslo.json`. |
| **Fjerner outliers**     | Kaller `remove_outliers` for √• identifisere og sette uteliggere til `NaN`. |
| **Interpolerer manglende verdier** | Bruker `interpolate_and_save_clean_data` for √• fylle inn manglende data. |
| **Lagrer renset data**  | Lagres i `niluAPI_clean_data.json`.                              |

##### `fix_skewness_data_niluAPI()`

| Funksjon                | Beskrivelse                                                       |
|------------------------|------------------------------------------------------------------|
| **Analyserer skjevhet** | Bruker `analyse_and_fix_skewness` for √• analysere fordelingens skjevhet i datasettet. |
| **Normalfordeler data** | Korrigerer skjevheter med Yeo-Johnson transformasjon.            |
| **Lagrer korrigerte data** | Resultatet lagres i `niluAPI_analyzed_data.json`.                |


#### Forutsetninger

- R√•data m√• v√¶re tilgjengelig i: `../../data/raw_data/raw_air_quality_nilu_oslo.json`
- Python-moduler fra prosjektmappen m√• v√¶re importert.
- Krever `sys` for path-h√•ndtering og tilgang til spesialfunksjoner.
- Resultater lagres i:
  - Renset data: `../../data/clean_data/niluAPI_clean_data.json`
  - Analysert data: `../../data/analyzed_data/niluAPI_analyzed_data.json`


In [3]:
from niluAPI.data_niluAPI import clean_raw_data
clean_raw_data()

Fjerning av outliers:
Outliers er mer enn 3 standardavvik unna gjennomsnittet

Verdi_NO2:
Fjernet 39 outliers
Standaravvik: 21.74
Gjennomsnitt: 32.25

Verdi_O3:
Fjernet 8 outliers
Standaravvik: 16.29
Gjennomsnitt: 42.08

Verdi_SO2:
Fjernet 27 outliers
Standaravvik: 1.17
Gjennomsnitt: 2.23


Interpolering av Nan-verdier:
Verdi_NO2: 233 verdier ble interpolert
Verdi_O3: 574 verdier ble interpolert
Verdi_SO2: 393 verdier ble interpolert

Gruppert data er lagret under ../../data/clean_data/niluAPI_clean_data.json


In [4]:
from niluAPI.data_niluAPI import fix_skewness_data_niluAPI
fix_skewness_data_niluAPI()

Skjevhet f√∏r transformasjon:
‚Üí Verdi_NO2: 1.12
‚Üí Verdi_O3: -0.18
‚Üí Verdi_SO2: 0.76

Behandler kolonner med skjevhet over ¬±1.0:

 Verdi_NO2: skjevhet 1.12 ‚Üí Yeo-Johnson + skalering
Verdi_O3: skjevhet -0.18 ‚Üí kun skalering
Verdi_SO2: skjevhet 0.76 ‚Üí kun skalering

Skjevhet etter transformasjon:
‚Üí Verdi_NO2_Trans: -0.01
‚Üí Verdi_O3_Trans: -0.18
‚Üí Verdi_SO2_Trans: 0.76

Transformert data lagret i: ../../data/analyzed_data/niluAPI_analyzed_data.json


---
## üìä  Analyse av luftkvalitetsdata fra NILU API (2010-2016)
I denne delen analyseres luftkvalitetsdata for Oslo over en seks√•rsperiode (2010-2016), hentet fra NILU API. Hensikten er √• avdekke trender, sesongvariasjoner og potensielle forbedringer eller forverringer i luftkvaliteten over tid. Dataene inkluderer konsentrasjoner av NO‚ÇÇ, O‚ÇÉ og SO‚ÇÇ, som er blant de viktigste indikatorene p√• lokal luftforurensning.

#### Metoder brukt for analyse:
- ...sett inn her
- ...sett inn her 

#### Analysestruktur:
- ...sett inn her
- ...sett inn her 

Alle analyser ledsages av visualiseringer, og resultatene tolkes med tanke p√• mulige milj√∏- og samfunnsmessige √•rsaker. Datasettet er renset og korrigert for skjevhet for √• sikre robusthet i analysene.

In [5]:
#m√•ntlig statistikk

df = pd.read_json("../../data/clean_data/niluAPI_clean_data.json")
query = """
SELECT 
    strftime('%Y-%m', Dato) AS M√•ned, 
    AVG(Verdi_NO2) AS Snitt_NO2,
    AVG(Verdi_O3) AS Snitt_O3,
    AVG(Verdi_SO2) AS Snitt_SO2,
    COUNT(*) AS AntallDager
FROM df
GROUP BY M√•ned
ORDER BY M√•ned
"""

    # Execute the query
pysqldf = lambda q: sqldf(q, globals())
monthly_stats = pysqldf(query)


print(monthly_stats)

      M√•ned  Snitt_NO2   Snitt_O3  Snitt_SO2  AntallDager
0   2010-04  35.294109  64.302514   2.862069           29
1   2010-05  21.199597  59.643414   2.394220           31
2   2010-06  20.604992  62.172153   1.661528           30
3   2010-07  19.245623  59.183333   1.759274           31
4   2010-08  22.120556  49.400958   1.744296           31
..      ...        ...        ...        ...          ...
76  2016-08  15.866144  31.959334   1.179835           31
77  2016-09  11.270938  29.060571   1.426891           30
78  2016-10  18.103540  30.474370   1.923178           31
79  2016-11  38.514975  25.146216   2.166528           30
80  2016-12  46.175656   8.485714   2.040703           31

[81 rows x 5 columns]


### üìä Visualisering av luftkvalitet og datakvalitet

#### Hva gj√∏r funksjonen?
Funksjonen `plot_air_quality()` genererer separate grafer for ulike luftforurensningskomponenter (NO‚ÇÇ, O‚ÇÉ, SO‚ÇÇ). Hver graf viser:

- En **punktsky** av m√•leverdier over tid.
- En **bl√• trendlinje** som indikerer utviklingen.
- **Fargekoding** av datapunkter basert p√• datakvalitet:
  - üî¥ **R√∏d** ‚Äì manglende eller interpolerte verdier
  - üü° **Gul** ‚Äì dekningsgrad under 90 %
  - üü¢ **Gr√∏nn** ‚Äì god datakvalitet (‚â• 90 %)

#### Fordeler ved denne fremstillingsm√•ten
- **Tydelig kommunikasjon av datakvalitet:** Brukeren f√•r umiddelbar visuell informasjon om hvilke data som er p√•litelige.
- **St√∏tter tolkning av trender:** Trendlinjer hjelper med √• identifisere m√∏nstre over tid.
- **Fleksibel og gjenbrukbar struktur:** Funksjonen tar generelle parametere og kan brukes p√• andre variabler, stasjoner og tidsperioder.
- **Styrker datadrevne beslutninger:** Fremhever b√•de verdier og usikkerheter, noe som er avgj√∏rende for milj√∏analyse og -rapportering.



In [6]:
import sys

sys.path.insert(0, '../../src/') 
from niluAPI.data_niluAPI import load_and_plot_air_quality
load_and_plot_air_quality()

---
[‚¨ÖÔ∏è Forrige: Frost-analyse](../frostAPI/frostAPI.ipynb)                    
[‚û°Ô∏è Neste: Kombinert analyse](../Kombinert_analyse.ipynb) 