# Dataanalyse

Her analyserer temperaturdata, klimagassutslipp og luftkvalitetsdata ved bruk av funksjoner i `statistikk.py`.


#### Importere nødvendige biblioteker og moduler


In [512]:
import pandas as pd
import numpy as np

import sys, os
sys.path.append(os.path.abspath("../src"))


import importlib
import statistikk
importlib.reload(statistikk)

<module 'statistikk' from 'c:\\Users\\johan\\Documents\\Mappe\\src\\statistikk.py'>

## Analyse av temperaturdata

I denne seksjonen blir historiske temperaturdata fra Gløshaugen analysert.

### Statistikk for tempraturen hver måned og årlig gjennomsnitt 

In [513]:

from statistikk import analyser_temperatur

resultat = analyser_temperatur("../data/temp_gloshaugen_historisk_renset_ 50.csv")


for navn, data in resultat.items():
    print("Statistikk for tempraturen hver måned")
    print(data["samlet_statistikk"])
    if data["årlig_snitt"] is not None:
        print("Årlig gjennomsnitt:")
        print(data["årlig_snitt"])
årlig_snitt = resultat["temperatur"]["årlig_snitt"]


Statistikk for tempraturen hver måned
       år  måned  gjennomsnitt  median  standardavvik
0    1976      1         -4.55   -4.10           4.65
1    1976      2         -2.26   -1.90           4.53
2    1976      3         -1.20   -1.30           4.40
3    1976      4          5.57    5.55           3.81
4    1976      5         12.56   12.50           4.65
..    ...    ...           ...     ...            ...
587  2024     12          1.42    1.70           3.46
588  2025      1         -1.39   -0.90           4.10
589  2025      2         -0.99   -0.85           3.84
590  2025      3          4.08    4.15           4.15
591  2025      4          8.76    8.80           4.08

[592 rows x 5 columns]
Årlig gjennomsnitt:
      år  årsgjennomsnitt
0   1976             6.46
1   1977             6.26
2   1978             5.75
3   1979             5.02
4   1980             5.73
5   1981             5.44
6   1982             6.53
7   1983             7.30
8   1984             6.96
9   1985  

### Endring i gjennomsnittstemperatur fra første til siste år

In [514]:
from statistikk import beregn_endring_totalt

# Endring i gjennomsnittstemperatur fra første til siste år
resultat = beregn_endring_totalt(årlig_snitt)
print(f"Endring i temperatur fra {resultat['startår']} til {resultat['sluttår']}:")
print(f"{resultat['endring']:.2f} °C ({resultat['prosent']:.2f} %)")


Endring i temperatur fra 1976 til 2024:
1.23 °C (19.04 %)


### Årlig endring i temperatur

In [515]:
from statistikk import beregn_endring_årlig

endringsdata = beregn_endring_årlig(årlig_snitt, verdikolonne='årsgjennomsnitt')
display(endringsdata.round(2))


Unnamed: 0,år,årsgjennomsnitt,absolutt_endring,prosent_endring
0,1976,6.46,,
1,1977,6.26,-0.2,-3.1
2,1978,5.75,-0.51,-8.15
3,1979,5.02,-0.73,-12.7
4,1980,5.73,0.71,14.14
5,1981,5.44,-0.29,-5.06
6,1982,6.53,1.09,20.04
7,1983,7.3,0.77,11.79
8,1984,6.96,-0.34,-4.66
9,1985,4.67,-2.29,-32.9


### Høyeste og laveste gjennomsnittstemperatur

In [516]:
from statistikk import ekstremverdier

ekstremer = ekstremverdier(årlig_snitt, verdikolonne='årsgjennomsnitt')

print(f"Høyeste år: {ekstremer['maksimum']['år']}. Da var det i gjennomsnitt: {ekstremer['maksimum']['verdi']:.2f} °C")
print(f"Laveste år: {ekstremer['minimum']['år']}. Da var det i gjennomsnitt: {ekstremer['minimum']['verdi']:.2f} °C")

Høyeste år: 2020. Da var det i gjennomsnitt: 8.76 °C
Laveste år: 1985. Da var det i gjennomsnitt: 4.67 °C


### Gjenomsnittet for hvert tiår

In [517]:
from statistikk import tiår_snitt

tiår_snitt = tiår_snitt(årlig_snitt, verdikolonne='årsgjennomsnitt')
display(tiår_snitt.round(2))


Unnamed: 0,tiår,årsgjennomsnitt
0,1970,5.87
1,1980,6.21
2,1990,6.61
3,2000,7.12
4,2010,7.11
5,2020,7.69


### Temperaturavvik per år

In [518]:
from statistikk import beregn_avvik

avvik_df = beregn_avvik(årlig_snitt)
display(avvik_df.round(2))


Unnamed: 0,år,årsgjennomsnitt,avvik
0,1976,6.46,-0.32
1,1977,6.26,-0.52
2,1978,5.75,-1.03
3,1979,5.02,-1.76
4,1980,5.73,-1.05
5,1981,5.44,-1.34
6,1982,6.53,-0.25
7,1983,7.3,0.52
8,1984,6.96,0.18
9,1985,4.67,-2.11


## Analyse av klimagassutslipp i verden

Denne seksjonen analyserer globale utslippsdata.


#### Henter inn datasettet med globale klimagassutslipp

In [519]:
statistikk_verden, df_total_verden, df_verden = statistikk.analyser_fil("../data/klimagassutslipp_verden_renset.csv",datokolonne="År",groupby="år")

### Utslipp per tiår i hele verden

In [520]:
from statistikk import tiår_snitt

tiårs_snitt = tiår_snitt(df_verden, verdikolonne='utslipp_i_co2_ekvivalenter')

print("Utslipp per tiår globalt:")
display(tiårs_snitt)

Utslipp per tiår globalt:


Unnamed: 0,tiår,utslipp_i_co2_ekvivalenter
0,1970,31640810000.0
1,1980,34501320000.0
2,1990,38987180000.0
3,2000,44450320000.0
4,2010,51812160000.0
5,2020,52718850000.0


### Året med høyest og lavest utslipp i verden

In [521]:
from statistikk import ekstremverdier

ekstremer = ekstremverdier(df_verden, verdikolonne='utslipp_i_co2_ekvivalenter')

print(f"Høyeste utslipp: {ekstremer['maksimum']['år']} med {ekstremer['maksimum']['verdi']:.2f}")
print(f"Laveste utslipp: {ekstremer['minimum']['år']} med {ekstremer['minimum']['verdi']:.2f}")


Høyeste utslipp: 2023 med 53816852000.00
Laveste utslipp: 1974 med 30245190000.00


### Endring i klimagassutslipp fra første til siste år

In [522]:
from statistikk import beregn_endring_totalt

resultat_utslipp = beregn_endring_totalt(df_verden, verdikolonne='utslipp_i_co2_ekvivalenter')

print(f"Endring i utslipp fra {resultat_utslipp['startår']} til {resultat_utslipp['sluttår']}:")
print(f"{resultat_utslipp['endring']:.2f} ({resultat_utslipp['prosent']:.2f} %)")


Endring i utslipp fra 1973 til 2023:
23475972000.00 (77.37 %)


### Årlig endring i klimagassutslipp

In [523]:
from statistikk import beregn_endring_årlig

endringsdata = beregn_endring_årlig(df_verden, verdikolonne='utslipp_i_co2_ekvivalenter')
display(endringsdata.round(2))


Unnamed: 0,år,utslipp_i_co2_ekvivalenter,absolutt_endring,prosent_endring
0,1973,30340880000,,
1,1974,30245190000,-95690000.0,-0.32
2,1975,30411125000,165935000.0,0.55
3,1976,31535469000,1124344000.0,3.7
4,1977,32603044000,1067575000.0,3.39
5,1978,33151205000,548161000.0,1.68
6,1979,33198746000,47541000.0,0.14
7,1980,33347820000,149074000.0,0.45
8,1981,32570309000,-777511000.0,-2.33
9,1982,32320344000,-249965000.0,-0.77


## Analyse av klimagassutslipp i Norge

Denne seksjonen analyserer historisk klimagassutslipp i Norge.

#### Leser inn data om Norges klimagassutslipp fra en ferdig renset CSV-fil

In [524]:
statistikk_norge, df_total_norge, df_norge = statistikk.analyser_fil("../data/klimagassutslipp_norge_renset.csv", sep=",", datokolonne="år", groupby="år")

### Utslipp i Norge per kilde og år

In [525]:
from statistikk import analyser_utslipp_norge

stats_per_kilde_år = analyser_utslipp_norge(df_norge)

if stats_per_kilde_år is not None:
    display(stats_per_kilde_år)


Unnamed: 0,kilde_(aktivitet),år,mean,median
0,1 Olje- og gassutvinning,1990,8254.0,8254.0
1,1 Olje- og gassutvinning,1991,8127.0,8127.0
2,1 Olje- og gassutvinning,1992,8728.0,8728.0
3,1 Olje- og gassutvinning,1993,9257.0,9257.0
4,1 Olje- og gassutvinning,1994,10053.0,10053.0
...,...,...,...,...
267,9 Andre kilder,2019,2398.0,2398.0
268,9 Andre kilder,2020,2341.0,2341.0
269,9 Andre kilder,2021,2294.0,2294.0
270,9 Andre kilder,2022,2242.0,2242.0


### Gjennomsnitts utslipp og median for hver kilde totalt i Norge

In [526]:
from statistikk import gjennomsnitt_per_kilde

stats_per_kilde = gjennomsnitt_per_kilde(df_norge)
display(stats_per_kilde)


Unnamed: 0_level_0,mean,median
kilde_(aktivitet),Unnamed: 1_level_1,Unnamed: 2_level_1
2 Industri og bergverk,14117.5,14322.5
1 Olje- og gassutvinning,12653.09,13559.0
5 Veitrafikk,8881.03,8909.0
"6 Luftfart, sj�fart, fiske, motorredskaper m.m.",6904.62,7103.0
7 Jordbruk,4788.35,4782.5
9 Andre kilder,2778.12,2832.0
4 Oppvarming i andre n�ringer og husholdninger,1726.79,1897.0
3 Energiforsyning,1112.26,759.0


### Endring av utslipp i norge fra startår til sluttår 

In [527]:
from statistikk import lag_totaldata, beregn_endring_totalt

total = lag_totaldata(df_total_norge)
resultat = beregn_endring_totalt(total, årskolonne='år', verdikolonne='utslipp')

print(f"Endring i utslipp fra {resultat['startår']} til {resultat['sluttår']}:")
print(f"{resultat['endring']:.0f} ({resultat['prosent']:.2f} %)")


Endring i utslipp fra 1990 til 2023:
-4694 (-9.14 %)


### Året med høyest og lavest utslipp i Norge

In [528]:
from statistikk import ekstremverdier

# Filtrer ut "Alle kilder"
df_alle_kilder = df_total_norge[df_total_norge['kilde_(aktivitet)'].str.lower().str.contains("alle kilder")].copy()
ekstremer = ekstremverdier(df_alle_kilder, verdikolonne='utslipp_til_luft_(1_000_tonn_co2-ekvivalenter,_ar5)')

print(f"Høyeste utslipp: {ekstremer['maksimum']['år']} med {ekstremer['maksimum']['verdi']:.0f} (1 000 tonn CO₂-ekv.)")
print(f"Laveste utslipp: {ekstremer['minimum']['år']} med {ekstremer['minimum']['verdi']:.0f} (1 000 tonn CO₂-ekv.)")


Høyeste utslipp: 2007 med 56548 (1 000 tonn CO₂-ekv.)
Laveste utslipp: 2023 med 46654 (1 000 tonn CO₂-ekv.)


### Årlig endring for hver kilde i Norge

In [529]:
from statistikk import beregn_endring_per_kilde

endringer = beregn_endring_per_kilde(stats_per_kilde_år)

for kilde, df_endring in endringer.items():
    print(f"\nEndring for kilde: {kilde}")
    display(df_endring.round(2))



Endring for kilde: 1 Olje- og gassutvinning


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
0,1990,8254.0,,
1,1991,8127.0,-127.0,-1.54
2,1992,8728.0,601.0,7.4
3,1993,9257.0,529.0,6.06
4,1994,10053.0,796.0,8.6
5,1995,10237.0,184.0,1.83
6,1996,11139.0,902.0,8.81
7,1997,11641.0,502.0,4.51
8,1998,11308.0,-333.0,-2.86
9,1999,11829.0,521.0,4.61



Endring for kilde: 2 Industri og bergverk


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
34,1990,19140.0,,
35,1991,17620.0,-1520.0,-7.94
36,1992,15377.0,-2243.0,-12.73
37,1993,16325.0,948.0,6.17
38,1994,17275.0,950.0,5.82
39,1995,16556.0,-719.0,-4.16
40,1996,17165.0,609.0,3.68
41,1997,16854.0,-311.0,-1.81
42,1998,17168.0,314.0,1.86
43,1999,16960.0,-208.0,-1.21



Endring for kilde: 3 Energiforsyning


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
68,1990,341.0,,
69,1991,396.0,55.0,16.13
70,1992,390.0,-6.0,-1.52
71,1993,409.0,19.0,4.87
72,1994,466.0,57.0,13.94
73,1995,468.0,2.0,0.43
74,1996,560.0,92.0,19.66
75,1997,493.0,-67.0,-11.96
76,1998,538.0,45.0,9.13
77,1999,523.0,-15.0,-2.79



Endring for kilde: 4 Oppvarming i andre n�ringer og husholdninger


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
102,1990,2755.0,,
103,1991,2490.0,-265.0,-9.62
104,1992,2276.0,-214.0,-8.59
105,1993,2308.0,32.0,1.41
106,1994,2329.0,21.0,0.91
107,1995,2369.0,40.0,1.72
108,1996,2905.0,536.0,22.63
109,1997,2469.0,-436.0,-15.01
110,1998,2237.0,-232.0,-9.4
111,1999,2478.0,241.0,10.77



Endring for kilde: 5 Veitrafikk


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
136,1990,7426.0,,
137,1991,7307.0,-119.0,-1.6
138,1992,7338.0,31.0,0.42
139,1993,7511.0,173.0,2.36
140,1994,7408.0,-103.0,-1.37
141,1995,7527.0,119.0,1.61
142,1996,7902.0,375.0,4.98
143,1997,7887.0,-15.0,-0.19
144,1998,8116.0,229.0,2.9
145,1999,8543.0,427.0,5.26



Endring for kilde: 6 Luftfart, sj�fart, fiske, motorredskaper m.m.


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
170,1990,5298.0,,
171,1991,5109.0,-189.0,-3.57
172,1992,5461.0,352.0,6.89
173,1993,5664.0,203.0,3.72
174,1994,5858.0,194.0,3.43
175,1995,6554.0,696.0,11.88
176,1996,6960.0,406.0,6.19
177,1997,7246.0,286.0,4.11
178,1998,7463.0,217.0,2.99
179,1999,7526.0,63.0,0.84



Endring for kilde: 7 Jordbruk


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
204,1990,5050.0,,
205,1991,4984.0,-66.0,-1.31
206,1992,4956.0,-28.0,-0.56
207,1993,4937.0,-19.0,-0.38
208,1994,4944.0,7.0,0.14
209,1995,4988.0,44.0,0.89
210,1996,5021.0,33.0,0.66
211,1997,4962.0,-59.0,-1.18
212,1998,4954.0,-8.0,-0.16
213,1999,4947.0,-7.0,-0.14



Endring for kilde: 9 Andre kilder


Unnamed: 0,år,mean,absolutt_endring,prosent_endring
238,1990,3084.0,,
239,1991,2953.0,-131.0,-4.25
240,1992,2924.0,-29.0,-0.98
241,1993,2968.0,44.0,1.5
242,1994,2999.0,31.0,1.04
243,1995,3042.0,43.0,1.43
244,1996,2989.0,-53.0,-1.74
245,1997,3066.0,77.0,2.58
246,1998,2912.0,-154.0,-5.02
247,1999,2891.0,-21.0,-0.72


### Gjennomsnittlig utslipp per tiår i Norge (alle kilder)

In [530]:
from statistikk import tiår_snitt

kol_utslipp = [kol for kol in df_alle_kilder.columns if "utslipp" in kol.lower() and "co2" in kol.lower()][0]
tiårsdata_norge = tiår_snitt(df_alle_kilder, verdikolonne=kol_utslipp)

display(tiårsdata_norge)


Unnamed: 0,tiår,"utslipp_til_luft_(1_000_tonn_co2-ekvivalenter,_ar5)"
0,1990,51988.9
1,2000,55203.5
2,2010,53432.2
3,2020,48612.75


## Analyse av luftkvalitet

I denne seksjonen analyseres utviklingen av luftkvaliteten på Gløshaugen i Trondheim

#### Leser inn data for historisk luftkvalitet fra CSV-fil

In [531]:
statistikk_luft, df_total, df_luft = statistikk.analyser_fil("../data/gyldig_historisk_luftkvalitet.csv", datokolonne="tid", groupby="år")

  df[tidkolonne] = pd.to_datetime(df[tidkolonne], errors='coerce')


### Statistikk for luftkvalitetsmålinger

In [532]:
for stoff, df in statistikk_luft.items():
    print(f"Statistikk: {stoff}")
    display(df[['år', 'gjennomsnitt', 'median']].round(2))

Statistikk: elgeseter_no2_ugm3_day


Unnamed: 0,år,gjennomsnitt,median
0,2003,48.27,48.07
1,2004,59.01,51.42
2,2005,52.45,53.35
3,2006,56.64,56.27
4,2007,63.51,58.7
5,2008,53.38,50.71
6,2009,52.99,50.32
7,2010,51.11,45.46
8,2011,45.63,42.96
9,2012,44.44,42.32


Statistikk: elgeseter_pm10_ugm3_day


Unnamed: 0,år,gjennomsnitt,median
0,2003,29.01,25.91
1,2004,33.14,23.4
2,2005,35.21,24.77
3,2006,42.77,35.05
4,2007,30.01,22.09
5,2008,26.56,20.96
6,2009,29.01,21.55
7,2010,26.96,20.81
8,2011,31.35,21.45
9,2012,29.73,19.82


Statistikk: elgeseter_pm2.5_ugm3_day


Unnamed: 0,år,gjennomsnitt,median
0,2003,14.9,12.38
1,2004,14.97,12.55
2,2005,15.3,13.36
3,2006,15.28,13.49
4,2007,12.5,10.28
5,2008,10.53,8.86
6,2009,10.73,9.18
7,2010,11.25,9.27
8,2011,10.33,9.21
9,2012,9.99,8.43


### Årlige og månedlige trender i luftkvalitet

In [535]:
from statistikk import analyser_luftkvalitet, legg_til_tid

df_luft = legg_til_tid(df_luft)
målinger = [kol for kol in df_luft.columns if "ugm3" in kol]

resultater = analyser_luftkvalitet(df_luft, målinger)

for stoff, data in resultater.items():
    print(f"Analyse for: {stoff}")
    print("Årlig snitt:")
    display(data["årlig"].round(2))

    print("\nMånedlig snitt:")
    display(data["månedlig"].round(2))

    print("\nEkstremverdier:")
    print(f"Maks: {data['ekstremer']['maksimum']['verdi']:.2f} µg/m³ på {data['ekstremer']['maksimum']['år']}")
    print(f"Min: {data['ekstremer']['minimum']['verdi']:.2f} µg/m³ på {data['ekstremer']['minimum']['år']}")


Analyse for: elgeseter_no2_ugm3_day
Årlig snitt:


Unnamed: 0,år,årssnitt
0,2003,48.27
1,2004,59.01
2,2005,52.45
3,2006,56.64
4,2007,63.51
5,2008,53.38
6,2009,52.99
7,2010,51.11
8,2011,45.63
9,2012,44.44



Månedlig snitt:


Unnamed: 0,måned,månedsnitt
0,1,51.46
1,2,50.6
2,3,42.9
3,4,35.34
4,5,28.51
5,6,24.87
6,7,22.38
7,8,27.36
8,9,28.73
9,10,36.07



Ekstremverdier:
Maks: 162.14 µg/m³ på 2004
Min: 0.00 µg/m³ på 2024
Analyse for: elgeseter_pm10_ugm3_day
Årlig snitt:


Unnamed: 0,år,årssnitt
0,2003,29.01
1,2004,33.14
2,2005,35.21
3,2006,42.77
4,2007,30.01
5,2008,26.56
6,2009,29.01
7,2010,26.96
8,2011,31.35
9,2012,29.73



Månedlig snitt:


Unnamed: 0,måned,månedsnitt
0,1,17.5
1,2,16.95
2,3,25.56
3,4,33.86
4,5,22.81
5,6,16.74
6,7,13.21
7,8,14.86
8,9,15.98
9,10,24.99



Ekstremverdier:
Maks: 190.88 µg/m³ på 2004
Min: 0.00 µg/m³ på 2023
Analyse for: elgeseter_pm2.5_ugm3_day
Årlig snitt:


Unnamed: 0,år,årssnitt
0,2003,14.9
1,2004,14.97
2,2005,15.3
3,2006,15.28
4,2007,12.5
5,2008,10.53
6,2009,10.73
7,2010,11.25
8,2011,10.33
9,2012,9.99



Månedlig snitt:


Unnamed: 0,måned,månedsnitt
0,1,11.33
1,2,9.27
2,3,7.82
3,4,7.62
4,5,6.37
5,6,6.16
6,7,5.67
7,8,5.73
8,9,6.12
9,10,8.56



Ekstremverdier:
Maks: 66.62 µg/m³ på 2008
Min: 0.00 µg/m³ på 2014
