# Modul 0 - Bruk av JupyterLab til øvelser 
I kurset skal vi etterhvert bruke en enkel klimamodell, en toboksmodell, for å beregne temperaturresponser på ulike faktorer. Vi skal både bruke fortidsdata som er basert på observasjoner, og fremtidsdata som er basert på de større klimamodellene. 

I denne modulen skal du trene på å hente inn data som ligger i en csv-fil, og så bruke kommandoer fra biblioteket `pandas` til å hente ut informasjon fra de dataene som ligger i filen. Pandas gjør det enkelt å lage finere plot, og å hente ut spesifikke data fra datafilen, selv om datamengden er stor. 

In [None]:
import pandas as pd # importerer pandas og bruker forkortelsen pd
import matplotlib.pyplot as plt # importerer bibliotek som gjør at man kan lage plott liknende MatLab

df=pd.read_csv('historical.csv',index_col = 0,sep=',',encoding = "utf-8") 

# Visualisér dine data
Du kan visualisere det datasettet som du nettopp har lastet inn ved å skrive inn navnet på din dataframe (i.e. <b>df</b>)

In [None]:
df

In [None]:
df.index=df.index.astype(int) # årstallene lastes inn som flyttall - her endres de til heltall
df.plot() # her lager vi plot fra de dataene som finnes i datafilen, vi har ikke gjort noen beregninger

In [None]:
df.plot(ylabel="W/m$^2$",title="Strålingspådriv fra ulike faktorer fra 1750 og frem til i dag")
# her har vi lagt til litt mer informasjon til selve plottet, men fortsatt ingen beregninger

## Hente spesifikke data
Noen ganger ønsker vi å se på verdier fra spesifikke år. Årstallene fungerer som index i datarammen vi har laget med dataene. Vi kan derfor hente ut verdiene fra de ulike årstallene som vist under. Denne metoden vil dere få bruk for i oppgavene senere. Test gjerne ut med ulike årstall. 
`df.loc[årstall]`

In [None]:
df.loc[1900]

In [None]:
df.loc[1900,'solinnstråling']

### Lete etter verdier
Vi har også mulighet til å lete etter bestemte verdier eller intervaller. Under vises en måte å hente ut data for når pådrivet fra vulkaner er mindre enn $-4 W/m^2$. 

In [None]:
df.loc[df['vulkanisme']<-4]

Vi kan også velge å bare vise den kolonnen som vi er interessert i:

In [None]:
df.loc[df['vulkanisme']<-4,'vulkanisme']

## Hvilke faktorer ønsker du å ta med i beregningene?
Noen ganger så ønsker man bare å studere effektene av eksempelvis solens aktivitet. Sett parameterne under til 1 eller 0, alt ettersom du ønsker å ha dem med eller ei. I koden under lages en ny dataramme som inneholder totalt pådriv med disse faktorene.

In [None]:
# --------------------
# Forcing switches [n=1 off=0]
# --------------------
switch_ghg=0     # Greenhouse gas forcing on=1 off=0
switch_solar=1   # Solar forcing on=1 off=0
switch_volc=0    # Volcanic forcing on=1 off=0
switch_land=0    # Landuse forcing on=1 off=0
switch_aero=0    # Pollution particle forcing on=1 off=0

In [None]:
total_forcing = switch_ghg*df['drivhusgasser']+switch_solar*df['solinnstråling']+switch_volc*df['vulkanisme']+switch_land*df['arealbruk']+switch_aero*df['aerosoler']
total_forcing.plot()
plt.axhline(y=0, linewidth=0.7, color="black")

## Veien videre
Senere skal vi bruke disse dataene til å si noe om temperaturresponsen i klimasystemet basert på de ulike drivkreftene. Vi skal bruke en enkel klimamodell for å kunne studere hvordan de ulike faktorene påvirker temperaturen i atmosfæren.

# Beregne middelverdier og sum

In [None]:
# opprett simpel dataframe for test
data = [[1, 1, 2], [6, 4, 2], [4, 2, 1], [4, 2, 3]]

A = pd.DataFrame(data)

# Beregn middelverdi langs rekker
print(A.mean())

# Tilsvarende kan vi også beregne summen via funktionen "df.sum()"
print(A.sum())

Som default beregnes middelverdien langs den 1. dimensjon av dataframe (langs rekker). Om du vil beregne verdien langs kolonner istedet må du definere dette:

In [None]:
# middelverdi langs kolonner
print(A.mean(axis='columns'))

# sum langs kolonner
print(A.sum(axis='columns'))

## Beregne middelverdier av strålingsdata 
Prøv nå å beregne middelverdien for 
1. hele tidsperioden (år 1750-2011) for hver strålingspådriv (*drivhusgasser, solinnstråling, vulkanisme, arealbruk, aerosoler*)  
2. det totale strålingspådriv, men for hvert årstall 

In [None]:
print(df.mean())

print(df.mean(axis='columns'))

## Beregne middelverdier over en bestemt periode

For at få ut verdier over en bestemt periode (eller for en bestemt variabel) kan vi benytte funktionen *loc*, som vi brukte tidligere


In [None]:
df1800_1900 = df.loc[1800:1900] # for år 1800-1900
df1900_2000 = df.loc[1900:2000] # for år 1900-2000

print(df1800_1900)


## Øvelse

Vi kan nå beregne middelsverdier for hvert enkelt strålingspådriv over perioden 1800-1900 og 1900-2000. Svar deretter på følgende: 

1. Hvilket pådriv har vært dominerende i perioden **før** den industrielle revolusjon (år 1800-1900)?
2. Ser du en endring i hvilket pådriv som har vært dominerende i perioden **etter** den industrielle revolusjon (år 1900-2000)
3. Hva er det totale (sum) strålingspådriv for de to perioder? 


In [None]:
df1800_1900_mean = df1800_1900.mean()
df1900_2000_mean = df1900_2000.mean()

print("middelsværdier over perioden 1800-1900:\n", df1800_1900_mean)
print("middelsværdier over perioden 1900-2000:\n", df1900_2000_mean)

print("Total pådriv over perioden 1800-1900:\n", df1800_1900_mean.sum())

print("Total pådriv over perioden 1900-2000:\n", df1900_2000_mean.sum())


# Eksempel på barplot

Vi kan visualisere disse data med et barplot


In [None]:
# definér ny dataframe mead værdiene fra 'df1800_1900_mean' og 'df1900_2000_mean'
plotdata = pd.DataFrame({
    "1800-1900":df1800_1900_mean,
    "1900-2000":df1900_2000_mean,
    }, 
)

plotdata.plot(kind="bar") # lage bar plot
