# De rol van interne klimaatvariabiliteit in klimaatprojecties

<div>
<img src="ClimateSystem.jpg" width="500"/>
<figcaption align = "center"> Figuur 1: Gekoppelde klimaatsysteem </figcaption>
</div>

## Overzicht

Om je kennis te laten maken met een Earth System model, gaan we kijken naar atmosferische oppervlakte temperaturen gesimuleerd met een klimaatmodel. Je gaat dus niet zelf zo'n model maken maken, maar wel kijken hoe je de uitkomsten van zulke grote, complexe modellen kunt inladen, dimensies en variabelen kunt bekijken, resultaten kunt visualiseren en enkele analyses kan doen.

We zullen gebruik maken van klimaatprojecties voor de periode 2015-2100 gedaan met het CCSM3 klimaatmodel ("https://www.cesm.ucar.edu/models"). Dit is een gekoppeld klimaatmodel waarin processen in de atmosfeer, oceaan, zee-ijs en op het land gesimuleerd worden. Zie voor meer details: "https://en.wikipedia.org/wiki/Community_Climate_System_Model". De forcering van deze klimaatprojecties volgen het zogenaamde SSP2-4.5 scenario, een scenario waarin CO$_2$ toeneemt tot ongeveer 600$ppm$ in 2100 (zie figuur 2) en de aarde per 2100 zo'n 2.7$\degree$$C$ opwarmt. Dit komt redelijk overeen met het pad wat we op dit moment ongeveer volgen. Kijk voor meer details over de "Shared Socioeconomic Pathways" scenarios op: "https://en.wikipedia.org/wiki/Shared_Socioeconomic_Pathways".

<div>
<img src="SSP_21st_century.png" width="700"/>
<figcaption align = "center"> Figuur 2: Evolutie van CO$_2$ in de 21st eeuw voor de verschillende SSP-scenario's </figcaption>
</div>

<br/>

Om de rol van interne, oftewel niet geforceerde, variabiliteit te bekijken, gaan we werken met een zogenaamd 10-member initiële condities ensemble. Dat wil zeggen dat de klimaatprojecties niet 1 keer, maar 10 keer gesimuleerd zijn met exact hetzelfde klimaatmodel en exact dezelfde SSP2-4.5 forcering, maar met hele kleine verschillen in de initiele condities (dus op 1 januari 2015).

## De opdracht maken

Hieronder staat stap voor stap uitgelegd wat je moet doen en welke vragen je moet beantwoorden. Schrijf je antwoorden op in een apart document en voeg figuren toe.

***
## Data inladen en bekijken

We hebben voor het laden en visualiseren van de data de volgende *Python* packages nodig.

In [None]:
import numpy as np
import netCDF4 as netcdf
import matplotlib.pyplot as plt
import cartopy.crs as ccrs

Vervolgens openen we het bestand waarin de temperatuur data zit via de *netCDF4* method *Dataset*

In [None]:
inputfile = netcdf.Dataset('/srv/scistor/data/MFE/b.e21.BSSP245smbb.f09_g17.ens.cam.h0.TS.201501-210012.nc', 'r')

We gaan nu eerst de zogenaamde *metadata* van deze data, oftewel een beschrijving van wat de data voorstelt, bekijken. Je kunt dit doen voor het hele bestand door in de onderstande cell *inputfile* in te toetsen en de cel uit te voeren. Je kunt ook alle variabelen in de data bekijken door gebruik te maken van *inputfile.variables*, en tenslotte kun je informatie van een specifieke variabele bekijken met *inputfile.variables['variable_name']*

**Vraag 1**: Schrijf de eenheid van de volgende variabelen op: 'time', 'lat', 'lon' and 'TS'

We laden vervolgens enkele individuele variabelen en stoppen de data in Python *numpy arrays* (mogelijk duurt dit even)

In [None]:
time= inputfile.variables['time'][:]  	  			              
lat	= inputfile.variables['lat'][:]
lon	= inputfile.variables['lon'][:]
ts	= inputfile.variables['TS'][:]

We kunnen de 'vorm' van de 'ts' variabele bekijken door middel van de *.shape* method. Als je dat doet dan krijg je in dit geval 5 getallen te zien gescheiden door kommas. Deze getallen geven je de grootte van de 5 dimensies van de variabele 'ts'. Gebruik de onderstaande cell om dit te proberen.

**Vraag 2:** Leg uit welke betekenis de 5 dimensies van de 'ts' variabele hebben

***
## Berekenen van jaargemiddelde-, januari- en juli temperaturen

Voor enkele van de komende vragen zullen we gaan werken met jaargemiddelde temperaturen, en ook met januari en juli temperaturen. Die kunnen we bepalen met het volgende stuk code. We zullen ze opslaan in de variabelen *ts_yr*, *ts_jan* en *ts_jul*. Probeer te begrijpen wat hier gebeurt. Als je dit nog niet zelf had kunnen bedenken is dat geen probleem.

In [None]:
# Jaar gemiddelde
ts_yr = np.zeros((ts.shape[0],int(ts.shape[1]/12),ts.shape[2],ts.shape[3]))
for t in range(int(ts.shape[1]/12)):
    ts_yr[:,t,...] = np.nanmean(ts[:,t*12:t*12+11,...],axis=1)

# januari en juli
ts_jan = np.zeros_like(ts_yr)
ts_jul = np.zeros_like(ts_yr)
    
ts_jan = ts[:,0:-1:12,...]
ts_jul = ts[:,6:-1:12,...]

***
## Globale temperaturen
We gaan nu de eerste uitkomsten van de klimaatsimulaties bekijken. We beginnen met de globale temperatuur gemiddeld over het hele 10-member initiële condities ensemble. Hiervoor gebruiken we de *numpy mean* functie. In de onderstaande cell zie je de functie al staan, maar je moet zelf nog invullen over welke dimensies je het gemiddelde wilt berekenen. Gebruik hiervoor je antwoord bij vraag 2. Maak vervolgens een lijn-plot van de nieuwe variabele *ts_glob*.

In [None]:
ts_glob = np.mean(ts,axis=(dimx,dimy,...)) # in plaats van 'dimx,dimy,...' moet je een lijst getallen geven voor alle dimensies waarover je het gemiddelde wilt berekenen

**Vraag 4:** Wat zijn de *eenheden* van de x-as en van de y-as van je lijn-plot?


We gaan nu de x-as en y-as van de lijn-plot aanpassen zodat de figuur makkelijker te lezen en interpreteren wordt. Dit zullen we doen door op de x-as *kalenderjaren* in plaats van model-jaren te zetten, en op de y-as de *temperatuurveranderingen ten opzichte van 2015* in plaats van absolute temperaturen.
Tip: gebruik voor de x-as: np.linspace(2015,2100,ts.shape[1])

**Vraag 5:** Is dit een 'realistische' hoeveelheid opwarming tot het jaar 2100? Is dit waar we met de huidige uitstoot en ontwikkelingen waar we ongeveer op afstevenen? (zoek eventueel op op internet als je dit niet weet)


*** 
## Ruimtelijke patronen
Om ruimtelijke verschillen in de mate van opwarming te bekijken zullen we het verschil tussen de jaren 2090-2100 en de jaren 2015-2025 bekijken op een kaart. Hiervoor zullen we eerst gemiddeldes (*np.mean()*) voor het 10-member initiële condities ensemble berekenen voor 2090-2100 (*ts_2100*) en 2015-2025 (*ts_2015*), vervolgens het verschil hiertussen berekenen (*diff*) om uiteindelijke door middel van functies uit de *matplotlib* en *cartopy* packages een kaart te maken. De code voor deze kaart is al helemaal gegeven.


In [None]:
ts_2100 = # Gemiddelde over de 10 ensemble members en over de laaste 10 jaar

ts_2015 = # Gemiddelde over de 10 ensemble members en over de eerste 10 jaar

diff = # Bereken het verschil tussen de laaste 10 jaar en de eerste 10 jaar

fig, ax = plt.subplots(subplot_kw={'projection': ccrs.PlateCarree()})
im =ax.contourf(lon,lat,diff, transform=ccrs.PlateCarree(),levels=[-5,-4,-3,-2,-1,0,1,2,3,4,5],cmap = 'bwr')
ax.contour(lon,lat,diff, transform=ccrs.PlateCarree(),levels=[0],colors='white')
cbar = plt.colorbar(im,orientation='horizontal')
cbar.set_label('Temperatuur verandering [$\degree$C]')
ax.coastlines()
ax.set_title('Temperatuur verandering 2100 minus 2015')

**Vraag 6:** Kun je de ruimtelijke patronen verklaren in de kaart die je net gemaakt hebt? Bijvoorbeeld de verschillen tussen land en zee? De verschillen tussen de lage en hoge breedtegraden? Kun je verklaren waarom een deel van de Noord Atlantische Oceaan kouder wordt? Zie je nog andere opmerkelijke patronen?

***
## De invloed van interne klimaatvariabiliteit op de klimaatprojecties over verschillende ruimtelijke schalen
Tot nu toe hebben we gekeken naar gemiddeldes over alle 10 ensemble members. Maar hoe groot zijn de verschillen tussen de ensemble members? En hoe hangt dit af van het gebied waar we naar kijken of de ruimtelijke schaal?
We zullen beginnen met onze analyse door de kaart van vraag 6 te vergelijken met een nieuw te maken kaart waarop we door middel van de standaard deviatie de verschillen tussen de ensemble members zullen laten zien.
Combineer voor deze nieuwe kaart zowel de *np.mean* als de *np.std* functies en bedenk goed over welke dimensie je een gemiddelde wilt en over welke dimensie de standaard deviatie.

In [None]:
# Gebruik en vul de onderstaande code aan.
ts_2100 =
ts_2015 =
diff = 
std =

fig, ax = plt.subplots(subplot_kw={'projection': ccrs.PlateCarree()})
im = ax.pcolormesh(lon,lat,std, transform=ccrs.PlateCarree())
cbar = plt.colorbar(im,orientation='horizontal')
cbar.set_label('Temperatuur standaard deviatie [$\degree$C]')
ax.coastlines()
ax.set_title('Ensemble standaard deviatie in temperatuurverandering 2100 minus 2015')

**Vraag 7:** Hoe groot zijn de verschillen tussen de ensemble members? En hoe verhoudt zich dat met de gemiddelde temperatuurverandering?

Zoals je in je kaart bij vraag 7 al hebt kunnen zien, zijn er grote regionale verschillen in de invloed van interne klimaatvariabiliteit op klimaatprojecties. Dit zullen we verder bekijken door gemiddelde jaarlijkse temperatuurveranderingen te gaan berekenen en visualiseren in lijn-plots voor drie verschillende gebieden: een globaal gemiddelde, en gemiddeldes over de lage en hoge breedtegraden van het noordelijk halfrond.
Gebruik de onderstaande code en vul deze verder aan. Zoek hiervoor ook op in de variabele *lat* welke indexen er horen bij 0$\degree$N en 45$\degree$N en vul deze waardes in bij *latind_0N* en *latind_45N*. Probeer de onderstaande code te begrijpen. Als je dit nog niet zelf had kunnen bedenken is dat geen probleem.

In [None]:
# Gebruik en vul de onderstaande code aan.
latind_0N = 
latind_45N = 

globmean = 
lowlatmean = 
highlatmean =

time = np.linspace(2015,2100,ts_yr.shape[1])
fig, ax = plt.subplots(nrows=1,ncols=3,figsize=(15, 5))
for mem in range(10):
    ax[0].plot(time,globmean[mem,...], label='Member '+str(mem+1))
    ax[0].set_title("Globale gemiddeldes")
    ax[0].set_xlabel('Kalenderjaren')
    ax[0].set_ylabel('Jaarlijkse gemiddelde temperatuur [$K$]')
    ax[1].plot(time,lowlatmean[mem,...])
    ax[1].set_title("Gemiddeldes lage breedtegraden")
    ax[1].set_xlabel('Kalenderjaren')
    ax[2].plot(time,highlatmean[mem,...])
    ax[2].set_title("Gemiddeldes hoge breedtegraden")
    ax[2].set_xlabel('Kalenderjaren')    
ax[0].legend()

**Vraag 8:** Wat valt je op als je naar de temperatuurprojecties en de verschillen tussen de ensemble members kijkt? Kun je de verschillen tussen de verschillende gebieden en ruimtelijke schalen verklaren?

Nu gaan we hetzelfde doen als bij vraag 8, maar nu voor de maanden januari en juli (*ts_jan* en *ts_jul*). Kopieer hiervoor de code van vraag 8, plak hem in de cel hieronder en pas deze aan.

**Vraag 9:** Wat valt je op als je naar de veranderingen en de verschillen tussen de ensemble members kijkt voor de maanden januari en juli? Kun je de verschillen tussen de verscihllende gebieden en ruimtelijke schalen verklaren?

Tenslotte zullen we gaan kijken naar tijdreeksen voor enkele individuele locaties, zowel jaargemiddelde, januari als juli temperaturen. We zullen deze verschillende tijdreeksen gaan weergeven in 1 figuur door gebruik te maken van de 'ncols' en 'nrows' opties van 'plt.subplots'. Maak hiervoor gebruik van de onderstaande code en vul deze verder aan door onder andere gebruik te maken van de code bij de vorige vraag. Kies de breedtegraad en lengtegraad van je locatie die je wilt bekijken en vul de in bij *latloc* en *lonloc*.

In [None]:
latloc =  # Gebruik getallen tussen de -90 (zuidpool) en 90 (noordpool)
lonloc =  # Gebruik getallen tussen de 0 en 360

latind = np.squeeze(np.min(np.where(abs(lat-latloc)==min(abs(lat-latloc))))) # deze code zoekt de breedtegraad index die hoort bij de gekozen breedtegraad
lonind = np.squeeze(np.min(np.where(abs(lon-lonloc)==min(abs(lon-lonloc))))) # deze code zoekt de lengtegraad index die hoort bij de gekozen lengtegraad



**Vraag 10:**  Maak de bovenstaande figuur voor minimaal 5 locaties die je interessant lijken. Wat valt je op en kun je verklaren wat je ziet?

## Einde

***