<img src="../.images/logosnb.png" alt="Banner" style="width:800px;"/>

<div style='color: #690027;' markdown="1">
    <h1>CO<sub>2</sub></h1> 
</div>

<div class="alert alert-box alert-success">
In deze notebook leer je een puntenwolk maken van data uit een <em>csv-bestand</em>. Je leert hoe je de punten kunt verbinden met een gebroken lijn en hoe je een voorstelling maakt van twee grafieken met de y-as anders geschaald.<br>
Je beperkt NumPy arrays, voegt er samen en verwijdert er elementen uit.
</div>

Dr. Pieter Tans is hoofd van de  'Carbon Cycle Greenhouse Gases Group' van het onderzoekscentrum 'National Oceanic & Atmospheric Administration (NOAA)' in Colorada. Zijn onderzoeksgroep doet op Mauna Loa op Hawaï metingen van de concentratie CO$_{2}$ in de atmosfeer. De data zijn te vinden op de website van NOAA [1].

Pieter Tans [2]: "David Keeling van het 'Scripps Institute of Oceanography' in San Diego begon in 1958 de eerste precisiemetingen van CO2 op de vulkaan Mauna Loa in een hutje van de 'U.S. Weather Bureau', dat nu overgegaan is in NOAA. De CO$_{2}$-metingen van NOAA begonnen in 1973. Sindsdien zijn er twee onafhankelijke meetprogramma's: door Scripps en door NOAA.<br>
De CO$_{2}$-concentraties van de periode voor de metingen op Mauna Loa begonnen, kan men bepalen uit natuurlijke luchtmonsters,  luchtbellen opgesloten in diep ijs. CO$_{2}$ van de laatste 2000 jaar, dat opgesloten zat in diep ijs, werd ontgonnen op Antarctica." 

Dr. Pieter Tans verschafte ons data van zijn onderzoek met de Law Dome **ijskernen** [2]. <br>
In deze notebook ga je met de data uit ijskernen en met de data van Mauna Loa aan de slag.

CO$_{2}$-concentratie wordt uitgedrukt in **ppm**: parts per million.

### De nodige modules importeren

Om van **csv-bestanden** - csv staat voor **comma separated values** -  overzichtelijke tabellen te kunnen maken, maak je gebruik van de module pandas. <br>
Om kolommen van deze tabel om te vormen naar een lijst en daarmee te kunnen rekenen, importeer je de module NumPy. <br>
Grafische voorstellingen van de gegevens maken, doe je met de interface pyplot van de module Matplotlib. <br><br>
Je importeert de nodige modules door de volgende code-cel uit te voeren.

In [None]:
import pandas as pd

import matplotlib.pyplot as plt
import numpy as np

from IPython.display import YouTubeVideo

### Video 'CO2 in the Ice Core Record'

Bekijk eerst een videofragment uit 'Earth: The Operators' Manual'. Klimaatdeskundige Richard Alley toont hoe ijskernen hun rol van klimaatproxy vervullen. 

In [None]:
YouTubeVideo("oHzADl-XID8")             

<div style='color: #690027;' markdown="1">
    <h2>1. Inlezen van de data uit de ijskernen</h2> 
</div>

De data werd ons bezorgd als csv-bestand. Dat is een veel gebruikt bestandsformaat.
Het ziet er als volgt uit:

<img src="../.images/IntroductiePython/csvAntarctica.JPG" alt="Banner" style="width:250px;"/>

Lees het bestand in door de volgende code-cel uit te voeren:

In [None]:
antarctica = pd.read_csv("../.data/IntroductiePython/AntarcticaCO2.dat")         # data Tans (NOAA)

En vraag het resultaat op:

In [None]:
antarctica

Wil je enkel het begin van de tabel zien, of enkel de laatste rijen ervan, dan kan dat via de methodes `head()` en `tail()`.

In [None]:
antarctica.head()

In [None]:
antarctica.tail()

De tabel heeft 203 rijen en 2 kolommen. <br>
De eerste kolom bevat het jaartal van de meting, de tweede kolom de CO$_{2}$-concentratie in ppm.

De data bekomen uit de ijskernen, geven de  CO$_{2}$-concentratie van het jaar 1 tot het jaar 1996.

Om deze data uit te zetten in een grafiek, kies je twee variabelen: x voor het jaartal en y voor de CO$_{2}$-concentratie. <br>
Je maakt een lijst met de jaartallen en een lijst met de CO$_{2}$-concentraties. Met Pandas gaat dat vrij eenvoudig omdat je de hoofding van de tabel als **sleutel** (*key*) kunt gebruiken.

In [None]:
x = antarctica["jaartal"]                # hoofding van kolom is sleutel, die speelt rol van index, jaartal komt op x-as
y = antarctica["molfractie CO2 (ppm)"]   # concentratie CO2 komt op y-as

Kijk eens hoe zo'n lijst eruitziet:

In [None]:
print(x)

Dit is nog steeds een soort tabel. Eigenlijk heb je voor x enkel de tweede kolom nodig.<br> Je kunt dat bekomen door gebruik te maken van *typecasting*: je zet deze pandas-tabel om naar een *NumPy array*.

In [None]:
# data omzetten naar NumPy array
x = np.array(x)
y = np.array(y)

In [None]:
print(x)
print(y)

Het is altijd goed om data te visualiseren. Dat maakt de data wat meer concreet.

<div style='color: #690027;' markdown="1">
    <h2>2. Data uit ijskernen weergeven in puntenwolk</h2> 
</div>

Het bereik nodig op de x-as is eenvoudig te zien. Om het bereik op de y-as te bepalen, is het interessant om te weten wat de kleinste en wat de grootste y-waarde is. <br>
Je gebruikt daarvoor de methodes `min()` en `max()`.

In [None]:
y_min = y.min()
y_max = y.max()
print(y_min, y_max)

Het is altijd het beste om geen misleidende grafieken te maken en dus zeker 0 ook te tonen op de y-as. Eventuele stijgingen en dalingen worden anders sterk uitvergroot.

In [None]:
# grafiek

plt.figure()                                  # grafiekscherm

plt.xlim(0, 2020)                             # bereik op x-as
plt.ylim(0, 450)                              # bereik op y-as

plt.scatter(x, y, color="blue", marker=".")   # puntenwolk, kleur en vorm van punten vastleggen

plt.title("Antarctica, CO$_{2}$ uit ijskernen")    # titel geven aan grafiek
plt.xlabel("jaartal")                         # omschrijving geven bij x-as
plt.ylabel("CO$_{2}$ (in ppm)")                    # omschrijving geven bij y-as

plt.show()                                    # grafiek tonen

De CO$_{2}$-concentratie lijkt tot 1500 vrij stabiel. In het eerste deel lijkt de kromme een constant verloop te hebben. <br>
Maar je kan dat maar zeker weten als je op de y-as wat inzoomt. Neem een kleiner bereik op de y-as, meer geconcentreerd rond de datapunten.<br>
Je maakt de grafiek ook wat groter.

In [None]:
plt.figure(figsize=(10,8))    # grotere grafiek
plt.xlim(0, 2000)
plt.ylim(250, 400)
plt.scatter(x, y, color="blue", marker=".")
plt.title("Antarctica, CO$_{2}$ uit ijskernen")
plt.xlabel("jaartal")
plt.ylabel("CO$_{2}$ (in ppm)")
plt.show()

### Opdracht 
Hieronder wordt de grafiek hernomen. Er is een  verticale lijn aan toegevoegd, die het begin van de industriële revolutie aangeeft, het jaar 1750.<br>
Voeg twee horizonatle lijnen toe. Doe dat op zo'n manier dat de meeste datapunten er tussen liggen.<br>
Probeer tot slot via een verticale lijn in te schatten vanaf waar de punten niet meer in de strook gevangen zitten.<br>

In [None]:
plt.figure(figsize=(10,8))    # grotere grafiek
plt.xlim(0, 2000)
plt.ylim(250, 400)
plt.scatter(x, y, color="blue", marker=".")
plt.title("Antarctica, CO$_{2}$ uit ijskernen")
plt.xlabel("jaartal")
plt.ylabel("CO$_{2}$ (in ppm)")

# Voeg twee horizontale lijnen toe
plt.hlines(290, xmin=0, xmax=2000, color = "green")
plt.hlines(270, xmin=0, xmax=2000, color = "green")
plt.vlines(1850, ymin=0, ymax=400, color = "green")
plt.vlines(1750, ymin=0, ymax=400, color = "red")
plt.show()

Dus vóór 1850 schommelt de CO$_{2}$-concentratie  weliswaar een beetje maar nooit meer dan $\pm$ 10 ppm.

Teken nu een lijndiagram i.p.v. een puntenwolk:

In [None]:
fig = plt.figure(figsize=(10,8))    # grotere grafiek
plt.xlim(0, 2000)
plt.ylim(250, 400)
plt.plot(x, y, color="blue")
plt.title("Antarctica, CO$_{2}$ uit ijskernen")
plt.xlabel("jaartal")
plt.ylabel("CO$_{2}$ (in ppm)")

# Voeg twee horizontale lijnen toe
plt.hlines(290, xmin=0, xmax=2000, color = "green")
plt.hlines(270, xmin=0, xmax=2000, color = "green")
plt.vlines(1850, ymin=0, ymax=400, color = "green")
plt.vlines(1750, ymin=0, ymax=400, color = "red")
plt.show()

De industriële revolutie begon ongeveer in 1750. Het is opvallend hoe de kromme vanaf dan van vorm verandert. <br>


<div class="alert alert-block alert-warning"> 
Over de periode vanaf het begin van de industriële revolutie leer je meer in de de notebook 'CO$_{2}$: trend sinds het begin van de industriële revolutie'.
</div>

<div style='color: #690027;' markdown="1">
    <h2>3. Kleine IJstijd</h2> 
</div>

De ijskernen verschaffen ook belangrijke informatie over de periode vóór de industriële revolutie. De atmosferische CO$_{2}$ was toen vooral bepaald door natuurlijke processen, maar was wellicht al wat onderhevig aan menselijke activiteiten zoals ontbossing, landbouw en oorlog [4].

De Kleine IJstijd is een periode van de 16de tot midden de 19de eeuw. Vooral in de 17de eeuw was het toen kouder in Noordwest-Europa. De periode was bv. gekenmerkt door het feit dat de gebergtegletsjers zich uitbreiden. <br> 
Veel oogsten mislukten. Er was meer melding van honger en ziekte en een stijging in kindersterfte [5].
<img src="../.images/IntroductiePython/Bruegel_Jagersindesneeuw.jpg" alt="Banner" style="width:400px;"/>
<center>Pieter Bruegel de Oudere. Jagers in de sneeuw [3].</center>

Herken je deze periode op de grafiek? Vind je een verband met het CO$_{2}$-gehalte in die periode?

<div class="alert alert-block alert-warning"> 
Na deze periode volgt een dramatische terugtrekking van de gebergtegletsjers. Zie hiervoor de notebooks over de Morteratschgletsjer en de Silvrettagletsjer.
</div>

### Opdracht
Maak een nieuwe grafiek (lijndiagram) die enkel de waarden toont voor de Kleine IJstijd.<br>
Beperk hiervoor ook de gebruikte arrays op een correcte manier. <br> 


<div class="alert alert-block alert-warning"> 
Meer uitleg over hoe je dit doet, vind je in de notebook 'Lijsten en NumPy-arrays beperken'.
</div>

In [None]:
# index opsporen
np.where(x==1499)

In [None]:
np.where(x==1850)

In [None]:
x_ki = x[51:95]
y_ki = y[51:95]

In [None]:
plt.figure()   
plt.xlim(1490, 1860)
plt.ylim(270, 290)
plt.plot(x_ki, y_ki, color="purple")
plt.title("Antarctica, CO$_{2}$ in ijs, Kleine IJstijd")
plt.xlabel("jaartal")
plt.ylabel("CO$_{2}$ (ppm)")
plt.show()

<div style='color: #690027;' markdown="1">
    <h2>4. Verloop temperatuur en verandering CO$_{2}$-concentratie vergelijken</h2> 
</div>

**Je bekijkt de periode van 1880 tot 1996.**

<div style='color: #690027;' markdown="1">
    <h3>4.1 Verandering CO$_{2}$-concentratie</h3> 
</div>

Je hebt dus de CO$_{2}$-concentratie nodig voor deze periode.<br> Je moet daarvoor de NumPy array y beperken tot die waarden en tegelijk ook voor de NumPy array x.

Je zoekt eerst uit het hoeveelste element in de rij het jaartal 1880 is.

In [None]:
np.where(x == 1880)

Oei, geen resultaat. Ga eens naar de uitgeprinte rij kijken. Je ziet dan dat 1880 zelf er niet in staat, probeer eens met een jaartal er dichtbij.

In [None]:
np.where(x == 1882)

Nog eens controleren:

In [None]:
print(x[107])

In [None]:
x_CO2 = x[107:]
y_CO2 = y[107:]

In [None]:
print(x_CO2, y_CO2)

<div style='color: #690027;' markdown="1">
    <h3>4.2 Verloop temperatuur</h3> 
</div>

Je hebt ook data van de gemiddelde globale temperatuur nodig.

De data die je zal gebruiken, zijn beschikbaar op de website van NASA/GISS [6]. Het zijn echter niet de gemeten temperaturen die de data vormen. De data bevatten de mate waarin de gemeten temperatuur afwijkt t.o.v. een bepaalde referentieperiode. Men spreekt van een **temperatuuranomalie**. Voor de data van NASA/GISS is de referentieperiode 1951-1980.

In [None]:
globale_temp = pd.read_csv("../.data/IntroductiePython/globaleTemperatuur.dat")           # data NASA

In [None]:
print(globale_temp)

Merk op dat deze metingen lopen tot in 2018, en je hebt ze maar tot 1996 nodig.

In [None]:
x_globale_temp = globale_temp["jaar"]

In [None]:
y_globale_temp = globale_temp["temperatuur"]

In [None]:
x_globale_temp = np.array(x_globale_temp)
y_globale_temp = np.array(y_globale_temp)

In [None]:
np.where(x_globale_temp == 1996)

In [None]:
print(x_globale_temp[116])

In [None]:
x_temp = x_globale_temp[:117]
y_temp = y_globale_temp[:117]

In [None]:
print(x_temp, y_temp)

<div style='color: #690027;' markdown="1">
    <h3>4.3 Verloop temperatuur en verandering  CO$_{2}$-concentratie op één grafiek</h3> 
</div>

In [None]:
print(y_temp.min(), y_temp.max())

In [None]:
print(y_CO2.min(), y_CO2.max())

In [None]:
# grafiek met twee krommen met verschillende schaal op y-as 
fig, ax1 = plt.subplots(figsize=(8, 6))    
ax2 = ax1.twinx()   # voor gemeenschappelijke x-as

plt.xlim(1850, 2020)
ax1.set_ylim(280, 370)
ax2.set_ylim(-0.6, 0.6)
plt.xlabel("jaartal")
ax1.set_ylabel("CO$_{2}$ (ppm)", color="blue")
ax2.set_ylabel("temperatuur anomalie (°C)\n(relatief t.o.v. 1951-1980)", color="green")


ax1.plot(x_CO2, y_CO2, color="blue")
ax2.plot(x_temp, y_temp, color="green")


plt.title("Temperatuur vs. CO$_{2}$ (1882-1996)")

# plt.ylabel("temperatuur relatief tov....")
fig.tight_layout()
plt.show()

fig.savefig('tempCO2.png')

# ax1.set_xlabel('time (s)')
# ax1.set_ylabel('exp', color=color)


<div style='color: #690027;' markdown="1">
    <h2>5. Keelingcurve</h2> 
</div>

De Keelingcurve is een van de belangrijkste krommen in het klimaatonderzoek.

We beschouwen de data vanaf 1958, toen Keeling met zijn metingen begon. 

In [None]:
keeling = pd.read_csv("../.data/IntroductiePython/keeling.dat")    # data Scripps
keeling

In [None]:
x_keel = keeling["Date.1"]
y_keel = keeling["CO2"]

In [None]:
print(x_keel, y_keel)

In [None]:
x_keel = np.array(x_keel)
y_keel = np.array(y_keel)

In de data is er een opvallende waarde die meermaals terugkomt: -99.99.<br>
Dat zijn eigenlijk **ontbrekende metingen**. Die moet je eruit halen.
Pieter Tans verklaart: "-99.99 betekent immers dat er geen geldige metingen zijn voor dat uur, die dag of die maand. Soms is er een technisch probleem, een orkaan of een vulkaanuitbarsting waarbij de elektriciteit uitgevallen is." 

Om -99.99 te kunnen verwijderen, moet je eerst nagaan op welke plaatsen in de NumPy array deze waarde voorkomt. Je moet immers ook het overeenkomstig jaartal verwijderen uit x_keel.

In [None]:
np.where(y_keel == -99.99 )

De waarden met deze indices moeten verwijderd worden. Ook de overeenkomstige uit x-keel.

In [None]:
index = np.where(y_keel == -99.99 )
print(len(x_keel), len(y_keel))
y_keel_aangepast = np.delete(y_keel, index)
x_keel_aangepast = np.delete(x_keel, index)
print(x_keel_aangepast, y_keel_aangepast)
print(len(x_keel_aangepast),len(y_keel_aangepast))

In [None]:
plt.figure(figsize=(10,8))    
plt.xlim(1950, 2025)
plt.ylim(250, 450)
plt.plot(x_keel_aangepast, y_keel_aangepast, color="blue")
plt.title("Keelingcurve")
plt.xlabel("jaartal")
plt.ylabel("CO$_{2}$ (in ppm)")
plt.show()

Let op de vorm. 
-  Welke trend kun je vaststellen?
-  Kun je het zigzaggen verklaren?

<div>
    <h2>Referentielijst</h2> 
</div>

[1] Earth System Research Laboratory, Global Monitoring Division. ESRL/GMD FTP Data Finder.<br> &nbsp; &nbsp; &nbsp; &nbsp; Geraadpleegd op 18 augustus 2019 via https://www.esrl.noaa.gov/gmd/dv/data/?category=Greenhouse%2BGases. <br>
[2] Tans, P. (2018). Via e-mail.<br>
[3] Pieter Bruegel the Elder [Public domain], via Wikimedia Commons. Geraadpleegd op 4 september 2019 via <br> &nbsp; &nbsp; &nbsp; &nbsp;  https://commons.wikimedia.org/wiki/File:Pieter_Bruegel_the_Elder_-_Hunters_in_the_Snow_(Winter)_-_Google_Art_Project.jpg<br>
[4] Ahn, J., Brook, E.J., Mitchell, L.E., Rosen, J.C., McConnell, J.R., Taylor, K.C., Etheridge, D.M., & Rubino, M. (2012).<br> &nbsp; &nbsp; &nbsp; &nbsp; Atmospheric CO$_{2}$ over the last 1000 years: A high‐resolution record from the West Antarctic Ice Sheet (WAIS) Divide ice core.<br> &nbsp; &nbsp; &nbsp; &nbsp; *Global Biochemical Cycles.* Vol. 26. doi: 10.1029/2011GB004247. <br>
[5] Mann, M.E. (2002). Little Ice Age.<br>
[6] GISS Surface Temperature Analysis. Geraadpleegd op 4 september 2019 via <br> &nbsp; &nbsp; &nbsp; &nbsp; https://data.giss.nasa.gov/gistemp/graphs_v4/customize.html

<img src="../.images/cclic.png" alt="Banner" align="left" style="width:80px;"/><br><br>
Notebook KIKS, zie <a href="http://www.aiopschool.be">ai op school</a>, van F. wyffels & N. Gesquière is in licentie gegeven volgens een <a href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 4.0 Internationaal-licentie</a>. 