Welkom bij deze tutorial voor Jupyter notebooks. Hierin worden de basics voor een notebook (de omgeving) en Python (de hier gebruikte programmeertaal) niet alleen uitgelegd, je kan er ook zelf mee aan de slag gaan, want dit hele document is volledig interactief!

# Wat is een Jupyter notebook?

In deze lessenreeks zullen we per cursusonderdeel werken in een Jupyter notebook. Een notebook is een omgeving, waarin zowel code kan geschreven en uitgevoerd worden, als tekst en figuren kunnen worden gebruikt, wat dit een ideale tool maakt voor rapportage. Alle bouwstenen worden in afzonderlijke cellen geplaatst (ook deze paragraaf is een cel!) en vormen samen de notebook. Om een cel te selecteren en de inhoud ervan te wijzigen, klik je eenvoudig op de cel (voor een cel van het type markdown, zoals deze paragraaf, dien je te dubbelklikken om toegang te krijgen tot de teksteditor). De inhoud van een geselecteerde cel wordt uitgevoerd door vanuit deze cel de toetsencombinatie **Shift + Enter** te drukken. Probeer dit gerust al eens uit op deze paragraaf!

Bovenaan zie je twee werkbalken. De onderste werkbalk bevat enkel shortcuts voor bewerkingen die ook met de bovenstaande werkbalk op te roepen zijn, en is voldoende voor het meeste werk in deze cursus. Probeer zelf even een aantal van deze knoppen uit!

Er zijn verschillende mogelijkheden voor de aard van deze cellen: code, markdown, raw text en headings. Je ziet deze types ook terug in de onderste werkbalk bij elke cel die je selecteert, of zelf aanmaakt. We overlopen ze even:

## Code

Hieronder staan twee codecellen, geschreven in de programmeertaal Python (straks meer hierover). Probeer ook deze cellen eens uit te voeren door ze te selecteren, en vervolgens **Shift + Enter** te drukken.

In [None]:
print('Hello world')

In [None]:
getal = 10
print(getal + 5)

De eerste cel voert het commando **print** uit op een stuk tekst, waardoor dit wordt uitgeschreven naar het scherm. De tweede cel creëert een variabele met als waarde 10, en voert nadien het commando **print** uit op het resultaat van de gegeven bewerking, waardoor ook dit naar het scherm uitgeschreven wordt. Maar later meer over variabelen.

 **Belangrijk is dat je elk stuk code in deze notebook even uitvoert, want sommige stukken code zullen enkel werken indien je de voorgaande code hebt uitgevoerd!**

## Markdown

Dit is een Markdown cel, waarbij we gebruik maken van de zogenaamde markdown-syntax, hetgeen werkt zoals een andere tekst-editor. Je kan dingen **vet** maken of *cursief*, etc...

In Markdown kan je ook eenvoudig (Latex) commando's ingeven om wiskundige formules weer te geven (zoals bv. het model dat we in deze cursus zullen gebruiken):
$$\frac{dBZV}{dt}=BZV_{in} - k_1 .BZV$$
$$\frac{dOZ}{dt}=k_2 .(OZ_{sat}-OZ) - k_1 .BZV$$

Ook tabellen zijn mogelijk in Markdown:
 
 Symbool | verklaring
 --- | --- 
 $BZV$      | biologische zuurstofvraag
 $OZ$	    | opgeloste zuurstof
 $BZV_{in}$		  | input BZV
 $OZ_{sat}$		  | saturatieconcentratie opgeloste zuurstof
 $k_1$		      | bacteriële degradatiesnelheid
 $k_2$		      | reäeratieconstante


Je kan ook code schrijven in Markdown, maar dan enkel ter illustratie, deze zal niet worden uitgevoerd:

```python
getal = 12
print getal
```

Mensen die html-kennen, kunnen dat ook gebruiken in cellen van het type Markdown, vermits die syntax ook herkend zal worden (bv. <b> Een vette tekst met &#60;b&#62; </b> of <i>een cursieve tekst met &#60;i&#62; </i>). Voor alle andere mogelijkheden met Markdown, verwijzen jullie graag door naar deze handige Cheatsheet: https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet


## Raw NBConvert

## Heading

Als laatste kunnen ook cellen van het type heading aangemaakt worden, maar zoals Jupyter zal aangeven wanneer je dit doet, zal dit binnenkort verdwijnen, en kan je headers gewoon in Markdown cellen typen als # titel, ## ondertitel, ### onderondertitel etc.

### h3

#### h4

##### h5

# Wat is Python?

Python is een programmeertaal die specifiek geschikt is voor wetenschappelijk programmeren. Dit betekent dat de syntax eenvoudig te lezen is, je heel veel functionaliteiten ter beschikking hebt voor typisch wetenschappelijk werk en er een balans is tussen flexibiliteit en toegankelijkheid. Bovendien is Python volledig gratis en *open source*, zodat je het overal en altijd kan gebruiken voor je werk én het komt met een heleboel krachtige modules voor data-analyse, visualisatie en modelleren, *packages* genaamd.

## Packages

Allereerst, om ervoor te zorgen dat je figuren in deze notebook zullen verschijnen, voer even onderstaande lijn code uit:

In [1]:
%matplotlib inline

Onderstaande code laadt nu een aantal packages in via het commando **import**, waardoor alle functionaliteiten ervan beschikbaar worden.

In [2]:
# Importeren van packages
import matplotlib.pyplot as plt  # package voor plotten
import seaborn       # package voor geavanceerd plotten
import numpy as np   # package voor wiskundige functies
import pandas as pd  # package voor data-behandeling

Merk op dat alle tekst gevolgd door een hashtag (#) in een codecel in het grijs komt te staan. Dit wordt door Python aanzien als commentaar die wat meer uitlegt geeft bij je code, maar die Python gewoon negeert. Het is aan te raden dit zelf veel te doen, zodat je code voor jezelf en voor anderen begrijpbaar wordt.

## Variabelen

In de code zullen we gebruik maken van verschillende types variabelen: *number* (*int* en *float*), *string*, *list*, en *dictionary*

In [None]:
# Een int (integer) is een geheel getal
i = 5

In [None]:
# Een float is een kommagetal
f1 = 5.3
f2 = 6.  # Dit betekent 6.0 (zo kan je Python een geheel getal toch als float laten opslaan)

In [None]:
# Een string is een stuk tekst en wordt aangeven met enkele aanhalingstekens ('')
s = 'Hello world'

In [6]:
# Een list kan verschillende elementen samen bevatten (bv. een int, string en float)
# Een list is steeds geordend, dus de volgorde waarin je de elementen in de lijst
# plaatst is van belang! Merk hierbij op dat Python telt vanaf 0!
l = [123, 'Spam', 1.23]
print(l[0])    # het eerste element van de lijst opvragen (Python telt vanaf 0!)
print(l[-1])   # met een negatieve index wordt van achteraan geteld

123
1.23


In [None]:
# Een dictionary is een niet-geordende tabel, waarbij op een efficiente manier
# keys met values verbonden worden. Het kan gebruikt worden om eenvoudig
# waarden geassocieerd met een naam op te slaan en op te vragen.
# d = {key: value}
d = {'twee': 2, 'een': 1, 3: 'drie'}
print(d['een'])   # de waarde voor de key 'een' op vragen
print(d[3])       # de waarde voor de key 3 opvragen. Bemerk dat dit niet locatie 3 is,
                  # zoals je zou verwachten bij een lijst, want de locatie heeft geen
                  # betekenis in een niet-geordende dictionary

In [None]:
# indien je twijfelt met welk datatype je te maken hebt, kan je de functie type() uitvoeren op een object
type(d)

Onderstaande code maakt nu een variabele aan met als naam *data*, en maakt tenslotte een histogram van deze data met het commando **hist** uit het matplotlib.pyplot package (dat ingeladen werd onder de naam **plt**)

In [None]:
# Een klein voorbeeld: het opstellen van een histogram van een dataset (list van int)
data = [1, 2 , 1, 4, 5, 2, 7, 9, 4, 5, 8, 2, 3, 1, 4, 2, 9, 3, 5]
plt.hist(data, bins=12, cumulative=False, orientation='vertical')

Omdat we de output van de functie **plt.hist()** niet opslaan in een variabele, wordt deze geprint naar het scherm. Merk op dat het commando **output = plt.hist(data, bins=12, cumulative=False, orientation='vertical')** dit niet veroorzaakt, omdat we nu een variabele meegeven waar de output mag naartoe geschreven worden. We kunnen dit printen naar het scherm ook onderdrukken door een **;** toe te voegen achteraan het commando: **plt.hist(data, bins=12, cumulative=False, orientation='vertical');**

Doorheen de lessen zul je steeds meer packages en commando's leren kennen. Het belangrijkste is echter dat je zelf op zoek kan gaan naar de informatie. Enkele belangrijke tips (probeer zelf eens op bovenstaande code):

* De **TAB** toets na het ingeven van de (verkorte) naam van een package (bv. **plt.** en dan TAB de toets indrukken) geeft je de beschikbare mogelijkheden
* De **SHIFT-TAB** combinatie is essentieel om informatie te verkrijgen over een net ingegeven functie (bv. **plt.hist(** en dan SHIFT+TAB indrukken) en geeft je de help-pagina voor die functie met de beschrijving van de elementen die je moet ingeven.
* [Google](http://lmgtfy.com/) geeft meestal wel een antwoord op je vraag, maar [Stack Overflow](http://stackoverflow.com/questions/tagged/python) is er specifiek voor programmeervragen!

## Functies

Naast afzonderlijke bewerkingen, zijn ook functies essentieel bij wetenschappelijk programmeren. Het bakent een bepaalde functionaliteit af die je daarna zelf kan hergebruiken. Hierdoor wordt je onderzoek/werk reproduceerbaar voor anderen en jezelf. Belangrijk is ook dat je steeds zelf een help-tekst voorziet die aangeeft wat de functie doet en hoe je ze gebruikt. Deze help-tekst kan je met behulp van de hashtag ingeven, maar omdat deze tekst al snel lang wordt, wordt er afgesproken dit in een commentaarblok mee te geven, dat afgebakend wordt door 3 dubbele aanhalingstekens (" " ") om te openen, en 3 om te sluiten. Merk op dat deze tekst automatisch gemarkeerd wordt in rood.

Een voorbeeld van een (vrij eenvoudige) functie staat hieronder, die de oppervlakte van een rechthoek berekent bij een gegeven breedte en lengte. De eerste lijn is de functiedefinitielijn, die aangeeft dat we een functie willen beginnen (aangegeven door *def*), gevolgd door de functienaam (hier: *oppervlakteRechthoek*), gevolgd door de inputs van de functie tussen haakjes, gescheiden door komma's (hier: *breedte* en *lengte*). Na de help-tekst komen alle instructies die de input verwerken tot de output, en tot slot wordt de output weergegeven met het commando **return**. Merk op dat de indentatie (het inspringen) aangeeft dat al deze commando's onder de functie *oppervlakteRechthoek* vallen.

In [None]:
def oppervlakteRechthoek(breedte, lengte):
    """
    Functie die de oppervlakte berekent van een rechthoek
    
    Argumenten
    ----------
    breedte : float
        De breedte van de rechthoek
    lengte : float
        De lengte van de rechthoek
        
    Output
    ------
    oppervlakte : float
        De oppervlakte van de rechthoek
    """
    oppervlakte = breedte*lengte
    return oppervlakte

Deze code voert echter niets uit, het bundelt alleen een aantal handelingen (in dit geval slechts 1) in een handig commando voor de gebruiker. Om dit beschikbaar te stellen, voer je éénmalig deze functiedefinitie uit, zodat je functie wordt opslagen in het geheugen. Vanaf nu kan je de functie oproepen m.b.v. zijn naam, zoveel je wenst:

In [None]:
oppervlakteRechthoek(3,4)

In [None]:
oppervlakteRechthoek(6,2.5)

Deze functie is eigenlijk in wezen niet verschillend van de functies **print()** en **plt.hist()** die je eerder gebruikte. Ze is alleen door jezelf geschreven.

Functies wordenpas echt handig wanneer meerdere en complexere commando's een mooi geheel vormen, en toegepast kunnen worden in verschillende situaties. Bestudeer even onderstaande functie:

In [None]:
def mijnDobbel(worpen):
    """
    Functie die een histogram maakt van het aantal ogen,
    na een gegeven aantal worpen met twee dobbelstenen.
    
    Argumenten
    ----------
    worpen : int
        Aantal worpen met twee dobbelstenen
    """
    steen1 = np.random.uniform(1, 6, worpen) # random resultaten van de eerste dobbelsteen
    steen2 = np.random.uniform(1, 6, worpen) # random resultaten van de eerste dobbelsteen
    ogen=steen1+steen2                       # resultaten van de worpen
    myhist = plt.hist(ogen, bins=12)         # histogram van de worpen

Om een experiment uit te voeren waarbij je 100 keer met een paar dobbelstenen gooit en de verdeling van de resultaten wil onderzoeken:

In [None]:
mijnDobbel(100)

Een functie accepteert dus input(s), en produceert output(s). Toch is geen van beide echt noodzakelijk. Je kan dit al opmerken bij de functie *mijnDobbel*, die geen **return** statement heeft, en dus technisch gezien ook geen output.

In [None]:
def functie1(ikbeninput):
    """
    Functie met 1 input, geen outputs
    """
    print(ikbeninput)

In [None]:
def functie2():
    """
    Functie zonder inputs, met één output
    """
    return 'ikbenoutput'

---
<h3><font color="#FFA500">Opdracht</font></h3>

Test onderstaande opdrachten één per één in de cel hieronder. Merk op dat sommige opdrachten een foutmelding kunnen geven. Probeer in dat geval de foutmelding te ontcijferen.
* Wat gebeurt er indien je functie1 oproept met 1 input?
* Wat gebeurt er indien je functie1 oproept zonder input?
* Wat gebeurt er indien je functie2 oproept met 1 input?
* Wat gebeurt er indien je functie2 oproept zonder input?
* Wat gebeurt er indien je functie2 oproept als a=functie2()?

In [None]:
# Test in deze cel je antwoorden (de tweede opdracht is hier als voorbeeld ingevuld)
functie1()

Je merkt dat sommige commando's uitmonden in een *error* boodschap. Dit is volkomen normaal wanneer je programmeert, het komt er alleen op aan de melding te lezen en te proberen begrijpen om het probleem te verhelpen.

---

# Interactiviteit via notebooks

Notebooks maken het ook mogelijk om snel zaken interactief te maken op basis van de interact-functionaliteit. Hiervoor laden we eerst het juiste pakket in.

In [None]:
from ipywidgets import interact, fixed

In [None]:
interact(oppervlakteRechthoek, breedte=fixed(3), lengte=(2, 50));

De echte meerwaarde zit hem echter in de interactiviteit van de plots:

In [None]:
interact(mijnDobbel, worpen=(20, 100));

Tot slot kan een notebook opgeslaan worden (doe dit regelmatig indien je aanpassingen maakt), maar ook geëxporteerd worden als html, pdf of Python file (zie *File > Download as*). Pas tot slot deze notebook gerust aan naar je eigen noden, om er je eigen naslagwerk van te maken! Happy computing!

# Extra informatie

Wil je meer weten over de Python programmeertaal? Hieronder vind je enkele handige links die je op weg helpen:

https://docs.python.org/3.6/tutorial/

https://www.codecademy.com/learn/python

http://docs.python-guide.org/en/latest/intro/learning/