# Python Basics

Deze training is opgezet in een Jupyter Notebook. Het draaien van een cel gebeurd met Ctrl+Enter (of Shift+Enter als je direct naar de volgende cel wil).

## Inleiding

[Python](https://www.python.org/) is een (high level) programmeertaal die begin jaren 90 ontworpen en ontwikkeld werd door Guido van Rossum, destijds verbonden aan het Centrum voor Wiskunde en Informatica in Amsterdam. Het doel was om een taal te ontwikkelen die beter leesbaar is. Inmiddels wordt Python veelvuldig gebruikt in zowel back-end als front-end toepassingen als:
- Scripting en automatisatie
- GUI Apps
- Web development
- Wiskunde & fysica
- Machine Learning & A.I.
- Data Analyse & web scraping
- Eenvoudige games

#### Voor- en nadelen van Python

|Voordelen|Nadelen|
|:--|:--|
|Open source inclusief grote community|Scripttaal => interpretatie tijdens runtime en daardoor niet zo snel als low level programmeertaal als C/C++|
|Gebruiksvriendelijk en makkelijk te leren => snellere ontwikkelingstijd|Dynamische typering => veel vrijheid, maar ook verantwoordelijkheid als je iets maakt met Python|
|Krachtige (en uitgebreide) standard library|Niet alle libraries even stabiel|
|Schaalbaar||

Het gedachtegoed van Python is vastgelegd in een 'Easter egg':

In [None]:
import this

## Syntax

In Python zijn er een aantal karakters(combinaties) welke een bijzonder functie hebben. Dit zijn de meest gebruikte:
- `#` : commentaar toevoegen aan je code. Dit kan ook voor meerdere regels met `''' '''`. 
- `!` : Direct Python aanroepen in je notebook.
- `'..'` of `".."` : Tekst in je code.
- `\n`: Enter, oftewel nieuwe regel in een print statement. Sowieso bij `\` moet je altijd even opletten. In print statements betekent dit vaak een bijzonder karakter. 

Python is een taal die op verschillende manieren om kan gaan met code welke op de volgende regel verder gaat. Te denken aan:
- Hardcoded aangeven dat de code op de volgende regel erbij hoort met `\`
- Een lijst afbreken en doorgaan op een nieuwe regel.
- Parameters in een functie door laten gaan op een nieuwe regel. 

Als laatste bij syntax is het goed om te weten dat er verschillende 'operators' zijn. Dit zijn karakters die helpen om bepaalde vergelijkingen of toekenning te doen. Denk hierbij aan:
- Arithmetic operators: Wiskundige berekeningen als `+`, `-`, `*`, `/`, `**`, `%`, `//`, etc.
- Assignment operators: Om een waarde toe te kennen aan een object als `=`, `+=`, `-=`, etc.
- Comparison operators: Om objecten te vergelijken als `==`, `!=`, `>`, etc.
- Logical operators: Toepassen van logica als `and`, `or`, `not`, etc.
- Identity operators: Om te vergelijken als `is`, `is not` etc.
- Membership operators: Om te controleren of item voorkomt als `in`, `not in`, etc.
- Bitwise operators: Om (binair) logica toe te passen als `&` (and), `|` (or), `~`(not), `^` (xor), etc.

Hieronder een aantal voorbeelden van de materie behandeld in dit hoofdstuk:

In [None]:
# Ophalen Python versie welke nu gebruikt wordt
!python --version

In [None]:
print("Print statement door laten gaan op \nde volgende regel.")

print("Printen van een bijzonder karakter: \a")

In [None]:
# Gebroken regels code door een backslash
a = 7 * 3 + \
5 / 2

# Gebroken regels code bij een lijst
b = [1, 2, 3, 'a', 
    'b', 'c']

# Gebroken regels code bij een functie
c = range(1,
          11)

# Printen van bovenstaande toekenning aan variabelen. 
print(a, b, c)

In [None]:
# Assignment operators
x = 3
print(f"De waarde van x is: {x}")

x += 10
print(f"De waarde van x is geworden: {x}")

# Comparison operators
y = 8
print(f"Zijn x en y hetzelfde? {x==y}")

print(f"Is x groter dan y? {x>y}")

print(f"Zijn x en y ongelijk aan elkaar? {x!=y}")

## Datatypen

Python kent de volgende (built-in) datatypen:

|Categorie|Datatypen|Voorbeelden|
|:--|:--|:--|
|Text Type|`str`|`"Text"`, `'text'`, `"Een zin kan ook"`|
|Numeric Types|`int`, `float`, `complex`|`5`, `5.5`, `5+1j`|
|Sequence Types|`list`, `tuple`, `range`|`[1, 2, 'a', 'b']`, `(1, 2, 'a', 'b')`, `range(6)`|
|Mapping Type|`dict`|`{"Numeric":1, "String": "Tekst", "List":[1, 2, 3], "Dictionary":{"Nog iets":"Anders"}}`|
|Set Types|`set`, `frozenset`|`{"appel", "banaan", "kers"}`, `frozenset({"appel", "banaan", "kers"})`|
|Boolean Type|`bool`| `True`, `False`|
|Binary Types|`bytes`, `bytearray`, `memoryview`|`b"Hello"`, `bytearray(5)`, `memoryview(bytes(5))`|
|None Type|`NoneType`|`None`|

Welk type gebruikt wordt, kun je achterhalen door de functie `type()`. Wat een 'functie' is wordt later toegelicht.

Het aanmaken van een object in Python kan op twee manieren:

* `a = int(8)`  --> Hiermee declareer je inclusief hardcoded vastzetten dat het om een integer gaat.

of

* `a = 8`  --> Hiermee declareer je een variabele en bepaald Python zelf welk datatype dit zal zijn. 

Ook bij het inlezen van datasets zal Python (zonder declaratie) een poging doen om dit te bepalen. Je moet er dus op bedacht zijn of dit in alle gevallen goed gaat. 

#### Opgaven
Om een beetje gevoel te krijgen bij de werking en toepassing datatypen, een aantal opgaven:
- a. Maak een twee teksten aan `tekst1 = "Eerste deel"` en `tekst2 = "Tweede deel"`. Wat gebeurd er bij `tekst1+tekst2`?
- b. Maak een variabele x met een integer (int) en een variabele y met een list. Controleer of x in y zit met een operator. 
- c. Voeg een item toe aan variable y (de lijst).
- d. Maak een tuple `t` aan. Kun je items toevoegen aan de tuple?
- e. Hoe vraag je het 3e element op van een tuple?
- f. Maak de volgende variabele aan `bereik = range(2, 20, 2)`. Wat zou de uitkomst zijn van `bereik[5]`? Wat is het laatste getal in dit bereik?
- g. Maak een variabele 'dict_ik' met dictionary van jezelf met 'Voornaam', 'Achternaam', 'Leeftijd'. 
- h. Voeg 'Woonplaats' toe aan de dictionary.

In [None]:
# Plaats hier je code, vervang de x tussen de {} voor het antwoord.

# Voorbeeld bij optelling twee variabelen:
x = 5
y = 6
print(f"\n Antwoord voorbeeld: {x+y}")

print(f"\n Antwoord a: {x}")

print(f"\n Antwoord b: {x}")

print(f"\n Antwoord c: {x}")

print(f"\n Antwoord d: {x}")

print(f"\n Antwoord e: {x}")

print(f"\n Antwoord f: {x} en {x}")

print(f"\n Antwoord g: {x}")

print(f"\n Antwoord h: {x}")

In [None]:
# EXAMPLE OF A SOLUTION
#             ###
#             ###
#             ###
#           #######
#            #####
#             ###
#              #
#
#                   ###
#                   ###
#                   ###
#                 #######
#                  #####
#                   ###
#                    #
#             ###
#             ###
#             ###
#           #######
#            #####
#             ###
#              #
#
#                   ###
#                   ###
#                   ###
#                 #######
#                  #####
#                   ###
#                    #

In [None]:
# Antwoorden, lees ook comments door voor nog een aantal belangrijke lessen!

# a. Samenvoegen van teksten
tekst1 = "Eerste deel"
tekst2 = "Tweede deel"
print(f"\n Antwoord a: {tekst1+tekst2}") # "Eerste deelTweede deel" Teksten kun je dus samenvoegen met een '+'. 

# b. Controleren of item voorkomt in list
x = 5
y = [2, 3, 4, 'a', 'b']
print(f"\n Antwoord b: {x in y}") # False

# c. Voeg item toe aan list y
y = y + [1]
print(f"\n Antwoord c: {y}") # Belangrijk: Volgorde blijft bewaard!

# d. Maak en voeg item toe aan tuple
t = (1, 2, 'a', 'b')
# Een tuple kan niet rechtstreeks veranderd worden. Tuples zijn 'immutable'. 
# Je kunt een tuple alleen aanpassen op een indirecte manier. 
# Na bepalen van datatype 'tuple' is deze weer niet te wijzigen.
t = tuple(list(t)+['c'])
print(f"\n Antwoord d: {t}")

# e. Vraag het 3e element uit de tuple op
print(f"\n Antwoord e: {t[2]}") # Python hanteert het volgende voor een reeks in een object: 0, 1, 2, 3, ...

# f. Wat is het 5e element en het laatste element uit range(2, 20, 2)?
bereik = range(2, 20, 2)
print(f"\n Antwoord f: {bereik[5]} en {bereik[8]}") # [2, 4, 6, 8, 10, 12, 14, 16, 18]

# g. Maak een dictionary dict_ik met de gegevens 'Voornaam', 'Achternaam', 'Leeftijd'
dict_ik = {'Voornaam': "Maikel", 'Achternaam': "Jonkers", 'Leeftijd': 42}
# Een dictionary heeft 'key' en 'values'. De 'key' is altijd een string. 
# De 'value' behorende bij de 'key' kan elk Python object zijn (str, int, list, dict, pd.DataFrame, ...)
print(f"\n Antwoord g: {dict_ik}") 

# h. Voeg aan de dictionary dict_ik een item toe
dict_ik['Woonplaats'] = "Veghel"
print(f"\n Antwoord h: {dict_ik}") # Het oproepen van een waarde gebeurd vergelijkbaar, bijvoorbeeld: 'dict_ik['Voornaam']'

## Loops

Vrijwel elke programmeertaal kent het principe loops. Het wordt gebruikt om een bepaalde bewerking(en) meerdere keren te herhalen totdat aan een specifieke voorwaarde is voldaan. Het wordt voornamelijk gebruikt om repetitieve taken te automatiseren. Qua vorm is een loop te herkennen aan het inspringen van de regels. Alle code binnen deze inspringing behoort tot de loop en wordt alleen uitgevoerd als aan de voorwaarde voldaan is. Of, in eenvoud:

    loop-vorm <voorwaarde>:
        # code met inspringing
        # dit wordt uitgevoerd als aan voorwaarde voldaan is
    # Deze wordt pas uitgevoerd is als de loop ten einde is. 

#### if loop
Een 'if-loop' is een loop waarbij een bepaalde vergelijking gecontroleerd wordt. Als die vergelijking 'WAAR' is, dan wordt een opdracht uitgevoerd. De loop zelf kan uitgebreid worden met `else` en `elif` statements om ook alternatieve opties te definiëren. 

Voorbeeld:

    x = 25
    y = 30
    if x > y:
        print("x is groter dan y")
    elif x>20 & y<=31:
        print("x is groter dan 20 en y is kleiner of gelijk aan 31")
    else:
        print("Print dit maar als het bovenstaande niet waar is")

Bij dit voorbeeld zal de print statement `"x is groter dan 20 en y is kleiner of gelijk aan 31"` zijn. 

#### while loop
Een if-loop wordt vaak eenmalig doorlopen bij aanroepen code. De opdrachten uit de while-loop worden net zo lang uitgevoerd totdat een bepaalde voorwaarde geldig is. **Belangrijk:** Denk goed na over de voorwaarde! Het foutief kiezen van de voorwaarde kan immers leiden tot het 'oneindig' lang blijven draaien van je programma. 

Voorbeeld:

    x = 0
    while x < 5:
        print(x)
        x = x + 1
        
Dit voorbeeld levert de volgende print statement op:

    0
    1
    2
    3
    4


#### for loop
De while-loop kent dus een risico. De meeste concepten die je in een while loop wilt toepassen, zijn ook in een for loop te programmeren. Het voordeel van een for loop is dat deze meer gecontroleerd is dan een while loop. Je geeft nadrukkelijker mee welke grenzen er zijn. 

Voorbeeld:

    lijst_namen = ['Edwin', 'Erik  ', 'Gerard', 'Joris', 'Kamiel', 'Luuk', 'Maik', 'Maikel', 'Murat', 'Olger', 'Stefan']
    for x in lijst_namen:
        if len(x)>5:
            print(x)

Dit levert alle namen op welke meer dan 5 characters bevatten, dus ook 'Erik  '. Later komen we nog op een standaard package wat meer mogelijkheden biedt met tekst. Mocht je het resultaat meteen in een lijst willen, kan dit ook met een zogenaamde 'list comprehension':

    [x for x in lijst_namen if len(x)>5]
    
Resultaat:

    ['Erik  ', 'Gerard', 'Kamiel', 'Maikel', 'Stefan']
        

#### Bijzondere statements in loops
Binnen in de loops kunnen statements toegevoegd worden welke het resultaat beinvloeden:
- `continue` : Doorgaan naar volgende iteratie (begin van loop, volgende in de reeks)
- `break` : Direct verlaten van de loop

Voorbeeld `continue`:

    for n in "abcdef":
        if n =="a" or n =="d":
           continue
        print("letter :", n)
        
Resultaat:

    letter : b
    letter : c
    letter : e
    letter : f
        
Voorbeeld `break`:

    for n in "abcdef":
    if n =="c" or n =="d":
       break
    print("letter :", n)
    
Resultaat:

    letter : a
    letter : b

#### Opgaven
- a. Gebruik loops (zonder bijzondere statements) om het volgende te bereiken: Maak een nieuwe lijst van `lijst = [100, 1, 10, 2, 3, 5, 8, 13, 21, 34, 55, 98]` met alleen maar cijfers groter of gelijk aan 10 en kleiner als 50. 
- b. Schrijf een loop welke het aantal even en oneven cijfers telt in een reeks. 
- c. Schrijf een loop welke de Fibonacci reeks print kleiner dan een bepaald getal 'n' (bijvoorbeeld 50). Fibonacci reeks is: 0, 1, 1, 2, 3, 5, 8, 13, 21, .... (oftewel, 2 voorgaande cijfers bepalen eerstvolgende cijfer). 

Een aantal opgaven zijn [hiervan](https://www.w3resource.com/python-exercises/python-conditional-statements-and-loop-exercises.php) gekopieerd. Er staan er nog meer mocht je interesse hebben. 

In [None]:
# Plaats hier je code

# a. Filter lijst (getal tussen 10 en 50)
lijst = [100, 1, 10, 2, 3, 5, 8, 13, 21, 34, 55, 98]

# b. Tel het aantal even en oneven cijfers in een reeks

# c. Print de Fibonacci reeks tot een bepaald getal n.


In [None]:
# EXAMPLE OF A SOLUTION
#             ###
#             ###
#             ###
#           #######
#            #####
#             ###
#              #
#
#                   ###
#                   ###
#                   ###
#                 #######
#                  #####
#                   ###
#                    #
#             ###
#             ###
#             ###
#           #######
#            #####
#             ###
#              #
#
#                   ###
#                   ###
#                   ###
#                 #######
#                  #####
#                   ###
#                    #

In [None]:
# a. Filter lijst (getal tussen 10 en 50)
lijst = [100, 1, 10, 2, 3, 5, 8, 13, 21, 34, 55, 98]
ondergrens = 10
bovengrens = 50
new_list = []
for i in lijst:
    if i >= ondergrens and i < bovengrens:
        new_list = new_list + [i]
print("\nOpgave a.")
print("De nieuwe lijst is: ", new_list)

# b. Tel het aantal even en oneven cijfers in een reeks
numbers = (1, 2, 3, 4, 5, 6, 7, 8, 9) # Declaring the tuple
count_odd = 0
count_even = 0
for x in numbers:
    if not x % 2:
        count_even+=1
    else:
        count_odd+=1
print("\nOpgave b.")
print("Aantal even cijfers: ",count_even)
print("Aantal oneven cijfers: ",count_odd)

# c. Print de Fibonacci reeks tot een bepaald getal n.
n=50
x,y=0,1
print("\nOpgave c.")
print("Fibonacci reeks:")
print(x)
while y<n:
    print(y)
    x,y = y,x+y

## Functies
Een functie is een blok code welke aangeroepen kan worden met een bepaald doel. In een functie kan je parameters meegeven die nodig zijn om het resultaat te bepalen. 

Functies moet je declareren (definieren en aanroepen) voordat je ze kunt gebruiken. Dit gebeurd met het woord `def`, gevolgd door de naam van de functie, twee haakjes en een dubbele punt. Op de volgende regel is er een inspringing om aan te geven wat tot de functie behoort. De meest eenvoudige vorm is:

    def functie_leeg():
        pass

Binnen de () kun je parameters toevoegen. Dit kunnen open variabelen zijn en variabelen met een default waarde (ook in deze volgorde). Dus, bijvoorbeeld een functie om iemand te groeten:

    def groet(naam, groet="Hallo beste "):
        print(groet+naam)

Tot slot, elke functie is gebouwd met een bepaalde gedachtegang. Zeker bij de ontwikkeling van meerdere functies in een groter project kan die gedachtegang wel eens 'vergeten' worden. Om die reden worden bij functies docstrings toegevoegd. Dit is een kort stukje tekst met een toelichting van de functie.

    def groet(naam, groet="Hallo beste "):
        """Functie om iemand of iets te groeten."""
        print(groet+naam)

Bij het aanroepen van een functie kun je de docstring raadplegen voor informatie. Bij meer ontwikkeling van functies en code komt ook zorgvuldigheid om de hoek kijken. Er is een specifieke training die wat meer in gaat over stijl bij coderen en docstrings (PEP-8 & docstrings). 

#### Opgaven
- a. Schrijf een functie welke de som van een reeks berekend. 
    Voorbeeldreeks : (8, 2, 3, 0, 7)
    Verwacht antwoord: 20
- b. Voor de gevorderde: Schrijf een recursieve functie (functie die zichzelf aanroept). De functie moet de som bepalen van een getallenreeks (bijv. van 0 tot 10, verwacht antwoord is 55). 

Ook hierin zijn veel oefeningen on line te vinden. De bovenstaande zijn gehaald van [deze website](https://www.w3resource.com/python-exercises/python-functions-exercises.php).

In [None]:
# a. Maak functie die nummers in reeks sommeert


# b. Maak functie die som berekend van reeks tussen twee getallen.


In [None]:
# EXAMPLE OF A SOLUTION
#             ###
#             ###
#             ###
#           #######
#            #####
#             ###
#              #
#
#                   ###
#                   ###
#                   ###
#                 #######
#                  #####
#                   ###
#                    #
#             ###
#             ###
#             ###
#           #######
#            #####
#             ###
#              #
#
#                   ###
#                   ###
#                   ###
#                 #######
#                  #####
#                   ###
#                    #

In [None]:
# a. Maak functie die nummers in reeks sommeert
def sum_numbers(numbers):
    total = 0
    for x in numbers:
        total += x
    return total

print("\nOpgave a.")
print(f"Antwoord sommeer functie: {sum_numbers((8, 2, 3, 0, 7))}")

# b. Maak functie die som berekend van reeks tussen twee getallen.
def recursive_sum(num_lower, num_upper):
    if num_upper>num_lower:
        # call same function by reducing number by 1
        return num_upper + recursive_sum(num_lower = num_lower, num_upper=num_upper - 1)
    else:
        return num_lower
    
res = recursive_sum(num_lower=0, num_upper=10)
print("\nOpgave b.")
print(f"Antwoord recursieve functie: {res}")

## Libraries

Een functie een specifieke toepassing (object) voor een bepaald doel. Van de objecten die er zijn, kun je natuurlijk stellen dat er een bepaalde rangorde is, waarbij de hoogste rangorde een library (of package) is. Dit laat zich wellicht het best illustreren aan de hand van een tabel:

|Object|Voorbeeld|Toelichting|
|:--|:--|:--|
|package/library|`statsmodels`|Dit is een library met functionaliteiten rondom statistiek||
|module|`statsmodels/statsmodels/regression/linear_model.py` |Binnen de library `statsmodels` zitten meerdere modules (Python Scripts) voor diverse statistische berekeningen.|
|class|`RegressionModel` oftewel `from statsmodels.statsmodel.regression.linear_model import RegressionModel`|In de module `linear_model` zit een class `RegressionModel`. In deze class zitten meerdere functies met betrekking tot regressie modellen.|
|function|`get_distribution(self, params, scale, exog=None, dist_class=None)`|In de class `RegressionModel` zit bijvoorbeeld de functie `get_distribution` om een distributie te construeren.|
|variable/ attribute|`x=5` of `params`|Object waarvan waarde aangepast kan worden|
|constant|`5` of `"a"`|Object met een vaste waarde|

Een library of package moet je beschikbaar hebben binnen je de software-omgeving waar je werkzaam bent. Packages kun je installeren via package managers als `pip` en `conda`. Doorgaans laad je een library (met bijbehorende functionaliteiten) in als volgt:

`import package` Hiermee laadt je alle functionaliteiten ineens.

of 

`from package.groep.module import class` Hiermee laadt je alleen de class met bijbehorende functies, kost minder geheugen.


### Standard libraries
Bij het installeren van Python worden een aantal standaard libraries geïnstalleerd. Deze libraries zijn veelal geprogrammeerd in CPython en dus goed geoptimaliseerd (en snel). Daarnaast worden deze goed onderhouden door de community. De belangrijkste zijn:
- `time`: Module met voor het weergeven van tijden.
- `datetime`: Module voor het rekenen met tijden.
- `sys`: Module voor toegang/manipulatie van de de Python Runtime Environment.
- `os`: Module voor communicatie met het OperatingSystem.
- `math`: Module voor wiskundige berekeningen.
- `random`: Module voor genereren random reeksen.
- `pickle`: Module voor het serialiseren of deserialiseren van Python objecten.
- `urllib`: Module voor het benaderen van websites.
- `re`: Module voor ondersteuning bij regular expressions (matchen tekst).
- `cgi`: Module met standaarden voor data interactie tussen webserver en routine script.



### Third Party Libraries

Er zijn ontzettend veel libraries met allerlei verschillende functionaliteiten. Zeker bij een actieve community als bij Python zijn er voor heel veel vraagstukken al packages beschikbaar. Denk bijvoorbeeld aan:
- Package management: `pip`, `conda`
- Data toegang/ophalen: `SQLAlchemy`, `Pillow`, `BeautifulSoup`, etc.
- Netwerktoegang: `PyArrow`, `Scrapy`, `Requests`, etc.
- Data representatie/bewerking: `numpy`, `pandas`, `polars`, `spaCy`, `NLTK`, etc.
- Visualisaties: `matplotlib`, `seaborn`, `plotly`,  `bokeh`, etc.
- Analysis/Machine learning/Deep learning: `statsmodels`, `scikit-learn`, `keras`, `theano`, `TensorFlow`, `PyMC3`, etc.
- Spatial analysis: `shapely`, `geopandas`, etc.
- Applicatie frameworks: `Project Jupyter`, `flask`, `PySpark`, etc.

**BELANGRIJK:** Open source is mooi, maar kent ook risico's. Check ten alle tijden hoe volwassen een package is en hoe goed deze onderhouden is. Iedereen kan packages aanleveren, maar dat wil niet zeggen dat je deze foutloos/risicoloos kunt blijven gebruiken.

#### Illustratieve voorbeelden
Het gaat te ver om van de packages alle functionaliteiten te laten zien of om daarover opgaven toe te voegen. Het beste is bij een specifiek vraagstuk te zoeken naar welke package je ervoor nodig hebt. De opgaven tot nu toe waren echter vooral reken-voorbeelden. Het is goed om nog wat andere voorbeelden te illustreren (op basis van built-in packages).

In [None]:
import time
import datetime, pytz
import sys
import os
import re

In [None]:
# time: rekenen / bepalen tijden en tijdzones. Hier slechts een aantal voorbeelden:

print(f"Start van rekenen met tijd (epoch): {time.gmtime(0)}\n") # Vanaf hier worden alle seconden geteld (als float)
print(f"Huidige tijd (in seconden vanaf epoch): {time.time()}\n")
print(f"Huidige tijd (in notatie van besturingssysteem): {time.ctime()}\n")
print(f"Tijdzone is (met zomer-/wintertijd): {time.localtime().tm_zone}\n")

In [None]:
# datetime: Voor het aanmaken / bewerken / omzetten van tijden. Een aantal voorbeelden:

print(f"Huidige tijd: {datetime.datetime.now()}\n")
print(f"Aanmaken datum: {datetime.date(year=2020, month=1, day=31)}\n")
print(f"Aanmaken tijd: {datetime.time(hour=13, minute=14, second=31)}\n")
print(f"Aanmaken datumtijd: {datetime.datetime(year=2020, month=1, day=31, hour=13, minute=14, second=31)}\n")
print(f"Verkort aanmaken datumtijd: {datetime.datetime(2023,5,1,12,0,0,0)}\n")
print(f"Aanmaken datumtijd incl. tijdzone: {datetime.datetime(2023,5,1,12,0,0,0, pytz.UTC)}\n")
date_string = "01-31-2020 14:45:37"
format_string = "%m-%d-%Y %H:%M:%S"
print(f"Omzetten tekst naar tijd: {datetime.datetime.strptime(date_string, format_string)}")

In [None]:
# sys: Deze package geeft de mogelijkheid om te kijken naar software (in gebruik) en instellingen. 
# Hieronder een aantal voorbeelden

# Mogelijkheid om (in je omgeving) te achterhalen waar Python kijkt naar programmatuur. 
print(f"Print de lijst met locaties welke gebruikt worden om modules te laden:")
print(*sys.path, sep='\n')
# met sys.path.append() kun je daar locaties aan toevoegen

# Of om te achterhalen in welk operating system je werkzaam bent:
print(f"\nHuidig operating system is: {sys.platform}")

print(f"\nAchterhalen van de gebruikte encoding: {sys.getdefaultencoding()}")

# Nog een aantal belangrijke om te onthouden: 
# sys.exit() : Deze kun je gebruiken om veilig een programma te beeindigen. 
# sys.exc_clear() : Deze kun je gebruiken om geheugen vrij te maken.

In [None]:
# os: Package om te navigeren/bewerken/... binnen je Operating System. 
# Je vindt hier ook veel bash en command prompt commando's (o.a. chdir, mkdir).

# Dit werkt niet in Google Colab, wel lokaal in bijvoorbeeld Jupyter Notebook
# path = "C:/"
# print(f"All files in C:/ are: {os.listdir(path)}\n")

cwd = os.getcwd()
print(f"Current working directory path: {cwd}")

In [None]:
# re: Package om makkelijk te zoeken in teksten en te zoeken/filteren/bewerken op bepaalde elementen.
# Dit kan zowel op een tekst als op een lijst met tekst als op een kolom met tekstvelden. 

tekst = """
‘Mijn ontslag’
Ik dien bij deze mijn ontslag in als volwassene. Ik heb besloten de verantwoordelijkheid te nemen 
van een kind van 8 jaar oud.

Ik wil weer denken dat Skittles beter zijn dan geld, omdat je het kunt eten. En dat McDonald’s een 
4 sterren restaurant is. Ik wil terug naar een tijd waarin het leven eenvoudig was. Een leven 
vol kleuren, kinderliedjes, springen in de plassen en baggeren door de modder. Een wereld waarin 
je gelukkig bent omdat je onwetend bent van alle zorgwekkende dingen.

Ik wil denken dat de wereld eerlijk is. Dat iedereen eerlijk is en goed. Ik wil geloven dat alles 
mogelijk is. Ik wil simpel leven. Ik wil weer geloven in de kracht van de glimlach, knuffels, een 
vriendelijk woord, waarheid, rechtvaardigheid, vrede, dromen, verbeelding.

Dus bij deze dien ik mijn ontslag als volwassene in. En als je het hier niet mee eens bent, dan 
ren maar achter me aan, want… tikkie, jij bent um!
"""

# Filter alle cijfers
regex_cijfers = r'\d'
cijfers = re.findall(regex_cijfers,tekst)
print(f"De cijfers in deze tekst zijn:\n {cijfers}\n")

# Filter alle woorden beginnend met hoofdletter
regex_hoofdletter_woorden = r'(?<!^)(?<!\. )[A-Z][a-z]+'
Hoofdletter_woorden = re.findall(regex_hoofdletter_woorden,tekst)
print(f"De woorden beginnend met hoofdletter zijn:\n {Hoofdletter_woorden}\n")

# Haal alle elementen onderscheiden van een spatie eruit
regex_spatie ='\s'
alle_woorden_en_karakters = re.split(regex_spatie,tekst)
print(f"Alle elementen in tekst:\n {alle_woorden_en_karakters}\n")

# Verwijder alle 'enters'
regex_enter ='\n'
tekst_zonder_enters = re.sub(regex_enter,' ',tekst)
print(f"Tekst zonder enters ziet er als volgt uit:\n {tekst_zonder_enters}\n")

# Vervang tekst
tekst_met_vervanging = re.sub('Skittles',"M&M's",tekst[:200])
print(f"Fragment tekst waarbij Skittles vervangen is door M&M's: {tekst_met_vervanging}...\n")

## Referentiemateriaal:
- [W3 Schools Python](https://www.w3schools.com/python/)
- [Regex 101](https://regex101.com/)