# Requests

## Inleiding

De `requests`-bibliotheek is een elegante en simpele HTTP bibliotheek voor Python. Met `requests` kunnen heel eenvoudig HTTP/1.1-verzoeken verstuurd worden. Het is niet nodig om handmatig queryreeksen aan de URL's toe te voegen of om POST-gegevens te coderen. `Keep-alive` en HTTP-verbindingspooling zijn 100% automatisch, dankzij `urllib3`.

Het ophalen en analyseren van online data wordt overzichtelijk gefaciliteerd dankzij deze bibliotheek:

```python
r = requests.get('https://api.github.com/user', auth=('user', 'pass'))
r.status_code
>>> 200
r.headers['content-type']
>>> 'application/json; charset=utf8'
r.encoding
>>> 'utf-8'
r.text
>>> '{"type":"User"...'
r.json()
>>> {'private_gists': 419, 'total_private_repos': 77, ...}
```

> Het verschil tussen `requests` en `urllib2` wordt [hier](https://gist.github.com/kennethreitz/973705) geïllustreerd.

De volgende zaken worden ondersteund:
- Keep-Alive & Connection Pooling
- International Domains and URLs
- Sessions with Cookie Persistence
- Browser-style SSL Verification
- Automatic Content Decoding
- Basic/Digest Authentication
- Elegant Key/Value Cookies
- Automatic Decompression
- Unicode Response Bodies
- HTTP(S) Proxy Support
- Multipart File Uploads
- Streaming Downloads
- Connection Timeouts
- Chunked Requests
- `.netrc` Support

De `requests`-bibliotheek wordt ondersteund door Python 2.7 en Python 3.6+.

<div class="alert alert-block alert-info">Deze tutorial is een vertaling van de <i>getting started guide</i> op <a href="https://docs.python-requests.org">https://docs.python-requests.org/</a></div>

## Installatie
De `requests`-bibliotheek is niet direct beschikbaar na een standaard installatie van Python. Het is daarom vereist om deze bibliotheek achteraf te downloaden en te installeren. Vervolgens wordt de installatie gecontroleerd.

### PyPy
De eerste manier om `requests` te installeren is door simpelweg het volgende commando uit te voeren in de opdrachtprompt of terminal:

```python -m pip install requests```

### Conda
Als gebruik gemaakt wordt van een virtuele omgevingsbeheerder, zoals Anaconda of Miniconda, is het aangewezen om de installatie van `requests` uit te voeren met het volgende commando. Besteed hierbij de nodige aandacht voor het voorbereiden en activeren van de gewenste *environment*:

```conda install -c anaconda requests```

### Broncode
`requests` wordt nog steeds actief ontwikkeld op [Github](https://github.com/psf/requests), waar de meest recente broncode terug te vinden is. Deze code kan gekloond worden uit de publieke *repository*:

```git clone git://github.com/psf/requests.git```

De tarball (of zipball, voor Windows) kan ook gedownload worden:

```curl -OL https://github.com/psf/requests/tarball/main```

Deze code kan toegevoerd worden aan bestaande Python pakketten, maar kan ook als *site-packages easily* geïnstalleerd worden:

```cd requests```
```python -m pip install .```

### Installatie en versie contoleren
Voer de volgende code uit om de installatie van `requests` te controleren:

```python -c "import requests; print(requests.__version__)"```

<div class="alert alert-warning"><b>Opdracht: </b>Installeer <code>requests</code> en controleer dat de bibliotheek correct geïnstalleerd is.</div>

In [None]:
## UW CODE HIER ##
import requests
print(requests.__version__)

## Aan de slag
In de volgende sectie van het gebruik van `requests` geïllustreerd worden aan de hand van enkele voorbeelden. Hierbij wordt dieper ingegaan op verschillende functies, argumenten en output. Binnen de GeoICT worden dergelijke zaken meer en meer gebruikt om online databronnen aan te spreken.

Vanaf nu worden de volgende zaken verondersteld:
* De `requests`-bibliotheek is successvol geïnstalleerd;
* De `requests`-bibliotheek is up-to-date.

We starten met enkele eenvoudige voorbeelden.

### Een *request* plaatsen
Een *request* plaatsen met `requests` is heel eenvoudig. Hiervoor begin we met het importeren van de module `requests`:

In [None]:
import requests

Laten we nu proberen een webpagina te krijgen. We illustreren dit door een `get`-*request* uit te voeren op de *endpoint* van een simpele HTTP *request* & *response* Service op [https://httpbin.org/](https://httpbin.org). 

In [None]:
r = requests.get('https://httpbin.org')

Nu hebben we een `response`-object genaamd `r`. We kunnen alle informatie die we nodig hebben uit dit object halen. De [status](https://nl.wikipedia.org/wiki/Lijst_van_HTTP-statuscodes) van de *request* kunnen we eenvoudig bekijken door het object rechtstreeks aan te spreken:

In [None]:
r

De eenvoud van de API van `requests` zit hem in het feit dat alle vormen van HTTP-*requests* even vanzelfsprekend zijn. Een HTTP `POST`-*request* voeren we bijvoorbeeld als volgt uit:

In [None]:
r = requests.post('https://httpbin.org/post', data={'key': 'value'})

De andere typen HTTP-*requests* (`PUT`, `DELETE`, `HEAD` en `OPTIONS`) werken op een soortgelijke manier:

In [None]:
r = requests.put('https://httpbin.org/put', data={'key': 'value'})
r = requests.delete('https://httpbin.org/delete')
r = requests.head('https://httpbin.org/get')
r = requests.options('https://httpbin.org/get')

<div class="alert alert-warning"><b>Opdracht: </b>Bestudeer <a href="https://www.w3schools.com/tags/ref_httpmethods.asp">deze website</a> om inzicht te krijgen in het verschil tussen de verschillende HTTP-<i>requests</i>. Eventueel kan <a href="https://www.w3schools.com/tags/ref_httpmessages.asp">deze website</a> ook al bekeken worden voor meer informatie over de verschillende HTTP-<i>response</i>-codes, maar deze komen later nog aan bod.</div>

### Parameters doorgeven aan URL's
Vaak willen we een gegevens verzenden in de queryreeks van de URL, bijvoorbeeld om een specifiek adres op te halen uit de API van [Vlaamse Basisregisters](https://docs.basisregisters.vlaanderen.be/docs/api-documentation.html). Als we de URL manueel zouden opstellen, zouden alle gegevens als sleutel/waarde-paren in de URL ingegeven moeten worden na een vraagteken, bijvoorbeeld `httpbin.org/get?key=val`. Met `requests` kunnen we u deze argumenten opgeven als een `dict` van strings, met behulp van het params-sleutelwoordargument.

Als we bijvoorbeeld de Valentin Vaerwyckweg 1 in Gent willen opzoeken, gebruiken zullen we bijvoorbeeld `gemeentenaam=gent`, `straatnaam=valentin vaerwyckweg` en `huisnummer=1`door moeten geven aan [https://api.basisregisters.vlaanderen.be/v1/adresmatch](https://api.basisregisters.vlaanderen.be/v1/adresmatch). Deze operatie kunnen we als volgt uitvoeren:

In [None]:
import requests
payload = {'gemeentenaam': 'gent', 'straatnaam': 'valentin vaerwyckweg', 'huisnummer': '1'}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)

We kunnen zien dat de URL correct is gecodeerd door de URL af te drukken:

In [None]:
print(r.url)

<div class="alert alert-block alert-info">Houd er rekening mee dat een sleutel in de <code>dict</code>-object met een waarde <code>None</code> niet zal worden toegevoerd aan de  queryreeks van de URL.</div>

<div class="alert alert-warning"><p><b>Opdracht: </b>bekijk het resultaat van bovenstaande voorbeeld (opzoeking van de Valentin Vaerwyckweg 1 in Gent met behulp van <a href="https://api.basisregisters.vlaanderen.be/v1/adresmatch">https://api.basisregisters.vlaanderen.be/v1/adresmatch</a> wanneer we de verschillende HTTP-<i>requests</i> uitvoeren. Om de status te evalueren gebruiken we de <code>status_code</code>-operator.</div>

In [None]:
## UW CODE HIER ##

We kunnen ook meerdere waarden met een bepaalde sleutel doorgeven. Combinaties van meerdere waarden kunnen worden aangemaakt door van gegevens een `list` met `tuples` te maken. Ook kunnen we een `dict`-object voorzien van lijsten met de bijbehorende waarden. We illustreren dit concept door de verwijzing naar de Valentin Vaerwyckweg en de Voskenslaan in Gent op te halen van de API van [Vlaamse Basisregisters](https://docs.basisregisters.vlaanderen.be/docs/api-documentation.html):

In [None]:
payload_tuples = [('gemeentenaam', 'gent'), ('straatnaam', 'valentin vaerwyckweg'), ('straatnaam', 'Voskenslaan')]
r_tupples = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload_tuples)
payload_dict = {'gemeentenaam': 'gent', 'straatnaam': ['valentin vaerwyckweg', 'Voskenslaan']}
r_dict = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload_dict)
r_tupples.text == r_dict.text

<div class="alert alert-warning"><p><b>Opdracht: </b>op de website van de <a href="https://nmbs.be">NMBS</a> kunnen we via een formulier aanbevolen routes opvragen om op een gegeven datum en tijd van het ene naar het andere station in België te gaan. <a href="https://irail.be/">iRail</a> is een <i>open-source</i> platform dat eveneens allerhande data van de NMBS beschikbaar maakt via een API. De API beschikt over een uitgebreide <a href="https://docs.irail.be/">documentatie</a>, waarin verschillende functies besproken worden, zoals <a href="https://docs.irail.be/#stations"><code>stations</code></a>, <a href="https://docs.irail.be/#connections"><code>connections</code></a> of <a href="https://docs.irail.be/#occupancy"><code>occumancy</code></a>. Per functie wordt aangegeven of de serive wordt aangesproken met een <code>GET</code> of <code>POST</code> <i>request</i>. Daarnaast worden de verschillende parameters besproken en wordt telkens een voorbeeld gegeven.<p>
    <p>Gebruik <a href="https://docs.irail.be/#connections"><code>connections</code></a> om de aanbevolen routes te bepalen van Neerpelt naar Gent-Sint-Pieters op zondag 12 december 2021 om 1900h. Maak hiervoor een verwijzing naar de <i>endpoint</i> als een <code>string</code>-object en een <code>dict</code>-object om de verschillende parameters te verwerken. Het volstaat nu om voor het resultaat van de <i>request</i> enkel de URL terug te geven met de <code>url</code>-operator.</p>
</div>

In [None]:
## UW CODE HIER ##

### Inhoud van de *response*
Vanzelfsprekend wordt het gebruik van de `requests`-bibliotheek helemaal zinvol als het mogelijk is om de inhoud van de *response* te lezen. We bekijken dit aan de hand van het resultaat voor de Valentin Vaerwyckweg 1 te Gent volgens de API van [Vlaamse Basisregisters](https://api.basisregisters.vlaanderen.be/v1/adresmatch):

In [None]:
import requests
payload = {'gemeentenaam': 'gent', 'straatnaam': 'valentin vaerwyckweg', 'huisnummer': '1'}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)
r.text

De inhoud van de server zal automatisch gedecodeerd worden door de `requests`-bibliotheek. De meeste Unicode-tekensets zullen zonder problemen gedecodeerd kunnen worden. Wanneer we een *request* uitvoeren, maakt `requests` een redelijk goede inschatting over de juiste codering van het antwoord op basis van de *HTTP-headers*. De tekstcodering die wordt ingeschat door `requests` wordt gebruikt wanneer we de code `r.text` uitvoeren. We kunnen achterhalen welke coderingsverzoeken worden gebruikt (en deze eventueel wijzigen):

In [None]:
r.encoding
r.encoding = 'ISO-8859-1'

Zodra we de codering wijzigen, zal `requests` de nieuwe waarde van `r.encoding` gebruiken wanneer we `r.text` opnieuw aanroepen. Dit is mogelijkst nuttig in situaties waarin we speciale karaktersets moeten toepassen om de inhoud van de *response* correct te verwerken. HTML en XML hebben bijvoorbeeld de mogelijkheid om de codering expliciet te specificeren in hun body. In dergelijke situaties moeten we `r.content` gebruiken om de oorspronkelijke codering te vinden en vervolgens `r.encoding` op deze opnieuw in te stellen. Tot slot gebruiken we `r.text` om het resultaat te controleren.

<div class="alert alert-warning"><p><b>Opdracht:</b> We gaan verder met de vorige oefening. Gebruik opnieuw <a href="https://docs.irail.be/#connections"><code>connections</code></a> om nu de aanbevolen routes te bepalen van Appelterre naar Gent-Sint-Pieters op zondag 12 december 2021 om 1900h. Maak hiervoor een verwijzing naar de <i>endpoint</i> als een <code>string</code>-object en een <code>dict</code>-object om de verschillende parameters te verwerken. Geef het resultaat van <i>request</i> weer door de <code>text</code>-operator te gebruiken.</p>
</div>

In [None]:
## UW CODE HIER ##

### Inhoud van JSON-response
Er is ook een ingebouwde JSON-decoder binnen de `requests` bibliotheek, voor het geval dat we te maken hebben met JSON-gegevens. Een groot aantal services leveren hun data standaard aan in het JSON-formaat. We illustreren deze veelgebruikte methode aan de hand van het eerdere voorbeeld voor de Valentin Vaerwyckweg 1 te Gent:

In [None]:
import requests
payload = {'gemeentenaam': 'gent', 'straatnaam': 'valentin vaerwyckweg', 'huisnummer': '1'}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)
r.json()

Het ophalen van specifieke waarden verloopt zoals we dat gewoon zijn bij het werken met JSON-bestanden in Python. De coördinaten van bovenstaande *request* halen we bijvoorbeeld als volg op:

In [None]:
coordinates = r.json()['adresMatches'][0]['adresPositie']['point']['coordinates']
coordinates
x = coordinates[0]
y = coordinates[1]
print('De coördinaten zijn x: %.2f en y: %.2f' % (x, y))

Indien de JSON-decodering mislukt, genereert `r.json()` een uitzondering. Als het antwoord bijvoorbeeld een [HTTP status 204 (No Content)](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/204) is, of als het antwoord ongeldige JSON-code bevat, zal `r.json()` een `requests.exceptions.JSONDecodeError` opwerpen. Dit specifiek type wrapper-uitzondering maakt interoperabiliteit van meerdere uitzonderingen mogelijk die kunnen worden gegenereerd door verschillende python-versies en json-serialisatiebibliotheken. Deze melding krijgen we bijvoorbeeld wanneer we de zojuist opgehaalde afbeelding proberen om te zetten naar JSON:

In [None]:
import requests
endpoint = "https://tile.informatievlaanderen.be/ws/raadpleegdiensten/wmts"
payload = {"SERVICE":"WMTS", "VERSION":"1.0.0", "REQUEST":"GetTile",\
           "LAYER":"grb_bsk", "STYLE": "", "FORMAT":"image/png",\
           "TILEMATRIXSET":"GoogleMapsVL", "TILEMATRIX":"15",\
           "TILEROW":"10965", "TILECOL":"16721"}
r = requests.get(endpoint, params=payload)
r.json()

Merk op dat het al dan niet succesvol zijn van `r.json()` niets zegt over het daadwerkelijke succes van de *response*. Sommige servers zullen bijvoorbeeld ook een JSON-object terug geven bij een foute *response* (bijvoorbeeld bij een [HTTP status 500 (Internal Server Error)](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/500). Een dergelijke *response* kan wel degelijk omgezet worden naar een geldig JSON-object. Om te controleren of een *request* succesvol is, en dus resulteert in een [HTTP status 200(OK)](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/200), kan de correcte HTTP-status geëvalueerd worden met `r.raise_for_status()` of meer algemeen met `r.status_code`: 

In [None]:
import requests
payload = {'onzin': 'nonsense'}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)
print("HTTP status: %s" % r.status_code)

Het resultaat van een bepaalde *request* kunnen we gebruiken om in bepaalde gevallen een geheel nieuwe URL aan te maken. Dit illustreren we in onderstaande code waarbij we een geojson van het Vlaamse GRB gebruiken als input voor een website die de visualisatie van geojson-bestanden mogelijk maakt:

In [None]:
from requests.utils import requote_uri
def getGBG(fid):
    url = 'https://geoservices.informatievlaanderen.be/overdrachtdiensten/GRB/wfs'
    payload = {'SERVICE':'WFS','REQUEST':'GetFeature','VERSION':'2.0.0',
              'TYPENAMES':'GRB:GBG','featureID':'GBG.' + str(fid),
              'outputFormat':'application/json','srsName':'EPSG:4326'}
    return requests.get(url, params=payload)

url = 'http://geojson.io'
url = url + '#data=data:application/json,' + requote_uri(getGBG(1929586).text)

r = requests.get(url)
print(r.url)

<div class="alert alert-warning"><p><b>Opdracht: </b>Op <a href="https://provincies.incijfers.be">Provincies in Cijfers</a> worden een groot aantal kerncijfers aangeboden met betrekking tot allerhande variabelen op verschillende ruimtelijke niveaus in Vlaanderen. De meeste gebruikers zullen deze website gebruiken om inzicht te krijgen in hun wijk, gemeente, provincie, ... door automatische rapporten te bestuderen, of door tabellen aan te maken via een interactieve omgeving. Het is echter ook mogelijk om specifieke data op te vragen door parameters mee te geven met de URL. Bekijk de <a href="https://provincies.incijfers.be/jive/report/?id=achter_de_schermen#url">handleiding</a> voor meer informatie.</p><p>Maak gebruik van <code>https://provincies.incijfers.be/jive/selectiontableasjson.ashx</code> om de volgende zaken op te vragen voor alle <a href="https://www.vlaanderen.be/gemeenten-en-provincies/provincie-oost-vlaanderen/gent">deelgemeenten van Gent</a> (Gent, Oostakker, Mariakerke, ...):</p><ul>
            <li>Totaal aantal inwoners volgens rijksregister [aantal]</li>
            <li>Eigenaars (t.o.v. huishoudens met gekende eigendomstitel) [%]</li>
            <li>Huurders (t.o.v. huishoudens met gekende eigendomstitel) [%]</li>
    </ul><p>Zoek hiervoor de verschillende NIS-codes op van de deelgemeenten, alsook de codes van de verschillende parameters. Het resultaat van de <i>request</i> wordt op een overzichtelijke manier gevisualiseerd. Hiervoor mag de <code>print</code>-operator gebruikt worden, maar andere technieken zijn uiteraard ook toegestaan.<p>
</div>

In [None]:
## UW CODE HIER ##

<div class="alert alert-warning"><p><b>Opdracht:</b> voor een internationale veldcampagne buiten Europa hebben we een vliegtuig te nemen vanaf Schiphol (Nederland). Op woensdag 15 december 2021 dienen we ten laatste om 1600h op deze luchthaven aanwezig. Gebruik opnieuw de <code>connections</code>-functie van <a href="https://irail.be/">iRail</a> om de aanbevolen verbindingen vanuit Gent Sint-Pieters te bepalen, en geef op overzichtelijke wijze de volgende zaken weer:</p><ul>
        <li>Vertrektijd vanuit Gent</li>
        <li>Eventuele stations waar we moeten overstappen, inclusief de aankomst- en vertrektijden</li>
        <li>Aankomsttijd op Schiphol</li>
    </ul>
</div>

In [None]:
## UW CODE HIER ##

### Binaire *response*-inhoud
We kunnen ook toegang vragen tot de *response* als bytes voor niet-tekstverzoeken. Dit is nuttig als we bijvoorbeeld afbeeldingen willen opvragen, zoals in onderstaande voorbeeld een snede uit het Vlaamse GRB via WMTS:

In [None]:
import requests
endpoint = "https://tile.informatievlaanderen.be/ws/raadpleegdiensten/wmts"
payload = {"SERVICE":"WMTS", "VERSION":"1.0.0", "REQUEST":"GetTile",\
           "LAYER":"grb_bsk", "STYLE": "", "FORMAT":"image/png",\
           "TILEMATRIXSET"
           
           
           :"GoogleMapsVL", "TILEMATRIX":"15",\
           "TILEROW":"10965", "TILECOL":"16721"}

r = requests.get(endpoint, params=payload)
print(type(r.content))

De *response* bevat binaire data (type `byte`) en omvat meer bepaald een afbeelding in het PNG-formaat. Deze afbeelding kunnen we opslaan voor verdere verwerking, maar ook gewoon visualiseren:

In [None]:
from PIL import Image
from io import BytesIO
with open('data/GRB-GRB_BSK.png', mode='wb') as grb_bsk:
    grb_bsk.write(r.content)
i = Image.open(BytesIO(r.content))
display(i)

<div class="alert alert-warning"><b>Opdracht: </b><a href="http://www.geopunt.be/catalogus/webservicefolder/10a61124-ef79-d4f7-07fd-252e-10b7-5aa3-a38d5f8e">Historisch-cartografisch materiaal</a>  van Vlaanderen wordt onder meer aangeboden via <a href="https://geoservices.informatievlaanderen.be/raadpleegdiensten/histcart/wms?request=getcapabilities&version=1.3.0&service=wms">deze WMS</a>. Schrijf Python-code waarmee voor een gegeven adrespunt een <i>bounding box</i> van +/- 500 meter wordt berekend, en waarbij deze rechthoek vervolgens wordt gebruikt om voor dit gebied zowel de <a href="https://www.geopunt.be/catalogus/datasetfolder/2d7382ea-d25c-4fe5-9196-b7ebf2dbe352">Ferraris-kaart</a> als de <a href="https://www.geopunt.be/catalogus/datasetfolder/93795cd6-66d3-4310-83b2-5443adfee403">Vandermaelen-kaart</a> te downloaden PNG.</div>

In [None]:
## UW CODE HIER ##

### Onbewerkte response-inhoud
> Deze sectie heeft de auteur van deze *Notebook* niet kunnen testen in een praktische toepassing.

In het zeldzame geval dat we het raw socket-antwoord van de server willen ontvangen, kunnen we toegang krijgen tot `r.raw`. Indien dit gewenst is, dient `stream=True` in te worden gesteld bij het eerste verzoek. Hieronder wordt een *request* uitgevoerd en worden de eerste 10 bytes gelezen:

In [None]:
import requests
r = requests.get('https://api.github.com/events', stream=True)
r.raw.read(10)

Over het algemeen moeten we echter een patroon gebruiken zoals in onderstaande voorbeeld om de data doe gestreamd op te slaan in een bestand:

In [None]:
r = requests.get('https://api.github.com/events', stream=True)
with open("RawResponseContent.txt", 'wb') as fd:
    for chunk in r.iter_content(chunk_size=128):
        fd.write(chunk)

Het gebruik van `response.iter_content` zal veel afhandelen van wat we anders zelf zouden moeten doen als we `response.raw` rechtstreeks zouden gebruiken. Het wordt daarom aanbevolen om de bovenstaande methode te gebruiken voor het streamen van downloads en het ophalen van de inhoud. Merk op dat de variabele `chunk_size` vrij kan worden aangepast in functie van specifieke toepassingen.

<div class="alert alert-block alert-info">Een belangrijke opmerking over het gebruik van <code>response.iter_content</code> versus <code>response.raw</code> is dat <code>response.iter_content</code> automatisch de gzip zal decoderen en transfer-coderingen leeg zal laten lopen. Aan de andere kant werkt <code>response.raw</code> met een onbewerkte stroom van bytes. Het transformeert de inhoud van de <i>response</i> bijgevolg niet. Indien we echt toegang nodig hebben tot de bytes zoals ze zijn geretourneerd, gebruiken we dus best <code>response.raw</code>.</div>

### Aangepaste *headers*
Als we HTTP-*headers* aan een verzoek willen toevoegen, dienen we eenvoudigweg een `dict` door aan de `headers`-parameter. Dit is bijvoorbeeld interessant wanneer we de [*user-agent*](https://developer.mozilla.org/en-US/docs/Web/HTTP/Headers/User-Agent) mee willen geven, of zoals in onderstaande voorbeeld, om de *response* op te vragen in XML:

In [None]:
import requests
payload = {'gemeentenaam': 'gent', 'straatnaam': 'valentin vaerwyckweg', 'huisnummer': '1'}
headers = {"accept": "application/xml"}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload, headers=headers)
r.text

Het moet worden opgemerkt dat eigen *headers* een lagere prioriteit krijgen dan meer specifieke informatiebronnen. Bijvoorbeeld:
- Autorisatie-*headers* die zijn ingesteld in de `dict`-object met `headers=...` worden overschreven als referenties zijn opgegeven in [.netrc](https://everything.curl.dev/usingcurl/netrc), die op hun beurt worden overschreven door de parameter `auth=`. `requests` naar naar het netrc-bestand op `~/.netrc`, `~/_netrc` of op het pad dat is opgegeven in de NETRC-omgevingsvariabele;
- Autorisatie-*headers* worden verwijderd als we *off-host* worden omgeleid;
- Proxy-autorisatie-headers worden overschreven door proxy-inloggegevens die in de URL zijn opgegeven;
- *Content-Length headers* worden overschreven wanneer we de lengte van de inhoud kunnen bepalen.

Tot slot verandert het gedrag van `requests` helemaal wanneer aangepaste headers zijn opgegeven. De *headers* worden simpelweg doorgegeven in de uiteindelijke *request*.

<div class="alert alert-block alert-info">Opmerking: alle koptekstwaarden moeten een string, bytestring of unicode zijn. Het wordt geadviseerd om te voorkomen dat Unicode-headerwaarden worden doorgegeven, maar dit is niet vereist.</div>

<div class="alert alert-warning"><p><b>Opdracht:</b> met de <a href="https://www.delijn.be/nl/routeplanner">routerplanner van De Lijn</a> kunnen we de aanbevolen routes berekenen tussen twee punten in Vlaanderen. Dergelijke data zijn ook beschikbaar via de API van De Lijn, naast een grote hoeveelheid andere data. Informatie over het gebruik van deze data is <a href="https://data.delijn.be/">hier</a> beschikbaar. Het gebruik van deze service vereist registratie, waarna de gebruiker een API-<i>key</i> toegewezen krijgt. Deze <i>key</i> dient bij iedere <i>request</i> meegestuurd te worden in de <i>header</i>, gekoppeld aan de <code>Ocp-Apim-Subscription-Key</code>-sleutel.</p><p>Gebruik (onder andere) de methodes <code>geefHaltesIndebuurt</code> en <code>geefRouteplan</code> om een overzicht te krijgen in de aanbevole route van Gent Sint Pieters naar de Bijloke-site in Gent op maandag 13 december 2021, met voorzien vertrek om 0800h. Geef het resutaat op een overzichtelijke manier weer.</p>
</div>

In [None]:
## UW CODE HIER ##

### Meer complexe POST-`requests`
Meestal willen we gegevens van de *client* naar de *server* gecodeerd verzenden, zoals bij het opsturen van de inhoud van een [HTML-formulier](https://www.w3schools.com/tags/att_form_method.asp) of voor het doorsturen van parameters via [AJAX](https://api.jquery.com/jquery.ajax/). 

Om dit te doen, geven we eenvoudigweg een `dict`-object door aan het `data`-argument. Dit `dict`-object wordt automatisch in de juiste vorm gecodeerd wanneer de *request* wordt uitgevoerd. In onderstaand voorbeeld gebruiken we een API voor het ophalen van data over [telramen in Vlaanderen](https://telraam.net):

<div class="alert alert-block alert-info">Opmerking: voor het gebruik van <a href="https://telraam.net">https://telraam.net</a> is een API <i>key</i> vereist. Deze kan gratis verkregen worden na registratie op de website.</div>

In [None]:
import requests
url = 'https://telraam-api.net/v1/reports/traffic'
headers = {'X-Api-Key': '<HIER MOET EEN API KEY KOMEN>', 'content-type': 'application/json'}
payload = {'level': 'segments', 'format': 'per-hour','id': '155073','time_start': '2021-12-01 06:00:00Z','time_end': '2021-12-01 09:00:00Z'}
r = requests.post(url, data=payload, headers=headers)
r.json()

<div class="alert alert-block alert-info">Opmerking: zoals bij het <code>params</code>-argument bij een <code>GET</code>-<i>request</i>, kan het <code>data</code>-argument ook meerdere waarden hebben voor een individuele <code>key</code>. Dit is met name handig wanneer het formulier meerdere elementen bevat die dezelfde sleutel gebruiken.</div>

Hoewel we in bovenstaande voorbeeld onze parameters verwerkt hebben in een `dict`, hebben we niet het gewenste resultaat gekregen ([HTTP 400 Bad Request](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/400)). Er zijn namelijk situaties, zoals bij dit voorbeeld, waarbij we gegevens moeten (of willen) verzenden die nog niet in de finale vorm zijn gecodeerd. Als we een `string` doorgeven in plaats van een `dict`, worden die gegevens direct gepost:

In [None]:
url = 'https://telraam-api.net/v1/reports/traffic'
headers = {'X-Api-Key': '<HIER MOET EEN API KEY KOMEN>', 'content-type': 'application/json'}
payload = {'level': 'segments', 'format': 'per-hour','id': '155073',
           'time_start': '2021-12-01 06:00:00Z','time_end': '2021-12-01 09:00:00Z'}
r = requests.post(url, data=str(payload), headers=headers)
r.json()

Het `dict`-object kunnen we ook omzetten in een json-achtige string met behulp van [`json.dumps`](https://docs.python.org/3/library/json.html#json.dumps). Hiermee krijgen we dezelfde resultaten als zojuist:

In [None]:
import json
url = 'https://telraam-api.net/v1/reports/traffic'
headers = {'X-Api-Key': '<HIER MOET EEN API KEY KOMEN>', 'content-type': 'application/json'}
payload = {'level': 'segments', 'format': 'per-hour','id': '155073',
           'time_start': '2021-12-01 06:00:00Z','time_end': '2021-12-01 09:00:00Z'}
r_dumps = requests.post(url, data=json.dumps(payload), headers=headers)
r_str = requests.post(url, data=str(payload), headers=headers)
r_dumps.text == r_str.text

In plaats van de inhoud van het `dict`-object zelf te coderen, kunnen we deze ook direct doorgeven met behulp van de `json`-parameter, dat de inhoud van het `dict`-object automatisch zal coderen:

In [None]:
url = 'https://telraam-api.net/v1/reports/traffic'
headers = {'X-Api-Key': '<HIER MOET EEN API KEY KOMEN>', 'content-type': 'application/json'}
payload = {'level': 'segments', 'format': 'per-hour','id': '155073',
           'time_start': '2021-12-01 06:00:00Z','time_end': '2021-12-01 09:00:00Z'}
r_json = requests.post(url, json=payload, headers=headers)
r_str = requests.post(url, data=str(payload), headers=headers)
r_json.text == r_str.text

<div class="alert alert-block alert-info">Opmerking: de <code>json</code>-parameter wordt genegeerd zodra er gegevens of bestanden worden doorgegeven. Als we de <code>json</code>-parameter in de aanvraag gebruiken, wordt het inhoudstype in de koptekst gewijzigd naar <code>application/json</code>.</div>

<div class="alert alert-warning"><p><b>Opdracht:</b> de <a href="https://openrouteservice.org/">Openrouteservice-API</a> biedt wereldwijde ruimtelijke diensten door gebruik te maken van <a href="https://www.openstreetmap.org">OpenStreetMap</a>. Het is zeer performant en flexibel te gebruiken met behulp van onder andere de <code>requests</code>-bibliotheek. Onder meer de volgende services zijn beschikbaar:
        </p><ul>
        <li>Routebeschrijving: retourneert een route tussen twee of meer locaties voor een geselecteerd profiel met aanpasbare aanvullende instellingen en instructies;</li>
        <li>Isochronen: verkrijgt bereikbaarheidsgebieden van bepaalde locaties;</li>
        <li>Matrix: berekent een-op-veel-, veel-op-een- of veel-op-veel-routes voor elk vervoermiddel dat wordt aangeboden door openrouteservice.</li>
    </ul>
    <p>De service vereist registratie en een API-<i>key</i> bij iedere <i>request</i>. Maak een account aan en genereer isochronen voor de campus Schoonmeersen. Deze isochronen moeten de bereikbaarheid geven voor een automobilist op 20, 40 en 60 minuten.</p>
</div>

In [None]:
## UW CODE HIER ##

### POST een uit meerdere delen gecodeerd bestand
Met `requests` is het eenvoudig om *Multipart*-gecodeerde bestanden te uploaden. [*Multipart requests*](https://swagger.io/docs/specification/describing-request-body/multipart-requests) combineren een of meer verzamelingen van data in een enkele *body*, zoals binaire bestanden. In onderstaand voorbeeld gebruiken we [https://httpbin.org](https://httpbin.org) om een Excel-bestand op te laden met [Belgische bevolkingsstatistieken](https://statbel.fgov.be). De data worden eerst gedownlaod en vervolgens in een *request* meegestuurd:

In [None]:
import requests
url = 'https://statbel.fgov.be/sites/default/files/files/documents/bevolking/5.1%20Structuur%20van%20de%20bevolking/Bevolking_per_gemeente.xlsx'
r = requests.get(url)
with open('data/statbel.xlsx', mode='wb') as grb_bsk:
    grb_bsk.write(r.content)
url = 'https://httpbin.org/post'
files = {'file': open('data/statbel.xlsx', 'rb')}

r = requests.post(url, files=files)
r.text

We kunnen de bestandsnaam, *content_type* en aanvullende *headers* expliciet instellen in een 4-*tupple*, zoals omschreven in de [documentatie](https://docs.python-requests.org/en/latest/api/#requests.request). In onderstaande voorbeeld wordt dit geïllustreerd door een snede uit het Vlaamse GRB op te halen en mee te geven in een `POST`-*request*. Met onderstaande code tonen we aan dat het niet vereist is om te verwijzen naar een bestand dat ergens op de PC aanwezig is, maar dat we ook gebruik kunnen maken van een datastream:

In [None]:
def getGRB_WMS():
    url = 'https://geoservices.informatievlaanderen.be/raadpleegdiensten/GRB-basiskaart/wms'
    payload = {'SERVICE':'WMS','VERSION':'1.3.0','REQUEST':'GetMap',
               'BBOX':'51.0327,3.7003,51.0362,3.7038', 'CRS':'EPSG:4326',
               'WIDTH':'512','HEIGHT':'512','LAYERS':'GRB_BSK','FORMAT':'image/geotiff',
               'DPI':'72','TRANSPARENT':'TRUE'}
    r = requests.get(url, params=payload)
    return r

grb = getGRB_WMS()
url = 'https://httpbin.org/post'
files = {'file': ('data/GRB_BSK.tif', grb.content, 'image/geotiff', {'Expires': '0'})}

r = requests.post(url, files=files)
r.text

Indien gewenst kunnen we ook *strings* verzenden die als bestanden te worden ontvangen:

In [None]:
def getGBG_WFS(fid):
    url = 'https://geoservices.informatievlaanderen.be/overdrachtdiensten/GRB/wfs'
    payload = {'SERVICE':'WFS','REQUEST':'GetFeature','VERSION':'2.0.0',
              'TYPENAMES':'GRB:GBG','featureID':'GBG.' + str(fid),
              'outputFormat':'application/json','srsName':'EPSG:4326'}
    r = requests.get(url, params=payload)
    return r

grb_gbg = getGBG_WFS(1929586)
url = 'https://httpbin.org/post'
files = {'file': ('grb_gbg.geojson', grb_gbg.text)}
r = requests.post(url, files=files)
r.text

Wanneer we een zeer groot bestand meesturen als `multipart/form-data`, zouden we onze data misschien beter streamen. Standaard wordt dit niet ondersteunt door de `requests`-bibliotheek. Er si echter een apart pakket dat dit wel doet, namelijk de `requests-toolbelt`-bibiotheek. We verwijzen naar de [*toolbelt*](https://toolbelt.readthedocs.io)-documentatie voor meer informatie. Voor het verzenden van meerdere bestanden in een *request* verwijzen we naar de [oorspronkelijke documentatie](https://docs.python-requests.org/en/master/user/advanced/#advanced) van `requests`.

Raadpleeg de geavanceerde sectie voor het verzenden van meerdere bestanden in één verzoek.

<div class="alert alert-block alert-info">Waarschuwing: Het wordt sterk aanbevolen om bestanden in <a href="https://docs.python.org/3/tutorial/inputoutput.html#tut-files">binaire modus</a> te openen. Dit komt omdat <code>requests</code> zal proberen om de <code>Content-Length-header</code> voor de data zal berekenen, die wordt deze  ingesteld op basis van het aantal <i>bytes</i> in het bestand. Er kunnen echter fouten optreden als we het bestand in tekstmodus openen.</div>

### HTTP *response* status codes
Zoals eerder vermeld kunnen we de reactiestatuscode controleren, ook wel [HTTP response status codes](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status) genoemd:

In [None]:
import requests
payload = {'gemeentenaam': 'gent', 'straatnaam': 'valentin vaerwyckweg', 'huisnummer': '1'}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)
r.reason

Verzoeken worden ook geleverd met een ingebouwd statuscode-opzoekobject voor eenvoudige referentie:

In [None]:
r.status_code == requests.codes.ok

Als we een slechte *request* verzonden hebben, resulterend in een [4XX-clientfout](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#client_error_responses) of een [5XX-serverfoutreactie](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status#server_error_responses), kunnen we de resulterende fout opvangen met `response.raise_for_status()`:

In [None]:
import requests
payload = {'onzinsleutel': 'onzinwaarde'}
r_bad = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)
r_bad.status_code

In [None]:
print(r_bad.raise_for_status())

Maar aangezien onze `status_code` voor `r` gelijk is aan `200` was krijgen we niet terug als we `raise_for_status()` aanroepen:

In [None]:
print(r.raise_for_status())

<div class="alert alert-warning"><p><b>Opdracht:</b> tot hier hebben we al een aantal services gezien die we kunnen gebruiken voor een grote verscheidenheid aan vraagstukken. In de documentatie hebben we ook gezien dat er expliciet een onderscheid gemaakt wordt tussen functies die we kunnen gebruiken in een <code>GET</code>-<i>request</i> en andere in een <code>POST</code>-<i>request</i>. Tracht met deze services een aantal verschillende HTTP-status codes te genereren, en print het resultaat.</p>
</div>

In [None]:
## UW CODE HIER ##

### Response Headers
We kunnen de *headers* van de *response* van de server bekijken met behulp van een Python-`dict`. We illustreren dit opnieuw aan de hand van de Valentin Vaerwyckweg 1 te Gent volgens de API van [Vlaamse Basisregisters](https://api.basisregisters.vlaanderen.be/v1/adresmatch):

In [None]:
import requests
payload = {'gemeentenaam': 'gent', 'straatnaam': 'valentin vaerwyckweg', 'huisnummer': '1'}
r = requests.get('https://api.basisregisters.vlaanderen.be/v1/adresmatch', params=payload)
r.headers

Dit `dict`-object is echter speciaal: het is alleen gemaakt voor HTTP-*headers*. Volgens [RFC 7230](https://tools.ietf.org/html/rfc7230#section-3.2) zijn de sleutels van HTTP-headers niet hoofdlettergevoelig. We hebben dus toegang tot de headers met elk hoofdlettergebruik dat we willen:

In [None]:
print(r.headers['Content-Type'])
print(r.headers['CONTENT-TYPE'])
print(r.headers.get('Content-Type'))
print(r.headers.get('content-type'))

Het is ook bijzonder dat de server dezelfde header meerdere keren met verschillende waarden zou kunnen terugsturen. De `requests`-bibliotheek combineert ze echter, zodat ze in het `dict`-object kunnen worden weergegeven binnen een enkele toewijzing. RFC 7230 zegt hierover:

> *"A recipient may combine multiple header fields with the same field name into one “field-name: field-value” pair, without changing the semantics of the message, by appending each subsequent field value to the combined field value in order, separated by a comma."* ([RFC 7230, §3.2.2](https://datatracker.ietf.org/doc/html/rfc7230#section-3.2).

> *"RFC: request for romment, a document circulated on the internet which forms the basis of a technical standard." ([Oxford Dictionaries](www.lexico.com)).

<div class="alert alert-warning"><p><b>Opdracht:</b> <a href="https://epsg.io">epsg.io</a> is een <i>open-source</i> web service met een databank voor coördinaatreferentiesystemen (CRS). Naast een overzicht van een groot aantal systemen, zoals het <a href="https://epsg.io/3812">Belgische Lambert 2008</a> of <a href="https://epsg.io/4326">WGS84</a>, laat de service ook toe om coördinaten te transformeren van het ene naar het andere systeem.</p><p>Herneem de code waarmee de coördinaten van de Valentin Vaerwyckweg 1 in Gent zijn bepaald met behulp van de API van Vlaamse basisregisters. Deze coördinaten worden aangeleverd in het Belgische Lambert '72 CRS. Gebruik <a href="https://epsg.io">epsg.io</a> om deze coordinaten om te zetten naar het Belgische Lambert '08 CRS en naar UTM 31N (ETRS'89). Bestudeer voor beide situaties de <i>headers</i> en identificeer eventuele verschillen.
</div>

In [None]:
## UW CODE HIER ##

### Cookies
Als een *response* [cookies](https://nl.wikipedia.org/wiki/Cookie_(internet)) bevat, kunnen we deze afzonderlijk bekijken:

In [None]:
import requests
headers = {'Ocp-Apim-Subscription-Key': '<HIER MOET EEN API KEY KOMEN>'}
url = 'https://api.delijn.be/DLZoekOpenData/v1/zoek/haltes/Gent Hogeschool'
r = requests.get(url, headers=headers)
r.cookies

Om onze eigen cookies naar de server te sturen, kunnen we de `cookies`-parameter gebruiken:

In [None]:
cookies = r.cookies
url = 'https://api.delijn.be/DLZoekOpenData/v1/zoek/haltes/Gent Hogeschool'
headers = {'Ocp-Apim-Subscription-Key': '<HIER MOET EEN API KEY KOMEN>'}
r = requests.get(url, headers=headers, cookies=cookies)
r.text

Cookies worden geretourneerd in een `RequestsCookieJar`, die werkt als een dict maar daarnaast een completere interface biedt, geschikt voor gebruik over meerdere domeinen of paden. `RequestsCookieJar`-objecten kunnen ook worden doorgegeven aan `requests`:

In [None]:
jar = requests.cookies.RequestsCookieJar()
jar.set('tasty_cookie', 'yum', domain='httpbin.org', path='/cookies')
jar.set('gross_cookie', 'blech', domain='httpbin.org', path='/elsewhere')
url = 'https://httpbin.org/cookies'
r = requests.get(url,  cookies=jar)
r.text

### Omleiding en geschiedenis
Met uitzondering van `HEAD` voert `requests` standaard locatie-omleiding uit voor alle HTTP *request*-methoden. We kunnen de `history`-eigenschap van het `response`-object gebruiken om de omleidingen bij te houden. De lijst `response.history` bevat de `response`-objecten die zijn gemaakt om de *request* te voltooien. De lijst is gesorteerd van de oudste tot de meest recente reactie.

De server van [geo.hogent.be](https://geo.hogent.be) is bijvoorbeeld zo ingesteld dat een *request* naar [http://geo.hogent.be](http://geo.hogent.be) (HTTP) zal worden omgeleid naar [https://geo.hogent.be](https://geo.hogent.be) (HTTPS). Dit resulteert in een [HTTP 302 Found](https://developer.mozilla.org/en-US/docs/Web/HTTP/Status/301)-melding.

In [None]:
import requests
r = requests.get('http://geo.hogent.be')
print('url: %s' % r.url)
print('status code: %s' % r.status_code)
print('history: %s' % r.history)

Als we `GET`, `OPTIONS`, `POST`, `PUT`, `PATCH` of `DELETE` gebruiken, kunnen we de afhandeling van omleidingen uitschakelen met de parameter `allow_redirects`:

In [None]:
import requests
r = requests.get('http://geo.hogent.be', allow_redirects=False)
print('url: %s' % r.url)
print('status code: %s' % r.status_code)
print('history: %s' % r.history)

Als we `HEAD` gebruikt, kunt we omleidingen ook inschakelen:

In [None]:
import requests
r = requests.head('http://geo.hogent.be', allow_redirects=True)
print('url: %s' % r.url)
print('status code: %s' % r.status_code)
print('history: %s' % r.history)

### *Time-outs*
We kunnen *requests* na een bepaalde tijd laten stoppen met wachten als er geen reactie komt van de server. De wachttijd stellen we vast met de `timeout`-parameter. Het wordt aanbevolen om alle code in operationele omgevingen te voorzien van een dergelijke parameter, en deze dus te gebruiken bij iedere *request*. Als we dit niet doen, kan onze code voor onbepaalde tijd vastlopen:

In [None]:
import requests
try:
    requests.get('https://github.com/', timeout=0.001)
except requests.exceptions.Timeout as e: 
    print(e)

<div class="alert alert-block alert-info">Opmerking: de <code>timeout</code>-parameter is geen tijdslimiet voor de volledige download van de <i>response</i>. Er wordt echter een uitzondering opgeworpen wanneer de server geen reactie heeft gegeven voor *time-out*-seconden, of met andere woorden, wanneer er geen *bytes* zijn ontvangen op de onderliggende socket gedurende *time-out*-seconden. Als er geen <code>timeout</code>-parameter expliciet wordt opgegeven, is er ook geen time-out voor aanvragen.</div>

### Fouten en uitzonderingen
We sluiten deze *notebook* af met enkele voorbeelden van fouten en uitzonderingen:
* In het geval van een netwerkprobleem (bijvoorbeeld bij een DNS-fout, een geweigerde verbinding, enz.), zal `requests` een `ConnectionError`-uitzondering opwerpen.
* Er wordt een `HTTPError` gegenereerd wanneer `response.raise_for_status()` een mislukte statuscode retourneerd.
* Als er een *time-out* optreedt voor een *request* wordt een `Timeout`-uitzondering gegenereerd.
* Als een aanvraag het geconfigureerde aantal maximale omleidingen overschrijdt, wordt een `TooManyRedirects`-uitzondering gegenereerd.
* Alle uitzonderingen die `requests` expliciet oproept, worden overgeorven van `requests.exceptions.RequestException`.

## Meer informatie


Bekijk de [originele gids](https://docs.python-requests.org/en/master/user/quickstart) of de [geavanceerde sectie](https://docs.python-requests.org/en/latest/user/advanced/#advanced) voor meer informatie.