# Hypertext Transfer Protocol (HTTP)
In deze opdracht ga je zelf een Hypertext Transfer Protocol (Hypertext Transfer Protocol) request doen. Je gaat de webpagina opvragen die het cijfer bevat van het aantal positieve coronatesten van gisteren.

**aan het einde van de opdracht**:
* kun je zelf een HTTP request doen via de programmeertaal Python

**voor als je meer wilt weten over HTTP**:
* de [requests](https://docs.python-requests.org/en/master/) library
* de Wikipedia pagina over [HTTP](https://nl.wikipedia.org/wiki/Hypertext_Transfer_Protocol)
* [Youtube video](https://www.youtube.com/watch?v=4_-KdOLZWLs) over HTTP

**uitleg voor het maken van deze opdracht**
* deze opdracht bestaat uit vijf stappen. Het is belangrijk dat je alle stappen na elkaar uitvoert. 
* Je voert een cel uit door er eerst op te klikken. Daarna klik je op het 'play' teken bovenaan dit bestand.
* sommige stappen bevatten **vragen**. Bij een vraag is het belangrijk dat jij de vraag beantwoordt.
* je kunt je antwoord opschrijven in dit bestand:
    * Klik op de cel van de vraag
    * Klik daarna op het plusje boven de titel van dit bestand (een lege cel verschijnt)
    * Kies 'Markdown' vanuit de dropdown bovenaan dit bestand.
    * typ je antwoord in de cel die verschijnt gevolgd door het 'play' teken bovenaan dit bestand.
* Als laatste is het heel belangrijk dat je het bestand opslaat (zie diskette afbeelding bovenaan dit bestand) en dat je jouw opdracht downloadt
* Je kunt het bestand download door te klikken op 'Download' bovenaan dit bestand. Een bestand genaamd 'HTTP.ipynb' zal verschijnen in je Downloads map. Dit bestand lever je in. Let op dat het bestand niet overschreden wordt als je meerdere keren downloadt. Je krijgt dan HTTP (1).ipynb, HTTP (2).ipynb, etc.

## Stap 1: de webpagina
We gaan in deze opdracht een HTTP request doen van de volgende webpagina: 
**https://coronadashboard.rijksoverheid.nl/landelijk/positief-geteste-mensen**.

## Stap 2: HTTP GET request
We gaan een HTTP GET request doen. Hiervoor gebruiken we de **urllib** library:

In [None]:
from urllib.request import urlopen

De URL (Uniform Resource Locator) van het HTTP GET request is:

In [None]:
url = 'https://coronadashboard.rijksoverheid.nl/landelijk/positief-geteste-mensen'

We gaan nu in Python een HTTP GET request doen:

In [None]:
r = urlopen(url)
the_html = r.read().decode('utf-8')

## Stap 3: response bekijken

Als eerste gaan we de status code bekijken

In [None]:
status_code = r.getcode()
print(status_code)

Is de status code 200? Dan is het gelukt!

`**Vraag 1**: Leg uit wat de volgende status codes betekenen (gebruik je favoriete zoekmachine om achter de betekenis van de statuscodes te komen):`
- 404
- 414
- 418
- 429

Gelukkig bevat een response nog veel meer informatie:

In [None]:
for header, waarde in r.headers.items():
    print(header, waarde)

`**Vraag 2**: Leg uit wat de volgende headers betekenen (gebruik je favoriete zoekmachine om achter de betekenis van de headers te komen):`
- Content-Type
- Last-Modified
- Date

Als laatste stap gaan we de HTML zelf bekijken. Hieronder tonen we de eerste 100 karakters van de HTML.

In [None]:
print(the_html[:100])

## Stap 4: op zoek naar het aantal besmettingen

We gaan eerst de HTML inlezen met Python via de **xml** library.

In [None]:
import xml.etree.ElementTree as ET
from io import StringIO

In [None]:
the_html_as_file_object = StringIO(the_html)
tree = ET.parse(the_html_as_file_object)

In [None]:
html_element = 'div'
attribuut_waarde = 'infected'
html_elementen = tree.findall(f'.//{html_element}[@data-cy="{attribuut_waarde}"]')

Als het goed is, is er maar een HTML element *div* met als waarde van **data-cy**: **infected**

In [None]:
len(html_elementen)

In [None]:
element = html_elementen[0]
ET.dump(element)

In [None]:
aantal_besmettingen = element.text.replace('.', '')
print(aantal_besmettingen)

Als het goed is, zie je hierboven het aantal positieve coronatesten van gisteren!

## Stap 5: JSON
HTML is niet echt makkelijk in te lezen door computers. Het RIVM biedt ook ander soorten formaten aan:
https://data.rivm.nl/covid-19/

We gaan nu een HTTP request doen om een JSON bestand op te vragen voor het aantal besmettingen per gemeente per dag.

In [None]:
import json

https://data.rivm.nl/covid-19/COVID-19_aantallen_gemeente_per_dag.json

In [None]:
page = 'https://data.rivm.nl/covid-19/COVID-19_aantallen_gemeente_per_dag.json'

De volgende cel zal even duren voordat deze klaar is. Zolang er `[*]` staat is Python nog aan het nadenken.

In [None]:
r = urlopen(page)
json_as_string = r.read().decode('utf-8')
json_object = json.loads(json_as_string)

In [None]:
print(r.getcode())

In [None]:
stad = 'Amersfoort' # GEMEENTE
datum = '2020-10-01' # JAAR-MAAND-DAG
for informatie in json_object:
    if informatie['Municipality_name'] == stad:
        if informatie['Date_of_publication'] == datum:
            print(informatie)

`**Vraag 3**: Hoeveel overledenen waren er in Amersfoort op 27 november 2020? En hoeveel ziekenhuisopnames?`

`**Vraag 4**: Hoeveel positieve besmettingen had Urk op oudjaarsdag 2020?`