# Hoe werkt het web?

Je gebruikt vrijwel elk uur het web, op de een of andere manier.
Hoe werkt het web? Wat zijn de bouwstenen? Daar gaan we in deze lesbrief op in.




## Toepassing van het internet

Het web is een toepassing van het internet, net als bijvoorbeeld e-mail, internet-telefonie en Skype, muziek of video-on-demand (Spotify, NetFlix), chat-toepassingen (Whats-App), enzovoorts.
Het web gebruikt eigen protocollen (HTTP, enz.) met de internet-protocollen (TCP, IP) als basis.

Voor veel gebruikers in het web het belangrijkste gebruikersinterface van het web: daarom worden de termen web en internet soms door elkaar gebruikt - net zoals we "trein" en "spoor" soms door elkaar gebruiken. Dat is niet erg, als je maar weer hoe de verhouding tussen web en internet is.

Figuur: HTTP op basis van TCP/IP.

## Client-server

Het web gebruikt een client-server aanpak: de browser in je laptop of smartphone is de client, de webserver is de server. De client (browser) stuurt de server een verzoek ("request"), de server stuurt het antwoord ("response") terug. In het geval van HTTP, het web-protocol, bevat dit request de URL van de gevraagde webpagina. De repsonse bevat het HTML-document van deze webpagina. De browser vertaalt de HTML-codes naar een weergave op het scherm.

Figuur: Client-server, met URL en HTML

### Client en server als rollen

## Developer-tools in de browser

Je kunt de interactie tussen de browser en de server volgen met de developer-tools van de browser. Soms moet je deze eerst activeren.

* Chrome: https://developers.google.com/web/tools/chrome-devtools
    * Network tab: https://developers.google.com/web/tools/chrome-devtools/network/
* FireFox: Menu "Extra->Webontwikkelaar->Hulpmiddelen inschakelen" of "Tools", -> 
    * https://developer.mozilla.org/nl/docs/Tools
    * Network: https://developer.mozilla.org/en-US/docs/Tools/Network_Monitor
* Safari:
* Edge:

Lees of bekijk de aanwijzingen voor de browser die je gebruikt. Je komt waarschijnlijk nog veel termen tegen die je nog niet begrijpt, maar deze worden later wel duidelijk. Later bekijk je die aanwijzingen dan nog eens.


## Een eenvoudige interactie

We bekijken wat er gebeurt als je de URL `http://www.example.com` opvraagt.

1. open een leeg venster/tab in de browser
2. open daarin de developer tools, met de network-tab.
3. type als URL in het URL-venster: `http://www.example.com` (RETURN).
4. de pagina van www.example.com verschijnt nu in de browser.

In de developer tools kun je volgen wat hier gebeurd is:

1. de client (browser) stuurt een verzoek (HTTP GET-request) met URL "/" naar de server (IP-adres: 93.184.216.34:80), met als host: "www.example.com". De informatie over de host en andere informatie over de browser (User Agent) wordt gestuurd via "headers" of "kopteksten": een aantal (naam, waarde)-combinaties.
2. de server stuurt een response met daarin een HTML-document. De response bevat ook weer een aantal headers of koptektsten, bijvoorbeeld welk soort document meegestuurd wordt (`Content-Type: text/html; charset=UTF-8`). De code 200 in de response geeft aan dat het verzoek succesvol verwerkt is. (Een code 404 geeft aan dat de pagina niet gevonden is.)

Vaak vind je in de browsertools nog veel meer details, bijvoorbeeld over de tussenstappen en de timing daarvan. Bijvoorbeeld: DNS-omzetting of DNS-lookup: dit is een apart verzoek van de browser aan de DNS-server, om het IP-adres van www.example.com te vinden.

Figuur: www.example.com in de browser tools (Firefox, Chrome?)

#### Request- en response-headers

Hieronder geven we de request- en response in source formaat, zoals deze verstuurd worden. Vaak worden deze in de tools in een wat meer leesbare vorm samengevat, maar je kunt dit source-formaat vaak wel vinden.

Request:

```
GET / HTTP/1.1
Host: www.example.com
Connection: keep-alive
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 10_3_1 like Mac OS X) AppleWebKit/603.1.30 (KHTML, like Gecko) Version/10.0 Mobile/14E304 Safari/602.1
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9
Accept-Encoding: gzip, deflate
Accept-Language: nl,en;q=0.9,nl-NL;q=0.8,en-US;q=0.7
```

De "/" na "GET" is de URL; samen met de host-header is dat: "www.example.com/"

Response:

```
HTTP/1.1 200 OK
Content-Encoding: gzip
Cache-Control: max-age=604800
Content-Type: text/html; charset=UTF-8
Date: Mon, 16 Dec 2019 10:06:00 GMT
Etag: "3147526947+gzip"
Expires: Mon, 23 Dec 2019 10:06:00 GMT
Last-Modified: Thu, 17 Oct 2019 07:18:26 GMT
Server: ECS (nyb/1DCD)
Vary: Accept-Encoding
X-Cache: HIT
Content-Length: 648
```

#### HTML-document

Het meegestuurde HTML-document:

```
<!doctype html>
<html>
<head>
    <title>Example Domain</title>

    <meta charset="utf-8" />
    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1" />
    <style type="text/css">
    body {
        background-color: #f0f0f2;
        margin: 0;
        padding: 0;
        font-family: -apple-system, system-ui, BlinkMacSystemFont, "Segoe UI", "Open Sans", "Helvetica Neue", Helvetica, Arial, sans-serif;
        
    }
    div {
        width: 600px;
        margin: 5em auto;
        padding: 2em;
        background-color: #fdfdff;
        border-radius: 0.5em;
        box-shadow: 2px 3px 7px 2px rgba(0,0,0,0.02);
    }
    a:link, a:visited {
        color: #38488f;
        text-decoration: none;
    }
    @media (max-width: 700px) {
        div {
            margin: 0 auto;
            width: auto;
        }
    }
    </style>    
</head>

<body>
<div>
    <h1>Example Domain</h1>
    <p>This domain is for use in illustrative examples in documents. You may use this
    domain in literature without prior coordination or asking for permission.</p>
    <p><a href="https://www.iana.org/domains/example">More information...</a></p>
</div>
</body>
</html>
```

## Andere web-clients

We kunnen ook vanuit een ander programma dan een browser een HTTP-request sturen. Dit gebruiken we bijvoorbeeld voor het opvragen van gegevens uit een API, zoals de gegevens van het KNMI (https://www.knmi.nl/kennis-en-datacentrum/achtergrond/data-ophalen-vanuit-een-script).


In een Python-programma gebruik je daarvoor de module `requests` (zie: https://2.python-requests.org//en/v2.7.0/).

We geven hier het voorbeeld voor het opvragen van dezelfde voorbeeld-webpagina. Zoals je ziet kunnen we alle gegevens van de response ook in het Python-programma opvragen.

In de notebooks over web-API's gaan we hier verder op in.

In [9]:
import requests

r = requests.get("http://www.exmple.com")
print("status code: ", r.status_code)
for h in r.headers:
    print(h, ": ", r.headers[h])
print("======")
print("document:")
print(r.text)

status code:  200
Date :  Mon, 16 Dec 2019 10:48:51 GMT
Server :  Apache/2
X-Powered-By :  PHP/5.6.40
Vary :  Accept-Encoding,User-Agent
Content-Encoding :  gzip
Content-Length :  1075
Keep-Alive :  timeout=2, max=100
Connection :  Keep-Alive
Content-Type :  text/html; charset=UTF-8
document:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<html>
<head>
<title>Example Website, Exmple Website - Exmple.com</title>
  <meta name="description" content="This is an example website that can be used as a demo when creating a dummy link for demonstration purposes.">
  <meta name="keywords" content="Exmple,Example,Exmple.com">
</head>

<body>

<center><table style="margin-top: 2px" width=640><tr><td>

<h2>Example Website</h2>

<p>This is an example website that can be used to demonstrate links without really linking
    to any real site. The domains example.com, example.net and example.org are reserved
    and cannot be followed through a link, while this misspelled domain exmple.c

## Samenvatting

* 