# Het publieke internet

```{Admonition} Concepten
ISP, router, maasnetwerk, adressering, netwerk-prefix, host-adres, routering, BGP, peering, transit
```

```{figure} images/internet-tiers.png
:width: 600px

Internet-tiers
```

Het internet is een netwerk van netwerken.
De thuisrouter is de *gateway* van het lokale netwerk naar het publieke internet:
naar alle netwerken die daarin verbonden zijn, met hun hosts.

De thuisrouter maakt deel uit van het netwerk van de Internet Service Provider.
Dit ISP-netwerk is via routers/gateways verbonden met de netwerken van andere ISPs,
en uiteindelijk met de *Tier-1* netwerken die de *backbone* van het internet vormen.

```{figure} images/maas-netwerk.png
:width: 400px

Internet als maas-netwerk: elk punt is een router 
```

De netwerken zijn onderling sterk verknoopt in een *maasnetwerk*.
Dit betekent dat er tussen elk tweetal punten (netwerken) meestal meerdere paden door het netwerk te vinden zijn.
Er is dan bij het uitvallen van een enkele verbinding of van een enkel knoopput (router) nog steeds communicatie mogelijk.

Net als in het verkeersnetwerk kunnen er in het internet files en opstoppingen ontstaan, en storingen door verbindingen of routers die (tijdelijk) niet werken. 
Het routeren van een pakket door het internet lijkt sterk op het probleem van een routeplanner ("TomTom"), die met al die factoren rekening moet houden.

Deze *redundantie* (letterlijk overtolligheid, hier eigenlijk *overdimensionering*) zorgt ervoor dat het netwerk betrouwbaar is, ook bij storingen en plaatselijke overbelasting. 

Het "beste pad" voor een pakket tussen A en B is niet op elk moment hetzelfde. Niet alleen de capaciteit van de verbindingen en van de routers bepalen het beste pad, maar ook de eventuele storingen en de huidige verkeersdruk.

## Adressering

De communicatie in het internet is gebaseerd op pakketten: elk pakket bevat, naast de eigenlijke data (de "payload"), het internetadres van de bestemming en dat van de afzender.

```{margin}
Je kunt een internetadres vergelijken met een postadres: de plaatsnaam/straatnaam (postcode) bepaalt de straat, het huisnummer het huis in de straat.
```

Een internetadres (IP-adres) bestaat uit twee gedeelten: (i) de netwerkprefix (het netwerkadres); en (ii) het adres van de host in het netwerk.
De netwerkprefix wordt gebruikt voor het routeren van het pakket naar het juiste netwerk. Daarna zorgt de lokale router voor de bezorging bij de host.

```{margin}
De notatie 192.169.47.34/24 heet wel de *CIDR* notatie.
```

**IPv4** De netwerk-prefix geef je aan door `/xx`, waarbij `xx` het aantal bits van de prefix is; of door het *netmasker*, waarin de binaire 1-en aangeven welk deel tot de netwerk-prefix hoort.

Het adres van een netwerk is de netwerk-prefix aangevuld met 0-en; bijvoorbeeld: 192.168.3.12/24, met als netmasker 255.255.255.0, heeft als netwerkadres: 192.168.3.0.

De rest van het IP-adres, na de prefix, bepaalt het *aantal mogelijke host-adressen* in het netwerk. Hierbij zijn twee adressen gereserveerd: allemaal 0-en voor het netwerk-adres en allemaal 1-en voor een broadcast-pakket.

Voor het bovenstaande voorbeeld is het netwerkadres 192.168.3.0 en het broadcastadres 192.168.3.255. In dit voorbeeld blijven er dan 256-2=254 host-adressen over, van 192.168.3.1 t/m 192.168.3.254. Meestal wordt één van beide uitersten gebruikt voor de gateway, hier 192.168.3.1 of 192.178.3.254.

**IPv6** Bovenstaande geldt voor IPv4-adressen. Een IPv6-adres bestaat uit 128 bits, waarvan de eerste 64 bits de netwerk-prefix zijn, en de laatste 64 bits het host-adres in het netwerk.

## Routering

Hoe komt een internet-pakket van A naar B? De *routering* van internet-pakketten gebeurt (i) voor elk pakket afzonderlijk, en (ii) stap voor stap.

```{margin}
Een routeplanner voor wegverkeer werkt anders: deze bepaalt vooraf de hele route.
```

Een router die een pakket ontvangt bepaalt of dit bestemd is voor een lokaal netwerk dat aan deze router verbonden is; zo ja, dan stuurt de router het pakket direct naar de bestemmings-host (zie het gedeelte over het lokale netwerk).
Zo nee, dan bepaalt de router wat in de aanliggende netwerken de eerstvolgende router is die een stap dichter bij de bestemming ligt, en stuurt het pakket naar die router.

**(+)** Elke router heeft informatie over de netwerken die via deze router bereikbaar zijn, direct en indirect; en wat voor de indirecte routes de eerstvolgende router is. Deze informatie wordt tussen de routers uitgewisseld via het *Border Gateway Protocol*.

* https://en.wikipedia.org/wiki/Border_Gateway_Protocol
* https://www.imperva.com/blog/bgp-routing-explained/

Een pakket kan onderweg verloren raken, ten gevolge van een storing of door overbelansting van een router. Bovendien wordt, zoals gezegd, elk pakket afzonderlijk gerouteerd. Dit betekent dat (i) niet alle pakketten op hun bestemming aankomen; en dat (ii) de pakketten in een andere volgorde bij de bestemming kunnen aankomen dan waarin ze verzonden zijn.

```{margin}
*end-to-end*: in hosts A en B, niet in het netwerk.
```

*Voorbeeld.* Stel, host A stuurt 3 pakketten: p1, p2, en p3. Bij de bestemming B kunnen deze pakketten in alle (6) volgordes aankomen: p1, p2, p3; p1, p3, p2; p2, p1, p3; ... En bovendien kunnen in deze volgordes pakketten ontbreken. Met als gevolg: als B pakket p3 ontvangt weet deze niet of p1 en p2 verloren geraakt zijn, of nog onderweg zijn.
Als je wilt garanderen dat alle pakketten aankomen, en dat de volgorde gehandhaafd blijft, heb je een *end-to-end* protocol nodig dat daarvoor zorgt. Het TCP protocol is daarvan een voorbeeld.

## (+) Internet backbone

De netwerken van de Internet Service Providers zijn op verschillende manieren op elkaar aangesloten, met verschillende soorten afspraken:

* een kleiner netwerk ("Tier-3") moet voor de aansluiting op een groter netwerk meestal betalen: het grote netwerk levert meer voordeel voor het kleine netwerk op, dan omgekeerd. Er is dan sprake van een *transit overeenkomst*; het kleinere netwerk is de klant van het grotere netwerk. (Dit kun je vergelijken met de overeenkomst die je als consument met een ISP hebt.)
* de grootste netwerken ("Tier-1") betalen niet voor de aansluiting op een ander groot netwerk: de voordelen zijn voor beide ongeveer gelijk. Er is dan sprake van een *peering overeenkomst* zonder betaling.
* de middelgrote netwerken ("Tier-2") hebben een combinatie van transit- en peering-overeenkomsten met betaling voor de aansluiting op grotere netwerken, en peering overeenkomsten met vergelijkbare netwerken.

Veel overeenkomsten tussen ISPs zijn geheim, waardoor niet duidelijk is of er sprake is van aan transit-overeenkomst of van peering op basis van gelijkwaardigheid.

* https://en.wikipedia.org/wiki/Tier_1_network
* https://nl.wikipedia.org/wiki/Tier_1-netwerk
* https://nl.wikipedia.org/wiki/Peering
* https://en.wikipedia.org/wiki/Internet_backbone

Vooral de Tier-1 netwerken hebben grote internationale glasvezel-verbindingen, met onderzeese verbindingen.
Een kaart van de verbindingen wereldwijd vind je bijvoorbeeld op:

* https://www.infrapedia.com/app
* https://www.vox.com/a/internet-maps (historische ontwikkeling van het internet)

Deze netwerken worden op elkaar aangesloten via Internet Exchange Points (IXPs).
Eén van de grootste IXPs is IXP Amsterdam.

* https://en.wikipedia.org/wiki/Internet_exchange_point
* https://nl.wikipedia.org/wiki/Amsterdam_Internet_Exchange
* https://www.ams-ix.net/ams


## (+) Content Delivery Networks

Veel web-content is *statisch*, dat wil zeggen, deze is voor een groot deel van de gebruikers gelijk. Dat geldt niet alleen voor statische websites, die niet afhangen van de gebruiker of van de toestand van de server. Het geldt ook voor vaak omvangrijke onderdelen zoals foto's, video's, JavaScript-libraries en dergelijke. Voor dergelijke content heeft het zin om deze te *cachen*, bij voorkeur in de buurt van de gebruikers. *Content Delivery Networks* bieden dat als dienst aan, om zo de snelheid van websites te vergroten en tegelijkertijd de webservers van de aanbieders te ontlasten.
Voorbeelden van dergelijke CDN-aanbieders zijn: Akamai, Cloudflare, Fastly

## (+) Van wie is het internet?

Het internet is van niemand, of beter: van ons allemaal. Het is niet het eigendom van een bedrijf of van een overheid. Het is een gemeenschappelijke activiteit van een groot aantal organisaties, bedrijven, overheden, en individuen.

Er zijn wel organisaties die proberen de ontwikkelingen rond het internet in goede banen te leiden; enkele van de belangrijkste daarvan:

* ISOC: de internet society
    * *The Internet is for Everyone* - This vision drives everything we do
    *  https://www.internetsociety.org/internet/how-it-works/
    * http://www.internetsociety.org/who-we-are
* IETF: de technische organisatie die verantwoordelijk is voor de *protocollen* die in het internet gebruikt worden.
    * deze protocollen worden beschreven in zogenaamde *Request for Comments* (RFCs): dit zijn publieke documenten van een werkgroep waar iedereen met verstand van zaken gedurende een bepaalde periode commentaar op kan leveren. Veel van deze RFCs, zeker de oudere, zijn een voorbeeld van helder technisch taalgebruik.
    * https://www.rfc-editor.org/rfc/rfc8700.html#name-key-moments-in-rfc-history
    * in principe kan iedereen met verstand van zaken deelnemen in de IETF werkgroepen; dat is niet gebonden aan andere organisaties of bedrijven. - https://www.ietf.org/about/participate/
* SIDN: beheert het .nl-domein
    * https://www.sidn.nl/over-sidn/ons-verhaal
    * https://www.sidn.nl/over-sidn/waar-wij-voor-staan
* ICANN: Internet Corporation for Assigned Names and Numbers
    * https://www.icann.org
    * ICANN organiseert IANA: Internet Assigned Numbers Authority
    * deelt nummers uit voor gebruik in de internet-protoollen: IP-nummers, socket-nummers, protocol-nummers, enz.; en (domein)namen: DNS root, TLD (top level domeinen registratie), .int en .arpa domeinen beheer.
* W3C: Word Wide Web Consortium - standaardisatie van het web (HTML, CSS, JavaScript)
    * https://en.wikipedia.org/wiki/World_Wide_Web_Consortium
    * https://www.w3.org

De organisatie van het internet is uniek, en een voorbeeld waar grootschalige open samenwerking toe kan leiden. De bovenstaande organisaties zijn allemaal non-profit organisaties met leden. Veel van het werk wordt door vrijwilligers gedaan, en de organisaties zijn erg open en welkom voor nieuwkomers.

## ??

* het internet is een maas-netwerk (mesh network), met *redundante* verbindingen.
    * deze redundantie (extra verbindingen) zorgen ervoor dat het netwerk kan blijven functioneren, ook als er een enkele verbinding uitvalt (of overbelast raakt)
    * dit maakt het routeren wel lastiger, omdat de "snelste verbinding tussen twee punten" in de tijd kan veranderen.
* voor de routering van pakketten wordt een bepaald algoritme gebruikt (BGP)
* elk pakket wordt onafhankelijk van de andere pakketten gerouteerd. De pakketten van eenzelfde HTTP-verbinding kunnen dus verschillende routes afleggen.
* een pakket kan verloren raken... bijvoorbeeld als gevolg van een transmissiefout, maar ook door een buffer-overflow bij een router
    * dit probleem wordt niet in het netwerk opgelost, maar moet door de protocollen in de hogere lagen (transportlaag: TCP of toepassingenlaag) opgelost worden.
    * dit is een voorbeeld van het "end to end" principe - omdat de manier waarop dit probleem het best opgelost kan worden, afhankelijk is van de toepassing. Bijvoorbeeld in het geval van internet-telefonie, VoIP, levert het verlies van een paar pakketten niet direct problemen op. (Extra latency voor het oplossen hiervan, zoals bij TCP, is een groter probleem.)
* alle netwerkapparaten in het publieke internet werken - in principe - alleen op het IP-niveau
    * voor de functionaliteit is dat voldoende
    * maar: soms vindt "deep packet inspection" plaats
    * en bijv. caching van protocollen op hogere niveaus (html?)


figuur: maas-netwerk (met benoemde punten)

Wat kunnen we in deze context zeggen over adressering? Het gaat eigenlijk vnl. over routering, op basis van IP-adressen (IP-netwerk-adressen.)


Internet Backbone (Cisco figuren)

"backbone providers sell their services to ISP's"

* https://en.wikipedia.org/wiki/List_of_Internet_exchange_points

Internet outages

* https://www.thousandeyes.com/outages/

Internet radar

* https://radar.cloudflare.com

Met o.a. verschillende soorten aanvallen (DDOS e.d.)

Cloudflare (zijn er ook alternatieve aanbieders van dit soort diensten? - o.a. CND, content delivery network - voor de caching van content "dichtbij de gebruikers".)

Tier-1 networks - https://en.wikipedia.org/wiki/Tier_1_network

"zo groot dat ze met *peering* kunnen volstaan, en niet hoeven te betalen voor het uitwisselen van verkeer met andere netwerken."

Amsterdam Internet Exchange

* https://nl.wikipedia.org/wiki/Amsterdam_Internet_Exchange
* https://en.wikipedia.org/wiki/List_of_Internet_exchange_points

Schakelpunten tussen netwerken; verwerken grote hoeveelheden dataverkeer.

## Adressering in het internet

* internetadres bestaat uit (netwerkadres, hostadres)
    * in het geval van IPv4 weet je bijv. uit het netmasker wat het netwerk-deel is van het adres. Een andere notatie is "/xx" wat aangeeft dat de eerste xx bits van het adres het netwerk-deel vormen
    * in het geval van IPv6 is het eenvoudig: de eerste 64 bits vormen het netwerk-deel, de laatste 64 bits het host-deel. (Dit kun je evt. afleiden van het MAC-adres.)
* je kunt ook symbolische namen gebruiken (domeinnaam), die via het DNS protocol omgezet kunnen worden in het bijbehorende IP-adres
    * bij een bepaald IP-adres kunnen meerdere domeinnamen horen. Meerdere domeinnamen kunnen hetzelfde IP-adres delen.
    * een domeinnaam bestaat uit twee of 3 delen, bijv. `www.infvo.nl`. Het subdomein-gedeelte (hier: `www.`) kan ook leeg zijn. Het laatste deel is het "superdomein" - officieel: 
    
### IP-adressen    
    
### DNS
    
(Een router moet eigenlijk weten wat het netwerk-deel is van een IP-adres: dat gebruik je voor het routeren. Als je dat niet weet, moet je voor elk IP-adres een entry in de router-tabellen hebben. Maar hoe weet je, gegeven een IP-adres, wat daarvan het netwerk-deel is?)

Een gateway kan in elk geval concluderen dat een IP-adres niet in het eigen netwerk valt. (Dat is triviaal.)

## Routering

* via BGP
* elk IP-pakket wordt afzonderlijk gerouteerd. Door het uitvallen van verbindingen of routers, of door tijdelijke overbelasting daarvan, kunnen opeenvolgende pakketten met dezelfde afzender en dezelfde bestemming een andere route krijgen. Ook kunnen er onderweg pakketten verloren raken, door een gestoorde communicatie of door een overbelaste router. Dit betekent dat het niet zeker is dat alle verzonden pakketten aankomen; en de volgorde bij aankomst kan anders zijn dan de volgorde bij verzenden.
    * met andere woorden: als het vorige pakket nog niet ontvangen is, betekent dat niet noodzakelijk dat het verloren geraakt is.


Het internet is een netwerk van netwerken.
De routers in het netwerk verbinden steeds twee of meer netwerken.
Tussen twee routers in het netwerk bestaan vaak meerdere verbindingen: het netwerk is *redundant*.
Dit betekent dat het wegvallen van een verbinding of van een router de verbondenheid van het netwerk niet direct in gevaar brengt.
Dit betekent ook dat het vinden van het "beste" pad voor een pakket, van afzender A naar bestemming B, niet altijd eenvoudig is is: er zijn soms heel veel verschillende paden mogelijk.

```{figure} images/maas-netwerk.png
:width: 350

Maas-netwerk
```

Je kunt het internet vergelijken met het wegennet:
een verbinding is dan een weg, en een router een kruising van wegen (kruispunt of t-splitsing).
Het vinden van het "beste pad" kun je dan vergelijken met de taak van een TomTom.
(Een verschil is dat de TomTom de hele route van te voren bepaalt; we zullen zien dat dat in het internet niet het geval is.)

Het routeren van een pakket van afzender A naar bestemming B is het bepalen van het "beste" pad van A naar B.
Als een router een pakket ontvang voor bestemming B, en

* B bevindt zich in een netwerk dat direct verbonden is met de router: de router stuurt het pakket direct naar B:
* B bevindt zich niet in één van de direct verbonden netwerken: de router stuurt het pakket naar de eerstvolgende router in één van de verbonden netwerken die "een stap dichter bij B ligt" op het "beste pad".

Hiervoor moet elke router weten wat de direct verbonder routers zijn, en welke netwerken via die routers te bereiken zijn (en met welke snelheden e.d.) . Het Border Gateway Protocol (BGP)zorgt voor het uitwisselen van deze informatie tussen de routers.

De eigenschappen van het netwerk veranderen in de loop van de tijd: verbindigen vallen soms weg, er komen nieuwe verbindingen bij, verbindingen of routers raken overbelast, enz. Het "beste pad" van A naar B zal daarom niet op elk moment hetzelfde zijn.

Omdat elk pakket onafhankelijk van de andere pakketten gerouteerd wordt, kunnen opeenvolgende pakketten van A naar B een verschillend pad in het netwerk afleggen. Hierbij kunnen pakketten elkaar inhalen: de volgorde bij aankomst is dan anders dan de volgorde bij verzenden.

Het netwerk is niet volledig betrouwbaar: een pakket kan verloren raken door storing van een verbinding, door overbelasting van een router, enz. Het is de taak van hogere protocollen om dit probleem ("end to end") op te lossen: dit is niet de taak van het netwerk. (Dit maakt het netwerk veel eenvoudiger, en, paradoxaal genoeg, daardoor ook sneller en betrouwbaarder.)

Je kunt een overbelaste router vergelijken met een overbelast distributiecentrum dat zo nu en dan een stapel pakjes weggooit, om ervoor te zorgen dat de rest op tijd bezorgd wordt - in plaats van dat alles vastloopt.

(Dit is mogelijk ook een oplossing voor het fileprobleem: een deel van de auto's wordt tijdelijk verplicht aan de kant gezet.)

## Backbone(*)

Voor het internetverkeer over grote afstanden, bijvoorbeeld overzee, zijn er glasvezelkabels met grote capaciteit aangelegd, bijvoorbeeld op de bodem van de atlatische oceaan.

zie figuur voor deze verbindingen

* https://www.infrapedia.com

Om al deze verbindingen en de ISP-netwerken op elkaar aan te sluiten zijn er grote schakelcentra ingericht. Eén van de grootste wereldwijd is de "Amsterdam Internet Exchange". zie: https://www.ams-ix.net/ams en https://en.wikipedia.org/wiki/Amsterdam_Internet_Exchange.

Het uitwisselen van het dataverkeer tussen verschillende Internet Service Providers (ISPs) In een IXP gebeurt op basis van *peering* overeenkomsten, meestal met gesloten beurzen: beide ISPs zijn gebaat bij de aansluiting op elkaars netwerk. 

Het alternatief voor deze directe uitwisseling is de aansluiting van het ISP-netwerk op een "hoger" ("upstream") netwerk. Hiervoor moeten wel de kosten voor dataverkeer betaald worden.
voorgebruik van een "hoger" netwerk, waarop een ISP aangesloten 


De grootste ISPs ("Tier-1 networks") hebben zoveel capaciteit, verbindingen en aansluitingen dat ze altijd op basis van peering overeenkomsten met gesloten beurs hun netwerk op andere netwerken kunnen aansluiten.
Tier-2 ISPs kunnen via peering op andere Tier-2 netwerken aangesloten worden, maar voor aansluiting op grotere netwerken moet betaald worden.
andere Tier-2 ISPs v

(Peering: aansluiting van netwerken op elkaar, niet op de rest van het internet. Transit: aansluiting op "de rest van het internet". Peering kan in veel gevallen met gesloten beurs ("settlement-free peering"; voor transit moet altijd betaald worden.)

* Tier 1 netwerk
* Internet transit
* Internet peering
* IXP
* https://www.pch.net

Er is geen centrale organisatie die het internet beheert. Er is wel een aantal organisaties dat probeert het internet in goede banen te leiden. Organisaties en bedrijven die zich aan de richtlijnen houden weten dat dit de beste manier is om het internet betrouwbaar, veilig en efficiënt te houden. Er is in verschillende landen wel sprake van politieke invloed op het internet en het gebruik daarvan. De genoemde organisaties geven voorlichting aan overheden om de werking van het internet te begrijpen, en om de gevolgen van bepaalde politieke invloed op het internet(-gebruik) duidelijk te maken. 

* voor het uitdelen van unieke nummers en namen (bijv. domeinnamen?) protocolnummers e,d, IANA
* IETF - protocoldefinitie



## Netwerk-prefix

Een IP-adres bestaat uit twee delen: het adres van het netwerk (de netwerk-prefix), en het adres van host in het netwerk. Bij IPv4 zijn er twee manieren om de grens tussen deze twee delen aan te geven:

* door de prefix-lengte, in de notatie `/xx`, waarin *xx* het aantal bits van de prefix aangeeft.
* door het netmasker, in decimale notatie voor de bytes, bijvoorbeeld `255.255.254.0`. Hierin geven de "1"-bits aan welk deel tot de prefix behoort.

Voor het uitrekenen van de lengte uit een byte-masker (of omgekeerd) kun je de volgende tabel gebruiken:

```{figure} images/prefix-tabel.png
:width: 300px

Verband tussen byte-masker en prefix-lengte
```

Voorbeeld: het netmasker `255.255.254.0` komt overeen met prefix-lengte 8 + 8 + 7 + 0 = 23. Het netmasker `255.255.248.0` geeft prefix-lengte 8 + 8 + 5 + 0 = 21.

> Een IPv6 adres bestaat uit 128 bits: de eerste 64 bits vormen het netwerkadres; de laatste 64 bits, het adres van de host in het netwerk.


```{figure} images/internet-tiers.png
:width: 600px

Internet-tiers
```

---

```{todo} figuur-tiers

figuur van de manier waarop de verschillende lagen (tiers) in het internet verbonden zijn.

* https://en.wikipedia.org/wiki/Tier_1_network
    * ik begrijp deze figuur niet helemaal, o.a. de PoP-elementen?
* (er is nog een andere, voor mijn gevoeg duidelijker figuur. Waar?

```