# TP réseaux 2021/2022 - TP 2 - programmation socket en Python


L'API `socket` permet de créer des sockets, d'y écrire et de recevoir des données. Les clients et les serveurs communiquants via des `sockets` demandent généralement l'écriture de programme *asynchrone*. Dans un tel programme, des fonctions peuvent être mises en suspens, attendant par exemple la lecture de données dans une socket. Malheureusement, les fonctions de la l'API `socket` sont bloquantes et ne facilitent pas l'écriture d'applications client-serveur. Pour pallier cette problèmatique, on peut utiliser un primitive de multiplexage (comme la fonction `select`) qui permet l'écoute simultanée sur plusieurs sockets.


Dans ce TP, on se propose d'écrire du code réseau, via une API de plus haut niveau: `asyncio`. Cette API est  conçue pour la programmation *asynchrone* et ses `streams` permettent de manipuler des sockets de façon non bloquantes.


## À la conquête de `asyncio` et ses `async`/`await`


Ce sont les *coroutines* qui permettent des exécutions concurrentes : une *coroutine* est une fonction qui peut ``suspendre'' son exécution. On la définit par `async def NomDeLaCoroutine:` (notez l'emploi de `async` avant la **définition**).

Les coroutines (et plus généralement les tâches *attendables* ou *awaitable* en anglais) possèdent une méthode `await`. L'utilisation du mot clé `await` devant **l'appel** d'une coroutine (que ce soit une coroutine que nous avons définie nous-même ou une coroutine d'une API) signale que cet appel sera non bloquant. Attention, cela ne signifie pas que le code qui suit l'appel sera exécuté immédiatement, mais que s'il y a d'autres coroutines en attente et prêtes à continuer leur exécution, elles pourront poursuivre leur exécution. Le `await` rend la main à la boucle d'évènements pour l'exécution de ces autres fonctions ; l'exécution de la coroutine se poursuivra plus tard lorsque la coroutine appelée après `await` sera prête.


Voici un premier exemple. Au lieu d'utiliser la classique *fonction* `time.sleep()`, nous préférons appeler la *coroutine* `asyncio.sleep()`, complété par l'usage de `await`. Une *coroutine* peux être mise en attente, et c'est l'usage de `await` qui demande explicitement de l'attendre.

>```
>import asyncio
>
>async def affiche(msg):
>    await asyncio.sleep(5) # attendre 5 secondes
>    print(msg)
>
> asyncio.run(affiche("bonjour"))
> ```

C'est l'usage de `asyncio.run()` qui démarre la boucle d'exécution et lance la coroutine `affiche`. Notez que ce code ne fonctionne pas directement dans `jupyter` ou `spyder` (car ces logiciels ont déjà lancé la boucle d'exécution). En plus de `asyncio.run()`, l'usage de `asyncio.create_task()` planifie l'exécution d'une coroutine par la boucle d'exécution.

L'utilisation de toutes ces fonctions est décrite ici : https://docs.python.org/fr/3/library/asyncio-task.html

Un exemple complet :

```
import asyncio
import time

async def affiche(msg, delai):
    await asyncio.sleep(delai)
    print(msg)

async def attente():
    await affiche('Hello', 5)
    await affiche('World', 2)

async def concurente():
    task1 = asyncio.create_task(affiche('hello', 5))
    task2 = asyncio.create_task(affiche('world', 2))
    await task1
    await task2

print(f"started at {time.strftime('%X')}")
asyncio.run(attente())
print(f"finished at {time.strftime('%X')}")

print(f"started at {time.strftime('%X')}")
asyncio.run(concurente())
print(f"finished at {time.strftime('%X')}")
```

## Streams is our dreams

Bien que les fonctions de bas niveau de la bibliothèque [socket](https://docs.python.org/3.9/library/socket.html) permettent de manipuler les sockets, elles n'offrent pas le support de `async / await` pour la programmation concurrente. Aussi, nous préférons nous orienter vers les [Streams](https://docs.python.org/fr/3/library/asyncio-stream.html) et leurs coroutines pour interagir avec des connexions réseaux tout en supportant `async / await`. 


Voici quelques coroutines, dont nous vous laissons consulter la documentation :
- [`asyncio.open_connection()`](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.open_connection)
- [`asyncio.start_server()`](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.start_server) qui retourne un objet [Server](https://docs.python.org/fr/3/library/asyncio-eventloop.html#asyncio.Server)

Elles manipulent des paires objets `(reader, writer)`, respectivement de types [`StreamReader`](https://docs.python.org/fr/3/library/asyncio-stream.html#streamreader) et [`StreamWriter`](https://docs.python.org/fr/3/library/asyncio-stream.html#streamwriter), qui possèdent des méthodes pour y lire ou écrire :


- [reader.read()](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.StreamReader.read) et [reader.readline()](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.StreamReader.readline)
- [writer.write()](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.StreamWriter.write)
- [writer.close()](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.StreamWriter.close)
- [writer.get_extra_info()](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.StreamWriter.get_extra_info)
- [writer.drain()](https://docs.python.org/fr/3/library/asyncio-stream.html#asyncio.StreamWriter.drain)

# Première partie : découverte de l'API Streams

Le réseau virtuel de ce TP est fourni déjà entièrement configuré sous la forme d'une archive `labsock.tar.gz`. Une fois l'archive extraite, se placer dans un terminal à l'intérieur du répertoire labsock et démarrer le réseau virtuel à l'aide de la commande `kathara lstart`. Le lab contient 5 machines du domaine DNS iiia.net : quatre clients avec une console nommés `pc1`, `pc2`, `pc3` et `pc4`, ainsi qu'un serveur sans console `server`.

Afin d'observer le trafic réseau, connectez wireshark au réseau `rezo` à l'aide de la commande hôte suivante.

> $ kathara wire rezo


Pendant le TP, la commande `lsof -i TCP` (ou `lsof -i UDP`) permet de connaître les sockets actives. À l'aide de la commande `nmap`, identifier les ports ouverts sur chacune des machines.

# Où l'on écrit des clients TCP

## Protocole HTTP

Le code source `gethttp.py` contient un client HTTP rudimentaire qui affiche la réponse d'un serveur passé en argument à la demande de sa racine. Tester ce script en l'exécutant à l'aide de `./gethttp.py www | less`.
Étudier son code source et les primitives socket impliquées.

## Protocole SMTP

Écrire un client SMTP rudimentaire qui envoie un message de bienvenue à l'adresse mail donnée en argument. Le tester sur l'adresse `guest@iiia.net` dont on trouvera le serveur SMTP en interrogeant le DNS à l'aide de la commande `dig`.

Vérifier que l'utilisateur guest a bien reçu le message en affichant le contenu de sa boîte sur le serveur grâce à la commande suivante (le mot de passe est `guest`) :

> `pc1# ssh guest@server.iiia.net cat /var/mail/guest`

# Où l'on écrit des serveurs TCP


## Protocole DAYTIME


Écrire un **serveur** TCP pour le protocole daytime défini dans la RFC 867. 

Pour générer la date et l'heure actuelle, on pourra utiliser `datetime.now().strftime('%c')` après avoir ajouté en tête de programme `from datetime import datetime`.


## Serveur de Chat

Un *chat* permet à plusieurs participant de dialoguer entre eux.

Le code source `chatd.py` met en œuvre un protocole de salon de discussion rudimentaire qui accepte les connexions multiples. Lancer le serveur de chat sur `server` au moyen d'une connexion SSH :
> `pc1# ssh guest@server.iiia.net /shared/chatd.py`

Interagir avec ce serveur à l'aide de la commande `nc`. Étudier le code source. COMMANDE : nc -C ip port


## Proxy TCP

Écrire un proxy TCP `proxy.py` invoqué avec 3 arguments `port rhost rport` qui écoute sur le port `port`, sert de relais vers la machine `rhost` sur le port `rport` et affiche les messages échangés sur la console.
Tester votre programme en utilisant `pc1` comme serveur de chat, `pc2` comme proxy pour rediriger vers le serveur de chat et `pc3` et `pc4` comme clients. Comme montré dans l'exemple plus haut, on pourra créer des tâches avec `asyncio.create_task` et les exécuter de manière concurrente.

Attention, le proxy n'est qu'un relais, il ne décide pas à qui envoyer des messages. Lorsque `pc3` se connecte au proxy sur `pc2`, celui-ci crée une connexion vers le serveur de chat sur `pc1` et doit faire transiter tous les messages entre ces deux connexions. Lorsque `pc4` se connecte au proxy, celui-ci crée une nouvelle connexion vers le serveur de chat.


# Bonus : et pour quelques dollars de plus

Cette section est là pour occuper les étudiants qui auraient terminé toute la première partie avant la fin de la première séance.

Étudier la documentation de la bibliothèque [`socket`](https://docs.python.org/fr/3/library/socket.html) et en particulier les primitives liées aux sockets UDP [SOCK_DGRAM](https://docs.python.org/fr/3/library/socket.html#socket.SOCK_DGRAM) :
- [`socket.recvfrom`](https://docs.python.org/fr/3/library/socket.html#socket.socket.recvfrom)
- [`socket.sendto`](https://docs.python.org/fr/3/library/socket.html#socket.socket.sendto)

Ecrire un serveur UDP pour le protocole daytime en utilisant les fonctions de `socket`.

# Deuxième partie : échange de fichiers

Pour cette deuxième partie, le réseau virtuel `labsock` est utilisé pour expérimenter avec les protocoles, le développement proprement dit est à réaliser sur la machine hôte avec les outils de programmation de votre choix. 


## File Transfer Protocol

Le protocole FTP est l'un des plus vieux protocoles de l'internet. Toujours très utilisé, il permet d'échanger des fichiers entre un serveur et des clients. La [RFC 959](https://datatracker.ietf.org/doc/html/rfc959) décrit par le menu ce protocole d'une relative complexité.

Écrire un programme capable de se connecter à un serveur FTP et qui permet de naviguer dans l'arborescence du serveur et de télécharger un fichier en *mode passif binaire*. Le reste de cette section vous accompagne dans la découverte du protocole client FTP.

Pour observer le protocole FTP, dans le lab, activer wireshark et utiliser la commande `ftp` pour récupérer le fichier cake dans le répertoire /home/guest sur le serveur `server.iiia.net` à l'aide des commandes suivantes :

>```
pc1# ftp server.iiia.net
Name: guest
Password: guest
binary
passive
cd /home/guest
dir
get cake
exit
>```

Avec nc : 

nc -C 10.0.1.1 21 
USER guest
PASS guest
TYPE I // binary
PASV // passive
CWD /home/guest
...


Dans wireshark, étudier les échanges TCP et identifier deux connexions liées à ce transfert de fichier FTP. Identifier les commandes utilisées dans cet échange.

Lire la [page wikipedia sur FTP](https://fr.wikipedia.org/wiki/File_Transfer_Protocol) pour avoir une vue plus précise du protocole, que vous compléterez au besoin par la consultation de la [RFC 959](https://datatracker.ietf.org/doc/html/rfc959).

Une fois votre client écrit, tester qu'il fonctionne en récupérant sur le serveur `ftp.lip6.fr` le fichier `rfc99.txt` du répertoire `/pub/rfc/rfc/` pour l'utilisateur `ftp` de mot de passe `guest@`.

## Trivial File Transfer Protocol

Le protocole [TFTP](https://datatracker.ietf.org/doc/html/rfc1350) est, comme son nom l'indique, un protocole d'échange de fichier très rudimentaire, principalement utilisé pour le transfert de fichier lors d'un démarrage de machine à travers le réseau (utilisé en complément du protocole BOOTP). La [RFC 1350](https://datatracker.ietf.org/doc/html/rfc1350) décrit par le menu ce protocole relativement simple.

Écrire un serveur TFTP qui permet de lire et d'écrire des fichiers dans le répertoire courant du serveur en mode octet. Pour vous accompagner dans cette tâche vous trouverez sur Celene de la documentation sur l'écriture de client/serveur UDP pour le langage C. Le reste de cette section vous accompagne dans la découverte du protocole TFTP.

Pour observer le protocole TFTP, dans le lab Kathará, activer wireshark et utiliser la commande tftp pour récupérer le fichier cake dans le répertoire /srv/tftp sur le serveur server.iiia.net à l'aide des commandes suivantes :

> ```
pc1# tftp server.iiia.net
binary
verbose
trace
get cake
put cake
quit
>```

Lire la [page wikipedia anglaise sur TFTP](https://en.wikipedia.org/wiki/Trivial_File_Transfer_Protocol) pour avoir une vue plus précise du protocole, que vous compléterez au besoin par la consultation de la [RFC 1350]((https://datatracker.ietf.org/doc/html/rfc1350)).


Tester votre serveur avec le client tftp.

## Bonus : et pour quelques dollars de plus

Cette section est là pour occuper les étudiants qui auraient terminé toute la deuxième partie avant la fin de la seconde séance.

Écrire un serveur FTP qui permette de lire et d'écrire des fichiers dans le répertoire courant et ses sous-répertoires en mode passif binaire. La mise en œuvre devra être assez robuste pour que le client classique en ligne de commande ftp fonctionne avec votre serveur.

