# Construire une carte interactive √† partir de Glottolog

Dans cet exercice, vous allez produire une carte interactive en HTML, en partant de la page d'une langue (ou famille de langues) de votre choix sur le site [Glottolog](https://glottolog.org/). Pour ce faire, vous allez :
1. Naviguer automatiquement sur le site pour afficher la page de la carte, puis la fen√™tre contenant les donn√©es correspondantes.
2. Extraire les coordonn√©es des points au format GeoJSON.
3. D√©clarer une carte avec les coordonn√©es de d√©part et le fond de carte de votre choix.
4. Cr√©er une couche de donn√©es et y ajouter les points dont vous avez obtenu les coordonn√©es.

## R√©cup√©rer les donn√©es GeoJSON

### Import des librairies et initialisation d'un `webdriver`

Vous n'avez pas besoin de modifier la cellule ci-dessous, elle contient les modules et librairies Python dont vous aurez besoin pour cette partie du travail. Pour que le programme fonctionne, n'oubliez pas de l'ex√©cuter quand m√™me ! (`ctrl`+`enter` ou `shift`+`enter`)
* `webdriver` de `selenium` simule un navigateur web et permettra de mettre en place une navigation script√©e.
* `time` propose des fonctions relatives au temps, et vous servira ici √† mettre le script en pause pour laisser charger les pages web.

In [None]:
from selenium import webdriver
import time

La cellule ci-dessous peut √©galement rester telle quelle, et initie un objet `webdriver` √©mulant le navigateur Firefox. Celui-ci correspond √† la variable `driver`, que vous pouvez d√©sormais utiiser pour mettre en place une navigation automatique. 

In [None]:
options = webdriver.FirefoxOptions()
options.headless = True
options.add_argument('--ignore-certificate-errors')
options.add_argument('--incognito')
options.add_argument('--headless')
webdrivers_path = "./WebDrivers/"
driver = webdriver.Firefox(webdrivers_path, options=options)

Pour des explications plus d√©taill√©es sur l'utilisation de `selenium` et `webdriver`, vous pouvez consulter [cet article](https://tekipaki.hypotheses.org/1475).

**Pour la suite, √† vous de jouer !**

###  Acc√©der √† la page web, cliquer sur le bouton pour afficher la carte

Pour commencer, ouvrez votre navigateur pr√©f√©r√© et naviguez manuellement sur le site [Glottolog](https://glottolog.org) pour choisir la langue ou famille que vous voulez repr√©senter sur votre carte. Vous trouverez sur [cette page](https://glottolog.org/glottolog/language) une liste des langues disponibles.

Affichez la page correspondant √† la langue choisie. Son URL devrait correspondre √† `https://glottolog.org/resource/languoid/id/` suivi de l'identifiant de la langue dans la base de Glottolog (4 lettres + 4 chiffres).

Dans la cellule ci-dessous, associez cette URL √† la variable `url`.

In [None]:
# url = ""

La page comporte un bouton *show big map*, tel que montr√© sur l'image ci-dessous (entour√© d'une jolie ellipse orange).

![show big map button](minn1241_webpage_showmapbutton.png "Show big map button (minn2141)")

Associez le lien vers lequel pointe ce bouton √† la variable `map_page`. Acc√©dez ensuite √† ce lien via votre objet `driver`d√©clar√© plus haut. La fonction de `driver` permettant d'acc√©der √† une page web s'appelle `.get()` et prend l'URL en param√®tre. 

In [None]:
# associer le lien √† la variable map_page
# acc√©der √† l'URL avec driver

Si tout se passe bien, votre `driver` acc√®de maintenant √† la page sur laquelle est affich√©e la carte. Mais √ßa ne suffit pas pour pouvoir g√©n√©rer votre propre carte ensuite. Ce dont vous avez besoin, ce sont les coordonn√©es g√©ographiques de l'ensemble des points repr√©sent√©s sur la carte.

### Ouvrir la fen√™tre contenant les coordonn√©es des points

Ces donn√©es sont disponibles au format GeoJSON, vous pouvez y acc√©der en cliquant sur le bouton *GeoJSON* en haut √† droite de la fen√™tre de la carte. Si vous cliquez dessus √† la main, puis sur le nom de la langue dans le menu d√©roulant, vous d√©clencherez l'ouverture d'une fen√™tre modale.

Dans le navigateur que vous avez ouvert pour naviguer manuellement, inspectez le code source pour r√©cup√©rer l'identifiant de ce bouton *GeoJSON*. Dans votre script, c'est `driver` qui va rep√©rer cet √©l√©ment pour que vous puissiez ensuite lui donner l'instruction de cliquer dessus.

La fonction de `driver` qui vous permet de rep√©rer un √©l√©ment donn√© dans le code source est `.find_element_by_id("id-de-l-element")`. Pour pouvoir l'utiliser ensuite, je vous propose de l'associer √† la variable `opener`.

In [None]:
# associer le bouton GeoJSON √† la variable opener

Votre `driver` a maintenant connaissance du bouton *GeoJSON* mais n'a pas encore interagi avec. 

Pour cliquer sur un √©l√©ment, rien de plus simple, il suffit d'appeler dessus la fonction `.click()` (d'o√π l'int√©r√™t d'avoir associ√© le bouton √† une variable).

Ce clic va ouvrir le menu d√©roulant. Par pr√©caution, il vaut mieux laisser un petit temps de repos pour s'assurer que le chargement est bien termin√©. La fonction `time.sleep()` prend en param√®tre une dur√©e en secondes, et permet de mettre le script en pause. 

In [None]:
# cliquer sur le bouton GeoJSON
# mettre le script en pause pendant une seconde

Tout ceci est bien entendu invisible, mais tout comme un utilisateur humain qui aurait cliqu√© sur le bouton *GeoJSON*, `driver` est maintenant capable d'interagir avec les √©l√©ments du menu d√©roulant.

Pour ouvrir la fen√™tre modale, il faut cliquer sur le nom de la langue dans le menu d√©roulant, en suivant la m√™me proc√©dure que pour le bouton *GeoJSON*. L'`id` de l'item du menu sur lequel cliquer sera associ√© √† la variable `geo_container`.

In [None]:
# associer l'√©l√©ment du menu d√©roulant (nom de la langue) √† la variable geo_container
# cliquer sur cet √©l√©ment
# mettre le script en pause pendant une seconde

### Extraire le contenu textuel de la fen√™tre modale

La fen√™tre modale est maintenant "affich√©e" pour `driver`. Comme pour les autres √©l√©ments, pour interagir avec cette fen√™tre, il faut commencer par signaler son existence √† votre `driver`. 

Proc√©dez de la m√™me fa√ßon qu'avec les boutons pour rep√©rer la fen√™tre modale, et associez-la √† la variable `geo_contents`. 

In [None]:
# associer la fen√™tre modale √† la variable geo_contents

Les donn√©es dont vous avez besoin sont √† port√©e de `driver` ! 

Comment les obtenir ? Si vous observez le contenu de `geojson_contents`, par exemple avec `print()` ou avec `type()`, vous pouvez remarquer qu'il s'agit d'un objet `webelement` (`webelement.FirefoxWebElement`, puisque `driver` a ici √©t√© initi√© √† partir d'un pilote Firefox). 

In [None]:
type(geojson_contents)

La [documentation *Web Elements*](https://www.selenium.dev/documentation/webdriver/elements/) indique ce que vous pouvez faire avec cette classe d'objets. 

Parcourez cette documentation pour retrouver comment obtenir le contenu textuel d'un `webelement`. Associez le r√©sultat obtenu √† la variable `geojson_data`.

In [None]:
# associer le contenu textuel de la fen√™tre modale √† la variable geojson_data

Pour v√©rifier si les donn√©es ont bien √©t√© r√©cup√©r√©es, utilisez `print(geojson_data)`. Les donn√©es au format GeoJSON devraient alors s'afficher.

In [None]:
print(geojson_data)

Si c'est bien le cas, vous pouvez refermer votre `driver` et passer √† la suite.

In [None]:
driver.quit()

## Construire la repr√©sentation cartographique

### Import de la librairie `folium`

Pour produire une carte au format HTML, vous aurez besoin de la librairie `folium`. Celle-ci est import√©e dans la cellule ci-dessous, qui n'a pas besoin d'√™tre modifi√©e.

In [None]:
import folium

### Mettre en place le fond de carte

Avant de repr√©senter les donn√©es, il faut d'abord d√©clarer et param√©trer la carte, via une instance d'objet `Map` de la librairie `folium`. Vous pouvez √©ventuellement initialiser l'objet sans lui attribuer de param√®tre, en l'associant √† la variable `ma_carte`.

In [None]:
# d√©clarez la variable ma_carte en lui associant une instance d'objet folium Map() sans pr√©ciser de param√®tre 

Pour obtenir un aper√ßu de la carte, il suffit d'appeler la variable dans laquelle elle est stock√©e.

In [None]:
# pr√©visualiser la carte

In [None]:
ma_carte

Vous obtenez bien une carte, mais cette vue par d√©faut n'est ni satisfaisante ni optimale pour visualiser des donn√©es.

D√©clarez √† nouveau votre carte, en renseignant au moins les param√®tres `location` (coordonn√©es par d√©faut), `zoom_start` (zoom par d√©faut, bas√© sur la valeur de `location`), et `tiles` (fond de carte par d√©faut).

Pour ce faire, vous pouvez vous aider de [cette page de la documentation de `folium`](https://python-visualization.github.io/folium/modules.html). Si vous ne lisez pas l'anglais, [cet article de *Tekipaki*](https://tekipaki.hypotheses.org/1225) peut √©galement vous apporter des informations.

In [None]:
# d√©clarer √† nouveau la carte avec ses param√®tres

In [None]:
# pr√©visualiser √† nouveau la carte

C'est (normalement) beaucoup mieux comme √ßa !

### D√©clarer une couche de donn√©es

Il est temps d'ajouter √† la carte les donn√©es r√©cup√©r√©es sur Glottolog. Voici comment proc√©der :
1. D√©clarer une couche de donn√©es
2. Ajouter les donn√©es √† la couche
3. Ajouter la couche √† la carte

La couche de donn√©es correspond √† un objet de `folium` nomm√© `FeatureGroup`. Vous trouverez ses diff√©rents param√®tres dans [la documentation](https://python-visualization.github.io/folium/modules.html#folium.map.FeatureGroup), mais vous pouvez ici l'initialiser avec seulement le param√®tre `name`. 

Pour pouvoir √™tre ajout√©e √† la carte ensuite il est indispensable de stocker les informations de la couche de donn√©es dans une variable ; je vous conseille de la nommer de fa√ßon √† identifier quelles sont les donn√©es correspondantes (vous pouvez par exemple reprendre l'identifiant Glottolog de la langue que vous avez choisie).

In [None]:
# d√©clarer une couche de donn√©es en renseignant le param√®tre name, l'associer √† une variable nomm√©e explicitement

### Reporter les coordonn√©es g√©ographiques dans la couche de donn√©es

La couche de donn√©es existe maintenant dans le sens o√π une instance d'objet `FeatureGroup` a √©t√© cr√©√©, mais elle ne comporte aucune information (√† part son nom), et n'est pas reli√©e √† la carte.

Pour rappel, les coordonn√©es sont actuellement stock√©es dans la variable `geojson_data`, au format GeoJSON.

Celles-ci correspondent √† une s√©rie de points. Dans le code, chaque point correspondra √† un objet `folium.CircleMarker()` qui prendra en param√®tre les coordonn√©es g√©ographiques `[latitude, longitude]`.

Il n'est pas n√©cessaire de comprendre l'int√©gralit√© des informations, mais il faut au moins comprendre comment identifier :
* Quelle portion de la structure JSON correspond √† un point ?
* Dans cette portion, o√π sont indiqu√©es les coordonn√©es g√©ographiques ?

Vous pouvez les rep√©rer en parcourant manuellement le contenu de `geojson_data`.

In [None]:
# afficher le contenu de la variable geojson_data

Il est plus efficace de parser le contenu pour le parcourir automatiquement, ce qui n'est pas possible en l'√©tat car `geojson_data` est en fait une simple cha√Æne de caract√®res.

In [None]:
type(geojson_data)

Python dispose de diff√©rents moyens de lire du JSON, voici une fa√ßon de faire via `folium`.

Ex√©cutez la cellule ci-dessous, et v√©rifiez √† quel type de donn√©es correspond la variable `geo_data`.

In [None]:
geo_data = folium.GeoJson(geojson_data).data

In [None]:
# v√©rifier le type de geo_data

Le type `dict` correspond √† un dictionnaire, c'est-√†-dire une liste associative.

`geo_data` peut maintenant √™tre parcouru automatiquement avec les m√©thodes relatives √† la classe `dict` ([documentation](https://docs.python.org/3/tutorial/datastructures.html#dictionaries)) ou avec des boucles. Par exemple :

In [None]:
for key in geo_data:
    print(key)

Vous avez maintenant tout ce qu'il vous faut pour ajouter vos donn√©es √† la couche d√©clar√©e pr√©c√©demment. 

Sachant qu'un point est ajout√© avec la fonction `.add_to(nom_de_la_couche_de_donnees)`, d√©commentez et compl√©tez le code de la cellule suivante :

In [None]:
"""
for feature in ...:
    folium.CircleMarker(
        location=...,
    ).add_to(...)
"""

### Ajouter la couche de donn√©es √† la carte

Le plus dur est fait. La fonction `.add_to()` permet √©galement d'ajouter une couche de donn√©es √† une carte, en utilisant la syntaxe `nom_de_la_couche_de_donnees.add_to(nom_de_la_carte)`.

In [None]:
# ajouter la couche de donn√©es √† la carte

F√©licitations, vous avez termin√© ! üéâ 

Les point appara√Ætront maintenant lorsque vous visualiserez votre carte. Vous pouvez admirer le r√©sultat de votre travail en appelant la variable correspondant √† la carte.

In [None]:
# visualiser la carte

## Aller plus loin

Si vous voulez continuer √† vous amuser avec les repr√©sentations cartographiques produite par `folium`, voici quelques suggestions sur ce que vous pouvez essayer :

* Exporter la carte dans un fichier HTML
* Tracer d'autres s√©ries de points
* Tracer un ou plusieurs polygones
* Capturer l'image de la carte dans un fichier PNG
* Mettre en place un *layer control*
* D√©finir des fonctions pour r√©p√©ter ais√©ment les traitements

Les diff√©rents [articles consacr√©s √† la cartographie de donn√©es linguistiques sur *Tekipaki*] pourront vous √™tre utiles si besoin.

---

<a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-sa/4.0/88x31.png" /></a><br /><span xmlns:dct="http://purl.org/dc/terms/" href="http://purl.org/dc/dcmitype/InteractiveResource" property="dct:title" rel="dct:type">LTTAC_2021_TP_cartographie_linguistique</span> de <a xmlns:cc="http://creativecommons.org/ns#" href="https://tekipaki.hypotheses.org/" property="cc:attributionName" rel="cc:attributionURL">Alexander Delaporte</a> est mis √† disposition selon les termes de la <a rel="license" href="http://creativecommons.org/licenses/by-sa/4.0/">licence Creative Commons Attribution -  Partage dans les M√™mes Conditions 4.0 International</a>.<br />Code source disponible : <a xmlns:dct="http://purl.org/dc/terms/" href="https://github.com/alxdrdelaporte/LTTAC_2021_TP" rel="dct:source">https://github.com/alxdrdelaporte/LTTAC_2021_TP</a>.