# **Outil de création d'une carte interactive par catégories**

Les outils de recherches d'informations permettent de récupérer les emplacements de chaque lieu (coordonnées GPS), le type de lieu dans lequel il est catégorisé ainsi qu'une brève description du lieu. Il est possible, à la fin du notebook, d'ajouter son propre fond de carte.

*Document d'entrée* : un fichier au format TXT contenant la liste des noms de lieux à recenser sur la carte.

*Documents de sortie* : une carte au format HTML + un fichier avec les identifiants Wikidata des lieux + un fichier sous la forme d'un tableau lisible avec Excel avec les informations récoltées + le même fichier mais en format JSON pour une utilisation machine.



In [None]:
#@markdown # Connexion du notebook à son compte Google Drive et signalement du dossier de travail :

#@markdown - Lancer la cellule
#@markdown - Cliquer sur « Exécuter malgré tout » lors de l’apparition du message d’avertissement indiquant que le notebook n’a pas été créé par Google
#@markdown - Cliquer sur « Se connecter à Google Drive » lors de l’apparition du second message d’avertissement pour donner l’autorisation au notebook d’accéder à vos fichiers Google Drive
#@markdown - Choisir son compte Gmail puis cliquer sur « Autoriser »

!pip install geopy==1.17.0
!pip install wptools==0.4.17
from google.colab import drive
import folium
from geopy.geocoders import Nominatim
import pandas as pd
from folium import plugins
import json
import csv
import wptools
import re
import itertools
import urllib.parse, urllib.request
from collections import Counter
import matplotlib.pyplot as plt
from pandas.plotting import table
import os

drive.mount('/content/drive/')
%cd /content/drive/My Drive/

#@markdown ###Indiquer le chemin vers le dossier de travail sur le Google Drive (si le dossier n'existe pas, il sera créé lors du lancement de la cellule) :
chemin_vers_le_dossier_de_travail = '/content/drive/My Drive/Visualisations lieux/'#@param {type:"string"}

if not os.path.exists(chemin_vers_le_dossier_de_travail):
      os.makedirs(chemin_vers_le_dossier_de_travail)
os.chdir(chemin_vers_le_dossier_de_travail)

In [None]:
#@markdown # Récupération des identifiants Wikidata des lieux contenus dans le fichier texte :
#@markdown ####Indiquer le chemin vers le fichier texte avec la liste des lieux à détecter :
chemin_liste_des_lieux = '/content/drive/My Drive/Visualisations lieux/lieux.txt'#@param {type:"string"}
#@markdown ####Changer la langue si nécessaire (par défaut : français) :
langue = "fr" #@param {type:"string"}
#@markdown ####Si la détection des lieux n'est pas assez précise, descendre le seuil à 0.8 (moins de noms vont être identifiés). Dans le cas contraire, monter le seuil à 1.0 :
seuil = "1.0" #@param {type:"string"}

def CallWikifier(text, lang=langue, threshold=float(seuil)):
  # Thresold = taux de sureté. 0.8 = sûr que le résultat est exact; mais peu de résultat.
  # 1 = tous les résultats mais certains faux résultats
    # Url de demande:
    data = urllib.parse.urlencode([
        ("text", text), ("lang", lang),
        ("userKey", "nqvsutgqswvfmrcvyxjtopvpiukjtp"),
        ("pageRankSqThreshold", "%g" % threshold), ("applyPageRankSqThreshold", "true"),
        ("nTopDfValuesToIgnore", "200"), ("nWordsToIgnoreFromList", "200"),
        ("wikiDataClasses", "true"), ("wikiDataClassIds", "false"),
        ("support", "true"), ("ranges", "false"), ("minLinkFrequency", "4"),
        ("includeCosines", "false"), ("maxMentionEntropy", "3")
        ])
    url = "http://www.wikifier.org/annotate-article"
    # Appel de Wikifier 
    req = urllib.request.Request(url, data=data.encode("utf8"), method="POST")
    with urllib.request.urlopen(req, timeout = 100) as f:
        response = f.read()
        response = json.loads(response.decode("utf8"))
        print(response)
    # Sortie des annotations:
    #@markdown ####Indiquer le nom du fichier créé avec la liste des identifiants Wikidata :
    nom_fichier_liste_identifiants = 'id_wikidata_lieux.txt' #@param {type:"string"}
    with open(nom_fichier_liste_identifiants, 'w') as outfile:
        for annotation in response["annotations"]:
          ## Récupération (uniquement de l'ID wikidata):
          itemid = annotation["wikiDataItemId"] 
          itemid2 = "".join([str(itemid)," "])
          outfile.write(itemid2)

with open (chemin_liste_des_lieux, "r") as myfile:
    liste=myfile.read()

CallWikifier(text=liste)

In [None]:
#@markdown # Récupération des informations de chaque lieu reconnu et lié à Wikidata :

#@markdown Toutes les informations (le type de lieu, les coordonnées GPS (latitude et longitude) et une brève description du lieu) sont enregistrées et exportées sous la forme d'un fichier de données JSON et sous la forme d'un tableau dans un fichier Excel dans le Google Drive.

#@markdown ####Indiquer le nom du fichier avec les identifiants Wikidata créé dans la cellule précédente :
nom_fichier_liste_identifiants = "id_wikidata_lieux.txt" #@param {type:"string"}
#@markdown ####Indiquer le nom du fichier en format JSON créé avec les informations sur les lieux :
fichier_json_infos_lieux = "donnees_lieux.json" #@param {type:"string"}

donnees = {}
nom = []
type_lieu = []
latitude = []
longitude = []
longitude = []
description = []

# Utilisation du document créé précédement avec les identifiants wikidata:
with open(nom_fichier_liste_identifiants, "r") as a_file:
      with open(fichier_json_infos_lieux, "w") as fichier : 
        for line in a_file:
            for word in line.split():
              page = wptools.page(wikibase=word, lang="fr")
              page.get_wikidata()
              page.get_parse()
## Pour avoir toutes les informations:
              try:
                infobox=page.data['infobox']
                nom = infobox.get("nom")
                type_lieu=infobox.get("type")
                if type_lieu is None: 
                  type_lieu=page.data['what']
                latitude = infobox.get("latitude")
                longitude = infobox.get("longitude")
                description = page.data["description"]
              except AttributeError as at:
                print("Ce n'est pas un lieu!")
# Création d'un dictionnaire + fichier json avec les informations récupérées sur les lieux:
              donnees[nom] = {"Type de lieu" : type_lieu,
                              "Latitude" : latitude, "Longitude" : longitude, "Description": description}
      
        json.dump(donnees, fichier, ensure_ascii=False)

#@markdown ####Indiquer le nom du fichier en format XLSX créé avec les informations sur les lieux :
fichier_xlsx_infos_lieux = "informations_lieux.xlsx" #@param {type:"string"}

# Enregistrement de toutes les informations récupérées sous la forme d'un tableau Excel:
df = pd.DataFrame(donnees)
df2 = df.transpose()
df2.to_excel(fichier_xlsx_infos_lieux)

In [None]:
#@markdown # Outils de calculs statistiques :

#@markdown Cette cellule permet de calculer les types de lieux détectés sur Wikidata ainsi que la proportion de chaque. Le résultat s'affiche dans le résultat de la cellule (en dessous).

#@markdown Indiquer le nom du fichier en format JSON créé précédement avec les informations sur les lieux :
fichier_json_infos_lieux = "donnees_lieux.json" #@param {type:"string"}

# Récupération et création d'une liste avec catégories de lieux
keys = donnees[nom]["Type de lieu"]
liste_des_types = []
fichier_json = fichier_json_infos_lieux
with open(fichier_json, "r") as f :
  contenu_json = json.load(f)
  pairs = contenu_json.items()
  for key, value in pairs:
      test_types=value["Type de lieu"]
      liste_des_types.append(test_types)

def proportion_types(liste):
  c = Counter(liste)
  print("Voici le nombre de lieux, triés par chaque type:", "\n", c) ## Affiche le nombre de lieux de chaque type
  prop = [(i, c[i] / len(liste) * 100.0) for i in c]
  print("Voici la proportion de chaque type de lieux:", "\n", prop) ## Affiche la proportion de chaque type de lieux
  
proportion_types(liste_des_types)

In [None]:
#@markdown # Création de la carte avec les outils de sélection par type de lieux :

#@markdown La catégorisation des lieux faite par Wikidata est générée automatiquement pour permettre la sélection de certains types de lieux en particulier.

#@markdown Les coordonnées GPS sont récupérées pour intégrer directement les lieux sur la carte. La carte est originellement cadrée sur l'Europe. Il est possible de zoomer/dézoomer et de se déplacer pour accéder à l'endroit précis recherché. 

#@markdown La carte est enregistrée automatiquement en format HTML dans le dossier de travail sur le Google Drive. Il faut télécharger ensuite la carte sur son ordinateur pour pouvoir l'ouvrir dans un navigateur web.

# Faire liste des types de lieux
keys = donnees[nom]["Type de lieu"]
liste_des_types = []
fichier_json = fichier_json_infos_lieux
with open(fichier_json, "r") as f :
  contenu_json = json.load(f)
  pairs = contenu_json.items()
  for key, value in pairs:
      test_types=value["Type de lieu"]
      liste_des_types.append(test_types)

items = Counter(liste_des_types).keys() 
nbr_types_lieux = len(items)

### Affilier un numéro de groupe pour chaque catégorie
groupe = []
d = {ni: indi for indi, ni in enumerate(set(liste_des_types))}
numbers = [d[ni] for ni in liste_des_types]

for k, v in zip(contenu_json, numbers):
  groupe.append(v)
  for element in groupe:
    contenu_json[k]["Groupe"] = element

### Création du fonds de carte
map = folium.Map(location=[48.856614, 2.3522219], zoom_start=12)
fg = folium.FeatureGroup(name="Tous")
map.add_child(fg)

## Création des différentes catégories pour la carte
def creating_categories(nombre_categories, liste_noms_categories):
  g = []
  for k in contenu_json: 
    lat = contenu_json[k]["Latitude"] 
    longi = contenu_json[k]["Longitude"]
    for i, j in zip(range(nombre_categories), liste_noms_categories): 
      g=plugins.FeatureGroupSubGroup(fg, str(j)) 
      try:
        if str(j) == str(donnees[k]["Type de lieu"]):  
          try:
            folium.Marker([float(lat), float(longi)]).add_to(g) 
            map.add_child(g)  
          except TypeError as Te:
            pass
      except KeyError as kerr:
        pass

creating_categories(nbr_types_lieux, liste_des_types)

folium.LayerControl(collapsed=False).add_to(map)

#@markdown ####Indiquer le nom de la carte créée :
nom_carte = 'carte.html'#@param {type:"string"}

map.save(nom_carte)
map

In [None]:
#@markdown # Créer et ajouter son fond de carte :
#@markdown ####Si l'on veut ajouter son propre fond de carte personnalisé :
#@markdown - Création d’un compte sur : https://mapwarper.net/.
#@markdown - Téléchargement du fond de carte (IIIF recommandé, avec la meilleure résolution possible).
#@markdown - Sur Map Warper, dans l’onglet "Upload Map", il est possible de charger le fond de carte que l’on veut utiliser et d'indiquer toutes les métadonnées nécessaires.
#@markdown - Dans l’onglet "Rectify", il faut indiquer le plus de points identiques sur les deux cartes pour permettre la superposition du fond de carte chargé sur des données géolocalisées. Cliquer sur un point sur chaque carte, puis cliquer sur « add Control point » en dessous des cartes. Répéter l’opération le plus de fois possible pour obtenir un bon résultat. Dans l'encadré en dessous des deux fonds de carte, cliquer sur "Warp image" : le fond s'ajoute. Si le résultat n'est pas satisfaisant, il possible d'ajouter d'autres repères pour améliorer la qualité du nouveau fond de carte créé.
#@markdown - Se rendre dans l'onglet "Export". Dans "Map services", copier le lien entier se situant après "Tiles" (Google/OSM scheme):", débutant par http et se terminant par .png
#@markdown - Coller ensuite le lien ci-dessous :
fond_de_carte_cree = "https://mapwarper.net/maps/tile/54525/{z}/{x}/{y}.png" #@param {type:"string"}

#@markdown ####Indiquer le nom de la carte créée :
nom_carte = 'carte_perso.html'#@param {type:"string"}

### Création du fonds de carte
map = folium.Map(location=[48.856614, 2.3522219], zoom_start=12,
                 tiles=fond_de_carte_cree, attr="None")
fg = folium.FeatureGroup(name="Tous")
map.add_child(fg)

# Faire liste des types de lieux
keys = donnees[nom]["Type de lieu"]
liste_des_types = []
fichier_json = fichier_json_infos_lieux
with open(fichier_json, "r") as f :
  contenu_json = json.load(f)
  pairs = contenu_json.items()
  for key, value in pairs:
      test_types=value["Type de lieu"]
      liste_des_types.append(test_types)


items = Counter(liste_des_types).keys() 
nbr_types_lieux = len(items)

### Affilier un numéro de groupe pour chaque catégorie
groupe = []
d = {ni: indi for indi, ni in enumerate(set(liste_des_types))}
numbers = [d[ni] for ni in liste_des_types]

for k, v in zip(contenu_json, numbers):
  groupe.append(v)
  for element in groupe:
    contenu_json[k]["Groupe"] = element

## Création des différentes catégories pour la carte
def creating_categories(nombre_categories, liste_noms_categories):
  g = []
  for k in contenu_json: ### boucle: pour chasue lieu dontenu dans "donnees"
    lat = contenu_json[k]["Latitude"] 
    longi = contenu_json[k]["Longitude"]
    for i, j in zip(range(nombre_categories), liste_noms_categories): 
      g=plugins.FeatureGroupSubGroup(fg, str(j)) 
      try:
        if str(j) == str(donnees[k]["Type de lieu"]):  
          try:
            folium.Marker([float(lat), float(longi)]).add_to(g) 
            map.add_child(g)  
          except TypeError as Te:
            pass
      except KeyError as kerr:
        pass

creating_categories(nbr_types_lieux, liste_des_types)

folium.LayerControl(collapsed=False).add_to(map)

map.save(nom_carte)
map