## Variables

### Import des librairies

In [1]:
import os
import urllib.parse as up
from rdflib import Graph
import code.functions as fn

### Définition des variables globales

In [2]:
# Fichiers existants
addr_ont_file = "address_ont.ttl"
ev_ont_file = "events_ont.ttl"

# Fichiers créés durant le processus
export_file = "addresses-temp.ttl"
out_file = "addresses.ttl"
local_config_file_name = "config_repo.ttl"

temp_folder = "tmp_files"
source_folder = "sources"
mapping_folder = "mappings"
wikidata_folder = "wikidata"

project_name = "voies_paris_hist" 
graphdb_url = "http://localhost:7200"

wd_graph_name = "wikidata"
addr_graph_name = "local_street"

### Traitement des variables globales

* Obtention des chemins absolus des fichiers à partir des chemins relatifs donnés dans la section précédente
* Création d'un dossier temporaire s'il n'existe pas encore pour stocker des fichiers à vocation d'être supprimés

In [3]:
temp_folder = os.path.abspath(temp_folder)
wikidata_folder = os.path.join(temp_folder, wikidata_folder)
source_folder = os.path.abspath(source_folder)
mapping_folder = os.path.abspath(mapping_folder)

fn.create_folder_if_not_exists(temp_folder)
fn.create_folder_if_not_exists(wikidata_folder)

local_config_file_name = os.path.join(temp_folder, local_config_file_name)

## Gestion du répertoire local

### Création du répertoire local dans GraphDB
Pour que la création marche, il faut que GraphDB soit lancé et donc que l'URI donné par `graphdb_url` fonctionne. Si le répertoire existe déjà, rien n'est fait

In [4]:
fn.create_config_local_repository_file(local_config_file_name, project_name)
url = f"{graphdb_url}/rest/repositories"
curl_cmd_local = fn.get_curl_command("POST", url, content_type="multipart/form-data", form=f"config=@{local_config_file_name}")
os.system(curl_cmd_local)

{"message":"Repository voies_paris_hist already exists."}

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  1649    0    57  100  1592   1545  43156 --:--:-- --:--:-- --:--:-- 54966


0

### Vidage du répertoire local
Le répertoire dont l'id est `project_name` pour y stocker les données récupérées, cela est utile si le répertoire existait déjà.

In [13]:
url = f"{graphdb_url}/repositories/{project_name}/statements"
cmd = fn.get_curl_command("DELETE", url, content_type="application/x-turtle")
os.system(cmd)

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0


0

### Import des ontologies

In [5]:
abs_addr_ont_file = os.path.abspath(addr_ont_file)
abs_ev_ont_file = os.path.abspath(ev_ont_file)
                              
url = f"{graphdb_url}/repositories/{project_name}/statements"
cmd_1 = fn.get_curl_command("POST", url, content_type="application/x-turtle", local_file=abs_addr_ont_file)
cmd_2 = fn.get_curl_command("POST", url, content_type="application/x-turtle", local_file=abs_ev_ont_file)

os.system(cmd_1)
os.system(cmd_2)

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 19366    0     0  100 19366      0   105k --:--:-- --:--:-- --:--:--  112k
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100 12901    0     0  100 12901      0  73114 --:--:-- --:--:-- --:--:-- 75444


0

## Import des données de Wikidata
Récupération des fichiers ttl d'éléments de Wikidata (voies, quartiers, arrondissements de Paris). Ensuite ces fichiers sont importés dans le répertoire local.

### Récupération des éléments de Wikidata
Pour chaque élément Wikidata décrivant une rue de Paris, on extrait un fichier `ttl` le décrivant.
Ce processus peut prendre du temps (environ 1 heure et demie) du fait du nombre d'éléments à récupérer (presque 7000).

#### Création des requêtes
Création des requêtes pour récupérer les données liées aux voies de Paris et une autre pour avoir les zones de la ville (quartiers administratifs et arrondissements)

In [15]:
qid_variable = "qid"

query_streets = f"""
SELECT DISTINCT ?{qid_variable}
WHERE {{
{{?{qid_variable} p:P361 [ps:P361 wd:Q16024163].}}
UNION
{{?{qid_variable} p:P361 [ps:P361 wd:Q107311481].}}
}}
ORDER BY ?{qid_variable}
"""

query_areas = f"""
SELECT DISTINCT ?qid WHERE {{
  {{BIND (wd:Q90 AS ?{qid_variable}) }}
  UNION{{?{qid_variable} p:P31 [ps:P31 wd:Q252916].}}
  UNION{{?{qid_variable} p:P31 [ps:P31 wd:Q702842]; p:P131 [ps:P131 wd:Q90].}}
}}
"""

#### Lancement des requêtes

In [16]:
# # Décommenter ces lignes pour récupérer les données

# # Récupération des voies de Paris
# fn.get_ttl_files_from_wikidata_query(query_streets, qid_variable, wikidata_folder, flavor="dump")

# #Récupération des zones de Paris
# fn.get_ttl_files_from_wikidata_query(query_areas, qid_variable, wikidata_folder, flavor="dump")

### Import des fichiers `ttl` venant de Wikidata
Importer tous les fichiers ttl dans un graphe nommé défini par `wd_graph_name` dans le répertoire (une dizaine de minutes pour 7000 fichiers)

In [None]:
fn.upload_ttl_folder_in_graphdb_repository(wikidata_folder, graphdb_url, project_name, wd_graph_name)

## Traitements pour créer / importer des données

### Requêtes SPARQL pour construire le graphe des rues de Paris à partir de Wikidata

:warning: Impossible de chaîner les requêtes sur le endpoint de Wikidata, d'où la séparation de celles-ci sous plusieurs variables

Note : `wd:Q16024163` décrit l'élément `réseau viaire de Paris` donc le triplet `?street p:P361 [ps:P361 wd:Q16024163].` permet de sélectionner les élements qui font partie de ce réseau. `wd:Q107311481` est similaire à la différence qu'il décrit l'élément `anciennes voies de Paris`.

* `query_1` : sélection des voies de Paris avec leur label, leurs potentiels alias, ainsi que leur localisation (arrondissements et/ou quartiers)
* `query_2` : sélection des voies de Paris avec l'ensemble de leur nom officiel avec si elles existent les dates de début et de fin de validité du nom officiel pour la voie
* `query_3` : sélection (si elles existent) des dates de création et de disparition des voies de Paris
* `query_4` : sélection des arrondissements de Paris avec leur label, leurs potentiels alias et leur localisation (qui est normalement Paris, ie `wd:Q90`)
* `query_5` : similaire à `query_4` mais repose sur les quartiers de Paris (leur localisation est normalement un arrondissement)
* `query_6` : récupération de données sur la ville de Paris (label, alias)


In [21]:
# Récupération de l'URI des graphes à partir de leur nom
wd_graph_name_uri = fn.get_graph_uri_from_name(graphdb_url, project_name, wd_graph_name)
addr_graph_name_uri = fn.get_graph_uri_from_name(graphdb_url, project_name, addr_graph_name)

# Récupération des préfixes pour les requêtes
prefixes = fn.get_repository_prefixes(graphdb_url, project_name)
prefixes += f"\nPREFIX ofn:<http://www.ontotext.com/sparql/functions/>"

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  1883    0  1883    0     0   122k      0 --:--:-- --:--:-- --:--:--  262k


In [22]:
# Structurer les rues de Paris, et les zones selon notre modèle

# Vider le graphe `addr_graph_name_uri`
query0 = prefixes + f"""
DELETE {{ ?s ?p ?o }}
WHERE {{ GRAPH <{addr_graph_name_uri}> {{ ?s ?p ?o }} }}
"""

# Création des rues de Paris et ajout d'un lien owl:sameAs avec son équivalent sur Wikidata
query1 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
  ?landmark a addr:Landmark;
           addr:isLandmarkType addr:Thoroughfare;
           addr:hasAttribute ?attrName;
           owl:sameAs ?street.
  ?attrName a addr:Attribute; addr:isAttributeType addr:NameAttribute.
}} }}
WHERE {{
  {{ ?street p:P361 [ps:P361 wd:Q16024163]. }}
  UNION
  {{ ?street p:P361 [ps:P361 wd:Q107311481]. }}
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#LM_", STRUUID())), ?x) AS ?landmark)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#AN_", STRUUID())), ?x) AS ?attrName)
  }}
"""

query2 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
 ?landmark rdfs:label ?streetLabel;
           skos:altLabel ?streetAltLabel;
           addr:within ?loc ;
           addr:hasAttribute ?officialNameAttr.
}} }}
WHERE {{
  ?landmark a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; owl:sameAs ?street.
  ?street wdt:P131 ?loc.
  ?street rdfs:label ?streetLabel.
  FILTER (LANG(?streetLabel) = "fr")
  OPTIONAL {{?street skos:altLabel ?streetAltLabel. FILTER (LANG(?streetAltLabel) = "fr")}}
}}
"""

# Obtention des noms officiels des rues
query3 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
  ?attrName addr:version ?attrNameVersion.
  ?attrNameVersion owl:sameAs ?officialNameSt; a addr:AttributeVersion; addr:value ?officialName.
  ?startEvent a addr:Event; addr:hasTime ?startTimeInstant.
  ?endEvent a addr:Event; addr:hasTime ?endTimeInstant.
  ?startChange a addr:AttributeChange; addr:isChangeType addr:NameChange; addr:dependsOn ?startEvent; addr:appliedTo ?attrName; addr:after ?attrNameVersion.
  ?endChange a addr:AttributeChange; addr:isChangeType addr:NameChange; addr:dependsOn ?endEvent; addr:appliedTo ?attrName; addr:before ?attrNameVersion.
  ?startTimeInstant a addr:TimeInstant; addr:timeStamp ?startDateValue; addr:timePrecision ?startDatePrec; addr:timeCalendar ?startDateCal.
  ?endTimeInstant a addr:TimeInstant; addr:timeStamp ?endDateValue; addr:timePrecision ?endDatePrec; addr:timeCalendar ?endDateCal.
}} }}
WHERE {{
  ?landmark a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; owl:sameAs [p:P1448 ?officialNameSt]; addr:hasAttribute ?attrName.
  ?attrName a addr:Attribute; addr:isAttributeType addr:NameAttribute.
  ?officialNameSt ps:P1448 ?officialName.
  OPTIONAL{{?officialNameSt pqv:P580 [wikibase:timeValue ?startDateValue; wikibase:timePrecision ?startDatePrec; wikibase:timeCalendarModel ?startDateCal]}}
  OPTIONAL{{?officialNameSt pqv:P582 [wikibase:timeValue ?endDateValue; wikibase:timePrecision ?endDatePrec; wikibase:timeCalendarModel ?endDateCal]}}
  FILTER (LANG(?officialName) = "fr")
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#ANV_", STRUUID())), ?x) AS ?attrNameVersion)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#EV_", STRUUID())), ?x) AS ?startEvent)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#CH_", STRUUID())), ?x) AS ?startChange)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#EV_", STRUUID())), ?x) AS ?endEvent)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#CH_", STRUUID())), ?x) AS ?endChange)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#TE_", STRUUID())), ?x) AS ?startTimeInstant)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#TE_", STRUUID())), ?x) AS ?endTimeInstant)
}}
"""

# Obtention des dates de création et des dissolution des rues
query4 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
  ?startEvent a addr:Event; addr:hasTime ?startTimeInstant.
  ?endEvent a addr:Event; addr:hasTime ?endTimeInstant.
  ?startChange a addr:LandmarkChange; addr:isChangeType addr:Creation; addr:appliedTo ?landmark; addr:dependsOn ?startEvent.
  ?endChange a addr:LandmarkChange; addr:isChangeType addr:Dissolution; addr:appliedTo ?landmark; addr:dependsOn ?endEvent.
  ?startTimeInstant a addr:TimeInstant; addr:timeStamp ?creationTimeValue; addr:timePrecision ?creationTimePrec; addr:timeCalendar ?creationTimeCal.
  ?endTimeInstant a addr:TimeInstant; addr:timeStamp ?dissolutionTimeValue; addr:timePrecision ?dissolutionTimePrec; addr:timeCalendar ?dissolutionTimeCal.
}} }}
WHERE {{
  ?landmark a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; owl:sameAs ?street.
  OPTIONAL {{ ?street p:P571 [psv:P571 [wikibase:timeValue ?creationTimeValue; wikibase:timePrecision ?creationTimePrec; wikibase:timeCalendarModel ?creationTimeCal]]. }}
  OPTIONAL {{ ?street p:P576 [psv:P576 [wikibase:timeValue ?dissolutionTimeValue; wikibase:timePrecision ?dissolutionTimePrec; wikibase:timeCalendarModel ?dissolutionTimeCal]]. }}
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#EV_", STRUUID())), ?x) AS ?startEvent)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#CH_", STRUUID())), ?x) AS ?startChange)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#EV_", STRUUID())), ?x) AS ?endEvent)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#CH_", STRUUID())), ?x) AS ?endChange)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#TE_", STRUUID())), ?x) AS ?startTimeInstant)
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#TE_", STRUUID())), ?x) AS ?endTimeInstant)
}}
"""

# Données relatives aux arrondissements de Paris
query5 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
  ?landmark a addr:Landmark;
           addr:isLandmarkType addr:District;
           rdfs:label ?arrdtLabel;
           skos:altLabel ?arrdtAltLabel;
           addr:within wd:Q90;
           addr:startDate ?startDate;
           owl:sameAs ?arrdt.
}} }}
WHERE {{
  ?arrdt wdt:P31 wd:Q702842; p:P131 [ps:P131 wd:Q90]; rdfs:label ?arrdtLabel; skos:altLabel ?arrdtAltLabel.
  FILTER(LANG(?arrdtLabel) = "fr" && LANG(?arrdtAltLabel) = "fr")
  OPTIONAL {{?arrdt wdt:P571 ?startDate}}
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#LM_", STRUUID())), ?x) AS ?landmark)
}}
"""

# Données relatives aux quartiers administratifs de Paris
query6 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
  ?landmark a addr:Landmark;
           addr:isLandmarkType addr:District;
           rdfs:label ?quartierLabel;
           skos:altLabel ?quartierAltLabel;
           addr:within ?loc; 
           owl:sameAs ?quartier.
}} }}
WHERE {{
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#LM_", STRUUID())), ?x) AS ?landmark)
  ?quartier wdt:P31 wd:Q252916; rdfs:label ?quartierLabel; skos:altLabel ?quartierAltLabel; p:P131 [ps:P131 ?loc].
  FILTER(LANG(?quartierLabel) = "fr" && LANG(?quartierAltLabel) = "fr")
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#LM_", STRUUID())), ?x) AS ?landmark)
}}
"""

# Données relatives à la ville de Paris
query7 = prefixes + f"""
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
  ?landmark a addr:Landmark;
           addr:isLandmarkType addr:City;
           rdfs:label ?parisLabel;
           skos:altLabel ?parisAltLabel;
           owl:sameAs ?paris.
}} }}
WHERE {{
  BIND (wd:Q90 AS ?paris)
  ?paris rdfs:label ?parisLabel; skos:altLabel ?parisAltLabel.
  FILTER(LANG(?parisLabel) = "fr" && LANG(?parisAltLabel) = "fr")
  BIND(IF(1=1, URI(CONCAT("http://rdf.geohistoricaldata.org/address#LM_", STRUUID())), ?x) AS ?landmark)
}}
"""

wiki_queries = [query0, query1, query2, query3, query4, query5, query6, query7]

#### Traitements après l'import de données

* `loc_query_1` : 
    * ajoute un élément de classe `addr:Attribute` relatif au nom de la voie qui permet d'avoir l'ensemble des noms officiels que cette dernière a porté durant son existence. Il est lié à la voie via le prédicat `addr:hasAttribute` ;
    * `BIND(URI(...) AS ?z)` est appelé deux fois afin que `?attrName` soit unique pour chaque rue (sinon il possède la même valeur tout le temps).
* `loc_query_2` : lors de la construction du graphe via les requêtes de la section précédente, les versions des noms sont liées directement aux voies (`?voie ?aPourVersionDeNom ?nomVersion`). Cette requête supprime ce triplet et associe `nomVersion` a l'élément crée grâce à `loc_query_1`. Ainsi, on a : `?voie ?aPourAttributDeNom ?nomAttribut. ?nomAttribut ?aPourVersionDeNom ?nomVersion.`
* `loc_query_3` : fusion d'éléments de type `addr:Event` qui sont équivalents.

In [23]:
loc_query_0 = prefixes + f"""
DELETE {{ 
    ?timeInstant addr:timePrecision ?timePrecision.
}}
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
    ?timeInstant addr:timePrecision ?timeUnit.
}} }}
WHERE {{ GRAPH <{addr_graph_name_uri}> {{
    ?timeInstant a addr:TimeInstant; addr:timePrecision ?timePrecision.
        BIND(IF(?timePrecision = 11, time:unitDay, 
                IF(?timePrecision = 10, time:unitMonth,
                    IF(?timePrecision = 9, time:unitYear,
                        IF(?timePrecision = 8, time:unitDecade,
                            IF(?timePrecision = 7, time:unitCentury,
                                IF(?timePrecision = 6, time:unitMillenium, ?x
                            )))))) AS ?timeUnit)
    }} }}

"""

loc_query_1 = prefixes + f"""

DELETE {{
    ?change1 ?p ?o.
    ?event1 ?pe ?oe.
    ?se ?pe ?event1.
    ?timeInstant1 a addr:timeInstant; addr:timeStamp ?timeStamp1; addr:timePrecision ?timePrec1; addr:timeCalendar ?timeCal1.
}}
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
    ?change2 addr:before ?attrNameVersion1.
}} }}
WHERE {{
    ?attrName a addr:Attribute; addr:isAttributeType addr:NameAttribute; addr:version ?attrNameVersion1, ?attrNameVersion2.
    ?attrNameVersion1 a addr:AttributeVersion.
    ?attrNameVersion2 a addr:AttributeVersion.
    FILTER (?attrNameVersion1 != ?attrNameVersion2)
    ?change1 a addr:AttributeChange; addr:before ?attrNameVersion1; addr:dependsOn ?event1.
    ?event1 a addr:Event; addr:hasTime ?timeInstant1. 
    ?timeInstant1 a addr:TimeInstant; addr:timeStamp ?timeStamp1; addr:timePrecision ?timePrec1; addr:timeCalendar ?timeCal1.
    ?change2 a addr:AttributeChange; addr:after ?attrNameVersion2; addr:dependsOn [a addr:Event; addr:hasTime [a addr:TimeInstant; addr:timeStamp ?timeStamp2; addr:timePrecision ?timePrec2; addr:timeCalendar ?timeCal2]].
    BIND(ofn:asDays(?timeStamp2 - ?timeStamp1) AS ?diffTime)
    FILTER(?diffTime >= 0.0 && ?timeCal1 = ?timeCal2)
    FILTER ((?diffTime <= 1.0 && ?timePrec1 = time:unitDay && ?timePrec2 = time:unitDay) ||
         (?diffTime <= 0 && ?timePrec1 != time:unitDay && ?timePrec2 != time:unitDay))
    ?change1 ?p ?o.
    {{?event1 ?pe ?oe}}UNION{{?se ?pe ?event1}}
}}
"""

loc_query_2 = prefixes + f"""
DELETE {{
    ?creaEv ?p ?o.
    ?s ?p ?creaEv.
    ?crevEvTime a addr:TimeInstant; addr:timePrecision ?creaEvTimePrec; addr:timeStamp ?creaEvTimeVal; addr:timeCalendar ?creaEvTimeCal.
}}
INSERT {{ GRAPH <{addr_graph_name_uri}> {{
    ?lmCrea addr:dependsOn ?attrNameEv.
}} }}
WHERE {{
    ?lmCrea a addr:LandmarkChange; addr:isChangeType addr:Creation; addr:appliedTo ?landmark; addr:dependsOn ?creaEv.
    ?creaEv a addr:Event; addr:hasTime ?crevEvTime.
    ?crevEvTime a addr:TimeInstant; addr:timePrecision ?creaEvTimePrec; addr:timeStamp ?creaEvTimeVal; addr:timeCalendar ?creaEvTimeCal.
    ?landmark a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; addr:hasAttribute ?nameAttr.
    ?attrNameChange a addr:AttributeChange; addr:appliedTo ?nameAttr; addr:dependsOn ?attrNameEv.
    ?attrNameEv a addr:Event; addr:hasTime ?attrNameEvTime. 
    ?attrNameEvTime a addr:TimeInstant; addr:timePrecision ?newNameEvTimePrec; addr:timeStamp ?newNameEvTimeVal; addr:timeCalendar ?newNameEvTimeCal.
    FILTER(?attrNameEv != ?creaEv)
    BIND(ofn:asDays(?creaEvTimeVal - ?newNameEvTimeVal) AS ?diffTime)
    FILTER(?diffTime >= 0.0 && ?newNameEvTimeCal = ?creaEvTimeCal)
    FILTER ((?diffTime <= 1.0 && ?creaEvTimePrec = time:unitDay && ?newNameEvTimePrec = time:unitDay) ||
         (?diffTime <= 0 && ?creaEvTimePrec != time:unitDay && ?timePrec2 != time:newNameEvTimePrec))
        {{?creaEv ?p ?o}}UNION{{?s ?p ?creaEv}}
}}
"""

loc_queries = [loc_query_0, loc_query_1, loc_query_2]

#### Import et nettoyage des données

Création d'un graphe nommé stockant les rues selon l'ontologie définie à partir des données de Wikidata

In [24]:
url = f"{graphdb_url}/repositories/{project_name}/statements"

for query in wiki_queries:
    query_encoded = up.quote(query)
    cmd = fn.get_curl_command("POST", url, content_type="application/x-www-form-urlencoded", post_data=f"update={query_encoded}")
    os.system(cmd)

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0

100  3164    0     0  100  3164      0    190  0:00:16  0:00:16 --:--:--     0
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  3974    0     0  100  3974      0   3618  0:00:01  0:00:01 --:--:--  3635
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  3805    0     0  100  3805      0   5736 --:--:-- --:--:-- --:--:--  5791
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  6217    0     0  100  6217      0     87  0:01:11  0:01:11 --:--:--     0
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  5595    0     0  100  5595      0    550  0:00:

Nettoyage des données en fusionnant certains événements et changements

In [25]:
url = f"{graphdb_url}/repositories/{project_name}/statements"

for loc_query in loc_queries:
    query_encoded = up.quote(loc_query)
    cmd = fn.get_curl_command("POST", url, content_type="application/x-www-form-urlencoded", post_data=f"update={query_encoded}")
    os.system(cmd)

  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  4396    0     0  100  4396      0   1107  0:00:03  0:00:03 --:--:--  1110
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  5222    0     0  100  5222      0   1238  0:00:04  0:00:04 --:--:--     0
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  5176    0     0  100  5176      0   3927  0:00:01  0:00:01 --:--:--  3942


### Requêtes pour faire des sélections dans le graphe

In [26]:
# Sélection des noms qu'a pris la place de la Nation durant sa vie
query = """
PREFIX addr: <http://rdf.geohistoricaldata.org/address#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>

select ?street ?name ?timeValueStart ?timeValueEnd where { 
	?street a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; addr:hasAttribute ?attrName; (rdfs:label|skos:altLabel) "place de la Nation"@fr.
    ?attrName a addr:Attribute; addr:isAttributeType addr:NameAttribute; addr:version ?attrNameVersion.
    ?attrNameVersion addr:value ?name.
    ?changeEnd addr:before ?attrNameVersion; addr:appliedTo ?attrName; addr:dependsOn ?eventEnd.
    ?changeStart addr:after ?attrNameVersion; addr:appliedTo ?attrName; addr:dependsOn ?eventStart.
    ?eventEnd a addr:Event.
    ?eventStart a addr:Event.
    OPTIONAL {?eventEnd addr:hasTime [a addr:TimeInstant; addr:timeStamp ?timeValueEnd]}
    OPTIONAL {?eventEnd addr:hasTime [a addr:TimeInstant; addr:timePrecision ?timePrecisionEnd]}
    OPTIONAL {?eventEnd addr:hasTime [a addr:TimeInstant; addr:timeCalendar ?timeCalendarEnd]}
    OPTIONAL {?eventStart addr:hasTime [a addr:TimeInstant; addr:timeStamp ?timeValueStart]}
    OPTIONAL {?eventStart addr:hasTime [a addr:TimeInstant; addr:timePrecision ?timePrecisionStart]}
    OPTIONAL {?eventStart addr:hasTime [a addr:TimeInstant; addr:timeCalendar ?timeCalendarStart]}
""" 

# Sélection de l'historique des noms de la place de la Nation avec les dates
query = """
PREFIX addr: <http://rdf.geohistoricaldata.org/address#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>

select ?street ?change ?event ?timeValue ?timePrecision ?timeCalendar ?beforeVersion ?afterVersion where { 
	?street a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; addr:hasAttribute ?attrName; (rdfs:label|skos:altLabel) "place de la Nation"@fr.
    ?attrName a addr:Attribute; addr:isAttributeType addr:NameAttribute.
    ?change addr:appliedTo ?attrName; addr:dependsOn ?event.
    ?event a addr:Event.
    OPTIONAL {?event addr:hasTime [a addr:TimeInstant; addr:timeStamp ?timeValue]}
    OPTIONAL {?event addr:hasTime [a addr:TimeInstant; addr:timePrecision ?timePrecision]}
    OPTIONAL {?event addr:hasTime [a addr:TimeInstant; addr:timeCalendar ?timeCalendar]}
    OPTIONAL {?change addr:before [addr:value ?beforeVersion]}
    OPTIONAL {?change addr:after [addr:value ?afterVersion]}
}
"""

# Sélection du nom de la place de la Nation à une date donnée
query = """
PREFIX addr: <http://rdf.geohistoricaldata.org/address#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX skos: <http://www.w3.org/2004/02/skos/core#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>

select ?street ?name ?selectTime where { 
	?street a addr:Landmark; addr:isLandmarkType addr:Thoroughfare; addr:hasAttribute ?attrName; (rdfs:label|skos:altLabel) "place de la Nation"@fr.
    BIND("1800-01-08T00:00:00"^^xsd:dateTime AS ?selectTime)
    ?attrName a addr:Attribute; addr:isAttributeType addr:NameAttribute; addr:version ?attrNameVersion.
    ?attrNameVersion a addr:AttributeVersion; addr:value ?name.
    ?change1 addr:before ?attrNameVersion; addr:dependsOn ?event1.
    ?change2 addr:after ?attrNameVersion; addr:dependsOn ?event2.
    ?event1 a addr:Event.
    ?event2 a addr:Event.
    OPTIONAL {?event1 addr:hasTime [a addr:TimeInstant; addr:timeStamp ?timeValue1]}
    OPTIONAL {?event1 addr:hasTime [a addr:TimeInstant; addr:timePrecision ?timePrecision1]}
    OPTIONAL {?event1 addr:hasTime [a addr:TimeInstant; addr:timeCalendar ?timeCalendar1]}
    OPTIONAL {?event2 addr:hasTime [a addr:TimeInstant; addr:timeStamp ?timeValue2]}
    OPTIONAL {?event2 addr:hasTime [a addr:TimeInstant; addr:timePrecision ?timePrecision2]}
    OPTIONAL {?event2 addr:hasTime [a addr:TimeInstant; addr:timeCalendar ?timeCalendar2]}
    FILTER ((?timeValue1 >= ?selectTime && ?timeValue2 <= ?selectTime && ?timeCalendar1 = ?timeCalendar2) ||
        (?timeValue1 >= ?selectTime && !BOUND(?timeValue2)) ||
        (?timeValue2 <= ?selectTime && !BOUND(?timeValue1))
    ) 
}
""" 