# TP1 - Requête SPARQL vers Wikidata

## Imports

In [7]:
from datetime import datetime as dt
from SPARQLWrapper import SPARQLWrapper, JSON

## Obtenir la liste des maladies infectieuses

In [13]:
# Retrieve results from SPARQL
endpoint = "https://query.wikidata.org/bigdata/namespace/wdq/sparql"
sparql = SPARQLWrapper(endpoint)

# P279 = instance of 
# Q18123741 = infectious disease
# Q18553247 = primary bacterial infectious disease
# P1120 = number of deaths 
# P1603 = number of cases

statement = """
SELECT ?disease ?diseaseDescription ?diseaseLabel ?nombre_de_morts ?nombre_de_cas WHERE {
  { ?disease wdt:P279 wd:Q18123741. }
  UNION
  { ?disease wdt:P279 wd:Q18553247. }
  SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
  OPTIONAL { ?disease wdt:P1120 ?nombre_de_morts. }
  OPTIONAL { ?disease wdt:P1603 ?nombre_de_cas. }
}
ORDER BY ?diseaseLabel
"""
sparql.setQuery(statement)
sparql.setReturnFormat(JSON)
results = sparql.query().convert()

rows = results['results']['bindings']
print(f"\n{len(rows)} Maladies infectieuses trouvées\n")
print(rows[:10])


113 Maladies infectieuses trouvées

[{'disease': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q10659178'}, 'diseaseLabel': {'type': 'literal', 'value': 'Q10659178'}}, {'disease': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q11558841'}, 'diseaseLabel': {'type': 'literal', 'value': 'Q11558841'}}, {'disease': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q25503254'}, 'diseaseLabel': {'type': 'literal', 'value': 'Q25503254'}}, {'disease': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q55009413'}, 'diseaseLabel': {'type': 'literal', 'value': 'Q55009413'}}, {'disease': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q55788465'}, 'diseaseLabel': {'type': 'literal', 'value': 'Q55788465'}}, {'disease': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q164818'}, 'diseaseLabel': {'xml:lang': 'fr', 'type': 'literal', 'value': 'Fièvre Q'}, 'diseaseDescription': {'xml:lang': 'fr', 'type': 'literal', 'value': 'infection bactérienne pleu

## Filtrer pour n'afficher que le typhus

In [31]:
name_filter = 'typhus'
max_results = 10
nb_morts_label='nombre de morts :'
nb_cas_label='nombre de cas :'
lien_label='lien vers wikipedia : '
lien = "https://fr.wikipedia.org/wiki/" 
separation = " | "

filtered_rows = [row for row in rows if name_filter in row['diseaseLabel']['value']]
print(f"Afficher les {max_results} premiers résultats:\n")
for row in filtered_rows[:max_results]:
    try:
        nb_morts = (row['nombre_de_morts']['value'])
        
    except ValueError: # nombre de décès inconnu
        nb_morts = "inconnu"
    except KeyError: # nombre de décès inconnu
        nb_morts = "inconnu"
        
    try:
        nb_cas = (row['nombre_de_cas']['value'])
        
    except ValueError: # nombre de cas inconnu
        nb_cas = "inconnu"
    except KeyError: # nombre de cas inconnu
        nb_cas = "inconnu"
        
        
    print(f"{row['diseaseLabel']['value']}{separation}{row['diseaseDescription']['value']}{separation}{nb_morts_label}{nb_morts}{separation}{nb_cas_label}{nb_cas}{separation}{lien_label}{lien}{row['diseaseLabel']['value']}")

Afficher les 10 premiers résultats:

typhus | groupe de maladies | nombre de morts :inconnu | nombre de cas :inconnu | lien vers wikipedia : https://fr.wikipedia.org/wiki/typhus
