# Bases de connaissance : interroger Wikidata à l'aide de requêtes SPARQL

## Imports

In [1]:
from datetime import datetime as dt
from SPARQLWrapper import SPARQLWrapper, JSON

## Obtenir la liste des politiciens belges

In [56]:
# Retrieve results from SPARQL
endpoint = "https://query.wikidata.org/bigdata/namespace/wdq/sparql"
sparql = SPARQLWrapper(endpoint)

# P27 = country of citizenship 
# Q31 = Belgium
# P106 = Opccupation
# Q82955 = Politician
# P569 = date of birth
# P570 = date of death

# Dans cette requête, j'ai essayé de sélectionner des œuvres littéraires, des auteurs ainsi que les labels en français.
# Apports pour Camille : Cette requête peut aider à sélectionner les différents noms d'auteurs dans le corpus et à classer les corpus déjà par auteur ou maison d'édition.
# Et aussi, même si cela reste ambigu, vu que c'est un corpus et que nous devons définir des critères pour reconnaître les noms d'auteurs ou de maisons d'édition avant de pouvoir les sélectionner et organiser .
# Le résultat dans notre requête a été limité à 20, vu le nombre important de résultats, et sans le "LIMIT", on ne pourrait facilement afficher tout le résultat.

statement = """
SELECT ?oeuvre ?oeuvreLabel ?auteur ?auteurLabel ?maisonEdition ?maisonEditionLabel ?oeuvreDescription
WHERE {
  ?oeuvre wdt:P31 wd:Q7725634.            
  ?oeuvre wdt:P50 ?auteur.                 
  ?oeuvre wdt:P123 ?maisonEdition.         

  SERVICE wikibase:label {
    bd:serviceParam wikibase:language "fr" .
    ?oeuvre rdfs:label ?oeuvreLabel .
    ?auteur rdfs:label ?auteurLabel .
    ?maisonEdition rdfs:label ?maisonEditionLabel .
    ?oeuvre schema:description ?oeuvreDescription .
  }
}
LIMIT 40

"""

sparql.setQuery(statement)
sparql.setReturnFormat(JSON)

results = sparql.query().convert()

rows = results['results']['bindings']
print(f"\n{len(rows)} Noms \n")
print(rows[:20])



40 Noms 

[{'oeuvre': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q480'}, 'maisonEdition': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q3187850'}, 'auteur': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q5682'}, 'oeuvreLabel': {'xml:lang': 'fr', 'type': 'literal', 'value': 'Don Quichotte'}, 'auteurLabel': {'xml:lang': 'fr', 'type': 'literal', 'value': 'Miguel de Cervantes'}, 'maisonEditionLabel': {'xml:lang': 'fr', 'type': 'literal', 'value': 'Juan de la Cuesta'}, 'oeuvreDescription': {'xml:lang': 'fr', 'type': 'literal', 'value': 'roman de Miguel de Cervantes'}}, {'oeuvre': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q480'}, 'maisonEdition': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q19007672'}, 'auteur': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q5682'}, 'oeuvreLabel': {'xml:lang': 'fr', 'type': 'literal', 'value': 'Don Quichotte'}, 'auteurLabel': {'xml:lang': 'fr', 'type': 'literal', 'value': 'Miguel de

## Filtrer pour n'afficher que les noms contenant "Alphonse"

In [57]:

sparql.setQuery(statement)
sparql.setReturnFormat(JSON)

results = sparql.query().convert()

rows = results['results']['bindings']
print(f"\n{len(rows)} Noms \n")

for row in rows:
    oeuvre_label = row['oeuvreLabel']['value']
    auteur_label = row['auteurLabel']['value']
    maison_edition_label = row['maisonEditionLabel']['value']
    oeuvre_description = row['oeuvreDescription']['value']

    print(f"Œuvre : {oeuvre_label}")
    print(f"Auteur : {auteur_label}")
    print(f"Maison d'édition : {maison_edition_label}")
    print(f"Description de l'œuvre : {oeuvre_description}\n")


40 Noms 

Œuvre : Don Quichotte
Auteur : Miguel de Cervantes
Maison d'édition : Juan de la Cuesta
Description de l'œuvre : roman de Miguel de Cervantes

Œuvre : Don Quichotte
Auteur : Miguel de Cervantes
Maison d'édition : Francisco de Robles
Description de l'œuvre : roman de Miguel de Cervantes

Œuvre : La Vie, l'Univers et le Reste
Auteur : Douglas Adams
Maison d'édition : Pan Books
Description de l'œuvre : roman de Douglas Adams

Œuvre : La Vie, l'Univers et le Reste
Auteur : Douglas Adams
Maison d'édition : Harmony Books
Description de l'œuvre : roman de Douglas Adams

Œuvre : La Case de l'oncle Tom
Auteur : Harriet Beecher Stowe
Maison d'édition : The National Era
Description de l'œuvre : roman de Harriet Beecher Stowe

Œuvre : Nuits éternelles
Auteur : Neil Gaiman
Maison d'édition : DC Comics
Description de l'œuvre : album de bande-dessinée de Neil Gaiman

Œuvre : L'Histoire de Lucy Gault
Auteur : William Trevor
Maison d'édition : Viking Press
Description de l'œuvre : roman de W

## Pour en savoir plus

- [Le projet Wikidata](https://www.wikidata.org/wiki/Wikidata:Main_Page)
- [Aide à la construction de requêtes](https://query.wikidata.org/)