[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/jlfvindel/SW-KG/blob/main/RDFlib/Wikidata-CONSTRUCT.ipynb)

## Recepción de un grafo desde Wikidata

### Resumen de este cuaderno
+ Se remite una consulta a Wikidata de tipo CONSTRUCT, de la que se espera un grafo como respuesta
+ Se visualiza una parte del grafo
+ Se construye otro grafo distinto a partir del primero

### Contexto de trabajo

In [None]:
# Comente o descomente conforme los paquetes estén instalados
!pip install sparqlwrapper rdflib 

## Diseño de la consulta

### Primero, como consulta SELECT
Aprovechando el interfaz web de consulta de Wikidata, se experimenta con una consulta SELECT previa, con las siguientes características:
+ se acotan las entidades de interés a **los museos localizados en España**
+ de estos ítem ?museo nos interesan todas las relaciones (museo, relacionado_por_X_con, objeto) almacenadas en Wikidata como enunciados directos; para todo tipo de relación posible del museo con todo tipo de objeto
+ adicionalmente se solicita el tipo de la relación, es decir, qué tipo sintáctico se espera como objeto, así como la clase semántica a la que pertenece el objeto

> **Esta consulta se puede ver y ejecutar externamente en** [este enlace](https://query.wikidata.org/#%23%201.%20Items%20%28%3Fmuseo%29%2C%20instancias%20de%20cualquier%20subclase%20de%20museo%20%28Q33506%29%20en%20pa%C3%ADs%20España%20%28Q29%29.%0A%23%20%20%20%20Se%20busca%20toda%20tripleta%20con%20%3Fmuseo%20como%20sujeto%3A%20%3Fmuseo%20%3FpD%20%3Fo%20.%0A%23%202.%20En%20realidad%20en%201%20se%20buscan%20tan%20sólo%20las%20tripletas%20que%20sean%20%27enunciados%20directos%27%3A%20%3Fs%20%3FpD%20%3Fo%2C%20as%C3%AD%20que%0A%23%20%20%20%20%3FpD%20debe%20cumplir%20una%20restricción.%20Si%20%3Fp%20wikibase%3AdirectClaim%20%3FpD%2C%20entonces%20%3FpD%20es%20la%20variante%20sintáctica%0A%23%20%20%20%20adecuada%20para%20ser%20usada%20en%20enunciados%20directos.%0A%23%203.%20Los%20objetos%20%3Fo%2C%20en%20caso%20de%20no%20ser%20literales%2C%20pueden%20pertenecer%20a%20alguna%20clase%0A%0ASELECT%20%20%3FmuseoLabel%20%3FpLabel%20%3FoLabel%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%3Fmuseo%20%3FpD%20%3Fo%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%3FpTipo%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%3FoClase%20%3FoClaseLabel%20%20%20%20%20%20%20%0AWHERE%20%7B%0A%20%20%3Fp%20rdf%3Atype%20wikibase%3AProperty%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%23%202%0A%20%20%20%20%20%20%20%20%20%20%20%20wikibase%3AdirectClaim%20%3FpD%20%3B%20%0A%20%20%20%20%20%20%20%20%20%20%20%20wikibase%3ApropertyType%20%3FpTipo.%20%0A%20%20%0A%20%20%3Fmuseo%20wdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ33506%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%23%201%0A%20%20%20%20%20%20%20%20%20%20wdt%3AP17%20wd%3AQ29%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20%3FpD%20%3Fo%20.%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%0A%20%20OPTIONAL%20%7B%3Fo%20wdt%3AP31%20%3FoClase%7D%20.%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%23%203%0A%20%20%0A%20%20%23%20De%20cualquier%20%3Fitem%2C%20este%20servicio%20proporciona%20su%20etiqueta%20en%20%3FitemLabel%20%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22es%22%2C%22ca%22%2C%22eu%22%2C%22gl%22%2C%22en%22%2C%22fr%22.%20%7D%0A%7D%0AORDER%20BY%20%3Fmuseo%0ALIMIT%20200000). La consulta devuelve una colección de n-tuplas, 9-tuplas en este caso, con tantos componente como variables solicitadas como respuesta en SELECT.

### Diseño de la consulta CONSTRUCT
También esta consulta CONSTRUCT se puede ejecutar y refinar directamente sobre el interfaz web de Wikidata. El patrón WHERE de esta consulta es similar al anterior y devuelve una n-tupla resultante cada vez que una instanciación de todas las variables de ese patrón coincidan localmente con el grafo consultado (el de todo Wikidata).
> [Este enlace](https://query.wikidata.org/#CONSTRUCT%20%7B%0A%20%20%23%20Por%20el%20cuerpo%20del%20WHERE%2C%20los%20%3Fsujeto%20son%20museos%20en%20España.%0A%20%20%3Fsujeto%20%3FpropD%20%3Fobjeto%20%3B%0A%20%20%20%20%20%20%20%20%20%20rdfs%3Alabel%20%3FsujetoLabel%20%3B%0A%20%20%20%20%20%20%20%20%20%20rdf%3Atype%20%3FsujetoClase%20.%0A%20%20%20%0A%20%20%3Fprop%20rdf%3Atype%20wikibase%3AProperty%20%3B%0A%20%20%20%20%20%20%20%20rdfs%3Alabel%20%3FpropLabel%20%3B%0A%20%20%20%20%20%20%20%20wikibase%3AdirectClaim%20%3FpropD%20%3B%0A%20%20%20%20%20%20%20%20wikibase%3ApropertyType%20%3FpropTipoObjeto%20.%0A%20%20%0A%20%20%3Fobjeto%20rdfs%3Alabel%20%3FobjetoLabel%20%3B%0A%20%20%20%20%20%20%20%20%20%20%20%20%20%20wdt%3AP31%20%3FobjetoClase%20.%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%7D%0AWHERE%20%7B%0A%20%20%3Fprop%20rdf%3Atype%20wikibase%3AProperty%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20%20%20wikibase%3AdirectClaim%20%3FpropD%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20%20%20wikibase%3ApropertyType%20%3FpropTipoObjeto.%20%0A%20%20%0A%20%20%3Fsujeto%20wdt%3AP31%2Fwdt%3AP279%2a%20wd%3AQ33506%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20wdt%3AP31%20%3FsujetoClase%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20wdt%3AP17%20wd%3AQ29%20%3B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%20%20%20%20%20%20%3FpropD%20%3Fobjeto%20.%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%0A%20%20OPTIONAL%20%7B%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%20%0A%20%20%20%20%3Fobjeto%20wdt%3AP31%20%3FobjetoClase%20.%0A%20%20%7D%20.%20%20%20%20%20%20%20%20%20%20%0A%20%20%0A%20%20%23%20De%20cualquier%20%3Fitem%2C%20este%20servicio%20proporciona%20su%20etiqueta%20en%20%3FitemLabel%20%0A%20%20SERVICE%20wikibase%3Alabel%20%7B%20bd%3AserviceParam%20wikibase%3Alanguage%20%22es%22%2C%22ca%22%2C%22eu%22%2C%22gl%22%2C%22en%22%2C%22fr%22.%20%7D%0A%7D) **muestra la consulta CONSTRUCT, que puede ejecutarse externamente**. 

En la consulta SELECT anterior, cada una de esas n-tuplas resultantes se mostraban como una fila de resultados de la tabla. Las consultas CONSTRUCT **siempre devuelven tripletas (sujeto, propiedad, objeto), es decir, un grafo resultante**. Las n-tuplas de instancias que va facilitando el cuerpo del WHERE se usan para configurar el grafo tal y como se declara en el cuerpo de CONSTRUCT: con los espacios de nombre que se desee y con la relación entre entidades que se quiera. En este ejemplo, salvo la inserción de alguna tripleta nueva, se mantiene en el grafo resultante la relación que tenían las entidades en Wikidata.

In [15]:
from SPARQLWrapper import SPARQLWrapper, RDFXML, TURTLE
from rdflib import RDFS

In [2]:
consulta = '''
CONSTRUCT {
  # Por el cuerpo del WHERE, los ?sujeto son museos en España.
  ?sujeto ?propD ?objeto ;
          rdfs:label ?sujetoLabel ;
          rdf:type ?sujetoClase .
   
  ?prop rdf:type wikibase:Property ;
        rdfs:label ?propLabel ;
        wikibase:directClaim ?propD ;
        wikibase:propertyType ?propTipoObjeto .
  
  ?objeto rdfs:label ?objetoLabel ;
              wdt:P31 ?objetoClase .              
}
WHERE {
  ?prop rdf:type wikibase:Property ;                 
            wikibase:directClaim ?propD ;             
            wikibase:propertyType ?propTipoObjeto. 
  
  ?sujeto wdt:P31/wdt:P279* wd:Q33506 ;              
          wdt:P31 ?sujetoClase ;                     
          wdt:P17 wd:Q29 ;                           
          ?propD ?objeto .                           
  
  OPTIONAL {                                         
    ?objeto wdt:P31 ?objetoClase .
  } .          
  
  # De cualquier ?item, este servicio proporciona su etiqueta en ?itemLabel 
  SERVICE wikibase:label { bd:serviceParam wikibase:language "es","ca","eu","gl","en","fr". }
}
'''

## Ejecución

### Recepción de resultados

In [3]:
servidor = "https://query.wikidata.org/sparql" 
cliente = SPARQLWrapper(servidor)
# Se fija el retorno a RDFXML porque se espera un grafo
cliente.setReturnFormat(RDFXML)

cliente.setQuery(consulta)
# Ejecución de la consulta y recepción en un objeto QueryResult
resp_obj = cliente.query()
# Conversión a un grafo RDF internamente vía RDFLib
resp_grafo = resp_obj.convert()

In [4]:
len(resp_grafo)

15232

### Secuenciación del grafo
El grafo RDFLib `resp_grafo` se puede secuenciar textualmente en varios formatos para ser impreso o almacenado en ficheros.

In [7]:
resp_f_turtle = resp_grafo.serialize(format="turtle")
print(resp_f_turtle[:5000])

@prefix geo: <http://www.opengis.net/ont/geosparql#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix wd: <http://www.wikidata.org/entity/> .
@prefix wdt: <http://www.wikidata.org/prop/direct/> .
@prefix wikibase: <http://wikiba.se/ontology#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

wd:P1004 a wikibase:Property ;
    rdfs:label "identificador de lugar MusicBrainz"@es ;
    wikibase:directClaim wdt:P1004 ;
    wikibase:propertyType wikibase:ExternalId .

wd:P1005 a wikibase:Property ;
    rdfs:label "identificador PTBNP"@es ;
    wikibase:directClaim wdt:P1005 ;
    wikibase:propertyType wikibase:ExternalId .

wd:P101 a wikibase:Property ;
    rdfs:label "campo de trabajo"@es ;
    wikibase:directClaim wdt:P101 ;
    wikibase:propertyType wikibase:WikibaseItem .

wd:P1015 a wikibase:Property ;
    rdfs:label "identificador BIBSYS"@es ;
    wikibase:directClaim wdt:P1015 ;
    wikibase:propertyType wikibase:ExternalId .

wd:P1017 a wikibase:Property ;
    rd

In [8]:
resp_f_xml = resp_grafo.serialize(format="xml")
print(resp_f_xml[:5000])

<?xml version="1.0" encoding="utf-8"?>
<rdf:RDF
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
   xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
   xmlns:wdt="http://www.wikidata.org/prop/direct/"
   xmlns:wikibase="http://wikiba.se/ontology#"
>
  <rdf:Description rdf:about="http://www.wikidata.org/entity/Q160112">
    <wdt:P276 rdf:resource="http://www.wikidata.org/entity/Q5818335"/>
    <rdfs:label xml:lang="es">Museo del Prado</rdfs:label>
    <rdf:type rdf:resource="http://www.wikidata.org/entity/Q207694"/>
    <rdf:type rdf:resource="http://www.wikidata.org/entity/Q570116"/>
    <rdf:type rdf:resource="http://www.wikidata.org/entity/Q43229"/>
    <rdf:type rdf:resource="http://www.wikidata.org/entity/Q17431399"/>
    <rdf:type rdf:resource="http://www.wikidata.org/entity/Q1200957"/>
    <wdt:P271 rdf:datatype="http://www.w3.org/2001/XMLSchema#string">DA03210098</wdt:P271>
    <wdt:P269 rdf:datatype="http://www.w3.org/2001/XMLSchema#string">026414767</wdt:P269>
    

## Descarga a fichero

### Descarga desde Google Colab
Si este cuaderno se está ejecutando desde Google colab:

In [None]:
from google.colab import files

with open('resp_f_xml.xml', 'w') as f:
  f.write(resp_f_xml)
files.download('resp_f_xml.xml')

In [None]:
with open('resp_f_turtle.ttl', 'w') as f:
  f.write(resp_f_turtle)
files.download('resp_f_turtle.ttl')

### Descarga desde ejecución local
Descomente y reemplace, en caso de ejecución local:

In [9]:
#fichero_turtle = 'reemplace esto con el camino y el nombre del fichero .ttl'
#resp_grafo.serialize(destination=fichero_turtle, format='turtle')

<Graph identifier=N1a84061fa9a342c9b3aa78b0e87bf756 (<class 'rdflib.graph.ConjunctiveGraph'>)>

In [10]:
#fichero_xml = 'reemplace esto con el camino y el nombre del fichero .xml'
#resp_grafo.serialize(destination=fichero_xml, format='xml')

<Graph identifier=N1a84061fa9a342c9b3aa78b0e87bf756 (<class 'rdflib.graph.ConjunctiveGraph'>)>