# RDFLib Tutorial

![RDFLib logo](https://rdflib.readthedocs.io/en/stable/_static/RDFlib.png)

**RDFLib** es un paquete de Python para trabajar con **RDF**. **RDFLib** contiene la mayoría de herramientas que se necesitan para trabajar con **RDF**. Incluye:

- *Parseadores* y *serializadores* para **RDF/XML**, **N3**, **NTriples**, **N-Quads**, **Turtle** y **JSON-LD** (via plugin).
- Una *interfaz gráfica* que puede ser respaldada por cualquiera de varias implementaciones de Store.
- Una implementación de **SPARQL 1.1**. Pemite declarar consultas en el grafo.

## Instalación de RDFLib

Según como quieras trabajar descomenta el correspondiente comando para instalar **RDFLib**.

In [None]:
# pip install rdflib # Instalación local
# !pip install rdflib # Instalación en Google Colab
# conda install -c conda-forge rdflib # Instalación en Conda

Comprobar que se la instalación ha sido exitosa.

In [None]:
# pip show rdflib # Instalación local
# !pip show rdflib # Instalación Google Colab

# Ejemplo 1

In [2]:
from rdflib import Graph

In [3]:
# Inicializar un grafo
g = Graph()

In [None]:
# Parsear un grafo de dbpedia en un archivo RDF
g.parse('https://dbpedia.org/resource/Michael_Jackson')

In [None]:
# Recorro las primeras 10 tripletas
for index, (sub,pred, obj) in enumerate(g):
  print(sub, pred, obj)
  if index == 10:
    break

In [None]:
# Mostrar el tamaño del grafo
print(f'El grafo tiene {len(g)} tripletas')

In [None]:
# Mostrar por pantalla todo el grafo serializado en turtle
v = g.serialize(format="ttl")
print(v)

In [None]:
# Almacenar el grafo en formato RDF turtle en el archivo tbl.ttl
print(g.serialize(destination="tbl.ttl"))

## Ejemplo 2

In [11]:
from rdflib import Graph, Literal, RDF, URIRef
from rdflib.namespace import FOAF, XSD

# Crear un grafo
g = Graph()

In [12]:
# Creamos una RDF URI para utilizar como sujeto de varias tripletas

maradona = URIRef("http://example.org/maradona")

# Añadimos nuevas tripletas utilizando el metodo add()

g.add((maradona, RDF.type, FOAF.Person))
g.add((maradona, FOAF.nick, Literal("El Pelusa")))
g.add((maradona, FOAF.name, Literal("Diego Armando Maradona")))
g.add((maradona, FOAF.mbox, URIRef("mailto:maradona@example.org")))


<Graph identifier=N87ef0dedb151460bb7b941029c863843 (<class 'rdflib.graph.Graph'>)>

In [13]:
# Añadir otra persona

ronaldo = URIRef("http://example.org/ronaldo")

# Añadimos nuevas tripletas utilizando el metodo add()

g.add((ronaldo, RDF.type, FOAF.Person))
g.add((ronaldo, FOAF.nick, Literal("El Fenomeno", datatype=XSD.string)))
g.add((ronaldo, FOAF.name, Literal("Ronaldo Nazario")))
g.add((ronaldo, FOAF.mbox, URIRef("mailto:r9@example.org")))

<Graph identifier=N87ef0dedb151460bb7b941029c863843 (<class 'rdflib.graph.Graph'>)>

In [14]:
# Iterar sobre las tripletas almacenadas y mostrarlas

for f, p, o in g:
    print(f, p, o)

http://example.org/ronaldo http://xmlns.com/foaf/0.1/name Ronaldo Nazario
http://example.org/maradona http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://xmlns.com/foaf/0.1/Person
http://example.org/maradona http://xmlns.com/foaf/0.1/mbox mailto:maradona@example.org
http://example.org/ronaldo http://xmlns.com/foaf/0.1/nick El Fenomeno
http://example.org/ronaldo http://xmlns.com/foaf/0.1/mbox mailto:r9@example.org
http://example.org/maradona http://xmlns.com/foaf/0.1/name Diego Armando Maradona
http://example.org/maradona http://xmlns.com/foaf/0.1/nick El Pelusa
http://example.org/ronaldo http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://xmlns.com/foaf/0.1/Person


In [None]:
# De cada FOAF.Person que exista en el grafo, muestra por pantalla su nick

for person in g.subjects(RDF.type, FOAF.Person):
    for nick in g.objects(person, FOAF.nick):
        print(nick)

In [None]:
# Enlazar el namespace FOAF a un prefijo para aumentar la legibilidad

g.bind("foaf", FOAF)

# Mostrar el grafo en formato n3

v = g.serialize(format="n3")
print(v)

## Cargar y Guardar

In [None]:
# Instalar RDFLib

# pip install rdflib
# !pip install rdflib

In [2]:
#Importar RDFLib

import rdflib

In [5]:
# Inicializar un grafo

g = rdflib.Graph()

In [None]:
# Parsear un grafo de la web

g.parse('https://dbpedia.org/resource/Python_(programming_language')

In [7]:
print(len(g))

0


In [10]:
# Vamos a listar los archivos del directorio de trabajo

%ls

Readme.md      grafos1.ipynb  [34mlib[m[m/           [34mshare[m[m/
[34mbin[m[m/           [34minclude[m[m/       pyvenv.cfg     [34msrc[m[m/


In [None]:
# Cargar un grafo a partir de un archivo

h = rdflib.Graph()
format_ = rdflib.util.guess_format('ejemplo.xml')
h.parse('ejemplo.xml', format=format_)

In [None]:
print(f'el grafo h tiene {len(h)} tripletas')
print(h.serialize())

In [None]:
for tripleta in h:
    print(tripleta)

In [32]:
data = '''
<http://example.com/drewp> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://xmlns.com/foaf/0.1/Person> .
<http://example.com/drewp> <http://example.com/says> "Hello World" .
'''

In [36]:
# Cargar un grafo a partir de texto

j = rdflib.Graph()
j.parse(data = data, format = 'n3')
print(f'el grafo j tiene {len(j)} tripletas')

el grafo j tiene 2 tripletas


In [37]:
for s, p, o in j:
    print(s, p, o)

http://example.com/drewp http://example.com/says Hello World
http://example.com/drewp http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://xmlns.com/foaf/0.1/Person


In [44]:
j.serialize(format="ttl").decode('u8')

AttributeError: 'str' object has no attribute 'decode'