# RDF Syntax: Eine Breite Wahl

In der Vorlesung haben wir dargestellt wie man einen RDF Graphen als Tripelmenge mittels verschiedenen RDF Syntaxen in Textdateien als Zeichenfolge serialisieren kann. Dies ermöglicht das maschinelle Lesen und Speichern von RDF. In dieser Übung werden Sie die verschiedenen RDF Syntaxen anhand Beispielen näher kennenlernen. Wir verwenden hier die Python Programmiersprache um RDF zu lesen, schreien, und verarbeiten. Wir beginnen mit dem Lesen von RDF in N-Triples Syntax und das Ausgeben der einzelnen Tripel.

In [1]:
from rdflib import Graph

rdf = """
<http://example.org#Wako5UJ_7t> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://example.org#Album> .
<http://example.org#Wako5UJ_7t> <http://example.org#title> "The Dark Side of the Moon" .
"""

g = Graph()
r = g.parse(data=rdf, format='nt')

for s, p, o in g:
    print('subject = {}'.format(s))
    print('  predicate = {}'.format(p))
    print('    object = {}'.format(o))

subject = http://example.org#Wako5UJ_7t
  predicate = http://www.w3.org/1999/02/22-rdf-syntax-ns#type
    object = http://example.org#Album
subject = http://example.org#Wako5UJ_7t
  predicate = http://example.org#title
    object = The Dark Side of the Moon


Was erwarten Sie hier als Resultat? Wieviele Tripel enthält die Tripelmenge?

In [2]:
print(len(g))
# einmal das Triple: <http://example.org#Wako5UJ_7t> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://example.org#Album> .
# und einmal das Triple: <http://example.org#Wako5UJ_7t> <http://example.org#title> "The Dark Side of the Moon" .
#also 2 Tripel in der Tripelmenge

2


Nun serialisieren wir den Graphen mittels einer anderen Syntax, z.B. Turtle.

In [3]:
print(g.serialize(format='turtle').decode('utf-8'))

@prefix ns1: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ns1:Wako5UJ_7t a ns1:Album ;
    ns1:title "The Dark Side of the Moon" .




Der Präfix (*prefix*) `ns1:` für `http://example.org#` ist zwar technisch OK aber er ist nicht gerade aussagekräftig. Eine bessere Wahl wäre `ex:`. Dafür müssen wir den Präfix binden (registrieren).

In [4]:
g = Graph()

g.bind('ex', 'http://example.org#')

r = g.parse(data=rdf, format='nt')

print(g.serialize(format='turtle').decode('utf-8'))

# Was hat sich geändert gegenüber dem vorherigen Beispiel? Antwort: Das Präfix für http://example.org#. 

@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:Wako5UJ_7t a ex:Album ;
    ex:title "The Dark Side of the Moon" .




Nun serialisieren wir den Graphen als RDF/XML. Das Resultat der Serialisierung ist implementierungsabhängig. Es werden hier z.B. weder XML Entitäten noch der XML *base namespace* verwendet. Solche Entscheidungen können wir allerdings der Sprache überlassen: Wir müssen uns darüber nicht sonderlich kümmern.

In [5]:
print(g.serialize(format='xml').decode('utf-8'))

<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF
   xmlns:ex="http://example.org#"
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
>
  <rdf:Description rdf:about="http://example.org#Wako5UJ_7t">
    <ex:title>The Dark Side of the Moon</ex:title>
    <rdf:type rdf:resource="http://example.org#Album"/>
  </rdf:Description>
</rdf:RDF>



Nehmen Sie nun das RDF/XML als Input und serialisieren Sie es nach N-Triples. Zwischen solchen RDF Syntaxen zu konvertieren ist also sehr einfach. Versuchen Sie das auch mal online hier: http://www.easyrdf.org/converter. Welche weiteren Syntaxen gibt es?

In [6]:
rdf = """
[TODO]
"""

g = Graph()
r = g.parse(data=rdf, format='[TODO]')
print(g.serialize(format='[TODO]').decode('utf-8'))

# Wieviele Syntaxen unterstützt der easyrdf.org converter? Antwort: 7 Syntaxen können vom converter angenommen werden. Ausgegeben können 11.

PluginException: No plugin registered for ([TODO], <class 'rdflib.parser.Parser'>)

Natürlich können Sie RDF auch aus Dateien lesen und schreiben. Führen Sie den nächsten Programmcode aus und schauen Sie sich die Dateien `example.rdf` und `example.n3` an. Wie Sie am Beispiel entnehmen können, dann man RDF Graphen auch programmatisch manipulieren.

In [7]:
from rdflib import Graph, URIRef, Literal
from rdflib.namespace import RDFS

g = Graph()
r = g.parse('example.rdf')

print('Graph size: {} triples'.format(len(g)))

g.add((URIRef('http://example.org#Wako5UJ_7t'), RDFS.label, Literal('Harvest, EMI')))

print('Graph size: {} triples'.format(len(g)))

g.serialize(destination='example.n3', format='n3')

Graph size: 2 triples
Graph size: 3 triples


Versuchen Sie nun ein eigenes Beispiel zu konstruieren. Wählen Sie ein Thema, z.B. Bücher oder Personen, und schreiben Sie RDF in einer Syntax. Sie dürfen das RDF auch programmatisch schreiben indem Sie die `g.add()` Funktion benutzen. Konvertieren Sie dieses zu einer anderen Syntax. Lesen und schreiben Sie die jeweilige Serialisierung in Dateien. 

Bonus: Versuchen Sie mittels der Dokumentation http://rdflib.readthedocs.io/en/latest/apidocs/rdflib.html ein Triple zu löschen.

In [25]:
g = Graph()
r = g.parse('sammlung.rdf', format='nt')
g.bind('ex', 'http://example.org#')
print(g.serialize(format='turtle').decode('utf-8'))

@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

<http://example.org#123456> a ex:buch ;
    ex:autor "Blackwood" ;
    ex:title "Das leere Haus" .




In [26]:
g = Graph()
r = g.parse('sammlung.rdf', format='nt')
g.bind('ex', 'http://example.org#')
print(g.serialize(format='xml').decode('utf-8'))

<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF
   xmlns:ex="http://example.org#"
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
>
  <rdf:Description rdf:about="http://example.org#123456">
    <ex:title>Das leere Haus</ex:title>
    <rdf:type rdf:resource="http://example.org#buch"/>
    <ex:autor>Blackwood</ex:autor>
  </rdf:Description>
</rdf:RDF>



In [35]:
g = Graph()
r = g.parse('sammlung.rdf', format='nt')
g.bind('ex', 'http://example.org#')
print (len(g))

3
