# RDF: Fortgeschrittene Themen

In dieser Übung werden wir uns einige fortgeschrittene Themen etwas genauer in der Praxis anschauen, insb. Datentypen, der *language tag*, Listen und Reifizierung in RDF. Wir beginnen mit Datetypen. Führen Sie den folgenden Codeblock aus.

In [1]:
#!pip install rdflib

In [2]:
from rdflib import Graph, Literal, BNode
from rdflib.namespace import XSD

def eq(l1, l2):
    print(l1.eq(l2))

Nun schauen Sie sich die folgende Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [3]:
eq(Literal('1973'), Literal('1973'))
# Erklärung: Die beiden Literale sind gleich

True


In [4]:
eq(Literal('1973'), Literal('1979')) 
# Erklärung: Der Wert der beiden Literale ist nicht gleicht

False


In [5]:
eq(Literal('1973'), Literal('1973', datatype=XSD.int)) 
# Erklärung: Die Literale sind ungleich, das zweite ist ein typisiertes Literal

False


In [6]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.int)) 
# Erklärung: Beides sind typisierte Literale mit gleichem Wert und Datentyp

True


In [7]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.float)) 
# Erklärung: Zwei typisierte Literale mit gleichem Wert und vergleichbarem Datentyp

True


In [8]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.gYear)) 
# Erklärung: Wertgleiche Literale allerdings mit einem nicht vergleichbarem Datentyp

False


Untypisierte Literale können auch einen sogenannten *language tag* enthalten.

Schauen Sie sich die folgenden Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [9]:
eq(Literal('The Wall'), Literal('The Wall'))
# Erklärung: Gleiche Literale

True


In [10]:
eq(Literal('The Wall'), Literal('The Dark Side of the Moon'))
# Erklärung: Wertungleiche Literale

False


In [11]:
eq(Literal('The Wall'), Literal('The Wall', lang='en'))
# Erklärung: Wertgleiche Literale wobei das zweite ein language tag definiert

False


In [12]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='en'))
# Erklärung: Wertgleiche Literale, inklusive language tag

True


In [13]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='de'))
# Erklärung: Wert gleiche Literale, nicht aber das language tag

False


Schauen Sie sich die folgenden RDF Graphen an und erklären Sie wie es zur unterschiedlichen Grösse kommt.

In [14]:
s = BNode()
p = BNode()

g0 = Graph()
g0.add((s, p, Literal('The Wall')))
g0.add((s, p, Literal('The Wall')))

print('Länge g0: {} Tripel'.format(len(g0))) # Erklärung: Gleiche Tripel, werden zwar zweimal dem Graphen zugefüht nicht aber mehrfach aufgeführt (Menge!)

g1 = Graph()
g1.add((s, p, Literal('The Wall', lang='en')))
g1.add((s, p, Literal('The Wall', lang='de')))

print('Länge g1: {} Tripel'.format(len(g1))) # Erklärung: Ungleiche Tripel, werden beide aufgeführt

g2 = Graph()
g2.add((s, p, Literal('The Wall', lang='en')))
g2.add((s, p, Literal('The Wall', lang='en')))

print('Länge g2: {} Tripel'.format(len(g2))) # Erklärung: Gleiche Tripel, werden nur einmal aufgeführt

g3 = Graph()
g3.add((s, p, Literal('The Wall')))
g3.add((s, p, Literal('The Dark Side of the Moon')))

print('Länge g3: {} Tripel'.format(len(g3))) # Erklärung: Ungleiche Tripel, werden beide aufgeführt

g4 = Graph()
g4.add((s, p, Literal('1979')))
g4.add((s, p, Literal('1979', datatype=XSD.int)))

print('Länge g4: {} Tripel'.format(len(g4))) # Erklärung: Ungleiche Tripel, werden beide aufgeführt

g5 = Graph()
g5.add((s, p, Literal('1973', datatype=XSD.int)))
g5.add((s, p, Literal('1973', datatype=XSD.int)))

print('Länge g5: {} Tripel'.format(len(g5))) # Erklärung: Gleiche Tripel, werden nur einmal aufgeführt

Länge g0: 1 Tripel
Länge g1: 2 Tripel
Länge g2: 1 Tripel
Länge g3: 2 Tripel
Länge g4: 2 Tripel
Länge g5: 1 Tripel


Vervollständigen Sie nun das RDF mit Datentypen und einem *language tag* für Titel, und überprüfen Sie ob das RDF fehlerfrei ist.

In [15]:
from rdflib import Graph

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:dobtvAwc a ex:Album ;
    ex:title "The Dark Side of the Moon"@en ;
    ex:title "Die Dunkle Seite des Mondes"@de ;
    ex:label "Harvest, EMI"^^xsd:string ;
    ex:released [ 
      ex:day "16"^^xsd:int ;
      ex:month "03"^^xsd:int ;
      ex:year "1973"^^xsd:gYear ] .
"""

g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))

8


Schreiben Sie nun eine *geschlossene* Einkaufsliste in beliebiger RDF Syntax, lesen Sie das RDF mit `g.parse()` ein und geben Sie dann die Grösse des Graphen aus. Die benötigten Pythonbefehle können Sie aus den obigen Beispielen entnehmen.

In [16]:
from rdflib import Graph

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:dobtvAwc a ex:ShoppingList ;
    ex:items (ex:banana ex:apples ex:oranges) .
"""

g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))
print('\n--- Die ungekürzte Form einer geschlossenen Liste, hier in RDF/XML ---\n')
print(g.serialize(format='xml').decode('utf-8'))

8

--- Die ungekürzte Form einer geschlossenen Liste, hier in RDF/XML ---

<?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF
   xmlns:ex="http://example.org#"
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
>
  <rdf:Description rdf:about="http://example.org#dobtvAwc">
    <rdf:type rdf:resource="http://example.org#ShoppingList"/>
    <ex:items rdf:nodeID="f74784682c74c43e8a456dbbc53ef0f77b1"/>
  </rdf:Description>
  <rdf:Description rdf:nodeID="f74784682c74c43e8a456dbbc53ef0f77b3">
    <rdf:first rdf:resource="http://example.org#oranges"/>
    <rdf:rest rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#nil"/>
  </rdf:Description>
  <rdf:Description rdf:nodeID="f74784682c74c43e8a456dbbc53ef0f77b1">
    <rdf:rest rdf:nodeID="f74784682c74c43e8a456dbbc53ef0f77b2"/>
    <rdf:first rdf:resource="http://example.org#banana"/>
  </rdf:Description>
  <rdf:Description rdf:nodeID="f74784682c74c43e8a456dbbc53ef0f77b2">
    <rdf:first rdf:resource="http://example.org#apples"/>
    <r