# RDF: Fortgeschrittene Themen

In dieser Übung werden wir uns einige fortgeschrittene Themen etwas genauer in der Praxis anschauen, insb. Datentypen, der *language tag*, Listen und Reifizierung in RDF. Wir beginnen mit Datetypen. Führen Sie den folgenden Codeblock aus.

In [1]:
from rdflib import Graph, Literal, Namespace, BNode
from rdflib.namespace import XSD

def eq(l1, l2):
    print(l1.eq(l2))

Nun schauen Sie sich die folgende Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [2]:
eq(Literal('1973'), Literal('1973'))
# Erklärung: Dies beiden Strings sind gleich == True

True


In [3]:
eq(Literal('1973'), Literal('1979')) 
# Erklärung: Der String 1973 =|= 1979 == False

False


In [4]:
eq(Literal('1973'), Literal('1973', datatype=XSD.int)) 
# Erklärung: Hier wird ein String mit einem int verglichen == False

False


In [5]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.int)) 
# Erklärung: Vegleich von integer(kurz int) mit int(lang integer) == True

True


In [8]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.float)) 
# Erklärung:  Vergleich von int mit x.0 float == True / mit x.1 x.2... float == False

True


In [9]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.gYear)) 
# Erklärung: Der String 1973 liegt nicht im Vokabular des Schema gYear. (Sollte bestimmt int sein...)

False


Untypisierte Literale können auch einen sogenannten *language tag* enthalten.

Schauen Sie sich die folgenden Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [10]:
eq(Literal('The Wall'), Literal('The Wall'))
# Erklärung: Vergleich zweier gleicher Strings == True

True


In [11]:
eq(Literal('The Wall'), Literal('The Dark Side of the Moon'))
# Erklärung: Vergleich zweier unterschiedlicher Strings == False

False


In [12]:
eq(Literal('The Wall'), Literal('The Wall', lang='en'))
# Erklärung: Beim zweiten Literal ist die Sprache bestimmt, beim ersten nicht.
# Somit wäre es falsch zu behaupten sie sind in der gleichen Sprache == False

False


In [13]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='en'))
# Erklärung: # Erklärung: Vergleich zweier gleicher Strings in gleicher Sprache == True

True


In [14]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='de'))
# Erklärung: # Erklärung: Vergleich zweier gleicher Strings in verschiedener Sprache == True

False


Schauen Sie sich die folgenden RDF Graphen an und erklären Sie wie es zur unterschiedlichen Grösse kommt.

In [16]:
s = BNode()
p = BNode()

g0 = Graph()
g0.add((s, p, Literal('The Wall')))
g0.add((s, p, Literal('The Wall')))

print('Länge g0: {} Tripel'.format(len(g0))) 
# Erklärung: hier wird dem Subjekt(g0) das Literal 'The Wall' angehängt.
# Zwar 2x, aber das Ergebnis bleibt... "Diese Wand ist blau" liefert mir auch nur diese Information.
# Auch bei mehrfach Aussage.

g1 = Graph()
g1.add((s, p, Literal('The Wall', lang='en')))
g1.add((s, p, Literal('The Wall', lang='de')))

print('Länge g1: {} Tripel'.format(len(g1))) 
# Erklärung: Hier sagen wir jetzt "Das Album ist Englisch" und auch "Das Album ist Deutsch".
# 2 Aussagen mit unterschiedlichen Informationen == 2 Triple

g2 = Graph()
g2.add((s, p, Literal('The Wall', lang='en')))
g2.add((s, p, Literal('The Wall', lang='en')))

print('Länge g2: {} Tripel'.format(len(g2))) 
# Erklärung: Eine wiederholte Aussage hat den gleichen Informationsgehalt... Bleibt 1 Triple...

g3 = Graph()
g3.add((s, p, Literal('The Wall')))
g3.add((s, p, Literal('The Dark Side of the Moon')))

print('Länge g3: {} Tripel'.format(len(g3))) 
# Erklärung: Subjekt(g0) hat hier zwei Literale bekommen.
# Informationsgehalt der Literale ist verschieden, also 2 Triple.

g4 = Graph()
g4.add((s, p, Literal('1979')))
g4.add((s, p, Literal('1979', datatype=XSD.int)))

print('Länge g4: {} Tripel'.format(len(g4)))
# Erklärung: Subjekt(g0) hat hier zwei Literale bekommen.
# Informationsgehalt der Literale ist verschieden(string(1979)+int(1979)), also 2 Triple.

g5 = Graph()
g5.add((s, p, Literal('1973', datatype=XSD.int)))
g5.add((s, p, Literal('1973', datatype=XSD.int)))

print('Länge g5: {} Tripel'.format(len(g5))) 
# Erklärung: Wiederholte Aussage liefert nur eine Information. == 1 Triple

Länge g0: 1 Tripel
Länge g1: 2 Tripel
Länge g2: 1 Tripel
Länge g3: 2 Tripel
Länge g4: 2 Tripel
Länge g5: 1 Tripel


Vervollständigen Sie nun das RDF mit Datentypen und einem *language tag* für Titel, und überprüfen Sie ob das RDF fehlerfrei ist.

In [17]:
from rdflib import Graph, Namespace, BNode, URIRef, Literal
from rdflib.namespace import RDF, XSD
from shortid import ShortId

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:dobtvAwc a ex:Album ;
    ex:title "The Dark Side of the Moon"@... ;
    ex:title "Die Dunkle Seite des Mondes"@... ;
    ex:label "Harvest, EMI"^^xsd:... ;
    ex:released [ 
      ex:day "16"^^xsd:... ;
      ex:month "03"^^xsd:... ;
      ex:year "1973"^^xsd:... ] .
"""

g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))

ImportError: No module named 'shortid'

Schreiben Sie nun eine *geschlossene* Einkaufsliste in beliebiger RDF Syntax, lesen Sie das RDF mit `g.parse()` ein und geben Sie dann die Grösse des Graphen aus. Die benötigten Pythonbefehle können Sie aus den obigen Beispielen entnehmen.