# RDF: Fortgeschrittene Themen

In dieser Übung werden wir uns einige fortgeschrittene Themen etwas genauer in der Praxis anschauen, insb. Datentypen, der *language tag*, Listen und Reifizierung in RDF. Wir beginnen mit Datetypen. Führen Sie den folgenden Codeblock aus.

In [2]:
!pip install rdflib
!pip install shortid



In [29]:
from rdflib import Graph, Literal, Namespace, BNode
from rdflib.namespace import XSD

def eq(l1, l2):
    print(l1.eq(l2))

Nun schauen Sie sich die folgende Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [4]:
eq(Literal('1973'), Literal('1973'))
# Erklärung: Die Literale sind syntaktisch gleich.

True


In [5]:
eq(Literal('1973'), Literal('1979')) 
# Erklärung: Die Literale sind synstaktisch ungeleich.

False


In [6]:
eq(Literal('1973'), Literal('1973', datatype=XSD.int)) 
# Erklärung: Da es sich beim rechten Literal um ein typisiertes Literal handelt und links um ein untypisiertes Literal, sind die Literale syntaktisch ungleich.

False


In [7]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.int)) 
# Erklärung: Beides sind typisierte Literale desselben Typs. Deshalb syntaktisch gleich.

True


In [8]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.float)) 
# Erklärung: Bei der Umwandlung von 1973 in float bzw int bleibt der gleiche Wert erhalten.

True


In [9]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.gYear)) 
# Erklärung: Unterschiedliche Typisierungen der Literale. 

False


Untypisierte Literale können auch einen sogenannten *language tag* enthalten.

Schauen Sie sich die folgenden Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [10]:
eq(Literal('The Wall'), Literal('The Wall'))
# Erklärung: syntaktisch gleich

True


In [11]:
eq(Literal('The Wall'), Literal('The Dark Side of the Moon'))
# Erklärung: syntaktisch ungleich.

False


In [12]:
eq(Literal('The Wall'), Literal('The Wall', lang='en'))
# Erklärung: syntaktisch ungleich, weil rechtes Literal den language tag-Zusatz hat. 

False


In [13]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='en'))
# Erklärung: syntaktisch gleich.

True


In [14]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='de'))
# Erklärung: Unterschiedlicher language tag.

False


Schauen Sie sich die folgenden RDF Graphen an und erklären Sie wie es zur unterschiedlichen Grösse kommt.

In [15]:
s = BNode()
p = BNode()

g0 = Graph()
g0.add((s, p, Literal('The Wall')))
g0.add((s, p, Literal('The Wall')))

print('Länge g0: {} Tripel'.format(len(g0))) # Erklärung: 1 Tripel, weil beide Literale syntaktisch gleich.

g1 = Graph()
g1.add((s, p, Literal('The Wall', lang='en')))
g1.add((s, p, Literal('The Wall', lang='de')))

print('Länge g1: {} Tripel'.format(len(g1))) # Erklärung: 2 Tripel, weil language tag syntaktisch ungleich.

g2 = Graph()
g2.add((s, p, Literal('The Wall', lang='en')))
g2.add((s, p, Literal('The Wall', lang='en')))

print('Länge g2: {} Tripel'.format(len(g2))) # Erklärung: 1 Tripel, weil language tag syntaktisch gleich.

g3 = Graph()
g3.add((s, p, Literal('The Wall')))
g3.add((s, p, Literal('The Dark Side of the Moon')))

print('Länge g3: {} Tripel'.format(len(g3))) # Erklärung: 2 Tripel, weil Literale syntaktisch ungleich.

g4 = Graph()
g4.add((s, p, Literal('1979')))
g4.add((s, p, Literal('1979', datatype=XSD.int)))

print('Länge g4: {} Tripel'.format(len(g4))) # Erklärung: 2 Tripel, weil letztes letztes Literal zusätliche Typisierung besitzt.

g5 = Graph()
g5.add((s, p, Literal('1973', datatype=XSD.int)))
g5.add((s, p, Literal('1973', datatype=XSD.int)))

print('Länge g5: {} Tripel'.format(len(g5))) # Erklärung: 1 Tripel weil beide Literale typisiert und syntaktisch korrekt sind.

Länge g0: 1 Tripel
Länge g1: 2 Tripel
Länge g2: 1 Tripel
Länge g3: 2 Tripel
Länge g4: 2 Tripel
Länge g5: 1 Tripel


Vervollständigen Sie nun das RDF mit Datentypen und einem *language tag* für Titel, und überprüfen Sie ob das RDF fehlerfrei ist.

In [21]:
from rdflib import Graph, Namespace, BNode, URIRef, Literal
from rdflib.namespace import RDF, XSD
from shortid import ShortId

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:dobtvAwc a ex:Album ;
    ex:title "The Dark Side of the Moon"@en ;
    ex:title "Die Dunkle Seite des Mondes"@de ;
    ex:label "Harvest, EMI"^^xsd:string ;
    ex:released [ 
      ex:day "16"^^xsd:gday;
      ex:month "03"^^xsd:gmonth ;
      ex:year "1973"^^xsd:gYear ] .
"""

g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))

8


Schreiben Sie nun eine *geschlossene* Einkaufsliste in beliebiger RDF Syntax, lesen Sie das RDF mit `g.parse()` ein und geben Sie dann die Grösse des Graphen aus. Die benötigten Pythonbefehle können Sie aus den obigen Beispielen entnehmen.

In [38]:
from rdflib import Graph, Namespace, BNode, URIRef, Literal
from rdflib.namespace import RDF, XSD
from shortid import ShortId

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:gggggg a ex:Einkaufsliste ;
    ex:bananen "3"^^xsd:int ;
    ex:weintrauben "2kg"^^xsd:string ; 
    .
"""


g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))

3
