# RDF: Fortgeschrittene Themen

In dieser Übung werden wir uns einige fortgeschrittene Themen etwas genauer in der Praxis anschauen, insb. Datentypen, der *language tag*, Listen und Reifizierung in RDF. Wir beginnen mit Datetypen. Führen Sie den folgenden Codeblock aus.

In [None]:
!pip install rdflib

In [1]:
from rdflib import Graph, Literal, BNode
from rdflib.namespace import XSD

def eq(l1, l2):
    print(l1.eq(l2))

Nun schauen Sie sich die folgende Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [2]:
eq(Literal('1973'), Literal('1973'))
# Erklärung: die beiden Literale haben den gleichen Wert und sind somit semantisch und syntaktisch gleich

True


In [3]:
eq(Literal('1973'), Literal('1979')) 
# Erklärung: die Werte der beiden Literale sind unterschiedlich, weshalb False als Ergebnis erscheint

False


In [4]:
eq(Literal('1973'), Literal('1973', datatype=XSD.int)) 
# Erklärung: nur das zweite Literal wurd mit einem Datentyp deklariert. da das andere Literal untypisiert ist, werden die beiden Literale ungleich behandelt

False


In [5]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.int)) 
# Erklärung: hier sind zwei typisierte Literale, die semantisch gleich sind.

True


In [6]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.float)) 
# Erklärung: hier sind zwei typisierte Literale, die semantisch gleich sind.

True


In [7]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.gYear)) 
# Erklärung: 

False


Untypisierte Literale können auch einen sogenannten *language tag* enthalten.

Schauen Sie sich die folgenden Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [8]:
eq(Literal('The Wall'), Literal('The Wall'))
# Erklärung: die beiden Literale haben den gleichen Wert

True


In [9]:
eq(Literal('The Wall'), Literal('The Dark Side of the Moon'))
# Erklärung: die beiden Literale haben unterschiedliche Inhalte

False


In [10]:
eq(Literal('The Wall'), Literal('The Wall', lang='en'))
# Erklärung:da das language tag nur für ein Literal gilt, erscheint False

False


In [11]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='en'))
# Erklärung:hier sind beide Literale mit einem language tag deklariert, wodurch sie semantisch gleich sind

True


In [12]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='de'))
# Erklärung:die beidne Literale haben unterschiedliche language tags, wodurch False erzeugt wird

False


Schauen Sie sich die folgenden RDF Graphen an und erklären Sie wie es zur unterschiedlichen Grösse kommt.

In [13]:
s = BNode()
p = BNode()

g0 = Graph()
g0.add((s, p, Literal('The Wall')))
g0.add((s, p, Literal('The Wall')))

print('Länge g0: {} Tripel'.format(len(g0))) # Erklärung:

g1 = Graph()
g1.add((s, p, Literal('The Wall', lang='en')))
g1.add((s, p, Literal('The Wall', lang='de')))

print('Länge g1: {} Tripel'.format(len(g1))) # Erklärung:

g2 = Graph()
g2.add((s, p, Literal('The Wall', lang='en')))
g2.add((s, p, Literal('The Wall', lang='en')))

print('Länge g2: {} Tripel'.format(len(g2))) # Erklärung:

g3 = Graph()
g3.add((s, p, Literal('The Wall')))
g3.add((s, p, Literal('The Dark Side of the Moon')))

print('Länge g3: {} Tripel'.format(len(g3))) # Erklärung:

g4 = Graph()
g4.add((s, p, Literal('1979')))
g4.add((s, p, Literal('1979', datatype=XSD.int)))

print('Länge g4: {} Tripel'.format(len(g4))) # Erklärung:

g5 = Graph()
g5.add((s, p, Literal('1973', datatype=XSD.int)))
g5.add((s, p, Literal('1973', datatype=XSD.int)))

print('Länge g5: {} Tripel'.format(len(g5))) # Erklärung:

Länge g0: 1 Tripel
Länge g1: 2 Tripel
Länge g2: 1 Tripel
Länge g3: 2 Tripel
Länge g4: 2 Tripel
Länge g5: 1 Tripel


Vervollständigen Sie nun das RDF mit Datentypen und einem *language tag* für Titel, und überprüfen Sie ob das RDF fehlerfrei ist.

In [None]:
from rdflib import Graph

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:dobtvAwc a ex:Album ;
    ex:title "The Dark Side of the Moon"@... ;
    ex:title "Die Dunkle Seite des Mondes"@... ;
    ex:label "Harvest, EMI"^^xsd:... ;
    ex:released [ 
      ex:day "16"^^xsd:... ;
      ex:month "03"^^xsd:... ;
      ex:year "1973"^^xsd:... ] .
"""

g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))

Schreiben Sie nun eine *geschlossene* Einkaufsliste in beliebiger RDF Syntax, lesen Sie das RDF mit `g.parse()` ein und geben Sie dann die Grösse des Graphen aus. Die benötigten Pythonbefehle können Sie aus den obigen Beispielen entnehmen.