# RDF: Fortgeschrittene Themen

In dieser Übung werden wir uns einige fortgeschrittene Themen etwas genauer in der Praxis anschauen, insb. Datentypen, der *language tag*, Listen und Reifizierung in RDF. Wir beginnen mit Datetypen. Führen Sie den folgenden Codeblock aus.

In [2]:
!pip install rdflib
!pip install shortid



You are using pip version 9.0.1, however version 10.0.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.




You are using pip version 9.0.1, however version 10.0.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.


In [5]:
from rdflib import Graph, Literal, Namespace, BNode
from rdflib.namespace import XSD

def eq(l1, l2):
    print(l1.eq(l2))

Nun schauen Sie sich die folgende Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [4]:
eq(Literal('1973'), Literal('1973'))
# Erklärung: Die beiden Literale stimmen überein

True


In [5]:
eq(Literal('1973'), Literal('1979')) 
# Erklärung: Das Literal '1973' ist ungleich '1979'

False


In [6]:
eq(Literal('1973'), Literal('1973', datatype=XSD.int)) 
# Erklärung: Das erste Literal wird als String behandelt, das zweite als integer, somit nicht gleich, denn ein andere Datentyp liegt vor

False


In [7]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.int)) 
# Erklärung: 'Integer' und 'int' bedeuten das gleiche

True


In [8]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.float)) 
# Erklärung: 'float' ist eine Unterart von 'integer' und somit der gleiche Datentyp

True


In [9]:
eq(Literal('1973', datatype=XSD.integer), Literal('1973', datatype=XSD.gYear)) 
# Erklärung: Das zweite '1973' ist ein anderer Datentyp als das erste

False


Untypisierte Literale können auch einen sogenannten *language tag* enthalten.

Schauen Sie sich die folgenden Literalvergleiche an und erklären Sie warum das Ergebnis wahr oder falsch ist.

In [10]:
eq(Literal('The Wall'), Literal('The Wall'))
# Erklärung: Die beiden Literale bedeuten das selbe

True


In [17]:
eq(Literal('The Wall'), Literal('The Dark Side of the Moon'))
# Erklärung: Das erste Literal ist ungleich dem zweiten

False


In [11]:
eq(Literal('The Wall'), Literal('The Wall', lang='en'))
# Erklärung: Dem ersten Literal wurde keine 'language' zugeordnet, dem zweiten schon. Somit sind die Literale nicht gleich

False


In [12]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='en'))
# Erklärung: Beiden Literalen wurden die gleichen Sprachen zugeordnet, und somit sind sie gleich. 

True


In [13]:
eq(Literal('The Wall', lang='en'), Literal('The Wall', lang='de'))
# Erklärung: Dem ersten Literal wurde eine andere Sprache zugeordnet, als dem zweiten. Somit sind sie ungleich

False


Schauen Sie sich die folgenden RDF Graphen an und erklären Sie wie es zur unterschiedlichen Grösse kommt.

In [6]:
s = BNode()
p = BNode()

g0 = Graph()
g0.add((s, p, Literal('The Wall')))
g0.add((s, p, Literal('The Wall')))

print('Länge g0: {} Tripel'.format(len(g0))) # Erklärung: Da beide statements die selben Ojbecte haben, zählen sie nur als ein Statement

g1 = Graph()
g1.add((s, p, Literal('The Wall', lang='en')))
g1.add((s, p, Literal('The Wall', lang='de')))

print('Länge g1: {} Tripel'.format(len(g1))) # Erklärung: Den Objecten wurden unterschiedliche Sprachen zugeordnet, sind somit auch ungleich und zählen als jeweils als eigenes Object

g2 = Graph()
g2.add((s, p, Literal('The Wall', lang='en')))
g2.add((s, p, Literal('The Wall', lang='en')))

print('Länge g2: {} Tripel'.format(len(g2))) # Erklärung: Den Objecten wurde die gleiche Sprache zugeordnet und sind somit in der Bedeutung gleich und werden dann nur als ein Object gezählt.

g3 = Graph()
g3.add((s, p, Literal('The Wall')))
g3.add((s, p, Literal('The Dark Side of the Moon')))

print('Länge g3: {} Tripel'.format(len(g3))) # Erklärung: Zwei unterschiedliche Objecte und somit zwei Statements.

g4 = Graph()
g4.add((s, p, Literal('1979')))
g4.add((s, p, Literal('1979', datatype=XSD.int)))

print('Länge g4: {} Tripel'.format(len(g4))) # Erklärung: Hier auch zwei unterschiedliche Objecte mit unterschiedlichen Bedeutungen und somit zwei Statements.

g5 = Graph()
g5.add((s, p, Literal('1973', datatype=XSD.int)))
g5.add((s, p, Literal('1973', datatype=XSD.int)))

print('Länge g5: {} Tripel'.format(len(g5))) # Erklärung: Zwei gleiche Objcte mit gleicher Bedeutung und somit nur ein Statement.

Länge g0: 1 Tripel
Länge g1: 2 Tripel
Länge g2: 1 Tripel
Länge g3: 2 Tripel
Länge g4: 2 Tripel
Länge g5: 1 Tripel


Vervollständigen Sie nun das RDF mit Datentypen und einem *language tag* für Titel, und überprüfen Sie ob das RDF fehlerfrei ist.

In [7]:
from rdflib import Graph, Namespace, BNode, URIRef, Literal
from rdflib.namespace import RDF, XSD
from shortid import ShortId

rdf = """
@prefix ex: <http://example.org#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix xml: <http://www.w3.org/XML/1998/namespace> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

ex:dobtvAwc a ex:Album ;
    ex:title "The Dark Side of the Moon"@literal ;
    ex:title "Die Dunkle Seite des Mondes"@literal ;
    ex:label "Harvest, EMI"^^xsd:lang="eng" ;
    ex:released [ 
      ex:day "16"^^xsd:decimal ;
      ex:month "03"^^xsd:decimal ;
      ex:year "1973"^^xsd:decimal ] ;
"""

g = Graph()
r = g.parse(data=rdf, format='turtle')

print(len(g))

BadSyntax: at line 11 of <>:
Bad syntax (expected '.' or '}' or ']' at end of statement) at ^ in:
"...b' des Mondes"@literal ;\n    ex:label "Harvest, EMI"^^xsd:lang'^b'="eng" ;\n    ex:released [ \n      ex:day "16"^^xsd:decimal ;'..."

Schreiben Sie nun eine *geschlossene* Einkaufsliste in beliebiger RDF Syntax, lesen Sie das RDF mit `g.parse()` ein und geben Sie dann die Grösse des Graphen aus. Die benötigten Pythonbefehle können Sie aus den obigen Beispielen entnehmen.

In [8]:
rdf = """
<rdf:Description rdf:about="http://example.org#Einkaufsliste">
    <ex:Backzutaten rdf:parseType="Collection">
        <rdf:Description rdf:about="http://www.example.org/Brot"/>
        <rdf:Description rdf:about="http://www.example.org/Mehl" />
        <rdf:Description rdf:about="http://www.example.org/Hefe" />
        <rdf:Description rdf:about="http://www.example.org/Olivenöl" />
        <rdf:Description rdf:about="http://www.example.org/Salz" />
    </ex:Backzutaten>
</rdf:Description>
"""
    
g = Graph()
r = g.parse(data=rdf, format='XML/RDF')

#Weder die Folien noch die obigen Beispiele helfen mir die Lösung zu finden. Bitte um Hilfe!

PluginException: No plugin registered for (XML/RDF, <class 'rdflib.parser.Parser'>)