# Czym jest rdflib

Pakiet Pythona pomocny w pracy z grafami RDF. Umożliwia:
- wczytywanie grafów z internetu
- zapisywanie grafów
- parsowanie i serializację grafów
- wydawanie zapytań za pomocą języka SPARQL

Instalacja pakietu w środowisku unixowym:
> pip install rdflib

W celu ćwiczeń użyjemy przykładowego grafu opisującego domenę uniwersytetu (pochodzącego z repozytorium systemu ontop: https://github.com/ontop/ontop). 

Kulczak Wojciech, IP, 136270, L1

# Tworzenie grafu

In [1]:
!pip install rdflib

import rdflib

/bin/bash: pip: command not found


Tworzenie elementu grafu:

In [2]:
from rdflib import Graph
g1 = Graph()

Ładowanie grafu z zewnętrznego źródła:

In [3]:
result = g1.parse("university.ttl", format="ttl")

In [4]:
print("Graf zawiera %s trójek." % len(g1))

Graf zawiera 250 trójek.


# Serializacja grafu

Graf rdf możemy serializować na wiele różnych formatów: xml, turle, n3, json-ld itd. Poniżej znajduje się przykład serializacji do formatu turtle. 

In [5]:
print(g1.serialize(format='turtle'))


b'@prefix ns1: <http://example.org/voc#> .\n@prefix ns2: <http://xmlns.com/foaf/0.1/> .\n@prefix owl: <http://www.w3.org/2002/07/owl#> .\n@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .\n\n<http://example.org/uni1/academic/1> a ns1:FacultyMember,\n        ns1:FullProfessor,\n        owl:NamedIndividual ;\n    ns1:teaches <http://example.org/uni1/course/1234>,\n        <http://example.org/uni1/course/1235> ;\n    ns2:firstName "Anna"^^xsd:string ;\n    ns2:lastName "Chambers"^^xsd:string .\n\n<http://example.org/uni1/academic/10> a ns1:ExternalTeacher,\n        ns1:FacultyMember,\n        owl:NamedIndividual ;\n    ns2:firstName "Udi"^^xsd:string ;\n    ns2:lastName "Heinrike"^^xsd:string .\n\n<http://example.org/uni1/academic/11> a ns1:FacultyMember,\n        ns1:PostDoc,\n        owl:NamedIndividual ;\n    ns2:firstName "Alvena"^^xsd:string ;\n    ns2:lastName "Merry"^^xsd:string .\n\n<http://example.org/uni1/academic/12> a ns1:FacultyMember,\n        ns1:FullProfessor,\n        ow

<span style="color:red"> __Zadanie 1: serializuj graf g1 do formatu XML ('pretty-xml').__ </span>

In [6]:
print(g1.serialize(format='pretty-xml'))
#tutaj wprowadź rozwiązanie zadania 1

b'<?xml version="1.0" encoding="utf-8"?>\n<rdf:RDF\n  xmlns:ns1="http://example.org/voc#"\n  xmlns:owl="http://www.w3.org/2002/07/owl#"\n  xmlns:ns2="http://xmlns.com/foaf/0.1/"\n  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"\n>\n  <ns1:Student rdf:about="http://example.org/uni1/student/5">\n    <ns1:attends>\n      <owl:NamedIndividual rdf:about="http://example.org/uni1/course/1500">\n        <ns1:title>Data Mining</ns1:title>\n        <rdf:type rdf:resource="http://example.org/voc#Course"/>\n        <ns1:isGivenAt rdf:resource="http://example.org/uni1/university"/>\n      </owl:NamedIndividual>\n    </ns1:attends>\n    <ns1:attends>\n      <ns1:Course rdf:about="http://example.org/uni1/course/1502">\n        <ns1:isGivenAt rdf:resource="http://example.org/uni1/university"/>\n        <rdf:type rdf:resource="http://www.w3.org/2002/07/owl#NamedIndividual"/>\n        <ns1:title>Research Methods</ns1:title>\n      </ns1:Course>\n    </ns1:attends>\n    <ns2:lastName rdf:datatyp

# Iterowanie po trójkach w grafie 

Możemy także iterować po trójkach w grafie jak pokazane poniżej:


In [7]:
for s, p, o in g1:
  print(s, p, o)

http://example.org/uni1/student/5 http://example.org/voc#attends http://example.org/uni1/course/1500
http://example.org/uni1/academic/5 http://xmlns.com/foaf/0.1/lastName Richmal
http://example.org/uni1/academic/9 http://xmlns.com/foaf/0.1/lastName Chernobog
http://example.org/uni2/person/11 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://xmlns.com/foaf/0.1/Person
http://example.org/uni2/person/6 http://xmlns.com/foaf/0.1/firstName Victor
http://example.org/uni1/course/1234 http://example.org/voc#isGivenAt http://example.org/uni1/university
http://example.org/uni2/course/6 http://example.org/voc#title Intelligent Systems
http://example.org/uni2/course/5 http://example.org/voc#isGivenAt http://example.org/uni2/university
http://example.org/voc#GraduateStudent http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/2002/07/owl#Class
http://example.org/uni2/person/4 http://xmlns.com/foaf/0.1/firstName Rachel
http://example.org/uni1/academic/7 http://www.w3.org/1999/02/22-

# Przestrzenie nazw

rdflib pozwala utworzyć własne przestrzenie nazw:

In [8]:
from rdflib import Namespace
n1 = Namespace("http://semantic.cs.put.poznan.pl/university/")

Przestrzenie nazw, które są zdefiniowane w pakiecie to: RDF, RDFS, OWL, XSD, FOAF, SKOS, DOAP, DC, DCTERMS,VOID

In [9]:
from rdflib.namespace import FOAF, DC, RDF

<span style="color:red"> __Zadanie 2: Zaimportuj przestrzeń nazw XSD__ </span>

In [10]:
# tutaj wprowadź rozwiązanie zadania 2
from rdflib.namespace import XSD

# Zasoby

## Reprezentacja podstawowych elementów i ich tworzenie

- URIRef

Poniżej pokazano tworzenie referencji do zasobów (reprezentowanych przez URI).

In [11]:
from rdflib import URIRef, BNode, Literal
academic1 = URIRef("http://example.org/uni1/academic/1")
academic2 = URIRef("http://example.org/uni1/academic/2")
teaches = URIRef("http://example.org/voc#teaches")
attends = URIRef("http://example.org/voc#attends")
course1500 = URIRef("http://example.org/uni1/course/1500")
student = URIRef("http://example.org/voc#UndergraduateStudent")
student1 = URIRef("http://example.org/uni1/student/1")

<span style="color:red"> __Zadanie 3: Utwórz następujące zasoby:__ </span>
- http://example.org/uni1/academic/1000 
- http://example.org/uni2/course/1000

        

In [12]:
academic1000 = URIRef("http://example.org/uni1/academic/1000")
course1000 = URIRef("http://example.org/uni2/course/1000")
#tutaj wprowadź rozwiązanie zadania 3

- BNode: węzeł anonimowy

In [13]:
bnode = BNode()

• Literal

In [14]:
from rdflib.namespace import XSD

anna = Literal('Anna', datatype = XSD.string)
chambers = Literal('Chambers', datatype = XSD.string)

<span style="color:red"> __Zadanie 4: Utwórz następujące literały:__ </span>
- 'Jan' (datatype = XSD.string)
- 'Kowalski' (datatype = XSD.string)

In [15]:
jan_literal = Literal('Jan', datatype = XSD.string)
kowalski_literal = Literal('Kowalski', datatype = XSD.string)
# tutaj wprowadź rozwiązanie zadania 4

# Dodawanie i usuwanie trójek

- Dodawanie trójek RDF:

In [16]:
g1.add((academic1, teaches, course1500))

<span style="color:red"> __Zadanie 5: dodaj do grafu g1 następującą trójkę: (academic1, FOAF.name, chambers)__ </span>


In [17]:
g1.add((academic1, FOAF.name, chambers))
# tutaj wprowadź rozwiązanie zadania 5

<span style="color:red"> __Zadanie 6: dodaj do grafu g1 następującą informację: (student1, attends, _bnode1), (_bnode1, title, "Data Mining"). Uwaga: _bnode1 może być zastąpiony dowolnym identyfikatorem węzła anonimowego (np. automatycznie wygenerowanym). __ </span>

In [18]:
bnode1 = BNode()
_bnode1 = BNode()
title = URIRef("http://example.org/voc#title")
Ldata_mining = Literal("Data Mining", datatype = XSD.string)
g1.add((student1, attends, bnode))
g1.add((_bnode1, title, Ldata_mining))
# tutaj wprowadź rozwiązanie zadania 6

In [19]:
FOAF

rdf.namespace.ClosedNamespace('http://xmlns.com/foaf/0.1/')

Podobnie możemy usunąć trójkę/trójki:

In [20]:
g1.remove( (academic2, None, None) )

# Odczyt grafu

- Odczyt trójki z grafu

Grafy RDFLib wspierają podstawowe dopasowywanie wzorców za pomocą funkcji triples(). Ta funkcja jest generatorem trójek, które można dopasować do wzorca określonego przez argumenty. Termy __None__ są traktowane jako wildcard, np:

In [21]:
for s,p,o in g1.triples( (None, RDF.type, FOAF.Person) ):
   print("%s jest osobą"%s)

http://example.org/uni2/person/4 jest osobą
http://example.org/uni2/person/11 jest osobą
http://example.org/uni2/person/9 jest osobą
http://example.org/uni2/person/1 jest osobą
http://example.org/uni2/person/10 jest osobą
http://example.org/uni2/person/6 jest osobą
http://example.org/uni2/person/8 jest osobą
http://example.org/uni2/person/2 jest osobą
http://example.org/uni2/person/7 jest osobą
http://example.org/uni2/person/5 jest osobą
http://example.org/uni2/person/3 jest osobą


Odczyt podmiotu

In [22]:
# podmioty dla danego typu
for person in g1.subjects(RDF.type, student):
   print("%s jest studentem"%person)

http://example.org/uni2/person/2 jest studentem
http://example.org/uni2/person/10 jest studentem


Odczyt predykatu

In [23]:
# predykaty dla podmiotu i obiektu
for pred in g1.predicates(student1, None): 
   print(pred)

http://example.org/voc#attends
http://xmlns.com/foaf/0.1/firstName
http://example.org/voc#attends
http://www.w3.org/1999/02/22-rdf-syntax-ns#type
http://example.org/voc#attends
http://www.w3.org/1999/02/22-rdf-syntax-ns#type
http://example.org/voc#attends
http://xmlns.com/foaf/0.1/lastName


In [24]:
!ls

lab-rdf.ipynb  test.jpg  university.ttl


In [25]:
# obiekty dla podmiotu i predykatu
first_name = URIRef("http://xmlns.com/foaf/0.1/firstName")
# gr = g1.objects(student1, first_name)
# print(type(gr)) # albo
# print([x for x in g1.objects(student1, first_name)])

print(g1.value(student1, first_name))

Mary


<span style="color:red"> __Zadanie 7: z grafu g1 odczytaj nazwy (http://example.org/voc#title) wszystkich kursów (instancji typu http://example.org/voc#Course)__ </span>

In [26]:
for course in g1.subjects(RDF.type, URIRef("http://example.org/voc#Course")):
    print(g1.value(course, title))
# tutaj wprowadź rozwiązanie zadania 7

Analysis
Research Methods
Operating Systems
Linear Algebra
Theory of Computing
Software process management
Data Mining
Introduction to programming
Discrete mathematics and logic
Software factory
Information security
Intelligent Systems


<span style="color:red"> __Zadanie 8: z grafu g1 odczytaj wszystkich członków wydziału (instancji typu http://example.org/voc#FacultyMember) którzy uczą (http://example.org/voc#teaches) kursu http://example.org/uni1/course/1500 __ </span>   

In [27]:
# tutaj wprowadź rozwiązanie zadania 8

In [28]:
for fmember in g1.subjects(RDF.type, URIRef("http://example.org/voc#FacultyMember")):
    for s,p,o in g1.triples((fmember, URIRef("http://example.org/voc#teaches"), course1500)):
        print("{}: {} {}".format(s, g1.value(s, first_name), g1.value(s, URIRef("http://xmlns.com/foaf/0.1/lastName"))))

http://example.org/uni1/academic/12: Kyler Josephina
http://example.org/uni1/academic/1: Anna Chambers


In [29]:
for s, p, o in g1:
  print(s, p, o)

http://example.org/uni1/student/5 http://example.org/voc#attends http://example.org/uni1/course/1500
http://example.org/uni1/academic/5 http://xmlns.com/foaf/0.1/lastName Richmal
http://example.org/uni1/academic/9 http://xmlns.com/foaf/0.1/lastName Chernobog
http://example.org/uni2/person/11 http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://xmlns.com/foaf/0.1/Person
http://example.org/uni2/person/6 http://xmlns.com/foaf/0.1/firstName Victor
http://example.org/uni1/course/1234 http://example.org/voc#isGivenAt http://example.org/uni1/university
http://example.org/uni2/course/6 http://example.org/voc#title Intelligent Systems
http://example.org/uni2/course/5 http://example.org/voc#isGivenAt http://example.org/uni2/university
http://example.org/voc#GraduateStudent http://www.w3.org/1999/02/22-rdf-syntax-ns#type http://www.w3.org/2002/07/owl#Class
http://example.org/uni2/person/4 http://xmlns.com/foaf/0.1/firstName Rachel
http://example.org/uni1/academic/7 http://www.w3.org/1999/02/22-