# rdflib のチュートリアルを基にRDFの基礎を学習する

## 1. 既存RDFデータの読み込みと内容の確認

rdflib のインストール、google colab 上での　pip は、　!pip で動作する。

In [None]:
! pip install rdflib

Collecting rdflib
  Downloading rdflib-6.0.1-py3-none-any.whl (379 kB)
[K     |████████████████████████████████| 379 kB 5.2 MB/s 
Collecting isodate
  Downloading isodate-0.6.0-py2.py3-none-any.whl (45 kB)
[K     |████████████████████████████████| 45 kB 3.5 MB/s 
Installing collected packages: isodate, rdflib
Successfully installed isodate-0.6.0 rdflib-6.0.1


rdflib を利用した最も基本的なプログラム。ネット上のRDF データ（TBLの個人情報）を読み込む。

In [None]:
from rdflib import Namespace,BNode
from rdflib import URIRef, Graph
# Create a Graph
g = Graph()

# Parse in an RDF file hosted on the Internet
g.parse("http://www.w3.org/People/Berners-Lee/card")

# Loop through each triple in the graph (subj, pred, obj)
for subj, pred, obj in g:
    # Check if there is at least one triple in the Graph
    if (subj, pred, obj) not in g:
       raise Exception("It better be!")

# Print the number of "triples" in the Graph
print(f"Graph g has {len(g)} statements.")
# Prints: Graph g has 86 statements.

# Print out the entire Graph in the RDF Turtle format
#print(g.serialize(format="turtle"))

Graph g has 86 statements.


Berners-Lee/card では、この人物に関する情報が、3項組（主語-述語-> 目的語）で示されている。　86個の項目が定義されている。

In [None]:
print(g.serialize( format = "turtle"))

@prefix : <http://xmlns.com/foaf/0.1/> .
@prefix cc: <http://creativecommons.org/ns#> .
@prefix cert: <http://www.w3.org/ns/auth/cert#> .
@prefix con: <http://www.w3.org/2000/10/swap/pim/contact#> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix dct: <http://purl.org/dc/terms/> .
@prefix doap: <http://usefulinc.com/ns/doap#> .
@prefix geo: <http://www.w3.org/2003/01/geo/wgs84_pos#> .
@prefix ldp: <http://www.w3.org/ns/ldp#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix schema: <http://schema.org/> .
@prefix sioc: <http://rdfs.org/sioc/ns#> .
@prefix solid: <http://www.w3.org/ns/solid/terms#> .
@prefix space: <http://www.w3.org/ns/pim/space#> .
@prefix vcard: <http://www.w3.org/2006/vcard/ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

<http://dig.csail.mit.edu/2005/ajar/ajaw/data#Tabulator> doap:developer <https://www.w3.org/People/Berners-Lee/card#i> .

<http://dig.csail.mit.edu/2007/01/camp/data#course> :maker <https://www.w3.org/People/Berner

例えば、後半にある項目の一つは、<https://www.w3.org/People/Berners-Lee/card#i> :img　<https://www.w3.org/Press/Stock/Berners-Lee/2001-europaeum-eighth.jpg> という3項組からなり、述語（pred）は、「:img」で画像情報の在りかを指示している。主語である『「card#i」の画像は、「..eighth.jpg」である。』ということを意味している。
serialize の形式は、pretty-xml, N3, turtle がある。

## 2. 独自のRDFグラフ作ってみる

新たにDonna　という女性に関する三項組情報を構成していく


In [None]:
from rdflib import Graph, Literal, RDF, URIRef
# rdflib knows about quite a few popular namespaces, like W3C ontologies, schema.org etc.
from rdflib.namespace import FOAF , XSD

# Create a Graph
g = Graph()

# Create an RDF URI node to use as the subject for multiple triples
donna = URIRef("http://example.org/donna")

Donna という名前の女性に関す情報を追加してく。


In [None]:
# Add triples using store's add() method.
g.add((donna, RDF.type, FOAF.Person))
g.add((donna, FOAF.nick, Literal("donna", lang="en")))
g.add((donna, FOAF.name, Literal("Donna Fales")))
g.add((donna, FOAF.mbox, URIRef("mailto:donna@example.org")))

<Graph identifier=N1292b49187cc4c4fad6a71ea6f0fcba8 (<class 'rdflib.graph.Graph'>)>

別な人物に関する情報を加える。

In [None]:
# Add another person
ed = URIRef("http://example.org/edward")

# Add triples using store's add() method.
g.add((ed, RDF.type, FOAF.Person))
g.add((ed, FOAF.nick, Literal("ed", datatype=XSD.string)))
g.add((ed, FOAF.name, Literal("Edward Scissorhands")))
g.add((ed, FOAF.mbox, Literal("e.scissorhands@example.org", datatype=XSD.anyURI)))

<Graph identifier=N1292b49187cc4c4fad6a71ea6f0fcba8 (<class 'rdflib.graph.Graph'>)>

これまで形成されたグラフの全体像をprint する。

In [None]:
# Iterate over triples in store and print them out.
print("--- printing raw triples ---")
for s, p, o in g:
    print((s, p, o))

--- printing raw triples ---
(rdflib.term.URIRef('http://example.org/edward'), rdflib.term.URIRef('http://xmlns.com/foaf/0.1/mbox'), rdflib.term.Literal('e.scissorhands@example.org', datatype=rdflib.term.URIRef('http://www.w3.org/2001/XMLSchema#anyURI')))
(rdflib.term.URIRef('http://example.org/donna'), rdflib.term.URIRef('http://www.w3.org/1999/02/22-rdf-syntax-ns#type'), rdflib.term.URIRef('http://xmlns.com/foaf/0.1/Person'))
(rdflib.term.URIRef('http://example.org/edward'), rdflib.term.URIRef('http://xmlns.com/foaf/0.1/name'), rdflib.term.Literal('Edward Scissorhands'))
(rdflib.term.URIRef('http://example.org/edward'), rdflib.term.URIRef('http://xmlns.com/foaf/0.1/nick'), rdflib.term.Literal('ed', datatype=rdflib.term.URIRef('http://www.w3.org/2001/XMLSchema#string')))
(rdflib.term.URIRef('http://example.org/donna'), rdflib.term.URIRef('http://xmlns.com/foaf/0.1/name'), rdflib.term.Literal('Donna Fales'))
(rdflib.term.URIRef('http://example.org/edward'), rdflib.term.URIRef('http://w

全てのメンバーのメールボックスに関する情報を表示

In [None]:
# For each foaf:Person in the store, print out their mbox property's value.
print("--- printing mboxes ---")
for person in g.subjects(RDF.type, FOAF.Person):
    for mbox in g.objects(person, FOAF.mbox):
        print(mbox)

--- printing mboxes ---
mailto:donna@example.org
e.scissorhands@example.org


In [None]:
from rdflib import Namespace
ns = Namespace("http://love.com#")

Namespace 名前空間として新たに　love.com を定義した。

そのうえで、donna という要素と　ed という要素を「Love」関係でつなぐ

In [None]:
g.add((donna, ns['loves'], ed))

<Graph identifier=N1292b49187cc4c4fad6a71ea6f0fcba8 (<class 'rdflib.graph.Graph'>)>

この関係を利用する例としては、次のように記述する。

In [None]:
for l in g.objects(donna, FOAF.name):
  print(l)
print('Loves')
for x in g.objects(donna , ns.loves / FOAF.name):
  print (" %s" %x)

Donna Fales
Loves
 Edward Scissorhands


FOAF 名前空間（namespace）の登録、および全体の表示

In [None]:
# Bind the FOAF namespace to a prefix for more readable output
g.bind("foaf", FOAF)

# print all the data in the Notation3 format
print("--- printing mboxes ---")
print(g.serialize(format='n3'))

--- printing mboxes ---
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix ns1: <http://love.com#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .

<http://example.org/donna> a foaf:Person ;
    ns1:loves <http://example.org/edward> ;
    foaf:mbox <mailto:donna@example.org> ;
    foaf:name "Donna Fales" ;
    foaf:nick "donna"@en .

<http://example.org/edward> a foaf:Person ;
    foaf:mbox "e.scissorhands@example.org"^^xsd:anyURI ;
    foaf:name "Edward Scissorhands" ;
    foaf:nick "ed"^^xsd:string .




## 3. SPARQL による3項組＝グラフデータベースに対するクエリ（問い合わせ）例

Tim Berners-Lee の例で表示する。q=""" で始まる部分は、SPARQL言語によるRDFグラフに対するクエリ（問い合わせ）である。

In [None]:
# Create a Graph, pare in Internet data
g = Graph().parse("http://www.w3.org/People/Berners-Lee/card#1")

# Query the data in g using SPARQL
# This query returns the 'name' of all ``foaf:Person`` instances
q = """
    PREFIX foaf: <http://xmlns.com/foaf/0.1/>

    SELECT ?name
    WHERE {
        ?p rdf:type foaf:Person .
        ?p foaf:name ?name .
    }
"""

# Apply the query to the graph and iterate through results
for r in g.query(q):
    print(r["name"])

Timothy Berners-Lee


別の例として、比較的大きな映画に関するRDFデータを読み込む。（注意：IPythonを利用してファイルを読み込むためには、Google Driveに関して前処置が必要）
「John Malkovich」という役者が出演した映画のタイトルを答えさせる例は以下である。

In [None]:
mg = Graph()
mg.parse("content/drive/My Drive/Colab Notebooks/movies.xml")

res = mg.query("""SELECT ?fname WHERE{?film dc:title ?fname .
        ?film fb:film.film.performances ?perf .
        ?perf fb:film.performance.actor ?jm .
        ?jm dc:title "John Malkovich". }""")
print('=============================')
for row in res:
  print (" %s " %row)

file:///content/drive/My Drive/Colab Notebooks/movies.xml does not look like a valid URI, trying to serialize this will break.


 GARDENS OF THE NIGHT 
 CHANGELING 
