In [None]:
# pip install rdflib

# RDF (Resource Description Framework) ile Çalışmak

`rdflib`, RDF veri formatında bilgileri yönetmek için kullanılan güçlü bir Python kütüphanesidir. RDF, verilerin üçlüler halinde (subject-predicate-object) saklanmasını sağlar. Bu, özellikle bilgi grafikleri veya ontolojiler oluştururken çok kullanışlıdır. RDF formatı, Linked Data ve Semantic Web gibi kavramların temelini oluşturur.

## Alternatif Yöntemler

RDF ile çalışmak için başka kütüphaneler de kullanılabilir, örneğin Apache Jena. Ancak Python'da genellikle `rdflib` en yaygın tercih edilenidir. `rdflib`, Python 2 ve Python 3 sürümlerinde kullanılabilir ve geniş bir topluluk tarafından desteklenir.

In [21]:
# b. Graph Nesnesi ve Namespace Tanımlaması
# Aşağıdaki kod ile bir RDF grafiği oluşturuluyor:
from rdflib import Graph, URIRef, Literal, Namespace


In [20]:
# Create a new RDF graph
g = Graph()
"""
Burada Graph() fonksiyonu ile yeni bir RDF grafiği oluşturuluyor. Bu, RDF üçlülerinin saklanacağı yerdir.

Namespace ise RDF içerisinde kullanılan verilerin anlaşılabilir bir biçimde organize edilmesi için kullanılıyor
"""

'\nBurada Graph() fonksiyonu ile yeni bir RDF grafiği oluşturuluyor. Bu, RDF üçlülerinin saklanacağı yerdir.\n\nNamespace ise RDF içerisinde kullanılan verilerin anlaşılabilir bir biçimde organize edilmesi için kullanılıyor\n'

In [19]:
# Define a namespace for your entities
EX = Namespace("http://ncirl.ie/")

# Bind the namespace prefix (optional but useful for readability)
g.bind("ex", EX)
# bind nedir? Namespace ve prefix arasında bir ilişki kurar. Bu, RDF grafiğindeki verileri daha okunabilir hale getirir.
# Namespace kavramı, RDF grafiği içindeki verilerin belirli bir URL alanına ait olduğunu belirtir. Burada "http://ncirl.ie/" alan adı bir örnek olarak kullanılıyor.

In [18]:
"""c. Üçlülerin Eklenmesi
RDF'nin temeli, "subject", "predicate" ve "object" şeklinde organize edilen üçlülerdir:
"""
#Add Triples to the Knowledge Graph

# Define some entities (subjects and objects)
person1 = URIRef(EX["John_Doe"])
person2 = URIRef(EX["Jane_Smith"])
organization = URIRef(EX["My_Company"])

# Add properties (predicates)
works_for = URIRef(EX["works_for"])
has_age = URIRef(EX["has_age"])

# Add triples to the graph (subject, predicate, object)
g.add((person1, works_for, organization))  # John Doe works for Example Company
g.add((person2, works_for, organization))  # Jane Smith works for Example Company
g.add((person1, has_age, Literal(29)))  # John Doe has age 29
g.add((person2, has_age, Literal(32)))  # Jane Smith has age 32

"""URIRef: Bu fonksiyon, RDF'nin öznesi veya nesnesi olan varlıkları tanımlamak için kullanılır. Her bir varlık, bir URI (Uniform Resource Identifier) ile tanımlanır. Örneğin, "John_Doe" bir URI olarak temsil ediliyor.

Literal: Sayısal değerler veya dizeler gibi RDF'de kullanılan diğer veriler için kullanılır. Örneğin, "29" bir Literal olarak tanımlanmış.
"""

'URIRef: Bu fonksiyon, RDF\'nin öznesi veya nesnesi olan varlıkları tanımlamak için kullanılır. Her bir varlık, bir URI (Uniform Resource Identifier) ile tanımlanır. Örneğin, "John_Doe" bir URI olarak temsil ediliyor.\n\nLiteral: Sayısal değerler veya dizeler gibi RDF\'de kullanılan diğer veriler için kullanılır. Örneğin, "29" bir Literal olarak tanımlanmış.\n'

# SPARQL ile RDF Verileri Üzerinde Sorgulamalar

SPARQL (SPARQL Protocol and RDF Query Language), RDF verilerini sorgulamak için kullanılan bir sorgu dilidir. SQL'ye benzer bir yapısı vardır ancak RDF’nin üçlü yapısına uyacak şekilde tasarlanmıştır. SPARQL, RDF grafiğindeki verileri seçmek, düzenlemek, güncellemek ve silmek için kullanılabilir.

## SPARQL Nedir?

SPARQL, RDF veri kümeleri üzerinde sorgulama yapmak için geliştirilmiş bir dildir. RDF'nin üçlü yapısına uygun olarak tasarlanmıştır ve RDF grafiğindeki verileri seçmek, düzenlemek, güncellemek ve silmek için kullanılabilir.

## SPARQL Sorgu Örneği: Verileri Çekmek

Önceden eklediğimiz RDF grafiğimiz üzerinde SPARQL kullanarak sorgu yapmaya bakalım. Aşağıdaki örnekte, RDF grafiğimizden belirli verileri sorgulamak için `rdflib` kütüphanesi içindeki SPARQL sorgulama mekanizmasını kullanacağız.

### Adım 1: RDF Grafiğini Oluşturma

Öncelikle, RDF grafiğimizi oluşturuyoruz ve bazı üçlüler ekliyoruz.

In [16]:
# Serialize the graph in Turtle format
# You can serialize (save) the graph in different formats such as Turtle (TTL), XML, or N-Triples (NT).
print(g.serialize(format="xml"))
# Burada serialize fonksiyonu, RDF grafiğini belirtilen formatta (örneğin, XML) serileştirir. Bu, verileri bir dosyaya veya ağ üzerindeki bir hedefe kaydetmek için kullanılabilir.
# amaç? Ve nerede işimize yarar? Verileri bir dosyaya veya ağ üzerindeki bir hedefe kaydetmek için kullanılabilir. Örneğin, bir bilgi grafiğini bir dosyaya kaydedebilir ve daha sonra başka bir uygulamada kullanabilirsiniz.

<?xml version="1.0" encoding="utf-8"?>
<rdf:RDF
   xmlns:ex="http://ncirl.ie/"
   xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
>
  <rdf:Description rdf:about="http://ncirl.ie/John_Doe">
    <ex:works_for rdf:resource="http://ncirl.ie/My_Company"/>
    <ex:has_age rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">29</ex:has_age>
  </rdf:Description>
  <rdf:Description rdf:about="http://ncirl.ie/Jane_Smith">
    <ex:works_for rdf:resource="http://ncirl.ie/My_Company"/>
    <ex:has_age rdf:datatype="http://www.w3.org/2001/XMLSchema#integer">32</ex:has_age>
  </rdf:Description>
</rdf:RDF>



# Adım 2: SPARQL Sorgusu Yazma
* Şimdi, RDF grafiğimizden belirli verileri sorgulamak için bir SPARQL sorgusu yazalım. Bu örnekte, "Example Company" için çalışan tüm kişileri bulacağız.

In [11]:
from rdflib.plugins.sparql import prepareQuery


In [12]:
# Write a SPARQL query to find all people who work for Example Company
q = prepareQuery('''
  SELECT ?person
  WHERE {
    ?person ex:works_for ex:My_Company .
  }
''', initNs={"ex": EX})

# Adım 3: Sorguyu Çalıştırma ve Sonuçları Yazdırma
* Son olarak, sorguyu çalıştırıp sonuçları yazdıralım.

In [13]:
# Save the graph to a Turtle file
g.serialize(destination="knowledge_graph.ttl", format="xml")

<Graph identifier=N62ee9d5f0c424c40bd3bac6813b411a7 (<class 'rdflib.graph.Graph'>)>

In [14]:
# Create a new graph
newg = Graph()

# Load the Turtle file into the graph
newg.parse("knowledge_graph.ttl", format="xml")

<Graph identifier=Nfb7564da13f947c388a8d0e3cd9a251b (<class 'rdflib.graph.Graph'>)>

In [15]:
# Execute the query and print the results
for row in newg.query(q):
    print(row)

(rdflib.term.URIRef('http://ncirl.ie/John_Doe'),)
(rdflib.term.URIRef('http://ncirl.ie/Jane_Smith'),)
