## Материалы по Python:

[10 видеоуроков "Python: основы программирования"](https://www.youtube.com/playlist?list=PLsFgCA3RuGOCgfD0evyDcJf27G3VpWumX)

[Учебник по языку программирования Python](http://dfedorov.spb.ru/python3/book.pdf) 

## SPARQL

(от англ. SPARQL Protocol and RDF Query Language) – язык запросов к данным, представленным по модели [RDF](https://ru.wikipedia.org/wiki/Resource_Description_Framework). 

[Официальное описание SPARQL](https://www.w3.org/TR/sparql11-overview/)

[SPARQL in 11 minutes](https://www.youtube.com/watch?v=FvGndkpa4K0)

[Сервисы, предоставляющие API для доступа к базам знаний](https://www.w3.org/wiki/SparqlEndpoints)

[SPARQLWrapper](https://rdflib.github.io/sparqlwrapper/) – библиотека-обертка для работы с SPARQL на языке Python (на других языках: RDF-Query для Perl, SPARQL/Grammar для Ruby и ARQ для Java).

[Документация для SPARQLWrapper](https://rdflib.github.io/sparqlwrapper/doc/latest/)

In [3]:
!pip install SPARQLWrapper

Collecting SPARQLWrapper
  Downloading https://files.pythonhosted.org/packages/b0/1d/d7c60a451a255fca655fe37eb3f6e3b3daa7d33fc87eeec0d8631d501e76/SPARQLWrapper-1.8.4-py3-none-any.whl
Installing collected packages: SPARQLWrapper
Successfully installed SPARQLWrapper-1.8.4


Далее приведены примеры автоматизации запросов к базе знаний: https://dbpedia.org/sparql

Следующий запрос возвращает ответ в формате [JSON](https://www.w3.org/TR/rdf-sparql-json-res/) -> **dict**:
Содержимое переменной results будет иметь вид:
```javascript
{ 'head':    {'vars': ['label'], 'link': []}, 
  'results': {'distinct': False, 'bindings': 
                                [{'label': {'value': 'Asturias', 'xml:lang': 'en', 'type': 'literal'}}, 
                                 {'label': {'value': 'منطقة أستورياس', 'xml:lang': 'ar', 'type': 'literal'}}, 
                                 {'label': {'value': 'Asturien', 'xml:lang': 'de', 'type': 'literal'}}, 
                                 {'label': {'value': 'Asturias', 'xml:lang': 'es', 'type': 'literal'}}, 
                                 {'label': {'value': 'Asturies', 'xml:lang': 'fr', 'type': 'literal'}}, 
                                 {'label': {'value': 'Asturie', 'xml:lang': 'it', 'type': 'literal'}}, 
                                 {'label': {'value': 'アストゥリアス州', 'xml:lang': 'ja', 'type': 'literal'}}, 
                                 {'label': {'value': 'Asturië (regio)', 'xml:lang': 'nl', 'type': 'literal'}}, 
                                 {'label': {'value': 'Asturia', 'xml:lang': 'pl', 'type': 'literal'}}, 
                                 {'label': {'value': 'Astúrias', 'xml:lang': 'pt', 'type': 'literal'}}, 
                                 {'label': {'value': 'Астурия', 'xml:lang': 'ru', 'type': 'literal'}}, 
                                 {'label': {'value': '阿斯图里亚斯', 'xml:lang': 'zh', 'type': 'literal'}}],  
  'ordered': True}
} 
```

In [14]:
# Пример с официального сайта: https://rdflib.github.io/sparqlwrapper/

from SPARQLWrapper import SPARQLWrapper, JSON
from pprint import pprint

sparql = SPARQLWrapper("http://dbpedia.org/sparql")
queryString = """
    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
    SELECT ?label
    WHERE { <http://dbpedia.org/resource/Asturias> rdfs:label ?label }
"""
sparql.setQuery(queryString)
sparql.setReturnFormat(JSON)
results = sparql.query().convert()

pprint(results)
print('____________________')

if not results["results"]["bindings"]:
    print ("No results found.")       
else:
    for result in results["results"]["bindings"]:
        print(result["label"]["value"])    

{'head': {'link': [], 'vars': ['label']},
 'results': {'bindings': [{'label': {'type': 'literal',
                                     'value': 'Asturias',
                                     'xml:lang': 'en'}},
                          {'label': {'type': 'literal',
                                     'value': 'منطقة أستورياس',
                                     'xml:lang': 'ar'}},
                          {'label': {'type': 'literal',
                                     'value': 'Asturien',
                                     'xml:lang': 'de'}},
                          {'label': {'type': 'literal',
                                     'value': 'Asturias',
                                     'xml:lang': 'es'}},
                          {'label': {'type': 'literal',
                                     'value': 'Asturies',
                                     'xml:lang': 'fr'}},
                          {'label': {'type': 'literal',
                                     'val

In [18]:
from SPARQLWrapper import SPARQLWrapper, JSON
from pprint import pprint

sparql = SPARQLWrapper("http://dbpedia.org/sparql")
queryString = """
    PREFIX : <http://dbpedia.org/resource/> 
    PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> 
    PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#> 
    PREFIX dbo: <http://dbpedia.org/ontology/> 
    SELECT  ?author_name ?title ?pages     
    WHERE { 
        ?author rdf:type dbo:Writer . 
        ?author rdfs:label ?author_name 
        FILTER (LANG(?author_name)="en"). 
        ?author dbo:notableWork ?work . 
        ?work dbo:numberOfPages ?pages 
        FILTER (?pages > 500) . 
        ?work rdfs:label ?title . 
        FILTER (LANG(?title)="en"). 
    } 
    LIMIT 10
"""
sparql.setQuery(queryString)
sparql.setReturnFormat(JSON)
results = sparql.query().convert()

pprint(results)

print('______________________________________')

# проверяем количество записей, которое вернул сервис:
if not results["results"]["bindings"]:
    print("No results found.")       
else:
    for result in results["results"]["bindings"]:
        print(result["author_name"]["value"], result["title"]["value"], result["pages"]["value"], sep=":")


{'head': {'link': [], 'vars': ['author_name', 'title', 'pages']},
 'results': {'bindings': [{'author_name': {'type': 'literal',
                                           'value': 'Victor Hugo',
                                           'xml:lang': 'en'},
                           'pages': {'datatype': 'http://www.w3.org/2001/XMLSchema#positiveInteger',
                                     'type': 'typed-literal',
                                     'value': '940'},
                           'title': {'type': 'literal',
                                     'value': 'The Hunchback of Notre-Dame',
                                     'xml:lang': 'en'}},
                          {'author_name': {'type': 'literal',
                                           'value': 'Garth Risk Hallberg',
                                           'xml:lang': 'en'},
                           'pages': {'datatype': 'http://www.w3.org/2001/XMLSchema#positiveInteger',
                                    

Следующий скрипт из книги [Learning SPARQL](http://www.learningsparql.com/) отправляет запрос к базе знаний [LinkedMDB](http://data.linkedmdb.org/) об актерах, которые хотя бы один раз снимались в фильмах Стивена Спилберга и Стенли Кубрика. 

Результат возвращается в формате [JSON](https://www.w3.org/TR/rdf-sparql-json-res/):

```javascript
{ 'results': {
            'bindings': 
                    [
                        {'actorName': {'type': 'literal', 'value': 'Wolf Kahler'}}, 
                        {'actorName': {'type': 'literal', 'value': 'Slim Pickens'}}, 
                        {'actorName': {'type': 'literal', 'value': 'Tom Cruise'}}, 
                        {'actorName': {'type': 'literal', 'value': 'Arliss Howard'}}, 
                        {'actorName': {'type': 'literal', 'value': 'Ben Johnson'}}, 
                        {'actorName': {'type': 'literal', 'value': 'Scatman Crothers'}}, 
                        {'actorName': {'type': 'literal', 'value': 'Philip Stone'}}
                    ]
            }, 
  'head': {'vars': ['actorName']}
}
```

In [None]:
from SPARQLWrapper import SPARQLWrapper, JSON

# SPARQL endpoint
sparql = SPARQLWrapper("http://data.linkedmdb.org/sparql")
queryString = """
PREFIX m: <http://data.linkedmdb.org/resource/movie/>
SELECT DISTINCT ?actorName WHERE {
?dir1 m:director_name "Steven Spielberg" .
?dir2 m:director_name "Stanley Kubrick" .
?dir1film m:director ?dir1 ;
m:actor ?actor .
?dir2film m:director ?dir2 ;
m:actor ?actor .
?actor m:actor_name ?actorName .
}
"""

sparql.setQuery(queryString)
# по умолчанию результат возвращается в XML формате: https://www.w3.org/TR/rdf-sparql-XMLres/
# преобразуем в JSON: https://www.w3.org/TR/rdf-sparql-json-res/
sparql.setReturnFormat(JSON)
# вернется словарь (dict), основанный на JSON
results = sparql.query().convert()

# проверяем количество записей, которое вернул сервис:
if not results["results"]["bindings"]:
    print("No results found.")       
else:
    for result in results["results"]["bindings"]:
        print(result["actorName"]["value"])        

In [4]:
from SPARQLWrapper import SPARQLWrapper, JSON

# Имена режиссеров поместили в отдельные переменные
director1 = "Steven Spielberg"
director2 = "Stanley Kubrick"
sparql = SPARQLWrapper("http://data.linkedmdb.org/sparql")
queryString = """
PREFIX m: <http://data.linkedmdb.org/resource/movie/>
SELECT DISTINCT ?actorName WHERE {
?dir1 m:director_name "DIR1-NAME".
?dir2 m:director_name "DIR2-NAME".
?dir1film m:director ?dir1 ;
m:actor ?actor .
?dir2film m:director ?dir2 ;
m:actor ?actor .
?actor m:actor_name ?actorName .
}
"""
queryString = queryString.replace("DIR1-NAME", director1)
queryString = queryString.replace("DIR2-NAME", director2)
sparql.setQuery(queryString)
sparql.setReturnFormat(JSON)
results = sparql.query().convert()

if not results["results"]["bindings"]:
    print("No results found.")
else:
    for result in results["results"]["bindings"]:
        print(result["actorName"]["value"])

Wolf Kahler
Slim Pickens
Tom Cruise
Arliss Howard
Ben Johnson
Scatman Crothers
Philip Stone


Добавим программе графический интерфейс на основе tkinter. Список виджетов tkinter представлен по [ссылке](http://effbot.org/tkinterbook/tkinter-index.htm).

Сначала рассмотрим пример простой графической программы:

In [20]:
from tkinter import *

master = Tk()

var = StringVar()
var2 = StringVar()

var.set("one") # initial value

label = Label(master, text = "Укажите режиссера:")
label.pack()

# http://effbot.org/tkinterbook/optionmenu.htm
option = OptionMenu(master, var, "Steven Spielberg", "Stanley Kubrick")
option.pack()

def ok():
    var2.set(var.get())
    
button = Button(master, text="Готово!", command=ok)
button.pack()

label = Label(master, textvariable=var2)
label.pack()

mainloop()

В следующем примере подключаем возможности SPARQLWrapper:

In [None]:
from SPARQLWrapper import SPARQLWrapper, JSON
from tkinter import *

master = Tk()

var = StringVar()
var2 = StringVar()

var.set("Укажите режиссера:") # initial value

option = OptionMenu(master, var, "Steven Spielberg", "Stanley Kubrick")
option.pack()

def ok():    
    sparql = SPARQLWrapper("http://data.linkedmdb.org/sparql")
    queryString = """
    PREFIX m: <http://data.linkedmdb.org/resource/movie/>
    SELECT DISTINCT ?actorName WHERE {
    ?dir1 m:director_name "DIR1-NAME".
    ?dir1film m:director ?dir1 ;
    m:actor ?actor .
    ?actor m:actor_name ?actorName .
    }
    """
    queryString = queryString.replace("DIR1-NAME",var.get())
    sparql.setQuery(queryString)
    sparql.setReturnFormat(JSON)
    results = sparql.query().convert()

    if not results["results"]["bindings"]:
        var2.set("No results found.")
    else:
        res = ""
        for result in results["results"]["bindings"]:            
            res = res + result["actorName"]["value"] + '\n'                      
        var2.set(res)
    
button = Button(master, text="Готово!", command=ok)
button.pack()

# Получился длинный список актеров, поэтому желательно использовать:
# scrollbar = Scrollbar(master)
label = Label(master, textvariable=var2)
label.pack()

mainloop()

Результат работы программы:

<img src="http://dfedorov.spb.ru/python3/tkinter.jpg" />

Для осуществления запросов к собственному RDF-документу потребуется настроить локальный SPARQL-сервис. Например, на основе Fuseki. [Getting Started With Fuseki](https://www.youtube.com/watch?v=apNEpgW0pTM)

[Архитектура Apache Jena](https://jena.apache.org/getting_started/)

[Скачать Fuseki](http://jena.apache.org/download/index.cgi#apache-jena-fuseki)

Потребуется версия Java 8. Запуск сервиса из командной строки:

> c:\apache-jena-fuseki-3.13.1>fuseki-server --update --mem /ds

После запуска откройте в браузере: localhost:3030 

[Примеры для тестирования](https://github.com/apache/jena/tree/master/jena-fuseki2/examples)

<img src="http://dfedorov.spb.ru/python3/jena.jpg" width="400" height="200" />

Далее представлен исходный текст программы для обращения к локальному SPARQL endpoint:

In [7]:
from SPARQLWrapper import SPARQLWrapper, JSON

# Локальный SPARQL endpoint
sparql = SPARQLWrapper("http://localhost:3030/book-pers/query")
queryString = """
SELECT ?subject ?predicate ?object
WHERE {
  ?subject ?predicate ?object
}
LIMIT 25
"""

sparql.setQuery(queryString)
# по умолчанию результат возвращается в XML формате: https://www.w3.org/TR/rdf-sparql-XMLres/
# преобразуем в JSON: https://www.w3.org/TR/rdf-sparql-json-res/
sparql.setReturnFormat(JSON)
# вернется словарь (dict), основанный на JSON
results = sparql.query().convert()

#print(results)

# проверяем количество записей, которое вернул сервис:
if not results["results"]["bindings"]:
    print("No results found.")       
else:
    for result in results["results"]["bindings"]:
        print(result["object"]["value"])
         

Harry Potter and the Philosopher's Stone
J.K. Rowling
Harry Potter and the Chamber of Secrets
b0
J.K. Rowling
b1
Harry Potter and the Prisoner Of Azkaban
b0
Harry Potter and the Goblet of Fire
Harry Potter and the Order of the Phoenix
J.K. Rowling
Harry Potter and the Half-Blood Prince
J.K. Rowling
Harry Potter and the Deathly Hallows
J.K. Rowling
Rowling
Joanna


> Примечание: онтология для Fuseki загружается в формате RDF/XML ("Сохранить как" в Protege).

Пример автоматизации запроса: "Вы вегетарианец? Да."

In [1]:
from SPARQLWrapper import SPARQLWrapper, JSON

# SPARQL endpoint
sparql = SPARQLWrapper("http://localhost:3030/new-last-pizza/query")
queryString = """
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX owl: <http://www.w3.org/2002/07/owl#>
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
PREFIX : <http://www.pizza.com/ontologies/pizza.owl#>

SELECT ?Pizza 
WHERE {
?Pizza rdfs:subClassOf :VegetarianPizza.}

"""
sparql.setQuery(queryString)

# по умолчанию результат возвращается в XML формате: https://www.w3.org/TR/rdf-sparql-XMLres/
# преобразуем в JSON: https://www.w3.org/TR/rdf-sparql-json-res/
sparql.setReturnFormat(JSON)
# вернется словарь (dict), основанный на JSON
results = sparql.query().convert()

#print(results)

# проверяем количество записей, которое вернул сервис:
if not results["results"]["bindings"]:
    print("No results found.")       
else:
    for result in results["results"]["bindings"]:
        print(result["Pizza"]["value"])

http://www.pizza.com/ontologies/pizza.owl#MargheritaPizza
http://www.pizza.com/ontologies/pizza.owl#MushroomHotPizza
http://www.pizza.com/ontologies/pizza.owl#MushroomPizza
http://www.pizza.com/ontologies/pizza.owl#SpicyVegetablePizza


Пример программы с графичесим интерфейсом:

In [2]:
from SPARQLWrapper import SPARQLWrapper, JSON
from tkinter import *

# возвращает SPARQL-запрос в зависимости от выбора пользователя (a - (не)с мясом, b - (не)острая, c - (не)традиционная)
def queryResult (a, b, c):
    prefix = '''
            PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
            PREFIX owl: <http://www.w3.org/2002/07/owl#>
            PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
            PREFIX xsd: <http://www.w3.org/2001/XMLSchema#>
            PREFIX : <http://www.pizza.com/ontologies/pizza.owl#>
            '''
    # любая без мяса
    if a == "Да" and b == "Не знаю" and c == "Не знаю":
        queryString = prefix + """
                    SELECT ?Pizza
                    WHERE {
                        ?Pizza rdfs:subClassOf :VegetarianPizza.
                    }
                    """
        return queryString
    # любая с мясом
    elif a == "Нет" and b == "Не знаю" and c == "Не знаю":
        queryString = prefix + """
                    SELECT ?Pizza
                    WHERE {
                        ?Pizza rdfs:subClassOf :NamedPizza
                        MINUS {?Pizza rdfs:subClassOf :VegetarianPizza.}
                    }
                    """
        return queryString
    # любая острая без мяса
    elif a == "Да" and b == "Да" and c == "Не знаю":
        queryString = prefix + """
                    SELECT ?Pizza
                    WHERE {
                        ?Pizza rdfs:subClassOf :VegetarianPizza.
                        ?Pizza rdfs:subClassOf :SpicyPizza.}
                    """
        return queryString
    # Предпочитает пиццу с мясом, неострую и традиционную
    elif a == "Нет" and b == "Нет" and c == "Да":
        queryString = prefix + """
                    SELECT ?Pizza
                    WHERE {
                        ?Pizza rdfs:subClassOf :ExoticPizza.
                        Minus {?Pizza rdfs:subClassOf :VegetarianPizza.}
                        Minus {?Pizza rdfs:subClassOf :SpicyPizza.}
                    }
                    """
        return queryString
    # С мясом, неострая и нетрадиционная
    elif a == "Нет" and b == "Нет" and c == "Нет":
        queryString = prefix + """
                    SELECT ?Pizza
                    WHERE {
                        ?Pizza rdfs:subClassOf :NamedPizza.
                        Minus {?Pizza rdfs:subClassOf :ExoticPizza}.
                        Minus {?Pizza rdfs:subClassOf :VegetarianPizza.}
                        Minus {?Pizza rdfs:subClassOf :SpicyPizza.}
                    }
                    """
        return queryString
    return "Неизвестный запрос"

master = Tk()

var = StringVar()
var1 = StringVar()
var2 = StringVar()
var3 = StringVar()

label = Label(master, text="Для выбора подходящей пиццы необходимо ответить на вопросы:")
label.pack()

var1.set("Не знаю")
var2.set("Не знаю")
var3.set("Не знаю")

label = Label(master, text="Вы вегетарианец?")
label.pack()
option = OptionMenu(master, var1, "Да", "Нет", "Не знаю")
option.pack()

label = Label(master, text="Вы любите острое?")
label.pack()
option = OptionMenu(master, var2, "Да", "Нет", "Не знаю")
option.pack()

label = Label(master, text="Предпочитаете традиционную пиццу?")
label.pack()
option = OptionMenu(master, var3, "Да", "Нет", "Не знаю")
option.pack()


def ok():
    sparql = SPARQLWrapper("http://localhost:3030/new-last-pizza/query")
    queryString = queryResult(var1.get(), var2.get(), var3.get())
    if queryString != "Неизвестный запрос":
        sparql.setQuery(queryString)
        sparql.setReturnFormat(JSON)
        results = sparql.query().convert()

        if not results["results"]["bindings"]:
            var.set("No results found.")
        else:
            res = ""
            for result in results["results"]["bindings"]:
                # split('#')[1] позволяет вывести только имя пиццы (см. п.11.5 эл. учебника)
                res = res + result["Pizza"]["value"].split('#')[1] + '\n'
            var.set(res)
    else:
        var.set("Что-то пошло не так, повторите выбор :-(")


button = Button(master, text="Готово!", command=ok)
button.pack()

label = Label(master, textvariable=var)
label.pack()

mainloop()

Результат работы программы:
<img src="http://dfedorov.spb.ru/python3/pizza_tkinter1.jpg" />