<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#json" data-toc-modified-id="json-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>json</a></span></li></ul></div>

# Тестовое задание для mindset

In [1]:
import pandas as pd
import json
#import requests

from flask import Flask, request, jsonify, redirect, render_template
from neo4j import GraphDatabase

In [2]:
try:
    data = pd.read_csv('data_test.csv', sep=';')
except:
    data = pd.read_csv('https://raw.githubusercontent.com/artemvhvn/mindset_test/main/data_test.csv', sep=';')

In [3]:
data.head()

Unnamed: 0,id события,ФИО участника события 1,ФИО участника события 2
0,189,Галчевская Карина Владимировна,Белоновская Анастасия Семеновна
1,206,Офицеров Олег Романович,Сапожник Борис Валерьевич
2,445,Жандарова Лариса Германовна,Чемодуров Дамир Русланович
3,503,Масимова Яна Дамировна,Мингажетдинов Рамиль Семенович
4,571,Мухтарова Алена Яковлевна,Щербатенко Ольга Робертовна


In [4]:
# переименуем столбцы для удобной работы в jupyter notebook
data.columns = ['event_id', 'name_of_event_participant_1', 'name_of_event_participant_2']

In [5]:
# класс для подключения к neo4j
class Neo4jConnection:
    def __init__(self, uri, user, password):
        self.driver = GraphDatabase.driver(uri, auth=(user, password))

    def close(self):
        if self.driver is not None:
            self.driver.close()

# Метод, который передает запрос в БД
    def query(self, query, db=None):
        assert self.driver is not None, "Driver not initialized!"
        session = None
        response = None
        try:
            session = self.driver.session(database=db) if db is not None else self.driver.session()
            response = session.run(query)
        except Exception as e:
            print("Query failed:", e)
        finally:
            if session is not None:
                session.close()
        return response

In [6]:
# подключение
conn = Neo4jConnection(uri="bolt://localhost:7687", user="artemvhvn", password="12345678")
# создаем базу данных
conn.query("CREATE OR REPLACE DATABASE testdb")

<neo4j._sync.work.result.Result at 0x11e4f3700>

In [7]:
# загружаем датасет в бд
query_string = '''
LOAD CSV WITH HEADERS FROM
    'https://raw.githubusercontent.com/artemvhvn/mindset_test/main/data_test.csv'
    AS line FIELDTERMINATOR ';'

MERGE (name:name {name: line['ФИО участника события 1']})
MERGE (id:event_id {event_id: line['id события']})

MERGE (name)-[:IS_IN]->(id)

;

'''
conn.query(query_string, db='testdb')

<neo4j._sync.work.result.Result at 0x11e6bcb50>

Создали узлы с ФИО участника и id события. Связь: ФИО - IS_IN -> id. Теперь добавим вторые ФИО участников с такой же связью.

In [8]:
query_string = '''
LOAD CSV WITH HEADERS FROM
'https://raw.githubusercontent.com/artemvhvn/mindset_test/main/data_test.csv'
AS line FIELDTERMINATOR ';'

MATCH (id:event_id {event_id: line['id события']})

MERGE (name:name {name: line['ФИО участника события 2']})

MERGE (name)-[:IS_IN]->(id)

;

'''
conn.query(query_string, db='testdb')

<neo4j._sync.work.result.Result at 0x11e6bc160>

![graph](graph.png)

In [9]:
query_string = '''
MATCH ()-[r]->()
RETURN count(r)
'''

conn.query(query_string, db='testdb')

<neo4j._sync.work.result.Result at 0x11e6bf940>

Всего 10000 связей

In [10]:
query_string = '''
MATCH (n:event_id)
RETURN count(n)
'''
conn.query(query_string, db='testdb')


<neo4j._sync.work.result.Result at 0x11e6bc7f0>

Всего 4985 событий, т.к. в датасете есть дубликаты по id события, вероятно, это события, в которых учавствовало более двух человек одновременно.

In [11]:
data.event_id.nunique()

4985

In [12]:
data[data.event_id.duplicated()].head(3)

Unnamed: 0,event_id,name_of_event_participant_1,name_of_event_participant_2
367,70049,Федова Анжелика Вадимовна,Вальдовский Альберт Ефимович
487,92995,Кучеренко Ирина Ильинична,Болтик Григорий Максимович
598,117280,Уточкин Евгений Анатольевич,Каганович Лилия Петровна


In [13]:

query_string = '''
MATCH (n)
WHERE n.event_id IN ['70049', '92995', '117280']
RETURN n
'''
conn.query(query_string, db='testdb')


<neo4j._sync.work.result.Result at 0x11e4f3490>

![bigevents](bigevents.png)

In [14]:
query_string = '''
MATCH (n:name)
RETURN count(n)
'''
conn.query(query_string, db='testdb')


<neo4j._sync.work.result.Result at 0x11e70c310>

Всего получилось 9899 уникальных ФИО участников, т.к. некоторые учавствовали в нескольких событиях.

Посмотрим на 3 участников с наибольшим количеством событий

In [15]:
query_string = '''
MATCH (p)
CALL {
  WITH p
  MATCH (p)--(c)
  RETURN count(c) AS numberOfConnections
}
RETURN p
ORDER BY numberOfConnections DESC
LIMIT 3
'''
conn.query(query_string, db='testdb')

<neo4j._sync.work.result.Result at 0x11e70c700>

![popnames](popnames.png)

In [16]:
query_string = '''
MATCH (p)--(c)
RETURN p, count(c) AS numberOfConnections
ORDER BY numberOfConnections DESC
LIMIT 5
'''
conn.query(query_string, db='testdb')


<neo4j._sync.work.result.Result at 0x11e70cd90>

![compl](cnames.png)

Некоторые участники связаны со многими событиями. Если предположить, что наши события, это какие-то матчи в турнире, то можно сделать вывод о том, как они проходили по турнирной сетке. Человек, с наибольшим количеством событий, возможно, является победителем.

### json

Вводим ФИО участника, получаем файл name_js.json

In [17]:
fname = input()
query_string = f'''
CALL apoc.export.json.query(
    "MATCH (name)-[rel]-(secname) WHERE name.name = $name return name, rel, secname",
    "name_js.json",
    {{params:{{name: '{fname}'}}}}
)
'''
conn.query(query_string, db='testdb')

hjh


[<Record file='name_js.json' source='statement: cols(3)' format='json' nodes=0 relationships=0 properties=0 time=19 rows=0 batchSize=-1 batches=1 done=True data=None>]

In [29]:
query_string = '''

MATCH (id:event_id {event_id: line['id события']})

MERGE (name:name {name: line['ФИО участника события 2']})

MERGE (name)-[:IS_IN]->(id)

;

'''
conn.query(query_string, db='testdb')

In [220]:
driver1 = GraphDatabase.driver(uri="bolt://localhost:7687", auth=("artemvhvn", "12345678"))
session1 = driver1.session(database='testdb')

In [221]:
app = Flask(__name__)
app.config['JSON_AS_ASCII'] = False

In [222]:
@app.route('/display/<string:name>', methods=['GET', 'POST'])
def display_node1(name):
    q1 = '''
    MATCH (name)-[rel]-(secname) WHERE name.name = $name return name, rel, secname
    '''
    map = {'name': name}
    results = session1.run(q1, map)
    data = results.data()
    
    return jsonify(data)

In [223]:
if __name__ == '__main__':
    app.run(port=5050)

 * Serving Flask app '__main__'
 * Debug mode: off


 * Running on http://127.0.0.1:5050
[33mPress CTRL+C to quit[0m
127.0.0.1 - - [11/Mar/2023 12:11:06] "[33mGET /display//u041f/u0430/u0444/u043e/u043c/u043e/u0432/u0430%20/u041a/u0438/u0440/u0430%20/u0412/u0430/u0434/u0438/u043c/u043e/u0432/u043d/u0430 HTTP/1.1[0m" 404 -
127.0.0.1 - - [11/Mar/2023 12:11:08] "[33mGET /display//u041f/u0430/u0444/u043e/u043c/u043e/u0432/u0430%20/u041a/u0438/u0440/u0430%20/u0412/u0430/u0434/u0438/u043c/u043e/u0432/u043d/u0430 HTTP/1.1[0m" 404 -
127.0.0.1 - - [11/Mar/2023 12:11:09] "[33mGET /display//u041f/u0430/u0444/u043e/u043c/u043e/u0432/u0430%20/u041a/u0438/u0440/u0430%20/u0412/u0430/u0434/u0438/u043c/u043e/u0432/u043d/u0430 HTTP/1.1[0m" 404 -
127.0.0.1 - - [11/Mar/2023 12:11:09] "[33mGET /display//u041f/u0430/u0444/u043e/u043c/u043e/u0432/u0430%20/u041a/u0438/u0440/u0430%20/u0412/u0430/u0434/u0438/u043c/u043e/u0432/u043d/u0430 HTTP/1.1[0m" 404 -
127.0.0.1 - - [11/Mar/2023 12:11:09] "[33mGET /display//u041f/u0430/u0444/u043e/u043c/u043e/u0432

In [None]:
\u041f\u0430\u0444\u043e\u043c\u043e\u0432\u0430 \u041a\u0438\u0440\u0430 \u0412\u0430\u0434\u0438\u043c\u043e\u0432\u043d\u0430

In [38]:
# считываем файл
data_json = []
path = '/Users/avhvn/Library/Application Support/Neo4j Desktop/Application/relate-data/dbmss/dbms-baa6809c-46bf-4fe1-9285-72e9b66450e5/import/'
try:
    for line in open(path + 'name_js.json', encoding='utf-8-sig'):
        data_json.append(json.loads(line))
except:
    for line in open('name_js.json', encoding='utf-8-sig'):
        data_json.append(json.loads(line))
data_json

[{'name': {'type': 'node',
   'id': '886',
   'labels': ['name'],
   'properties': {'name': 'Пафомова Кира Вадимовна'}},
  'rel': {'type': 'relationship',
   'id': '9797',
   'label': 'IS_IN',
   'start': {'id': '886',
    'labels': ['name'],
    'properties': {'name': 'Пафомова Кира Вадимовна'}},
   'end': {'id': '9577',
    'labels': ['event_id'],
    'properties': {'event_id': '958318'}}},
  'secname': {'type': 'node',
   'id': '9577',
   'labels': ['event_id'],
   'properties': {'event_id': '958318'}}},
 {'name': {'type': 'node',
   'id': '886',
   'labels': ['name'],
   'properties': {'name': 'Пафомова Кира Вадимовна'}},
  'rel': {'type': 'relationship',
   'id': '4169',
   'label': 'IS_IN',
   'start': {'id': '886',
    'labels': ['name'],
    'properties': {'name': 'Пафомова Кира Вадимовна'}},
   'end': {'id': '8323',
    'labels': ['event_id'],
    'properties': {'event_id': '829652'}}},
  'secname': {'type': 'node',
   'id': '8323',
   'labels': ['event_id'],
   'properties': 