## Jeu de données
Un labo avec des projets, des services et des personnes

In [1]:
import json 
with open('data/lab2000.json','r') as f:
    lab = json.load(f)

# Liste des projets
lab['projects']

['Alpha', 'Cymbal', 'Tigre', 'Csw2000', 'Gringalet']

In [2]:
# Liste des services
lab['services']

['Electronique', 'Informatique', 'Optique', 'Mécanique']

In [3]:
# Liste des personnes (les 3 premières)
print(json.dumps(lab['persons'][1:3], indent=4, sort_keys=True))

[
    {
        "name": "Arlette Bienvenue",
        "projects": [
            {
                "function": "developpeur",
                "name": "Alpha"
            }
        ],
        "service": "Electronique"
    },
    {
        "name": "Roxanne Brochu",
        "projects": [],
        "service": "Informatique"
    }
]


## Configuration


In [4]:
demoConfig = {
    'url': 'localhost',
    'port': '7687',
    'user': 'neo4j',
    'password': 'neo4j',
}

driverUrl = f"bolt://{demoConfig['user']}:{demoConfig['password']}@{demoConfig['url']}:{demoConfig['port']}"

In [5]:
from scripts.draw_graph import draw_query
from py2neo import Graph

drawGraph = Graph()

# Neo4j - Python

## Jouons avec le driver officiel neo4j python

Le documentation est ici (version 1.7)

https://neo4j.com/docs/api/python-driver/1.7-preview/

## Concepts de base

- Un driver gère toutes les interactions avec la base
- Ces interactions se déroulent dans le cadre d'une session fournie par le driver
- les modifications se déroule au sein d'une transaction fournie par la session

```
driver        session        transaction
 |               |               |               
 | session()     |               |
 |-------------->|               |
 |               |   begin()     |               
 |               |-------------->|               
 |               |               |               
 |               |               |----+            
 |               |               |   write something
 |               |               |<---+           
 |               |               |               
 |               |               |----+           
 |               |               |  commit()     
 |               |               |<---+           
 |               |               |               
 |               |               |----+
 |               |               | close()              
 |               |               |<---+               
 |               |               |               
```



## Interactions avec la base
* Instancier un driver
* Obtenir une session

In [6]:
from neo4j.v1 import GraphDatabase

driver = GraphDatabase.driver('bolt://localhost:7687')

## Modification
* Ouverture d'une transaction pour modifier
 * modification
 * commit ou rollback

### Création des noeuds

D'une façon conventionelle, puis d'une façon plus pythonique.

In [None]:
def create_nodes_classic_way(label, data, driver):
    
    # -- Obtention session --
    session = driver.session()
    
    # -- Obention transaction --
    tx = session.begin_transaction()
    
    for name in data:
        tx.run('CREATE (:'+label+' {name : {name}})', name=name)
    
    #-- commit --
    tx.commit()
    # -- fermeture de la transaction. Elle ne peut être réutilisée.
    tx.close()

In [None]:
create_nodes_classic_way('Project', lab['projects'], driver)

In [None]:
def create_nodes_pythonic_way(label, data, driver):
    
    # - mode auto-commit
    
    with driver.session() as local_session:
        for name in data:
            print(name)
            # -- pas de transaction, directement au niveau de la session
            local_session.run('CREATE (:'+label+' {name : {name}})', name=name)

In [None]:
create_nodes_pythonic_way('Service', lab['services'],driver)

### Lecture seule

Un simple `Session.run(query)` suffit.

In [None]:
# - session globale pour le notebook
global_session = driver.session()

Les résultats sont des `Records` à parcourir.

In [None]:
[r for r in global_session.run('MATCH (n) RETURN labels(n)[0], n.name')]

In [None]:
global_session.run('MATCH (n:Project) RETURN count(n) as nb').single().value()

## Résultats en tant qu'entités Graph
Pour obtenir les résultats sous forme de 
* Node
* Relationship
* Path

il faut utiliser la vue `Graph` des `StatementResult`.

Au sein de graphes, il est possible d'avoir les noeuds `.nodes` et les relations `.relationships`.


In [None]:
[r for r in global_session.run('MATCH (n:Project) RETURN n').graph().nodes]

In [None]:
draw_query(drawGraph,'driver_project','MATCH (n:Project) RETURN n')

### Création de relations

**(:Person)-\[:MEMBER_OF\]->(:Service)**

In [None]:
query ='''
MATCH (s:Service {name: {service}}) 
CREATE (p:Person {name: {name}})
CREATE (p)-[:MEMBER_OF]->(s)'''

with driver.session() as session:
    for p in lab['persons']:
        session.run(query, name=p['name'],service=p['service'])

In [None]:
draw_query(drawGraph,'driver_member_of_service','MATCH p=(q:Person)-[r]->(s:Service) RETURN p')

**(:Person)-\[:WORK_IN \{function=$function}\]->(:Project)**

In [None]:
subquery = '''
MATCH (pers:Person {name: {name}}),(project:Project {name: {project}})
MERGE (pers)-[:WORK_IN{function: {function}} ]->(project)'''
        
with driver.session() as session:
    for person in lab['persons']:        
        for project in person['projects']:
            session.run(subquery,
                       name=person['name'],
                       project=project['name'],
                       function=project['function'])

In [7]:
draw_query(drawGraph,'driver_work_in_project',
           'MATCH p=(q:Person)-[r]->(s:Project) RETURN p')

In [8]:
with driver.session() as session:
    records = session.run('MATCH (n)-[r:WORK_IN]->(p) return n,r,p')
    
# - les 5 premiers
for relation in list(records.graph().relationships)[0:5]:
    print(relation.items())
    print(relation.type)
    print(relation.start_node)
    print(relation.end_node)
    print('---')

dict_items([('function', 'chefDeProjet')])
WORK_IN
<Node id=52 labels={'Person'} properties={'name': 'Édith Audet'}>
<Node id=35 labels={'Project'} properties={'name': 'Csw2000'}>
---
dict_items([('function', 'developpeur')])
WORK_IN
<Node id=51 labels={'Person'} properties={'name': 'Jeanette Desnoyers'}>
<Node id=35 labels={'Project'} properties={'name': 'Csw2000'}>
---
dict_items([('function', 'expert')])
WORK_IN
<Node id=34 labels={'Person'} properties={'name': 'Tracey Herman'}>
<Node id=35 labels={'Project'} properties={'name': 'Csw2000'}>
---
dict_items([('function', 'expert')])
WORK_IN
<Node id=33 labels={'Person'} properties={'name': 'Noelle Dubois'}>
<Node id=35 labels={'Project'} properties={'name': 'Csw2000'}>
---
dict_items([('function', 'developpeur')])
WORK_IN
<Node id=22 labels={'Person'} properties={'name': 'Valérie Laforest'}>
<Node id=35 labels={'Project'} properties={'name': 'Csw2000'}>
---


### La liste des personnes qui ne sont pas associées à un projet

In [9]:
with driver.session() as session:
    query= '''MATCH (p:Person)-[:MEMBER_OF]->(s) 
    WHERE NOT (p)-[:WORK_IN]->(:Project) 
    RETURN p.name AS name, s.name AS service'''
    records = session.run(query)
    
print(f'Statement {records.summary().statement} after {records.summary().result_available_after} ms' )

[ f"Person : {r['name']}, Service: {r['service']}" for r in records]


Statement MATCH (p:Person)-[:MEMBER_OF]->(s) 
    WHERE NOT (p)-[:WORK_IN]->(:Project) 
    RETURN p.name AS name, s.name AS service after 0 ms


['Person : Roxanne Brochu, Service: Informatique',
 'Person : Lotye Cousteau, Service: Informatique',
 'Person : Carine Laforest, Service: Informatique',
 'Person : Matilda Audet, Service: Mécanique',
 'Person : Inès Cousteau, Service: Informatique',
 'Person : Agathe Desnoyers, Service: Electronique',
 'Person : Valentine Brochu, Service: Electronique']

# Avec py2no

py2neo est un wrapper autour du driver neo4j.

Il simplifie la vie et s'intégre très bien avec plusieurs librairies communes Python

In [10]:
from py2neo import Graph, Node, Relationship

graph = Graph()

### Avec Pandas

In [11]:
query= '''MATCH (p:Person)-[:MEMBER_OF]->(s) 
WHERE NOT (p)-[:WORK_IN]->(:Project) 
RETURN p.name AS name, s.name AS service'''

graph.run(query).to_data_frame()

Unnamed: 0,name,service
0,Roxanne Brochu,Informatique
1,Lotye Cousteau,Informatique
2,Carine Laforest,Informatique
3,Matilda Audet,Mécanique
4,Inès Cousteau,Informatique
5,Agathe Desnoyers,Electronique
6,Valentine Brochu,Electronique


### Avec Numpy

In [12]:
graph.run(query).to_ndarray()

array([['Roxanne Brochu', 'Informatique'],
       ['Lotye Cousteau', 'Informatique'],
       ['Carine Laforest', 'Informatique'],
       ['Matilda Audet', 'Mécanique'],
       ['Inès Cousteau', 'Informatique'],
       ['Agathe Desnoyers', 'Electronique'],
       ['Valentine Brochu', 'Electronique']], dtype='<U16')

## Manipulations Graphiques (pour les gourmets)

py2neo permet de manipuler le graphe directement en terme de Node, Relationship.

Le graphe est modifié localement avant de mettre à jour la base à travers des _push_ et des _pull_.

_La documentation manque singulièrement de clarté._

In [13]:
# - Création de la ville d'orsay
city = Node('City', name='Orsay')

# - merge en matchant sur le label 'City' et la clef 'name'
graph.merge(city, 'City','name')

In [14]:
# - recherche du noeud (roxane)
roxanne = graph.nodes.match("Person", name='Roxanne Brochu').first()

print(roxanne, type(roxanne))

# - mise en relation avec la ville
liveIn = Relationship(roxanne, "lIVE_IN", city)

# - CREATION de la relation
graph.create(liveIn)


(_7:Person {name: 'Roxanne Brochu'}) <class 'py2neo.data.Node'>


In [None]:
# - Recherche du service informatique

serviceInfo = graph.nodes.match('Service', name='Informatique').first()

# - recherche de la relation entre carine et le service informatique

roxanneToInformatique = graph.match((roxanne,), r_type='MEMBER_OF').first()

# - Mise à jour locale

roxanneToInformatique['function'] = 'chef'

# - mise à jour remote 
graph.push(roxanneToInformatique)

In [None]:
graph.match((roxanne,), r_type='MEMBER_OF').first()

## Mettre à jour le graphe du projet  'Tigre'

In [None]:
import random

# - récupération duprojet 'tigre'
tigerProject = graph.nodes.match('Project', name='Tigre').first()

# - récupération des relations (p)->[r:WORK_IN]->(:Project {name: 'Tigre'})
relations =list(graph.relationships.match((None,tigerProject),'WORK_IN')) 

# - Mise à jour d'une charge de travail aléatoire comme en vrai ? :)
for rel in relations:
    rel['workload'] = random.randint(1,8)*10


for rel in graph.relationships.match((None,tigerProject),'WORK_IN'):
    print(rel.start_node, rel['workload'])

### Regroupement des objet sous forme de Subgraph (conteneur)

In [None]:
from py2neo import Subgraph

subgraph=Subgraph(relationships=relations)
graph.push(subgraph)

In [None]:
for rel in graph.relationships.match((None,tigerProject),'WORK_IN'):
    print(rel.start_node, rel['workload'])

## Procédure de nettoyage


In [None]:
import ipywidgets as widgets
from ipywidgets import interact

checkbox = widgets.ToggleButton(
    value=False,
    description='DELETE ALL',
    disabled=False
)

def delete_all(b):
    if b:
        with driver.session() as session:
            session.run('MATCH (n) DETACH DELETE n')
    
            
interact(delete_all, b=checkbox)