# NoSQL (Neo4j) (sesión 7)

![Image of HBase](https://neo4j.com/wp-content/themes/neo4jweb/assets/images/neo4j-logo-2015.png)

Esta hoja muestra cómo acceder a bases de datos Neo4j y también a conectar la salida con Jupyter.

Se puede utilizar el propio interfaz de Neo4j también en la dirección http://127.0.0.1:7474.

Iniciamos Neo4j:

In [None]:
%%bash
~/start-neo4j.sh

In [None]:
from pprint import pprint as pp
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib

%matplotlib inline
matplotlib.style.use('ggplot')

Vamos a cargar la extensión `ipython-cypher` para poder lanzar consultas Cypher directamente a través de la hoja. En mi ordenador he configurado "`root`" como el _password_.

Para iniciar Neo4j hay que ir primero a la página de su browser y hacer login con el usuario y clave iniciales:

http://127.0.0.1:7474

Usuario: neo4j
Password: neo4j

Después pide la nueva clave. Yo he puesto "`root`" en esta hoja.

Utilizaremos una extensión de Jupyter Notebook que se llama `ipython-cypher`. Está instalada en la máquina virtual. Si no, se podría instalar con:

    sudo pip2 install ipython-cypher
    
Después, todas las celdas que comiencen por `%%cypher` y todas las instrucciones Python que comiencen por `%cypher` se enviarán a Neo4j para su interpretación

In [None]:
%load_ext cypher
%config CypherMagic.uri='http://neo4j:root@127.0.0.1:7474/db/data'

In [None]:
%config CypherMagic.auto_html=False

La carga de datos CSV no se puede realizar directamente desde la hoja, porque la extensión `ipython-cypher` falla por alguna cuestión de codificación UTF-8. Además, el CSV que acepta Neo4j no es estándar y he enviado un fallo para que lo arreglen (no parece que estén muy por la labor):

https://github.com/neo4j/neo4j/issues/8472

Mientras tanto, se pueden importar los Posts de Stackoverflow español simplemente añadiendo una barra inversa a cada barra inversa que aparece en el fichero:

    sed -ie 's/\\/\\\\/g' Posts.csv
    
Ya lo he preparado en el fichero que aparece abajo. Sin embargo, no se puede ejecutar aquí, hay que ir al browser: http://127.0.0.1:7474.

In [None]:
%%cypher
USING PERIODIC COMMIT 10000
LOAD CSV WITH HEADERS FROM "http://neuromancer.inf.um.es:8080/es.stackoverflow/Posts-for-neo4j.csv" AS row
CREATE (n:Post)
SET n = row
FOREACH(ignoreMe IN CASE WHEN trim(row.OwnerUserId) <> "" THEN [1] ELSE [] END | 
  MERGE (u:User {Id: n.OwnerUserId})
  MERGE (u)-[:WROTE]->(n)
)
;

In [None]:
%%cypher
MATCH (p:Post), (q:Post {Id: p.ParentId})
WHERE p.ParentId <> "" 
MERGE (p)-[:ANSWERS]->(q)
;

In [None]:
%%cypher
MATCH q=(r)-[:ANSWERS]->(p) RETURN p,r LIMIT 100;

In [None]:
%%cypher
// RQ4
MATCH
(u)-[:WROTE]->()-[:ANSWERS]->()<-[:WROTE]-(u2),
(u2)-[:WROTE]->()-[:ANSWERS]->()<-[:WROTE]-(u)
WHERE u2 <> u AND u.Id < u2.Id
RETURN DISTINCT u,u2
;

In [None]:
%%cypher
MATCH
(u)-[:WROTE]->()-[:ANSWERS]->()<-[:WROTE]-(u2),
(u2)-[:WROTE]->()-[:ANSWERS]->()<-[:WROTE]-(u)
WHERE u2 <> u AND toInt(u.Id) < toInt(u2.Id)
RETURN DISTINCT u.Id,u2.Id
ORDER BY toInt(u.Id)
;

In [None]:
%%cypher
MATCH
(u:User)-[:WROTE]->()-[:ANSWERS]->()<-[:WROTE]-(u2:User),
(u2)-[:WROTE]->()-[:ANSWERS]->()<-[:WROTE]-(u)
WHERE u2 <> u AND u.Id < u2.Id
MERGE (u2)-[:RECIPROCATE]->(u)
MERGE (u)-[:RECIPROCATE]->(u2)
;