# Cypher improtar datos desde CSV

En este notebook vamos a ver como importar datos desde ficheros csv para crear un grafo.

Para cargar datos desde csv vamos a utilizar la sentencia **LOAD CSV**.

Para este ejercicio vamos a utilizar 3 ficheros que puedes encontrar en 

work/data/neo4j

* persosns.csv que contiene datos sobre personas (id, name)
* movies.csv que contiene datos sobre películas (id, title, country, year)
* roles.csv que contiene la relación de actua entre personas y películas (personId, movieId, role)

Si miramos el contenido de los ficheros veremos que:

* Cada persona tiene un identificador único (id) y un nombre único (name).
* Cada película tiene un identificador único (id), un título, la nacionalidad (country) y la fecha de estreno (year).
* Con el fichero roles podemos deducir que personas han actuado en que películas utilizando los identificadores (personId, movieId) y que papel ha interpretado esa persona en la película realcionada (role). 

Lo que pretendemos es obtener el siguiente grafo:
<img src="../images/neo4j/cypher41.png" alt="Initial Graph"/>

Como siempre lo primero es importar las librerías que vamos a utilizar.

In [None]:
%load_ext cypher
%matplotlib inline

Y borrar los nodos y relacciones de ejecuciones anteriores.

In [None]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
MATCH (n) DETACH DELETE n

Antes de iniciar la importación vamos crear el esquema de nuestro grafo.

Quremos que el id de de las personas sea único:

In [None]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
CREATE CONSTRAINT ON (person:Person) ASSERT person.id IS UNIQUE

También queremos que el id de las películas sea único:

In [None]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
CREATE CONSTRAINT ON (movie:Movie) ASSERT movie.id IS UNIQUE

Además queremos crear un índice sobre la propiedad *name* de los nodos *Person* para mejorar las búsquedas:

In [None]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
CREATE INDEX ON :Country(name)

Estas constraints e índices nos van a ayudar crear de forma adecuada los datos que importamos desde los ficheros utilizando las cláusulas MATCH y MERGE.

Primero vamos a importar las personas del fichero persons.csv y crearemos los nodos *:Person* utilizando la cláusula **LOAD CSV**

In [None]:
%%cypher http://neo4j:1234@127.0.0.1:7474/db/data
LOAD CSV WITH HEADERS FROM "file:///../data/neo4j/persons.csv" AS csvLine
CREATE (p:Person {id: toInteger(csvLine.id), name: csvLine.name})