# Cypher: Cómo definir un esquema

En este notebook vamos a ver como crear un esquema en Neo4j, para ello vamos a ver como:

* Definir y utilizar índices
* Definir y utilizar costraints

Como en los notebooks anteriores primero vamos a importar las librerías y a borrar todos los nodos y realciones que hay en la base de datos.

In [1]:
from py2neo import Graph, Relationship, Node
import json

graph = Graph("http://neo4j:1234@neo4j:7474/db/data")

In [2]:
graph.run("MATCH (n) DETACH DELETE n").evaluate()

Ahora vamos a crear el grafo que vamos a utilizar como base para el ejercicio:

In [3]:
graph.run("""
    CREATE (matrix:Movie { title:"The Matrix",released:1997 })
    CREATE (cloudAtlas:Movie { title:"Cloud Atlas",released:2012 })
    CREATE (forrestGump:Movie { title:"Forrest Gump",released:1994 })
    CREATE (keanu:Actor { name:"Keanu Reeves"})
    CREATE (robert:Actor { name:"Robert Zemeckis", born:1951 })
    CREATE (tom:Actor { name:"Tom Hanks", born:1956 })
    CREATE (tom)-[:ACTED_IN { roles: ["Forrest"]}]->(forrestGump)
    CREATE (tom)-[:ACTED_IN { roles: ['Zachry']}]->(cloudAtlas)
    CREATE (robert)-[:DIRECTED]->(forrestGump)
""").evaluate()

Como resultado obtenemos el siguiente grafo:

<img src="../images/neo4j/cypher31.png" alt="Initial Graph"/>

## Índices

La razón principal para crear un índice es la de encontrar el nodo inical de una búsqueda por recorrido del grafo.
Un índice se puede crear en cualquier momento, aunque si el grafo tiene datos puede que el índice tarde un tiempo en estar disponible.

En este caso queremos hacer un índice para encontrar de forma más rápida los actores por nombre.


In [4]:
graph.run("CREATE INDEX ON :Actor(name)").evaluate()

ClientError: [Schema.EquivalentSchemaRuleAlreadyExists] An equivalent index already exists, 'Index( id=3, name='index_ad47116a', type='GENERAL BTREE', schema=(:Actor {name}), indexProvider='native-btree-1.0' )'.

El ínide creado se utilizará de forma automática en la siguiente sentencia.

In [5]:
graph.run("""
    MATCH (actor:Actor { name: "Tom Hanks" })
    RETURN actor;
""").to_table()

actor
"(_32:Actor {born: 1956, name: 'Tom Hanks'})"


También se pueden crear índices sobre varios sobre varias propiedades de un nodo con una determinada etiqueta. 
Por ejemplo, podemos crear un índice compuesto sobre las propiedades *name* y *born* de los nodos etiquetados como *:Person*. 

Nota: los nodos de tipo *:Person* que sólo tienen el atributo *name* y no tienen el atributo *born* no se indexarían, por lo qe en nodo *'Keanu Reves'* no se indexaria. 

In [6]:
graph.run("CREATE INDEX ON :Actor(name, born)").evaluate()

Para consultar los índices creados en la base de datos, ejecuta la siguiente sentencia en la consola de Neo4j:

`
SHOW INDEXES YIELD *
`

Para borrar un índice se utiliza la sentencia **DROP INDEX**

In [7]:
graph.run("DROP INDEX ON :Actor(name, born)").evaluate()

Para saber más sobre índices puedes visitar la página asociada en la documentación de Neo4j: https://neo4j.com/docs/cypher-manual/current/administration/indexes-for-search-performance/

## Constraints

Los constraints o reestricciones se utilizan para asegurarnos de que los datos que se insertan cumplen las reglas del dominio que se está modelando. Por ejemplo que para los nodos con la etiqueta *:Actor* la propiedad *name* sea única entre todos ellos.

En nuestro caso si queremos que los nodos etiquedados como *:Pelicula* nuncan contengan mas de un nodo con la propiedad *title* repetida podemos utilizar especificar la constraint **IS UNIQUE** 

In [11]:
graph.run("CREATE CONSTRAINT ON (movie:Movie) ASSERT movie.title IS UNIQUE").stats()

{'contains_updates': True,
 'nodes_created': 0,
 'nodes_deleted': 0,
 'properties_set': 0,
 'relationships_created': 0,
 'relationships_deleted': 0,
 'labels_added': 0,
 'labels_removed': 0,
 'indexes_added': 0,
 'indexes_removed': 0,
 'constraints_added': 1,
 'constraints_removed': 0,
 'contains_system_updates': False,
 'system_updates': 0}

Implicitamente al crear la constraint se está creando un índice para esa propiedad. Si la constraint se elimina, el índice también se elimina y habría que crearlo si queremos seguir utilizándolo.

Para saber cuantas constraints hay creadas en nuestra base de datos podemos utillizar el procedimiento **db.constraints**.

In [12]:
graph.run("CALL db.constraints YIELD *").to_table()

name,description,details
constraint_3044d997,CONSTRAINT ON ( movie:Movie ) ASSERT (movie.title) IS UNIQUE,"Constraint( id=8, name='constraint_3044d997', type='UNIQUENESS', schema=(:Movie {title}), ownedIndex=7 )"
constraint_5f75e2f6,CONSTRAINT ON ( tweet:Tweet ) ASSERT (tweet.id) IS UNIQUE,"Constraint( id=11, name='constraint_5f75e2f6', type='UNIQUENESS', schema=(:Tweet {id}), ownedIndex=10 )"
constraint_99d662d3,CONSTRAINT ON ( user:User ) ASSERT (user.username) IS UNIQUE,"Constraint( id=13, name='constraint_99d662d3', type='UNIQUENESS', schema=(:User {username}), ownedIndex=12 )"
constraint_9b77979a,CONSTRAINT ON ( hashtag:HashTag ) ASSERT (hashtag.hashtag) IS UNIQUE,"Constraint( id=15, name='constraint_9b77979a', type='UNIQUENESS', schema=(:HashTag {hashtag}), ownedIndex=14 )"


Para borrar una constraint utilizamos la clausula **DROP CONSTRAINT**

In [13]:
graph.run("DROP CONSTRAINT ON (movie:Movie) ASSERT movie.title IS UNIQUE").evaluate()

Para saber más sobre las constraints puedes consultar la página relaccionada en la documentación de Neo4j:
https://neo4j.com/docs/cypher-manual/current/administration/constraints/