# Shakespeare Graph

Ya hemos aprendido a crear nodos, relaciones, ídices, constraints y además hemos aprendido a realizar consultas con patrones sobre esos datos.

Ahora es tu turno.

En este ejercicio vamos a crear una representación gráfica de la cadena de valor que rodea al producción y consumo de literatura shakesperiana. Almacenaremos información sobre Shakespeare y algunas de sus obras, junto con detalles de uno de las compañías que recientemente interpretaron alguna de sus obras de teatro, además de un lugar de teatro, también almacenamos algunos datos geoespaciales. Incluso hemos agregado una reseña. En total, el gráfico describe y conecta tres dominios diferentes. 

En el diagrama hemos distinguido estos tres dominios con relaciones con diferentes formatos: punteados para el dominio literario, sólido para el dominio teatral y discontinuo para el dominio geoespacial.

<img src="../images/neo4j/cypher51.png" alt="Initial Graph"/>

Una vez que conocemos los datos que vamos a modelar vamos a crear el grafo.

Como siempre los primeros pasos son inportar las librerías que vamos a utilizar y borrar los nodos y relaciones que existiesen previamente en la base de datos.

In [None]:
from py2neo import Graph, Relationship, Node
import json

graph = Graph("http://neo4j:1234@neo4j:7474/db/data")

In [None]:
graph.run("MATCH (n) DETACH DELETE n").evaluate()

Ahora que tenemos la base de datos vacía vamos a crear el grafo inicial para trabajar sobre él.

In [None]:
graph.run("""
    CREATE (shakespeare:Author {firstname:'William', lastname:'Shakespeare'}),
        (juliusCaesar:Play {title:'Julius Caesar'}),
        (shakespeare)-[:WROTE_PLAY {year:1599}]->(juliusCaesar),
        (theTempest:Play {title:'The Tempest'}),
        (shakespeare)-[:WROTE_PLAY {year:1610}]->(theTempest),
        (rsc:Company {name:'RSC'}),
        (production1:Production {name:'Julius Caesar'}),
        (rsc)-[:PRODUCED]->(production1),
        (production1)-[:PRODUCTION_OF]->(juliusCaesar),
        (performance1:Performance {date:20120729}),
        (performance1)-[:PERFORMANCE_OF]->(production1),
        (production2:Production {name:'The Tempest'}),
        (rsc)-[:PRODUCED]->(production2),
        (production2)-[:PRODUCTION_OF]->(theTempest),
        (performance2:Performance {date:20061121}),
        (performance2)-[:PERFORMANCE_OF]->(production2),
        (performance3:Performance {date:20120730}),
        (performance3)-[:PERFORMANCE_OF]->(production1),
        (billy:User {name:'Billy'}),
        (review:Review {rating:5, review:'This was awesome!'}),
        (billy)-[:WROTE_REVIEW]->(review),
        (review)-[:RATED]->(performance1),
        (theatreRoyal:Venue {name:'Theatre Royal'}),
        (performance1)-[:VENUE]->(theatreRoyal),
        (performance2)-[:VENUE]->(theatreRoyal),
        (performance3)-[:VENUE]->(theatreRoyal),
        (greyStreet:Street {name:'Grey Street'}),
        (theatreRoyal)-[:STREET]->(greyStreet),
        (newcastle:City {name:'Newcastle'}),
        (greyStreet)-[:CITY]->(newcastle),
        (tyneAndWear:County {name:'Tyne and Wear'}),
        (newcastle)-[:COUNTY]->(tyneAndWear),
        (england:Country {name:'England'}),
        (tyneAndWear)-[:COUNTRY]->(england),
        (stratford:City {name:'Stratford upon Avon'}),
        (stratford)-[:COUNTRY]->(england),
        (rsc)-[:BASED_IN]->(stratford),
        (shakespeare)-[:BORN_IN]->(stratford)
""").evaluate()

Vamos a realizar nuestra primera búsqueda en la base dedatos.

## 1. Encontrar el Venue 'Theatre Royal', la ciudad 'Newcastle' y el author 'Shakespeare'

In [None]:
result = graph.run("""
    MATCH (venue:Venue {name:'Theatre Royal'})-[:STREET]->(:Street)-[:CITY]->(city:City {name:'Newcastle'}),
          (author:Author {lastname:'Shakespeare'})
    RETURN venue, city, author
""").data()
print(result)


## 2. Para acelerar nuestras búsquedas crear un índice sobre el campo 'name' de los nodos 'Venue' 

In [None]:
graph.run("CREATE INDEX ON :Venue(name)")


## 3. Queremos asegurarnos que el campo 'name' de los nodos 'Country' son únicos

In [None]:
graph.run("CREATE CONSTRAINT ON (c:Country) ASSERT c.name IS UNIQUE")


## 4. Buscar todas las representaciones de Shakespeare en el teatro 'Theatre Royal' de Newcastle

In [None]:
result = graph.run("""
    MATCH (venue:Venue {name:'Theatre Royal'})<-[:VENUE]-(performance:Performance)-[:PERFORMANCE_OF]->(production:Production)-[:WROTE_PLAY]->(author:Author {lastname:'Shakespeare'})
    RETURN performance, production
""").data()
print(result)


## 5. Quermos restringir la búsqueda anterior a las obrea que fueron escritas antes de 1608 

In [None]:
result = graph.run("""
    MATCH (venue:Venue {name:'Theatre Royal'})<-[:VENUE]-(performance:Performance)-[:PERFORMANCE_OF]->(production:Production)-[:WROTE_PLAY]->(author:Author {lastname:'Shakespeare'})
    WHERE production.year < 1608
    RETURN performance, production
""").data()
print(result)


## 6. Sobre el ejercicio 4, cuenta el número de representaciones que hay de cada obra.

In [None]:
result = graph.run("""
    MATCH (venue:Venue {name:'Theatre Royal'})<-[:VENUE]-(performance:Performance)-[:PERFORMANCE_OF]->(production:Production)-[:WROTE_PLAY]->(author:Author {lastname:'Shakespeare'})
    RETURN production.title, COUNT(performance) AS num_performances
    ORDER BY num_performances DESC
""").data()
print(result)


## 7. Queremos obtener todas la obras escritas por Shakespeare ordenadas por año

In [None]:
result = graph.run("""
    MATCH (author:Author {lastname:'Shakespeare'})-[:WROTE_PLAY]->(production:Production)
    RETURN production.title, production.year
    ORDER BY production.year
""").data()
print(result)


## 8. Realiza la query anterior, pero devuelve el resultado como un array de texto.

In [None]:
result = graph.run("""
    MATCH (author:Author {lastname:'Shakespeare'})-[:WROTE_PLAY]->(production:Production)
    RETURN COLLECT(production.title) AS titles
    ORDER BY production.year
""").evaluate()
print(result)
