In [1]:
import os
import pandas as pd

from urllib.parse import quote_plus
from dotenv import load_dotenv

from neomodel import (
    StructuredNode,
    StringProperty,
    RelationshipTo,
    IntegerProperty,
    config
)

from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import Neo4jVector

In [2]:
catalog = pd.read_json("../data/catalog.json").reset_index(drop=True)
scifi_catalog = catalog[catalog.genreList.apply(lambda genre_list: "ficção científica" in genre_list)]
scifi_catalog.head(10)

Unnamed: 0,title,year,director,actors,fullDescription,shortDescription,genreList,image,moods
1,Amantes Eternos,2013,Jim Jarmusch,"[Tilda Swinton, Tom Hiddleston, Anton Yelchin,...",Conheça a história de amor e de reencontro ent...,Conheça a história de amor dos vampiros Adam e...,"[drama, romance, terror, fantasia, ficção cien...",https://lab-smartcontent.clarobrasil.mobi/asse...,"[romântico, dark]"
22,Transformers - A Era da Extinção,2014,Michael Bay,"[Mark Wahlberg, Stanley Tucci, Li Bingbing, Ke...",Depois da batalha entre Autobots e Decepticons...,"A humanidade se recupera de uma batalha épica,...","[ação, aventura, ficção científica]",https://lab-smartcontent.clarobrasil.mobi/asse...,[eletrizante]
48,X-Men - Dias de um Futuro Esquecido,2014,Bryan Singer,"[Hugh Jackman, James McAvoy, Michael Fassbende...",O Dr. Bolivar Trask acredita que os mutantes s...,Wolverine viaja no tempo para impedir que os m...,"[ação, aventura, fantasia, ficção científica]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[eletrizante, surpreendente]"
49,Planeta dos Macacos - O Confronto,2014,Matt Reeves,"[Andy Serkis, Jason Clarke, Gary Oldman, Keri ...","Dez anos após seu último embate, um grupo de h...",Um grupo de humanos sobrevivente de uma praga ...,"[ficção científica, ação, aventura]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[eletrizante, dramático]"
91,Os Últimos Dias em Marte,2013,Ruairi Robinson,"[Liev Schreiber, Elias Koteas, Romola Garai, G...",Missão espacial descobre evidências microscópi...,Astronautas encontram uma estranha forma de vi...,"[ficção científica, suspense]",https://lab-smartcontent.clarobrasil.mobi/asse...,[surpreendente]
101,Divergente,2014,Neil Burger,"[Shailene Woodley, Theo James, Ashley Judd, Ja...","Na futurística cidade de Chicago, ao completar...",Uma jovem descobre um plano para destruir os d...,"[ficção científica, ação, aventura]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[romântico, eletrizante]"
105,Expresso do Amanhã,2013,Bong Joon-ho,"[Chris Evans, Song Kang-ho, Tilda Swinton, Jam...",Os únicos sobreviventes de uma fracassada tent...,Os únicos sobreviventes de um experimento vive...,"[ficção científica, ação, suspense]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[dramático, dark]"
141,RoboCop - O Policial do Futuro,1987,Paul Verhoeven,"[Peter Weller, Nancy Allen, Ronny Cox, Daniel ...",Policial é morto em combate e transformado por...,Policial morto retorna como um ciborgue ultras...,"[ficção científica, ação]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[eletrizante, dark]"
163,Caçadores de Recompensa,2013,Henry Saine,"[Matthew Marsden, Kristanna Loken, Christian P...",Depois de uma guerra entre grandes corporações...,Caçadores de recompensas matam empresários gan...,"[ação, ficção científica]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[eletrizante, dark]"
180,RoboCop,2014,José Padilha,"[Joel Kinnaman, Gary Oldman, Samuel L. Jackson...","Na trama, o conglomerado multinacional OmniCor...",Um policial se torna a cobaia perfeita para se...,"[ficção científica, ação]",https://lab-smartcontent.clarobrasil.mobi/asse...,"[eletrizante, dramático]"


In [3]:
class Movie(StructuredNode):
    title = StringProperty(unique_index=True)
    description = StringProperty()
    year = IntegerProperty()


class Actor(StructuredNode):
    name = StringProperty(unique_index=True)
    movies = RelationshipTo("Movie", 'ACTED_IN')

In [4]:
load_dotenv()

password = quote_plus(os.getenv("NEO4J_PASSWORD"))
config.DATABASE_URL = f"bolt://neo4j:{password}@localhost:7687"

In [5]:
actors = {}
for _, content in scifi_catalog.iterrows():
    movie_node = Movie(title=content.title, description=content.fullDescription, year=content.year).save()
    for actor in content.actors:
        if actor not in actors:
            actor_node = Actor(name=actor).save()
            actors[actor] = actor_node
        else:    
            actor_node = actors[actor]
        actor_node.movies.connect(movie_node)

In [6]:
# Create the vectorstore for our existing graph
paper_graph = Neo4jVector.from_existing_graph(
    embedding=OpenAIEmbeddings(model="text-embedding-3-large"),
    url="bolt://localhost:7687",
    username="neo4j",
    password="secretgraph",
    index_name="movie_index",
    node_label="Movie",
    text_node_properties=["title", "description"],
    embedding_node_property="movie_embedding",
)