# RAG over MiniKGraph no Neo4j 

This Jupyter Notebook use the Neo4j Graph integration to interact with the Neo4j database and the CypherQAChain to query the database. Using the CypherQAChain, we can ask questions about the PetroKGraph database and get answers in natural language. 

The PetroKGraph is a knowledge graph that contains information about the oil and gas industry in Brazil. It was created using the Neo4j database and the Cypher query language. The graph contains nodes representing entities such as wells, fields, companies, and reservoirs, and relationships between these entities.

In this notebook, we will use the CypherQAChain to query the PetroKGraph database and get answers to questions about the oil and gas industry in Brazil. We will ask questions about the production of oil and gas in Brazil, the fields and reservoirs where oil and gas are extracted, and the geological characteristics of the reservoirs.

### Setup

To begin, we need to import the necessary modules and set up the environment variables.

#### Install LangChain and Neo4j

```bash
!pip install openai
!pip install langchain
!pip install neo4j
!pip install transformers
!pip install sentencepiece
pip install langchain-huggingface
!pip install langchainhub
!pip install sentence_transformers
!pip install networkx node2vec rdflib
```

In [1]:
import os
import torch
import sentence_transformers
import networkx as nx

from langchain.chains import GraphCypherQAChain
from langchain_community.graphs import Neo4jGraph
from langchain.chat_models.openai import ChatOpenAI

from langchain.prompts.prompt import PromptTemplate

from langchain.vectorstores.neo4j_vector import Neo4jVector
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain_openai import AzureChatOpenAI, AzureOpenAIEmbeddings
from langchain_huggingface import HuggingFaceEmbeddings


  from tqdm.autonotebook import tqdm, trange


In [2]:
from langchain_openai import AzureChatOpenAI
from httpx import Client
from configparser import ConfigParser, ExtendedInterpolation

config = ConfigParser(interpolation=ExtendedInterpolation())
config.read('config-v1.x.ini', 'UTF-8')

CERTIFICATE_PATH = 'petrobras-ca-root.pem'
OPENAI_API_VERSION = '2024-03-01-preview'
OPENAI_BASE_URL = 'https://apit.petrobras.com.br/ia/openai/v1/openai-azure/openai/deployments'
EMBEDDINGS_MODEL= config['OPENAI']['EMBEDDINGS_MODEL']


# Exemplo de uso do GPT
DEPLOYMENT_NAME = 'gpt-4o-petrobras'
llm_petrobras = AzureChatOpenAI(
    model=DEPLOYMENT_NAME,
    openai_api_version=OPENAI_API_VERSION,
    openai_api_key=config['OPENAI']['OPENAI_API_KEY'],
    base_url=f'{OPENAI_BASE_URL}/{DEPLOYMENT_NAME}',
    http_client=Client(verify=CERTIFICATE_PATH)
)

EMBEDDINGS_DEPLOYMENT_NAME='text-embedding-petrobras'
embeddings = AzureOpenAIEmbeddings(
    model=EMBEDDINGS_DEPLOYMENT_NAME,
    openai_api_version=OPENAI_API_VERSION,
    openai_api_key=config['OPENAI']['OPENAI_API_KEY'],
    base_url=f'{OPENAI_BASE_URL}/{EMBEDDINGS_DEPLOYMENT_NAME}',
    http_client=Client(verify=CERTIFICATE_PATH)
)

print(EMBEDDINGS_MODEL)

text-embedding-petrobras


In [3]:
NEO4J_URI = 'neo4j://atn1b03n13:7687' #nodo donde esta rodando neo4j
NEO4J_USERNAME = 'neo4j'
NEO4J_PASSWORD = 'Diripar8$'

## Vector similarity search in an RAG application

In [4]:
graph = Neo4jGraph(url=NEO4J_URI, username=NEO4J_USERNAME, password=NEO4J_PASSWORD)

### **Create a vector index**

In [11]:
graph.query("""
  CREATE VECTOR INDEX basins IF NOT EXISTS
  FOR (n:basin)
  ON (n.rdfs_label) 
  OPTIONS { indexConfig: {
    `vector.dimensions`: 256,
    `vector.similarity_function`: 'cosine'
  }}"""
)

[]

### **Show Vector index**

In [15]:
graph.query("""
  SHOW VECTOR INDEXES YIELD name, type, entityType, labelsOrTypes, properties
 """ 
)

[{'name': 'basins',
  'type': 'VECTOR',
  'entityType': 'NODE',
  'labelsOrTypes': ['basin'],
  'properties': ['embedding']},
 {'name': 'fields',
  'type': 'VECTOR',
  'entityType': 'NODE',
  'labelsOrTypes': ['field'],
  'properties': ['embedding']},
 {'name': 'lithostratigraphic_units',
  'type': 'VECTOR',
  'entityType': 'NODE',
  'labelsOrTypes': ['lithostratigraphic_unit'],
  'properties': ['embedding']},
 {'name': 'wells',
  'type': 'VECTOR',
  'entityType': 'NODE',
  'labelsOrTypes': ['well'],
  'properties': ['embedding']}]

In [16]:
# Para eliminar un indice
graph.query("""
  DROP INDEX wells 
 """ 
)

[]

In [29]:
#Se crea el embedding vector index para el nodo asociado 
vector_index = Neo4jVector.from_existing_graph(
    embeddings ,
    url=NEO4J_URI,
    username=NEO4J_USERNAME,
    password=NEO4J_PASSWORD,
    index_name='lithostratigraphic_units',
    node_label="lithostratigraphic_unit",
    text_node_properties=['_id','_uri', 'rdfs_label'],
    embedding_node_property='embedding',
)

### **Embedding**

In [17]:
import os
from neo4j import GraphDatabase, Result

uri = NEO4J_URI
username = NEO4J_USERNAME
password = NEO4J_PASSWORD

# Crear el driver de conexión
driver = GraphDatabase.driver(uri, auth=(username, password))

driver.verify_connectivity()


In [18]:
import pandas as pd

def execute_query(driver):
    with driver.session() as session:
        result = session.run("""
            MATCH (n:lithostratigraphic_unit)
            WHERE n.rdfs_label IS NOT NULL
            RETURN n._id AS ID, n.rdfs_label AS Field
            LIMIT 10
                        
        """)
        # Convert the result to a DataFrame if needed
        data = [record.data() for record in result]
        return pd.DataFrame(data)

# Execute the query and get the result
kgraph = execute_query(driver)
print((kgraph))

             ID                  Field
0  formacao_125        Fm. Água Grande
1  formacao_343  Formação Taipus-Mirim
2  formacao_122           Fm. Rio Doce
3     grupo_073          Gr. Trombetas
4  formacao_256          Fm. Caravelas
5  formacao_038              Fm. Ererê
6    membro_027            Mb. Cazumba
7     grupo_034              Gr. Purus
8  formacao_171           Fm. Algodões
9  formacao_086           Fm. Nhamundá


In [10]:
def check_index_exists(index_name):
    try:
        with driver.session() as session:
            result = session.run("SHOW INDEXES")
            indexes = result.data()
            
            for index in indexes:
                
                if index_name in index["name"]:
                    print("Index exists")
                    return True
            return False
    except Exception as e:
        print("❌ Failed to check if index exists:", str(e))
        return False

def get_existing_vector_index(index_name):
    try:
        print(f"Retrieving existing index '{index_name}'...")
        vector_index = Neo4jVector.from_existing_index(
            embeddings,
            url=NEO4J_URI,
            username=NEO4J_USERNAME,
            password=NEO4J_PASSWORD,
            index_name=index_name,
            text_node_property='rdfs_label',
        )
        print(f"✅ Successfully retrieved the existing index '{index_name}'.")
        print(f"☝️ Index Name: {vector_index.index_name}")
        print(f"☝️ Node Label: {vector_index.node_label}")
        print(f"☝️ Embedding_node_property: {vector_index.embedding_node_property}")
        print(f"☝️ Text_node_property: {vector_index.text_node_property}")
        return vector_index
    except Exception as e:
        print("Failed to retrieve existing vector index:", str(e))
        return None
    
def create_vector_index():
    try:
        print("Creating vector index... 🕑🕝🕒")
        vector_index = Neo4jVector.from_existing_graph(
                       embeddings ,
                       url=NEO4J_URI,
                       username=NEO4J_USERNAME,
                       password=NEO4J_PASSWORD,
                       index_name= index_name,
                       node_label="well",
                       text_node_properties=['_id','_uri', 'rdfs_label'],
                       embedding_node_property='embedding' )
        print("✅ Vector index created successfully! ✅")

        return vector_index
    except Exception as e:
        print("Failed to create vector index:", str(e))
        return None

def verify_embeddings():
    try:
        with driver.session() as session:
            result = session.run("""
                MATCH (n:well)
                RETURN n._id, n.rdfs_label LIMIT 6
            """)
            nodes = result.data()
            if nodes:
                print("✅ Nodes with embeddings found:", nodes)
            else:
                print("❌ No nodes with embeddings found.")
    except Exception as e:
        print("Query failed:", str(e))

# Verificar si el índice ya existe
index_name = 'wells'

if check_index_exists(index_name):
    print(f"Index '{index_name}' already exists. Skipping index creation.")
    vector_index = get_existing_vector_index(index_name)
else:
    # Crear el índice vectorial
    vector_index = create_vector_index()

# Verificar los nodos después de la creación del índice
if vector_index:
        
    verify_embeddings()
    try:
        query = """MATCH (n:well)-[r:located_in]->(f:field) 
        WHERE f._id = 'CAMP_CD_CAMPO_0890'
        RETURN f 
        """
        response = vector_index.similarity_search_with_score(query, top_k=2 )
        print("✅Neo4jVector vector_index results:", response)
        if response:
            for doc, score in response:
                doc_id = doc.metadata.get('_id', 'No ID found')
                print("✅ Similarity search result:", doc.page_content, "| ID:", doc_id, "| Score:", score)
        else:
            print("❌ No results found.")
    except Exception as e:
        print("Similarity search failed:", str(e))
else:
    print("❌ ❌ Skipping similarity search due to failed index creation.")

Index exists
Index 'wells' already exists. Skipping index creation.
Retrieving existing index 'wells'...
✅ Successfully retrieved the existing index 'wells'.
☝️ Index Name: wells
☝️ Node Label: well
☝️ Embedding_node_property: embedding
☝️ Text_node_property: rdfs_label
✅ Nodes with embeddings found: [{'n._id': 'POCO_CD_POCO_022772', 'n.rdfs_label': '1-TR-1-AM'}, {'n._id': 'POCO_CD_POCO_022993', 'n.rdfs_label': '2-BCST-1-PA'}, {'n._id': 'POCO_CD_POCO_022557', 'n.rdfs_label': '1-BRSA-9-AM'}, {'n._id': 'POCO_CD_POCO_022775', 'n.rdfs_label': '1-JUT-1-PA'}, {'n._id': 'POCO_CD_POCO_022556', 'n.rdfs_label': '1-JAB-1-AM'}, {'n._id': 'POCO_CD_POCO_022777', 'n.rdfs_label': '2-MUST-1-AM'}]
✅Neo4jVector vector_index results: [(Document(metadata={'_id': 'POCO_CD_POCO_023241', '_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_023241'}, page_content='9-FZ-2-AM'), 0.8860565423965454), (Document(metadata={'_id': 'POCO_CD_POCO_022794', '_uri': 'http://www.seman

In [12]:
response = vector_index.similarity_search_with_score("Quais poços estao localizados no campo CAMP_CD_CAMPO_0633?", top_k=2)
if response:
    for doc, score in response:
        doc_id = doc.metadata.get('_id', 'No ID found')
        print("✅ Similarity search result:", doc.page_content, "| ID:", doc_id, "| Score:", score)

✅ Similarity search result: 3-AZU-1-AM | ID: POCO_CD_POCO_023240 | Score: 0.8637489080429077
✅ Similarity search result: 1-AM-3-AM | ID: POCO_CD_POCO_022851 | Score: 0.8627311587333679
✅ Similarity search result: 9-PA-3A-AM | ID: POCO_CD_POCO_023243 | Score: 0.8621328473091125
✅ Similarity search result: 9-AMR-2-AM | ID: POCO_CD_POCO_023252 | Score: 0.8617016077041626


In [13]:
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

vector_qa = RetrievalQA.from_chain_type(
    llm=llm_petrobras,
    chain_type="stuff",
    retriever=vector_index.as_retriever()
)

In [14]:
vector_qa.invoke(  "Quantos os poços na base de dados fornecida?")

{'query': 'Quantos os poços na base de dados fornecida?',
 'result': 'A base de dados fornecida menciona quatro poços: 1-BAS-36, 1-BAS-29, 1-BAS-32 e 1-BAS-64. Portanto, há quatro poços na base de dados fornecida.'}

In [15]:
vector_qa.invoke(  "Quais poços encontramse localizados no campo JAPIIM?") #CAMP_CD_CAMPO_0633

{'query': 'Quais poços encontramse localizados no campo JAPIIM?',
 'result': 'Os poços localizados no campo JAPIIM são:\n\n- 3-JI-4-BA\n- 3-JI-2-BA\n- 3-JI-3-BA\n- 3-JI-6-BA'}

In [22]:
vector_qa.invoke(  "Quais poços estão localizados no campo CAMP_CD_CAMPO_0888?")

{'query': 'Quais poços estão localizados no campo CAMP_CD_CAMPO_0888?',
 'result': 'Os poços localizados no campo CAMP_CD_CAMPO_0888 são:\n\n- 9-AMR-2-AM\n- 9-PA-3A-AM\n- 3-AZU-1-AM\n- 3-PAM-4D-AM'}

# **Neo4j using Cypher**

In [35]:
CYPHER_GENERATION_TEMPLATE = """Task:Generate Cypher statement to query a graph database.
Instructions:
Use only the provided relationship types and properties in the schema.
Do not use any other relationship types or properties that are not provided.
Schema:
{schema}
Note: Do not include any explanations or apologies in your responses.
Do not respond to any questions that might ask anything else than for you to construct a Cypher statement.
Do not include any text except the generated Cypher statement.

Examples: Here are a few examples of generated Cypher statements for particular questions:
# How many people played in Top Gun?
MATCH (m:Movie {{name:"Top Gun"}})<-[:ACTED_IN]-()
RETURN count(*) AS numberOfActors


#Quais formações estão constituídas pelo material chamado siltito?
MATCH (f:lithostratigraphic_unit)-[:constituted_by]->(m:siltstone)
RETURN f.rdfs_label

The question is:
{question}"""

CYPHER_GENERATION_PROMPT = PromptTemplate(
    input_variables=["schema", "question"], template=CYPHER_GENERATION_TEMPLATE
)

In [36]:
#Se por acaso você não encontrar a informação necessária, responda com "Não foi possível encontrar a informação requerida no grafo dado".
QA_PROMPT = """
A sua função é atraves das informações submetidas que estejam no grafo, em formato de resposta de uma query cypher é responder de forma detalhada na forma culta da lingua portuguesa. 
Utilize apenas os tipos de relacionamentos e propriedades fornecidos no grafo. Não utilize nenhum outro tipo de relacionamento ou propriedade que não seja fornecido no grafo. 

Estruture sua resposta de forma clara e organizada, fornecendo informações relevantes sobre os relacionamentos e entidades mencionadas na pergunta.
Não inclua explicações ou desculpas em suas respostas.

Informação:
{context}

Questão: {question}

Resposta ideal:
"""

qa_prompt = PromptTemplate.from_template(QA_PROMPT)

### Neo4j integration within LangChain called GraphCypherQAChain

In [37]:
chain = GraphCypherQAChain.from_llm(
    graph=graph, qa_prompt = qa_prompt, llm=llm_petrobras, verbose=True, 
    cypher_prompt=CYPHER_GENERATION_PROMPT)


## 🔍 Preguntas de teste Geral sobre PetroKGrahp e miniKGraph

In [33]:
chain.invoke("Quantos poços estao localizados na bacia chamada AMAZONAS?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {rdfs_label: "AMAZONAS"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 220}][0m

[1m> Finished chain.[0m


{'query': 'Quantos poços estao localizados na bacia chamada AMAZONAS?',
 'result': 'A bacia denominada AMAZONAS possui um total de 220 poços localizados em sua área.'}

In [36]:
chain.invoke("Quantos poços estao localizados na bacia chamada AMAZONAS?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well)-[:located_in]->(b:basin {rdfs_label: "AMAZONAS"})
RETURN count(w) AS numberOfWells
[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 220}][0m

[1m> Finished chain.[0m


{'query': 'Quantos poços estao localizados na bacia chamada AMAZONAS?',
 'result': 'A bacia chamada AMAZONAS possui um total de 220 poços.'}

In [None]:
print()

In [37]:
chain.invoke("Quantos poços estao localizados na bacia chamada CAMAMU-ALMADA?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {rdfs_label: "CAMAMU-ALMADA"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 118}][0m

[1m> Finished chain.[0m


{'query': 'Quantos poços estao localizados na bacia chamada CAMAMU-ALMADA?',
 'result': 'Na bacia denominada CAMAMU-ALMADA, encontram-se localizados um total de 118 poços.'}

In [22]:
chain.invoke("Quantos poços estao localizados no campo SARDINHA?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {rdfs_label: "SARDINHA"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 12}][0m

[1m> Finished chain.[0m


{'query': 'Quantos poços estao localizados no campo SARDINHA?',
 'result': 'O campo SARDINHA possui um total de 12 poços localizados em sua área.'}

In [23]:
chain.invoke("Quantos poços estao localizados no campo JAPIIM?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {rdfs_label: "JAPIIM"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 2}][0m

[1m> Finished chain.[0m


{'query': 'Quantos poços estao localizados no campo JAPIIM?',
 'result': 'O campo JAPIIM possui um total de 2 poços localizados em sua área.'}

In [38]:
chain.invoke("Quais formações estão constituidas pelo material chamado siltito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (f:lithostratigraphic_unit)-[:constituted_by]->(m:siltstone)
RETURN f.rdfs_label
[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'Fm. Nhamundá'}, {'f.rdfs_label': 'Fm. Algodões'}, {'f.rdfs_label': 'Mb. Cazumba'}, {'f.rdfs_label': 'Fm. Itaípe'}, {'f.rdfs_label': 'Gr. Brotas'}, {'f.rdfs_label': 'Gr. Camamu'}, {'f.rdfs_label': 'Fm. Pitinga'}, {'f.rdfs_label': 'Formação Urucutuca'}, {'f.rdfs_label': 'Fm. Morro do Barro'}, {'f.rdfs_label': 'Membro Tinharé'}][0m

[1m> Finished chain.[0m


{'query': 'Quais formações estão constituidas pelo material chamado siltito?',
 'result': 'As formações que estão constituídas pelo material chamado siltito são as seguintes:\n\n1. Formação Nhamundá (Fm. Nhamundá)\n2. Formação Algodões (Fm. Algodões)\n3. Membro Cazumba (Mb. Cazumba)\n4. Formação Itaípe (Fm. Itaípe)\n5. Grupo Brotas (Gr. Brotas)\n6. Grupo Camamu (Gr. Camamu)\n7. Formação Pitinga (Fm. Pitinga)\n8. Formação Urucutuca\n9. Formação Morro do Barro (Fm. Morro do Barro)\n10. Membro Tinharé\n\nEstas formações geológicas são compostas pelo material siltito, conforme indicado na informação fornecida.'}

In [39]:
chain.invoke("Quantas formações estão constituidas pelo material chamado siltito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit)-[:constituted_by]->(m:siltstone)
RETURN count(*) AS numberOfFormations[0m
Full Context:
[32;1m[1;3m[{'numberOfFormations': 36}][0m

[1m> Finished chain.[0m


{'query': 'Quantas formações estão constituidas pelo material chamado siltito?',
 'result': 'O número de formações constituídas pelo material chamado siltito é 36.'}

In [40]:
chain.invoke("Nomea todas as formações que estão constituidas pelo material chamado siltito. Sem limitar o contexto.")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit)-[:constituted_by]->(m:siltstone)
RETURN f.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'Fm. Nhamundá'}, {'f.rdfs_label': 'Fm. Algodões'}, {'f.rdfs_label': 'Mb. Cazumba'}, {'f.rdfs_label': 'Fm. Itaípe'}, {'f.rdfs_label': 'Gr. Brotas'}, {'f.rdfs_label': 'Gr. Camamu'}, {'f.rdfs_label': 'Fm. Pitinga'}, {'f.rdfs_label': 'Formação Urucutuca'}, {'f.rdfs_label': 'Fm. Morro do Barro'}, {'f.rdfs_label': 'Membro Tinharé'}][0m

[1m> Finished chain.[0m


{'query': 'Nomea todas as formações que estão constituidas pelo material chamado siltito. Sem limitar o contexto.',
 'result': 'As formações que estão constituídas pelo material chamado siltito são as seguintes:\n\n1. Formação Nhamundá\n2. Formação Algodões\n3. Membro Cazumba\n4. Formação Itaípe\n5. Grupo Brotas\n6. Grupo Camamu\n7. Formação Pitinga\n8. Formação Urucutuca\n9. Formação Morro do Barro\n10. Membro Tinharé\n\nEssas formações geológicas contêm o material siltito em sua composição, conforme os dados fornecidos.'}

In [41]:
chain.invoke(  "Quais poços encontramse localizados no campo JAPIIM?") #CAMP_CD_CAMPO_0633



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well)-[:located_in]->(f:field {rdfs_label:"JAPIIM"})
RETURN p.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'p.rdfs_label': '1-IMP-1-AM'}, {'p.rdfs_label': '3-IMP-2-AM'}][0m

[1m> Finished chain.[0m


{'query': 'Quais poços encontramse localizados no campo JAPIIM?',
 'result': 'Os poços localizados no campo JAPIIM são os seguintes:\n\n1. Poço com a identificação "1-IMP-1-AM"\n2. Poço com a identificação "3-IMP-2-AM"'}

In [43]:
chain.invoke("Quantos CAMPOS estão localizados na bacia de Camamu-Almada de ID BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {_id: "BASE_CD_BACIA_266"})<-[:located_in]-(f:field)
RETURN count(f) AS numberOfFields[0m
Full Context:
[32;1m[1;3m[{'numberOfFields': 6}][0m

[1m> Finished chain.[0m


{'query': 'Quantos CAMPOS estão localizados na bacia de Camamu-Almada de ID BASE_CD_BACIA_266?',
 'result': 'A bacia de Camamu-Almada, identificada pelo ID BASE_CD_BACIA_266, possui um total de 6 campos localizados.'}

In [74]:
chain.invoke("Quais formações estão constituidas pelo material da terra chamado arenito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (f:lithostratigraphic_unit)-[:constituted_by]->(:sandstone)
RETURN f.rdfs_label AS formacao
[0m
Full Context:
[32;1m[1;3m[{'formacao': 'Formação Aliança'}, {'formacao': 'Fm. Rio de Contas'}, {'formacao': 'Formação Manacapuru'}, {'formacao': 'Gr. Tapajós'}, {'formacao': 'Fm. Afligidos'}, {'formacao': 'Formação Taipus-Mirim'}, {'formacao': 'Gr. Espírito Santo'}, {'formacao': 'Fm. Ererê'}, {'formacao': 'Fm. Caravelas'}, {'formacao': 'Fm. Itaípe'}][0m

[1m> Finished chain.[0m


{'query': 'Quais formações estão constituidas pelo material da terra chamado arenito?',
 'result': 'As formações constituídas pelo material da terra chamado arenito são as seguintes:\n\n1. **Formação Aliança**\n2. **Fm. Rio de Contas**\n3. **Formação Manacapuru**\n4. **Gr. Tapajós**\n5. **Fm. Afligidos**\n6. **Formação Taipus-Mirim**\n7. **Gr. Espírito Santo**\n8. **Fm. Ererê**\n9. **Fm. Caravelas**\n10. **Fm. Itaípe**\n\nEssas formações geológicas são compostas predominantemente de arenito, caracterizando-se por suas propriedades sedimentares e sua relevância no estudo da geologia e geomorfologia.'}

In [24]:
chain.invoke("Quais são os CAMPOS localizados na bacia AMAZONAS?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {rdfs_label: "AMAZONAS"})<-[:located_in]-(f:field)
RETURN f.rdfs_label AS campo
[0m
Full Context:
[32;1m[1;3m[{'campo': 'JAPIIM'}, {'campo': 'AZULÃO'}][0m

[1m> Finished chain.[0m


{'query': 'Quais são os CAMPOS localizados na bacia AMAZONAS?',
 'result': 'Os campos localizados na bacia Amazonas são:\n\n1. Campo Japiim\n2. Campo Azulão'}

In [None]:
chain.invoke("Quais são os CAMPOS localizados na bacia CAMAMU-ALMADA?")

In [44]:
chain.invoke(  "Quais poços encontramse localizados no campo JAPIIM?") #CAMP_CD_CAMPO_0633



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well)-[:located_in]->(c:field {rdfs_label: "JAPIIM"})
RETURN p.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'p.rdfs_label': '1-IMP-1-AM'}, {'p.rdfs_label': '3-IMP-2-AM'}][0m

[1m> Finished chain.[0m


{'query': 'Quais poços encontramse localizados no campo JAPIIM?',
 'result': 'Os poços localizados no campo JAPIIM são:\n\n1. Poço com a identificação: 1-IMP-1-AM\n2. Poço com a identificação: 3-IMP-2-AM'}

In [45]:
chain.invoke(  "Quais poços encontramse localizados no campo MANATI?") #CAMP_CD_CAMPO_0888



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well)-[:located_in]->(c:field {rdfs_label: "MANATI"})
RETURN p.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'p.rdfs_label': '7-MNT-6D-BAS'}, {'p.rdfs_label': '7-MNT-4-BAS'}, {'p.rdfs_label': '4-MNT-7-BAS'}, {'p.rdfs_label': '1-BAS-128'}, {'p.rdfs_label': '3-BRSA-141-BAS'}, {'p.rdfs_label': '3-BRSA-599DP-BAS'}, {'p.rdfs_label': '7-MNT-1-BAS'}, {'p.rdfs_label': '7-MNT-5D-BAS'}, {'p.rdfs_label': '7-MNT-3-BAS'}, {'p.rdfs_label': '7-MNT-2-BAS'}][0m

[1m> Finished chain.[0m


{'query': 'Quais poços encontramse localizados no campo MANATI?',
 'result': 'Os poços localizados no campo MANATI são:\n\n1. 7-MNT-6D-BAS\n2. 7-MNT-4-BAS\n3. 4-MNT-7-BAS\n4. 7-MNT-1-BAS\n5. 7-MNT-5D-BAS\n6. 7-MNT-3-BAS\n7. 7-MNT-2-BAS'}

In [49]:
chain.invoke(  "Quais poços estão localizados no campo MORRO DO BARRO?") #CAMP_CD_CAMPO_0721



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well)-[:located_in]->(f:field {rdfs_label: "MORRO DO BARRO"})
RETURN w.rdfs_label AS wellName
[0m
Full Context:
[32;1m[1;3m[{'wellName': '3-MBX-1-BA'}, {'wellName': '3-MB-6-BA'}, {'wellName': '3-MB-7-BA'}, {'wellName': '3-MB-8-BA'}, {'wellName': '3-MB-2-BA'}, {'wellName': '3-MBX-1R-BA'}, {'wellName': '3-MB-3-BA'}, {'wellName': '1-MB-1-BA'}, {'wellName': '4-MB-9-BA'}, {'wellName': '3-MB-4-BA'}][0m

[1m> Finished chain.[0m


{'query': 'Quais poços estão localizados no campo MORRO DO BARRO?',
 'result': 'Os poços localizados no campo MORRO DO BARRO são os seguintes:\n\n1. Poço 3-MBX-1-BA\n2. Poço 3-MB-6-BA\n3. Poço 3-MB-7-BA\n4. Poço 3-MB-8-BA\n5. Poço 3-MB-2-BA\n6. Poço 3-MBX-1R-BA\n7. Poço 3-MB-3-BA\n8. Poço 1-MB-1-BA\n9. Poço 4-MB-9-BA\n10. Poço 3-MB-4-BA\n\nEstes poços estão todos associados ao campo denominado MORRO DO BARRO.'}

## 🔍 Preguntas para avaliar sobre o miniKGraph (sept 2024)

### ✅  Teste de perguntas e respostas

In [82]:
### Teste de perguntas e respostas
chain.invoke("MATCH (n:well)-[r:located_in]->(b:basin) RETURN RETURN COUNT(r) as total_relationships")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:well)-[r:located_in]->(b:basin) 
RETURN COUNT(r) AS total_relationships[0m
Full Context:
[32;1m[1;3m[{'total_relationships': 338}][0m

[1m> Finished chain.[0m


{'query': 'MATCH (n:well)-[r:located_in]->(b:basin) RETURN RETURN COUNT(r) as total_relationships',
 'result': 'A consulta solicitada realizou a contagem dos relacionamentos do tipo "located_in" entre os nós do tipo "well" (poço) e os nós do tipo "basin" (bacia). O resultado obtido indica que existem 338 relacionamentos deste tipo no grafo.\n\nPortanto, a resposta para a consulta é:\n\nExistem 338 relacionamentos do tipo "located_in" que conectam nós do tipo "well" (poço) a nós do tipo "basin" (bacia).'}

Identificar os poços que estão localizados na bacia especificada

In [50]:
chain.invoke("Quais são os identificadores dos poços localizados na bacia com identificador BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: "BASE_CD_BACIA_030"})<-[:located_in]-(w:well)
RETURN w._id AS wellIdentifiers
[0m
Full Context:
[32;1m[1;3m[{'wellIdentifiers': 'POCO_CD_POCO_023016'}, {'wellIdentifiers': 'POCO_CD_POCO_022806'}, {'wellIdentifiers': 'POCO_CD_POCO_023017'}, {'wellIdentifiers': 'POCO_CD_POCO_022886'}, {'wellIdentifiers': 'POCO_CD_POCO_022809'}, {'wellIdentifiers': 'POCO_CD_POCO_022875'}, {'wellIdentifiers': 'POCO_CD_POCO_023011'}, {'wellIdentifiers': 'POCO_CD_POCO_022758'}, {'wellIdentifiers': 'POCO_CD_POCO_023059'}, {'wellIdentifiers': 'POCO_CD_POCO_023037'}][0m

[1m> Finished chain.[0m


{'query': 'Quais são os identificadores dos poços localizados na bacia com identificador BASE_CD_BACIA_030?',
 'result': 'Os identificadores dos poços localizados na bacia com identificador BASE_CD_BACIA_030 são:\n\n1. POCO_CD_POCO_023016\n2. POCO_CD_POCO_022806\n3. POCO_CD_POCO_023017\n4. POCO_CD_POCO_022886\n5. POCO_CD_POCO_022809\n6. POCO_CD_POCO_022875\n7. POCO_CD_POCO_023011\n8. POCO_CD_POCO_022758\n9. POCO_CD_POCO_023059\n10. POCO_CD_POCO_023037'}

In [83]:
chain.invoke("Quais poços sao localizados na bacia CAMAMU-ALMADA com identificador BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {_id: "BASE_CD_BACIA_266", rdfs_label: "CAMAMU-ALMADA"})<-[:located_in]-(w:well)
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_005755', 'rdfs_label': '1-BAS-79', '_id': 'POCO_CD_POCO_005755', 'embedding': [0.015432428568601608, 0.00876528862863779, 0.006139152683317661, -0.02274833805859089, -0.03147221729159355, 0.016578128561377525, -0.00306094903498888, 0.012133367359638214, -0.031334180384874344, -0.024432377889752388, -0.0007876681047491729, -0.0005409286823123693, -0.012195483781397343, 0.0011534636141732335, -0.02022227831184864, 0.02989860437810421, 0.022044355049729347, -0.017765237018465996, 0.0220719613134861, -0.009876478463411331, 0.026558132842183113, 0.026765186339616776, -0.030312713235616684, -0.019311241805553436, 0.001621060655452311, 0.012706217356026173, 0.017461558803915977,

BadRequestError: Error code: 400 - {'error': {'message': "This model's maximum context length is 128000 tokens. However, your messages resulted in 156494 tokens. Please reduce the length of the messages.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

### ✅ **Pregunta No. 1**

In [68]:
chain.run("Quantos poços localizados na bacia BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_030'})<-[:located_in]-(w:well)
RETURN COUNT(w) AS total_wells
[0m
Full Context:
[32;1m[1;3m[{'total_wells': 220}][0m

[1m> Finished chain.[0m


'A bacia identificada pelo código BASE_CD_BACIA_030 possui um total de 220 poços localizados em seu território.'

In [52]:
chain.invoke("Quais sao os poços localizados na bacia BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {_id: "BASE_CD_BACIA_030"})<-[:located_in]-(w:well)
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_023016', 'rdfs_label': '2-JIST-1-PA', '_id': 'POCO_CD_POCO_023016', 'embedding': [0.008931806311011314, 0.012525544501841068, 0.01588810794055462, -0.01762543059885502, -0.030178997665643692, 0.014529071748256683, -0.003922989591956139, 0.011747952550649643, -0.029394399374723434, -0.030683381482958794, -0.0015586877707391977, -0.007138439919799566, -0.015593882650136948, -0.011418701149523258, -0.014143778011202812, 0.03003889136016369, 0.02324371226131916, -0.018003718927502632, 0.02208082564175129, 0.009709399193525314, 0.015033455565571785, 0.02869386598467827, -0.02737686224281788, -0.015986181795597076, 0.012364421971142292, 0.0007307443302124739, 0.01983911730349064, -0.022361040115356445, -0.

BadRequestError: Error code: 400 - {'error': {'message': "This model's maximum context length is 128000 tokens. However, your messages resulted in 156519 tokens. Please reduce the length of the messages.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

In [465]:
chain.run("Quais sao os poços localizados na bacia BASE_CD_BACIA_116?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_009032', '_id': 'POCO_CD_POCO_009032'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006882', '_id': 'POCO_CD_POCO_006882'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_007140', '_id': 'POCO_CD_POCO_007140'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_010831', '_id': 'POCO_CD_POCO_010831'}}][0m

[1m> Finished chain.[0m


'Com base nas informações fornecidas, os poços localizados na bacia BASE_CD_BACIA_116 são:\n- POCO_CD_POCO_009032\n- POCO_CD_POCO_006882\n- POCO_CD_POCO_007140\n- POCO_CD_POCO_010831'

### ✅ **Pregunta No. 2**

In [53]:
chain.invoke("Quais sao os campos que estao localizados na bacia identificada BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {_id: "BASE_CD_BACIA_030"})<-[:located_in]-(f:field)
RETURN f[0m
Full Context:
[32;1m[1;3m[{'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0633', 'rdfs_label': 'JAPIIM', '_id': 'CAMP_CD_CAMPO_0633', 'embedding': [0.011752169579267502, 0.003233787603676319, -0.023433206602931023, -0.03435087203979492, -0.0006571861449629068, -0.04451405629515648, -0.03184070810675621, 0.07712878286838531, 0.0128950709477067, -0.02290714904665947, 0.04911734163761139, -0.012782025150954723, -0.04721394181251526, 0.006905417423695326, -0.012755259871482849, -0.010265104472637177, -0.007845962420105934, 0.03548990935087204, 0.009242677129805088, 0.006342824082821608, 0.046258121728897095, -0.0075142523273825645, -0.023224955424666405, -0.03141765668988228, -0.009758055210113525, -0.012950337491929531, -0.04303509742021561, -0.05216216668486595, 0.00394997

{'query': 'Quais sao os campos que estao localizados na bacia identificada BASE_CD_BACIA_030?',
 'result': 'A bacia identificada como BASE_CD_BACIA_030 contém os seguintes campos:\n\n1. **JAPIIM**\n   - **Identificador:** CAMP_CD_CAMPO_0633\n   - **URI:** [http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0633](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0633)\n\n2. **AZULÃO**\n   - **Identificador:** CAMP_CD_CAMPO_0131\n   - **URI:** [http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0131](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0131)\n\nEstes campos são constituídos por informações detalhadas, como seus respectivos embeddings, que são vetores numéricos representando características dessas entidades no grafo.'}

In [65]:
chain.run("Quais os campos que estao localizados na bacia BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_266'})<-[:located_in]-(f:field)
RETURN f.rdfs_label
[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'MORRO DO BARRO'}, {'f.rdfs_label': 'CAMARAO NORTE'}, {'f.rdfs_label': 'SARDINHA'}, {'f.rdfs_label': 'ÁREA BAS-064'}, {'f.rdfs_label': 'JIRIBATUBA'}, {'f.rdfs_label': 'MANATI'}][0m

[1m> Finished chain.[0m


'Os campos localizados na bacia BASE_CD_BACIA_266 são:\n\n1. Morro do Barro\n2. Camarão Norte\n3. Sardinha\n4. Área BAS-064\n5. Jiribatuba\n6. Manati'

In [67]:
chain.run("Quais os ID campos localizados na bacia BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_266'})<-[:located_in]-(f:field)
RETURN f._id
[0m
Full Context:
[32;1m[1;3m[{'f._id': 'CAMP_CD_CAMPO_0721'}, {'f._id': 'CAMP_CD_CAMPO_0890'}, {'f._id': 'CAMP_CD_CAMPO_0109'}, {'f._id': 'CAMP_CD_CAMPO_0108'}, {'f._id': 'CAMP_CD_CAMPO_0572'}, {'f._id': 'CAMP_CD_CAMPO_0888'}][0m

[1m> Finished chain.[0m


'Os campos localizados na bacia identificada como BASE_CD_BACIA_266 são os seguintes:\n\n1. CAMP_CD_CAMPO_0721\n2. CAMP_CD_CAMPO_0890\n3. CAMP_CD_CAMPO_0109\n4. CAMP_CD_CAMPO_0108\n5. CAMP_CD_CAMPO_0572\n6. CAMP_CD_CAMPO_0888'

### ✅ **Pregunta No. 3**

In [59]:
chain.invoke("Quantos poços estão localizados no campo identificado como CAMP_CD_CAMPO_0888?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {rdfs_label:"CAMP_CD_CAMPO_0888"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 0}][0m

[1m> Finished chain.[0m


{'query': 'Quantos poços estão localizados no campo identificado como CAMP_CD_CAMPO_0888?',
 'result': 'No campo identificado como CAMP_CD_CAMPO_0888, não há poços localizados.'}

In [62]:
chain.run("Quais poços estão localizados no campo CAMP_CD_CAMPO_0890?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(f:field {rdfs_label: "CAMP_CD_CAMPO_0890"})
RETURN w[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Com base nas informações fornecidas, não há dados disponíveis no grafo para responder à questão sobre quais poços estão localizados no campo CAMP_CD_CAMPO_0890.'

In [61]:
chain.run("Quantos poços estão localizados no campo CAMP_CD_CAMPO_0108?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well)-[:located_in]->(f:field {rdfs_label: "CAMP_CD_CAMPO_0108"})
RETURN count(w) AS numberOfWells
[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 0}][0m

[1m> Finished chain.[0m


'O campo identificado como "CAMP_CD_CAMPO_0108" não possui nenhum poço localizado em sua área, conforme indicado pela propriedade "numberOfWells" com o valor 0.'

### ✅ Pregunta No. 4

In [21]:
chain.invoke("Quais são os poços que estão localizados no campo CAMP_CD_CAMPO_0890?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {_id: "CAMP_CD_CAMPO_0890"})
MATCH (w:well)-[:located_in]->(f)
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_000010', 'rdfs_label': '3-BAS-131', '_id': 'POCO_CD_POCO_000010', 'embedding': [0.01584053412079811, 0.009938213042914867, 0.005509750917553902, -0.018209727481007576, -0.02555146999657154, 0.020785534754395485, -0.003636435605585575, 0.008629647083580494, -0.03157087415456772, -0.021735968068242073, 0.0013610806781798601, -0.0001816496078390628, -0.012837720103561878, -0.005244594067335129, -0.014724809676408768, 0.034463491290807724, 0.020014170557260513, -0.02497294545173645, 0.01984887756407261, 0.0004541240050457418, 0.020702889189124107, 0.03151577711105347, -0.03168106824159622, -0.017259294167160988, 0.0075759077444672585, 0.007692989893257618, 0.015193138271570206, -0.027851792052

{'query': 'Quais são os poços que estão localizados no campo CAMP_CD_CAMPO_0890?',
 'result': 'No campo identificado como "CAMP_CD_CAMPO_0890", encontram-se os seguintes poços:\n\n1. Poço "3-BAS-131" com o identificador "POCO_CD_POCO_000010".\n2. Poço "3-BRSA-135-BAS" com o identificador "POCO_CD_POCO_006025".\n\nEstes poços estão associados ao campo mencionado e possuem as respectivas propriedades que os identificam univocamente.'}

In [92]:
chain.run("Quantos e quais são os poços que estão localizados no campo CAMP_CD_CAMPO_0890?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {_id: "CAMP_CD_CAMPO_0890"})<-[:located_in]-(w:well)
RETURN w.rdfs_label AS wellName, w._id AS wellId[0m
Full Context:
[32;1m[1;3m[{'wellName': '3-BAS-131', 'wellId': 'POCO_CD_POCO_000010'}, {'wellName': '3-BRSA-135-BAS', 'wellId': 'POCO_CD_POCO_006025'}][0m

[1m> Finished chain.[0m


'O campo identificado pelo código "CAMP_CD_CAMPO_0890" possui dois poços localizados em sua área. Os poços são os seguintes:\n\n1. Nome do Poço: 3-BAS-131\n   Identificação do Poço: POCO_CD_POCO_000010\n\n2. Nome do Poço: 3-BRSA-135-BAS\n   Identificação do Poço: POCO_CD_POCO_006025'

### ✅ SINGLE-HOP Pregunta No. 8

In [46]:
chain.invoke("Que UNIDADES LITOESTRATIGRÁFICAS o poço identificado com o id POCO_CD_POCO_023241 atravessa?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_023241"})-[:crosses]->(u:lithostratigraphic_unit)
RETURN u.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'u.rdfs_label': 'Fm. Nova Olinda'}, {'u.rdfs_label': 'Formação Alter do Chão'}, {'u.rdfs_label': 'Fm. Ererê'}, {'u.rdfs_label': 'Formação Monte Alegre'}, {'u.rdfs_label': 'Formação Curiri'}, {'u.rdfs_label': 'Formação Oriximiná'}, {'u.rdfs_label': 'Formação Faro'}, {'u.rdfs_label': 'Formação Barreirinha'}, {'u.rdfs_label': 'Formação Andirá'}, {'u.rdfs_label': 'Fm. Itaituba'}][0m

[1m> Finished chain.[0m


{'query': 'Que UNIDADES LITOESTRATIGRÁFICAS o poço identificado com o id POCO_CD_POCO_023241 atravessa?',
 'result': 'O poço identificado com o id POCO_CD_POCO_023241 atravessa as seguintes unidades litoestratigráficas:\n\n1. Formação Nova Olinda (Fm. Nova Olinda)\n2. Formação Alter do Chão\n3. Formação Ererê (Fm. Ererê)\n4. Formação Monte Alegre\n5. Formação Curiri\n6. Formação Oriximiná\n7. Formação Faro\n8. Formação Barreirinha\n9. Formação Andirá\n10. Formação Itaituba (Fm. Itaituba)\n\nEssas formações representam diferentes camadas geológicas que o poço atravessa, cada uma com suas características específicas de composição e estrutura.'}

### ✅ MULTI-HOP Pregunta No. 12

In [48]:
chain.invoke("Que UNIDADES LITOESTRATIGRÁFICAS o poco com ID POCO_CD_POCO_023241 atravessa que são constituídas por ROCHAS do tipo dolomito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well {_id: "POCO_CD_POCO_023241"})-[:crosses]->(u:lithostratigraphic_unit)-[:constituted_by]->(r:dolomite)
RETURN u.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'u.rdfs_label': 'Fm. Nova Olinda'}, {'u.rdfs_label': 'Formação Monte Alegre'}, {'u.rdfs_label': 'Fm. Itaituba'}][0m

[1m> Finished chain.[0m


{'query': 'Que UNIDADES LITOESTRATIGRÁFICAS o poco com ID POCO_CD_POCO_023241 atravessa que são constituídas por ROCHAS do tipo dolomito?',
 'result': 'O poço identificado como POCO_CD_POCO_023241 atravessa as seguintes unidades litoestratigráficas constituídas por rochas do tipo dolomito:\n\n1. Formação Nova Olinda (Fm. Nova Olinda)\n2. Formação Monte Alegre (Formação Monte Alegre)\n3. Formação Itaituba (Fm. Itaituba)\n\nEstas unidades litoestratigráficas são reconhecidas pelas suas composições específicas que incluem dolomito, caracterizando assim a geologia do local onde o poço foi perfurado.'}

In [50]:
chain.invoke("Que UNIDADES LITOESTRATIGRÁFICAS o poco com id POCO_CD_POCO_023241 atravessa que são constituídas por FLUIDO do tipo gás seco?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well {_id: "POCO_CD_POCO_023241"})-[:crosses]->(u:lithostratigraphic_unit)-[:constituted_by]->(f:dry_gas)
RETURN u.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'u.rdfs_label': 'Fm. Itaituba'}, {'u.rdfs_label': 'Formação Oriximiná'}][0m

[1m> Finished chain.[0m


{'query': 'Que UNIDADES LITOESTRATIGRÁFICAS o poco com id POCO_CD_POCO_023241 atravessa que são constituídas por FLUIDO do tipo gás seco?',
 'result': 'O poço identificado como POCO_CD_POCO_023241 atravessa as seguintes unidades litoestratigráficas que são constituídas por fluido do tipo gás seco:\n\n1. **Formação Itaituba (Fm. Itaituba)**:\n   Esta formação é uma unidade litoestratigráfica atravessada pelo poço e contém gás seco.\n\n2. **Formação Oriximiná**:\n   Esta é outra unidade litoestratigráfica atravessada pelo poço e também é constituída por gás seco.\n\nEssas são as unidades litoestratigráficas associadas ao poço POCO_CD_POCO_023241 com a presença de gás seco.'}

### ✅ MULTI-HOP: Pregunta No. 13

In [52]:
chain.invoke("Que idade geológica das UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo dry_gas?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (u:lithostratigraphic_unit)-[:constituted_by]->(f:dry_gas)
MATCH (u)-[:has_age]->(a:owl_NamedIndividual)
RETURN a.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'a.rdfs_label': 'Bashkiriano'}, {'a.rdfs_label': 'Tournaisiano'}][0m

[1m> Finished chain.[0m


{'query': 'Que idade geológica das UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo dry_gas?',
 'result': 'As idades geológicas das unidades litoestratigráficas constituídas por fluido do tipo "dry_gas" são o Bashkiriano e o Tournaisiano. O Bashkiriano é uma idade da época Carbonífera Média, enquanto o Tournaisiano pertence à época Carbonífera Inferior.'}

In [55]:
chain.invoke("Que idade geológica das UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo gás seco?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (u:lithostratigraphic_unit)-[:constituted_by]->(f:dry_gas),
      (u)-[:has_age]->(a)
RETURN DISTINCT a.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'a.rdfs_label': 'Bashkiriano'}, {'a.rdfs_label': 'Tournaisiano'}][0m

[1m> Finished chain.[0m


{'query': 'Que idade geológica das UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo gás seco?',
 'result': 'As idades geológicas das UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo gás seco são Bashkiriano e Tournaisiano.'}

In [27]:
chain.invoke("Qual idade geológica idenficada pelo ID formacao_320?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual {_id: "formacao_320"})-[:has_age]->(age)
RETURN age.rdfs_label AS geological_age[0m
Full Context:
[32;1m[1;3m[{'geological_age': 'Tournaisiano'}][0m

[1m> Finished chain.[0m


{'query': 'Qual idade geológica idenficada pelo ID formacao_320?',
 'result': 'A formação identificada pelo ID formacao_320 pertence à idade geológica conhecida como Tournaisiano.'}

In [56]:
chain.invoke("Quantos POCOS atravessam UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo dry_gas?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (p:well)-[:crosses]->(u:lithostratigraphic_unit)-[:constituted_by]->(f:dry_gas)
RETURN count(p) AS numberOfWells
[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 243}][0m

[1m> Finished chain.[0m


{'query': 'Quantos POCOS atravessam UNIDADES LITOESTRATIGRÁFICAS constituídas por FLUIDO do tipo dry_gas?',
 'result': 'O número de poços que atravessam unidades litoestratigráficas constituídas por fluido do tipo gás seco (dry_gas) é de 243.'}

### ✅ Pregunta No. 6

In [31]:
chain.invoke("Which are the earth material and lithostratigraphic unit that crosses the well id POCO_CD_POCO_024505 and the rock os the lithostratigraphic unit ?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_024505"})-[:crosses]->(u:lithostratigraphic_unit)-[:constituted_by]->(r:owl_NamedIndividual)
RETURN u.rdfs_label AS lithostratigraphicUnit, r.rdfs_label AS rock[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


{'query': 'Which are the earth material and lithostratigraphic unit that crosses the well id POCO_CD_POCO_024505 and the rock os the lithostratigraphic unit ?',
 'result': 'Com base nas informações fornecidas, não foi possível identificar os materiais terrestres e a unidade litoestratigráfica que atravessam o poço com o identificador POCO_CD_POCO_024505, nem a rocha correspondente à unidade litoestratigráfica.'}

### ✅ Pregunta No. 7

In [128]:
chain.invoke("Quantos são os id das formações que atravessam o poço com id POCO_CD_POCO_022645 e que é constituída pelo sandstone?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_022645"})-[:crosses]->(f:lithostratigraphic_unit)-[:constituted_by]->(:sandstone)
RETURN count(f._id) AS numberOfFormations[0m
Full Context:
[32;1m[1;3m[{'numberOfFormations': 13}][0m

[1m> Finished chain.[0m


{'query': 'Quantos são os id das formações que atravessam o poço com id POCO_CD_POCO_022645 e que é constituída pelo sandstone?',
 'result': 'O poço identificado como POCO_CD_POCO_022645 atravessa um total de 13 formações constituídas por arenito (sandstone).'}

In [57]:
chain.invoke("Quais são os id das formações que atravessam o poço com id POCO_CD_POCO_022645 e que é constituída pelo sandstone?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well {_id: "POCO_CD_POCO_022645"})-[:crosses]->(f:lithostratigraphic_unit)-[:constituted_by]->(m:sandstone)
RETURN f._id[0m
Full Context:
[32;1m[1;3m[{'f._id': 'formacao_006'}, {'f._id': 'formacao_086'}, {'f._id': 'formacao_246'}, {'f._id': 'formacao_031'}, {'f._id': 'formacao_187'}, {'f._id': 'formacao_284'}, {'f._id': 'formacao_241'}, {'f._id': 'formacao_141'}, {'f._id': 'formacao_329'}, {'f._id': 'formacao_028'}][0m

[1m> Finished chain.[0m


{'query': 'Quais são os id das formações que atravessam o poço com id POCO_CD_POCO_022645 e que é constituída pelo sandstone?',
 'result': 'Os identificadores das formações que atravessam o poço com o ID "POCO_CD_POCO_022645" e que são constituídas por arenito (sandstone) são os seguintes:\n\n1. formacao_006\n2. formacao_086\n3. formacao_246\n4. formacao_031\n5. formacao_187\n6. formacao_284\n7. formacao_241\n8. formacao_141\n9. formacao_329\n10. formacao_028'}

### ✅ **Pregunta No. 8**

Neste casso é necessario dividir a pergunta por etapas para construir a pergunta final.

#### ✅ Qual formação atravessa o poço con ID: 'POCO_CD_POCO_024505'?

In [58]:
chain.invoke("Qual é o id da formação que atravessa o poço com id POCO_CD_POCO_022645?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well {_id: "POCO_CD_POCO_022645"})-[:crosses]->(f:lithostratigraphic_unit)
RETURN f._id
[0m
Full Context:
[32;1m[1;3m[{'f._id': 'formacao_006'}, {'f._id': 'formacao_086'}, {'f._id': 'formacao_246'}, {'f._id': 'formacao_031'}, {'f._id': 'formacao_187'}, {'f._id': 'formacao_284'}, {'f._id': 'formacao_241'}, {'f._id': 'formacao_141'}, {'f._id': 'formacao_329'}, {'f._id': 'formacao_028'}][0m

[1m> Finished chain.[0m


{'query': 'Qual é o id da formação que atravessa o poço com id POCO_CD_POCO_022645?',
 'result': 'O id da formação que atravessa o poço com id POCO_CD_POCO_022645 é **formacao_028**.'}

In [658]:
chain.run("Qual é o id da formação que atravessa o poço com id POCO_CD_POCO_018470?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_018470"})-[:crosses]->(l:lithostratigraphic_unit)
RETURN l._id[0m
Full Context:
[32;1m[1;3m[{'l._id': 'formacao_296'}][0m

[1m> Finished chain.[0m


'O id da formação que atravessa o poço com id POCO_CD_POCO_018470 é formacao_296.'

In [62]:
chain.invoke("Quais formações atravessam o poço com id POCO_CD_POCO_005760?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_005760"})-[:crosses]->(f:lithostratigraphic_unit)
RETURN f.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'Gr. Brotas'}, {'f.rdfs_label': 'Formação Sergi'}, {'f.rdfs_label': 'Gr. Camamu'}, {'f.rdfs_label': 'Formação Taipus-Mirim'}][0m

[1m> Finished chain.[0m


{'query': 'Quais formações atravessam o poço com id POCO_CD_POCO_005760?',
 'result': 'O poço identificado pelo código POCO_CD_POCO_005760 é atravessado pelas seguintes formações geológicas:\n\n1. **Formação Sergi**: Esta formação é uma das camadas geológicas que o poço atravessa. Ela é conhecida por suas características sedimentares específicas e sua importância na estratigrafia regional.\n\n2. **Formação Taipus-Mirim**: Outra formação geológica que o poço POCO_CD_POCO_005760 atravessa é a Formação Taipus-Mirim. Esta formação também possui características sedimentares distintas e desempenha um papel crucial na geologia da área.\n\nEssas formações fazem parte do contexto geológico em que o poço POCO_CD_POCO_005760 está inserido, proporcionando uma visão detalhada das camadas sedimentares através das quais o poço foi perfurado.'}

In [66]:
chain.invoke("Quais formações atravessam o poço com id POCO_CD_POCO_005744?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (p:well {_id: "POCO_CD_POCO_005744"})-[:crosses]->(f:lithostratigraphic_unit)
RETURN f.rdfs_label[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'Gr. Espírito Santo'}, {'f.rdfs_label': 'Formação Taipus-Mirim'}, {'f.rdfs_label': 'Gr. Camamu'}, {'f.rdfs_label': 'Formação Urucutuca'}][0m

[1m> Finished chain.[0m


{'query': 'Quais formações atravessam o poço com id POCO_CD_POCO_005744?',
 'result': 'O poço identificado pelo código POCO_CD_POCO_005744 atravessa as seguintes formações geológicas:\n\n1. Formação Taipus-Mirim\n2. Formação Urucutuca\n\nEstas formações são parte das unidades estratigráficas que foram interceptadas durante a perfuração do referido poço.'}

#### ✅ Em quais formações do campo 'nome do campo' foram identificadas ocorrências de 'tipo de fluido'?

In [663]:
chain.run("Quais unidades litoestratigraficas ou formações atravessam o poço _id:POCO_CD_POCO_024505  e são constituídas pelo id oil?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_024505"})-[:crosses]->(unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN unit;[0m
Full Context:
[32;1m[1;3m[{'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}][0m

[1m> Finished chain.[0m


'As unidades litoestratigráficas ou formações que atravessam o poço POCO_CD_POCO_024505 e são constituídas pelo id oil são as seguintes:\n- Formação 110 (formacao_110)'

✅ Quais unidades litoestratigraficas ou formações sao constituidas pelo 'tipo de fluido'?

In [665]:
chain.run("Which are the lithostratigraphic unit that is constituted by id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (lithostratigraphic_unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN lithostratigraphic_unit[0m
Full Context:
[32;1m[1;3m[{'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_319', '_id': 'formacao_319'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_200', '_id': 'formacao_200'}}][0m

[1m> F

'As unidades litoestratigráficas que são constituídas pelo id oil são:\n- formacao_027\n- formacao_056\n- formacao_110\n- formacao_319\n- formacao_200'

In [496]:
chain.run("Quais são as unidades litoestratigráficas que foram constituídas pelo owl_Class id oil?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:owl_Class { _id: "oil" })<-[:constituted_by]-(lu:lithostratigraphic_unit)
RETURN lu[0m
Full Context:
[32;1m[1;3m[{'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_319', '_id': 'formacao_319'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_200', '_id': 'formacao_200'}}][0m

[1m> Finished chain.[0m


'As unidades litoestratigráficas constituídas pelo owl_Class id oil são:\n- formacao_027\n- formacao_056\n- formacao_110\n- formacao_319\n- formacao_200'

### ✅ **Pregunta No. 9**

In [599]:
chain.run("Quais são as texturas das rochas de arenito encontradas no campo CAMP_CD_CAMPO_0519?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "CAMP_CD_CAMPO_0519"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:textura]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de arenito encontradas no campo CAMP_CD_CAMPO_0519 são granulosa e porosa.'

In [601]:
chain.run("Quais são as texturas das rochas de ardosia encontradas no campo CAMP_CD_CAMPO_0773?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:owl_NamedIndividual {_id: "CAMP_CD_CAMPO_0773"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As rochas de ardósia encontradas no campo CAMP_CD_CAMPO_0773 possuem as texturas de "lisa" e "rugosa".'

In [603]:
chain.run("Quais são as texturas das rochas de argilito encontradas no campo CAMP_CD_CAMPO_0536?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "CAMP_CD_CAMPO_0536"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de argilito encontradas no campo CAMP_CD_CAMPO_0536 são finas e laminadas.'

In [604]:
chain.run("Quais são as texturas das rochas de basalto encontradas no campo CAMP_CD_CAMPO_0773?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:owl_NamedIndividual {_id: "CAMP_CD_CAMPO_0773"})-[:located_in]->(basin)-[:rdf_type]->(owl_Class)-[:owl_equivalentClass]->(lithostratigraphic_unit)-[:rdf_type]->(textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de basalto encontradas no campo CAMP_CD_CAMPO_0773 são textura afanítica e textura porfirítica.'

In [605]:
chain.run("Quais são as texturas das rochas de brecha encontradas no campo CAMP_CD_CAMPO_0773?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "CAMP_CD_CAMPO_0773"})-[:located_in]->(well)-[:crosses]->(lithostratigraphic_unit)-[:rdf_type]->(textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As rochas de brecha encontradas no campo CAMP_CD_CAMPO_0773 possuem as texturas de "rugosa" e "porosa".'

### ✅ **Pregunta No. 10**

In [606]:
chain.run("Quais são as texturas das rochas de arenito encontradas no poço POCO_CD_POCO_023172 ?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "POCO_CD_POCO_023172"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de arenito encontradas no campo POCO_CD_POCO_023172 são granulares e porosas.'

In [843]:
chain.run("Quais são as texturas das rochas de id basalto encontradas no poço POCO_CD_POCO_023172 ?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (basalt:lithostratigraphic_unit {_id: "basalto"})-[:located_in]->(well:well {_id: "POCO_CD_POCO_023172"})-[:located_in]->(field)
RETURN basalt.textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de id basalto encontradas no poço POCO_CD_POCO_023172 são granular e porfirítica.'

In [842]:
chain.run("Quais são as texturas das rochas de id basalto encontradas no poço POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_012120"})-[:located_in]->(field)-[:located_in]->(textura)
WHERE field._id = "basalto"
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de id basalto encontradas no poço POCO_CD_POCO_012120 são textura maciça e textura porfírica.'

In [611]:
chain.run("Quais são as texturas das rochas de anidrita encontradas no poço POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_012120"})-[:crosses]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
WHERE lithostratigraphic_unit._uri CONTAINS "anidrita"
RETURN DISTINCT textura._uri, textura._id, textura.rdfs_label[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de anidrita encontradas no poço POCO_CD_POCO_012120 são granulares e foliadas.'

### Pregunta No. 11

Neste casso é necessario dividir a pergunta por etapas para construir a pergunta final.

In [655]:
chain.run("Quais são os ID campos que atravessam as unidades litoestratigráficas ID formacao_296?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual)-[:crosses]->(:lithostratigraphic_unit {_id: "formacao_296"}) RETURN n._id;[0m
Full Context:
[32;1m[1;3m[{'n._id': 'POCO_CD_POCO_012983'}, {'n._id': 'POCO_CD_POCO_018470'}][0m

[1m> Finished chain.[0m


'Os campos que atravessam as unidades litoestratigráficas da formação ID formacao_296 são POCO_CD_POCO_012983 e POCO_CD_POCO_018470.'

In [617]:

chain.run("Quais são os ID campos que atravessam as unidades litoestratigráficas formacao_242?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual)-[:crosses]->(:lithostratigraphic_unit { _id: "formacao_242" }) RETURN n._id[0m
Full Context:
[32;1m[1;3m[{'n._id': 'POCO_CD_POCO_012120'}, {'n._id': 'POCO_CD_POCO_012097'}][0m

[1m> Finished chain.[0m


'Os ID campos que atravessam as unidades litoestratigráficas formacao_242 são POCO_CD_POCO_012120 e POCO_CD_POCO_012097.'

In [47]:
chain.run("Quais são os ID campos que atravessam as unidades litoestratigráficas formacao_254?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual)-[:crosses]->(:lithostratigraphic_unit { _id: "formacao_254" }) RETURN n._id[0m
Full Context:
[32;1m[1;3m[{'n._id': 'POCO_CD_POCO_012020'}][0m

[1m> Finished chain.[0m


'Os campos que atravessam as unidades litoestratigráficas formacao_254 são:\n- POCO_CD_POCO_012020'

In [46]:
chain.run("Quais são os ID dos poços que atravessam as unidades litoestratigráficas formacao_294?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:crosses]->(:lithostratigraphic_unit {_id: "formacao_294"}) RETURN w._id;[0m
Full Context:
[32;1m[1;3m[{'w._id': 'POCO_CD_POCO_012020'}, {'w._id': 'POCO_CD_POCO_012120'}, {'w._id': 'POCO_CD_POCO_012097'}][0m

[1m> Finished chain.[0m


'Os poços que atravessam as unidades litoestratigráficas formacao_294 são: POCO_CD_POCO_012020, POCO_CD_POCO_012120 e POCO_CD_POCO_012097.'

In [45]:
chain.run("Que é a estrutura ID TEFR_CD_TIPO_EST_FISICA_ROCHA_004?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:geological_structure {_id: "TEFR_CD_TIPO_EST_FISICA_ROCHA_004"}) RETURN n;[0m
Full Context:
[32;1m[1;3m[{'n': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#TEFR_CD_TIPO_EST_FISICA_ROCHA_004', '_id': 'TEFR_CD_TIPO_EST_FISICA_ROCHA_004'}}][0m

[1m> Finished chain.[0m


'A estrutura ID TEFR_CD_TIPO_EST_FISICA_ROCHA_004 é uma rocha de tipo físico.'

In [53]:
chain.run("Quais são os ID dos poços que atravessam as unidades litoestratigráficas formacao_294 e apresentam estrutura ID TEFR_CD_TIPO_EST_FISICA_ROCHA_004?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:crosses]->(l:lithostratigraphic_unit {_id: "formacao_294"})
MATCH (w)-[:located_in]->(:geological_structure {_id: "TEFR_CD_TIPO_EST_FISICA_ROCHA_004"})
RETURN w._id[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A informação solicitada não se encontra no grafo disponibilizado.'

### ✅ Pregunta No. 12 

In [682]:
chain.run("Qual é a localização do poço POCO_CD_POCO_024505?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_024505"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0373', '_id': 'CAMP_CD_CAMPO_0373'}}][0m

[1m> Finished chain.[0m


'O poço POCO_CD_POCO_024505 está localizado no campo CAMP_CD_CAMPO_0373.'

In [221]:
chain.run("Qual é a localização do poço POCO_CD_POCO_023172?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_023172"})-[:located_in]->(location)
RETURN location;[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_051', '_id': 'BASE_CD_BACIA_051'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#basin', 'rdfs_label': 'bacia', '_id': 'basin'}}][0m

[1m> Finished chain.[0m


'A localização do poço POCO_CD_POCO_023172 está na bacia identificada como BASE_CD_BACIA_051.'

In [339]:
chain.run("Qual é a localização do poço POCO_CD_POCO_006882?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_006882"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_116', '_id': 'BASE_CD_BACIA_116'}}][0m

[1m> Finished chain.[0m


'O poço POCO_CD_POCO_006882 está localizado na bacia identificada como BASE_CD_BACIA_116.'

In [340]:
chain.run("Qual é a localização do poço POCO_CD_POCO_011894?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well {_id: "POCO_CD_POCO_011894"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_316', '_id': 'BASE_CD_BACIA_316'}}][0m

[1m> Finished chain.[0m


'O poço POCO_CD_POCO_011894 está localizado na bacia identificada como BASE_CD_BACIA_316.'

In [341]:
chain.run("Qual é a localização do poço POCO_CD_POCO_006789?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_006789"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#basin', 'rdfs_label': 'bacia', '_id': 'basin'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_106', '_id': 'BASE_CD_BACIA_106'}}][0m

[1m> Finished chain.[0m


'O poço POCO_CD_POCO_006789 está localizado na bacia identificada como BASE_CD_BACIA_106.'

In [342]:
chain.run("Qual é a localização do poço POCO_CD_POCO_016933?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_016933"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_100', '_id': 'BASE_CD_BACIA_100'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#field', 'rdfs_label': 'campo', '_id': 'field'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0234', '_id': 'CAMP_CD_CAMPO_0234'}}][0m

[1m> Finished chain.[0m


'O poço POCO_CD_POCO_016933 está localizado no campo CAMP_CD_CAMPO_0234, que por sua vez está localizado na bacia BASE_CD_BACIA_100.'

In [343]:
chain.run("Qual é a localização do poço POCO_CD_POCO_023169?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_023169"})-[:located_in]->(location)
RETURN location;[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_051', '_id': 'BASE_CD_BACIA_051'}}][0m

[1m> Finished chain.[0m


'O poço POCO_CD_POCO_023169 está localizado na bacia identificada como BASE_CD_BACIA_051.'

### Pregunta No. 13

In [804]:
chain.run("Qual é o intervalo geologico da formação_102?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:owl_NamedIndividual {_id: "formação_102"})-[:has_age]->(intervalo:geological_time_interval)
RETURN intervalo[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'O intervalo geológico da formação_102 é do período Cretáceo ao período Paleogeno.'

In [844]:
chain.run("Qual é formação ou unidade litoestratigrafica que tem intervalo geologico id Paleogeno?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:geological_time_interval {_id: "Paleogeno"})<-[:has_age]-(:owl_NamedIndividual)-[:part_of]->(u:lithostratigraphic_unit)
RETURN u[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A formação ou unidade litoestratigráfica que possui intervalo geológico do Paleógeno é a Formação X.'

In [810]:
chain.run("Quais são os poços localizados na bacia id BASE_CD_BACIA_116 atravessa unidades litoestratigráficas e possui intervalo geologico id Paleocene?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})-[:located_in]->(l:lithostratigraphic_unit)-[:crosses]->(:geological_time_interval {_id: "Paleocene"})
RETURN w[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Com base nas informações fornecidas no grafo, os poços localizados na bacia com o identificador BASE_CD_BACIA_116, que atravessam unidades litoestratigráficas e possuem intervalo geológico do Paleoceno são:\n- Poço com identificador id_poco_1\n- Poço com identificador id_poco_2'

In [777]:
chain.run("Quais as entidades que tem intervalo geologico Mesozoico?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (e:owl_NamedIndividual)-[:has_age]->(:Albian_quality)
RETURN e;[0m
Full Context:
[32;1m[1;3m[{'e': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#grupo_000', '_id': 'grupo_000'}}, {'e': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#SD_000', '_id': 'SD_000'}}][0m

[1m> Finished chain.[0m


'As entidades que têm intervalo geológico Mesozoico são o grupo_000 e o SD_000.'

In [781]:
chain.run("Quais são os poços localizados na bacia id BASE_CD_BACIA_281 e que tem intervalo geologico id Mesozoico?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_281"})-[:located_in]->(:geological_time_interval {_id: "Mesozoico"})
RETURN well[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Com base nas informações fornecidas no grafo, a query Cypher para encontrar os poços localizados na bacia com o ID BASE_CD_BACIA_281 e que possuem intervalo geológico com o ID Mesozoico seria:\n\nMATCH (p:Poco)-[:LOCALIZADO_EM]->(b:Bacia {id: "BASE_CD_BACIA_281"})\nMATCH (p)-[:POSSUI]->(i:IntervaloGeologico {id: "Mesozoico"})\nRETURN p\n\nEsta query irá retornar os poços que estão localizados na bacia com o ID BASE_CD_BACIA_281 e que possuem o intervalo geológico com o ID Mesozoico.'

### ✅ **Pregunta No. 14**

In [713]:
chain.run("Quais são os poços localizados no campo _id: CAMP_CD_CAMPO_0065?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(field:field {_id: "CAMP_CD_CAMPO_0065"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_020490', '_id': 'POCO_CD_POCO_020490'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_021725', '_id': 'POCO_CD_POCO_021725'}}][0m

[1m> Finished chain.[0m


'No campo CAMP_CD_CAMPO_0065, estão localizados os seguintes poços:\n- POCO_CD_POCO_020490\n- POCO_CD_POCO_021725'

In [714]:
chain.run("Quais são os poços localizados no campo _id: CAMP_CD_CAMPO_0373?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0373"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}}][0m

[1m> Finished chain.[0m


'Os poços localizados no campo com o ID CAMP_CD_CAMPO_0373 são:\n- POCO_CD_POCO_024505'

In [741]:
chain.run("Qual é o poço localizado no campo “CAMP_CD_CAMPO_0373” e também unidade litoestratigafica constituída por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0373"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit;[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}, 'unit': {'_uri': 'http://www.semanti

'O poço localizado no campo "CAMP_CD_CAMPO_0373" e que também está associado à unidade litoestratigráfica constituída pelo owl_Class id oil é o POCO_CD_POCO_024505. Este poço está relacionado com as seguintes unidades litoestratigráficas: formacao_027, formacao_056, formacao_110, formacao_319 e formacao_200.'

In [743]:
chain.run("Qual é o poço localizado no campo “CAMP_CD_CAMPO_0970” e também unidade litoestratigafica constituída por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0970"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_012040', '_id': 'POCO_CD_POCO_012040'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_012040', '_id': 'POCO_CD_POCO_012040'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_012040', '_id': 'POCO_CD_POCO_012040'}, 'unit': {'_uri': 'http://www.semantic

'O poço localizado no campo "CAMP_CD_CAMPO_0970" e que também está associado à unidade litoestratigráfica constituída pelo owl_Class id oil é o poço de código POCO_CD_POCO_012040. Este poço está relacionado com as seguintes unidades litoestratigráficas: formacao_027, formacao_056, formacao_110, formacao_319 e formacao_200.'

In [744]:
chain.run("Qual é o poço localizado no campo “CAMP_CD_CAMPO_0773” e também unidade litoestratigafica constituída por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0773"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006960', '_id': 'POCO_CD_POCO_006960'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006960', '_id': 'POCO_CD_POCO_006960'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006960', '_id': 'POCO_CD_POCO_006960'}, 'unit': {'_uri': 'http://www.semantic

'O poço localizado no campo "CAMP_CD_CAMPO_0773" e que também está associado à unidade litoestratigráfica constituída pelo owl_Class id oil é o poço com o identificador POCO_CD_POCO_006960.'

In [747]:
chain.run("Qual é o poço localizado no campo “CAMP_CD_CAMPO_0682” e também unidade litoestratigafica constituída por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0682"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024918', '_id': 'POCO_CD_POCO_024918'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024918', '_id': 'POCO_CD_POCO_024918'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024918', '_id': 'POCO_CD_POCO_024918'}, 'unit': {'_uri': 'http://www.semantic

'O poço localizado no campo "CAMP_CD_CAMPO_0682" e que também está associado à unidade litoestratigráfica constituída pelo owl_Class id oil é o poço de código POCO_CD_POCO_024918. Este poço está relacionado com as seguintes unidades litoestratigráficas: formacao_027, formacao_056, formacao_110, formacao_319 e formacao_200.'

In [681]:
chain.run("Que é o fludio geologico o id oil?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:geological_structure)
WHERE n._id = "oil"
RETURN n;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'O fluido geológico com o ID "oil" é um tipo de fluido presente no subsolo que possui propriedades específicas relacionadas à extração de petróleo. Esse fluido pode ser encontrado em reservatórios geológicos e é de extrema importância para a indústria petrolífera.'

### ✅ **Pregunta No. 15.**

In [24]:
chain.run("Quais formações possuem carstes?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:owl_NamedIndividual)-[:part_of]->(u:lithostratigraphic_unit)
WHERE (l)-[:rdf_type]->(:owl_Class {rdfs_label: "Carste"})
RETURN u;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Carstes são formações geológicas que se desenvolvem em terrenos calcários, resultantes da dissolução da rocha por águas ácidas. Essas formações são caracterizadas por apresentarem relevos cársticos, como dolinas, cavernas, lapiaz e grutas. Dessa forma, as formações geológicas que possuem carstes são aquelas compostas por rochas calcárias, que são mais suscetíveis à ação da água ácida, resultando na formação dessas características peculiares.'

In [750]:
chain.run("Qual é a formação ou unidade litoestrategrafica possue carstes?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:owl_NamedIndividual)-[:part_of]->(u:lithostratigraphic_unit)
WHERE (l)-[:located_in]->(:field)
RETURN u;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A formação ou unidade litoestratigráfica que possui carstes é a Formação Calcária.'

### ✅ Pregunta No. 16

In [286]:
chain.run("Qual a idade geológica da litologia arenito do campo identificado CAMP_CD_CAMPO_0065?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (lithostratigraphic_unit:lithostratigraphic_unit {_id: "CAMP_CD_CAMPO_0065"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A idade geológica da litologia arenito do campo identificado como CAMP_CD_CAMPO_0065 é do período Cretáceo.'

In [846]:
chain.run("Qual é a idade geológica do basalto localizado no campo CAMP_CD_CAMPO_0065?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin)-[:located_in]->(f:field)-[:located_in]->(w:well)-[:crosses]->(l:lithostratigraphic_unit)-[:has_age]->(a:owl_NamedIndividual)
WHERE b._id = "CAMP_CD_CAMPO_0065"
RETURN a._id;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A idade geológica do basalto localizado no campo CAMP_CD_CAMPO_0065 é de 1,2 milhões de anos, conforme a propriedade "idade_geologica" associada ao relacionamento "LOCALIZADO_EM" entre o basalto e o campo.'

In [292]:
chain.run("Qual a idade geologica do earth material named areia que está localizada no campo CAMP_CD_CAMPO_0065?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual {rdfs_label: "areia"})-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0065"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A idade geológica do material terrestre chamado areia, localizado no campo CAMP_CD_CAMPO_0065, é do período Quaternário.'

# 🕵️‍♀️ **3. Knowledge graph agent**

In [85]:
from langchain.agents import create_structured_chat_agent, create_openai_functions_agent, Tool, AgentExecutor, AgentType, create_tool_calling_agent, create_react_agent

tools = [
    Tool(
        name="Embeddings",
        func=vector_qa.invoke,
        description="""Useful when you need to answer questions about basins embeddings.
        Not useful for counting the number of tasks.
        Use full question as input.
        """,
    ),
    Tool(
        name="Graph",
        func=chain.invoke,
        description="""Useful when you need to answer questions about movies or person.
        Also useful for any sort of aggregation like counting the number of tasks, etc.
        Use full question as input.
        """,
    ),
]

In [86]:
from langchain.prompts import PromptTemplate
from langchain_core.prompts import ChatPromptTemplate

# Define the prompt template with placeholders
prompt = PromptTemplate(
    input_variables=["agent_scratchpad", "tools", "tool_names", "chat_history", "input"],
    template="""
    You are a knowledgeable assistant. You have access to the following tools:

    TOOLS:
    ------
    Assistant has access to the following tools:
    {tools}
    To use a tool, please use the following format:
    ```
    Thought: Do I need to use a tool? Yes
    Action: the action to take, should be one of [{tool_names}]
    Action Input: the input to the action
    Observation: the result of the action
    ```
    
    When you have a response to say to the Human, or if you do not need to use a tool, you MUST use the format:
    ```
    Thought: Do I need to use a tool? No
    Final Answer: [your response here]
    ```

    Begin!

    Previous conversation history: {chat_history}

    New input: {input}
    {agent_scratchpad}
    """
)


In [131]:
from langchain.agents import AgentExecutor, create_tool_calling_agent
from langchain_core.prompts import ChatPromptTemplate

# Definir el prompt con todos los marcadores de posición requeridos
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are a helpful assistant with access to several tools."),
        ("system", "Available tools: {tool_names}"),
        ("system", "Tools details: {tools}"),
        ("system", "Chat history: {chat_history}"),
        ("human", "{input}"),
        ("system", "{agent_scratchpad}"),
    ]
)


In [87]:
expected_variables = ["tools", "tool_names", "chat_history", "agent_scratchpad", "input"]
missing_vars = [var for var in expected_variables if var not in prompt.input_variables]

if missing_vars:
    print(f"Missing variables in prompt: {missing_vars}")


In [88]:
# Create the agent
agent = create_react_agent( llm_petrobras, tools, prompt)
# Create an executor for the agent
agent_executor = AgentExecutor(agent=agent, tools=tools)

In [89]:
query = "Quais sao os id da bacia BASE_CD_BACIA_030?"
response = agent_executor.invoke({"input": query})
print(response)


KeyError: "Input to PromptTemplate is missing variables {'chat_history'}.  Expected: ['agent_scratchpad', 'chat_history', 'input'] Received: ['input', 'intermediate_steps', 'agent_scratchpad']"

### Outra abordagem

In [90]:
from pydantic import BaseModel
from langchain.tools.base import StructuredTool
from langchain.agents.agent_toolkits import create_conversational_retrieval_agent

# Define el esquema de argumentos para la herramienta Graph
class GraphArgs(BaseModel):
    bacia_URI: str

class EmbeddingsArgs(BaseModel):
    query: str

# Suponiendo que `graph_tool` es una función que deseas usar como herramienta
graph_tool = StructuredTool(
    name="Graph",
    func=chain.invoke,  # Aquí la función que se utilizará
    description="Useful for retrieving information about the graph based on multiple inputs.",
    args_schema=GraphArgs
)

embeddings_tool = StructuredTool(
    name="Embeddings",
    func=vector_qa.invoke,  # Aquí la función que se utilizará
    description="Useful when you need to answer questions about embeddings.",
    args_schema=EmbeddingsArgs
)

tools = [graph_tool, embeddings_tool]

In [91]:
from langchain.agents.agent_toolkits import create_conversational_retrieval_agent
agent_executor = create_conversational_retrieval_agent(llm_petrobras, tools, verbose=True)

result = agent_executor.invoke({"input": "Quais sao os poços localizados na bacia BASE_CD_BACIA_030?"})
print(result)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `{'bacia_URI': 'BASE_CD_BACIA_030'}`


[0m

TypeError: invoke() missing 1 required positional argument: 'input'

# 🔍 Testing Agent: Query's Using miniKGraph

In [163]:
response = agent_executor.invoke({"input": "Quais sao os id dos poços localizados na bacia BASE_CD_BACIA_030?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `{'bacia_name': 'BASE_CD_BACIA_030'}`


[0m

TypeError: invoke() missing 1 required positional argument: 'input'

In [None]:
response = agent_executor.invoke({"input": "Quantos sao os poços localizados na bacia BASE_CD_BACIA_030?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Quantos sao os campos que estao localizados na bacia BASE_CD_BACIA_030?"})
print(response)

### **✔ Perguntas single-hop sem necessidade de agregação de informações (um para um)**
### ✅ **Pregunta No. 1**

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia está localizado o campo ÁREA DO BAS-64?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia está localizado o campo de URI CAMP_CD_CAMPO_0572?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia está localizado o campo de URI CAMP_CD_CAMPO_0888?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia está localizado o campo Japiim?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia está localizado o campo de URI CAMP_CD_CAMPO_0131?"})
print(response)

### ✅ **Pregunta No. 2**

# 🔍 Query's Using PetroKGraph

In [130]:
response = agent_executor.invoke({"input": "Quais sao os id dos poços localizados na bacia BASE_CD_BACIA_100?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all well IDs in basin BASE_CD_BACIA_100`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: 'BASE_CD_BACIA_100'}) RETURN w._id;[0m
Full Context:
[32;1m[1;3m[{'w._id': 'POCO_CD_POCO_017478'}, {'w._id': 'POCO_CD_POCO_016933'}, {'w._id': 'POCO_CD_POCO_016511'}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all well IDs in basin BASE_CD_BACIA_100', 'result': 'Os IDs dos poços na bacia BASE_CD_BACIA_100 são:\n- POCO_CD_POCO_017478\n- POCO_CD_POCO_016933\n- POCO_CD_POCO_016511'}[0m[32;1m[1;3mOs IDs dos poços localizados na bacia BASE_CD_BACIA_100 são:
- POCO_CD_POCO_017478
- POCO_CD_POCO_016933
- POCO_CD_POCO_016511[0m

[1m> Finished chain.[0m
{'input': 'Quais sao os id dos poços localizados na bacia BASE_CD_BACIA_100?', 'output': 'Os IDs dos poços localizados na bacia BASE_CD_BACIA_100 são:\n- POC

In [134]:
response = agent_executor.invoke({"input": "Quais são os id poços localizados na bacia com id BASE_CD_BACIA_116?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all wells in basin BASE_CD_BACIA_116`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(basin:basin)
WHERE basin._id = "BASE_CD_BACIA_116"
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_009032', '_id': 'POCO_CD_POCO_009032'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006882', '_id': 'POCO_CD_POCO_006882'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_007140', '_id': 'POCO_CD_POCO_007140'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_010831', '_id': 'POCO_CD_POCO_010831'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all wells in basin B

In [135]:
response = agent_executor.invoke({"input": "Quantos sao os poços localizados na bacia BASE_CD_BACIA_080?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `count wells in basin BASE_CD_BACIA_080`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(b:basin)
WHERE b._id = 'BASE_CD_BACIA_080'
RETURN COUNT(w) as well_count;[0m
Full Context:
[32;1m[1;3m[{'well_count': 1}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'count wells in basin BASE_CD_BACIA_080', 'result': 'O número de poços na bacia BASE_CD_BACIA_080 é 1.'}[0m[32;1m[1;3mHá 1 poço localizado na bacia BASE_CD_BACIA_080.[0m

[1m> Finished chain.[0m
{'input': 'Quantos sao os poços localizados na bacia BASE_CD_BACIA_080?', 'output': 'Há 1 poço localizado na bacia BASE_CD_BACIA_080.'}


In [142]:
response = agent_executor.invoke({"input": "Quantos sao os campos que estao localizados na bacia BASE_CD_BACIA_030?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quantos campos estao localizados na bacia BASE_CD_BACIA_281?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_281"})
RETURN COUNT(field) as total_campos;[0m
Full Context:
[32;1m[1;3m[{'total_campos': 15}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quantos campos estao localizados na bacia BASE_CD_BACIA_281?', 'result': 'Na bacia BASE_CD_BACIA_281 estão localizados 3 campos.'}[0m[32;1m[1;3mNa bacia BASE_CD_BACIA_281 estão localizados 3 campos.[0m

[1m> Finished chain.[0m
{'input': 'Quantos sao os campos que estao localizados na bacia BASE_CD_BACIA_281?', 'output': 'Na bacia BASE_CD_BACIA_281 estão localizados 3 campos.'}


### ✅ **Pregunta No. 1**

In [69]:
response = agent_executor.invoke({"input": "Quais poços localizados na bacia BASE_CD_BACIA_116?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quais poços estão localizados na bacia BASE_CD_BACIA_116?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_009032', '_id': 'POCO_CD_POCO_009032'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006882', '_id': 'POCO_CD_POCO_006882'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_007140', '_id': 'POCO_CD_POCO_007140'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_010831', '_id': 'POCO_CD_POCO_010831'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quais poços estão localizados na bacia BASE

### ✅ **Pregunta No. 2**

In [70]:
response = agent_executor.invoke({"input": "Quais sao os campos que estao localizados na bacia identificada BASE_CD_BACIA_116?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `campos localizados na bacia BASE_CD_BACIA_116`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})
RETURN field;[0m
Full Context:
[32;1m[1;3m[{'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0773', '_id': 'CAMP_CD_CAMPO_0773'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0519', '_id': 'CAMP_CD_CAMPO_0519'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0536', '_id': 'CAMP_CD_CAMPO_0536'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0951', '_id': 'CAMP_CD_CAMPO_0951'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CA

In [131]:
response = agent_executor.invoke({"input": "Quais os campos que estao localizados na bacia BASE_CD_BACIA_281?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `campos na bacia BASE_CD_BACIA_281`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_281"})
RETURN f[0m
Full Context:
[32;1m[1;3m[{'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0065', '_id': 'CAMP_CD_CAMPO_0065'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0523', '_id': 'CAMP_CD_CAMPO_0523'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0003', '_id': 'CAMP_CD_CAMPO_0003'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0734', '_id': 'CAMP_CD_CAMPO_0734'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0682', '_id': 'CAMP_CD_CAMPO_

## ✅ **Pregunta No. 3**

In [133]:
response = agent_executor.invoke({"input": "Quantos poços estão localizados no campo CAMP_CD_CAMPO_0970?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quantos poços estão localizados no campo CAMP_CD_CAMPO_0970?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field { _id: "CAMP_CD_CAMPO_0970" })
RETURN COUNT(well) as total_wells;[0m
Full Context:
[32;1m[1;3m[{'total_wells': 1}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quantos poços estão localizados no campo CAMP_CD_CAMPO_0970?', 'result': 'No campo CAMP_CD_CAMPO_0970 está localizado 1 poço.'}[0m[32;1m[1;3mNo campo CAMP_CD_CAMPO_0970 está localizado 1 poço.[0m

[1m> Finished chain.[0m
{'input': 'Quantos poços estão localizados no campo CAMP_CD_CAMPO_0970?', 'output': 'No campo CAMP_CD_CAMPO_0970 está localizado 1 poço.'}


In [139]:
response = agent_executor.invoke({"input": "Quantos poços estão localizados no campo CAMP_CD_CAMPO_0352?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quantos poços estão localizados no campo CAMP_CD_CAMPO_0352?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field { _id: "CAMP_CD_CAMPO_0352" })
RETURN COUNT(well) as total_wells;[0m
Full Context:
[32;1m[1;3m[{'total_wells': 1}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quantos poços estão localizados no campo CAMP_CD_CAMPO_0352?', 'result': 'No campo CAMP_CD_CAMPO_0352 está localizado 1 poço.'}[0m[32;1m[1;3mNo campo CAMP_CD_CAMPO_0352 está localizado 1 poço.[0m

[1m> Finished chain.[0m
{'input': 'Quantos poços estão localizados no campo CAMP_CD_CAMPO_0352?', 'output': 'No campo CAMP_CD_CAMPO_0352 está localizado 1 poço.'}


## ✅ **Pregunta No. 4**

In [145]:
response = agent_executor.invoke({"input": "Quais são os poços localizados no campo CAMP_CD_CAMPO_0065?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all wells in field CAMP_CD_CAMPO_0065`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0065"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_020490', '_id': 'POCO_CD_POCO_020490'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_021725', '_id': 'POCO_CD_POCO_021725'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all wells in field CAMP_CD_CAMPO_0065', 'result': 'Com base nas informações fornecidas, os poços no campo CAMP_CD_CAMPO_0065 são:\n- POCO_CD_POCO_020490\n- POCO_CD_POCO_021725'}[0m[32;1m[1;3mOs poços localizados no campo CAMP_CD_CAMPO_0065 são:
1. POCO_CD_POCO_020490
2. POCO_CD_POCO_021725[0m

[1m> Finished chain.

In [150]:
response = agent_executor.invoke({"input": "Quais são os poços localizados no campo CAMP_CD_CAMPO_0352?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all wells in field CAMP_CD_CAMPO_0352`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0352"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_018470', '_id': 'POCO_CD_POCO_018470'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all wells in field CAMP_CD_CAMPO_0352', 'result': "MATCH (f:Field {id: 'CAMP_CD_CAMPO_0352'})-[:BELONGS_TO]->(w:Well)\nRETURN w.id, w.name, w.type, w.status, w.depth\nORDER BY w.id"}[0m[32;1m[1;3mOs poços localizados no campo CAMP_CD_CAMPO_0352 são:

1. Poço ID: 001, Nome: Poço 001, Tipo: Tipo A, Status: Ativo, Profundidade: 2000m
2. Poço ID: 002, Nome: Poço 002, Tipo: Tipo B, Status: Inativo, Profundidade: 1800m
3. Poço ID: 003, Nome: Poço 003, Tipo: Tipo

## ✅ **Pregunta No. 5**

In [143]:
response = agent_executor.invoke({"input": "Qual idade geológica da Formação identificada pelo ID formacao_110?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Qual idade geológica da Formação identificada pelo ID formacao_110?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit {_id: "formacao_110"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Qual idade geológica da Formação identificada pelo ID formacao_110?', 'result': 'A idade geológica da Formação identificada pelo ID formacao_110 é Cretáceo.'}[0m[32;1m[1;3mA idade geológica da Formação identificada pelo ID formacao_110 é Cretáceo.[0m

[1m> Finished chain.[0m
{'input': 'Qual idade geológica da Formação identificada pelo ID formacao_110?', 'output': 'A idade geológica da Formação identificada pelo ID formacao_110 é Cretáceo.'}


In [144]:
response = agent_executor.invoke({"input": "Qual idade geológica da Formação identificada pelo ID grupo_000?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Qual a idade geológica da Formação identificada pelo ID grupo_000?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit {_id: "grupo_000"})-[:has_age]->(a)
RETURN a[0m
Full Context:
[32;1m[1;3m[{'a': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#Albian_quality_grupo_000', '_id': 'Albian_quality_grupo_000'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Qual a idade geológica da Formação identificada pelo ID grupo_000?', 'result': 'A idade geológica da Formação identificada pelo ID grupo_000 é Albian.'}[0m[32;1m[1;3mA idade geológica da Formação identificada pelo ID grupo_000 é Albian.[0m

[1m> Finished chain.[0m
{'input': 'Qual idade geológica da Formação identificada pelo ID grupo_000?', 'output': 'A idade geológica da Formação identificada pelo ID grupo_000 é Albian.'}


In [145]:
response = agent_executor.invoke({"input": "Qual idade geológica da Formação identificada pelo ID formacao_295?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Qual a idade geológica da Formação identificada pelo ID formacao_295?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit {_id: "formacao_295"})-[:has_age]->(a)
RETURN a[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Qual a idade geológica da Formação identificada pelo ID formacao_295?', 'result': 'A idade geológica da Formação identificada pelo ID formacao_295 é Cretáceo.'}[0m[32;1m[1;3mA idade geológica da Formação identificada pelo ID formacao_295 é Cretáceo.[0m

[1m> Finished chain.[0m
{'input': 'Qual idade geológica da Formação identificada pelo ID formacao_295?', 'output': 'A idade geológica da Formação identificada pelo ID formacao_295 é Cretáceo.'}


## ✅ **Pregunta No. 6**

In [155]:
response = agent_executor.invoke({"input": "Qual é o material terrestre e a unidade litoestratigráfica que atravessa o poço id POCO_CD_POCO_024505?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `What is the lithostratigraphic unit and terrestrial material that crosses well POCO_CD_POCO_024505?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: 'POCO_CD_POCO_024505'})-[:crosses]->(lithostratigraphic_unit:lithostratigraphic_unit)
RETURN lithostratigraphic_unit[0m
Full Context:
[32;1m[1;3m[{'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'What is the lithostratigraphic unit and terrestrial material that crosses well POCO_CD_POCO_024505?', 'result': 'A unidade litoestratigráfica é a Formação 110. Não foi possível encontrar informações sobre o material terrestre que atravessa o poço POCO_CD_POCO_024505 no grafo dado.'}[0m[32;1m[1;3mA unidade litoestratigráfica que 

##  **Pregunta No. 7**

In [157]:
response = agent_executor.invoke({"input": "Qual é o id da formação que atravessa o poço com identificador POCO_CD_POCO_024505 e que é constituída por id sandstone?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `formation atravessa poço POCO_CD_POCO_024505 e é constituída por sandstone`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit)-[:crosses]->(:well {_id: "POCO_CD_POCO_024505"}) 
WHERE f._id = "sandstone"
RETURN f[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'formation atravessa poço POCO_CD_POCO_024505 e é constituída por sandstone', 'result': 'A formação que atravessa o poço POCO_CD_POCO_024505 e é constituída por sandstone é a formação "Formação X". A formação "Formação X" possui uma relação de atravessar com o poço POCO_CD_POCO_024505 e possui a propriedade de ser constituída por sandstone. Não foram fornecidas informações adicionais no grafo.'}[0m[32;1m[1;3mA formação que atravessa o poço com identificador POCO_CD_POCO_024505 e que é constituída por sandstone é a formação "Formação

## **Pregunta No. 8**

In [158]:
response = agent_executor.invoke({"input": "Quais unidades litoestratigraficas ou formações atravessam o poço _id:POCO_CD_POCO_024505  e são constituídas pelo id oil?"})
print(response)




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quais unidades litoestratigraficas ou formações atravessam o poço _id:POCO_CD_POCO_024505 e são constituídas pelo id oil?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (poco:well {_id: "POCO_CD_POCO_024505"})-[:crosses]->(unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_NamedIndividual {_id: "oil"})
RETURN unit[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quais unidades litoestratigraficas ou formações atravessam o poço _id:POCO_CD_POCO_024505 e são constituídas pelo id oil?', 'result': 'Não foi possível encontrar a informação requerida no grafo dado.'}[0m[32;1m[1;3mDesculpe, não foi possível encontrar a informação sobre as unidades litoestratigráficas ou formações que atravessam o poço POCO_CD_POCO_024505 e são constituídas pelo id oil. Se precisar de mais alguma informação ou assistência, por favo

# ✏️📚 **Conclusão**

Grafos de conhecimento são estruturas de dados que combinam dados estruturados e não estruturados de maneira interconectada, tornando-se uma excelente opção para alimentar aplicações RAG (Retrieval-Augmented Generation). Eles melhoram a precisão, contextualização e relevância das respostas geradas, aproveitando ao máximo as capacidades de recuperação e geração de informações.

### **Vantagens dos Grafos de Conhecimento:**

### 1. Relações Interconectadas:

- Grafos de conhecimento modelam relações complexas entre entidades (como pessoas, peliculas, no caso do grafo de Movies; e baçias, campos e poços, no caso do PetroKGraph), o que permite uma compreensão mais profunda e contextualizada dos dados.
- São ideais para representar conhecimento que envolve múltiplas relações e hierarquias.

### 2. Integração de Dados Estruturados e Não Estruturados:

- Permitem a integração de dados estruturados (como tabelas e bancos de dados relacionais) e dados não estruturados (como texto, imagens, e vídeos) em uma única estrutura coerente.
- Dados não estruturados podem ser anotados e vinculados a entidades no grafo, facilitando a recuperação contextual.

### 3. Consultas Flexíveis:

- Usando linguagens de consulta como Cypher, é possível executar consultas complexas que exploram as relações e conexões entre diferentes entidades.
- Isso possibilita a recuperação precisa de informações relevantes, mesmo em cenários com dados altamente interconectados.

### 4. Atualização Dinâmica e Enriquecimento de Dados:

- Grafos de conhecimento podem ser continuamente atualizados e enriquecidos com novos dados, mantendo a base de conhecimento atualizada.
- Facilitam a incorporação de novas fontes de dados, melhorando a abrangência e a qualidade das respostas.