# RAG over MiniKGraph no Neo4j 

This Jupyter Notebook use the Neo4j Graph integration to interact with the Neo4j database and the CypherQAChain to query the database. Using the CypherQAChain, we can ask questions about the PetroKGraph database and get answers in natural language. 

The PetroKGraph is a knowledge graph that contains information about the oil and gas industry in Brazil. It was created using the Neo4j database and the Cypher query language. The graph contains nodes representing entities such as wells, fields, companies, and reservoirs, and relationships between these entities.

In this notebook, we will use the CypherQAChain to query the PetroKGraph database and get answers to questions about the oil and gas industry in Brazil. We will ask questions about the production of oil and gas in Brazil, the fields and reservoirs where oil and gas are extracted, and the geological characteristics of the reservoirs.

### Setup

To begin, we need to import the necessary modules and set up the environment variables.

#### Install LangChain and Neo4j

```bash
!pip install openai
!pip install langchain
!pip install neo4j
!pip install transformers
!pip install sentencepiece
pip install langchain-huggingface
!pip install langchainhub
!pip install sentence_transformers
!pip install networkx node2vec rdflib
```

In [1]:
import os
import torch
import sentence_transformers
import networkx as nx

from langchain.chains import GraphCypherQAChain
from langchain_community.graphs import Neo4jGraph
from langchain.chat_models.openai import ChatOpenAI

from langchain.prompts.prompt import PromptTemplate

from langchain.vectorstores.neo4j_vector import Neo4jVector
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain_openai import AzureChatOpenAI, AzureOpenAIEmbeddings
from langchain_huggingface import HuggingFaceEmbeddings


  from tqdm.autonotebook import tqdm, trange


In [2]:
from langchain_openai import AzureChatOpenAI
from httpx import Client
from configparser import ConfigParser, ExtendedInterpolation

config = ConfigParser(interpolation=ExtendedInterpolation())
config.read('config-v1.x.ini', 'UTF-8')

CERTIFICATE_PATH = 'petrobras-ca-root.pem'

OPENAI_API_VERSION = '2024-03-01-preview'
OPENAI_BASE_URL = 'https://apit.petrobras.com.br/ia/openai/v1/openai-azure/openai/deployments'
EMBEDDINGS_MODEL= config['OPENAI']['EMBEDDINGS_MODEL']


# Exemplo de uso do GPT
DEPLOYMENT_NAME = 'gpt-4o-petrobras'
llm_petrobras = AzureChatOpenAI(
    model=DEPLOYMENT_NAME,
    openai_api_version=OPENAI_API_VERSION,
    openai_api_key=config['OPENAI']['OPENAI_API_KEY'],
    base_url=f'{OPENAI_BASE_URL}/{DEPLOYMENT_NAME}',
    http_client=Client(verify=CERTIFICATE_PATH)
)

EMBEDDINGS_DEPLOYMENT_NAME='text-embedding-petrobras'
embeddings = AzureOpenAIEmbeddings(
    model=EMBEDDINGS_DEPLOYMENT_NAME,
    openai_api_version=OPENAI_API_VERSION,
    openai_api_key=config['OPENAI']['OPENAI_API_KEY'],
    base_url=f'{OPENAI_BASE_URL}/{EMBEDDINGS_DEPLOYMENT_NAME}',
    http_client=Client(verify=CERTIFICATE_PATH)
)

print(EMBEDDINGS_MODEL)

text-embedding-petrobras


In [3]:
NEO4J_URI = 'neo4j://atn1b03n13:7687' #nodo donde esta rodando neo4j
NEO4J_USERNAME = 'neo4j'
NEO4J_PASSWORD = 'Diripar8$'

## Vector similarity search in an RAG application

In [4]:
graph = Neo4jGraph(url=NEO4J_URI, username=NEO4J_USERNAME, password=NEO4J_PASSWORD)

### **Create a vector index**

In [11]:
graph.query("""
  CREATE VECTOR INDEX basins IF NOT EXISTS
  FOR (n:basin)
  ON (n.rdfs_label) 
  OPTIONS { indexConfig: {
    `vector.dimensions`: 256,
    `vector.similarity_function`: 'cosine'
  }}"""
)

[]

### **Show Vector index**

In [24]:
graph.query("""
  SHOW VECTOR INDEXES YIELD name, type, entityType, labelsOrTypes, properties
 """ 
)

[{'name': 'basins',
  'type': 'VECTOR',
  'entityType': 'NODE',
  'labelsOrTypes': ['basin'],
  'properties': ['embedding']},
 {'name': 'lithostratigraphic_units',
  'type': 'VECTOR',
  'entityType': 'NODE',
  'labelsOrTypes': ['lithostratigraphic_unit'],
  'properties': ['embedding']}]

In [23]:
# Para eliminar un indice
graph.query("""
  DROP INDEX fields 
 """ 
)

[]

In [29]:
#Se crea el embedding vector index para el nodo asociado 
vector_index = Neo4jVector.from_existing_graph(
    embeddings ,
    url=NEO4J_URI,
    username=NEO4J_USERNAME,
    password=NEO4J_PASSWORD,
    index_name='lithostratigraphic_units',
    node_label="lithostratigraphic_unit",
    text_node_properties=['_id','_uri', 'rdfs_label'],
    embedding_node_property='embedding',
)

### **Embedding**

In [6]:
import os
from neo4j import GraphDatabase, Result

uri = NEO4J_URI
username = NEO4J_USERNAME
password = NEO4J_PASSWORD

# Crear el driver de conexi√≥n
driver = GraphDatabase.driver(uri, auth=(username, password))

driver.verify_connectivity()


In [16]:
import pandas as pd

def execute_query(driver):
    with driver.session() as session:
        result = session.run("""
            MATCH (n:lithostratigraphic_unit)
            WHERE n.rdfs_label IS NOT NULL
            RETURN n._id AS ID, n.rdfs_label AS Field
            LIMIT 10
                        
        """)
        # Convert the result to a DataFrame if needed
        data = [record.data() for record in result]
        return pd.DataFrame(data)

# Execute the query and get the result
kgraph = execute_query(driver)
print((kgraph))

             ID                  Field
0  formacao_125        Fm. √Ågua Grande
1  formacao_343  Forma√ß√£o Taipus-Mirim
2  formacao_122           Fm. Rio Doce
3     grupo_073          Gr. Trombetas
4  formacao_256          Fm. Caravelas
5  formacao_038              Fm. Erer√™
6    membro_027            Mb. Cazumba
7     grupo_034              Gr. Purus
8  formacao_171           Fm. Algod√µes
9  formacao_086           Fm. Nhamund√°


In [42]:
def check_index_exists(index_name):
    try:
        with driver.session() as session:
            result = session.run("SHOW INDEXES")
            indexes = result.data()
            
            for index in indexes:
                
                if index_name in index["name"]:
                    print("Index exists")
                    return True
            return False
    except Exception as e:
        print("‚ùå Failed to check if index exists:", str(e))
        return False

def get_existing_vector_index(index_name):
    try:
        print(f"Retrieving existing index '{index_name}'...")
        vector_index = Neo4jVector.from_existing_index(
            embeddings,
            url=NEO4J_URI,
            username=NEO4J_USERNAME,
            password=NEO4J_PASSWORD,
            index_name=index_name,
            text_node_property='rdfs_label',
        )
        print(f"‚úÖ Successfully retrieved the existing index '{index_name}'.")
        print(f"‚òùÔ∏è Index Name: {vector_index.index_name}")
        print(f"‚òùÔ∏è Node Label: {vector_index.node_label}")
        print(f"‚òùÔ∏è Embedding_node_property: {vector_index.embedding_node_property}")
        print(f"‚òùÔ∏è Text_node_property: {vector_index.text_node_property}")
        return vector_index
    except Exception as e:
        print("Failed to retrieve existing vector index:", str(e))
        return None
    
def create_vector_index():
    try:
        print("Creating vector index... üïëüïùüïí")
        vector_index = Neo4jVector.from_existing_graph(
                       embeddings ,
                       url=NEO4J_URI,
                       username=NEO4J_USERNAME,
                       password=NEO4J_PASSWORD,
                       index_name= index_name,
                       node_label="field",
                       text_node_properties=['_id','_uri', 'rdfs_label'],
                       embedding_node_property='embedding' )
        print("‚úÖ Vector index created successfully! ‚úÖ")

        return vector_index
    except Exception as e:
        print("Failed to create vector index:", str(e))
        return None

def verify_embeddings():
    try:
        with driver.session() as session:
            result = session.run("""
                MATCH (n:field)
                RETURN n._id, n.rdfs_label LIMIT 25
            """)
            nodes = result.data()
            if nodes:
                print("‚úÖ Nodes with embeddings found:", nodes)
            else:
                print("‚ùå No nodes with embeddings found.")
    except Exception as e:
        print("Query failed:", str(e))

# Verificar si el √≠ndice ya existe
index_name = 'fields'

if check_index_exists(index_name):
    print(f"Index '{index_name}' already exists. Skipping index creation.")
    vector_index = get_existing_vector_index(index_name)
else:
    # Crear el √≠ndice vectorial
    vector_index = create_vector_index()

# Verificar los nodos despu√©s de la creaci√≥n del √≠ndice
if vector_index:
        
    verify_embeddings()
    try:
        query = """MATCH (f:field)
        RETURN f 
        LIMIT 25
        """
        response = vector_index.similarity_search_with_score(query, top_k=2 )
        print("‚úÖNeo4jVector vector_index results:", response)
        if response:
            print("‚úÖSimilarity search results:", response[0].page_content)
        else:
            print("‚ùå No results found.")
    except Exception as e:
        print("Similarity search failed:", str(e))
else:
    print("‚ùå ‚ùå Skipping similarity search due to failed index creation.")

Index exists
Index 'fields' already exists. Skipping index creation.
Retrieving existing index 'fields'...
‚úÖ Successfully retrieved the existing index 'fields'.
‚òùÔ∏è Index Name: fields
‚òùÔ∏è Node Label: field
‚òùÔ∏è Embedding_node_property: embedding
‚òùÔ∏è Text_node_property: rdfs_label
‚úÖ Nodes with embeddings found: [{'n._id': 'CAMP_CD_CAMPO_0721', 'n.rdfs_label': 'MORRO DO BARRO'}, {'n._id': 'CAMP_CD_CAMPO_0890', 'n.rdfs_label': 'CAMARAO NORTE'}, {'n._id': 'CAMP_CD_CAMPO_0109', 'n.rdfs_label': 'SARDINHA'}, {'n._id': 'CAMP_CD_CAMPO_0108', 'n.rdfs_label': '√ÅREA BAS-064'}, {'n._id': 'CAMP_CD_CAMPO_0633', 'n.rdfs_label': 'JAPIIM'}, {'n._id': 'CAMP_CD_CAMPO_0572', 'n.rdfs_label': 'JIRIBATUBA'}, {'n._id': 'CAMP_CD_CAMPO_0888', 'n.rdfs_label': 'MANATI'}, {'n._id': 'CAMP_CD_CAMPO_0131', 'n.rdfs_label': 'AZUL√ÉO'}]
‚úÖNeo4jVector vector_index results: []
‚ùå No results found.


In [41]:
response = vector_index.similarity_search("Em que BACIA est√° localizado o campo CAMP_CD_CAMPO_0633?")
print(response)

[]


In [38]:
response = vector_index.similarity_search_with_score("quais s√£o os campos na base de dados fornecida?")
print(response)

[]


In [12]:
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI

vector_qa = RetrievalQA.from_chain_type(
    llm=llm_petrobras,
    chain_type="stuff",
    retriever=vector_index.as_retriever()
)


In [57]:
vector_qa.invoke(  "Quantos e quais s√£o as bacias na base de dados fornecida?")

{'query': 'Quantos e quais s√£o as bacias na base de dados fornecida?',
 'result': 'Na base de dados fornecida, h√° duas bacias:\n\n1. AMAZONAS\n2. CAMAMU-ALMADA'}

In [62]:
vector_qa.invoke(  "Quais sao os identificadores das bacias?")

{'query': 'Quais sao os identificadores das bacias?',
 'result': 'Os identificadores das bacias fornecidos s√£o:\n\n1. AMAZONAS: BASE_CD_BACIA_030\n2. CAMAMU-ALMADA: BASE_CD_BACIA_266'}

# **Neo4j using Cypher**

In [14]:
CYPHER_GENERATION_TEMPLATE = """Task:Generate Cypher statement to query a graph database.
Instructions:
Use only the provided relationship types and properties in the schema.
Do not use any other relationship types or properties that are not provided.
Schema:
{schema}
Note: Do not include any explanations or apologies in your responses.
Do not respond to any questions that might ask anything else than for you to construct a Cypher statement.
Do not include any text except the generated Cypher statement.

Examples: Here are a few examples of generated Cypher statements for particular questions:
# How many people played in Top Gun?
MATCH (m:Movie {{name:"Top Gun"}})<-[:ACTED_IN]-()
RETURN count(*) AS numberOfActors

The question is:
{question}"""

CYPHER_GENERATION_PROMPT = PromptTemplate(
    input_variables=["schema", "question"], template=CYPHER_GENERATION_TEMPLATE
)

In [15]:
#Se por acaso voc√™ n√£o encontrar a informa√ß√£o necess√°ria, responda com "N√£o foi poss√≠vel encontrar a informa√ß√£o requerida no grafo dado".
QA_PROMPT = """
A sua fun√ß√£o √© atraves das informa√ß√µes submetidas que estejam no grafo, em formato de resposta de uma query cypher √© responder de forma detalhada na forma culta da lingua portuguesa. 
Utilize apenas os tipos de relacionamentos e propriedades fornecidos no grafo. N√£o utilize nenhum outro tipo de relacionamento ou propriedade que n√£o seja fornecido no grafo. 

Estruture sua resposta de forma clara e organizada, fornecendo informa√ß√µes relevantes sobre os relacionamentos e entidades mencionadas na pergunta.
N√£o inclua explica√ß√µes ou desculpas em suas respostas.

Informa√ß√£o:
{context}

Quest√£o: {question}

Resposta ideal:
"""

qa_prompt = PromptTemplate.from_template(QA_PROMPT)

### Neo4j integration within LangChain called GraphCypherQAChain

In [16]:
chain = GraphCypherQAChain.from_llm(graph=graph, qa_prompt = qa_prompt, llm=llm_petrobras, verbose=True, cypher_prompt=CYPHER_GENERATION_PROMPT)


## üîç Pregunta Teste

In [17]:
chain.invoke("Quantos po√ßos estao localizados na bacia chamada AMAZONAS?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well)-[:located_in]->(b:basin {rdfs_label: "AMAZONAS"})
RETURN count(w) AS numberOfWells
[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 220}][0m

[1m> Finished chain.[0m


{'query': 'Quantos po√ßos estao localizados na bacia chamada AMAZONAS?',
 'result': 'Na bacia denominada AMAZONAS, encontram-se localizados um total de 220 po√ßos.'}

In [18]:
chain.invoke("Quantos po√ßos estao localizados na bacia chamada AMAZONAS?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {rdfs_label: "AMAZONAS"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 220}][0m

[1m> Finished chain.[0m


{'query': 'Quantos po√ßos estao localizados na bacia chamada AMAZONAS?',
 'result': 'A bacia denominada "AMAZONAS" possui um total de 220 po√ßos localizados em sua √°rea.'}

In [19]:
chain.invoke("Quantos po√ßos estao localizados na bacia chamada CAMAMU-ALMADA?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {rdfs_label: "CAMAMU-ALMADA"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 118}][0m

[1m> Finished chain.[0m


{'query': 'Quantos po√ßos estao localizados na bacia chamada CAMAMU-ALMADA?',
 'result': 'A bacia denominada CAMAMU-ALMADA possui um total de 118 po√ßos localizados em sua √°rea.'}

In [20]:
chain.invoke("Quantos po√ßos estao localizados no campo SARDINHA?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(f:field {rdfs_label:"SARDINHA"})
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 12}][0m

[1m> Finished chain.[0m


{'query': 'Quantos po√ßos estao localizados no campo SARDINHA?',
 'result': 'O campo SARDINHA possui um total de 12 po√ßos localizados em sua √°rea.'}

In [21]:
chain.invoke("Quantos po√ßos estao localizados no campo JAPIIM?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well)-[:located_in]->(f:field {rdfs_label: "JAPIIM"})
RETURN count(w) AS numberOfWells
[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 2}][0m

[1m> Finished chain.[0m


{'query': 'Quantos po√ßos estao localizados no campo JAPIIM?',
 'result': 'O campo JAPIIM possui um total de 2 po√ßos localizados nele.'}

In [22]:
chain.invoke("Quais forma√ß√µes est√£o constituidas pelo material chamado siltito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit)-[:constituted_by]->(m:siltstone)
RETURN f.rdfs_label AS formacao[0m
Full Context:
[32;1m[1;3m[{'formacao': 'Fm. Nhamund√°'}, {'formacao': 'Fm. Algod√µes'}, {'formacao': 'Mb. Cazumba'}, {'formacao': 'Fm. Ita√≠pe'}, {'formacao': 'Gr. Brotas'}, {'formacao': 'Gr. Camamu'}, {'formacao': 'Fm. Pitinga'}, {'formacao': 'Forma√ß√£o Urucutuca'}, {'formacao': 'Fm. Morro do Barro'}, {'formacao': 'Membro Tinhar√©'}][0m

[1m> Finished chain.[0m


{'query': 'Quais forma√ß√µes est√£o constituidas pelo material chamado siltito?',
 'result': 'As forma√ß√µes constitu√≠das pelo material chamado siltito s√£o as seguintes:\n\n1. **Forma√ß√£o Nhamund√° (Fm. Nhamund√°)**\n2. **Forma√ß√£o Algod√µes (Fm. Algod√µes)**\n3. **Membro Cazumba (Mb. Cazumba)**\n4. **Forma√ß√£o Ita√≠pe (Fm. Ita√≠pe)**\n5. **Grupo Brotas (Gr. Brotas)**\n6. **Grupo Camamu (Gr. Camamu)**\n7. **Forma√ß√£o Pitinga (Fm. Pitinga)**\n8. **Forma√ß√£o Urucutuca**\n9. **Forma√ß√£o Morro do Barro (Fm. Morro do Barro)**\n10. **Membro Tinhar√©**\n\nEstas forma√ß√µes geol√≥gicas apresentam siltito como um dos materiais constituintes, o que implica que esse tipo de rocha sedimentar fina est√° presente em todas as forma√ß√µes listadas.'}

In [23]:
chain.invoke("Quantas forma√ß√µes est√£o constituidas pelo material chamado siltito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (lu:lithostratigraphic_unit)-[:constituted_by]->(s:siltstone)
RETURN count(lu) AS numberOfFormations
[0m
Full Context:
[32;1m[1;3m[{'numberOfFormations': 36}][0m

[1m> Finished chain.[0m


{'query': 'Quantas forma√ß√µes est√£o constituidas pelo material chamado siltito?',
 'result': 'O n√∫mero total de forma√ß√µes constitu√≠das pelo material denominado siltito √© 36.'}

In [74]:
chain.invoke("Quais forma√ß√µes est√£o constituidas pelo material da terra chamado arenito?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (f:lithostratigraphic_unit)-[:constituted_by]->(:sandstone)
RETURN f.rdfs_label AS formacao
[0m
Full Context:
[32;1m[1;3m[{'formacao': 'Forma√ß√£o Alian√ßa'}, {'formacao': 'Fm. Rio de Contas'}, {'formacao': 'Forma√ß√£o Manacapuru'}, {'formacao': 'Gr. Tapaj√≥s'}, {'formacao': 'Fm. Afligidos'}, {'formacao': 'Forma√ß√£o Taipus-Mirim'}, {'formacao': 'Gr. Esp√≠rito Santo'}, {'formacao': 'Fm. Erer√™'}, {'formacao': 'Fm. Caravelas'}, {'formacao': 'Fm. Ita√≠pe'}][0m

[1m> Finished chain.[0m


{'query': 'Quais forma√ß√µes est√£o constituidas pelo material da terra chamado arenito?',
 'result': 'As forma√ß√µes constitu√≠das pelo material da terra chamado arenito s√£o as seguintes:\n\n1. **Forma√ß√£o Alian√ßa**\n2. **Fm. Rio de Contas**\n3. **Forma√ß√£o Manacapuru**\n4. **Gr. Tapaj√≥s**\n5. **Fm. Afligidos**\n6. **Forma√ß√£o Taipus-Mirim**\n7. **Gr. Esp√≠rito Santo**\n8. **Fm. Erer√™**\n9. **Fm. Caravelas**\n10. **Fm. Ita√≠pe**\n\nEssas forma√ß√µes geol√≥gicas s√£o compostas predominantemente de arenito, caracterizando-se por suas propriedades sedimentares e sua relev√¢ncia no estudo da geologia e geomorfologia.'}

In [24]:
chain.invoke("Quais s√£o os CAMPOS localizados na bacia AMAZONAS?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {rdfs_label: "AMAZONAS"})<-[:located_in]-(f:field)
RETURN f.rdfs_label AS campo
[0m
Full Context:
[32;1m[1;3m[{'campo': 'JAPIIM'}, {'campo': 'AZUL√ÉO'}][0m

[1m> Finished chain.[0m


{'query': 'Quais s√£o os CAMPOS localizados na bacia AMAZONAS?',
 'result': 'Os campos localizados na bacia Amazonas s√£o:\n\n1. Campo Japiim\n2. Campo Azul√£o'}

In [25]:
chain.invoke("Quais s√£o os CAMPOS localizados na bacia CAMAMU-ALMADA?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {rdfs_label: "CAMAMU-ALMADA"})<-[:located_in]-(f:field)
RETURN f[0m
Full Context:
[32;1m[1;3m[{'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0721', 'rdfs_label': 'MORRO DO BARRO', '_id': 'CAMP_CD_CAMPO_0721', 'embedding': [0.022277986630797386, 0.016327109187841415, -0.028187714517116547, -0.028680983930826187, 0.01824064739048481, -0.05774376168847084, -0.05173172429203987, 0.09001590311527252, 0.021866735070943832, -0.03550747409462929, 0.034170642495155334, 0.0032517146319150925, -0.056892041116952896, 0.0007174767670221627, -0.02133934572339058, -0.017919987440109253, -0.012022317387163639, 0.01830979436635971, 0.018810756504535675, 0.0013078884221613407, 0.06987334042787552, -0.015786271542310715, -0.01220856886357069, -0.048592709004879, -0.03587553650140762, -0.012725374661386013, -0.028263945132493973, -0.03850250691175461, -

{'query': 'Quais s√£o os CAMPOS localizados na bacia CAMAMU-ALMADA?',
 'result': 'Os campos localizados na bacia CAMAMU-ALMADA s√£o:\n\n1. **MORRO DO BARRO**\n   - **ID:** CAMP_CD_CAMPO_0721\n   - **URI:** [Link](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0721)\n\n2. **CAMAR√ÉO NORTE**\n   - **ID:** CAMP_CD_CAMPO_0890\n   - **URI:** [Link](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0890)\n\n3. **SARDINHA**\n   - **ID:** CAMP_CD_CAMPO_0109\n   - **URI:** [Link](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0109)\n\n4. **√ÅREA BAS-064**\n   - **ID:** CAMP_CD_CAMPO_0108\n   - **URI:** [Link](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0108)\n\n5. **JIRIBATUBA**\n   - **ID:** CAMP_CD_CAMPO_0572\n   - **URI:** [Link](http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0572)\n\n6. **MANATI**\n   - **ID:

## üîç Preguntas para avaliar

### ‚úÖ  Teste de perguntas e respostas

In [26]:
### Teste de perguntas e respostas
chain.invoke("MATCH (n:well)-[r:located_in]->(b:basin) RETURN RETURN COUNT(r) as total_relationships")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:well)-[r:located_in]->(b:basin)
RETURN COUNT(r) as total_relationships[0m
Full Context:
[32;1m[1;3m[{'total_relationships': 338}][0m

[1m> Finished chain.[0m


{'query': 'MATCH (n:well)-[r:located_in]->(b:basin) RETURN RETURN COUNT(r) as total_relationships',
 'result': 'A consulta solicitada tem como objetivo contar o n√∫mero total de relacionamentos do tipo "located_in" entre os n√≥s do tipo "well" e os n√≥s do tipo "basin" no grafo.\n\nResposta detalhada:\n\nO grafo cont√©m um total de 338 relacionamentos do tipo "located_in". Isso significa que existem 338 conex√µes no grafo onde um po√ßo ("well") est√° localizado em uma bacia ("basin").'}

Identificar os po√ßos que est√£o localizados na bacia especificada

In [27]:
chain.invoke("Quais s√£o os identificadores dos po√ßos localizados na bacia com identificador BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {_id: "BASE_CD_BACIA_030"})<-[:located_in]-(w:well)
RETURN w._id[0m
Full Context:
[32;1m[1;3m[{'w._id': 'POCO_CD_POCO_023016'}, {'w._id': 'POCO_CD_POCO_022806'}, {'w._id': 'POCO_CD_POCO_023017'}, {'w._id': 'POCO_CD_POCO_022886'}, {'w._id': 'POCO_CD_POCO_022809'}, {'w._id': 'POCO_CD_POCO_022875'}, {'w._id': 'POCO_CD_POCO_023011'}, {'w._id': 'POCO_CD_POCO_022758'}, {'w._id': 'POCO_CD_POCO_023059'}, {'w._id': 'POCO_CD_POCO_023037'}][0m

[1m> Finished chain.[0m


{'query': 'Quais s√£o os identificadores dos po√ßos localizados na bacia com identificador BASE_CD_BACIA_030?',
 'result': 'Os identificadores dos po√ßos localizados na bacia com identificador BASE_CD_BACIA_030 s√£o:\n\n- POCO_CD_POCO_023016\n- POCO_CD_POCO_022806\n- POCO_CD_POCO_023017\n- POCO_CD_POCO_022886\n- POCO_CD_POCO_022809\n- POCO_CD_POCO_022875\n- POCO_CD_POCO_023011\n- POCO_CD_POCO_022758\n- POCO_CD_POCO_023059\n- POCO_CD_POCO_023037'}

In [64]:
chain.invoke("Quais po√ßos sao localizados na bacia CAMAMU-ALMADA com identificador BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin {_id: "BASE_CD_BACIA_266", rdfs_label: "CAMAMU-ALMADA"})<-[:located_in]-(w:well)
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_005755', 'rdfs_label': '1-BAS-79', '_id': 'POCO_CD_POCO_005755', 'embedding': [0.013798758387565613, 0.0005058402311988175, -0.047536250203847885, -0.04727967828512192, 0.0007083620293997228, -0.034381747245788574, -0.013826961629092693, 0.06024038791656494, 0.03639379143714905, -0.027609027922153473, 0.019592497497797012, 0.0020387833938002586, -0.047450922429561615, -0.001828057924285531, -0.009141869843006134, 0.0045607248321175575, -0.006302203051745892, 0.0011439681984484196, 0.011428301222622395, 0.01861529052257538, 0.04100353270769119, -0.032840874046087265, -0.016532015055418015, -0.03827150911092758, -0.008243493735790253, -0.012929648160934448, -0.0354351438581

{'query': 'Quais po√ßos sao localizados na bacia CAMAMU-ALMADA com identificador BASE_CD_BACIA_266?',
 'result': 'Os po√ßos localizados na bacia CAMAMU-ALMADA, identificada pelo c√≥digo BASE_CD_BACIA_266, s√£o:\n\n1. **Po√ßo 1-BAS-79**\n   - Identificador: POCO_CD_POCO_005755\n\n2. **Po√ßo 1-BAS-112**\n   - Identificador: POCO_CD_POCO_005658\n\n3. **Po√ßo 3-MB-4-BA**\n   - Identificador: POCO_CD_POCO_005617\n\n4. **Po√ßo 1-PCZ-1-BA**\n   - Identificador: POCO_CD_POCO_005612\n\n5. **Po√ßo 1-COST-3-BAS**\n   - Identificador: POCO_CD_POCO_006053\n\n6. **Po√ßo 1-BAS-83**\n   - Identificador: POCO_CD_POCO_005743\n\n7. **Po√ßo 1-BAS-72**\n   - Identificador: POCO_CD_POCO_005648\n\n8. **Po√ßo 7-MNT-5D-BAS**\n   - Identificador: POCO_CD_POCO_006258\n\n9. **Po√ßo 1-BAS-77**\n   - Identificador: POCO_CD_POCO_005759\n\n10. **Po√ßo 1-BAS-64**\n    - Identificador: POCO_CD_POCO_005960'}

### ‚úÖ **Pregunta No. 1**

In [68]:
chain.run("Quantos po√ßos localizados na bacia BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_030'})<-[:located_in]-(w:well)
RETURN COUNT(w) AS total_wells
[0m
Full Context:
[32;1m[1;3m[{'total_wells': 220}][0m

[1m> Finished chain.[0m


'A bacia identificada pelo c√≥digo BASE_CD_BACIA_030 possui um total de 220 po√ßos localizados em seu territ√≥rio.'

In [69]:
chain.run("Quais sao os po√ßos localizados na bacia BASE_CD_BACIA_030?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: "BASE_CD_BACIA_030"})<-[:located_in]-(w:well)
RETURN w
[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_023016', 'rdfs_label': '2-JIST-1-PA', '_id': 'POCO_CD_POCO_023016', 'embedding': [0.0015631438000127673, 0.014045652002096176, -0.026118146255612373, -0.03247372806072235, 0.005580601282417774, -0.04189777746796608, -0.0176917165517807, 0.08210714161396027, 0.028373748064041138, -0.022808391600847244, 0.03322244808077812, 0.003941547591239214, -0.038707833737134933, 0.0012013016967102885, 0.004274172242730856, 0.017192991450428963, -0.012741322629153728, 0.006260435562580824, 0.015812426805496216, 0.00021560481400229037, 0.06450540572404861, -0.017464181408286095, -0.024351133033633232, -0.019821612164378166, -0.016761736944317818, -0.015171126462519169, -0.018799781799316406, -0.056588426232

'A bacia identificada como "BASE_CD_BACIA_030" possui os seguintes po√ßos localizados:\n\n1. **Po√ßo: 2-JIST-1-PA**\n   - Identificador: POCO_CD_POCO_023016\n   - Descri√ß√£o: Este po√ßo √© identificado por "2-JIST-1-PA" e possui o c√≥digo √∫nico POCO_CD_POCO_023016.\n\n2. **Po√ßo: 1-AM-13-AM**\n   - Identificador: POCO_CD_POCO_022806\n   - Descri√ß√£o: Este po√ßo √© identificado por "1-AM-13-AM" e possui o c√≥digo √∫nico POCO_CD_POCO_022806.\n\n3. **Po√ßo: 2-RPST-1-PA**\n   - Identificador: POCO_CD_POCO_023017\n   - Descri√ß√£o: Este po√ßo √© identificado por "2-RPST-1-PA" e possui o c√≥digo √∫nico POCO_CD_POCO_023017.\n\n4. **Po√ßo: 1-TR-1-PA**\n   - Identificador: POCO_CD_POCO_022886\n   - Descri√ß√£o: Este po√ßo √© identificado por "1-TR-1-PA" e possui o c√≥digo √∫nico POCO_CD_POCO_022886.\n\n5. **Po√ßo: 1-AM-6A-AM**\n   - Identificador: POCO_CD_POCO_022809\n   - Descri√ß√£o: Este po√ßo √© identificado por "1-AM-6A-AM" e possui o c√≥digo √∫nico POCO_CD_POCO_022809.\n\n6. **Po√ßo: 1

In [465]:
chain.run("Quais sao os po√ßos localizados na bacia BASE_CD_BACIA_116?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_009032', '_id': 'POCO_CD_POCO_009032'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006882', '_id': 'POCO_CD_POCO_006882'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_007140', '_id': 'POCO_CD_POCO_007140'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_010831', '_id': 'POCO_CD_POCO_010831'}}][0m

[1m> Finished chain.[0m


'Com base nas informa√ß√µes fornecidas, os po√ßos localizados na bacia BASE_CD_BACIA_116 s√£o:\n- POCO_CD_POCO_009032\n- POCO_CD_POCO_006882\n- POCO_CD_POCO_007140\n- POCO_CD_POCO_010831'

### ‚úÖ **Pregunta No. 2**

In [63]:
chain.run("Quais sao os campos que estao localizados na bacia identificada BASE_CD_BACIA_030?")

  warn_deprecated(




[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_030'})<-[:located_in]-(f:field)
RETURN f.rdfs_label
[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'JAPIIM'}, {'f.rdfs_label': 'AZUL√ÉO'}][0m

[1m> Finished chain.[0m


'A bacia identificada como BASE_CD_BACIA_030 possui os seguintes campos localizados em seu territ√≥rio:\n\n1. **Campo Japiim**\n   - Nome: JAPIIM\n\n2. **Campo Azul√£o**\n   - Nome: AZUL√ÉO'

In [65]:
chain.run("Quais os campos que estao localizados na bacia BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_266'})<-[:located_in]-(f:field)
RETURN f.rdfs_label
[0m
Full Context:
[32;1m[1;3m[{'f.rdfs_label': 'MORRO DO BARRO'}, {'f.rdfs_label': 'CAMARAO NORTE'}, {'f.rdfs_label': 'SARDINHA'}, {'f.rdfs_label': '√ÅREA BAS-064'}, {'f.rdfs_label': 'JIRIBATUBA'}, {'f.rdfs_label': 'MANATI'}][0m

[1m> Finished chain.[0m


'Os campos localizados na bacia BASE_CD_BACIA_266 s√£o:\n\n1. Morro do Barro\n2. Camar√£o Norte\n3. Sardinha\n4. √Årea BAS-064\n5. Jiribatuba\n6. Manati'

In [67]:
chain.run("Quais os ID campos localizados na bacia BASE_CD_BACIA_266?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (b:basin {_id: 'BASE_CD_BACIA_266'})<-[:located_in]-(f:field)
RETURN f._id
[0m
Full Context:
[32;1m[1;3m[{'f._id': 'CAMP_CD_CAMPO_0721'}, {'f._id': 'CAMP_CD_CAMPO_0890'}, {'f._id': 'CAMP_CD_CAMPO_0109'}, {'f._id': 'CAMP_CD_CAMPO_0108'}, {'f._id': 'CAMP_CD_CAMPO_0572'}, {'f._id': 'CAMP_CD_CAMPO_0888'}][0m

[1m> Finished chain.[0m


'Os campos localizados na bacia identificada como BASE_CD_BACIA_266 s√£o os seguintes:\n\n1. CAMP_CD_CAMPO_0721\n2. CAMP_CD_CAMPO_0890\n3. CAMP_CD_CAMPO_0109\n4. CAMP_CD_CAMPO_0108\n5. CAMP_CD_CAMPO_0572\n6. CAMP_CD_CAMPO_0888'

### ‚úÖ **Pregunta No. 3**

In [77]:
chain.run("Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0888?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(f:field {rdfs_label: "CAMP_CD_CAMPO_0888"})
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 0}][0m

[1m> Finished chain.[0m


'O campo identificado pelo c√≥digo CAMP_CD_CAMPO_0888 n√£o possui nenhum po√ßo localizado em sua √°rea.'

In [86]:
chain.run("Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0890?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {_id: "CAMP_CD_CAMPO_0890"})<-[:located_in]-(w:well)
RETURN count(w) AS numberOfWells[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 2}][0m

[1m> Finished chain.[0m


'O campo identificado pelo c√≥digo CAMP_CD_CAMPO_0890 possui um total de 2 po√ßos.'

In [80]:
chain.run("Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0108?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (w:well)-[:located_in]->(f:field {rdfs_label: "CAMP_CD_CAMPO_0108"})
RETURN count(w) AS numberOfWells
[0m
Full Context:
[32;1m[1;3m[{'numberOfWells': 0}][0m

[1m> Finished chain.[0m


'Nenhum po√ßo est√° localizado no campo identificado como CAMP_CD_CAMPO_0108.'

### ‚úÖ Pregunta No. 4

In [89]:
chain.run("Quais s√£o os po√ßos que est√£o localizados no campo CAMP_CD_CAMPO_0890?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mcypher
MATCH (f:field {_id: "CAMP_CD_CAMPO_0890"})<-[:located_in]-(w:well)
RETURN w.rdfs_label AS wellName
[0m
Full Context:
[32;1m[1;3m[{'wellName': '3-BAS-131'}, {'wellName': '3-BRSA-135-BAS'}][0m

[1m> Finished chain.[0m


'Os po√ßos localizados no campo denominado CAMP_CD_CAMPO_0890 s√£o:\n\n1. Po√ßo: 3-BAS-131\n2. Po√ßo: 3-BRSA-135-BAS'

In [92]:
chain.run("Quantos e quais s√£o os po√ßos que est√£o localizados no campo CAMP_CD_CAMPO_0890?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field {_id: "CAMP_CD_CAMPO_0890"})<-[:located_in]-(w:well)
RETURN w.rdfs_label AS wellName, w._id AS wellId[0m
Full Context:
[32;1m[1;3m[{'wellName': '3-BAS-131', 'wellId': 'POCO_CD_POCO_000010'}, {'wellName': '3-BRSA-135-BAS', 'wellId': 'POCO_CD_POCO_006025'}][0m

[1m> Finished chain.[0m


'O campo identificado pelo c√≥digo "CAMP_CD_CAMPO_0890" possui dois po√ßos localizados em sua √°rea. Os po√ßos s√£o os seguintes:\n\n1. Nome do Po√ßo: 3-BAS-131\n   Identifica√ß√£o do Po√ßo: POCO_CD_POCO_000010\n\n2. Nome do Po√ßo: 3-BRSA-135-BAS\n   Identifica√ß√£o do Po√ßo: POCO_CD_POCO_006025'

### ‚úÖ Pregunta No. 5

In [116]:
chain.run("Qual idade geol√≥gica da unidade litoestratigrafica Forma√ß√£o Sergi idenficada pelo ID formacao_239?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:lithostratigraphic_unit {_id: "formacao_239"})-[:has_age]->(age)
RETURN age.rdfs_label AS geological_age[0m
Full Context:
[32;1m[1;3m[{'geological_age': 'Rio_da_Serra'}][0m

[1m> Finished chain.[0m


'A unidade litoestratigr√°fica Forma√ß√£o Sergi identificada pelo ID formacao_239 possui a idade geol√≥gica Rio da Serra.'

In [115]:
chain.invoke("Qual idade geol√≥gica idenficada pelo ID formacao_320?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual {_id: "formacao_320"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[{'age': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#Tournaisian_quality_formacao_320', 'rdfs_label': 'Tournaisiano', '_id': 'Tournaisian_quality_formacao_320'}}][0m

[1m> Finished chain.[0m


{'query': 'Qual idade geol√≥gica idenficada pelo ID formacao_320?',
 'result': 'A idade geol√≥gica identificada pelo ID "formacao_320" √© o Tournaisiano.'}

In [114]:
chain.run("Qual idade geol√≥gica da unidade litoestratigrafica idenficada pelo ID formacao_320?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (lu:lithostratigraphic_unit {_id: "formacao_320"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[{'age': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#Tournaisian_quality_formacao_320', 'rdfs_label': 'Tournaisiano', '_id': 'Tournaisian_quality_formacao_320'}}][0m

[1m> Finished chain.[0m


'A unidade litoestratigr√°fica identificada pelo ID "formacao_320" pertence √† idade geol√≥gica "Tournaisiano".'

### ‚úÖ Pregunta No. 6

In [282]:
chain.run("Which are the earth material and lithostratigraphic unit that crosses the well POCO_CD_POCO_024505 and the rock os the lithostratigraphic unit ?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: 'POCO_CD_POCO_024505'})-[:crosses]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:part_of]->(earth_material:owl_NamedIndividual)
RETURN earth_material, lithostratigraphic_unit[0m
Full Context:
[32;1m[1;3m[{'earth_material': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#grupo_009', '_id': 'grupo_009'}, 'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}][0m

[1m> Finished chain.[0m


'A unidade de material terrestre que atravessa o po√ßo POCO_CD_POCO_024505 √© o grupo grupo_009 e a unidade litoestratigr√°fica √© a forma√ß√£o formacao_110.'

### ‚úÖ Pregunta No. 7

In [128]:
chain.invoke("Quantos s√£o os id das forma√ß√µes que atravessam o po√ßo com id POCO_CD_POCO_022645 e que √© constitu√≠da pelo sandstone?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_022645"})-[:crosses]->(f:lithostratigraphic_unit)-[:constituted_by]->(:sandstone)
RETURN count(f._id) AS numberOfFormations[0m
Full Context:
[32;1m[1;3m[{'numberOfFormations': 13}][0m

[1m> Finished chain.[0m


{'query': 'Quantos s√£o os id das forma√ß√µes que atravessam o po√ßo com id POCO_CD_POCO_022645 e que √© constitu√≠da pelo sandstone?',
 'result': 'O po√ßo identificado como POCO_CD_POCO_022645 atravessa um total de 13 forma√ß√µes constitu√≠das por arenito (sandstone).'}

In [127]:
chain.invoke("Quais s√£o os id das forma√ß√µes que atravessam o po√ßo com id POCO_CD_POCO_022645 e que √© constitu√≠da pelo sandstone?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_022645"})-[:crosses]->(f:lithostratigraphic_unit)-[:constituted_by]->(:sandstone)
RETURN f._id AS formacoes_id[0m
Full Context:
[32;1m[1;3m[{'formacoes_id': 'formacao_006'}, {'formacoes_id': 'formacao_086'}, {'formacoes_id': 'formacao_246'}, {'formacoes_id': 'formacao_031'}, {'formacoes_id': 'formacao_187'}, {'formacoes_id': 'formacao_284'}, {'formacoes_id': 'formacao_241'}, {'formacoes_id': 'formacao_141'}, {'formacoes_id': 'formacao_329'}, {'formacoes_id': 'formacao_028'}][0m

[1m> Finished chain.[0m


{'query': 'Quais s√£o os id das forma√ß√µes que atravessam o po√ßo com id POCO_CD_POCO_022645 e que √© constitu√≠da pelo sandstone?',
 'result': 'Os id das forma√ß√µes que atravessam o po√ßo com id POCO_CD_POCO_022645 e que s√£o constitu√≠das pelo sandstone s√£o:\n\n- formacao_006\n- formacao_086\n- formacao_246\n- formacao_031\n- formacao_187\n- formacao_284\n- formacao_241\n- formacao_141\n- formacao_329\n- formacao_028'}

### ‚úÖ **Pregunta No. 8**

Neste casso √© necessario dividir a pergunta por etapas para construir a pergunta final.

#### ‚úÖ Qual forma√ß√£o atravessa o po√ßo con ID: 'POCO_CD_POCO_024505'?

In [123]:
chain.invoke("Qual √© o id da forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_022645?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_022645"})-[:crosses]->(f:lithostratigraphic_unit)
RETURN f._id AS formation_id[0m
Full Context:
[32;1m[1;3m[{'formation_id': 'formacao_006'}, {'formation_id': 'formacao_086'}, {'formation_id': 'formacao_246'}, {'formation_id': 'formacao_031'}, {'formation_id': 'formacao_187'}, {'formation_id': 'formacao_284'}, {'formation_id': 'formacao_241'}, {'formation_id': 'formacao_141'}, {'formation_id': 'formacao_329'}, {'formation_id': 'formacao_028'}][0m

[1m> Finished chain.[0m


{'query': 'Qual √© o id da forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_022645?',
 'result': 'O id da forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_022645 n√£o est√° fornecido nas informa√ß√µes submetidas. As forma√ß√µes listadas s√£o as seguintes:\n\n- formacao_006\n- formacao_086\n- formacao_246\n- formacao_031\n- formacao_187\n- formacao_284\n- formacao_241\n- formacao_141\n- formacao_329\n- formacao_028'}

In [658]:
chain.run("Qual √© o id da forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_018470?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_018470"})-[:crosses]->(l:lithostratigraphic_unit)
RETURN l._id[0m
Full Context:
[32;1m[1;3m[{'l._id': 'formacao_296'}][0m

[1m> Finished chain.[0m


'O id da forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_018470 √© formacao_296.'

In [659]:
chain.run("Qual √© a forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_012120"})-[:crosses]->(l:lithostratigraphic_unit)
RETURN l;[0m
Full Context:
[32;1m[1;3m[{'l': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_294', '_id': 'formacao_294'}}, {'l': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_242', '_id': 'formacao_242'}}][0m

[1m> Finished chain.[0m


'A forma√ß√£o que atravessa o po√ßo com id POCO_CD_POCO_012120 √© a forma√ß√£o_294.'

In [660]:
chain.run("Quantas forma√ß√µes atravessam o po√ßo com id POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_012120"})-[:crosses]->(l:lithostratigraphic_unit)
RETURN COUNT(l) as total_formacoes_que_atravessam_o_poco;[0m
Full Context:
[32;1m[1;3m[{'total_formacoes_que_atravessam_o_poco': 2}][0m

[1m> Finished chain.[0m


'Existem 2 forma√ß√µes que atravessam o po√ßo com o identificador POCO_CD_POCO_012120.'

In [661]:
chain.run("Quais forma√ß√µes atravessam o po√ßo com id POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit)-[:crosses]->(w:well {_id: "POCO_CD_POCO_012120"})
RETURN f[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As forma√ß√µes que atravessam o po√ßo com o identificador POCO_CD_POCO_012120 s√£o a Forma√ß√£o A e a Forma√ß√£o B.'

In [662]:
chain.run("Qual forma√ß√£o atravessa o po√ßo com id POCO_CD_POCO_024505?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well {_id: "POCO_CD_POCO_024505"})-[:crosses]->(l:lithostratigraphic_unit)
RETURN l;[0m
Full Context:
[32;1m[1;3m[{'l': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}][0m

[1m> Finished chain.[0m


'A forma√ß√£o com o id formacao_110 atravessa o po√ßo com o id POCO_CD_POCO_024505.'

#### ‚úÖ Em quais forma√ß√µes do campo 'nome do campo' foram identificadas ocorr√™ncias de 'tipo de fluido'?

In [663]:
chain.run("Quais unidades litoestratigraficas ou forma√ß√µes atravessam o po√ßo _id:POCO_CD_POCO_024505  e s√£o constitu√≠das pelo id oil?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_024505"})-[:crosses]->(unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN unit;[0m
Full Context:
[32;1m[1;3m[{'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}][0m

[1m> Finished chain.[0m


'As unidades litoestratigr√°ficas ou forma√ß√µes que atravessam o po√ßo POCO_CD_POCO_024505 e s√£o constitu√≠das pelo id oil s√£o as seguintes:\n- Forma√ß√£o 110 (formacao_110)'

‚úÖ Quais unidades litoestratigraficas ou forma√ß√µes sao constituidas pelo 'tipo de fluido'?

In [665]:
chain.run("Which are the lithostratigraphic unit that is constituted by id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (lithostratigraphic_unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN lithostratigraphic_unit[0m
Full Context:
[32;1m[1;3m[{'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_319', '_id': 'formacao_319'}}, {'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_200', '_id': 'formacao_200'}}][0m

[1m> F

'As unidades litoestratigr√°ficas que s√£o constitu√≠das pelo id oil s√£o:\n- formacao_027\n- formacao_056\n- formacao_110\n- formacao_319\n- formacao_200'

In [496]:
chain.run("Quais s√£o as unidades litoestratigr√°ficas que foram constitu√≠das pelo owl_Class id oil?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:owl_Class { _id: "oil" })<-[:constituted_by]-(lu:lithostratigraphic_unit)
RETURN lu[0m
Full Context:
[32;1m[1;3m[{'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_319', '_id': 'formacao_319'}}, {'lu': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_200', '_id': 'formacao_200'}}][0m

[1m> Finished chain.[0m


'As unidades litoestratigr√°ficas constitu√≠das pelo owl_Class id oil s√£o:\n- formacao_027\n- formacao_056\n- formacao_110\n- formacao_319\n- formacao_200'

### ‚úÖ **Pregunta No. 9**

In [599]:
chain.run("Quais s√£o as texturas das rochas de arenito encontradas no campo CAMP_CD_CAMPO_0519?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "CAMP_CD_CAMPO_0519"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:textura]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de arenito encontradas no campo CAMP_CD_CAMPO_0519 s√£o granulosa e porosa.'

In [601]:
chain.run("Quais s√£o as texturas das rochas de ardosia encontradas no campo CAMP_CD_CAMPO_0773?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:owl_NamedIndividual {_id: "CAMP_CD_CAMPO_0773"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As rochas de ard√≥sia encontradas no campo CAMP_CD_CAMPO_0773 possuem as texturas de "lisa" e "rugosa".'

In [603]:
chain.run("Quais s√£o as texturas das rochas de argilito encontradas no campo CAMP_CD_CAMPO_0536?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "CAMP_CD_CAMPO_0536"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de argilito encontradas no campo CAMP_CD_CAMPO_0536 s√£o finas e laminadas.'

In [604]:
chain.run("Quais s√£o as texturas das rochas de basalto encontradas no campo CAMP_CD_CAMPO_0773?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:owl_NamedIndividual {_id: "CAMP_CD_CAMPO_0773"})-[:located_in]->(basin)-[:rdf_type]->(owl_Class)-[:owl_equivalentClass]->(lithostratigraphic_unit)-[:rdf_type]->(textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de basalto encontradas no campo CAMP_CD_CAMPO_0773 s√£o textura afan√≠tica e textura porfir√≠tica.'

In [605]:
chain.run("Quais s√£o as texturas das rochas de brecha encontradas no campo CAMP_CD_CAMPO_0773?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "CAMP_CD_CAMPO_0773"})-[:located_in]->(well)-[:crosses]->(lithostratigraphic_unit)-[:rdf_type]->(textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As rochas de brecha encontradas no campo CAMP_CD_CAMPO_0773 possuem as texturas de "rugosa" e "porosa".'

### ‚úÖ **Pregunta No. 10**

In [606]:
chain.run("Quais s√£o as texturas das rochas de arenito encontradas no po√ßo POCO_CD_POCO_023172 ?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field {_id: "POCO_CD_POCO_023172"})-[:located_in]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de arenito encontradas no campo POCO_CD_POCO_023172 s√£o granulares e porosas.'

In [843]:
chain.run("Quais s√£o as texturas das rochas de id basalto encontradas no po√ßo POCO_CD_POCO_023172 ?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (basalt:lithostratigraphic_unit {_id: "basalto"})-[:located_in]->(well:well {_id: "POCO_CD_POCO_023172"})-[:located_in]->(field)
RETURN basalt.textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de id basalto encontradas no po√ßo POCO_CD_POCO_023172 s√£o granular e porfir√≠tica.'

In [842]:
chain.run("Quais s√£o as texturas das rochas de id basalto encontradas no po√ßo POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_012120"})-[:located_in]->(field)-[:located_in]->(textura)
WHERE field._id = "basalto"
RETURN textura[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de id basalto encontradas no po√ßo POCO_CD_POCO_012120 s√£o textura maci√ßa e textura porf√≠rica.'

In [611]:
chain.run("Quais s√£o as texturas das rochas de anidrita encontradas no po√ßo POCO_CD_POCO_012120?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_012120"})-[:crosses]->(lithostratigraphic_unit:lithostratigraphic_unit)-[:rdf_type]->(textura:textura)
WHERE lithostratigraphic_unit._uri CONTAINS "anidrita"
RETURN DISTINCT textura._uri, textura._id, textura.rdfs_label[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'As texturas das rochas de anidrita encontradas no po√ßo POCO_CD_POCO_012120 s√£o granulares e foliadas.'

### Pregunta No. 11

Neste casso √© necessario dividir a pergunta por etapas para construir a pergunta final.

In [655]:
chain.run("Quais s√£o os ID campos que atravessam as unidades litoestratigr√°ficas ID formacao_296?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual)-[:crosses]->(:lithostratigraphic_unit {_id: "formacao_296"}) RETURN n._id;[0m
Full Context:
[32;1m[1;3m[{'n._id': 'POCO_CD_POCO_012983'}, {'n._id': 'POCO_CD_POCO_018470'}][0m

[1m> Finished chain.[0m


'Os campos que atravessam as unidades litoestratigr√°ficas da forma√ß√£o ID formacao_296 s√£o POCO_CD_POCO_012983 e POCO_CD_POCO_018470.'

In [617]:

chain.run("Quais s√£o os ID campos que atravessam as unidades litoestratigr√°ficas formacao_242?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual)-[:crosses]->(:lithostratigraphic_unit { _id: "formacao_242" }) RETURN n._id[0m
Full Context:
[32;1m[1;3m[{'n._id': 'POCO_CD_POCO_012120'}, {'n._id': 'POCO_CD_POCO_012097'}][0m

[1m> Finished chain.[0m


'Os ID campos que atravessam as unidades litoestratigr√°ficas formacao_242 s√£o POCO_CD_POCO_012120 e POCO_CD_POCO_012097.'

In [47]:
chain.run("Quais s√£o os ID campos que atravessam as unidades litoestratigr√°ficas formacao_254?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual)-[:crosses]->(:lithostratigraphic_unit { _id: "formacao_254" }) RETURN n._id[0m
Full Context:
[32;1m[1;3m[{'n._id': 'POCO_CD_POCO_012020'}][0m

[1m> Finished chain.[0m


'Os campos que atravessam as unidades litoestratigr√°ficas formacao_254 s√£o:\n- POCO_CD_POCO_012020'

In [46]:
chain.run("Quais s√£o os ID dos po√ßos que atravessam as unidades litoestratigr√°ficas formacao_294?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:crosses]->(:lithostratigraphic_unit {_id: "formacao_294"}) RETURN w._id;[0m
Full Context:
[32;1m[1;3m[{'w._id': 'POCO_CD_POCO_012020'}, {'w._id': 'POCO_CD_POCO_012120'}, {'w._id': 'POCO_CD_POCO_012097'}][0m

[1m> Finished chain.[0m


'Os po√ßos que atravessam as unidades litoestratigr√°ficas formacao_294 s√£o: POCO_CD_POCO_012020, POCO_CD_POCO_012120 e POCO_CD_POCO_012097.'

In [45]:
chain.run("Que √© a estrutura ID TEFR_CD_TIPO_EST_FISICA_ROCHA_004?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:geological_structure {_id: "TEFR_CD_TIPO_EST_FISICA_ROCHA_004"}) RETURN n;[0m
Full Context:
[32;1m[1;3m[{'n': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#TEFR_CD_TIPO_EST_FISICA_ROCHA_004', '_id': 'TEFR_CD_TIPO_EST_FISICA_ROCHA_004'}}][0m

[1m> Finished chain.[0m


'A estrutura ID TEFR_CD_TIPO_EST_FISICA_ROCHA_004 √© uma rocha de tipo f√≠sico.'

In [53]:
chain.run("Quais s√£o os ID dos po√ßos que atravessam as unidades litoestratigr√°ficas formacao_294 e apresentam estrutura ID TEFR_CD_TIPO_EST_FISICA_ROCHA_004?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:crosses]->(l:lithostratigraphic_unit {_id: "formacao_294"})
MATCH (w)-[:located_in]->(:geological_structure {_id: "TEFR_CD_TIPO_EST_FISICA_ROCHA_004"})
RETURN w._id[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A informa√ß√£o solicitada n√£o se encontra no grafo disponibilizado.'

### ‚úÖ Pregunta No. 12 

In [682]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_024505?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_024505"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0373', '_id': 'CAMP_CD_CAMPO_0373'}}][0m

[1m> Finished chain.[0m


'O po√ßo POCO_CD_POCO_024505 est√° localizado no campo CAMP_CD_CAMPO_0373.'

In [221]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_023172?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_023172"})-[:located_in]->(location)
RETURN location;[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_051', '_id': 'BASE_CD_BACIA_051'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#basin', 'rdfs_label': 'bacia', '_id': 'basin'}}][0m

[1m> Finished chain.[0m


'A localiza√ß√£o do po√ßo POCO_CD_POCO_023172 est√° na bacia identificada como BASE_CD_BACIA_051.'

In [339]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_006882?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_006882"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_116', '_id': 'BASE_CD_BACIA_116'}}][0m

[1m> Finished chain.[0m


'O po√ßo POCO_CD_POCO_006882 est√° localizado na bacia identificada como BASE_CD_BACIA_116.'

In [340]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_011894?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well {_id: "POCO_CD_POCO_011894"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_316', '_id': 'BASE_CD_BACIA_316'}}][0m

[1m> Finished chain.[0m


'O po√ßo POCO_CD_POCO_011894 est√° localizado na bacia identificada como BASE_CD_BACIA_316.'

In [341]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_006789?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_006789"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#basin', 'rdfs_label': 'bacia', '_id': 'basin'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_106', '_id': 'BASE_CD_BACIA_106'}}][0m

[1m> Finished chain.[0m


'O po√ßo POCO_CD_POCO_006789 est√° localizado na bacia identificada como BASE_CD_BACIA_106.'

In [342]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_016933?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_016933"})-[:located_in]->(location)
RETURN location[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_100', '_id': 'BASE_CD_BACIA_100'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#field', 'rdfs_label': 'campo', '_id': 'field'}}, {'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0234', '_id': 'CAMP_CD_CAMPO_0234'}}][0m

[1m> Finished chain.[0m


'O po√ßo POCO_CD_POCO_016933 est√° localizado no campo CAMP_CD_CAMPO_0234, que por sua vez est√° localizado na bacia BASE_CD_BACIA_100.'

In [343]:
chain.run("Qual √© a localiza√ß√£o do po√ßo POCO_CD_POCO_023169?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: "POCO_CD_POCO_023169"})-[:located_in]->(location)
RETURN location;[0m
Full Context:
[32;1m[1;3m[{'location': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#BASE_CD_BACIA_051', '_id': 'BASE_CD_BACIA_051'}}][0m

[1m> Finished chain.[0m


'O po√ßo POCO_CD_POCO_023169 est√° localizado na bacia identificada como BASE_CD_BACIA_051.'

### Pregunta No. 13

In [804]:
chain.run("Qual √© o intervalo geologico da forma√ß√£o_102?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:owl_NamedIndividual {_id: "forma√ß√£o_102"})-[:has_age]->(intervalo:geological_time_interval)
RETURN intervalo[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'O intervalo geol√≥gico da forma√ß√£o_102 √© do per√≠odo Cret√°ceo ao per√≠odo Paleogeno.'

In [844]:
chain.run("Qual √© forma√ß√£o ou unidade litoestratigrafica que tem intervalo geologico id Paleogeno?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:geological_time_interval {_id: "Paleogeno"})<-[:has_age]-(:owl_NamedIndividual)-[:part_of]->(u:lithostratigraphic_unit)
RETURN u[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A forma√ß√£o ou unidade litoestratigr√°fica que possui intervalo geol√≥gico do Pale√≥geno √© a Forma√ß√£o X.'

In [810]:
chain.run("Quais s√£o os po√ßos localizados na bacia id BASE_CD_BACIA_116 atravessa unidades litoestratigr√°ficas e possui intervalo geologico id Paleocene?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})-[:located_in]->(l:lithostratigraphic_unit)-[:crosses]->(:geological_time_interval {_id: "Paleocene"})
RETURN w[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Com base nas informa√ß√µes fornecidas no grafo, os po√ßos localizados na bacia com o identificador BASE_CD_BACIA_116, que atravessam unidades litoestratigr√°ficas e possuem intervalo geol√≥gico do Paleoceno s√£o:\n- Po√ßo com identificador id_poco_1\n- Po√ßo com identificador id_poco_2'

In [777]:
chain.run("Quais as entidades que tem intervalo geologico Mesozoico?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (e:owl_NamedIndividual)-[:has_age]->(:Albian_quality)
RETURN e;[0m
Full Context:
[32;1m[1;3m[{'e': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#grupo_000', '_id': 'grupo_000'}}, {'e': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#SD_000', '_id': 'SD_000'}}][0m

[1m> Finished chain.[0m


'As entidades que t√™m intervalo geol√≥gico Mesozoico s√£o o grupo_000 e o SD_000.'

In [781]:
chain.run("Quais s√£o os po√ßos localizados na bacia id BASE_CD_BACIA_281 e que tem intervalo geologico id Mesozoico?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_281"})-[:located_in]->(:geological_time_interval {_id: "Mesozoico"})
RETURN well[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Com base nas informa√ß√µes fornecidas no grafo, a query Cypher para encontrar os po√ßos localizados na bacia com o ID BASE_CD_BACIA_281 e que possuem intervalo geol√≥gico com o ID Mesozoico seria:\n\nMATCH (p:Poco)-[:LOCALIZADO_EM]->(b:Bacia {id: "BASE_CD_BACIA_281"})\nMATCH (p)-[:POSSUI]->(i:IntervaloGeologico {id: "Mesozoico"})\nRETURN p\n\nEsta query ir√° retornar os po√ßos que est√£o localizados na bacia com o ID BASE_CD_BACIA_281 e que possuem o intervalo geol√≥gico com o ID Mesozoico.'

### ‚úÖ **Pregunta No. 14**

In [713]:
chain.run("Quais s√£o os po√ßos localizados no campo _id: CAMP_CD_CAMPO_0065?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(field:field {_id: "CAMP_CD_CAMPO_0065"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_020490', '_id': 'POCO_CD_POCO_020490'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_021725', '_id': 'POCO_CD_POCO_021725'}}][0m

[1m> Finished chain.[0m


'No campo CAMP_CD_CAMPO_0065, est√£o localizados os seguintes po√ßos:\n- POCO_CD_POCO_020490\n- POCO_CD_POCO_021725'

In [714]:
chain.run("Quais s√£o os po√ßos localizados no campo _id: CAMP_CD_CAMPO_0373?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0373"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}}][0m

[1m> Finished chain.[0m


'Os po√ßos localizados no campo com o ID CAMP_CD_CAMPO_0373 s√£o:\n- POCO_CD_POCO_024505'

In [741]:
chain.run("Qual √© o po√ßo localizado no campo ‚ÄúCAMP_CD_CAMPO_0373‚Äù e tamb√©m unidade litoestratigafica constitu√≠da por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0373"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit;[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024505', '_id': 'POCO_CD_POCO_024505'}, 'unit': {'_uri': 'http://www.semanti

'O po√ßo localizado no campo "CAMP_CD_CAMPO_0373" e que tamb√©m est√° associado √† unidade litoestratigr√°fica constitu√≠da pelo owl_Class id oil √© o POCO_CD_POCO_024505. Este po√ßo est√° relacionado com as seguintes unidades litoestratigr√°ficas: formacao_027, formacao_056, formacao_110, formacao_319 e formacao_200.'

In [743]:
chain.run("Qual √© o po√ßo localizado no campo ‚ÄúCAMP_CD_CAMPO_0970‚Äù e tamb√©m unidade litoestratigafica constitu√≠da por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0970"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_012040', '_id': 'POCO_CD_POCO_012040'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_012040', '_id': 'POCO_CD_POCO_012040'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_012040', '_id': 'POCO_CD_POCO_012040'}, 'unit': {'_uri': 'http://www.semantic

'O po√ßo localizado no campo "CAMP_CD_CAMPO_0970" e que tamb√©m est√° associado √† unidade litoestratigr√°fica constitu√≠da pelo owl_Class id oil √© o po√ßo de c√≥digo POCO_CD_POCO_012040. Este po√ßo est√° relacionado com as seguintes unidades litoestratigr√°ficas: formacao_027, formacao_056, formacao_110, formacao_319 e formacao_200.'

In [744]:
chain.run("Qual √© o po√ßo localizado no campo ‚ÄúCAMP_CD_CAMPO_0773‚Äù e tamb√©m unidade litoestratigafica constitu√≠da por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0773"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006960', '_id': 'POCO_CD_POCO_006960'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006960', '_id': 'POCO_CD_POCO_006960'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006960', '_id': 'POCO_CD_POCO_006960'}, 'unit': {'_uri': 'http://www.semantic

'O po√ßo localizado no campo "CAMP_CD_CAMPO_0773" e que tamb√©m est√° associado √† unidade litoestratigr√°fica constitu√≠da pelo owl_Class id oil √© o po√ßo com o identificador POCO_CD_POCO_006960.'

In [747]:
chain.run("Qual √© o po√ßo localizado no campo ‚ÄúCAMP_CD_CAMPO_0682‚Äù e tamb√©m unidade litoestratigafica constitu√≠da por owl_Class id oil?") 



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0682"}), (unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_Class {_id: "oil"})
RETURN well, unit[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024918', '_id': 'POCO_CD_POCO_024918'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_027', '_id': 'formacao_027'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024918', '_id': 'POCO_CD_POCO_024918'}, 'unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_056', '_id': 'formacao_056'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_024918', '_id': 'POCO_CD_POCO_024918'}, 'unit': {'_uri': 'http://www.semantic

'O po√ßo localizado no campo "CAMP_CD_CAMPO_0682" e que tamb√©m est√° associado √† unidade litoestratigr√°fica constitu√≠da pelo owl_Class id oil √© o po√ßo de c√≥digo POCO_CD_POCO_024918. Este po√ßo est√° relacionado com as seguintes unidades litoestratigr√°ficas: formacao_027, formacao_056, formacao_110, formacao_319 e formacao_200.'

In [681]:
chain.run("Que √© o fludio geologico o id oil?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:geological_structure)
WHERE n._id = "oil"
RETURN n;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'O fluido geol√≥gico com o ID "oil" √© um tipo de fluido presente no subsolo que possui propriedades espec√≠ficas relacionadas √† extra√ß√£o de petr√≥leo. Esse fluido pode ser encontrado em reservat√≥rios geol√≥gicos e √© de extrema import√¢ncia para a ind√∫stria petrol√≠fera.'

### ‚úÖ **Pregunta No. 15.**

In [24]:
chain.run("Quais forma√ß√µes possuem carstes?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:owl_NamedIndividual)-[:part_of]->(u:lithostratigraphic_unit)
WHERE (l)-[:rdf_type]->(:owl_Class {rdfs_label: "Carste"})
RETURN u;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'Carstes s√£o forma√ß√µes geol√≥gicas que se desenvolvem em terrenos calc√°rios, resultantes da dissolu√ß√£o da rocha por √°guas √°cidas. Essas forma√ß√µes s√£o caracterizadas por apresentarem relevos c√°rsticos, como dolinas, cavernas, lapiaz e grutas. Dessa forma, as forma√ß√µes geol√≥gicas que possuem carstes s√£o aquelas compostas por rochas calc√°rias, que s√£o mais suscet√≠veis √† a√ß√£o da √°gua √°cida, resultando na forma√ß√£o dessas caracter√≠sticas peculiares.'

In [750]:
chain.run("Qual √© a forma√ß√£o ou unidade litoestrategrafica possue carstes?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (l:owl_NamedIndividual)-[:part_of]->(u:lithostratigraphic_unit)
WHERE (l)-[:located_in]->(:field)
RETURN u;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A forma√ß√£o ou unidade litoestratigr√°fica que possui carstes √© a Forma√ß√£o Calc√°ria.'

### ‚úÖ Pregunta No. 16

In [286]:
chain.run("Qual a idade geol√≥gica da litologia arenito do campo identificado CAMP_CD_CAMPO_0065?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (lithostratigraphic_unit:lithostratigraphic_unit {_id: "CAMP_CD_CAMPO_0065"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A idade geol√≥gica da litologia arenito do campo identificado como CAMP_CD_CAMPO_0065 √© do per√≠odo Cret√°ceo.'

In [846]:
chain.run("Qual √© a idade geol√≥gica do basalto localizado no campo CAMP_CD_CAMPO_0065?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (b:basin)-[:located_in]->(f:field)-[:located_in]->(w:well)-[:crosses]->(l:lithostratigraphic_unit)-[:has_age]->(a:owl_NamedIndividual)
WHERE b._id = "CAMP_CD_CAMPO_0065"
RETURN a._id;[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A idade geol√≥gica do basalto localizado no campo CAMP_CD_CAMPO_0065 √© de 1,2 milh√µes de anos, conforme a propriedade "idade_geologica" associada ao relacionamento "LOCALIZADO_EM" entre o basalto e o campo.'

In [292]:
chain.run("Qual a idade geologica do earth material named areia que est√° localizada no campo CAMP_CD_CAMPO_0065?")



[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (n:owl_NamedIndividual {rdfs_label: "areia"})-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0065"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m


'A idade geol√≥gica do material terrestre chamado areia, localizado no campo CAMP_CD_CAMPO_0065, √© do per√≠odo Quatern√°rio.'

# üïµÔ∏è‚Äç‚ôÄÔ∏è **Knowledge graph agent**

In [144]:
from langchain.agents import create_structured_chat_agent, create_openai_functions_agent, Tool, AgentExecutor, AgentType, create_tool_calling_agent, create_react_agent

tools = [
    Tool(
        name="Embeddings",
        func=vector_qa.invoke,
        description="""Useful when you need to answer questions about embeddings.
        Not useful for counting the number of tasks.
        Use full question as input.
        """,
    ),
    Tool(
        name="Graph",
        func=chain.invoke,
        description="""Useful when you need to answer questions about movies or person.
        Also useful for any sort of aggregation like counting the number of tasks, etc.
        Use full question as input.
        """,
    ),
]

In [150]:
from langchain.prompts import PromptTemplate
from langchain_core.prompts import ChatPromptTemplate

# Define the prompt template with placeholders
prompt = PromptTemplate(
    input_variables=["agent_scratchpad", "tools", "tool_names", "chat_history", "input"],
    template="""
    You are a knowledgeable assistant. You have access to the following tools:

    TOOLS:
    ------
    Assistant has access to the following tools:
    {tools}
    To use a tool, please use the following format:
    ```
    Thought: Do I need to use a tool? Yes
    Action: the action to take, should be one of [{tool_names}]
    Action Input: the input to the action
    Observation: the result of the action
    ```
    
    When you have a response to say to the Human, or if you do not need to use a tool, you MUST use the format:
    ```
    Thought: Do I need to use a tool? No
    Final Answer: [your response here]
    ```

    Begin!

    Previous conversation history: {chat_history}

    New input: {input}
    {agent_scratchpad}
    """
)


In [131]:
from langchain.agents import AgentExecutor, create_tool_calling_agent
from langchain_core.prompts import ChatPromptTemplate

# Definir el prompt con todos los marcadores de posici√≥n requeridos
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are a helpful assistant with access to several tools."),
        ("system", "Available tools: {tool_names}"),
        ("system", "Tools details: {tools}"),
        ("system", "Chat history: {chat_history}"),
        ("human", "{input}"),
        ("system", "{agent_scratchpad}"),
    ]
)


In [151]:
expected_variables = ["tools", "tool_names", "chat_history", "agent_scratchpad", "input"]
missing_vars = [var for var in expected_variables if var not in prompt.input_variables]

if missing_vars:
    print(f"Missing variables in prompt: {missing_vars}")


In [152]:
# Create the agent
agent = create_react_agent( llm_petrobras, tools, prompt)
# Create an executor for the agent
agent_executor = AgentExecutor(agent=agent, tools=tools)

In [153]:
expected_variables = ["tools", "tool_names", "chat_history", "agent_scratchpad", "input"]
missing_vars = [var for var in expected_variables if var not in prompt.input_variables]

if missing_vars:
    print(f"Missing variables in prompt: {missing_vars}")


In [155]:
query = "Quais sao os id da bacia BASE_CD_BACIA_030?"
response = agent_executor.invoke({"input": query})
print(response)


KeyError: "Input to PromptTemplate is missing variables {'chat_history'}.  Expected: ['agent_scratchpad', 'chat_history', 'input'] Received: ['input', 'intermediate_steps', 'agent_scratchpad']"

### Outra abordagem

In [169]:
from pydantic import BaseModel
from langchain.tools.base import StructuredTool
from langchain.agents.agent_toolkits import create_conversational_retrieval_agent

# Define el esquema de argumentos para la herramienta Graph
class GraphArgs(BaseModel):
    bacia_URI: str

class EmbeddingsArgs(BaseModel):
    query: str

# Suponiendo que `graph_tool` es una funci√≥n que deseas usar como herramienta
graph_tool = StructuredTool(
    name="Graph",
    func=chain.invoke,  # Aqu√≠ la funci√≥n que se utilizar√°
    description="Useful for retrieving information about the graph based on multiple inputs.",
    args_schema=GraphArgs
)

embeddings_tool = StructuredTool(
    name="Embeddings",
    func=vector_qa.invoke,  # Aqu√≠ la funci√≥n que se utilizar√°
    description="Useful when you need to answer questions about embeddings.",
    args_schema=EmbeddingsArgs
)

tools = [graph_tool, embeddings_tool]

In [170]:
from langchain.agents.agent_toolkits import create_conversational_retrieval_agent
agent_executor = create_conversational_retrieval_agent(llm_petrobras, tools, verbose=True)

result = agent_executor.invoke({"input": "Quais sao os po√ßos localizados na bacia BASE_CD_BACIA_030?"})
print(result)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `{'bacia_URI': 'BASE_CD_BACIA_030'}`


[0m

TypeError: invoke() missing 1 required positional argument: 'input'

# üîç Query's Using miniKGraph

In [163]:
response = agent_executor.invoke({"input": "Quais sao os id dos po√ßos localizados na bacia BASE_CD_BACIA_030?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `{'bacia_name': 'BASE_CD_BACIA_030'}`


[0m

TypeError: invoke() missing 1 required positional argument: 'input'

In [None]:
response = agent_executor.invoke({"input": "Quantos sao os po√ßos localizados na bacia BASE_CD_BACIA_030?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Quantos sao os campos que estao localizados na bacia BASE_CD_BACIA_030?"})
print(response)

### **‚úî Perguntas single-hop sem necessidade de agrega√ß√£o de informa√ß√µes (um para um)**
### ‚úÖ **Pregunta No. 1**

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia est√° localizado o campo √ÅREA DO BAS-64?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia est√° localizado o campo de URI CAMP_CD_CAMPO_0572?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia est√° localizado o campo de URI CAMP_CD_CAMPO_0888?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia est√° localizado o campo Japiim?"})
print(response)

In [None]:
response = agent_executor.invoke({"input": "Em qual bacia est√° localizado o campo de URI CAMP_CD_CAMPO_0131?"})
print(response)

### ‚úÖ **Pregunta No. 2**

# üîç Query's Using PetroKGraph

In [130]:
response = agent_executor.invoke({"input": "Quais sao os id dos po√ßos localizados na bacia BASE_CD_BACIA_100?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all well IDs in basin BASE_CD_BACIA_100`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: 'BASE_CD_BACIA_100'}) RETURN w._id;[0m
Full Context:
[32;1m[1;3m[{'w._id': 'POCO_CD_POCO_017478'}, {'w._id': 'POCO_CD_POCO_016933'}, {'w._id': 'POCO_CD_POCO_016511'}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all well IDs in basin BASE_CD_BACIA_100', 'result': 'Os IDs dos po√ßos na bacia BASE_CD_BACIA_100 s√£o:\n- POCO_CD_POCO_017478\n- POCO_CD_POCO_016933\n- POCO_CD_POCO_016511'}[0m[32;1m[1;3mOs IDs dos po√ßos localizados na bacia BASE_CD_BACIA_100 s√£o:
- POCO_CD_POCO_017478
- POCO_CD_POCO_016933
- POCO_CD_POCO_016511[0m

[1m> Finished chain.[0m
{'input': 'Quais sao os id dos po√ßos localizados na bacia BASE_CD_BACIA_100?', 'output': 'Os IDs dos po√ßos localizados na bacia BASE_CD_BACIA_100 s√£o:

In [134]:
response = agent_executor.invoke({"input": "Quais s√£o os id po√ßos localizados na bacia com id BASE_CD_BACIA_116?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all wells in basin BASE_CD_BACIA_116`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(basin:basin)
WHERE basin._id = "BASE_CD_BACIA_116"
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_009032', '_id': 'POCO_CD_POCO_009032'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006882', '_id': 'POCO_CD_POCO_006882'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_007140', '_id': 'POCO_CD_POCO_007140'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_010831', '_id': 'POCO_CD_POCO_010831'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all wells in basin B

In [135]:
response = agent_executor.invoke({"input": "Quantos sao os po√ßos localizados na bacia BASE_CD_BACIA_080?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `count wells in basin BASE_CD_BACIA_080`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(b:basin)
WHERE b._id = 'BASE_CD_BACIA_080'
RETURN COUNT(w) as well_count;[0m
Full Context:
[32;1m[1;3m[{'well_count': 1}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'count wells in basin BASE_CD_BACIA_080', 'result': 'O n√∫mero de po√ßos na bacia BASE_CD_BACIA_080 √© 1.'}[0m[32;1m[1;3mH√° 1 po√ßo localizado na bacia BASE_CD_BACIA_080.[0m

[1m> Finished chain.[0m
{'input': 'Quantos sao os po√ßos localizados na bacia BASE_CD_BACIA_080?', 'output': 'H√° 1 po√ßo localizado na bacia BASE_CD_BACIA_080.'}


In [142]:
response = agent_executor.invoke({"input": "Quantos sao os campos que estao localizados na bacia BASE_CD_BACIA_030?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quantos campos estao localizados na bacia BASE_CD_BACIA_281?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_281"})
RETURN COUNT(field) as total_campos;[0m
Full Context:
[32;1m[1;3m[{'total_campos': 15}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quantos campos estao localizados na bacia BASE_CD_BACIA_281?', 'result': 'Na bacia BASE_CD_BACIA_281 est√£o localizados 3 campos.'}[0m[32;1m[1;3mNa bacia BASE_CD_BACIA_281 est√£o localizados 3 campos.[0m

[1m> Finished chain.[0m
{'input': 'Quantos sao os campos que estao localizados na bacia BASE_CD_BACIA_281?', 'output': 'Na bacia BASE_CD_BACIA_281 est√£o localizados 3 campos.'}


### ‚úÖ **Pregunta No. 1**

In [69]:
response = agent_executor.invoke({"input": "Quais po√ßos localizados na bacia BASE_CD_BACIA_116?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quais po√ßos est√£o localizados na bacia BASE_CD_BACIA_116?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (w:well)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})
RETURN w[0m
Full Context:
[32;1m[1;3m[{'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_009032', '_id': 'POCO_CD_POCO_009032'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_006882', '_id': 'POCO_CD_POCO_006882'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_007140', '_id': 'POCO_CD_POCO_007140'}}, {'w': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_010831', '_id': 'POCO_CD_POCO_010831'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quais po√ßos est√£o localizados na bacia 

### ‚úÖ **Pregunta No. 2**

In [70]:
response = agent_executor.invoke({"input": "Quais sao os campos que estao localizados na bacia identificada BASE_CD_BACIA_116?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `campos localizados na bacia BASE_CD_BACIA_116`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (field:field)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_116"})
RETURN field;[0m
Full Context:
[32;1m[1;3m[{'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0773', '_id': 'CAMP_CD_CAMPO_0773'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0519', '_id': 'CAMP_CD_CAMPO_0519'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0536', '_id': 'CAMP_CD_CAMPO_0536'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0951', '_id': 'CAMP_CD_CAMPO_0951'}}, {'field': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CA

In [131]:
response = agent_executor.invoke({"input": "Quais os campos que estao localizados na bacia BASE_CD_BACIA_281?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `campos na bacia BASE_CD_BACIA_281`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:field)-[:located_in]->(:basin {_id: "BASE_CD_BACIA_281"})
RETURN f[0m
Full Context:
[32;1m[1;3m[{'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0065', '_id': 'CAMP_CD_CAMPO_0065'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0523', '_id': 'CAMP_CD_CAMPO_0523'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0003', '_id': 'CAMP_CD_CAMPO_0003'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0734', '_id': 'CAMP_CD_CAMPO_0734'}}, {'f': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#CAMP_CD_CAMPO_0682', '_id': 'CAMP_CD_CAMPO_

## ‚úÖ **Pregunta No. 3**

In [133]:
response = agent_executor.invoke({"input": "Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0970?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0970?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field { _id: "CAMP_CD_CAMPO_0970" })
RETURN COUNT(well) as total_wells;[0m
Full Context:
[32;1m[1;3m[{'total_wells': 1}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0970?', 'result': 'No campo CAMP_CD_CAMPO_0970 est√° localizado 1 po√ßo.'}[0m[32;1m[1;3mNo campo CAMP_CD_CAMPO_0970 est√° localizado 1 po√ßo.[0m

[1m> Finished chain.[0m
{'input': 'Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0970?', 'output': 'No campo CAMP_CD_CAMPO_0970 est√° localizado 1 po√ßo.'}


In [139]:
response = agent_executor.invoke({"input": "Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0352?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0352?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field { _id: "CAMP_CD_CAMPO_0352" })
RETURN COUNT(well) as total_wells;[0m
Full Context:
[32;1m[1;3m[{'total_wells': 1}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0352?', 'result': 'No campo CAMP_CD_CAMPO_0352 est√° localizado 1 po√ßo.'}[0m[32;1m[1;3mNo campo CAMP_CD_CAMPO_0352 est√° localizado 1 po√ßo.[0m

[1m> Finished chain.[0m
{'input': 'Quantos po√ßos est√£o localizados no campo CAMP_CD_CAMPO_0352?', 'output': 'No campo CAMP_CD_CAMPO_0352 est√° localizado 1 po√ßo.'}


## ‚úÖ **Pregunta No. 4**

In [145]:
response = agent_executor.invoke({"input": "Quais s√£o os po√ßos localizados no campo CAMP_CD_CAMPO_0065?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all wells in field CAMP_CD_CAMPO_0065`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0065"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_020490', '_id': 'POCO_CD_POCO_020490'}}, {'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_021725', '_id': 'POCO_CD_POCO_021725'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all wells in field CAMP_CD_CAMPO_0065', 'result': 'Com base nas informa√ß√µes fornecidas, os po√ßos no campo CAMP_CD_CAMPO_0065 s√£o:\n- POCO_CD_POCO_020490\n- POCO_CD_POCO_021725'}[0m[32;1m[1;3mOs po√ßos localizados no campo CAMP_CD_CAMPO_0065 s√£o:
1. POCO_CD_POCO_020490
2. POCO_CD_POCO_021725[0m

[1m> Finished 

In [150]:
response = agent_executor.invoke({"input": "Quais s√£o os po√ßos localizados no campo CAMP_CD_CAMPO_0352?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `List all wells in field CAMP_CD_CAMPO_0352`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:well)-[:located_in]->(:field {_id: "CAMP_CD_CAMPO_0352"})
RETURN well[0m
Full Context:
[32;1m[1;3m[{'well': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#POCO_CD_POCO_018470', '_id': 'POCO_CD_POCO_018470'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'List all wells in field CAMP_CD_CAMPO_0352', 'result': "MATCH (f:Field {id: 'CAMP_CD_CAMPO_0352'})-[:BELONGS_TO]->(w:Well)\nRETURN w.id, w.name, w.type, w.status, w.depth\nORDER BY w.id"}[0m[32;1m[1;3mOs po√ßos localizados no campo CAMP_CD_CAMPO_0352 s√£o:

1. Po√ßo ID: 001, Nome: Po√ßo 001, Tipo: Tipo A, Status: Ativo, Profundidade: 2000m
2. Po√ßo ID: 002, Nome: Po√ßo 002, Tipo: Tipo B, Status: Inativo, Profundidade: 1800m
3. Po√ßo ID: 003, Nome: Po√ßo 003, Ti

## ‚úÖ **Pregunta No. 5**

In [143]:
response = agent_executor.invoke({"input": "Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit {_id: "formacao_110"})-[:has_age]->(age)
RETURN age[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110?', 'result': 'A idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110 √© Cret√°ceo.'}[0m[32;1m[1;3mA idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110 √© Cret√°ceo.[0m

[1m> Finished chain.[0m
{'input': 'Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110?', 'output': 'A idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_110 √© Cret√°ceo.'}


In [144]:
response = agent_executor.invoke({"input": "Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Qual a idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit {_id: "grupo_000"})-[:has_age]->(a)
RETURN a[0m
Full Context:
[32;1m[1;3m[{'a': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#Albian_quality_grupo_000', '_id': 'Albian_quality_grupo_000'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Qual a idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000?', 'result': 'A idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000 √© Albian.'}[0m[32;1m[1;3mA idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000 √© Albian.[0m

[1m> Finished chain.[0m
{'input': 'Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000?', 'output': 'A idade geol√≥gica da Forma√ß√£o identificada pelo ID grupo_000 

In [145]:
response = agent_executor.invoke({"input": "Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Qual a idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit {_id: "formacao_295"})-[:has_age]->(a)
RETURN a[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Qual a idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295?', 'result': 'A idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295 √© Cret√°ceo.'}[0m[32;1m[1;3mA idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295 √© Cret√°ceo.[0m

[1m> Finished chain.[0m
{'input': 'Qual idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295?', 'output': 'A idade geol√≥gica da Forma√ß√£o identificada pelo ID formacao_295 √© Cret√°ceo.'}


## ‚úÖ **Pregunta No. 6**

In [155]:
response = agent_executor.invoke({"input": "Qual √© o material terrestre e a unidade litoestratigr√°fica que atravessa o po√ßo id POCO_CD_POCO_024505?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `What is the lithostratigraphic unit and terrestrial material that crosses well POCO_CD_POCO_024505?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (well:owl_NamedIndividual {_id: 'POCO_CD_POCO_024505'})-[:crosses]->(lithostratigraphic_unit:lithostratigraphic_unit)
RETURN lithostratigraphic_unit[0m
Full Context:
[32;1m[1;3m[{'lithostratigraphic_unit': {'_uri': 'http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#formacao_110', '_id': 'formacao_110'}}][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'What is the lithostratigraphic unit and terrestrial material that crosses well POCO_CD_POCO_024505?', 'result': 'A unidade litoestratigr√°fica √© a Forma√ß√£o 110. N√£o foi poss√≠vel encontrar informa√ß√µes sobre o material terrestre que atravessa o po√ßo POCO_CD_POCO_024505 no grafo dado.'}[0m[32;1m[1;3mA unidade litoestratigr√

##  **Pregunta No. 7**

In [157]:
response = agent_executor.invoke({"input": "Qual √© o id da forma√ß√£o que atravessa o po√ßo com identificador POCO_CD_POCO_024505 e que √© constitu√≠da por id sandstone?"})
print(response)



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `formation atravessa po√ßo POCO_CD_POCO_024505 e √© constitu√≠da por sandstone`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (f:lithostratigraphic_unit)-[:crosses]->(:well {_id: "POCO_CD_POCO_024505"}) 
WHERE f._id = "sandstone"
RETURN f[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'formation atravessa po√ßo POCO_CD_POCO_024505 e √© constitu√≠da por sandstone', 'result': 'A forma√ß√£o que atravessa o po√ßo POCO_CD_POCO_024505 e √© constitu√≠da por sandstone √© a forma√ß√£o "Forma√ß√£o X". A forma√ß√£o "Forma√ß√£o X" possui uma rela√ß√£o de atravessar com o po√ßo POCO_CD_POCO_024505 e possui a propriedade de ser constitu√≠da por sandstone. N√£o foram fornecidas informa√ß√µes adicionais no grafo.'}[0m[32;1m[1;3mA forma√ß√£o que atravessa o po√ßo com identificador POCO_CD_POCO_024505 e que √© constitu√≠da por 

## **Pregunta No. 8**

In [158]:
response = agent_executor.invoke({"input": "Quais unidades litoestratigraficas ou forma√ß√µes atravessam o po√ßo _id:POCO_CD_POCO_024505  e s√£o constitu√≠das pelo id oil?"})
print(response)




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3m
Invoking: `Graph` with `Quais unidades litoestratigraficas ou forma√ß√µes atravessam o po√ßo _id:POCO_CD_POCO_024505 e s√£o constitu√≠das pelo id oil?`


[0m

[1m> Entering new GraphCypherQAChain chain...[0m
Generated Cypher:
[32;1m[1;3mMATCH (poco:well {_id: "POCO_CD_POCO_024505"})-[:crosses]->(unit:lithostratigraphic_unit)-[:constituted_by]->(:owl_NamedIndividual {_id: "oil"})
RETURN unit[0m
Full Context:
[32;1m[1;3m[][0m

[1m> Finished chain.[0m
[33;1m[1;3m{'query': 'Quais unidades litoestratigraficas ou forma√ß√µes atravessam o po√ßo _id:POCO_CD_POCO_024505 e s√£o constitu√≠das pelo id oil?', 'result': 'N√£o foi poss√≠vel encontrar a informa√ß√£o requerida no grafo dado.'}[0m[32;1m[1;3mDesculpe, n√£o foi poss√≠vel encontrar a informa√ß√£o sobre as unidades litoestratigr√°ficas ou forma√ß√µes que atravessam o po√ßo POCO_CD_POCO_024505 e s√£o constitu√≠das pelo id oil. Se precisar de mais alguma informa√ß√£

# ‚úèÔ∏èüìö **Conclus√£o**

Grafos de conhecimento s√£o estruturas de dados que combinam dados estruturados e n√£o estruturados de maneira interconectada, tornando-se uma excelente op√ß√£o para alimentar aplica√ß√µes RAG (Retrieval-Augmented Generation). Eles melhoram a precis√£o, contextualiza√ß√£o e relev√¢ncia das respostas geradas, aproveitando ao m√°ximo as capacidades de recupera√ß√£o e gera√ß√£o de informa√ß√µes.

### **Vantagens dos Grafos de Conhecimento:**

### 1. Rela√ß√µes Interconectadas:

- Grafos de conhecimento modelam rela√ß√µes complexas entre entidades (como pessoas, peliculas, no caso do grafo de Movies; e ba√ßias, campos e po√ßos, no caso do PetroKGraph), o que permite uma compreens√£o mais profunda e contextualizada dos dados.
- S√£o ideais para representar conhecimento que envolve m√∫ltiplas rela√ß√µes e hierarquias.

### 2. Integra√ß√£o de Dados Estruturados e N√£o Estruturados:

- Permitem a integra√ß√£o de dados estruturados (como tabelas e bancos de dados relacionais) e dados n√£o estruturados (como texto, imagens, e v√≠deos) em uma √∫nica estrutura coerente.
- Dados n√£o estruturados podem ser anotados e vinculados a entidades no grafo, facilitando a recupera√ß√£o contextual.

### 3. Consultas Flex√≠veis:

- Usando linguagens de consulta como Cypher, √© poss√≠vel executar consultas complexas que exploram as rela√ß√µes e conex√µes entre diferentes entidades.
- Isso possibilita a recupera√ß√£o precisa de informa√ß√µes relevantes, mesmo em cen√°rios com dados altamente interconectados.

### 4. Atualiza√ß√£o Din√¢mica e Enriquecimento de Dados:

- Grafos de conhecimento podem ser continuamente atualizados e enriquecidos com novos dados, mantendo a base de conhecimento atualizada.
- Facilitam a incorpora√ß√£o de novas fontes de dados, melhorando a abrang√™ncia e a qualidade das respostas.