## Setting

In [3]:
#pip install langchain langchain-cohere langchain-groq langchain-community langchain-pinecone python-dotenv  pypdf

In [None]:
# Importa√ß√£o de bibliotecas para lidar com vari√°veis de ambiente
import os
from dotenv import load_dotenv, find_dotenv

# Loaders para carregar arquivos de texto e PDF
from langchain_community.document_loaders import PyPDFLoader

# Ferramentas para dividir documentos em partes menores
from langchain_text_splitters import CharacterTextSplitter

# Gera√ß√£o de embeddings com Cohere
from langchain_cohere import CohereEmbeddings

# Integra√ß√£o com o vetorstore Pinecone
from langchain_pinecone import PineconeVectorStore

# Mem√≥ria de conversa (n√£o utilizada no trecho atual, mas importada)
from langchain.memory import ConversationBufferMemory

# LLM da Groq (ChatGPT acelerado por hardware especializado)
from langchain_groq import ChatGroq

# Acesso ao hub de chains pr√©-constru√≠das do LangChain
from langchain import hub

# Chains para combinar documentos e fazer busca com recupera√ß√£o
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains.retrieval import create_retrieval_chain

# Vectorstore local alternativo (FAISS), n√£o utilizado nesse c√≥digo
from langchain_community.vectorstores import FAISS

  from .autonotebook import tqdm as notebook_tqdm


## Data

Chaves API

In [57]:
# Carrega as vari√°veis de ambiente do arquivo .env
load_dotenv(find_dotenv())

# Obt√©m as chaves de API das vari√°veis de ambiente
COHERE_API_KEY = os.getenv("COHERE_API_KEY")
PINECONE_API_KEY = os.getenv("PINECONE_API_KEY")
GROQ_API_KEY = os.getenv("GROQ_API_KEY")

In [58]:
# Conferindo e pegou as Chaves corretamente
print(f"COHERE_API_KEY: {COHERE_API_KEY}")  # Debug tempor√°rio
print(f"PINECONE_API_KEY: {PINECONE_API_KEY}")  # Debug tempor√°rio
print(f"GROQ_API_KEY: {GROQ_API_KEY}")  # Debug tempor√°rio

COHERE_API_KEY: TOEQPo2gzPWKLP7SUpwAW3svbK3Vwm7tZOkU6FX5
PINECONE_API_KEY: pcsk_65d8mR_TRTfYVcecxyGRyRQPFNARgkRmit2WWY75Q4KVx3YFmmXHA3tiUKWZbsSzYsQSY5
GROQ_API_KEY: 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


Carregando e cortando arquivo

In [5]:
# Carrega o conte√∫do do arquivo PDF
loader = PyPDFLoader('../data/2210.03629v3.pdf')
documents = loader.load()

In [60]:
# Divide o texto em partes menores para facilitar a vetoriza√ß√£o
text_splitter = CharacterTextSplitter(separator="\n", chunk_size=1000,chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# Mostra quantas partes foram geradas
print(f"Total de partes criadas: {len(docs)}")

Total de partes criadas: 129


Incorporando agente

In [None]:
# Instancia os embeddings usando o modelo da Cohere
embeddings = CohereEmbeddings(
    model="embed-english-v3.0",
    cohere_api_key=COHERE_API_KEY
)

In [None]:
# Nome do √≠ndice no Pinecone (deve j√° existir no console do Pinecone)
index_name = "pdf-demo"

# Cria o vetorstore a partir dos documentos, com os embeddings e configura√ß√µes do Pinecone
vectorstore_from_docs = PineconeVectorStore.from_documents(
    docs,
    embedding=embeddings,
    index_name=index_name,
)

In [63]:
# Teste uma busca sem√¢ntica:
vectorstore = PineconeVectorStore(index_name=index_name, embedding=embeddings)
print(vectorstore.similarity_search("What is a vector store?"))

[Document(id='69385612-be28-4b2f-b6e9-6053f3bc33bc', metadata={'author': '', 'creationdate': '2023-03-13T00:09:11+00:00', 'creator': 'LaTeX with hyperref', 'keywords': '', 'moddate': '2023-03-13T00:09:11+00:00', 'page': 30.0, 'page_label': '31', 'producer': 'pdfTeX-1.40.21', 'ptex.fullbanner': 'This is pdfTeX, Version 3.14159265-2.6-1.40.21 (TeX Live 2020) kpathsea version 6.3.2', 'source': 'data/2210.03629v3.pdf', 'subject': '', 'title': '', 'total_pages': 33.0, 'trapped': '/False'}, page_content='Published as a conference paper at ICLR 2023\nD.3 W EBSHOP TRAJECTORIES\nTable 10: Example trajectories for Webshop predicted by Act and ReAct. Compared to Act,\nReAct uses reasoning to Ô¨Ånd products that satisfy all target attributes.\nInstruction: get me a sixteen pack of apple cinnamon freeze dried banana chips, and price lower than 50.00 dollars\nAct ReAct\nAction: search\n[\nsixteen pack apple cinnamon freeze dried banana\nchips\n]\nObservation:[\nBack to Search\n]\nPage 1 (Total resul

Criando LLM e Chain

In [64]:
# Inicializa o LLM da Groq com Gemma2
llm = ChatGroq(
    model="Gemma2-9b-It",
    groq_api_key=GROQ_API_KEY,
    temperature=0.1
)                              

In [65]:
# Cria a chain de resposta com base nos documentos
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

retrieval_qa_chat_prompt = hub.pull("langchain-ai/retrieval-qa-chat")
combine_docs_chain = create_stuff_documents_chain(llm, retrieval_qa_chat_prompt)

# Cria o retriever para buscar documentos relevantes
retriever = vectorstore_from_docs.as_retriever()

# Cria a chain de RAG combinando busca + gera√ß√£o
rag_chain = create_retrieval_chain(retriever, combine_docs_chain)



In [66]:
# Testanto LLM 
res = rag_chain.invoke({"input":"O que √© React? Responda em portugu√™s."})
print("üîç Pergunta: O que √© React? Responda em portugu√™s.")
print("üí¨ Resposta: \n")
print(res['answer'])

üîç Pergunta: O que √© React? Responda em portugu√™s.
üí¨ Resposta: 

ReAct √© um paradigma geral que combina racioc√≠nio e a√ß√£o com modelos de linguagem para resolver diversas tarefas de racioc√≠nio e tomada de decis√£o em linguagem. 

Ele funciona promptando os modelos de linguagem a gerar tanto racioc√≠nios verbais quanto a√ß√µes relacionadas a uma tarefa de forma intercalada. Isso permite que o modelo realize racioc√≠nio din√¢mico para criar, manter e ajustar planos de alto n√≠vel para agir ("raciocinar para agir"), al√©m de interagir com ambientes externos (como a Wikipedia) para incorporar informa√ß√µes adicionais ao racioc√≠nio ("agir para raciocinar"). 


Em resumo, ReAct visa integrar a capacidade de pensar e agir em modelos de linguagem para solucionar problemas de forma mais completa e eficiente. 



## Finaliza√ß√£o com intera√ß√£o com o usu√°rio

In [None]:
# Fun√ß√£o interativa
def fazer_pergunta_rag():
    while True:
        pergunta = input("\n ‚ùì No que posso ajudar ‚ùì (ou digite 'sair' para encerrar):\n> ")
        
        if pergunta.lower() in ["sair", "exit", "quit"]:
            print("Encerrando. At√© logo!")
            break

        try:
            resposta = rag_chain.invoke({"input":f"{pergunta} Responda em portugu√™s"})
            print(f'üîç Pergunta: {pergunta}')
            print("\nüß† Resposta:\n")
            print(resposta["answer"])
        except Exception as e:
            print(f"\n‚ö†Ô∏è Erro ao gerar resposta: {e}")


In [68]:
# Execu√ß√£o
if __name__ == "__main__":
    fazer_pergunta_rag()

üîç Pergunta: O que √© react

üß† Resposta:

O texto descreve um modelo chamado ReAct, que visa tornar as tarefas de resolu√ß√£o de problemas de grandes modelos de linguagem (LLMs) mais interpret√°veis, diagnostic√°veis e controlados por humanos. 

O ReAct conecta LLMs com um espa√ßo de a√ß√µes para interagir com ambientes externos, como a web ou ambientes f√≠sicos. No entanto, os autores reconhecem os potenciais perigos dessa conex√£o, como o acesso a informa√ß√µes privadas ou a execu√ß√£o de a√ß√µes prejudiciais. 

Para minimizar esses riscos, os experimentos do ReAct se limitam a intera√ß√µes com sites espec√≠ficos (Wikipedia ou WebShop) que n√£o cont√™m informa√ß√µes privadas e sem a√ß√µes perigosas no espa√ßo de a√ß√µes (os modelos n√£o podem realmente comprar produtos no WebShop).

O texto tamb√©m menciona que os autores fornecem todos os prompts usados, experimentos adicionais com GPT-3 e o c√≥digo de prompting GPT-3 ReAct para aumentar a reprodutibilidade do estudo.


Em resu