## Setting

In [3]:
#pip install langchain langchain-cohere langchain-groq langchain-community langchain-pinecone python-dotenv

In [None]:
# Importa√ß√£o de bibliotecas para lidar com vari√°veis de ambiente
import os
from dotenv import load_dotenv, find_dotenv

# Loaders para carregar arquivos de texto e PDF
from langchain_community.document_loaders import TextLoader

# Ferramentas para dividir documentos em partes menores
from langchain_text_splitters import CharacterTextSplitter

# Gera√ß√£o de embeddings com Cohere
from langchain_cohere import CohereEmbeddings

# Integra√ß√£o com o vetorstore Pinecone
from langchain_pinecone import PineconeVectorStore

# Mem√≥ria de conversa (n√£o utilizada no trecho atual, mas importada)
from langchain.memory import ConversationBufferMemory

# LLM da Groq (ChatGPT acelerado por hardware especializado)
from langchain_groq import ChatGroq

# Acesso ao hub de chains pr√©-constru√≠das do LangChain
from langchain import hub

# Chains para combinar documentos e fazer busca com recupera√ß√£o
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains.retrieval import create_retrieval_chain

# Vectorstore local alternativo (FAISS), n√£o utilizado nesse c√≥digo
from langchain_community.vectorstores import FAISS

  from .autonotebook import tqdm as notebook_tqdm


## Data

Chaves das APIs

In [5]:
# Carrega as vari√°veis de ambiente do arquivo .env
load_dotenv(find_dotenv())

# Obt√©m as chaves de API das vari√°veis de ambiente
COHERE_API_KEY = os.getenv("COHERE_API_KEY")
PINECONE_API_KEY = os.getenv("PINECONE_API_KEY")
GROQ_API_KEY = os.getenv("GROQ_API_KEY")

In [6]:
# Conferindo e pegou as Chaves corretamente
print(f"COHERE_API_KEY: {COHERE_API_KEY}")  # Debug tempor√°rio
print(f"PINECONE_API_KEY: {PINECONE_API_KEY}")  # Debug tempor√°rio
print(f"GROQ_API_KEY: {GROQ_API_KEY}")  # Debug tempor√°rio

COHERE_API_KEY: TOEQPo2gzPWKLP7SUpwAW3svbK3Vwm7tZOkU6FX5
PINECONE_API_KEY: pcsk_65d8mR_TRTfYVcecxyGRyRQPFNARgkRmit2WWY75Q4KVx3YFmmXHA3tiUKWZbsSzYsQSY5
GROQ_API_KEY: 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


Carregando documento

In [7]:
# Carrega o conte√∫do do arquivo de texto
loader = TextLoader("../data/mediumblog1.txt")
documents = loader.load()

In [8]:
# Divide o texto em partes menores para facilitar a vetoriza√ß√£o
text_splitter = CharacterTextSplitter(separator="\n", chunk_size=1000,chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# Mostra quantas partes foram geradas
print(f"Total de partes criadas: {len(docs)}")


Total de partes criadas: 4


Incorporando agente

In [None]:
# Instancia os embeddings usando o modelo da Cohere
embeddings = CohereEmbeddings(
    model="embed-english-v3.0",
    cohere_api_key=COHERE_API_KEY
)

In [None]:
# Nome do √≠ndice no Pinecone (deve j√° existir no console do Pinecone)
index_name = "rag-demo"

# Cria o vetorstore a partir dos documentos, com os embeddings e configura√ß√µes do Pinecone
vectorstore_from_docs = PineconeVectorStore.from_documents(
    docs,
    embedding=embeddings,
    index_name=index_name,
)

In [11]:
# Teste uma busca sem√¢ntica:
vectorstore = PineconeVectorStore(index_name=index_name, embedding=embeddings)
print(vectorstore.similarity_search("What is a vector store?"))

[Document(id='05cd1c2a-2322-437e-b72b-1b35a5e74f2f', metadata={'source': 'data/mediumblog1.txt'}, page_content='Title: Vector Database: What is it and Why You Should Know It?\n\nAuthor: Ejiro Onose\nDate: December 22, 2023\n\nIf 2021 was the year of graph databases, 2023 is the year of vector databases √¢‚Ç¨‚Äù Chip Huen.\n\nGenerative AI and Large Language Models (LLMs) have become popular, and a vector database is one of the best tools to handle LLM data. Vector databases provide the ideal infrastructure for managing the complex, high-dimensional data that LLMs produce and rely upon.\n\nIn this article, I√¢‚Ç¨‚Ñ¢ll explain what vector databases are, how they work, and introduce some top vector database tools.\n\n What is a Vector?\nIn machine learning (ML), a vector is a collection of numerical values that represents the features of multi-dimensional objects, such as words or images. For example, a vector representing an image might contain values related to pixel intensities and col

Criando LLM e Chain

In [12]:
# Inicializa o LLM da Groq com Gemma2
llm = ChatGroq(
    model="Gemma2-9b-It",
    groq_api_key=GROQ_API_KEY,
    temperature=0.1
)                              

In [13]:
# Cria a chain de resposta com base nos documentos
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

retrieval_qa_chat_prompt = hub.pull("langchain-ai/retrieval-qa-chat")
combine_docs_chain = create_stuff_documents_chain(llm, retrieval_qa_chat_prompt)

# Cria o retriever para buscar documentos relevantes
retriever = vectorstore_from_docs.as_retriever()

# Cria a chain de RAG combinando busca + gera√ß√£o
rag_chain = create_retrieval_chain(retriever, combine_docs_chain)

  memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)


In [14]:
# Testanto LLM 
res = rag_chain.invoke({"input":"O que √© React? Responda em portugu√™s."})
print("üîç Pergunta: O que √© React? Responda em portugu√™s.")
print("üí¨ Resposta: \n")
print(res['answer'])

üîç Pergunta: O que √© React? Responda em portugu√™s.
üí¨ Resposta: 

ReAct √© um novo paradigma para combinar racioc√≠nio e a√ß√£o com modelos de linguagem grandes (LLMs) para resolver tarefas de racioc√≠nio e tomada de decis√£o em linguagem. 

Em ess√™ncia, o ReAct incentiva o LLM a gerar tanto tra√ßos de racioc√≠nio verbal quanto a√ß√µes relacionadas a uma tarefa de forma interligada. Isso permite que o modelo realize racioc√≠nio din√¢mico para criar, manter e ajustar planos de alto n√≠vel para agir ("raciocinar para agir"), ao mesmo tempo em que interage com ambientes externos (como a Wikipedia) para incorporar informa√ß√µes adicionais no racioc√≠nio ("agir para raciocinar").


O texto destaca algumas caracter√≠sticas importantes do ReAct:

* **Intuitivo e f√°cil de projetar:** A cria√ß√£o de prompts para o ReAct √© simples, pois os anotadores humanos apenas digitam seus pensamentos em linguagem sobre as a√ß√µes que tomam.
* **Geral e flex√≠vel:** Devido ao espa√ßo de pensamento 

## Finaliza√ß√£o com intera√ß√£o com o usu√°rio

In [15]:
# Fun√ß√£o interativa
def fazer_pergunta_rag():
    while True:
        pergunta = input("\n ‚ùì No que posso ajudar ‚ùì (ou digite 'sair' para encerrar):\n> ")
        
        if pergunta.lower() in ["sair", "exit", "quit"]:
            print("Encerrando. At√© logo!")
            break

        try:
            resposta = rag_chain.invoke({"input":f"{pergunta} Responda em portugu√™s"})
            print("\nüß† Resposta:\n")
            print(resposta["answer"])
        except Exception as e:
            print(f"\n‚ö†Ô∏è Erro ao gerar resposta: {e}")


In [16]:
# Execu√ß√£o
if __name__ == "__main__":
    fazer_pergunta_rag()


üß† Resposta:

ReAct √© um framework para tarefas de tomada de decis√£o e racioc√≠nio sequenciais, baseado em modelos de linguagem grandes. 

Ele funciona assim:

* **Pensamento e A√ß√£o:** ReAct permite que um modelo de linguagem "pense" (formulando pensamentos em linguagem natural) e "aja" (executando a√ß√µes em um ambiente).
* **Trajet√≥rias:** As intera√ß√µes do modelo s√£o representadas como trajet√≥rias, onde cada etapa consiste em um pensamento, uma a√ß√£o e uma observa√ß√£o resultante.
* **Aprendizado por Exemplo:** ReAct aprende com exemplos de trajet√≥rias pr√©-definidas, chamadas de "trajet√≥rias densas", onde os pensamentos s√£o explicitamente fornecidos.
* **Flexibilidade:** A estrutura flex√≠vel de ReAct permite sua aplica√ß√£o em diversas tarefas, como perguntas e respostas, verifica√ß√£o de fatos, jogos de texto e navega√ß√£o na web.

**Vantagens do ReAct:**

* **Intuitivo e F√°cil de Projetar:** A cria√ß√£o de prompts para ReAct √© simples, pois os humanos apenas dig