RAG (Retrieval-Augmented Generation) Simples com Groq

In [None]:
import os
from langchain_community.vectorstores import FAISS
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_groq import ChatGroq
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_retrieval_chain
from langchain_core.prompts import ChatPromptTemplate
from langchain_community.embeddings import HuggingFaceEmbeddings

# Defina sua chave de API do Groq
os.environ["GROQ_API_KEY"] = "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"

# 1. Crie os documentos (texto para o seu RAG)
documento_completo = """A LangChain é uma biblioteca poderosa para construir aplicações com LLMs. Ela facilita a conexão de LLMs com outras fontes de dados e agentes. A LangChain foi criada para ajudar no desenvolvimento de aplicações de IA, como chatbots e sistemas de perguntas e respostas. Um dos seus conceitos chave é a LangChain Expression Language (LCEL), que permite a criação de pipelines de forma intuitiva.
O Groq, por outro lado, é uma plataforma de inferência de IA que se destaca pela sua velocidade impressionante. Ela usa hardware especializado para executar modelos de linguagem em tempo real, tornando-a ideal para aplicações que exigem respostas rápidas, como diálogos de agentes virtuais. O Groq oferece APIs que podem ser facilmente integradas com a LangChain."""

# 2. Divida o documento em partes menores
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
documentos_divididos = text_splitter.create_documents([documento_completo])

# 3. Crie os embeddings com um modelo do HuggingFace (não precisa de chave de API)
# 'sentence-transformers/all-MiniLM-L6-v2' é um modelo popular e eficiente.
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
db = FAISS.from_documents(documentos_divididos, embeddings)

# 4. Crie o Retrieval Chain com o Groq
llm = ChatGroq(model_name="llama3-8b-8192")
prompt = ChatPromptTemplate.from_template("""Responda a pergunta baseada apenas no contexto fornecido.
<context>
{context}
</context>
Pergunta: {input}""")

chain_documentos = create_stuff_documents_chain(llm, prompt)
retriever = db.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, chain_documentos)

# 5. Invoca a chain com uma pergunta sobre o documento
print("--- RAG em Ação com Groq (100% Open Source/Groq) ---")
resposta = retrieval_chain.invoke({"input": "O que é o Groq e qual sua relação com a LangChain?"})
print("--- Resposta da RAG ---")
print(resposta["answer"])

ModuleNotFoundError: No module named 'langchain_openai'