# üí¨ AgRAG

Este notebook configura um pipeline completo de perguntas e respostas (Q&A) com base em um arquivo PDF, usando RAG (Retrieval-Augmented Generation), FAISS, embeddings com HuggingFace, e LLM Gemma via Ollama.

In [None]:
# üìå Instala√ß√£o dos pacotes necess√°rios
%pip install langchain langchain-ollama langchain-huggingface langchain-community faiss-cpu pypdf sentence-transformers ollama pdfplumber

In [8]:
import pdfplumber

def load_pdf_text(path):
    all_text = ""
    with pdfplumber.open(path) as pdf:
        for page in pdf.pages:
            all_text += page.extract_text() + "\n"
    return all_text

pdf_text = load_pdf_text("data/500perguntassoja.pdf")
print(pdf_text[:1000])


Cole√ß√£oÔÅµ500 PerguntasÔÅµ500 Respostas
O produtor pergunta, a Embrapa responde

Empresa Brasileira de Pesquisa Agropecu√°ria
Embrapa Soja
Minist√©rio da Agricultura, Pecu√°ria e Abastecimento
O produtor pergunta, a Embrapa responde
Arnold Barbosa de Oliveira
Regina Maria Villas B√¥as de Campos Leite
Alvadi Ant√¥nio Balbinot Junior
Claudine Dinali Santos Seixas
Hugo Soares Kern
Editores T√©cnicos
Embrapa
Bras√≠lia, DF
2019
Exemplares desta publica√ß√£o podem ser adquiridos na:
Embrapa Respons√°vel pela edi√ß√£o
Parque Esta√ß√£o Biol√≥gica (PqEB) Secretaria-Geral
Av. W3 Norte (final)
Coordena√ß√£o editorial
70770-901 Bras√≠lia, DF
Alexandre de Oliveira Barcellos
Fone: (61) 3448-4236
Heloiza Dias da Silva
Fax: (61) 3448-2494
Nilda Maria da Cunha Sette
www.embrapa.br/livraria
livraria@embrapa.br Supervis√£o editorial
Embrapa Soja Josm√°ria Madalena Lopes
Rod. Carlos Jo√£o Strass, acesso Orlando Amaral,
Revis√£o de texto
Distrito de Warta
Jane Baptistone de Ara√∫jo
Caixa Postal 231
8600

In [9]:
# üìå Quebra de texto e gera√ß√£o dos embeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

splitter = RecursiveCharacterTextSplitter(chunk_size=1500, chunk_overlap=100)
docs = splitter.create_documents([pdf_text])

embedding = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-base")
db = FAISS.from_documents(docs, embedding)

In [10]:
# üìå Configura√ß√£o do modelo Gemma via Ollama
from langchain_ollama import OllamaLLM

llm = OllamaLLM(model="gemma3:1b")  # Requer que o modelo esteja instalado via `ollama pull gemma3:1b`

In [11]:
# üìå Cria√ß√£o do chain de perguntas e respostas (RAG)
from langchain.prompts import PromptTemplate
from langchain.chains import RetrievalQA

crop = "soja"  # Ajuste para a cultura desejada

template = """
Voc√™ √© um assistente agr√≠cola especializado na cultura de """ + crop + """ . Responda a pergunta abaixo em portugu√™s do Brasil, com base exclusivamente no conte√∫do fornecido.

Contexto:
{context}

Pergunta: {question}
Resposta:
"""

prompt = PromptTemplate(template=template, input_variables=["context", "question"])

qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    retriever=db.as_retriever(search_kwargs={"k": 10}),
    chain_type="stuff",
    chain_type_kwargs={"prompt": prompt},
)

In [12]:
# üìå Fazer perguntas ao modelo
pergunta = "Qual import√¢ncia do controle biol√≥gico na soja?"
resposta = qa_chain.invoke(pergunta)
print("Resposta:", resposta["result"])

Resposta: O controle biol√≥gico na soja √© de extrema import√¢ncia por diversas raz√µes:

*   **Autossustentabilidade:** Os agentes de controle biol√≥gico s√£o considerados in√≥cuos a outros organismos n√£o alvo e n√£o provocam desequil√≠brio no ambiente, o que o torna uma alternativa mais amig√°vel ao controle qu√≠mico.

*   **Resist√™ncia:** A utiliza√ß√£o de agentes biol√≥gicos pode ajudar a mitigar a dissemina√ß√£o de pragas resistentes a inseticidas, pois eles atuam de forma natural e complementam os agentes qu√≠micos.

*   **Diversidade:** O controle biol√≥gico promove a diversidade de organismos no solo, o que aumenta a resili√™ncia da cultura e reduz a depend√™ncia de produtos qu√≠micos.

*   **Alternativa:** Em situa√ß√µes de emerg√™ncia, o controle biol√≥gico pode ser utilizado para controlar pragas de forma r√°pida e eficiente.

*   **Benef√≠cios Ambientais:** Al√©m de combater pragas, o controle biol√≥gico contribui para a sa√∫de do solo e da √°gua.

*   **Redu√ß√£o de Cust