# BERTHA LUTZ DEV AGENTIC

- LLM responde usando RAG dos protocolos do MinistÃ©rio da SaÃºde > Guarda histÃ³rico no PostgreSQL > Aplica guardrails (nÃ£o diagnostica, nÃ£o prescreve)> Usa LangGraph + tools

## Ingerir PDFs do MS no Chroma (RAG)

In [1]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_huggingface import HuggingFaceEmbeddings

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# rag/ingest.py

def ingest(pdf_path: str):
    loader = PyPDFLoader(pdf_path)
    docs = loader.load()

    splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=100)
    chunks = splitter.split_documents(docs)

    embeddings = HuggingFaceEmbeddings(model_name="hkunlp/instructor-base")

    vectordb = Chroma.from_documents(
        chunks,
        embedding=embeddings,
        persist_directory="chroma_db"
    )

    vectordb.persist()

In [4]:
ingest(r'pdf\Consensointegra.pdf')

Loading weights: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆ| 100/100 [00:00<00:00, 331.85it/s, Materializing param=shared.weight]                                                     
  vectordb.persist()


In [5]:
ingest(r'pdf\relatorio-preliminar-diretrizes-brasileiras-para-o-rastreamento-do-cancer-do-colo-do-utero-parte-i-rastreamento-organizado-utilizando-testes-moleculares-para-deteccao-de-dna-hpv-oncogenico.pdf')

Loading weights: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆ| 100/100 [00:00<00:00, 421.94it/s, Materializing param=shared.weight]                                                     


In [6]:
ingest(r'pdf\Manual da Gestante.pdf')

Loading weights: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆ| 100/100 [00:00<00:00, 338.49it/s, Materializing param=shared.weight]                                                     


## MemÃ³ria PostgreSQL

In [2]:
from sqlalchemy import create_engine, text
from sqlalchemy.orm import sessionmaker

In [3]:
# agent/memory.py

# Engine (pool gerenciado automaticamente)
engine = create_engine(
    "postgresql+psycopg://postgres:postgres@127.0.0.1:5433/postgres",
    pool_pre_ping=True
)

SessionLocal = sessionmaker(bind=engine)

def save_memory(user_id: str, role: str, content: str):
    with SessionLocal() as session:
        session.execute(
            text("""
                INSERT INTO memory (user_id, role, content)
                VALUES (:user_id, :role, :content)
            """),
            {
                "user_id": user_id,
                "role": role,
                "content": content
            }
        )
        session.commit()

def load_memory(user_id: str):
    with SessionLocal() as session:
        result = session.execute(
            text("""
                SELECT role, content
                FROM memory
                WHERE user_id = :user_id
                ORDER BY created_at
            """),
            {"user_id": user_id}
        )
        return result.fetchall()

## Tool de RAG

In [4]:
from langchain_community.vectorstores import Chroma
from langchain_huggingface import HuggingFaceEmbeddings

In [5]:
# agent/tools.py

embeddings = HuggingFaceEmbeddings(model_name="hkunlp/instructor-base")
vectordb = Chroma(persist_directory="chroma_db", embedding_function=embeddings)

def buscar_protocolo(query: str):
    docs = vectordb.similarity_search(query, k=3)
    return "\n".join([d.page_content for d in docs])

Loading weights: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆ| 100/100 [00:00<00:00, 469.96it/s, Materializing param=shared.weight]                                                     
  vectordb = Chroma(persist_directory="chroma_db", embedding_function=embeddings)


## Guardrails mÃ©dicos

In [6]:
# agent/guardrails.py

def aplicar_guardrails(resposta: str):
    proibidos = ["diagnÃ³stico", "tome", "medicamento", "dosagem"]

    for p in proibidos:
        if p in resposta.lower():
            return (
                "NÃ£o posso fornecer diagnÃ³stico ou prescriÃ§Ã£o. "
                "Recomendo procurar uma UBS para avaliaÃ§Ã£o profissional.\n\n"
                + resposta
            )
    return resposta

## LangGraph (o cÃ©rebro)

In [7]:
# agent/graph.py
import os
from langgraph.graph import StateGraph
from langchain.chat_models import init_chat_model
# from agent.tools import buscar_protocolo
# from agent.guardrails import aplicar_guardrails

In [8]:
os.environ.get("OPENAI_API_KEY")

llm = init_chat_model("gpt-4.1") # pode trocar por Ollama depois

In [9]:
def node_rag(state):
    contexto = buscar_protocolo(state["input"])
    state["contexto"] = contexto
    return state

def node_llm(state):
    prompt = f"""
VocÃª Ã© um agente de saÃºde da mulher.

Contexto oficial:
{state['contexto']}

Pergunta da paciente:
{state['input']}
"""
    resposta = llm.invoke(prompt).content
    state["resposta"] = aplicar_guardrails(resposta)
    return state

graph = StateGraph(dict)
graph.add_node("rag", node_rag)
graph.add_node("llm", node_llm)

graph.set_entry_point("rag")
graph.add_edge("rag", "llm")

app = graph.compile()

## ExecuÃ§Ã£o

In [12]:
# main.py
# from agent.graph import app
# from agent.memory import save_memory, load_memory

In [15]:
# USER_ID = "paciente_001"

# while True:
#     pergunta = input("Paciente: ")

#     historico = load_memory(USER_ID)

#     result = app.invoke({
#         "input": pergunta,
#         "history": historico
#     })

#     resposta = result["resposta"]

#     print("\nAgente:", resposta, "\n")

#     save_memory(USER_ID, "user", pergunta)
#     save_memory(USER_ID, "agent", resposta)

In [10]:
USER_ID = "paciente_001"

def conversar(pergunta: str):
    historico = load_memory(USER_ID)

    result = app.invoke({
        "input": pergunta,
        "history": historico
    })

    resposta = result["resposta"]

    print("Agente:\n")
    print(resposta)
    print("\n" + "-"*60 + "\n")

    save_memory(USER_ID, "user", pergunta)
    save_memory(USER_ID, "agent", resposta)


In [12]:
conversar("Estou com dor pÃ©lvica forte e muito sangramento. Isso Ã© normal?")

Agente:

OlÃ¡! Recebi sua pergunta e entendo sua preocupaÃ§Ã£o.

Dor pÃ©lvica forte e muito sangramento **nÃ£o sÃ£o sinais normais** durante a gestaÃ§Ã£o. Apesar de um pequeno sangramento leve (Ã s vezes rosado ou marrom) poder ocorrer em algumas etapas da gravidez, principalmente no inÃ­cio, **sangramento intenso** e **dor forte** juntos podem indicar uma situaÃ§Ã£o mais sÃ©ria que **necessita de avaliaÃ§Ã£o mÃ©dica imediata**.

Esses sintomas podem estar associados a situaÃ§Ãµes que precisam de cuidados, como:
- Descolamento ovular ou descolamento de placenta;
- AmeaÃ§a de aborto ou aborto em curso;
- Gravidez ectÃ³pica (fora do Ãºtero), especialmente se a dor estiver localizada de um lado;
- Outras causas ginecolÃ³gicas ou obstÃ©tricas, que sÃ³ podem ser identificadas com avaliaÃ§Ã£o presencial.

**OrientaÃ§Ã£o:**  
- Procure imediatamente uma maternidade ou pronto atendimento prÃ³ximo para ser avaliada.
- Leve consigo seus documentos e, se possÃ­vel, um resumo do seu prÃ©-natal.
- 

In [13]:
conversar("Tenho 32 anos e nunca fiz preventivo.")

Agente:

OlÃ¡! Vou te orientar de acordo com as recomendaÃ§Ãµes oficiais e base cientÃ­fica mais atual.

VocÃª tem **32 anos** e **nunca fez o exame preventivo** (Papanicolau/citopatolÃ³gico) para cÃ¢ncer do colo do Ãºtero. Ã‰ muito importante que vocÃª **faÃ§a o rastreamento o quanto antes**!

### O que diz o protocolo oficial?
- **Mulheres entre 25 e 64 anos** devem realizar o rastreamento para cÃ¢ncer do colo do Ãºtero.
- Mulheres de **25 a 29 anos que nunca fizeram o rastreamento** tÃªm prioridade, mas aos **32 anos** vocÃª ainda estÃ¡ dentro da faixa recomendada e hÃ¡ muita vantagem em iniciar agora.
- Para iniciar, vocÃª deve realizar o exame de **citologia (Papanicolau)** ou, se disponÃ­vel em sua regiÃ£o, o **teste de DNA-HPV** oncogÃªnico, que demonstra maior eficÃ¡cia na detecÃ§Ã£o precoce do cÃ¢ncer e suas lesÃµes iniciais.
- O rastreamento deve ser realizado a cada **3 anos** apÃ³s dois exames anuais consecutivos normais. Se disponÃ­vel, o teste de DNA-HPV pode ter interval