# BERTHA LUTZ DEV AGENTIC

- LLM responde usando RAG dos protocolos do Ministério da Saúde > Guarda histórico no PostgreSQL > Aplica guardrails (não diagnostica, não prescreve)> Usa LangGraph + tools

## Ingerir PDFs do MS no Chroma (RAG)

In [1]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_huggingface import HuggingFaceEmbeddings

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# rag/ingest.py

def ingest(pdf_path: str):
    loader = PyPDFLoader(pdf_path)
    docs = loader.load()

    splitter = RecursiveCharacterTextSplitter(chunk_size=800, chunk_overlap=100)
    chunks = splitter.split_documents(docs)

    embeddings = HuggingFaceEmbeddings(model_name="hkunlp/instructor-base")

    vectordb = Chroma.from_documents(
        chunks,
        embedding=embeddings,
        persist_directory="chroma_db"
    )

    vectordb.persist()

In [3]:
# ingest(r'pdf\Consensointegra.pdf')

In [4]:
# ingest(r'pdf\relatorio-preliminar-diretrizes-brasileiras-para-o-rastreamento-do-cancer-do-colo-do-utero-parte-i-rastreamento-organizado-utilizando-testes-moleculares-para-deteccao-de-dna-hpv-oncogenico.pdf')

In [5]:
# ingest(r'pdf\Manual da Gestante.pdf')

In [6]:
ingest(r'pdf\femina-2019-474-241-244.pdf')

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 543.72it/s, Materializing param=shared.weight]                                                     
  vectordb.persist()


In [7]:
ingest(r'pdf\infeccoes_sexualmente_transmissiveis.pdf')

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 522.63it/s, Materializing param=shared.weight]                                                     


In [8]:
ingest(r'pdf\manual_atencao_mulher_climaterio.pdf')

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 375.54it/s, Materializing param=shared.weight]                                                     


In [9]:
ingest(r'pdf\manual_suplementacao_ferro_condutas_gerais.pdf')

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 422.17it/s, Materializing param=shared.weight]                                                     


In [10]:
ingest(r'pdf\pcdt_endometriose_2016-1.pdf')

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 534.45it/s, Materializing param=shared.weight]                                                      


In [11]:
ingest(r'pdf\saude_sexual_saude_reprodutiva.pdf')

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 487.73it/s, Materializing param=shared.weight]                                                     


## Memória PostgreSQL

In [12]:
from sqlalchemy import create_engine, text
from sqlalchemy.orm import sessionmaker

In [13]:
# agent/memory.py

# Engine (pool gerenciado automaticamente)
engine = create_engine(
    "postgresql+psycopg://postgres:postgres@127.0.0.1:5433/postgres",
    pool_pre_ping=True
)

SessionLocal = sessionmaker(bind=engine)

def save_memory(user_id: str, role: str, content: str):
    with SessionLocal() as session:
        session.execute(
            text("""
                INSERT INTO memory (user_id, role, content)
                VALUES (:user_id, :role, :content)
            """),
            {
                "user_id": user_id,
                "role": role,
                "content": content
            }
        )
        session.commit()

def load_memory(user_id: str):
    with SessionLocal() as session:
        result = session.execute(
            text("""
                SELECT role, content
                FROM memory
                WHERE user_id = :user_id
                ORDER BY created_at
            """),
            {"user_id": user_id}
        )
        return result.fetchall()

## Tool de RAG

In [26]:
from langchain_chroma import Chroma
from langchain_huggingface import HuggingFaceEmbeddings

In [15]:
# agent/tools.py

embeddings = HuggingFaceEmbeddings(model_name="hkunlp/instructor-base")
vectordb = Chroma(persist_directory="chroma_db", embedding_function=embeddings)

def buscar_protocolo(query: str):
    docs = vectordb.similarity_search(query, k=3)
    return "\n".join([d.page_content for d in docs])

Loading weights: 100%|██████████| 100/100 [00:00<00:00, 449.32it/s, Materializing param=shared.weight]                                                     
Exception in thread Thread-auto_conversion:
Traceback (most recent call last):
  File "c:\Users\erico\Documents\Bertha-Lutz-AI\env\Lib\site-packages\httpx\_transports\default.py", line 101, in map_httpcore_exceptions
    yield
  File "c:\Users\erico\Documents\Bertha-Lutz-AI\env\Lib\site-packages\httpx\_transports\default.py", line 250, in handle_request
    resp = self._pool.handle_request(req)
           ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\erico\Documents\Bertha-Lutz-AI\env\Lib\site-packages\httpcore\_sync\connection_pool.py", line 256, in handle_request
    raise exc from None
  File "c:\Users\erico\Documents\Bertha-Lutz-AI\env\Lib\site-packages\httpcore\_sync\connection_pool.py", line 236, in handle_request
    response = connection.handle_request(
               ^^^^^^^^^^^^^^^^^^^^^^^^^^
  File "c:\Users\erico\Docum

## Guardrails médicos

In [16]:
# agent/guardrails.py

def aplicar_guardrails(resposta: str):
    proibidos = ["diagnóstico", "tome", "medicamento", "dosagem"]

    for p in proibidos:
        if p in resposta.lower():
            return (
                "Não posso fornecer diagnóstico ou prescrição. "
                "Recomendo procurar uma UBS para avaliação profissional.\n\n"
                + resposta
            )
    return resposta

## LangGraph (o cérebro)

In [None]:
# agent/graph.py
import os
from langgraph.graph import StateGraph
from langchain_openai import ChatOpenAI
from langchain_core.messages import SystemMessage, HumanMessage
from typing import TypedDict
# from agent.tools import buscar_protocolo
# from agent.guardrails import aplicar_guardrails

In [34]:
os.environ.get("OPENAI_API_KEY")

llm = ChatOpenAI(model="gpt-4o-mini", max_tokens=300, temperature=0.5) # pode trocar por Ollama depois

In [35]:
class AgentState(TypedDict):
    input: str
    contexto: str
    resposta: str

In [36]:
def node_rag(state):
    contexto = buscar_protocolo(state["input"])
    state["contexto"] = contexto
    return state

def node_llm(state):
    messages = [
        SystemMessage(
            content="Você é um agente especializado em saúde da mulher, baseado em diretrizes oficiais."
        ),
        HumanMessage(
            content=f"""
Contexto oficial:
{state['contexto']}

Pergunta da paciente:
{state['input']}
"""
        )
    ]

    resposta = llm.invoke(messages).content
    state["resposta"] = aplicar_guardrails(resposta)
    return state

def node_guardrails(state):
    return state

graph = StateGraph(AgentState)
graph.add_node("rag", node_rag)
graph.add_node("llm", node_llm)
graph.add_node("guardrails", node_guardrails)

graph.set_entry_point("rag")

graph.add_edge("rag", "llm")
graph.add_edge("llm", "guardrails")

app = graph.compile()

In [37]:
print(app.get_graph().draw_mermaid())

---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	rag(rag)
	llm(llm)
	guardrails(guardrails)
	__end__([<p>__end__</p>]):::last
	__start__ --> rag;
	llm --> guardrails;
	rag --> llm;
	guardrails --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



## Execução

In [22]:
# main.py
# from agent.graph import app
# from agent.memory import save_memory, load_memory

In [23]:
# USER_ID = "paciente_001"

# while True:
#     pergunta = input("Paciente: ")

#     historico = load_memory(USER_ID)

#     result = app.invoke({
#         "input": pergunta,
#         "history": historico
#     })

#     resposta = result["resposta"]

#     print("\nAgente:", resposta, "\n")

#     save_memory(USER_ID, "user", pergunta)
#     save_memory(USER_ID, "agent", resposta)

In [None]:
USER_ID = "paciente_002"

def conversar(pergunta: str):
    historico = load_memory(USER_ID)

    result = app.invoke({
        "input": pergunta,
        "history": historico
    })

    resposta = result["resposta"]
    print(resposta)
    save_memory(USER_ID, "user", pergunta)
    save_memory(USER_ID, "agent", resposta)

In [42]:
conversar("Estou com dor pélvica forte e muito sangramento. Isso é normal?")

Dor pélvica forte e sangramento intenso não são considerados normais e podem indicar uma condição médica que requer avaliação imediata. É importante que você procure um profissional de saúde para uma avaliação completa. 

Possíveis causas para esses sintomas podem incluir:

- Problemas ginecológicos, como miomas, endometriose ou cistos ovarianos.
- Complicações em uma gravidez, como aborto espontâneo ou gravidez ectópica.
- Infecções, como doença inflamatória pélvica.
- Alterações hormonais.

A avaliação médica pode incluir um exame físico, ultrassonografia e, se necessário, outros exames laboratoriais para determinar a causa do seu sangramento e dor. Não hesite em buscar ajuda, especialmente se os sintomas forem intensos ou acompanhados de outros sinais, como febre ou tontura.


In [43]:
conversar("Tenho 32 anos e nunca fiz preventivo.")

Não posso fornecer diagnóstico ou prescrição. Recomendo procurar uma UBS para avaliação profissional.

É importante que você realize o exame preventivo, conhecido como Papanicolau (ou citologia cervical), que é fundamental para a detecção precoce de alterações nas células do colo do útero, incluindo câncer cervical. Embora a recomendação geral para o rastreamento do câncer cervical inicie aos 25 anos, é aconselhável que você faça seu primeiro exame o quanto antes, principalmente se você tem vida sexual ativa.

Além do Papanicolau, é essencial que você também faça o rastreamento para infecções sexualmente transmissíveis (ISTs), como a sífilis, especialmente considerando que a faixa etária de 13 a 29 anos tem mostrado um aumento nas notificações de sífilis. 

Recomendo que você procure uma unidade de saúde para agendar seu exame preventivo e discutir quaisquer outras preocupações relacionadas à sua saúde sexual. A prevenção e o diagnóstico precoce são fundamentais para garantir sua saúde