# Instala bibliotecas necess√°rias e importa m√≥dulos essenciais.



In [None]:
!pip install -q unsloth[colab-new] faiss-cpu sentence-transformers trl transformers datasets
!pip install --no-deps xformers "trl<0.9.0" peft accelerate bitsandbytes

In [None]:
import json
import re
import os
import unicodedata
import faiss
import numpy as np
import torch
import random
import pandas as pd
import sqlite3

from unsloth import FastLanguageModel, is_bfloat16_supported
from transformers import pipeline
from transformers import TrainingArguments
from sentence_transformers import SentenceTransformer
from datasets import load_dataset
from datasets import Dataset
from trl import SFTTrainer
from dotenv import load_dotenv
from huggingface_hub import login
from datetime import date, timedelta

In [None]:
from google.colab import drive
drive.mount('/content/drive')

# Download e explora√ß√£o inicial dos dados

In [None]:
!git clone https://github.com/pubmedqa/pubmedqa.git

file_path = 'pubmedqa/data/ori_pqal.json'

with open(file_path, 'r') as f:
    data = json.load(f)

sample_key = list(data.keys())[0]
print(f"\nCampos dispon√≠veis: {list(data[sample_key].keys())}\n")

print("=" * 60)
print("Explora√ß√£o de dados - PubMedQA")
print("=" * 60)

for i, key in enumerate(list(data.keys())[:3]):
    item = data[key]

    print(f"\nExemplo {i+1} | ID: {key}")
    print("-" * 60)
    print(f"Question: {item.get('QUESTION', 'N/A')}")

    context = " ".join(item.get('CONTEXTS', []))
    print(f"Context: {context[:300]}...")

    print(f"Labels: {item.get('LABELS', 'N/A')}")
    print(f"Decision: {item.get('final_decision', 'N/A')}")
    print(f"Answer: {item.get('LONG_ANSWER', 'N/A')[:200]}...")
    print(f"Meshes: {item.get('MESHES', 'N/A')}")
    print(f"Year: {item.get('YEAR', 'N/A')}")
    print(f"Reasoning required pred: {item.get('reasoning_required_pred', 'N/A')}")
    print(f"Reasoning free pred: {item.get('reasoning_free_pred', 'N/A')}")

print(f"\n\nTotal de registros: {len(data)}")

# Pr√©-processamento e Prepara√ß√£o para RAG
## - Limpeza, Normaliza√ß√£o e Anonimiza√ß√£o dos Textos

In [None]:
# Define a fun√ß√£o para anonimizar dados sens√≠veis em um texto.
def anonymize_text(text):
    """Remove dados sens√≠veis (LGPD/HIPAA compliance)"""
    if not isinstance(text, str):
        return ""
    text = re.sub(r'(Dr\.|Dra\.|Doctor|Prof\.|MD)\s+[A-Z][a-z]+(\s+[A-Z][a-z]+)?', '[NOME]', text)
    text = re.sub(r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}', '[EMAIL]', text)
    locations = r'(Israel|Denmark|Chile|Texas|France|United Kingdom|UK|USA|Pakistan|Karachi|Jordan|Japan|Australia|North Carolina|Washington)'
    text = re.sub(locations, '[LOCAL]', text, flags=re.IGNORECASE)
    text = re.sub(r'\b\d{6,}\b', '[ID]', text)
    text = re.sub(r'\b(19|20)\d{2}\b', '[ANO]', text)
    text = re.sub(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', '[URL]', text)
    return text

# Define a fun√ß√£o para limpar e normalizar o texto, aplicando tamb√©m a anonimiza√ß√£o.
def clean_text(text):
  if not text:
    return ""
  text = unicodedata.normalize("NFKC", text)
  text = re.sub(r"\s+", " ", text).strip()
  text = anonymize_text(text)
  return text

rag_documents = []

# Processa cada item dos dados, aplicando as fun√ß√µes de limpeza e anonimiza√ß√£o.
# Cria uma lista de dicion√°rios com as informa√ß√µes processadas.
for item in data.values():
    question = clean_text(item.get("QUESTION"))
    context = clean_text(" ".join(item.get("CONTEXTS", [])))
    answer = clean_text(item.get("LONG_ANSWER", ""))

    if not question or not context:
        continue

    text = f"""
    Pergunta cient√≠fica:
    {question}

    Evid√™ncia:
    {context}

    Conclus√£o:
    {answer}
    """

    rag_documents.append(text.strip())

# Exibe o n√∫mero total de documentos processados.
print(len(rag_documents))

# Gera√ß√£o de Embeddings e Constru√ß√£o de √çndice FAISS

In [None]:
# Inicializa o modelo de embeddings para converter texto em vetores num√©ricos.
embedder = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")

# Gera os embeddings para todos os documentos RAG.
embeddings = embedder.encode(rag_documents, show_progress_bar=True)

# Cria um √≠ndice FAISS para busca eficiente de documentos similares.
index = faiss.IndexFlatL2(embeddings.shape[1])

# Adiciona os embeddings ao √≠ndice FAISS.
index.add(np.array(embeddings))

# Garante que o diret√≥rio para salvar os arquivos exista no Google Drive.
os.makedirs('/content/drive/MyDrive/rag', exist_ok=True)

# Salva o √≠ndice FAISS no Google Drive.
faiss.write_index(index, "/content/drive/MyDrive/rag/medical_index.faiss")

# Salva os documentos RAG originais em formato JSON no Google Drive.
with open('/content/drive/MyDrive/rag/medical_docs.json', 'w') as f:
  json.dump(rag_documents, f)

# Cria√ß√£o de dataset de prontu√°rio (Fict√≠cio) com SQLite

In [None]:
# Define o caminho para o arquivo do banco de dados SQLite.
DB_PATH = "prontuarios.db"

# Conecta ao banco de dados SQLite e cria um cursor.
conn = sqlite3.connect(DB_PATH)
cursor = conn.cursor()

# Cria a tabela 'pacientes' se ela ainda n√£o existir, com as colunas especificadas.
cursor.execute("""
CREATE TABLE IF NOT EXISTS pacientes (
    patient_id TEXT PRIMARY KEY,
    nome TEXT,
    data_nascimento TEXT,
    idade INTEGER,
    sexo TEXT,
    alergias TEXT,
    comorbidades TEXT
)
""")

# Cria a tabela 'atendimentos' se ela ainda n√£o existir, com as colunas especificadas e uma chave estrangeira para 'pacientes'.
cursor.execute("""
CREATE TABLE IF NOT EXISTS atendimentos (
    atendimento_id INTEGER PRIMARY KEY AUTOINCREMENT,
    patient_id TEXT,
    data_atendimento TEXT,
    queixa_principal TEXT,
    anamnese TEXT,
    diagnostico TEXT,
    conduta TEXT,
    tratamentos_em_andamento TEXT,
    exames_solicitados TEXT,
    observacoes TEXT,
    FOREIGN KEY(patient_id) REFERENCES pacientes(patient_id)
)
""")

# Salva as mudan√ßas no banco de dados e fecha a conex√£o.
conn.commit()
conn.close()

# Populando os dados fict√≠cios

In [None]:
# Listas de dados fict√≠cios para nomes, diagn√≥sticos, alergias e comorbidades.
nomes = [
    "Ana Paula Souza", "Ana Carolina Lima", "Bruno Silva", "Carlos Eduardo Rocha",
    "Daniela Martins", "Eduardo Nogueira", "Fernanda Alves", "Gabriel Pacheco",
    "Helena Ribeiro", "Igor Farias", "Juliana Torres", "Lucas Fernandes",
    "Mariana Araujo", "Natalia Pacheco", "Otavio Nunes", "Paula Guedes",
    "Rafael Moreira", "Sabrina Lopes", "Thiago Barros", "Vanessa Farias",
    "William Teixeira", "Ana Beatriz Costa"
]

diagnosticos = [
    "Hipertens√£o arterial sist√™mica",
    "Diabetes mellitus tipo 2",
    "Asma br√¥nquica",
    "Infec√ß√£o do trato urin√°rio",
    "Pneumonia adquirida na comunidade",
    "Transtorno de ansiedade generalizada",
    "Gastrite cr√¥nica",
    "Enxaqueca cr√¥nica"
]

alergias_lista = [
    "Dipirona", "Penicilina", "Sulfa", "Nenhuma conhecida"
]

comorbidades_lista = [
    "Hipertens√£o", "Diabetes", "Dislipidemia", "Obesidade", "Nenhuma"
]

# Fun√ß√£o auxiliar para gerar datas de nascimento baseadas na idade.
def gerar_data_nascimento(idade):
    hoje = date.today()
    return hoje - timedelta(days=idade * 365)

# Conecta ao banco de dados SQLite para inser√ß√£o dos dados.
conn = sqlite3.connect(DB_PATH)
cursor = conn.cursor()

# Loop para gerar e inserir dados de pacientes fict√≠cios na tabela 'pacientes'.
for i, nome in enumerate(nomes, start=1):
    idade = random.randint(18, 85)
    patient_id = f"PAT{i:04d}"

    cursor.execute("""
        INSERT OR IGNORE INTO pacientes
        VALUES (?, ?, ?, ?, ?, ?, ?)
    """, (
        patient_id,
        nome,
        gerar_data_nascimento(idade).isoformat(),
        idade,
        random.choice(["F", "M"]),
        random.choice(alergias_lista),
        random.choice(comorbidades_lista)
    ))

    # Loop interno para gerar e inserir m√∫ltiplos atendimentos para cada paciente na tabela 'atendimentos'.
    for _ in range(random.randint(1, 4)):
        cursor.execute("""
            INSERT INTO atendimentos (
                patient_id,
                data_atendimento,
                queixa_principal,
                anamnese,
                diagnostico,
                conduta,
                tratamentos_em_andamento,
                exames_solicitados,
                observacoes
            ) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
        """, (
            patient_id,
            (date.today() - timedelta(days=random.randint(1, 1200))).isoformat(),
            "Dor, mal-estar e sintomas gerais",
            "Paciente relata in√≠cio dos sintomas h√° alguns dias, sem fatores agravantes claros.",
            random.choice(diagnosticos),
            "Conduta expectante e acompanhamento ambulatorial",
            "Uso cont√≠nuo de medica√ß√£o conforme prescri√ß√£o",
            "Hemograma completo, glicemia, PCR",
            "Paciente orientado quanto aos sinais de alarme"
        ))

# Salva as mudan√ßas no banco de dados e fecha a conex√£o.
conn.commit()
conn.close()

# Preparando conjunto de dados em portugu√™s para treino de tradu√ß√£o

In [None]:
# Clona o reposit√≥rio contendo o dataset para alinhamento de linguagem em portugu√™s.
!git clone https://github.com/diegosdomingos/tech-challenge-3.git

# Carrega o dataset a partir do arquivo JSONL.
file_path = 'tech-challenge-3/data/language_alignment_pt.jsonl'

dataset = load_dataset(
    "json",
    data_files="/content/drive/MyDrive/rag/language_alignment_pt.jsonl",  #Alterar quando o dataset j√° estiver na main
    split="train"
)

print(dataset.column_names)

# Define uma fun√ß√£o para converter o formato de mensagens em texto para o treinamento do modelo.
def messages_to_text(example):
    text = ""
    for msg in example["messages"]:
        if msg["role"] == "system":
            text += f"<<SYS>>\n{msg['content']}\n<</SYS>>\n\n"
        elif msg["role"] == "user":
            text += f"[INST] {msg['content']} [/INST]\n"
        elif msg["role"] == "assistant":
            text += msg["content"]
    return {"text": text}

# Aplica a fun√ß√£o de convers√£o ao dataset.
dataset = dataset.map(
    messages_to_text,
    batched=False,
    remove_columns=["messages"]
)

print(dataset.column_names)
print(dataset[0])

# Configura√ß√£o do Modelo para Treinamento com LoRA
## - Carrega modelo base e aplica adapta√ß√£o LoRA para reduzir custo de treino.

In [None]:
# Carrega um modelo de linguagem pr√©-treinado (`llama-3-8b-bnb-4bit`) com configura√ß√µes espec√≠ficas de otimiza√ß√£o.
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/llama-3-8b-bnb-4bit",
    max_seq_length = 2048,
    dtype = None,
    load_in_4bit = True,
    device_map="auto"
)

# Aplica PEFT (Parameter-Efficient Fine-Tuning) com LoRA ao modelo para treinamento eficiente.
model = FastLanguageModel.get_peft_model(
    model,
    r = 16,
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj"],
    lora_alpha = 16,
    lora_dropout = 0.05,
)

# Treinamento Supervisionado do Assistente M√©dico em Portugu√™s

In [None]:
# Configura os argumentos para o treinamento do modelo, como diret√≥rio de sa√≠da, n√∫mero de √©pocas, tamanho do lote e taxa de aprendizado.
training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=2,
    learning_rate=2e-4,
    logging_steps=5,
    save_strategy="epoch",
    fp16=True,
    report_to="none"
)

# Inicializa o SFTTrainer (Supervised Fine-tuning Trainer) com o modelo, tokenizer e dataset de treinamento.
trainer = SFTTrainer(
    model=model,
    tokenizer=tokenizer,
    train_dataset=dataset, #DataSet com dados Em Portugu√™s
    args=training_args,
    dataset_text_field="text",
    max_seq_length=512,
    packing=False
)

# Inicia o processo de treinamento do modelo.
trainer.train()

# Autentica√ß√£o e Upload do Modelo Treinado no HuggingFace

In [None]:
# Carrega vari√°veis de ambiente (como o token do Hugging Face) de um arquivo .env.
# Opicional: Subir modelo no Hugging Face
ENV_PATH = "/content/drive/MyDrive/token-hf/env"
load_dotenv(ENV_PATH)

# Realiza o login no Hugging Face Hub usando o token.
HF_TOKEN = os.getenv("HF_TOKEN")
login(token=HF_TOKEN)

# Define o nome do reposit√≥rio no Hugging Face para o upload do modelo.
HF_REPO = f"{os.getenv("HF_USER_REPO")}/assistente-medico-lora"

# Realiza o upload do modelo treinado para o Hugging Face Hub.
model.push_to_hub(HF_REPO)
# Realiza o upload do tokenizer para o Hugging Face Hub.
tokenizer.push_to_hub(HF_REPO)

# PROMPTS utilizados no modelo

In [None]:
# Define o prompt do sistema para o assistente m√©dico virtual, estabelecendo seu papel, regras e tom de voz.
SYSTEM_PROMPT = """
Voc√™ √© um assistente m√©dico virtual.
Responda sempre em portugu√™s, com linguagem clara, emp√°tica e baseada em evid√™ncias cient√≠ficas.

Regras:
- N√£o invente informa√ß√µes.
- Se n√£o houver evid√™ncia suficiente, diga isso explicitamente.
- N√£o prescreva rem√©dios ou medicamentos, e nem indique tratamentos espec√≠ficos.
- Quando perguntarem por algum rem√©dio, voc√™ deve responder: N√£o estou autorizado a prescrever medicamentos, por favor, consulte um m√©dico. <FIM>
- Sempre cite a fonte da informa√ß√£o cient√≠fica

Importante:
- Responda de forma resumida e objetiva e finalize sempre a primeira resposta objetiva com o texto: <FIM>
"""

# Define o prompt para classificar a mensagem do usu√°rio em categorias como inv√°lida, indevida, prontu√°rio, etc.
CLASSIFICADOR_PROMPT = """
Analise a mensagem do usu√°rio e retorne APENAS um JSON v√°lido.

Classifica√ß√µes poss√≠veis:
- INVALIDA
- INDEVIDA
- PRECISA_MAIS_INFO
- PRONTUARIO
- QA

Regras:
1. PRONTUARIO ‚Üí consulta sobre dados cl√≠nicos de um paciente espec√≠fico. Obrigat√≥riamente deve receber o nome do paciente.

2. PRECISA_MAIS_INFO ‚Üí consulta sobre dados cl√≠nicos de um paciente espec√≠fico, por√©m sem informar dados que possam identificar esse paciente (Nome, por exemplo)
Exemplo: consultar prontu√°rio, trazer hist√≥rico de pacientes, consultar caso de febre, ou seja, qualquer solicita√ß√£o sem especificar o paciente alvo.

3. QA ‚Üí pergunta cient√≠fica ou t√©cnica geral
Exemplo: Qual √© o meio de transmiss√£o da febre amarela?, COVID √© transmiss√≠vel mesmo com m√°scara?, A vacina da gripe √© 100% eficaz para preven√ß√£o de infec√£o?

4. INVALIDA ‚Üí textos vagos, sem sentido ou que n√£o seja poss√≠vel interpretar sem mais informa√ß√µes.
Exemplo: palavras soltas, palavras desconhecidas, frases sem sentido, idiomas desconhecidos.

5. INDEVIDA -> Solicita√ß√µes de recomenda√ß√£o direta de rem√©dio, medicamentos ou tratamentos.
Exemplo: Qual o melhor rem√©dio para inflama√ß√£o?, Quantos gramas devo tomar de dipirona?, Indique um bom rem√©dio para dor de dentes?, O que devo tomar para enxaqueca?

Formato EXATO da resposta (obrigat√≥rio):
{{"classificacao": "<UMA_DAS_OPCOES>"}} "<FIM>"

Mensagem do usu√°rio:
\"\"\"{mensagem}\"\"\"
"""
# Define o prompt para extrair o nome do paciente de uma mensagem, com regras espec√≠ficas para identifica√ß√£o.
EXTRATOR_NOME_PROMPT = """
Extraia o NOME do paciente mencionado na mensagem.

Regras obrigat√≥rias:
- Se houver nome E sobrenome, retorne o nome completo
- Se houver APENAS um nome (ex: "Ana"), retorne esse nome
- Se houver um √∫nico nome pr√≥prio comum em portugu√™s, retorne esse nome
- N√£o invente sobrenomes
- N√£o inclua aspas, colchetes ou marcadores de chat
- Se n√£o houver nenhum nome identific√°vel, retorne: NAO_IDENTIFICADO

Formato EXATO da resposta (Obrigat√≥rio):
<nome_do_paciente>
<FIM>

Mensagem:
\"\"\"{mensagem}\"\"\"
"""

# Pipelines utilizadas

In [None]:
# Configura o pipeline do LLM para consulta de artigos cient√≠ficos, com baixa temperatura para respostas determin√≠sticas.
llm_consulta = pipeline(
  "text-generation",
  model=model,
  tokenizer=tokenizer,
  max_new_tokens=250,
  temperature=0.0,
  do_sample=False,
  repetition_penalty=1.1,
  return_full_text=False,
  eos_token_id=tokenizer.eos_token_id
)

# Configura o pipeline do LLM para intera√ß√µes de chat, com temperatura mais alta para respostas mais criativas e variadas.
llm_chat = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=250,
    do_sample=True,
    temperature=0.7,
    repetition_penalty=1.1,
    return_full_text=False,
    eos_token_id=tokenizer.eos_token_id
)

# Configura o pipeline do LLM para extra√ß√£o de nomes, com baixa temperatura para precis√£o na extra√ß√£o.
llm_extracao = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=80,
    do_sample=False,
    temperature=0.0,
    return_full_text=False
)

# Busca informa√ß√µes no Q.A. pubMedQA

In [None]:
# Carrega os documentos m√©dicos e o √≠ndice FAISS salvos anteriormente.
with open('/content/drive/MyDrive/rag/medical_docs.json') as f:
  docs = json.load(f)

index = faiss.read_index('/content/drive/MyDrive/rag/medical_index.faiss')

# Define uma fun√ß√£o para recuperar contextos relevantes com base em uma pergunta, usando o √≠ndice FAISS.
def retrieve_context(question, k=3):
  q_emb = embedder.encode([question])
  _, idx = index.search(q_emb, k)
  return "\n\n".join([docs[i] for i in idx[0]])

# Define a fun√ß√£o principal de chat m√©dico que formula um prompt com contexto e gera uma resposta usando o LLM de consulta.
def query_QA(question):

  # Adiciona o token de fim √† pergunta, se necess√°rio.
  if "<FIM>" not in question:
    question += " <FIM>"

  # Recupera o contexto mais relevante para a pergunta.
  context = retrieve_context(question)

  # Constr√≥i o prompt para o LLM, incluindo o prompt do sistema, o contexto e a pergunta.
  prompt = f"""
{SYSTEM_PROMPT}


Contexto cient√≠fico relevante:
{context}


Pergunta: {question}
Resposta:
"""
  # Gera a resposta usando o LLM de consulta.
  output = llm_consulta(prompt)[0]["generated_text"]

  # Remove o token de fim e espa√ßos em branco da resposta gerada.
  output = output.split("<FIM>")[0]

  return output.strip()

# Testes de Consulta ao Assistente M√©dico com Exemplos


In [None]:
# Exemplo de consulta normal ao assistente m√©dico.
question = "O que a literatura indica sobre o uso de aspirina em preven√ß√£o prim√°ria?"
print(f"Resposta 1 (normal): {query_QA(question)}")

# Exemplo de consulta que testa a restri√ß√£o do assistente em prescrever medicamentos.
question = "Qual medicamento √© eficaz para pedra nos rins?"
print(f"Resposta 2 (restri√ß√£o): {query_QA(question)}")

# Montagem das consultas utilizados para extrair prontu√°rios do SQLite

In [None]:
# Fun√ß√£o para buscar pacientes no banco de dados por nome parcial, considerando diferentes padr√µes.
def buscar_pacientes_por_nome(nome_parcial: str):
    conn = sqlite3.connect(DB_PATH)
    cursor = conn.cursor()
    bind = nome_parcial.strip()

    #print('[DEBUG BIND]', bind)

    # Executa a consulta SQL para encontrar pacientes com nomes correspondentes.
    cursor.execute("""
        SELECT patient_id, nome, idade
        FROM pacientes
        WHERE LOWER(nome) LIKE LOWER(?)
        OR LOWER(nome) LIKE LOWER(? || ' %')
        OR LOWER(nome) LIKE LOWER('% ' || ? || ' %')
        OR LOWER(nome) LIKE LOWER('% ' || ?)
    """, (bind, bind, bind, bind))

    resultados = cursor.fetchall()
    conn.close()
    #print('[DEBUG RESULT]', resultados)
    return resultados


# Fun√ß√£o para buscar o prontu√°rio de um paciente espec√≠fico usando seu ID.
def buscar_prontuario_por_patient_id(patient_id: int):
    conn = sqlite3.connect(DB_PATH)
    cursor = conn.cursor()

    # Executa a consulta SQL para obter o diagn√≥stico e observa√ß√µes do atendimento.
    cursor.execute("""
        SELECT diagnostico, observacoes
        FROM atendimentos
        WHERE patient_id = ?
    """, (patient_id,))

    prontuario = cursor.fetchone()
    conn.close()
    return prontuario

# Controles para o chat do assistente


## - Extrai o nome do paciente da mensagem

In [None]:
# Fun√ß√£o para extrair o nome do paciente de uma mensagem do usu√°rio, utilizando um LLM espec√≠fico.
def extrair_nome_paciente(mensagem: str) -> str | None:
    system_prompt = (
        "Voc√™ extrai nomes de texto com alta precis√£o."
        )

    user_prompt = EXTRATOR_NOME_PROMPT.format(mensagem=mensagem)

    prompt = formatar_chat_llama(system_prompt, user_prompt)

    output = llm_extracao(
        prompt,
        max_new_tokens=80,
        do_sample=False,
        temperature=0.0,
        return_full_text=False
    )

    if not output or not output[0]["generated_text"]:
        return None

    nome = output[0]["generated_text"].strip()

    if "<FIM>" not in nome:
      return None

    if "<FIM>" in nome:
      nome = nome.split("<FIM>")[0].strip()

    if nome == "NAO_IDENTIFICADO" or not nome:
        return None

    return nome

## - Cria um pequeno controle de estado para o CHAT

In [None]:
# Inicializa o estado do chat para controlar o modo (ex: prontu√°rio) e dados parciais.
estado_chat = {
    "modo": None,            # None | "PRONTUARIO"
    "dados_parciais": {}     # ex: {"nome_paciente": "..."}
}

# Fun√ß√£o para limpar o estado do chat, resetando o modo e os dados parciais.
def limpar_estado():
    estado_chat["modo"] = None
    estado_chat["dados_parciais"].clear()

## - Formata o CHAT de acordo com o que o Llama espera

In [None]:
# Fun√ß√£o para formatar prompts no estilo Llama para intera√ß√£o com o modelo.
def formatar_chat_llama(system_prompt: str, user_prompt: str) -> str:
    return f"""<|begin_of_text|>
<|system|>
{system_prompt}
<|user|>
{user_prompt}
<|assistant|>
"""

## - Chama a consulta cient√≠fica QA (RAG)

In [None]:
# Fun√ß√£o para responder a perguntas cient√≠ficas gerais utilizando o assistente m√©dico.
def responder_qa(mensagem):
    resposta = query_QA(mensagem)

    if not resposta:
        return (
            "N√£o encontrei uma resposta cient√≠fica clara no material dispon√≠vel üìö\n\n"
            "Se quiser, pode reformular a pergunta."
        )

    return resposta

## - Chama a consulta ao prontu√°rio (SQLite)

In [None]:
# Fun√ß√£o para responder a consultas de prontu√°rio, buscando informa√ß√µes do paciente no banco de dados.
def responder_prontuario_com_nome(nome: str):
    pacientes = buscar_pacientes_por_nome(nome)

    if not pacientes:
        limpar_estado()
        return f"N√£o encontrei nenhum prontu√°rio para {nome}."

    if len(pacientes) > 1:
        lista = "\n".join(
            f"- {p[1]} (idade: {p[2]})"
            for p in pacientes
        )
        return (
            "Encontrei mais de um paciente com esse nome \n\n"
            "Por favor, confirme qual deles voc√™ deseja consultar:\n"
            f"{lista}"
        )

    patient_id, nome_completo, idade = pacientes[0]
    prontuario = buscar_prontuario_por_patient_id(patient_id)

    limpar_estado()

    diagnostico, observacoes = prontuario

    return (
        "Prontu√°rio do paciente\n\n"
        f"‚Ä¢ Nome: {nome_completo}\n"
        f"‚Ä¢ Idade: {idade}\n"
        f"‚Ä¢ Diagn√≥stico: {diagnostico}\n"
        f"‚Ä¢ Observa√ß√µes: {observacoes}"
    )

## - Faz a an√°lise do contexto da mensagem e classifica em 5 op√ß√µes:

- PRONTUARIO - Consulta ao banco de prontu√°rio (SQLite)
- PRECISA_MAIS_INFO - √â uma consulta ao prontu√°rio, mas faltam dados para completar a a√ß√£o.
- QA - D√∫vida cient√≠fica, deve consultar o QA (RAG)
- INVALIDA - Textos vagos, sem sentido ou que n√£o seja poss√≠vel interpretar
- INDEVIDA - Solicita√ß√£o indevida. Exemplo: Pedir que o chat receite um medicamento ou instru√ß√µes de como administr√°-lo.

In [None]:
# Fun√ß√£o auxiliar para extrair a classifica√ß√£o de uma resposta do LLM, tratando o token de fim e parsing JSON.
def extrair_classificacao(resposta: str) -> str:
    if "<FIM>" in resposta:
      resposta = resposta.split("<FIM>")[0].strip()

    json_str = resposta.strip()

    try:
        return json.loads(json_str)["classificacao"].upper()
    except Exception:
        return "INVALIDA"

# Fun√ß√£o principal para classificar uma mensagem do usu√°rio utilizando um LLM e o prompt de classifica√ß√£o.
def classificar_mensagem(mensagem: str) -> str:
    system_prompt = (
        "Voc√™ √© um assistente respons√°vel apenas por classificar mensagens. "
        "Siga estritamente o formato solicitado."
    )

    user_prompt = CLASSIFICADOR_PROMPT.format(mensagem=mensagem)

    prompt = formatar_chat_llama(system_prompt, user_prompt)

    output = llm_chat(
        prompt,
        max_new_tokens=50,
        do_sample=False,
        temperature=0.0,
        return_full_text=False
    )

    resposta = output[0]["generated_text"].strip()

    return extrair_classificacao(resposta)

# Respostas padr√µes para mensagens que n√£o geram consulta √† dados

In [None]:
# Retorna uma mensagem padr√£o quando a entrada do usu√°rio √© inv√°lida.
def resposta_invalida():
    return (
        "Tive dificuldade para entender sua mensagem \n\n"
        "Voc√™ pode reformular ou explicar um pouco melhor o que precisa?"
    )

# Retorna uma mensagem padr√£o quando falta informa√ß√£o para identificar um paciente.
def resposta_pedir_mais_info():
    return (
        "N√£o foi poss√≠vel identificar o paciente em quest√£o \n\n"
        "Verifique se digitou o nome do paciente corretamente"
    )

# Retorna uma mensagem padr√£o para solicita√ß√µes indevidas (ex: prescri√ß√£o de medicamentos).
def resposta_indevida():
    return (
        "N√£o tenho permiss√£o para responder este tipo de d√∫vida  \n\n"
        "Somente um M√©dico est√° apto para receitar ou indicar medicamentos"
    )

# Router para decidir o que a llm deve consultar Q.A. cient√≠fico ou Prontu√°rio no SQLite

In [None]:
# Fun√ß√£o principal do roteador de chat, que direciona a mensagem do usu√°rio com base em sua classifica√ß√£o.
def chat_router(mensagem: str):
    global estado_chat

    # Se o chat estiver no modo "PRONTUARIO", tenta extrair o nome do paciente.
    if estado_chat["modo"] == "PRONTUARIO":
        nome = extrair_nome_paciente(mensagem)

        if not nome:
            return (
                "Ainda preciso do nome completo do paciente para continuar"
            )

        limpar_estado()
        return responder_prontuario_com_nome(nome)

    # Classifica a mensagem do usu√°rio para determinar o tipo de intera√ß√£o.
    classificacao = classificar_mensagem(mensagem)

    print("Assunto: ",classificacao)

    # Se a mensagem for sobre um prontu√°rio, tenta extrair o nome e responde.
    if classificacao == "PRONTUARIO":

        nome = extrair_nome_paciente(mensagem)

        if nome:
            return responder_prontuario_com_nome(nome)

        # Se n√£o houver nome, solicita mais informa√ß√µes e muda o modo do chat para "PRONTUARIO".
        limpar_estado()
        estado_chat["modo"] = "PRONTUARIO"
        return (
            "Certo, vou consultar um prontu√°rio \n\n"
            "Pode me informar o nome completo do paciente?"
        )

    # Se a mensagem for uma pergunta de QA, responde utilizando o LLM de consulta.
    if classificacao == "QA":
        limpar_estado()
        return responder_qa(mensagem)

    # Se a mensagem precisar de mais informa√ß√µes, retorna a resposta padr√£o para tal.
    if classificacao == "PRECISA_MAIS_INFO":
        limpar_estado()
        return resposta_pedir_mais_info()

    # Se a mensagem for indevida, retorna a resposta padr√£o para tal.
    if classificacao == "INDEVIDA":
        limpar_estado()
        return resposta_indevida()

    # Para qualquer outra classifica√ß√£o, retorna uma resposta de mensagem inv√°lida.
    return resposta_invalida()


# Teste do assistente com a simula√ß√£o de um CHAT real

In [None]:
# Inicia a interface de chat do assistente m√©dico.
print("Assistente M√©dico iniciado")
print("Digite 'sair' para encerrar\n")

# Loop principal do chat, que continua at√© o usu√°rio digitar 'sair'.
while True:
    user_input = input("Voc√™: ").strip()

    # Verifica se o usu√°rio deseja encerrar a sess√£o.
    if user_input.lower() in ["sair", "exit", "quit"]:
        print("Assistente: Sess√£o encerrada.")
        break

    # Roteia a mensagem do usu√°rio para a fun√ß√£o de resposta apropriada.
    resposta = chat_router(user_input)
    print(f"\nAssistente: {resposta}\n")
    print("\n")
    print("="*60)
    print("\n")
