In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


# Download e explora√ß√£o inicial dos dados

In [2]:
!git clone https://github.com/pubmedqa/pubmedqa.git

import json

file_path = 'pubmedqa/data/ori_pqal.json'

with open(file_path, 'r') as f:
    data = json.load(f)

sample_key = list(data.keys())[0]
print(f"\nCampos dispon√≠veis: {list(data[sample_key].keys())}\n")

print("=" * 60)
print("Explora√ß√£o de dados - PubMedQA")
print("=" * 60)

for i, key in enumerate(list(data.keys())[:3]):
    item = data[key]

    print(f"\nExemplo {i+1} | ID: {key}")
    print("-" * 60)
    print(f"Question: {item.get('QUESTION', 'N/A')}")

    context = " ".join(item.get('CONTEXTS', []))
    print(f"Context: {context[:300]}...")

    print(f"Labels: {item.get('LABELS', 'N/A')}")
    print(f"Decision: {item.get('final_decision', 'N/A')}")
    print(f"Answer: {item.get('LONG_ANSWER', 'N/A')[:200]}...")
    print(f"Meshes: {item.get('MESHES', 'N/A')}")
    print(f"Year: {item.get('YEAR', 'N/A')}")
    print(f"Reasoning required pred: {item.get('reasoning_required_pred', 'N/A')}")
    print(f"Reasoning free pred: {item.get('reasoning_free_pred', 'N/A')}")

print(f"\n\nTotal de registros: {len(data)}")

Cloning into 'pubmedqa'...
remote: Enumerating objects: 40, done.[K
remote: Counting objects: 100% (3/3), done.[K
remote: Compressing objects: 100% (3/3), done.[K
remote: Total 40 (delta 0), reused 2 (delta 0), pack-reused 37 (from 1)[K
Receiving objects: 100% (40/40), 704.89 KiB | 14.10 MiB/s, done.
Resolving deltas: 100% (12/12), done.

Campos dispon√≠veis: ['QUESTION', 'CONTEXTS', 'LABELS', 'MESHES', 'YEAR', 'reasoning_required_pred', 'reasoning_free_pred', 'final_decision', 'LONG_ANSWER']

Explora√ß√£o de dados - PubMedQA

Exemplo 1 | ID: 21645374
------------------------------------------------------------
Question: Do mitochondria play a role in remodelling lace plant leaves during programmed cell death?
Context: Programmed cell death (PCD) is the regulated death of cells within an organism. The lace plant (Aponogeton madagascariensis) produces perforations in its leaves through PCD. The leaves of the plant consist of a latticework of longitudinal and transverse veins enclosi

# Pr√©-processamento

In [3]:
import json
import re
import unicodedata
import os

def preprocess_text(text):
    """Normaliza e limpa texto"""
    if not isinstance(text, str):
        return ""

    # Normaliza√ß√£o unicode
    text = unicodedata.normalize('NFKC', text)

    # Normaliza√ß√£o de espa√ßos
    text = re.sub(r'\s+', ' ', text).strip()

    return text

def map_decision(decision):
    decision = decision.lower()
    if decision == "yes":
        return "SIM"
    elif decision == "no":
        return "N√ÉO"
    elif decision == "maybe":
        return "TALVEZ"
    return

def sanitize_answer(text):
    forbiden_list = [
        "assistant.",
        "assistant.Decision",
        "assistant.Undefinitions",
        "definitions",
        "context",
        "analysis"
    ]
    for b in forbiden_list:
        text = text.replace(b, "")
    return text.strip()

def preprocess_dataset(input_path, output_path):
    """Pr√©-processa o dataset original completo"""
    print(f"Carregando {input_path}...")
    with open(input_path, 'r', encoding='utf-8') as f:
        data = json.load(f)

    processed_data = {}

    for key, item in data.items():

        # QUESTION
        question = preprocess_text(item.get('QUESTION', ''))

        # CONTEXTS (string ou lista)
        context_raw = " ".join(item.get('CONTEXTS', []))
        context = preprocess_text(context_raw)

        # DECISION
        decision_raw = item.get('final_decision', 'N/A')
        decision = map_decision(decision_raw)

        # LONG_ANSWER
        long_answer = preprocess_text(item.get('LONG_ANSWER', ''))
        long_answer = sanitize_answer(long_answer)

        answer = f"Decis√£o: {decision}\nJustificativa: {long_answer}"

        processed_data[key] = {
            "QUESTION": question,
            "CONTEXTS": context,
            "FINAL_ANSWER": answer,
            "YEAR": item.get('YEAR', 'N/A')
        }

    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    with open(output_path, 'w', encoding='utf-8') as f_out:
        json.dump(processed_data, f_out, indent=4, ensure_ascii=False)

    print(f"‚úì Processados {len(processed_data)} registros")
    return len(processed_data)

# Processar dataset original completo
total = preprocess_dataset(
    'pubmedqa/data/ori_pqal.json',
    'data_processed/ori_pqal_preprocessed.json'
)

print(f"\nPr√©-processamento conclu√≠do: {total} registros")
print("Arquivo salvo em: data_processed/ori_pqal_preprocessed.json")

Carregando pubmedqa/data/ori_pqal.json...
‚úì Processados 1000 registros

Pr√©-processamento conclu√≠do: 1000 registros
Arquivo salvo em: data_processed/ori_pqal_preprocessed.json


# Anonimiza√ß√£o

In [4]:
import json
import re
import os

def anonymize_text(text):
    """Remove dados sens√≠veis (LGPD/HIPAA compliance)"""
    if not isinstance(text, str):
        return ""

    text = re.sub(r'(Dr\.|Dra\.|Doctor|Prof\.|MD)\s+[A-Z][a-z]+(\s+[A-Z][a-z]+)?', '[NOME]', text)
    text = re.sub(r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}', '[EMAIL]', text)
    locations = r'(Israel|Denmark|Chile|Texas|France|United Kingdom|UK|USA|Pakistan|Karachi|Jordan|Japan|Australia|North Carolina|Washington)'
    text = re.sub(locations, '[LOCAL]', text, flags=re.IGNORECASE)
    text = re.sub(r'\b\d{6,}\b', '[ID]', text)
    text = re.sub(r'\b(19|20)\d{2}\b', '[ANO]', text)
    text = re.sub(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+', '[URL]', text)

    return text

def anonymize_dataset(input_path, output_path):
    """Anonimiza o dataset pr√©-processado completo"""
    print(f"Carregando {input_path}...")
    with open(input_path, 'r', encoding='utf-8') as f:
        data = json.load(f)

    anonymized = {}

    for key, item in data.items():
        new_id = f"HOSP_REG_{key[:4]}"

        anonymized[new_id] = {
            "QUESTION": anonymize_text(item.get('QUESTION', '')),
            "CONTEXTS": anonymize_text(item.get('CONTEXTS', '')),
            "FINAL_ANSWER": anonymize_text(item.get('FINAL_ANSWER', '')),
            "YEAR": item.get('YEAR', 'N/A')
        }

    os.makedirs(os.path.dirname(output_path), exist_ok=True)
    with open(output_path, 'w', encoding='utf-8') as f_out:
        json.dump(anonymized, f_out, indent=4, ensure_ascii=False)

    print(f"‚úì Anonimizados {len(anonymized)} registros")
    return len(anonymized)

# Anonimizar dataset pr√©-processado
total = anonymize_dataset(
    'data_processed/ori_pqal_preprocessed.json',
    'data_anonymized/ori_pqal_anonymized.json'
)

print(f"\nAnonimiza√ß√£o conclu√≠da: {total} registros")
print("Arquivo salvo em: data_anonymized/ori_pqal_anonymized.json")

# Exemplo de dado anonimizado
with open('data_anonymized/ori_pqal_anonymized.json', 'r', encoding='utf-8') as f:
    sample = json.load(f)
    first_key = list(sample.keys())[0]
    print(f"\n{'='*60}")
    print("Exemplo de dado anonimizado:")
    print(f"{'='*60}")
    print(f"ID: {first_key}")
    print(f"Question: {sample[first_key]['QUESTION'][:100]}...")

Carregando data_processed/ori_pqal_preprocessed.json...
‚úì Anonimizados 765 registros

Anonimiza√ß√£o conclu√≠da: 765 registros
Arquivo salvo em: data_anonymized/ori_pqal_anonymized.json

Exemplo de dado anonimizado:
ID: HOSP_REG_2164
Question: Do mitochondria play a role in remodelling lace plant leaves during programmed cell death?...


## An√°lise de Qualidade

In [5]:
import json
import os
from collections import Counter

def analyze_quality(data):
    issues = {
        'question_vazia': [],
        'context_vazio': [],
        'answer_vazia': [],
        'answer_muito_curta': [],
        'context_muito_curto': []
    }

    for key, item in data.items():
        if not item.get('QUESTION', '').strip():
            issues['question_vazia'].append(key)

        if not item.get('CONTEXTS', '').strip():
            issues['context_vazio'].append(key)

        if not item.get('FINAL_ANSWER', '').strip():
            issues['answer_vazia'].append(key)

        if len(item.get('FINAL_ANSWER', '')) < 50:
            issues['answer_muito_curta'].append(key)

        if len(item.get('CONTEXTS', '')) < 100:
            issues['context_muito_curto'].append(key)

    return issues

def extract_decision(answer):
    if answer.startswith("Decis√£o: SIM"):
        return "SIM"
    if answer.startswith("Decis√£o: N√ÉO"):
        return "N√ÉO"
    if answer.startswith("Decis√£o: TALVEZ"):
        return "TALVEZ"
    return "UNKNOWN"

def analyze_distribution(data):
    distribution = Counter()

    for key, item in data.items():
        decision = extract_decision(item.get('FINAL_ANSWER',''))
        distribution[decision] += 1

    return distribution

print("Analisando qualidade dos dados...")

# Analisar test set
with open('/content/data_anonymized/ori_pqal_anonymized.json', 'r', encoding='utf-8') as f:
    test_data = json.load(f)

issues = analyze_quality(test_data)

print("\nProblemas encontrados:")
for issue_type, ids in issues.items():
    if ids:
        print(f"  {issue_type}: {len(ids)} registros")
    else:
        print(f"  {issue_type}: 0")

print("\nDistribui√ß√£o:")
dist_test = analyze_distribution(test_data)
for cls, count in dist_test.items():
    pct = (count / len(test_data)) * 100
    print(f"  {cls}: {count} ({pct:.1f}%)")

print(f"\n{'='*60}")
print(f"Total de registros: {len(test_data)}")
print(f"{'='*60}")

Analisando qualidade dos dados...

Problemas encontrados:
  question_vazia: 0
  context_vazio: 0
  answer_vazia: 0
  answer_muito_curta: 0
  context_muito_curto: 0

Distribui√ß√£o:
  SIM: 422 (55.2%)
  N√ÉO: 263 (34.4%)
  TALVEZ: 80 (10.5%)

Total de registros: 765


## Fine Tunning

Instando as depend√™ncias

In [6]:
!pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install --no-deps xformers "trl<0.9.0" peft accelerate bitsandbytes
!pip install transformers datasets

Collecting unsloth@ git+https://github.com/unslothai/unsloth.git (from unsloth[colab-new]@ git+https://github.com/unslothai/unsloth.git)
  Cloning https://github.com/unslothai/unsloth.git to /tmp/pip-install-128vm5jc/unsloth_79e6f07a61eb41069754fb50e7b7ed6c
  Running command git clone --filter=blob:none --quiet https://github.com/unslothai/unsloth.git /tmp/pip-install-128vm5jc/unsloth_79e6f07a61eb41069754fb50e7b7ed6c
  Resolved https://github.com/unslothai/unsloth.git to commit 85bfdaf7ab3c32f95f98f3e3927164797fcc6d46
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Collecting unsloth_zoo>=2026.1.1 (from unsloth@ git+https://github.com/unslothai/unsloth.git->unsloth[colab-new]@ git+https://github.com/unslothai/unsloth.git)
  Downloading unsloth_zoo-2026.1.1-py3-none-any.whl.metadata (32 kB)
Collecting tyro (from unsloth@ git+https://github.com/unslothai/unsloth.git-

Configura√ß√£o das vari√°veis do modelo

In [7]:
from unsloth import FastLanguageModel, is_bfloat16_supported
import torch
import json
import os
from datasets import load_dataset
from trl import SFTTrainer
from transformers import TrainingArguments

max_seq_length = 2048
dtype = None
load_in_4bit = True
fourbit_models = [
    "unsloth/mistral-7b-v0.3-bnb-4bit",
    "unsloth/mistral-7b-instruct-v0.3-bnb-4bit",
    "unsloth/llama-3-8b-bnb-4bit",
    "unsloth/llama-3-8b-Instruct-bnb-4bit",
    "unsloth/llama-3-70b-bnb-4bit",
    "unsloth/Phi-3-mini-4k-instruct",
    "unsloth/Phi-3-medium-4k-instruct",
    "unsloth/mistral-7b-bnb-4bit",
    "unsloth/gemma-7b-bnb-4bit",
]


ü¶• Unsloth: Will patch your computer to enable 2x faster free finetuning.
ü¶• Unsloth Zoo will now patch everything to make training faster!


Convers√£o do dataset para treinamento


In [8]:
import json
from datasets import Dataset
import os

DATA_PATH = "data_anonymized/ori_pqal_anonymized.json"
OUTPUT_DATA_PATH = "data_final/final_pqal.json"
SYSTEM_PROMPT = """
Voc√™ √© um assistente m√©dico-cient√≠fico. Responda exclusivamente em portugu√™s.

Responda EXCLUSIVAMENTE com base no contexto fornecido.
N√£o utilize conhecimento externo.

REGRAS OBRIGAT√ìRIAS:
- A resposta DEVE conter APENAS duas linhas.
- A primeira linha DEVE come√ßar exatamente com:
  "Decis√£o: SIM", "Decis√£o: N√ÉO" ou "Decis√£o: TALVEZ"
- A segunda linha DEVE come√ßar exatamente com:
  "Justificativa:"

PROIBI√á√ïES ABSOLUTAS:
- N√ÉO inclua r√≥tulos internos, nomes t√©cnicos, marcadores ou palavras como:
  "assistant.", "assistant.Decision", "assistant.Undefinitions", "definitions", "context", "analysis".
- N√ÉO inclua listas, t√≠tulos, explica√ß√µes adicionais ou texto fora do formato exigido.
- N√ÉO repita a pergunta.
- N√ÉO inclua qualquer texto antes ou depois das duas linhas exigidas.
- N√£o fa√ßa recomenda√ß√£o de tratamentos
- N√£o fa√ßa recomenda√ß√£o de medicamentos

Use:
- SIM quando o contexto apoiar claramente a afirma√ß√£o.
- N√ÉO quando o contexto claramente a contradizer.
- TALVEZ apenas quando as evid√™ncias forem insuficientes, inconclusivas ou conflitantes.
"""

def validate_answer(answer):
    lines = answer.strip().splitlines()
    if not lines[0].startswith("Decis√£o:"):
        return False
    if not lines[1].startswith("Justificativa:"):
        return False
    if not any(x in lines[0] for x in ["SIM", "N√ÉO", "TALVEZ"]):
        return False
    return True

with open(DATA_PATH, "r", encoding="utf-8") as f:
    raw_data = json.load(f)

data = []
for _, item in raw_data.items():
  if not validate_answer(item["FINAL_ANSWER"]):
    continue

  data.append({
      "messages": [
          {"role": "system", "content": SYSTEM_PROMPT},
          {"role": "user", "content": item["QUESTION"]},
          {"role": "assistant", "content": item["FINAL_ANSWER"]},
      ]
  })

formatted_data = Dataset.from_list(data)

print("Novo formato do dataset:")
print(json.dumps(formatted_data[0], indent=2, ensure_ascii=False))

os.makedirs(os.path.dirname(OUTPUT_DATA_PATH), exist_ok=True)
with open(OUTPUT_DATA_PATH, 'w', encoding='utf-8') as output_file:
  json.dump(formatted_data.to_list(), output_file, indent=4)

print("\n")
print("="*60)
print(f"Dataset final salvo em: {OUTPUT_DATA_PATH}")
print("="*60)

Novo formato do dataset:
{
  "messages": [
    {
      "content": "\nVoc√™ √© um assistente m√©dico-cient√≠fico. Responda exclusivamente em portugu√™s.\n\nResponda EXCLUSIVAMENTE com base no contexto fornecido.\nN√£o utilize conhecimento externo.\n\nREGRAS OBRIGAT√ìRIAS:\n- A resposta DEVE conter APENAS duas linhas.\n- A primeira linha DEVE come√ßar exatamente com:\n  \"Decis√£o: SIM\", \"Decis√£o: N√ÉO\" ou \"Decis√£o: TALVEZ\"\n- A segunda linha DEVE come√ßar exatamente com:\n  \"Justificativa:\"\n\nPROIBI√á√ïES ABSOLUTAS:\n- N√ÉO inclua r√≥tulos internos, nomes t√©cnicos, marcadores ou palavras como:\n  \"assistant.\", \"assistant.Decision\", \"assistant.Undefinitions\", \"definitions\", \"context\", \"analysis\".\n- N√ÉO inclua listas, t√≠tulos, explica√ß√µes adicionais ou texto fora do formato exigido.\n- N√ÉO repita a pergunta.\n- N√ÉO inclua qualquer texto antes ou depois das duas linhas exigidas.\n- N√£o fa√ßa recomenda√ß√£o de tratamentos \n- N√£o fa√ßa recomenda√ß√£o de medic

## Carregando o modelo "unsloth/llama-3-8b-bnb-4bit"

In [9]:
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/llama-3-8b-bnb-4bit",
    max_seq_length = max_seq_length,
    dtype = dtype,
    load_in_4bit = load_in_4bit,
)


==((====))==  Unsloth 2026.1.1: Fast Llama patching. Transformers: 4.57.3.
   \\   /|    Tesla T4. Num GPUs = 1. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.9.0+cu126. CUDA: 7.5. CUDA Toolkit: 12.6. Triton: 3.5.0
\        /    Bfloat16 = FALSE. FA [Xformers = 0.0.33.post2. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


model.safetensors:   0%|          | 0.00/5.70G [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/198 [00:00<?, ?B/s]

tokenizer_config.json: 0.00B [00:00, ?B/s]

tokenizer.json: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/350 [00:00<?, ?B/s]

In [10]:
model = FastLanguageModel.get_peft_model(
    model,
    r = 16,
    target_modules = ["q_proj", "k_proj", "v_proj", "o_proj",
                      "gate_proj", "up_proj", "down_proj",],
    lora_alpha = 16,
    lora_dropout = 0,
    bias = "none",

    use_gradient_checkpointing = "unsloth",
    random_state = 3407,
    use_rslora = False,
    loftq_config = None,
)

Unsloth 2026.1.1 patched 32 layers with 32 QKV layers, 32 O layers and 32 MLP layers.


In [11]:
from datasets import load_dataset

EOS_TOKEN = tokenizer.eos_token

def formatting_prompts_func(examples):
    texts = []
    for messages in examples["messages"]:
        full_text = ""
        for msg in messages:
            full_text += msg["content"].strip() + "\n"
        texts.append(full_text.strip() + EOS_TOKEN)
    return {"text": texts}

OUTPUT_PATH_DATASET = "data_final/final_pqal.json"

dataset = load_dataset(
    "json",
    data_files=OUTPUT_PATH_DATASET,
    split="train"
)

dataset = dataset.map(
    formatting_prompts_func,
    batched=True,
    remove_columns=dataset.column_names
)

print("Primeiro exemplo do dataset formatado:")
print(dataset[0]["text"])

Generating train split: 0 examples [00:00, ? examples/s]

Map:   0%|          | 0/765 [00:00<?, ? examples/s]

Primeiro exemplo do dataset formatado:
Voc√™ √© um assistente m√©dico-cient√≠fico. Responda exclusivamente em portugu√™s.

Responda EXCLUSIVAMENTE com base no contexto fornecido.
N√£o utilize conhecimento externo.

REGRAS OBRIGAT√ìRIAS:
- A resposta DEVE conter APENAS duas linhas.
- A primeira linha DEVE come√ßar exatamente com:
  "Decis√£o: SIM", "Decis√£o: N√ÉO" ou "Decis√£o: TALVEZ"
- A segunda linha DEVE come√ßar exatamente com:
  "Justificativa:"

PROIBI√á√ïES ABSOLUTAS:
- N√ÉO inclua r√≥tulos internos, nomes t√©cnicos, marcadores ou palavras como:
  "assistant.", "assistant.Decision", "assistant.Undefinitions", "definitions", "context", "analysis".
- N√ÉO inclua listas, t√≠tulos, explica√ß√µes adicionais ou texto fora do formato exigido.
- N√ÉO repita a pergunta.
- N√ÉO inclua qualquer texto antes ou depois das duas linhas exigidas.
- N√£o fa√ßa recomenda√ß√£o de tratamentos 
- N√£o fa√ßa recomenda√ß√£o de medicamentos

Use:
- SIM quando o contexto apoiar claramente a afirma√ß√£o

In [13]:
# @title
os.environ["WANDB_DISABLED"] = "true"
trainer = SFTTrainer(
    model = model,
    tokenizer = tokenizer,
    train_dataset = dataset,
    dataset_text_field = "text",
    max_seq_length = max_seq_length,
    dataset_num_proc = 2,
    packing = False,
    args = TrainingArguments(
        per_device_train_batch_size = 2,
        gradient_accumulation_steps = 4,
        warmup_steps = 5,
        max_steps = 60,                   #Desej√°vel aumentar, por√©m demora muito
        learning_rate = 2e-4,
        fp16 = not is_bfloat16_supported(),
        bf16 = is_bfloat16_supported(),
        logging_steps = 1,
        optim = "adamw_8bit",
        weight_decay = 0.01,
        lr_scheduler_type = "linear",
        seed = 3407,
        output_dir = "outputs",
    ),
)

trainer_stats = trainer.train()

Using the `WANDB_DISABLED` environment variable is deprecated and will be removed in v5. Use the --report_to flag to control the integrations used for logging result (for instance --report_to none).
==((====))==  Unsloth - 2x faster free finetuning | Num GPUs used = 1
   \\   /|    Num examples = 765 | Num Epochs = 1 | Total steps = 60
O^O/ \_/ \    Batch size per device = 2 | Gradient accumulation steps = 4
\        /    Data Parallel GPUs = 1 | Total batch size (2 x 4 x 1) = 8
 "-____-"     Trainable parameters = 41,943,040 of 8,072,204,288 (0.52% trained)


Unsloth: Will smartly offload gradients to save VRAM!


Step,Training Loss
1,2.0426
2,2.0667
3,2.0081
4,2.035
5,2.017
6,1.9781
7,1.9468
8,1.8442
9,1.7997
10,1.7504


In [14]:
from google.colab import drive
from dotenv import load_dotenv
from huggingface_hub import login
import os

# Carregar env
ENV_PATH = "/content/drive/MyDrive/token-hf/env"
load_dotenv(ENV_PATH)

HF_TOKEN = os.getenv("HF_TOKEN")
login(token=HF_TOKEN)

HF_REPO = f"{os.getenv("HF_USER_REPO")}/assistente-medico-lora"
model.push_to_hub(HF_REPO)
tokenizer.push_to_hub(HF_REPO)

README.md:   0%|          | 0.00/550 [00:00<?, ?B/s]

Processing Files (0 / 0)      : |          |  0.00B /  0.00B            

New Data Upload               : |          |  0.00B /  0.00B            

  ...adapter_model.safetensors:   0%|          |  554kB /  168MB            

Saved model to https://huggingface.co/diegosdomingos/assistente-medico-lora


Processing Files (0 / 0)      : |          |  0.00B /  0.00B            

New Data Upload               : |          |  0.00B /  0.00B            

  ...mps4y__020/tokenizer.json: 100%|##########| 17.2MB / 17.2MB            

No files have been modified since last commit. Skipping to prevent empty commit.


# TESTE B√ÅSICO DO MODELO TREINADO

In [15]:
test_examples = [
    {
        "question": "O uso di√°rio de protetor solar previne o c√¢ncer de pele em pessoas com alto risco de desenvolver a doen√ßa?",
        "context": "Estudos longitudinais mostraram que o uso regular e consistente de protetor solar com FPS 30 ou superior, em indiv√≠duos com hist√≥rico familiar de melanoma ou com m√∫ltiplos nevos at√≠picos, reduziu significativamente a incid√™ncia de novos casos de c√¢ncer de pele n√£o melanoma e melanoma em compara√ß√£o com grupos de controle que usavam protetor solar ocasionalmente ou n√£o usavam. A aplica√ß√£o correta e reaplica√ß√£o conforme as instru√ß√µes s√£o cruciais para a efic√°cia."
    },
    {
        "question": "A dieta cetog√™nica √© recomendada como tratamento prim√°rio para hipertens√£o arterial em todos os pacientes?",
        "context": "A dieta cetog√™nica tem mostrado resultados promissores na redu√ß√£o da press√£o arterial em alguns estudos, especialmente em pacientes com obesidade e resist√™ncia √† insulina. No entanto, sua seguran√ßa e efic√°cia a longo prazo como tratamento prim√°rio para hipertens√£o em toda a popula√ß√£o de pacientes n√£o foram estabelecidas por completo. Diretrizes atuais recomendam uma abordagem individualizada, considerando comorbidades e potencial para efeitos adversos. Alguns estudos indicam que, em pacientes espec√≠ficos, pode ser uma op√ß√£o vi√°vel sob supervis√£o m√©dica, enquanto outros alertam para a necessidade de mais pesquisas antes de uma recomenda√ß√£o generalizada."
    },
    {
        "question": "A vacina contra a gripe √© eficaz em 100% dos casos para prevenir a infec√ß√£o pelo v√≠rus influenza?",
        "context": "A efic√°cia da vacina contra a gripe varia anualmente e depende de diversos fatores, como a correspond√™ncia entre as cepas da vacina e as que est√£o em circula√ß√£o, e a idade e o estado de sa√∫de do indiv√≠duo vacinado. Em geral, a vacina √© eficaz em 40% a 60% na preven√ß√£o da infec√ß√£o pelo v√≠rus influenza. Embora n√£o seja 100% eficaz, ela reduz significativamente o risco de desenvolver a doen√ßa e suas complica√ß√µes graves, incluindo hospitaliza√ß√µes e mortes."
    },
    {
        "question": "O consumo moderado de caf√© est√° associado a um risco aumentado de doen√ßas cardiovasculares em adultos saud√°veis?",
        "context": "M√∫ltiplos estudos observacionais e meta-an√°lises sugerem que o consumo moderado de caf√© (cerca de 3-4 x√≠caras por dia) n√£o est√° associado a um risco aumentado de doen√ßas cardiovasculares em adultos saud√°veis. Na verdade, alguns estudos indicam uma poss√≠vel associa√ß√£o com um risco ligeiramente reduzido de certas condi√ß√µes card√≠acas, embora mais pesquisas sejam necess√°rias para estabelecer causalidade. O consumo excessivo, no entanto, pode estar ligado a efeitos adversos em indiv√≠duos sens√≠veis."
    },
    {
        "question": "O tratamento com antibi√≥ticos √© sempre necess√°rio para resfriados comuns?",
        "context": "Resfriados comuns s√£o infec√ß√µes virais das vias a√©reas superiores. Antibi√≥ticos s√£o medicamentos projetados para combater infec√ß√µes bacterianas e n√£o t√™m efeito contra v√≠rus. O uso desnecess√°rio de antibi√≥ticos pode levar √† resist√™ncia a antibi√≥ticos, um problema de sa√∫de p√∫blica crescente. Portanto, o tratamento com antibi√≥ticos n√£o √© indicado para resfriados comuns."
    }
]

print(f"Gerados {len(test_examples)} exemplos de teste.")

Gerados 5 exemplos de teste.


In [16]:
FastLanguageModel.for_inference(model)

eos_id = tokenizer.eos_token_id

print("\n--- Executando testes com exemplos gerados ---")

for i, example in enumerate(test_examples):
    question = example["question"]
    context = example["context"]

    prompt = f"""{SYSTEM_PROMPT}

    Pergunta:
    {question}

    Contexto cient√≠fico:
    {context}

    Resposta:
    """.strip()

    inputs = tokenizer(
        prompt,
        return_tensors="pt"
    ).to("cuda")

    outputs = model.generate(
        **inputs,
        max_new_tokens=128,
        do_sample=False,
        temperature=0.0,
        eos_token_id=eos_id,
        repetition_penalty=1.1,
        use_cache=True
    )

    generated_ids = outputs[0][inputs["input_ids"].shape[-1]:]
    response = tokenizer.decode(
        generated_ids,
        skip_special_tokens=True
    ).strip()

    print(f"\n--- Exemplo {i+1} ---")
    print(f"Pergunta: {question}")
    print("\n")
    print("Resposta do Modelo:")
    print(response)
    print("\n" + "=" * 80)

print("\n--- Testes conclu√≠dos ---")



--- Executando testes com exemplos gerados ---

--- Exemplo 1 ---
Pergunta: O uso di√°rio de protetor solar previne o c√¢ncer de pele em pessoas com alto risco de desenvolver a doen√ßa?


Resposta do Modelo:
Decis√£o: SIM Justificativa: Estudos longitudinais mostraram que o uso regular e consistente de protetor solar com FPS 30 ou superior, em indiv√≠duos com hist√≥rico familiar de melanoma ou com m√∫ltiplos nevos at√≠picos, reduziu significativamente a incid√™ncia de novos casos de c√¢ncer de pele n√£o melanoma e melanoma em compara√ß√£o com grupos de controle que usavam protetor solar ocasionalmente ou n√£o usavam. A aplica√ß√£o correta e reaplica√ß√£o conforme as instru√ß√µes s√£o cruciais


--- Exemplo 2 ---
Pergunta: A dieta cetog√™nica √© recomendada como tratamento prim√°rio para hipertens√£o arterial em todos os pacientes?


Resposta do Modelo:
Decis√£o: SIM Justificativa: A dieta cetog√™nica tem mostrado resultados promissores na redu√ß√£o da press√£o arterial em alguns estud