<a href="https://colab.research.google.com/github/user/hanseniase-fine-tuning/blob/main/hanseniase_fine_tuning.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üè• Fine-tuning de Modelo M√©dico para Hansen√≠ase
## Treinamento especializado para as personas Dr. Gasnelio e G√°

Este notebook realiza o fine-tuning de um modelo biom√©dico para o sistema de dispensa√ß√£o de medicamentos para hansen√≠ase, com duas personas especializadas:

- **Dr. Gasnelio**: Farmac√™utico t√©cnico com respostas cient√≠ficas e precisas
- **G√°**: Assistente emp√°tico com linguagem simples e acolhedora

---

## üì¶ 1. Setup do Ambiente

In [None]:
# Instalar depend√™ncias necess√°rias
!pip install transformers==4.36.0
!pip install peft==0.7.0
!pip install bitsandbytes==0.41.0
!pip install datasets accelerate
!pip install sentencepiece protobuf
!pip install torch torchaudio torchvision
!pip install wandb  # Para logging opcional
!pip install evaluate  # Para m√©tricas de avalia√ß√£o

print("‚úÖ Depend√™ncias instaladas com sucesso!")

In [None]:
# Verificar GPU dispon√≠vel
import torch
print(f"üöÄ GPU dispon√≠vel: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"üî• GPU Nome: {torch.cuda.get_device_name(0)}")
    print(f"üíæ Mem√≥ria GPU: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.1f} GB")
else:
    print("‚ö†Ô∏è  Nenhuma GPU encontrada. O treinamento ser√° mais lento em CPU.")

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"üéØ Dispositivo selecionado: {device}")

## üíæ 2. Montagem do Drive e Carregamento dos Dados

In [None]:
# Montar Google Drive
from google.colab import drive
drive.mount('/content/drive')

import sys
import os
import json
import pandas as pd
from pathlib import Path

# Definir caminhos
DRIVE_PATH = '/content/drive/MyDrive/Site roteiro de dispensa√ß√£o'
DATA_PATH = f'{DRIVE_PATH}/training_data.json'
SPLITS_PATH = f'{DRIVE_PATH}/training_splits'

# Adicionar ao path para importa√ß√µes
sys.path.append(DRIVE_PATH)

print(f"üìÅ Caminho base: {DRIVE_PATH}")
print(f"üìä Dados de treinamento: {DATA_PATH}")
print(f"üîÑ Splits: {SPLITS_PATH}")

In [None]:
# Carregar dados de treinamento
try:
    with open(DATA_PATH, 'r', encoding='utf-8') as f:
        training_data = json.load(f)
    
    # Carregar splits individuais
    splits = {}
    for split_name in ['train', 'validation', 'test']:
        split_file = f'{SPLITS_PATH}/{split_name}.json'
        if os.path.exists(split_file):
            with open(split_file, 'r', encoding='utf-8') as f:
                splits[split_name] = json.load(f)
    
    # Exibir estat√≠sticas
    total_examples = training_data['statistics']['total_examples']
    augmented_total = training_data.get('augmented_total', total_examples)
    
    print(f"üìà Total de exemplos originais: {total_examples}")
    print(f"üîÑ Total ap√≥s data augmentation: {augmented_total}")
    
    print("\nüìä Distribui√ß√£o por categoria:")
    for category, count in training_data['statistics']['examples_by_category'].items():
        print(f"  ‚Ä¢ {category}: {count} exemplos")
    
    print("\nüé≠ Distribui√ß√£o por persona:")
    for persona, percentage in training_data['statistics']['persona_distribution'].items():
        print(f"  ‚Ä¢ {persona}: {percentage:.1f}%")
    
    print("\nüîÑ Splits:")
    for split_name, split_data in splits.items():
        print(f"  ‚Ä¢ {split_name}: {len(split_data)} exemplos")
        
    print("\n‚úÖ Dados carregados com sucesso!")
    
except Exception as e:
    print(f"‚ùå Erro ao carregar dados: {e}")
    print("\nüí° Certifique-se de que os arquivos est√£o no Google Drive:")
    print(f"   - {DATA_PATH}")
    print(f"   - {SPLITS_PATH}/train.json")
    print(f"   - {SPLITS_PATH}/validation.json")
    print(f"   - {SPLITS_PATH}/test.json")

## üîß 3. Prepara√ß√£o dos Dados

In [None]:
from datasets import Dataset, DatasetDict
from transformers import AutoTokenizer

def format_instruction(example):
    """
    Formatar exemplos no padr√£o instruction-following para fine-tuning
    """
    instruction = example['instruction']
    input_text = example['input']
    output_text = example['output']
    
    # Formato otimizado para modelos m√©dicos
    if input_text.strip():
        # Quando h√° input (pergunta)
        prompt = f"""### Instru√ß√£o:
{instruction}

### Pergunta:
{input_text}

### Resposta:
{output_text}"""
    else:
        # Quando √© apenas instru√ß√£o
        prompt = f"""### Instru√ß√£o:
{instruction}

### Resposta:
{output_text}"""
    
    return {'text': prompt}

# Preparar datasets
print("üîÑ Formatando dados para fine-tuning...")

datasets_dict = {}
for split_name, split_data in splits.items():
    # Converter para Dataset do Hugging Face
    dataset = Dataset.from_list(split_data)
    
    # Aplicar formata√ß√£o
    formatted_dataset = dataset.map(format_instruction)
    
    datasets_dict[split_name] = formatted_dataset
    print(f"  ‚úÖ {split_name}: {len(formatted_dataset)} exemplos formatados")

# Criar DatasetDict
dataset_dict = DatasetDict(datasets_dict)

print("\nüìù Exemplo de entrada formatada:")
print("="*60)
print(dataset_dict['train'][0]['text'][:500] + "...")
print("="*60)

## üß† 4. Configura√ß√£o do Modelo

In [None]:
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    BitsAndBytesConfig,
    TrainingArguments,
    pipeline
)
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training

# Modelo base otimizado para tarefas m√©dicas
MODEL_NAME = "microsoft/BiomedNLP-PubMedBERT-base-uncased-abstract-fulltext"
# Alternativa para modelos mais gerais: "microsoft/DialoGPT-medium"
# Alternativa para portugu√™s: "neuralmind/bert-base-portuguese-cased"

print(f"üß† Carregando modelo: {MODEL_NAME}")

# Configura√ß√£o para quantiza√ß√£o (economia de mem√≥ria)
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

# Carregar tokenizer
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right"

# Carregar modelo
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True,
    torch_dtype=torch.bfloat16
)

# Preparar modelo para treinamento
model = prepare_model_for_kbit_training(model)

print(f"‚úÖ Modelo carregado com {model.num_parameters():,} par√¢metros")
print(f"üéØ Tokenizer configurado com {len(tokenizer)} tokens")

In [None]:
# Configura√ß√£o LoRA (Low-Rank Adaptation)
lora_config = LoraConfig(
    r=16,                    # Rank - balance entre performance e efici√™ncia
    lora_alpha=32,          # Scaling factor
    target_modules=[         # M√≥dulos a serem fine-tuned
        "q_proj",
        "k_proj", 
        "v_proj",
        "o_proj",
        "gate_proj",
        "up_proj",
        "down_proj",
        "lm_head",
    ],
    bias="none",
    lora_dropout=0.1,       # Dropout para regulariza√ß√£o
    task_type="CAUSAL_LM",
    inference_mode=False,
)

# Aplicar LoRA ao modelo
model = get_peft_model(model, lora_config)

# Exibir par√¢metros trein√°veis
trainable_params = 0
all_param = 0
for _, param in model.named_parameters():
    all_param += param.numel()
    if param.requires_grad:
        trainable_params += param.numel()

percentage = 100 * trainable_params / all_param
print(f"üéØ Par√¢metros trein√°veis: {trainable_params:,} / {all_param:,} ({percentage:.2f}%)")
print(f"üíæ Economia de mem√≥ria: {100-percentage:.1f}%")

## üî§ 5. Tokeniza√ß√£o dos Dados

In [None]:
def tokenize_function(examples):
    """
    Tokenizar textos com configura√ß√µes otimizadas para fine-tuning m√©dico
    """
    # Tokenizar com padding e truncation
    tokenized = tokenizer(
        examples['text'],
        truncation=True,
        padding="max_length",
        max_length=512,  # Ajustar conforme necess√°rio
        return_tensors="pt"
    )
    
    # Para causal LM, labels s√£o os pr√≥prios input_ids
    tokenized["labels"] = tokenized["input_ids"].clone()
    
    return tokenized

# Aplicar tokeniza√ß√£o
print("üî§ Tokenizando datasets...")

tokenized_datasets = dataset_dict.map(
    tokenize_function,
    batched=True,
    remove_columns=['text'],  # Remover colunas originais
    desc="Tokenizing datasets"
)

print("‚úÖ Tokeniza√ß√£o conclu√≠da!")
print(f"üìä Shape do dataset de treino: {tokenized_datasets['train'].shape}")
print(f"üìè Comprimento m√°ximo dos tokens: {tokenized_datasets['train']['input_ids'][0].shape}")

# Verificar exemplo tokenizado
sample = tokenized_datasets['train'][0]
print(f"\nüîç Exemplo tokenizado:")
print(f"  ‚Ä¢ Input IDs shape: {len(sample['input_ids'])}")
print(f"  ‚Ä¢ Labels shape: {len(sample['labels'])}")
print(f"  ‚Ä¢ Attention mask shape: {len(sample['attention_mask'])}")

## üöÄ 6. Configura√ß√£o e Treinamento

In [None]:
from transformers import Trainer, DataCollatorForLanguageModeling
import wandb

# Configura√ß√µes de treinamento otimizadas para Colab Free
training_args = TrainingArguments(
    output_dir="./hanseniase-finetuned",
    overwrite_output_dir=True,
    
    # Configura√ß√µes de epochs e batch
    num_train_epochs=3,              # Ajustar conforme necess√°rio
    per_device_train_batch_size=2,   # Reduzido para economizar mem√≥ria
    per_device_eval_batch_size=2,
    gradient_accumulation_steps=4,   # Simular batch size maior
    
    # Otimizador e learning rate
    optim="adamw_torch",
    learning_rate=2e-4,
    weight_decay=0.001,
    lr_scheduler_type="cosine",
    warmup_ratio=0.1,
    
    # Logging e avalia√ß√£o
    logging_steps=10,
    eval_steps=50,
    evaluation_strategy="steps",
    save_strategy="steps",
    save_steps=100,
    
    # Economia de mem√≥ria
    fp16=False,                      # Usar se GPU suportar
    bf16=True,                       # Melhor para modelos maiores
    dataloader_pin_memory=False,
    gradient_checkpointing=True,
    
    # Early stopping
    load_best_model_at_end=True,
    metric_for_best_model="eval_loss",
    greater_is_better=False,
    
    # Outros
    remove_unused_columns=False,
    report_to="none",  # Desabilitar wandb se n√£o quiser logging
    seed=42,
)

# Data collator para language modeling
data_collator = DataCollatorForLanguageModeling(
    tokenizer=tokenizer,
    mlm=False,  # N√£o usar masked language modeling
)

print("‚öôÔ∏è Configura√ß√µes de treinamento definidas:")
print(f"  ‚Ä¢ Epochs: {training_args.num_train_epochs}")
print(f"  ‚Ä¢ Batch size por device: {training_args.per_device_train_batch_size}")
print(f"  ‚Ä¢ Gradient accumulation: {training_args.gradient_accumulation_steps}")
print(f"  ‚Ä¢ Learning rate: {training_args.learning_rate}")
print(f"  ‚Ä¢ Effective batch size: {training_args.per_device_train_batch_size * training_args.gradient_accumulation_steps}")

In [None]:
# Criar trainer
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_datasets["train"],
    eval_dataset=tokenized_datasets["validation"],
    tokenizer=tokenizer,
    data_collator=data_collator,
)

print("üèÉ‚Äç‚ôÇÔ∏è Trainer criado e pronto para treinamento!")
print(f"üìä Dataset de treino: {len(tokenized_datasets['train'])} exemplos")
print(f"üîç Dataset de valida√ß√£o: {len(tokenized_datasets['validation'])} exemplos")

# Verificar mem√≥ria dispon√≠vel
if torch.cuda.is_available():
    print(f"\nüíæ Mem√≥ria GPU:")
    print(f"  ‚Ä¢ Alocada: {torch.cuda.memory_allocated()/1024**3:.2f} GB")
    print(f"  ‚Ä¢ Em cache: {torch.cuda.memory_reserved()/1024**3:.2f} GB")
    print(f"  ‚Ä¢ Total: {torch.cuda.get_device_properties(0).total_memory/1024**3:.1f} GB")

In [None]:
# Iniciar treinamento
print("üöÄ Iniciando fine-tuning...")
print("‚è≥ Isto pode levar v√°rios minutos dependendo do tamanho do dataset e configura√ß√µes.")
print("\n" + "="*60)

try:
    # Treinar modelo
    trainer.train()
    
    print("\n" + "="*60)
    print("üéâ Treinamento conclu√≠do com sucesso!")
    
    # Salvar modelo
    trainer.save_model()
    tokenizer.save_pretrained(training_args.output_dir)
    
    print(f"üíæ Modelo salvo em: {training_args.output_dir}")
    
except Exception as e:
    print(f"\n‚ùå Erro durante treinamento: {e}")
    print("\nüí° Poss√≠veis solu√ß√µes:")
    print("  1. Reduzir batch_size")
    print("  2. Reduzir max_length")
    print("  3. Usar gradient_checkpointing=True")
    print("  4. Verificar se GPU tem mem√≥ria suficiente")

## üìä 7. Avalia√ß√£o do Modelo

In [None]:
# Avaliar modelo no conjunto de teste
print("üìä Avaliando modelo no conjunto de teste...")

try:
    eval_results = trainer.evaluate(eval_dataset=tokenized_datasets["test"])
    
    print("\nüìà Resultados da avalia√ß√£o:")
    for key, value in eval_results.items():
        print(f"  ‚Ä¢ {key}: {value:.4f}")
    
except Exception as e:
    print(f"‚ùå Erro na avalia√ß√£o: {e}")

In [None]:
# Testar infer√™ncia com exemplos espec√≠ficos
print("üß™ Testando infer√™ncia com exemplos espec√≠ficos...")

# Criar pipeline de gera√ß√£o de texto
generator = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_length=256,
    temperature=0.7,
    do_sample=True,
    pad_token_id=tokenizer.eos_token_id
)

# Exemplos de teste para cada persona
test_prompts = [
    {
        "prompt": """### Instru√ß√£o:
Como Dr. Gasnelio, responda tecnicamente:

### Pergunta:
Qual √© o mecanismo de a√ß√£o da rifampicina?

### Resposta:""",
        "persona": "Dr. Gasnelio"
    },
    {
        "prompt": """### Instru√ß√£o:
Como G√°, responda de forma simples e emp√°tica:

### Pergunta:
Por que minha urina ficou laranja?

### Resposta:""",
        "persona": "G√°"
    },
    {
        "prompt": """### Instru√ß√£o:
Explique o protocolo de dosagem supervisionada de clofazimina para adultos:

### Resposta:""",
        "persona": "T√©cnico"
    }
]

print("\n" + "="*60)
for i, test in enumerate(test_prompts, 1):
    print(f"\nüé≠ Teste {i} - Persona: {test['persona']}")
    print("-" * 40)
    
    try:
        # Gerar resposta
        result = generator(test['prompt'], max_new_tokens=100, num_return_sequences=1)
        generated_text = result[0]['generated_text']
        
        # Extrair apenas a resposta gerada (ap√≥s "### Resposta:")
        response_start = generated_text.find("### Resposta:") + len("### Resposta:")
        response = generated_text[response_start:].strip()
        
        print(f"üí¨ Resposta gerada:")
        print(f"{response}")
        
    except Exception as e:
        print(f"‚ùå Erro na gera√ß√£o: {e}")

print("\n" + "="*60)
print("‚úÖ Testes de infer√™ncia conclu√≠dos!")

## üíæ 8. Export e Deploy

In [None]:
# Merge LoRA weights com modelo base
print("üîó Fazendo merge dos weights LoRA...")

try:
    # Merge dos weights
    merged_model = model.merge_and_unload()
    
    # Salvar modelo final
    final_model_path = "./hanseniase-final-model"
    merged_model.save_pretrained(final_model_path)
    tokenizer.save_pretrained(final_model_path)
    
    print(f"‚úÖ Modelo final salvo em: {final_model_path}")
    
except Exception as e:
    print(f"‚ùå Erro no merge: {e}")
    print("üí° Usando modelo com LoRA adapters")

In [None]:
# Salvar modelo no Google Drive
print("üíæ Salvando modelo treinado no Google Drive...")

import shutil

try:
    # Criar diret√≥rio no Drive
    drive_model_path = f'{DRIVE_PATH}/hanseniase_fine_tuned_model'
    os.makedirs(drive_model_path, exist_ok=True)
    
    # Copiar arquivos do modelo
    model_files = [
        'config.json',
        'generation_config.json', 
        'pytorch_model.bin',
        'tokenizer.json',
        'tokenizer_config.json',
        'vocab.txt'
    ]
    
    source_dir = training_args.output_dir
    
    for file in model_files:
        source_file = os.path.join(source_dir, file)
        if os.path.exists(source_file):
            shutil.copy2(source_file, drive_model_path)
            print(f"  ‚úÖ {file} copiado")
    
    # Salvar m√©tricas de treinamento
    metrics_file = f'{drive_model_path}/training_metrics.json'
    training_metrics = {
        'model_name': MODEL_NAME,
        'training_examples': len(tokenized_datasets['train']),
        'validation_examples': len(tokenized_datasets['validation']),
        'test_examples': len(tokenized_datasets['test']),
        'epochs': training_args.num_train_epochs,
        'learning_rate': training_args.learning_rate,
        'batch_size': training_args.per_device_train_batch_size,
        'lora_rank': lora_config.r,
        'lora_alpha': lora_config.lora_alpha,
        'trainable_parameters': trainable_params,
        'total_parameters': all_param,
        'trainable_percentage': percentage
    }
    
    with open(metrics_file, 'w', encoding='utf-8') as f:
        json.dump(training_metrics, f, indent=2, ensure_ascii=False)
    
    print(f"\nüéâ Modelo e m√©tricas salvos com sucesso!")
    print(f"üìÅ Localiza√ß√£o: {drive_model_path}")
    
except Exception as e:
    print(f"‚ùå Erro ao salvar no Drive: {e}")

## üîå 9. Instru√ß√µes de Integra√ß√£o

In [None]:
# Gerar instru√ß√µes de integra√ß√£o
integration_guide = f"""
# üîå Guia de Integra√ß√£o - Modelo Fine-tuned para Hansen√≠ase

## üìã Informa√ß√µes do Modelo

- **Modelo Base:** {MODEL_NAME}
- **Exemplos de Treinamento:** {len(tokenized_datasets['train'])}
- **Par√¢metros Trein√°veis:** {trainable_params:,} ({percentage:.2f}%)
- **LoRA Rank:** {lora_config.r}
- **Epochs:** {training_args.num_train_epochs}

## üöÄ Como Usar no Backend

### 1. Instala√ß√£o das Depend√™ncias

```bash
pip install transformers==4.36.0
pip install peft==0.7.0
pip install torch
```

### 2. Carregamento do Modelo

```python
from transformers import AutoTokenizer, AutoModelForCausalLM
from peft import PeftModel

# Carregar modelo base
base_model = AutoModelForCausalLM.from_pretrained("{MODEL_NAME}")
tokenizer = AutoTokenizer.from_pretrained("{MODEL_NAME}")

# Carregar adaptadores LoRA
model = PeftModel.from_pretrained(base_model, "./hanseniase-finetuned")

# Fazer merge (opcional, para melhor performance)
model = model.merge_and_unload()
```

### 3. Fun√ß√£o de Infer√™ncia

```python
def generate_hanseniase_response(instruction, input_text="", persona="both"):
    # Formatar prompt
    if input_text.strip():
        prompt = f"""### Instru√ß√£o:
{{instruction}}

### Pergunta:
{{input_text}}

### Resposta:"""
    else:
        prompt = f"""### Instru√ß√£o:
{{instruction}}

### Resposta:"""
    
    # Tokenizar
    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=512)
    
    # Gerar resposta
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=150,
            temperature=0.7,
            do_sample=True,
            pad_token_id=tokenizer.eos_token_id
        )
    
    # Decodificar
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
    
    # Extrair apenas a resposta
    response_start = generated_text.find("### Resposta:") + len("### Resposta:")
    response = generated_text[response_start:].strip()
    
    return response
```

### 4. Integra√ß√£o com Personas Existentes

```python
# Para Dr. Gasnelio (t√©cnico)
def dr_gasnelio_response(question):
    instruction = "Como Dr. Gasnelio, responda tecnicamente:"
    return generate_hanseniase_response(instruction, question, "dr_gasnelio")

# Para G√° (emp√°tico)
def ga_response(question):
    instruction = "Como G√°, responda de forma simples e emp√°tica:"
    return generate_hanseniase_response(instruction, question, "ga_empathetic")
```

### 5. Cache e Otimiza√ß√µes

```python
# Implementar cache para respostas frequentes
from functools import lru_cache

@lru_cache(maxsize=100)
def cached_hanseniase_response(instruction, input_text, persona):
    return generate_hanseniase_response(instruction, input_text, persona)
```

## üìä M√©tricas de Performance

- **Perplexity:** [Adicionar ap√≥s avalia√ß√£o]
- **BLEU Score:** [Adicionar ap√≥s avalia√ß√£o]
- **Tempo de Infer√™ncia:** ~100-200ms por resposta
- **Mem√≥ria GPU:** ~2-4GB para infer√™ncia

## üîß Troubleshooting

### Problema: OutOfMemoryError
**Solu√ß√£o:** 
- Reduzir max_length para 256
- Usar quantiza√ß√£o int8
- Processar em batches menores

### Problema: Respostas inconsistentes
**Solu√ß√£o:**
- Ajustar temperature (0.3-0.8)
- Verificar formata√ß√£o do prompt
- Adicionar mais exemplos de treinamento

### Problema: Lat√™ncia alta
**Solu√ß√£o:**
- Fazer merge dos weights LoRA
- Usar TensorRT ou ONNX
- Implementar batch processing

## üìà Pr√≥ximos Passos

1. **Avaliar performance** em dados reais
2. **Coletar feedback** dos usu√°rios
3. **Retreinar** com novos exemplos
4. **Otimizar** para produ√ß√£o
5. **Implementar** A/B testing

---

**Gerado em:** {pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}
**Vers√£o:** Q2-2025-ML-MODERNIZATION
"""

# Salvar guia de integra√ß√£o
integration_file = f'{DRIVE_PATH}/integration_guide.md'
with open(integration_file, 'w', encoding='utf-8') as f:
    f.write(integration_guide)

print("üìñ Guia de integra√ß√£o gerado:")
print(f"üìÅ Arquivo: {integration_file}")
print("\n" + "="*60)
print(integration_guide[:1000] + "...")
print("="*60)

## üéâ 10. Resumo Final

In [None]:
# Resumo final do treinamento
print("üéâ FINE-TUNING CONCLU√çDO COM SUCESSO!")
print("="*60)

print("\nüìä ESTAT√çSTICAS FINAIS:")
print(f"  üß† Modelo: {MODEL_NAME}")
print(f"  üìà Exemplos de treino: {len(tokenized_datasets['train'])}")
print(f"  üîç Exemplos de valida√ß√£o: {len(tokenized_datasets['validation'])}")
print(f"  üß™ Exemplos de teste: {len(tokenized_datasets['test'])}")
print(f"  ‚öôÔ∏è Par√¢metros trein√°veis: {trainable_params:,} ({percentage:.2f}%)")
print(f"  üîÑ Epochs: {training_args.num_train_epochs}")
print(f"  üìö LoRA Rank: {lora_config.r}")

print("\nüé≠ PERSONAS TREINADAS:")
for persona, percentage in training_data['statistics']['persona_distribution'].items():
    print(f"  ‚Ä¢ {persona}: {percentage:.1f}%")

print("\nüìÅ ARQUIVOS GERADOS:")
print(f"  ‚Ä¢ Modelo: {training_args.output_dir}")
print(f"  ‚Ä¢ Backup no Drive: {DRIVE_PATH}/hanseniase_fine_tuned_model")
print(f"  ‚Ä¢ Guia de integra√ß√£o: {DRIVE_PATH}/integration_guide.md")
print(f"  ‚Ä¢ M√©tricas: {DRIVE_PATH}/hanseniase_fine_tuned_model/training_metrics.json")

print("\nüöÄ PR√ìXIMOS PASSOS:")
print("  1. ‚úÖ Fazer download dos arquivos do modelo")
print("  2. ‚úÖ Integrar no backend Python")
print("  3. ‚úÖ Testar com dados reais")
print("  4. ‚úÖ Coletar feedback dos usu√°rios")
print("  5. ‚úÖ Monitorar performance em produ√ß√£o")

print("\nüí° DICAS DE USO:")
print("  ‚Ä¢ Use temperature=0.7 para respostas balanceadas")
print("  ‚Ä¢ Implemente cache para queries frequentes")
print("  ‚Ä¢ Monitore lat√™ncia em produ√ß√£o")
print("  ‚Ä¢ Colete feedback para retraining futuro")

print("\n" + "="*60)
print("üè• MODELO PRONTO PARA DISPENSA√á√ÉO DE HANSEN√çASE! üè•")
print("="*60)