# Teste do Modelo com Fine-tuning

Este notebook demonstra como carregar e testar o modelo que foi submetido a fine-tuning usando LoRA.

## Objetivo

Testar o modelo treinado para extrair campos estruturados de tickets de call center, verificando se o fine-tuning melhorou a capacidade do modelo de retornar dados em formato JSON.

## Estrutura do Notebook

1. **Carregamento do Modelo**: Carrega o modelo base e o adaptador LoRA treinado
2. **Prepara√ß√£o do Tokenizer**: Configura o tokenizer para processar as entradas
3. **Testes com Exemplos**: Testa o modelo com diferentes exemplos de tickets
4. **Avalia√ß√£o**: Compara as respostas do modelo com os resultados esperados


## 1. Configura√ß√£o e Importa√ß√µes

Configuramos os caminhos e importamos as bibliotecas necess√°rias.


In [1]:
# Importa√ß√µes necess√°rias
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer
from peft import PeftModel
import json
import re

# -------------------------------
# CONFIGURA√á√ÉO
# -------------------------------
MODEL_NAME = "Qwen/Qwen2.5-3B-Instruct"  # Modelo base
LORA_ADAPTER_PATH = "./qwen2.5-lora"  # Caminho do adaptador LoRA treinado

print("Configura√ß√£o carregada:")
print(f"  Modelo base: {MODEL_NAME}")
print(f"  Adaptador LoRA: {LORA_ADAPTER_PATH}")


Configura√ß√£o carregada:
  Modelo base: Qwen/Qwen2.5-3B-Instruct
  Adaptador LoRA: ./qwen2.5-lora


## 2. Carregamento do Tokenizer

Carregamos o tokenizer que ser√° usado para processar as entradas e sa√≠das do modelo.


In [2]:
# Carregar tokenizer
print("Carregando tokenizer...")
tokenizer = AutoTokenizer.from_pretrained(
    MODEL_NAME,
    trust_remote_code=True,
    use_auth_token=True
)

# Configurar padding token se necess√°rio
if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token
    tokenizer.pad_token_id = tokenizer.eos_token_id

print("‚úì Tokenizer carregado com sucesso")
print(f"  Tamanho do vocabul√°rio: {len(tokenizer)}")
print(f"  Token de padding: {tokenizer.pad_token}")


Carregando tokenizer...




‚úì Tokenizer carregado com sucesso
  Tamanho do vocabul√°rio: 151665
  Token de padding: <|endoftext|>


## 3. Carregamento do Modelo Base e Adaptador LoRA

Carregamos o modelo base e depois aplicamos o adaptador LoRA treinado. O adaptador cont√©m apenas os pesos ajustados durante o fine-tuning.


In [3]:
# Carregar modelo base
print("Carregando modelo base...")
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    device_map="auto" if torch.cuda.is_available() else None,
    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
    trust_remote_code=True,
    use_auth_token=True
)

print("‚úì Modelo base carregado")

# Carregar adaptador LoRA treinado
print(f"\nCarregando adaptador LoRA de {LORA_ADAPTER_PATH}...")
model = PeftModel.from_pretrained(model, LORA_ADAPTER_PATH)

print("‚úì Adaptador LoRA carregado com sucesso")

# Colocar modelo em modo de avalia√ß√£o (n√£o treinamento)
model.eval()

if torch.cuda.is_available():
    print(f"  Modelo no dispositivo: {next(model.parameters()).device}")
else:
    print("  Modelo na CPU")


Carregando modelo base...


`torch_dtype` is deprecated! Use `dtype` instead!


Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

‚úì Modelo base carregado

Carregando adaptador LoRA de ./qwen2.5-lora...
'NoneType' object has no attribute 'cadam32bit_grad_fp32'


  warn("The installed version of bitsandbytes was compiled without GPU support. "


‚úì Adaptador LoRA carregado com sucesso
  Modelo na CPU


## 4. Fun√ß√£o de Infer√™ncia

Criamos uma fun√ß√£o auxiliar para fazer infer√™ncia com o modelo, formatando a entrada e processando a sa√≠da.


In [4]:
def generate_response(prompt, max_new_tokens=512, temperature=0.1, top_p=0.9):
    """
    Gera uma resposta do modelo para um prompt dado.
    
    Args:
        prompt: Texto de entrada (descri√ß√£o do ticket)
        max_new_tokens: N√∫mero m√°ximo de tokens a gerar
        temperature: Controla a aleatoriedade (menor = mais determin√≠stico)
        top_p: Nucleus sampling (probabilidade acumulada)
    
    Returns:
        Resposta gerada pelo modelo
    """
    # Formatar prompt no formato esperado pelo modelo
    messages = [
        {"role": "user", "content": prompt}
    ]
    
    # Aplicar template de chat do tokenizer
    if hasattr(tokenizer, 'apply_chat_template') and tokenizer.chat_template is not None:
        formatted_prompt = tokenizer.apply_chat_template(
            messages,
            tokenize=False,
            add_generation_prompt=True
        )
    else:
        # Fallback: formata√ß√£o manual
        formatted_prompt = f"<|im_start|>user\n{prompt}<|im_end|>\n<|im_start|>assistant\n"
    
    # Tokenizar
    inputs = tokenizer(formatted_prompt, return_tensors="pt")
    
    # Mover para o mesmo dispositivo do modelo
    if torch.cuda.is_available():
        inputs = {k: v.cuda() for k, v in inputs.items()}
    
    # Gerar resposta
    with torch.no_grad():
        outputs = model.generate(
            **inputs,
            max_new_tokens=max_new_tokens,
            temperature=temperature,
            top_p=top_p,
            do_sample=temperature > 0,
            pad_token_id=tokenizer.pad_token_id,
            eos_token_id=tokenizer.eos_token_id
        )
    
    # Decodificar resposta (remover o prompt da sa√≠da)
    generated_text = tokenizer.decode(outputs[0], skip_special_tokens=False)
    
    # Extrair apenas a parte gerada (ap√≥s o prompt)
    if "<|im_start|>assistant" in generated_text:
        response = generated_text.split("<|im_start|>assistant")[-1]
        response = response.replace("<|im_end|>", "").strip()
    else:
        # Se n√£o encontrar o marcador, pegar tudo ap√≥s o prompt
        prompt_tokens = len(tokenizer.encode(formatted_prompt))
        response = tokenizer.decode(outputs[0][prompt_tokens:], skip_special_tokens=True)
    
    return response

print("‚úì Fun√ß√£o de infer√™ncia criada")


‚úì Fun√ß√£o de infer√™ncia criada


## 5. Testes com Exemplos

Testamos o modelo com diferentes exemplos de tickets para verificar se ele consegue extrair os campos corretamente.


In [5]:
# Exemplos de teste
test_examples = [
    {
        "name": "Exemplo 1: Upgrade de PostgreSQL",
        "prompt": (
            "Short description: Request for PostgreSQL upgrade to the latest version.\n"
            "Content: I would like to request an upgrade for our PostgreSQL to the latest version "
            "in order to utilize new features and improvements. Before proceeding, please assess "
            "the impact this upgrade may have on our current projects and confirm compatibility "
            "with our existing data. Could you escalate this request to the Software Upgrade Team for me?\n"
            "Preencha os seguintes campos em JSON:\n"
            "- category\n"
            "- subcategory\n"
            "- issue_request\n"
            "- assignment_group\n"
            "- software_system\n"
            "- poor_close_notes\n"
            "- resolution_time\n"
            "- info_score_close_notes"
        )
    },
    {
        "name": "Exemplo 2: Problema de Login",
        "prompt": (
            "Short description: User unable to login to system\n"
            "Content: I am experiencing issues logging into the company portal. "
            "I have tried resetting my password multiple times but still cannot access my account. "
            "The error message says 'Invalid credentials' but I am certain I am using the correct password.\n"
            "Preencha os seguintes campos em JSON:\n"
            "- category\n"
            "- subcategory\n"
            "- issue_request\n"
            "- assignment_group\n"
            "- software_system\n"
            "- poor_close_notes\n"
            "- resolution_time\n"
            "- info_score_close_notes"
        )
    },
    {
        "name": "Exemplo 3: Aplica√ß√£o com Crash",
        "prompt": (
            "Short description: Application crashes when saving files\n"
            "Content: The application ZTrend keeps crashing whenever I try to save a file. "
            "This started happening after the last system update. I have lost work multiple times. "
            "Please help me resolve this issue as soon as possible.\n"
            "Preencha os seguintes campos em JSON:\n"
            "- category\n"
            "- subcategory\n"
            "- issue_request\n"
            "- assignment_group\n"
            "- software_system\n"
            "- poor_close_notes\n"
            "- resolution_time\n"
            "- info_score_close_notes"
        )
    }
]

print(f"Preparados {len(test_examples)} exemplos para teste")


Preparados 3 exemplos para teste


In [6]:
# Executar testes
print("=" * 80)
print("EXECUTANDO TESTES DO MODELO")
print("=" * 80)

results = []

for i, example in enumerate(test_examples, 1):
    print(f"\n{'='*80}")
    print(f"TESTE {i}: {example['name']}")
    print(f"{'='*80}")
    
    print("\nüì• Prompt:")
    print(example['prompt'][:200] + "..." if len(example['prompt']) > 200 else example['prompt'])
    
    print("\nü§ñ Gerando resposta...")
    try:
        response = generate_response(example['prompt'])
        
        print("\nüì§ Resposta do modelo:")
        print(response)
        
        # Tentar parsear como JSON
        try:
            # Limpar a resposta (remover markdown code blocks se houver)
            cleaned_response = response.strip()
            if cleaned_response.startswith("```"):
                # Remover code blocks
                lines = cleaned_response.split("\n")
                cleaned_response = "\n".join([l for l in lines if not l.strip().startswith("```")])
            
            parsed_json = json.loads(cleaned_response)
            print("\n‚úÖ Resposta v√°lida em formato JSON:")
            print(json.dumps(parsed_json, indent=2, ensure_ascii=False))
            
            results.append({
                "test": example['name'],
                "success": True,
                "response": response,
                "parsed_json": parsed_json
            })
            
        except json.JSONDecodeError as e:
            print(f"\n‚ö†Ô∏è  Resposta n√£o √© JSON v√°lido: {e}")
            print(f"   Tentando extrair JSON da resposta...")
            
            # Tentar encontrar JSON na resposta
            json_match = re.search(r'\{.*\}', response, re.DOTALL)
            if json_match:
                try:
                    parsed_json = json.loads(json_match.group())
                    print("\n‚úÖ JSON extra√≠do com sucesso:")
                    print(json.dumps(parsed_json, indent=2, ensure_ascii=False))
                    results.append({
                        "test": example['name'],
                        "success": True,
                        "response": response,
                        "parsed_json": parsed_json
                    })
                except:
                    results.append({
                        "test": example['name'],
                        "success": False,
                        "response": response,
                        "error": "N√£o foi poss√≠vel parsear JSON"
                    })
            else:
                results.append({
                    "test": example['name'],
                    "success": False,
                    "response": response,
                    "error": "Nenhum JSON encontrado na resposta"
                })
                
    except Exception as e:
        print(f"\n‚ùå Erro durante a gera√ß√£o: {e}")
        import traceback
        traceback.print_exc()
        results.append({
            "test": example['name'],
            "success": False,
            "error": str(e)
        })
    
    print("\n" + "-"*80)


EXECUTANDO TESTES DO MODELO

TESTE 1: Exemplo 1: Upgrade de PostgreSQL

üì• Prompt:
Short description: Request for PostgreSQL upgrade to the latest version.
Content: I would like to request an upgrade for our PostgreSQL to the latest version in order to utilize new features and impro...

ü§ñ Gerando resposta...

üì§ Resposta do modelo:
{"category": "SOFTWARE", "subcategory": "INSTALLATION", "issue_request": "PostgreSQL Upgrade Request", "assignment_group": "APPLICATION SUPPORT", "software_system": "PostgreSQL", "poor_close_notes": "Issue resolved", "resolution_time": 124.78, "info_score_close_notes": 0.9}

‚úÖ Resposta v√°lida em formato JSON:
{
  "category": "SOFTWARE",
  "subcategory": "INSTALLATION",
  "issue_request": "PostgreSQL Upgrade Request",
  "assignment_group": "APPLICATION SUPPORT",
  "software_system": "PostgreSQL",
  "poor_close_notes": "Issue resolved",
  "resolution_time": 124.78,
  "info_score_close_notes": 0.9
}

---------------------------------------------------

## 6. Resumo dos Resultados

Exibimos um resumo dos testes realizados.


In [7]:
# Resumo dos resultados
print("=" * 80)
print("RESUMO DOS TESTES")
print("=" * 80)

total_tests = len(results)
successful_tests = sum(1 for r in results if r.get('success', False))
failed_tests = total_tests - successful_tests

print(f"\nTotal de testes: {total_tests}")
print(f"‚úÖ Sucessos: {successful_tests}")
print(f"‚ùå Falhas: {failed_tests}")
if total_tests > 0:
    print(f"üìä Taxa de sucesso: {successful_tests/total_tests*100:.1f}%")

print("\n" + "=" * 80)
print("DETALHES POR TESTE")
print("=" * 80)

for i, result in enumerate(results, 1):
    status = "‚úÖ" if result.get('success', False) else "‚ùå"
    print(f"\n{status} Teste {i}: {result['test']}")
    
    if result.get('success'):
        print(f"   Campos extra√≠dos: {list(result.get('parsed_json', {}).keys())}")
    else:
        print(f"   Erro: {result.get('error', 'Desconhecido')}")
        if 'response' in result:
            print(f"   Resposta: {result['response'][:100]}...")


RESUMO DOS TESTES

Total de testes: 3
‚úÖ Sucessos: 3
‚ùå Falhas: 0
üìä Taxa de sucesso: 100.0%

DETALHES POR TESTE

‚úÖ Teste 1: Exemplo 1: Upgrade de PostgreSQL
   Campos extra√≠dos: ['category', 'subcategory', 'issue_request', 'assignment_group', 'software_system', 'poor_close_notes', 'resolution_time', 'info_score_close_notes']

‚úÖ Teste 2: Exemplo 2: Problema de Login
   Campos extra√≠dos: ['category', 'subcategory', 'issue_request', 'assignment_group', 'software_system', 'poor_close_notes', 'resolution_time', 'info_score_close_notes']

‚úÖ Teste 3: Exemplo 3: Aplica√ß√£o com Crash
   Campos extra√≠dos: ['category', 'subcategory', 'issue_request', 'assignment_group', 'software_system', 'poor_close_notes', 'resolution_time', 'info_score_close_notes']


## 7. Teste Interativo

Voc√™ pode testar o modelo com seus pr√≥prios exemplos aqui. Modifique o prompt abaixo para testar diferentes casos.


In [8]:
# Teste interativo - modifique o prompt abaixo
custom_prompt = """
Short description: [Sua descri√ß√£o curta aqui]
Content: [Descri√ß√£o detalhada do problema ou solicita√ß√£o]
Preencha os seguintes campos em JSON:
- category
- subcategory
- issue_request
- assignment_group
- software_system
- poor_close_notes
- resolution_time
- info_score_close_notes
"""

print("Testando com prompt customizado...")
print("\nüì• Prompt:")
print(custom_prompt)

response = generate_response(custom_prompt)

print("\nüì§ Resposta do modelo:")
print(response)

# Tentar parsear JSON
try:
    json_match = re.search(r'\{.*\}', response, re.DOTALL)
    if json_match:
        parsed = json.loads(json_match.group())
        print("\n‚úÖ JSON extra√≠do:")
        print(json.dumps(parsed, indent=2, ensure_ascii=False))
    else:
        print("\n‚ö†Ô∏è  Nenhum JSON encontrado na resposta")
except Exception as e:
    print(f"\n‚ö†Ô∏è  N√£o foi poss√≠vel extrair JSON: {e}")


Testando com prompt customizado...

üì• Prompt:

Short description: [Sua descri√ß√£o curta aqui]
Content: [Descri√ß√£o detalhada do problema ou solicita√ß√£o]
Preencha os seguintes campos em JSON:
- category
- subcategory
- issue_request
- assignment_group
- software_system
- poor_close_notes
- resolution_time
- info_score_close_notes


üì§ Resposta do modelo:
{"category": "SOFTWARE", "subcategory": "ERROR", "issue_request": "Sua descri√ß√£o de problema aqui", "assignment_group": "TECH SUPPORT TEAM", "software_system": "Sua aplica√ß√£o aqui", "poor_close_notes": "Problema resolvido", "resolution_time": 1208.749563, "info_score_close_notes": 0.8}

‚úÖ JSON extra√≠do:
{
  "category": "SOFTWARE",
  "subcategory": "ERROR",
  "issue_request": "Sua descri√ß√£o de problema aqui",
  "assignment_group": "TECH SUPPORT TEAM",
  "software_system": "Sua aplica√ß√£o aqui",
  "poor_close_notes": "Problema resolvido",
  "resolution_time": 1208.749563,
  "info_score_close_notes": 0.8
}
