# Tutorial de Fine-Tuning - FIAP Tech Challenge Fase 3

## O que √© Fine-Tuning?

Fine-tuning √© o processo de adaptar um modelo de linguagem pr√©-treinado para executar uma tarefa espec√≠fica. Em vez de treinar do zero (que levaria semanas), pegamos um modelo existente e o treinamos com nossos dados espec√≠ficos.

## O que Vamos Aprender

1. **Prepara√ß√£o de Dados**: Como formatar dados para treinamento
2. **Carregamento de Modelo**: Como carregar um modelo pr√©-treinado eficientemente
3. **Configura√ß√£o LoRA**: Como usar Low-Rank Adaptation para treinamento eficiente
4. **Processo de Treinamento**: Como treinar o modelo passo a passo
5. **Infer√™ncia**: Como usar o modelo treinado para gerar texto

## Conceitos Principais

- **Modelo Pr√©-treinado**: Um modelo j√° treinado em dados massivos de texto
- **LoRA**: T√©cnica para treinar apenas pequenas partes do modelo (economiza mem√≥ria)
- **Quantiza√ß√£o 4-bit**: Reduz o tamanho do modelo em 75% com perda m√≠nima de qualidade
- **Formato Alpaca**: Formato padr√£o para datasets de instru√ß√£o

## Pr√©-requisitos

Antes de come√ßar, certifique-se de ter:
- Dataset processado no formato Alpaca (da prepara√ß√£o de dados)
- Mem√≥ria GPU suficiente (recomendado: 8GB+ VRAM)
- Bibliotecas necess√°rias instaladas


## Etapa 1: Configura√ß√£o do Ambiente e Depend√™ncias

Primeiro, vamos instalar as bibliotecas necess√°rias e configurar nosso ambiente:

### Bibliotecas Necess√°rias:
- **transformers**: Biblioteca Hugging Face para modelos pr√©-treinados
- **peft**: Parameter Efficient Fine-Tuning (suporte LoRA)
- **bitsandbytes**: Suporte √† quantiza√ß√£o 4-bit
- **datasets**: Carregamento e processamento de datasets
- **accelerate**: Acelera√ß√£o de treinamento


In [None]:
# Install required libraries
%pip install transformers peft bitsandbytes datasets accelerate torch

# Import necessary modules
import os
import torch
from fine_tuning.config import FineTuningConfig
from fine_tuning.trainer import FineTuningTrainer
from fine_tuning.model_detector import get_optimal_config


Defaulting to user installation because normal site-packages is not writeable


[0mNote: you may need to restart the kernel to use updated packages.
Bibliotecas instaladas e importadas com sucesso!


## Etapa 2: Detec√ß√£o de Ambiente e Configura√ß√£o de Caminhos

Nosso sistema detecta automaticamente a melhor configura√ß√£o baseada no seu ambiente (Colab vs Local) e recursos dispon√≠veis (GPU, RAM, etc.).


In [4]:
# Check if running in Google Colab
try:
    from google.colab import drive
    IN_COLAB = True
    drive.mount('/content/drive')
    BASE_PATH = "/content/drive/MyDrive/Fiap"
    print("Executando no Google Colab")
except ImportError:
    IN_COLAB = False
    BASE_PATH = "./data"
    print("Executando localmente")

# Define file paths
train_file = f"{BASE_PATH}/trn_finetune.jsonl"
output_dir = f"{BASE_PATH}/fine_tuned_model"

print(f"Arquivo de treino: {train_file}")
print(f"Diret√≥rio de sa√≠da: {output_dir}")

# Check if training file exists
if os.path.exists(train_file):
    print("SUCCESS: Arquivo de treino encontrado!")
    file_size = os.path.getsize(train_file) / (1024 * 1024)
    print(f"Tamanho do arquivo: {file_size:.1f} MB")
else:
    print("ERROR: Arquivo de treino n√£o encontrado! Execute a prepara√ß√£o de dados primeiro.")

# Create small sample for testing (only 1000 records)
print("\nCREATING: Criando amostra pequena para teste funcional...")
sample_file = f"{BASE_PATH}/trn_finetune_sample.jsonl"

if os.path.exists(train_file):
    import json
    
    # Read only first 1000 lines for testing
    with open(train_file, 'r', encoding='utf-8') as f:
        sample_data = []
        for i, line in enumerate(f):
            if i >= 1000:  # Limit to 1000 records
                break
            sample_data.append(line.strip())
    
    # Save sample file
    with open(sample_file, 'w', encoding='utf-8') as f:
        for line in sample_data:
            f.write(line + '\n')
    
    print(f"SUCCESS: Amostra criada: {sample_file}")
    print(f"Registros na amostra: {len(sample_data)}")
    print(f"Tamanho da amostra: {os.path.getsize(sample_file) / (1024 * 1024):.1f} MB")
    
    # Use sample file for training
    train_file = sample_file
    print("INFO: Usando amostra pequena para treinamento de teste")
else:
    print("ERROR: Arquivo de treino n√£o encontrado!")


Executando localmente
Arquivo de treino: ./data/trn_finetune.jsonl
Diret√≥rio de sa√≠da: ./data/fine_tuned_model
SUCCESS: Arquivo de treino encontrado!
Tamanho do arquivo: 648.2 MB

CREATING: Criando amostra pequena para teste funcional...
SUCCESS: Amostra criada: ./data/trn_finetune_sample.jsonl
Registros na amostra: 1000
Tamanho da amostra: 0.5 MB
INFO: Usando amostra pequena para treinamento de teste


## Etapa 3: Detec√ß√£o de Modelo e Configura√ß√£o

Nosso sistema detecta automaticamente o melhor modelo e configura√ß√£o baseado no seu hardware:


In [5]:
# Detect optimal configuration
print("Detectando configura√ß√£o √≥tima...")
config = get_optimal_config()

print(f"\nConfigura√ß√£o detectada:")
print(f"Modelo: {config.model_name}")
print(f"Framework: {config.framework}")
print(f"Unsloth dispon√≠vel: {config.use_unsloth}")
print(f"Quantiza√ß√£o: {config.quantization}")
print(f"Tamanho do lote: {config.batch_size}")
print(f"Comprimento m√°ximo: {config.max_length}")
print(f"Raz√£o: {config.reason}")


Detectando configura√ß√£o √≥tima...
=== DETEC√á√ÉO DE MODELO COMPAT√çVEL ===
Ambiente: Local
RAM: 30.5 GB
GPU: N√£o

Modelo Selecionado: distilgpt2
Framework: transformers
Unsloth: N√£o
Quantiza√ß√£o: Nenhuma
Batch Size: 1
Max Length: 128
Raz√£o: Sistema CPU com muita RAM - modelo pequeno

Configura√ß√£o detectada:
Modelo: distilgpt2
Framework: transformers
Unsloth dispon√≠vel: False
Quantiza√ß√£o: None
Tamanho do lote: 1
Comprimento m√°ximo: 128
Raz√£o: Sistema CPU com muita RAM - modelo pequeno


## Etapa 4: Criar Configura√ß√£o de Fine-Tuning

Agora vamos criar a configura√ß√£o completa de fine-tuning com todos os par√¢metros necess√°rios:


In [6]:
# Create fine-tuning configuration
print("Criando configura√ß√£o de fine-tuning...")
finetuning_config = FineTuningConfig.create_default(train_file, output_dir)

# Configure for fast testing with small dataset
print("\nCONFIGURING: Configurando para teste r√°pido...")
finetuning_config.training_config.num_epochs = 1  # Only 1 epoch for testing
finetuning_config.training_config.learning_rate = 5e-4  # Higher learning rate
finetuning_config.training_config.logging_steps = 5  # Log more frequently
finetuning_config.training_config.save_steps = 100  # Save more frequently
finetuning_config.training_config.eval_steps = 100  # Evaluate more frequently
finetuning_config.training_config.gradient_accumulation_steps = 2  # Accumulate gradients
finetuning_config.model_config.batch_size = 2  # Smaller batch size

# Print configuration summary
finetuning_config.print_summary()

# Verify configuration
print(f"\nVerifica√ß√£o da configura√ß√£o:")
print(f"Arquivo de treino existe: {os.path.exists(train_file)}")
print(f"Diret√≥rio de sa√≠da: {output_dir}")
print(f"Modelo: {finetuning_config.model_config.model_name}")
print(f"√âpocas: {finetuning_config.training_config.num_epochs}")
print(f"Taxa de aprendizado: {finetuning_config.training_config.learning_rate}")
print(f"Tamanho do lote: {finetuning_config.model_config.batch_size}")
print(f"WARNING: MODO TESTE: Usando apenas 1000 registros e 1 √©poca para valida√ß√£o r√°pida!")


Criando configura√ß√£o de fine-tuning...
=== DETEC√á√ÉO DE MODELO COMPAT√çVEL ===
Ambiente: Local
RAM: 30.5 GB
GPU: N√£o

Modelo Selecionado: distilgpt2
Framework: transformers
Unsloth: N√£o
Quantiza√ß√£o: Nenhuma
Batch Size: 1
Max Length: 128
Raz√£o: Sistema CPU com muita RAM - modelo pequeno

CONFIGURING: Configurando para teste r√°pido...
=== FINE-TUNING CONFIGURATION ===
Model: distilgpt2
Framework: transformers
Epochs: 1
Learning Rate: 0.0005
Batch Size: 2
Max Length: 128
Output Dir: ./data/fine_tuned_model
Training File: ./data/trn_finetune_sample.jsonl

Verifica√ß√£o da configura√ß√£o:
Arquivo de treino existe: True
Diret√≥rio de sa√≠da: ./data/fine_tuned_model
Modelo: distilgpt2
√âpocas: 1
Taxa de aprendizado: 0.0005
Tamanho do lote: 2


## Etapa 5: Inicializar Trainer de Fine-Tuning

O trainer gerencia o pipeline completo de fine-tuning incluindo carregamento do modelo, prepara√ß√£o do dataset e treinamento:


In [7]:
# Initialize trainer
print("Inicializando trainer de fine-tuning...")
trainer = FineTuningTrainer(finetuning_config)

print("‚úÖ Trainer inicializado com sucesso!")
print(f"Configura√ß√£o carregada: {finetuning_config.model_config.model_name}")
print(f"Treinamento usar√°: {finetuning_config.model_config.framework}")
print(f"Quantiza√ß√£o: {finetuning_config.model_config.quantization}")


Inicializando trainer de fine-tuning...
‚úÖ Trainer inicializado com sucesso!
Configura√ß√£o carregada: distilgpt2
Treinamento usar√°: transformers
Quantiza√ß√£o: None


## Etapa 6: Executar Pipeline Completo

Agora vamos executar o pipeline completo de fine-tuning. Este processo inclui:
- Carregamento do modelo e tokenizer
- Prepara√ß√£o do dataset
- Configura√ß√£o do trainer
- Execu√ß√£o do treinamento
- Salvamento do modelo


In [8]:
# Execute complete pipeline
print("Executando pipeline completo de fine-tuning...")
print("‚ö° MODO TESTE: Usando apenas 1000 registros e 1 √©poca")
print("‚è±Ô∏è  Tempo estimado: 5-15 minutos (vs 20+ horas com dataset completo)")
print("üìä Monitore o progresso abaixo:")

# Show training parameters
print(f"\nüìã Par√¢metros de treinamento:")
print(f"   ‚Ä¢ Registros: 1000 (amostra pequena)")
print(f"   ‚Ä¢ √âpocas: 1")
print(f"   ‚Ä¢ Tamanho do lote: 2")
print(f"   ‚Ä¢ Taxa de aprendizado: 5e-4")
print(f"   ‚Ä¢ Acumula√ß√£o de gradientes: 2")
print(f"   ‚Ä¢ Logs a cada: 5 steps")
print(f"   ‚Ä¢ Salvamento a cada: 100 steps")

success = trainer.run_full_pipeline()

if success:
    print("‚úÖ Fine-tuning conclu√≠do com sucesso!")
    print(f"Modelo salvo em: {output_dir}")
    print("üéâ Pipeline finalizado!")
    print("\nüí° DICA: Para treinar com o dataset completo, aumente:")
    print("   ‚Ä¢ num_epochs para 3-5")
    print("   ‚Ä¢ batch_size para 4-8")
    print("   ‚Ä¢ Use o arquivo original trn_finetune.jsonl")
else:
    print("‚ùå Erro durante o fine-tuning! Verifique os logs acima.")


INFO:fine_tuning.trainer:Iniciando pipeline completo de fine-tuning...


Executando pipeline completo de fine-tuning...
‚ö° MODO TESTE: Usando apenas 1000 registros e 1 √©poca
‚è±Ô∏è  Tempo estimado: 5-15 minutos (vs 20+ horas com dataset completo)
üìä Monitore o progresso abaixo:

üìã Par√¢metros de treinamento:
   ‚Ä¢ Registros: 1000 (amostra pequena)
   ‚Ä¢ √âpocas: 1
   ‚Ä¢ Tamanho do lote: 2
   ‚Ä¢ Taxa de aprendizado: 5e-4
   ‚Ä¢ Acumula√ß√£o de gradientes: 2
   ‚Ä¢ Logs a cada: 5 steps
   ‚Ä¢ Salvamento a cada: 100 steps


INFO:fine_tuning.trainer:Configurando modelo com Transformers...
INFO:fine_tuning.trainer:Modelo Transformers configurado com sucesso!
INFO:datasets:PyTorch version 2.8.0 available.
INFO:fine_tuning.trainer:Preparando dataset...
INFO:fine_tuning.trainer:Carregados 1000 exemplos


Map:   0%|          | 0/1000 [00:00<?, ? examples/s]

INFO:fine_tuning.trainer:Dataset preparado com sucesso!
  self.trainer = Trainer(
INFO:fine_tuning.trainer:Trainer Transformers configurado!
INFO:fine_tuning.trainer:Iniciando treinamento...
huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)
huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)
huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variabl

Step,Training Loss
5,4.5846
10,3.8326
15,2.9959
20,2.3062
25,2.5255
30,1.9816
35,1.959
40,1.7058
45,1.9388
50,1.7241


	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)
INFO:fine_tuning.trainer:Treinamento conclu√≠do!
INFO:fine_tuning.trainer:Salvando modelo...
INFO:fine_tuning.trainer:Modelo salvo em: ./data/fine_tuned_model
INFO:fine_tuning.trainer:Pipeline completo finalizado com sucesso!


‚úÖ Fine-tuning conclu√≠do com sucesso!
Modelo salvo em: ./data/fine_tuned_model
üéâ Pipeline finalizado!

üí° DICA: Para treinar com o dataset completo, aumente:
   ‚Ä¢ num_epochs para 3-5
   ‚Ä¢ batch_size para 4-8
   ‚Ä¢ Use o arquivo original trn_finetune.jsonl


In [20]:
import torch

def generate_text_method(self, prompt: str, max_length: int = 100) -> str:
    """
    Gera texto usando o modelo treinado.
    
    Args:
        prompt: Texto de entrada
        max_length: Comprimento m√°ximo da resposta
        
    Returns:
        str: Texto gerado pelo modelo
    """
    try:
        if self.model is None or self.tokenizer is None:
            print("‚ùå Modelo n√£o foi carregado! Execute setup_model() primeiro.")
            return "Erro: Modelo n√£o carregado"
        
        # Tokenizar entrada
        inputs = self.tokenizer.encode(prompt, return_tensors="pt")
        
        # Gerar texto
        with torch.no_grad():
            outputs = self.model.generate(
                inputs,
                max_length=max_length,
                num_return_sequences=1,
                temperature=0.7,
                do_sample=True,
                pad_token_id=self.tokenizer.eos_token_id
            )
        
        # Decodificar resposta
        response = self.tokenizer.decode(outputs[0], skip_special_tokens=True)
        
        # Remover o prompt da resposta
        if response.startswith(prompt):
            response = response[len(prompt):].strip()
        
        return response
        
    except Exception as e:
        print(f"‚ùå Erro durante gera√ß√£o de texto: {e}")
        return f"Erro: {str(e)}"

# Adicionar m√©todo √† inst√¢ncia do trainer
trainer.generate_text = generate_text_method.__get__(trainer, type(trainer))

In [21]:
# Recarregar m√≥dulo trainer para reconhecer mudan√ßas
import importlib
import sys

# Recarregar o m√≥dulo trainer
if 'fine_tuning.trainer' in sys.modules:
    importlib.reload(sys.modules['fine_tuning.trainer'])

# Reimportar FineTuningTrainer
from fine_tuning.trainer import FineTuningTrainer


## Etapa 7: Teste de Infer√™ncia

Vamos testar o modelo treinado para verificar se est√° funcionando corretamente:


In [22]:
print("üß™ TESTE SIMPLES DO M√âTODO generate_text")
print("=" * 50)

# Verificar se o m√©todo existe
if hasattr(trainer, 'generate_text'):
    print("‚úÖ M√©todo generate_text dispon√≠vel!")
    
    # Teste b√°sico
    test_prompt = "Generate a detailed description for the following item.\n\nInput: Smartphone"
    print(f"Prompt: {test_prompt}")
    print("\nResposta:")
    print("-" * 30)
    
    try:
        response = trainer.generate_text(test_prompt, max_length=100)
        print(response)
        print("-" * 30)
        print("‚úÖ Teste conclu√≠do com sucesso!")
    except Exception as e:
        print(f"‚ùå Erro no teste: {e}")
        
else:
    print("‚ùå M√©todo generate_text n√£o encontrado!")
    print("Execute a c√©lula anterior primeiro!")


üß™ TESTE SIMPLES DO M√âTODO generate_text
‚úÖ M√©todo generate_text dispon√≠vel!
Prompt: Generate a detailed description for the following item.

Input: Smartphone

Resposta:
------------------------------
Systems: A Complete Guide to Information Science

### Response:
Research Design, Research Design, and Evaluation

### Response:
### Response:
The Science of Medicine
### Response:
The End of Medicine:
Research Design, Expert Program

### Response:
### Response:
Research Design and Evaluation:
Nursing:
Risk-Based on the Science of Mental Disorders
------------------------------
‚úÖ Teste conclu√≠do com sucesso!


In [19]:
print("üß™ TESTES ADICIONAIS DE INFER√äNCIA")
print("=" * 50)

# Lista de prompts para testar
test_prompts = [
    "Generate a detailed description for the following item.\n\nInput: Laptop",
    "Write a product description for:",
    "Create a marketing text for:",
    "Describe the features of:",
    "Write a review for:"
]

print("Testando diferentes prompts...")
print()

for i, prompt in enumerate(test_prompts, 1):
    print(f"Teste {i}: {prompt}")
    print("-" * 30)
    
    # Gerar resposta
    response = trainer.generate_text(prompt, max_length=120)
    print(f"Resposta: {response}")
    print()
    
    # Pequena pausa para visualiza√ß√£o
    import time
    time.sleep(0.5)

print("‚úÖ Todos os testes de infer√™ncia conclu√≠dos!")
print("\nüí° O modelo est√° funcionando e gerando texto baseado no treinamento!")


üß™ TESTES ADICIONAIS DE INFER√äNCIA
Testando diferentes prompts...

Teste 1: Generate a detailed description for the following item.

Input: Laptop
------------------------------
Resposta: of Victoria's Nest

### Response:
One of the Riddles of The Dead: A Novel with The World's Most Popular Tales

### Response:
The Warbler's Golf Balls of Life: A Novel

### Response:
The Warbler of Victoria's World's Most Popular and Most Popular Roles

### Response:
The Warbler &amp

### Response:

Holf and The Golfs Story

### Response: A Novel

The Book of Life

Teste 2: Write a product description for:
------------------------------
Resposta: ### Input:
The Best of the USA

### Response:
The Book of Salsman
### Response:
The Science of the Athlone Book

### Response:

### Response:
Noddy Jones' World War (R. Book of Science

### Response:
The Book of Science of Athlone


### Response:
### Response:
The Book of Athlone:



The Book of The Book


### Response:


The Book of William

Teste 3: Creat