# Tutorial de Fine-Tuning - FIAP Tech Challenge Fase 3

## O que √© Fine-Tuning?

Fine-tuning √© o processo de adaptar um modelo de linguagem pr√©-treinado para executar uma tarefa espec√≠fica. Em vez de treinar do zero (que levaria semanas), pegamos um modelo existente e o treinamos com nossos dados espec√≠ficos.

## O que Vamos Aprender

1. **Prepara√ß√£o de Dados**: Como formatar dados para treinamento
2. **Carregamento de Modelo**: Como carregar um modelo pr√©-treinado eficientemente
3. **Configura√ß√£o LoRA**: Como usar Low-Rank Adaptation para treinamento eficiente
4. **Processo de Treinamento**: Como treinar o modelo passo a passo
5. **Infer√™ncia**: Como usar o modelo treinado para gerar texto

## Conceitos Principais

- **Modelo Pr√©-treinado**: Um modelo j√° treinado em dados massivos de texto
- **LoRA**: T√©cnica para treinar apenas pequenas partes do modelo (economiza mem√≥ria)
- **Quantiza√ß√£o 4-bit**: Reduz o tamanho do modelo em 75% com perda m√≠nima de qualidade
- **Formato Alpaca**: Formato padr√£o para datasets de instru√ß√£o

## Pr√©-requisitos

Antes de come√ßar, certifique-se de ter:
- Dataset processado no formato Alpaca (da prepara√ß√£o de dados)
- Mem√≥ria GPU suficiente (recomendado: 8GB+ VRAM)
- Bibliotecas necess√°rias instaladas


## Etapa 1: Configura√ß√£o do Ambiente e Depend√™ncias

Primeiro, vamos instalar as bibliotecas necess√°rias e configurar nosso ambiente:

### Bibliotecas Necess√°rias:
- **transformers**: Biblioteca Hugging Face para modelos pr√©-treinados
- **peft**: Parameter Efficient Fine-Tuning (suporte LoRA)
- **bitsandbytes**: Suporte √† quantiza√ß√£o 4-bit
- **datasets**: Carregamento e processamento de datasets
- **accelerate**: Acelera√ß√£o de treinamento


In [1]:
# Install required libraries
%pip install transformers peft bitsandbytes datasets accelerate torch

# Import necessary modules
import os
import torch
from fine_tuning.config import FineTuningConfig
from fine_tuning.trainer import FineTuningTrainer
from fine_tuning.model_detector import get_optimal_config

print("Bibliotecas instaladas e importadas com sucesso!")


Defaulting to user installation because normal site-packages is not writeable
[0mNote: you may need to restart the kernel to use updated packages.
Bibliotecas instaladas e importadas com sucesso!


## Etapa 2: Detec√ß√£o de Ambiente e Configura√ß√£o de Caminhos

Nosso sistema detecta automaticamente a melhor configura√ß√£o baseada no seu ambiente (Colab vs Local) e recursos dispon√≠veis (GPU, RAM, etc.).


In [2]:
# Check if running in Google Colab
try:
    from google.colab import drive
    IN_COLAB = True
    drive.mount('/content/drive')
    BASE_PATH = "/content/drive/MyDrive/Fiap"
    print("Executando no Google Colab")
except ImportError:
    IN_COLAB = False
    BASE_PATH = "./data"
    print("Executando localmente")

# Define file paths
train_file = f"{BASE_PATH}/trn_finetune.jsonl"
output_dir = f"{BASE_PATH}/fine_tuned_model"

print(f"Arquivo de treino: {train_file}")
print(f"Diret√≥rio de sa√≠da: {output_dir}")

# Check if training file exists
if os.path.exists(train_file):
    print("‚úÖ Arquivo de treino encontrado!")
    file_size = os.path.getsize(train_file) / (1024 * 1024)
    print(f"Tamanho do arquivo: {file_size:.1f} MB")
else:
    print("‚ùå Arquivo de treino n√£o encontrado! Execute a prepara√ß√£o de dados primeiro.")


Executando localmente
Arquivo de treino: ./data/trn_finetune.jsonl
Diret√≥rio de sa√≠da: ./data/fine_tuned_model
‚úÖ Arquivo de treino encontrado!
Tamanho do arquivo: 648.2 MB


## Etapa 3: Detec√ß√£o de Modelo e Configura√ß√£o

Nosso sistema detecta automaticamente o melhor modelo e configura√ß√£o baseado no seu hardware:


In [3]:
# Detect optimal configuration
print("Detectando configura√ß√£o √≥tima...")
config = get_optimal_config()

print(f"\nConfigura√ß√£o detectada:")
print(f"Modelo: {config.model_name}")
print(f"Framework: {config.framework}")
print(f"Unsloth dispon√≠vel: {config.use_unsloth}")
print(f"Quantiza√ß√£o: {config.quantization}")
print(f"Tamanho do lote: {config.batch_size}")
print(f"Comprimento m√°ximo: {config.max_length}")
print(f"Raz√£o: {config.reason}")


Detectando configura√ß√£o √≥tima...
=== DETEC√á√ÉO DE MODELO COMPAT√çVEL ===
Ambiente: Local
RAM: 30.5 GB
GPU: N√£o

Modelo Selecionado: distilgpt2
Framework: transformers
Unsloth: N√£o
Quantiza√ß√£o: Nenhuma
Batch Size: 1
Max Length: 128
Raz√£o: Sistema CPU com muita RAM - modelo pequeno

Configura√ß√£o detectada:
Modelo: distilgpt2
Framework: transformers
Unsloth dispon√≠vel: False
Quantiza√ß√£o: None
Tamanho do lote: 1
Comprimento m√°ximo: 128
Raz√£o: Sistema CPU com muita RAM - modelo pequeno


## Etapa 4: Criar Configura√ß√£o de Fine-Tuning

Agora vamos criar a configura√ß√£o completa de fine-tuning com todos os par√¢metros necess√°rios:


In [5]:
# Create fine-tuning configuration
print("Criando configura√ß√£o de fine-tuning...")
finetuning_config = FineTuningConfig.create_default(train_file, output_dir)

# Print configuration summary
finetuning_config.print_summary()

# Verify configuration
print(f"\nVerifica√ß√£o da configura√ß√£o:")
print(f"Arquivo de treino existe: {os.path.exists(train_file)}")
print(f"Diret√≥rio de sa√≠da: {output_dir}")
print(f"Modelo: {finetuning_config.model_config.model_name}")
print(f"√âpocas: {finetuning_config.training_config.num_epochs}")
print(f"Taxa de aprendizado: {finetuning_config.training_config.learning_rate}")


Criando configura√ß√£o de fine-tuning...
=== DETEC√á√ÉO DE MODELO COMPAT√çVEL ===
Ambiente: Local
RAM: 30.5 GB
GPU: N√£o

Modelo Selecionado: distilgpt2
Framework: transformers
Unsloth: N√£o
Quantiza√ß√£o: Nenhuma
Batch Size: 1
Max Length: 128
Raz√£o: Sistema CPU com muita RAM - modelo pequeno
=== FINE-TUNING CONFIGURATION ===
Model: distilgpt2
Framework: transformers
Epochs: 3
Learning Rate: 0.0002
Batch Size: 1
Max Length: 128
Output Dir: ./data/fine_tuned_model
Training File: ./data/trn_finetune.jsonl

Verifica√ß√£o da configura√ß√£o:
Arquivo de treino existe: True
Diret√≥rio de sa√≠da: ./data/fine_tuned_model
Modelo: distilgpt2
√âpocas: 3
Taxa de aprendizado: 0.0002


## Etapa 5: Inicializar Trainer de Fine-Tuning

O trainer gerencia o pipeline completo de fine-tuning incluindo carregamento do modelo, prepara√ß√£o do dataset e treinamento:


In [6]:
# Initialize trainer
print("Inicializando trainer de fine-tuning...")
trainer = FineTuningTrainer(finetuning_config)

print("‚úÖ Trainer inicializado com sucesso!")
print(f"Configura√ß√£o carregada: {finetuning_config.model_config.model_name}")
print(f"Treinamento usar√°: {finetuning_config.model_config.framework}")
print(f"Quantiza√ß√£o: {finetuning_config.model_config.quantization}")


Inicializando trainer de fine-tuning...
‚úÖ Trainer inicializado com sucesso!
Configura√ß√£o carregada: distilgpt2
Treinamento usar√°: transformers
Quantiza√ß√£o: None


## Etapa 6: Executar Pipeline Completo

Agora vamos executar o pipeline completo de fine-tuning. Este processo inclui:
- Carregamento do modelo e tokenizer
- Prepara√ß√£o do dataset
- Configura√ß√£o do trainer
- Execu√ß√£o do treinamento
- Salvamento do modelo


In [None]:
# Execute complete pipeline
print("Executando pipeline completo de fine-tuning...")
print("‚ö†Ô∏è  Este processo pode levar alguns minutos ou horas...")
print("üìä Monitore o progresso abaixo:")

success = trainer.run_full_pipeline()

if success:
    print("‚úÖ Fine-tuning conclu√≠do com sucesso!")
    print(f"Modelo salvo em: {output_dir}")
    print("üéâ Pipeline finalizado!")
else:
    print("‚ùå Erro durante o fine-tuning! Verifique os logs acima.")


INFO:fine_tuning.trainer:Iniciando pipeline completo de fine-tuning...


Executando pipeline completo de fine-tuning...
‚ö†Ô∏è  Este processo pode levar alguns minutos ou horas...
üìä Monitore o progresso abaixo:


INFO:fine_tuning.trainer:Configurando modelo com Transformers...


tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/762 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/353M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

INFO:fine_tuning.trainer:Modelo Transformers configurado com sucesso!
INFO:datasets:PyTorch version 2.8.0 available.
INFO:fine_tuning.trainer:Preparando dataset...


## Etapa 7: Teste de Infer√™ncia

Vamos testar o modelo treinado para verificar se est√° funcionando corretamente:


In [None]:
# Test inference
print("Testando modelo treinado...")

# Example test
test_prompt = "Generate a detailed description for the following item.\n\nInput: Smartphone"

print(f"Prompt de teste: {test_prompt}")
print("\nResposta do modelo:")
print("-" * 50)

# Here you can add code to test the model
# Depending on the trainer implementation
print("Modelo treinado e pronto para uso!")
print("‚úÖ Fine-tuning conclu√≠do com sucesso!")
