# Tech Challenge - Fine-tuning para Produtos Amazon (GPU Colab)

**Objetivo**: Executar fine-tuning de um foundation model usando o dataset AmazonTitles-1.3MM para gerar descri√ß√µes de produtos baseadas em t√≠tulos.

**Dataset**: Utilizaremos o arquivo `trn.json.gz` que cont√©m t√≠tulos e descri√ß√µes de produtos da Amazon.

**Modelo Escolhido**: TinyLlama 1.1B com Unsloth para otimiza√ß√£o de treinamento.

---

## üìã √çndice
1. [Configura√ß√£o Inicial](#1-configuracao-inicial)
2. [Explora√ß√£o dos Dados](#2-exploracao-dos-dados)
3. [Prepara√ß√£o do Dataset](#3-preparacao-do-dataset)
4. [Teste do Modelo Base](#4-teste-do-modelo-base)
5. [Fine-tuning](#5-fine-tuning)
6. [Teste do Modelo Treinado](#6-teste-do-modelo-treinado)
7. [Demonstra√ß√£o Interativa](#7-demonstracao-interativa)

---

## 1. Configura√ß√£o Inicial

### 1.1 Montagem do Google Drive
Primeiro, vamos montar o Google Drive para acessar e salvar nossos arquivos.

In [None]:
from google.colab import drive
import os

# Monta o Google Drive
drive.mount('/content/drive')

# Define o diret√≥rio de trabalho (usando o mesmo diret√≥rio onde est√° o arquivo de dados)
WORK_DIR = '/content/drive/MyDrive/FineTunning/TechChallenge03'
os.makedirs(WORK_DIR, exist_ok=True)

print(f"‚úÖ Google Drive montado com sucesso!")
print(f"üìÅ Diret√≥rio de trabalho: {WORK_DIR}")

# Verifica se o diret√≥rio existe e lista os arquivos
if os.path.exists(WORK_DIR):
    files_in_dir = os.listdir(WORK_DIR)
    print(f"üìã Arquivos no diret√≥rio: {files_in_dir}")
else:
    print(f"‚ö†Ô∏è Diret√≥rio n√£o existe, ser√° criado: {WORK_DIR}")

### 1.2 Instala√ß√£o das Depend√™ncias

Instalamos as bibliotecas necess√°rias:
- **Unsloth**: Otimiza√ß√£o para fine-tuning eficiente
- **Transformers**: Biblioteca principal para modelos de linguagem
- **Datasets**: Para manipula√ß√£o de datasets
- **TRL**: Para treinamento de modelos de linguagem

In [None]:
# Instala√ß√£o das depend√™ncias principais
!pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install --no-deps xformers "trl<0.9.0" peft accelerate bitsandbytes
!pip install transformers datasets torch
!pip install textstat  # Para an√°lise de legibilidade de texto

print("‚úÖ Todas as depend√™ncias foram instaladas com sucesso!")

### 1.3 Importa√ß√£o das Bibliotecas e Configura√ß√µes Iniciais

In [None]:
# Imports necess√°rios
import json
import gzip
import pandas as pd
import numpy as np
from datasets import Dataset, load_dataset
import torch
from transformers import TrainingArguments, TextStreamer
from trl import SFTTrainer
from unsloth import FastLanguageModel, is_bfloat16_supported
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display, HTML
import warnings
warnings.filterwarnings('ignore')

print("‚úÖ Bibliotecas importadas com sucesso!")
print(f"üî• CUDA dispon√≠vel: {torch.cuda.is_available()}")
print(f"üíæ GPU: {torch.cuda.get_device_name(0) if torch.cuda.is_available() else 'N√£o dispon√≠vel'}")

### 1.4 Configura√ß√µes do Modelo e Treinamento

In [None]:
# Configura√ß√µes principais
CONFIG = {
    # Configura√ß√µes do modelo
    'model_name': "unsloth/tinyllama-bnb-4bit",
    'max_seq_length': 1024,
    'dtype': None,  # Ser√° determinado automaticamente
    'load_in_4bit': True,
    
    # Configura√ß√µes do dataset
    'data_file': '/content/drive/MyDrive/FineTunning/TechChallenge03/trn.json.gz',
    'sample_size': 50000,  # N√∫mero de amostras para treinamento (otimizado para Colab)
    'test_size': 5000,  # N√∫mero de amostras para teste
    
    # Configura√ß√µes do fine-tuning
    'lora_r': 32,
    'lora_alpha': 16,
    'lora_dropout': 0,
    'max_steps': 100,  # Ajuste conforme necess√°rio
    'learning_rate': 2e-4,
    'batch_size': 4,
    'gradient_accumulation_steps': 2,
    
    # Caminhos - usando o mesmo diret√≥rio base
    'base_dir': '/content/drive/MyDrive/FineTunning/TechChallenge03',
    'output_dir': '/content/drive/MyDrive/FineTunning/TechChallenge03/outputs',
    'model_save_path': '/content/drive/MyDrive/FineTunning/TechChallenge03/amazon_model',
}

# Cria√ß√£o dos diret√≥rios
os.makedirs(CONFIG['base_dir'], exist_ok=True)
os.makedirs(CONFIG['output_dir'], exist_ok=True)
os.makedirs(CONFIG['model_save_path'], exist_ok=True)

print("‚öôÔ∏è Configura√ß√µes definidas:")
for key, value in CONFIG.items():
    print(f"  {key}: {value}")

## 2. Explora√ß√£o dos Dados

### 2.1 Upload do Arquivo de Dados

Primeiro, voc√™ precisa fazer upload do arquivo `trn.json.gz` para o Colab.
Execute a c√©lula abaixo e fa√ßa upload do arquivo quando solicitado.

In [None]:
import os

# Define o caminho para o arquivo no Google Drive
DATA_FILE_PATH = '/content/drive/MyDrive/FineTunning/TechChallenge03/trn.json.gz'

# Verifica se o arquivo existe
if os.path.exists(DATA_FILE_PATH):
    print("‚úÖ Arquivo trn.json.gz encontrado no Google Drive!")
    print(f"üìÅ Caminho: {DATA_FILE_PATH}")
    
    # Verifica o tamanho do arquivo
    file_size = os.path.getsize(DATA_FILE_PATH)
    print(f"üìä Tamanho do arquivo: {file_size / (1024*1024):.1f} MB")
else:
    print("‚ùå Arquivo n√£o encontrado no caminho especificado.")
    print(f"‚ùå Caminho verificado: {DATA_FILE_PATH}")
    print("üí° Certifique-se de que o arquivo trn.json.gz est√° no diret√≥rio correto do Google Drive.")
    DATA_FILE_PATH = None

### 2.2 Carregamento dos Dados

In [None]:
def load_data_sample(file_path, sample_size=100000):
    """
    Carrega uma amostra dos dados do arquivo JSON comprimido
    """
    data = []
    print(f"üîÑ Carregando dados de {file_path}...")
    
    try:
        with gzip.open(file_path, 'rt', encoding='utf-8') as f:
            for i, line in enumerate(f):
                if i >= sample_size:
                    break
                    
                try:
                    json_obj = json.loads(line.strip())
                    data.append(json_obj)
                except json.JSONDecodeError:
                    continue
                    
                # Progress indicator
                if (i + 1) % 10000 == 0:
                    print(f"üìä Carregados {i + 1} registros...")
    
    except Exception as e:
        print(f"‚ùå Erro ao carregar dados: {str(e)}")
        return []
    
    print(f"‚úÖ Carregamento conclu√≠do! Total de registros: {len(data)}")
    return data

# Carrega uma amostra dos dados para explora√ß√£o
if DATA_FILE_PATH and os.path.exists(DATA_FILE_PATH):
    sample_data = load_data_sample(DATA_FILE_PATH, sample_size=CONFIG['sample_size'])
    print(f"üìã Amostra carregada com {len(sample_data)} registros")
else:
    print("‚ùå N√£o foi poss√≠vel carregar os dados. Verifique o arquivo.")

### 2.3 An√°lise Explorat√≥ria dos Dados

In [None]:
if sample_data:
    print("üîç An√°lise dos dados carregados:\n")
    
    # Estrutura dos dados
    print("üìã Estrutura dos dados:")
    if sample_data:
        print(f"  Primeiro registro: {sample_data[0]}")
        print(f"  Chaves dispon√≠veis: {list(sample_data[0].keys())}")
        
        # AN√ÅLISE DETALHADA: Verifica todos os campos dispon√≠veis
        all_fields = set()
        for item in sample_data[:100]:  # Analisa os primeiros 100 registros
            all_fields.update(item.keys())
        
        print(f"  üìä TODOS os campos encontrados: {sorted(list(all_fields))}")
        
        # Analisa campos n√£o vazios
        field_stats = {}
        for field in all_fields:
            non_empty_count = sum(1 for item in sample_data[:1000] if item.get(field) and str(item.get(field)).strip())
            field_stats[field] = {
                'count': non_empty_count,
                'percentage': (non_empty_count / min(1000, len(sample_data))) * 100
            }
        
        print(f"\nüìà Estat√≠sticas de preenchimento dos campos (primeiros 1000 registros):")
        for field, stats in sorted(field_stats.items()):
            print(f"  üìã {field}: {stats['count']}/1000 ({stats['percentage']:.1f}%) preenchidos")
    
    # Converte para DataFrame para an√°lise
    df = pd.DataFrame(sample_data)
    print(f"\nüìä Estat√≠sticas b√°sicas:")
    print(f"  Total de registros: {len(df)}")
    print(f"  Colunas: {list(df.columns)}")
    
    # An√°lise detalhada de TODOS os campos de texto
    text_fields = ['title', 'content', 'description', 'summary', 'text', 'body', 'abstract']
    
    for field in text_fields:
        if field in df.columns:
            field_data = df[field].dropna()
            if len(field_data) > 0:
                field_lengths = field_data.str.len()
                print(f"\nüìè An√°lise do campo '{field}':")
                print(f"  Registros preenchidos: {len(field_data)}/{len(df)} ({len(field_data)/len(df)*100:.1f}%)")
                print(f"  Comprimento m√©dio: {field_lengths.mean():.1f} caracteres")
                print(f"  Comprimento mediano: {field_lengths.median():.1f} caracteres")
                print(f"  M√≠nimo: {field_lengths.min()} caracteres")
                print(f"  M√°ximo: {field_lengths.max()} caracteres")
    
    # An√°lise de campos categ√≥ricos/num√©ricos
    numeric_fields = ['price', 'rating', 'reviews', 'category_id', 'brand_id', 'year']
    categorical_fields = ['category', 'brand', 'type', 'manufacturer', 'model']
    
    for field in numeric_fields + categorical_fields:
        if field in df.columns:
            field_data = df[field].dropna()
            if len(field_data) > 0:
                print(f"\nüìä Campo '{field}': {len(field_data)} valores √∫nicos")
                if field in numeric_fields and pd.api.types.is_numeric_dtype(field_data):
                    print(f"  Min: {field_data.min()}, Max: {field_data.max()}, M√©dia: {field_data.mean():.2f}")
                else:
                    top_values = field_data.value_counts().head(3)
                    print(f"  Top 3 valores: {dict(top_values)}")
    
    # Mostra alguns exemplos COMPLETOS
    print(f"\nüìù Exemplos de dados COMPLETOS:")
    for i in range(min(2, len(df))):  # Reduzido para 2 para economizar espa√ßo
        print(f"\n--- Exemplo {i+1} ---")
        for col in df.columns:
            content = str(df[col].iloc[i])
            if content and content != 'nan':
                if len(content) > 150:
                    content = content[:150] + "..."
                print(f"  {col}: {content}")
else:
    print("‚ùå Nenhum dado dispon√≠vel para an√°lise.")

## 3. Prepara√ß√£o do Dataset

### 3.1 Tratamento e Limpeza dos Dados

Vamos implementar um sistema robusto de limpeza dos dados que j√° provou ser eficaz, garantindo que apenas dados de alta qualidade sejam usados no treinamento.

In [None]:
import re
from collections import Counter

def is_valid_text(text, min_length=10, max_length=500):
    """Verifica se o texto √© v√°lido para treinamento"""
    if not text or not isinstance(text, str):
        return False
    
    text = text.strip()
    if len(text) < min_length or len(text) > max_length:
        return False
    
    # Verifica se tem conte√∫do significativo (n√£o apenas s√≠mbolos)
    if len(re.sub(r'[^a-zA-Z0-9\s]', '', text).strip()) < min_length // 2:
        return False
    
    return True

def clean_text(text):
    """Limpa e padroniza o texto"""
    if not text:
        return ""
    
    # Remove caracteres especiais excessivos
    text = re.sub(r'[^\w\s\-.,!?()&]', ' ', text)
    
    # Remove espa√ßos m√∫ltiplos
    text = re.sub(r'\s+', ' ', text)
    
    return text.strip()

def prepare_training_data(data, sample_size=50000):
    """
    Prepara os dados para treinamento com limpeza avan√ßada
    Utiliza TODOS os campos dispon√≠veis, n√£o apenas title e content
    """
    print(f"üîÑ Processando dados para treinamento...")
    
    # DESCOBERTA: Analisa quais campos est√£o dispon√≠veis
    all_fields = set()
    for item in data[:100]:
        all_fields.update(item.keys())
    
    print(f"üìä Campos dispon√≠veis no dataset: {sorted(list(all_fields))}")
    
    # Define mapeamento inteligente de campos
    title_fields = ['title', 'name', 'product_name', 'item_name']
    description_fields = ['content', 'description', 'summary', 'details', 'text', 'body']
    category_fields = ['category', 'type', 'department', 'section']
    brand_fields = ['brand', 'manufacturer', 'company']
    price_fields = ['price', 'cost', 'value']
    rating_fields = ['rating', 'score', 'stars']
    
    processed_data = []
    rejected_count = 0
    field_usage_stats = {}
    
    for i, item in enumerate(data[:sample_size]):
        try:
            # COLETA INTELIGENTE: Busca o melhor campo para cada tipo
            title = ""
            for field in title_fields:
                if field in item and item.get(field):
                    title = str(item[field]).strip()
                    field_usage_stats[f'title_from_{field}'] = field_usage_stats.get(f'title_from_{field}', 0) + 1
                    break
            
            description = ""
            for field in description_fields:
                if field in item and item.get(field):
                    description = str(item[field]).strip()
                    field_usage_stats[f'description_from_{field}'] = field_usage_stats.get(f'description_from_{field}', 0) + 1
                    break
            
            # ENRIQUECIMENTO: Coleta informa√ß√µes adicionais
            additional_info = []
            
            # Categoria
            for field in category_fields:
                if field in item and item.get(field):
                    category = str(item[field]).strip()
                    if category and len(category) > 1:
                        additional_info.append(f"Category: {category}")
                        break
            
            # Marca
            for field in brand_fields:
                if field in item and item.get(field):
                    brand = str(item[field]).strip()
                    if brand and len(brand) > 1:
                        additional_info.append(f"Brand: {brand}")
                        break
            
            # Pre√ßo (se dispon√≠vel)
            for field in price_fields:
                if field in item and item.get(field):
                    try:
                        price = float(str(item[field]).replace('$', '').replace(',', ''))
                        additional_info.append(f"Price range: ${price:.2f}")
                        break
                    except:
                        pass
            
            # Rating (se dispon√≠vel)
            for field in rating_fields:
                if field in item and item.get(field):
                    try:
                        rating = float(str(item[field]))
                        if 0 <= rating <= 5:
                            additional_info.append(f"Rating: {rating}/5 stars")
                        break
                    except:
                        pass
            
            # Limpa os textos principais
            title_clean = clean_text(title)
            description_clean = clean_text(description)
            
            # Valida qualidade
            if (is_valid_text(title_clean, min_length=5, max_length=2000) and 
                is_valid_text(description_clean, min_length=20, max_length=5000)):
                
                # FORMATO ENRIQUECIDO: Inclui informa√ß√µes adicionais quando dispon√≠veis
                additional_context = "\n".join(additional_info) if additional_info else ""
                
                if additional_context:
                    formatted_text = f"""### Instruction:
Generate a detailed product description based on the following title and additional product information.

### Input:
Title: {title_clean}
{additional_context}

### Response:
{description_clean}"""
                else:
                    # Formato original se n√£o h√° informa√ß√µes adicionais
                    formatted_text = f"""### Instruction:
Generate a detailed product description based on the following title.

### Input:
{title_clean}

### Response:
{description_clean}"""
                
                processed_data.append({
                    'text': formatted_text,
                    'title': title_clean,
                    'content': description_clean,
                    'additional_info': additional_info
                })
            else:
                rejected_count += 1
        
        except Exception as e:
            rejected_count += 1
            continue
        
        # Progress indicator
        if (i + 1) % 10000 == 0:
            approval_rate = (len(processed_data) / (i + 1)) * 100
            print(f"üìä Processados {i + 1} | Aprovados: {len(processed_data)} ({approval_rate:.1f}%)")
    
    final_approval_rate = (len(processed_data) / len(data[:sample_size])) * 100
    print(f"\n‚úÖ Processamento conclu√≠do!")
    print(f"üìà Taxa de aprova√ß√£o final: {final_approval_rate:.1f}%")
    print(f"‚úÖ Dados aprovados: {len(processed_data)}")
    print(f"‚ùå Dados rejeitados: {rejected_count}")
    
    # RELAT√ìRIO: Mostra quais campos foram utilizados
    print(f"\nüìã Uso dos campos:")
    for field_use, count in field_usage_stats.items():
        print(f"  {field_use}: {count} vezes")
    
    # Estat√≠sticas de enriquecimento
    enriched_count = sum(1 for item in processed_data if item.get('additional_info'))
    print(f"\nüéØ Dados enriquecidos: {enriched_count}/{len(processed_data)} ({enriched_count/len(processed_data)*100:.1f}%)")
    
    return processed_data
                    {content_clean}"""
                
                processed_data.append({
                    'text': formatted_text,
                    'title': title_clean,
                    'content': content_clean
                })
            else:
                rejected_count += 1
        
        except Exception as e:
            rejected_count += 1
            continue
        
        # Progress indicator
        if (i + 1) % 10000 == 0:
            approval_rate = (len(processed_data) / (i + 1)) * 100
            print(f"üìä Processados {i + 1} | Aprovados: {len(processed_data)} ({approval_rate:.1f}%)")
    
    final_approval_rate = (len(processed_data) / len(data[:sample_size])) * 100
    print(f"\n‚úÖ Processamento conclu√≠do!")
    print(f"üìà Taxa de aprova√ß√£o final: {final_approval_rate:.1f}%")
    print(f"‚úÖ Dados aprovados: {len(processed_data)}")
    print(f"‚ùå Dados rejeitados: {rejected_count}")
    
    return processed_data

# Processa os dados
if sample_data:
    training_data = prepare_training_data(sample_data, CONFIG['sample_size'])
    print(f"\nüéØ Dataset final: {len(training_data)} amostras prontas para treinamento")
    
    # DEMONSTRA√á√ÉO: Mostra exemplos de como os campos adicionais est√£o sendo usados
    print(f"\nüìã EXEMPLOS DE ENRIQUECIMENTO COM CAMPOS ADICIONAIS:")
    print("=" * 70)
    
    # Exemplo com informa√ß√µes adicionais
    enriched_examples = [item for item in training_data if item.get('additional_info')]
    if enriched_examples:
        for i, example in enumerate(enriched_examples[:2], 1):
            print(f"\nüéØ EXEMPLO {i} - DADOS ENRIQUECIDOS:")
            print(f"T√≠tulo: {example['title'][:60]}...")
            print(f"Info adicional: {example['additional_info']}")
            print(f"Formato completo:")
            print("-" * 40)
            print(example['text'][:300] + "..." if len(example['text']) > 300 else example['text'])
            print("-" * 40)
    
    # Exemplo b√°sico (s√≥ title + content)
    basic_examples = [item for item in training_data if not item.get('additional_info')]
    if basic_examples:
        print(f"\nüìù EXEMPLO B√ÅSICO (s√≥ title + content):")
        example = basic_examples[0]
        print(f"T√≠tulo: {example['title'][:60]}...")
        print(f"Formato:")
        print("-" * 40)
        print(example['text'][:300] + "..." if len(example['text']) > 300 else example['text'])
        print("-" * 40)
    
    print(f"\nüí° RESUMO DO ENRIQUECIMENTO:")
    enriched_count = len(enriched_examples)
    basic_count = len(basic_examples)
    print(f"  üìä Dados enriquecidos: {enriched_count} ({enriched_count/len(training_data)*100:.1f}%)")
    print(f"  üìÑ Dados b√°sicos: {basic_count} ({basic_count/len(training_data)*100:.1f}%)")
    print("=" * 70)
    
else:
    print("‚ùå Nenhum dado dispon√≠vel para processamento.")

### 3.2 Cria√ß√£o do Dataset do Hugging Face

In [None]:
if training_data:
    # VALIDA√á√ÉO: Filtra textos que podem causar problemas
    valid_texts = []
    for item in training_data:
        text = item.get('text', '')
        if isinstance(text, str) and len(text.strip()) > 10:
            valid_texts.append(text.strip())
    
    print(f"üìä Dados v√°lidos: {len(valid_texts)} de {len(training_data)} originais")
    
    # Converte para formato do Hugging Face com dados validados
    dataset_dict = {'text': valid_texts}
    dataset = Dataset.from_dict(dataset_dict)
    
    print(f"‚úÖ Dataset criado com sucesso!")
    print(f"üìä Total de amostras: {len(dataset)}")
    print(f"üìè Comprimento m√©dio do texto: {np.mean([len(text) for text in dataset_dict['text']]):.0f} caracteres")
    
    # Mostra exemplo do formato
    print(f"\nüìù Exemplo do formato de treinamento:")
    print("=" * 60)
    print(dataset[0]['text'][:500] + "..." if len(dataset[0]['text']) > 500 else dataset[0]['text'])
    print("=" * 60)
    
else:
    print("‚ùå N√£o foi poss√≠vel criar o dataset.")

## 4. Teste do Modelo Base

### 4.1 Carregamento do Modelo TinyLlama

In [None]:
# Carrega o modelo base TinyLlama
print("üîÑ Carregando modelo TinyLlama...")

model, tokenizer = FastLanguageModel.from_pretrained(
    model_name=CONFIG['model_name'],
    max_seq_length=CONFIG['max_seq_length'],
    dtype=CONFIG['dtype'],
    load_in_4bit=CONFIG['load_in_4bit'],
)

# CORRE√á√ÉO: Configura√ß√£o robusta do tokenizer para evitar erros
if tokenizer.pad_token is None:
    tokenizer.pad_token = tokenizer.eos_token
    print("üîß pad_token configurado como eos_token")

if tokenizer.chat_template is None:
    tokenizer.chat_template = "{% for message in messages %}\n{% if message['role'] == 'user' %}{{ message['content'] }}{% endif %}\n{% endfor %}"
    print("üîß chat_template configurado")

print("‚úÖ Modelo TinyLlama carregado com sucesso!")
print(f"üìä Modelo: {CONFIG['model_name']}")
print(f"üìè Comprimento m√°ximo de sequ√™ncia: {CONFIG['max_seq_length']}")
print(f"üîß Quantiza√ß√£o 4-bit: {CONFIG['load_in_4bit']}")

# Informa√ß√µes sobre o modelo
print(f"\nüìà Estat√≠sticas do modelo:")
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)
print(f"  Par√¢metros totais: {total_params:,}")
print(f"  Par√¢metros trein√°veis: {trainable_params:,}")
print(f"  Tamanho do vocabul√°rio: {len(tokenizer)}")

### 4.2 Teste do Modelo Base

In [None]:
# Fun√ß√£o para testar o modelo
def test_model(model, tokenizer, prompt, max_new_tokens=150):
    """Testa o modelo com um prompt"""
    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
    
    # Configura√ß√µes de gera√ß√£o
    generation_config = {
        'max_new_tokens': max_new_tokens,
        'temperature': 0.7,
        'do_sample': True,
        'top_p': 0.9,
        'pad_token_id': tokenizer.eos_token_id
    }
    
    with torch.no_grad():
        outputs = model.generate(**inputs, **generation_config)
    
    # Decodifica apenas os tokens gerados (n√£o inclui o prompt)
    generated_text = tokenizer.decode(outputs[0][inputs['input_ids'].shape[1]:], skip_special_tokens=True)
    return generated_text.strip()

# COMPARATIVO: Testes do modelo base para compara√ß√£o posterior
print("üß™ Coletando dados do modelo base para compara√ß√£o...")

# T√≠tulos de teste para compara√ß√£o
test_titles = [
    "Wireless Bluetooth Headphones with Noise Cancellation",
    "Professional Gaming Keyboard with RGB Lighting", 
    "Stainless Steel Water Bottle 32oz",
    "Organic Cotton T-Shirt for Men",
    "Smart Fitness Tracker with Heart Rate Monitor",
    "Portable Phone Charger 10000mAh",
    "Waterproof Bluetooth Speaker",
    "Ergonomic Office Chair with Lumbar Support"
]

# Coleta respostas do modelo base
base_model_responses = {}
print("üìä Testando modelo base em 8 produtos...")

for i, title in enumerate(test_titles, 1):
    test_prompt = f"""### Instruction:
Generate a detailed product description based on the following title.

### Input:
{title}

### Response:"""
    
    try:
        response = test_model(model, tokenizer, test_prompt, max_new_tokens=100)
        base_model_responses[title] = response
        print(f"‚úÖ Teste {i}/8 conclu√≠do: {title[:30]}...")
    except Exception as e:
        base_model_responses[title] = f"Erro: {str(e)}"
        print(f"‚ùå Erro no teste {i}: {str(e)}")

print("\n‚úÖ Dados do modelo base coletados para compara√ß√£o!")

## 5. Fine-tuning

### 5.1 Configura√ß√£o do LoRA

In [None]:
# Configura√ß√£o do LoRA (Low-Rank Adaptation)
print("üîß Configurando LoRA para fine-tuning...")

model = FastLanguageModel.get_peft_model(
    model,
    r=CONFIG['lora_r'],
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
    lora_alpha=CONFIG['lora_alpha'],
    lora_dropout=CONFIG['lora_dropout'],
    bias="none",
    use_gradient_checkpointing="unsloth",
    random_state=3407,
    use_rslora=False,
    loftq_config=None,
)

print("‚úÖ LoRA configurado com sucesso!")

# Mostra estat√≠sticas dos par√¢metros trein√°veis
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print(f"\nüìä Estat√≠sticas ap√≥s configura√ß√£o LoRA:")
print(f"  Par√¢metros totais: {total_params:,}")
print(f"  Par√¢metros trein√°veis: {trainable_params:,}")
print(f"  Percentual trein√°vel: {100 * trainable_params / total_params:.2f}%")
print(f"üéØ LoRA configurado com r={CONFIG['lora_r']}, alpha={CONFIG['lora_alpha']}")

### 5.2 Configura√ß√£o do Treinamento

In [None]:
# Configura√ß√£o dos argumentos de treinamento
training_args = TrainingArguments(
    per_device_train_batch_size=CONFIG['batch_size'],
    gradient_accumulation_steps=CONFIG['gradient_accumulation_steps'],
    warmup_steps=5,
    max_steps=CONFIG['max_steps'],
    learning_rate=CONFIG['learning_rate'],
    fp16=not is_bfloat16_supported(),
    bf16=is_bfloat16_supported(),
    logging_steps=1,
    optim="adamw_8bit",
    weight_decay=0.01,
    lr_scheduler_type="linear",
    seed=3407,
    output_dir=CONFIG['output_dir'],
    save_steps=25,
    save_total_limit=3,
    dataloader_num_workers=0,
    remove_unused_columns=False,
)

print("‚öôÔ∏è Argumentos de treinamento configurados:")
print(f"  Batch size: {CONFIG['batch_size']}")
print(f"  Accumulation steps: {CONFIG['gradient_accumulation_steps']}")
print(f"  Learning rate: {CONFIG['learning_rate']}")
print(f"  Max steps: {CONFIG['max_steps']}")
print(f"  Precision: {'BF16' if is_bfloat16_supported() else 'FP16'}")
print(f"  Output dir: {CONFIG['output_dir']}")

# NOVA ABORDAGEM: Fun√ß√£o de tokeniza√ß√£o personalizada para evitar erros
def tokenize_function(examples):
    """Tokeniza os dados de forma segura"""
    try:
        # Garante que temos uma lista de strings
        texts = examples["text"] if isinstance(examples["text"], list) else [examples["text"]]
        
        # Tokeniza com padding e truncation
        result = tokenizer(
            texts,
            truncation=True,
            padding="max_length",
            max_length=CONFIG['max_seq_length'],
            return_tensors=None
        )
        return result
    except Exception as e:
        print(f"Erro na tokeniza√ß√£o: {e}")
        return {"input_ids": [], "attention_mask": []}

# Configura√ß√£o do trainer com tokeniza√ß√£o segura
if 'dataset' in locals():
    # Aplica tokeniza√ß√£o ao dataset
    print("üîÑ Tokenizando dataset...")
    tokenized_dataset = dataset.map(
        tokenize_function,
        batched=True,
        remove_columns=dataset.column_names,
        desc="Tokenizing"
    )
    
    # Configura√ß√£o do trainer sem SFTTrainer (que est√° causando problemas)
    from transformers import Trainer, DataCollatorForLanguageModeling
    
    # Data collator para language modeling
    data_collator = DataCollatorForLanguageModeling(
        tokenizer=tokenizer,
        mlm=False,  # N√£o √© masked language modeling
    )
    
    trainer = Trainer(
        model=model,
        args=training_args,
        train_dataset=tokenized_dataset,
        data_collator=data_collator,
        tokenizer=tokenizer,
    )
    
    print("‚úÖ Trainer configurado com sucesso usando Trainer padr√£o!")
    print(f"üìä Dataset tokenizado: {len(tokenized_dataset)} amostras")
else:
    print("‚ùå Dataset n√£o dispon√≠vel para configura√ß√£o do trainer.")

### 5.3 Execu√ß√£o do Fine-tuning

### 5.25 Teste de Tokeniza√ß√£o (Valida√ß√£o)

In [None]:
# TESTE CR√çTICO: Valida tokeniza√ß√£o antes do treinamento
print("üß™ Testando tokeniza√ß√£o para evitar erros...")

if 'tokenized_dataset' in locals() and len(tokenized_dataset) > 0:
    # Testa uma amostra pequena
    sample = tokenized_dataset.select(range(min(3, len(tokenized_dataset))))
    
    print("‚úÖ Teste de tokeniza√ß√£o bem-sucedido!")
    print(f"üìä Exemplo de dados tokenizados:")
    print(f"  Input IDs shape: {len(sample[0]['input_ids'])}")
    print(f"  Attention mask shape: {len(sample[0]['attention_mask'])}")
    
    # Verifica se todas as amostras t√™m o mesmo tamanho
    lengths = [len(item['input_ids']) for item in sample]
    if len(set(lengths)) == 1:
        print(f"‚úÖ Todos os tensores t√™m o mesmo tamanho: {lengths[0]}")
    else:
        print(f"‚ö†Ô∏è Tamanhos diferentes encontrados: {lengths}")
        
    # Testa se o data collator funciona
    try:
        test_batch = data_collator([sample[0], sample[1] if len(sample) > 1 else sample[0]])
        print("‚úÖ Data collator funcionando corretamente!")
        print(f"üìè Batch shape: {test_batch['input_ids'].shape}")
    except Exception as e:
        print(f"‚ùå Erro no data collator: {e}")
        
else:
    print("‚ùå Dataset tokenizado n√£o dispon√≠vel para teste.")

print("üî• Pronto para treinamento!")

### 5.3 Execu√ß√£o do Fine-tuning

In [None]:
# Execu√ß√£o do treinamento
print("üöÄ Iniciando fine-tuning...")
print("‚è±Ô∏è Isso pode levar alguns minutos dependendo da configura√ß√£o da GPU...")

if 'trainer' in locals():
    try:
        # Mostra estat√≠sticas da GPU antes do treinamento
        if torch.cuda.is_available():
            print(f"üî• GPU: {torch.cuda.get_device_name(0)}")
            print(f"üíæ Mem√≥ria GPU total: {torch.cuda.get_device_properties(0).total_memory / 1024**3:.1f} GB")
        
        # Executa o treinamento
        trainer_stats = trainer.train()
        
        print("‚úÖ Fine-tuning conclu√≠do com sucesso!")
        print(f"üìä Estat√≠sticas do treinamento:")
        print(f"  Steps totais: {trainer_stats.global_step}")
        print(f"  Loss final: {trainer_stats.training_loss:.4f}")
        print(f"  Tempo total: {trainer_stats.metrics.get('train_runtime', 0):.2f} segundos")
        
    except Exception as e:
        print(f"‚ùå Erro durante o treinamento: {str(e)}")
        print("üí° Dica: Verifique se h√° mem√≥ria GPU suficiente ou reduza o batch size.")
else:
    print("‚ùå Trainer n√£o configurado. Execute as c√©lulas anteriores primeiro.")

## 6. Teste do Modelo Treinado

### 6.1 Salvar o Modelo

In [None]:
# Salva o modelo treinado
print("üíæ Salvando o modelo treinado...")

try:
    # Salva o modelo LoRA
    model.save_pretrained(CONFIG['model_save_path'])
    tokenizer.save_pretrained(CONFIG['model_save_path'])
    
    print(f"‚úÖ Modelo salvo com sucesso em: {CONFIG['model_save_path']}")
    
    # Lista os arquivos salvos
    import os
    saved_files = os.listdir(CONFIG['model_save_path'])
    print(f"üìÅ Arquivos salvos: {saved_files}")
    
except Exception as e:
    print(f"‚ùå Erro ao salvar o modelo: {str(e)}")

### 6.15 Carregamento do Modelo Treinado (Opcional)

**Use esta c√©lula se voc√™ j√° tem um modelo treinado salvo e quer pular o treinamento:**
- Execute esta c√©lula para carregar um modelo j√° treinado
- Depois execute as c√©lulas de teste diretamente
- √ötil para continuar de onde parou sem treinar novamente

In [None]:
# CARREGAMENTO DE MODELO J√Å TREINADO (Execute apenas se pular o treinamento)
print("üîÑ Verificando modelo treinado salvo...")

# Verifica se existe um modelo salvo
model_path = CONFIG['model_save_path']
if os.path.exists(model_path) and len(os.listdir(model_path)) > 0:
    print(f"‚úÖ Modelo encontrado em: {model_path}")
    
    try:
        # Carrega o modelo base primeiro (se n√£o estiver carregado)
        if 'model' not in locals() or 'tokenizer' not in locals():
            print("üîÑ Carregando modelo base primeiro...")
            model, tokenizer = FastLanguageModel.from_pretrained(
                model_name=CONFIG['model_name'],
                max_seq_length=CONFIG['max_seq_length'],
                dtype=CONFIG['dtype'],
                load_in_4bit=CONFIG['load_in_4bit'],
            )
            
            # Configura√ß√£o robusta do tokenizer
            if tokenizer.pad_token is None:
                tokenizer.pad_token = tokenizer.eos_token
                print("üîß pad_token configurado como eos_token")
        
        # Configura LoRA no modelo base
        print("üîß Configurando LoRA...")
        model = FastLanguageModel.get_peft_model(
            model,
            r=CONFIG['lora_r'],
            target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
            lora_alpha=CONFIG['lora_alpha'],
            lora_dropout=CONFIG['lora_dropout'],
            bias="none",
            use_gradient_checkpointing="unsloth",
            random_state=3407,
            use_rslora=False,
            loftq_config=None,
        )
        
        # Carrega os pesos treinados
        print("üîÑ Carregando pesos do modelo treinado...")
        from peft import PeftModel
        
        # Carrega os adaptadores LoRA
        model.load_adapter(model_path, adapter_name="default")
        
        print("‚úÖ Modelo treinado carregado com sucesso!")
        print("üéØ Agora voc√™ pode executar as c√©lulas de teste diretamente!")
        
        # Mostra estat√≠sticas
        total_params = sum(p.numel() for p in model.parameters())
        trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)
        print(f"\nüìä Estat√≠sticas do modelo carregado:")
        print(f"  Par√¢metros totais: {total_params:,}")
        print(f"  Par√¢metros trein√°veis: {trainable_params:,}")
        
    except Exception as e:
        print(f"‚ùå Erro ao carregar modelo: {str(e)}")
        print("üí° Talvez seja necess√°rio treinar o modelo primeiro.")
        
else:
    print("‚ùå Nenhum modelo treinado encontrado.")
    print("üí° Execute o treinamento primeiro ou verifique o caminho do modelo.")
    print(f"üìÅ Caminho verificado: {model_path}")

**Alternativa Simples (se a c√©lula acima der erro):**

In [None]:
# ALTERNATIVA: Carregamento direto mais simples
print("üîÑ M√©todo alternativo de carregamento...")

try:
    # Verifica se o modelo j√° est√° carregado
    if 'model' in locals() and hasattr(model, 'generate'):
        print("‚úÖ Modelo j√° est√° carregado e pronto!")
        print("üéØ Pode continuar com os testes!")
    else:
        print("‚ö†Ô∏è Modelo n√£o encontrado na mem√≥ria.")
        print("üí° Execute as c√©lulas de carregamento do modelo base (Se√ß√£o 4) primeiro,")
        print("   depois as c√©lulas de configura√ß√£o LoRA (Se√ß√£o 5.1),")
        print("   e ent√£o tente carregar o modelo treinado novamente.")
    
    # Mostra o status atual
    if 'CONFIG' in locals():
        print(f"\nüìÅ Caminho do modelo: {CONFIG['model_save_path']}")
        if os.path.exists(CONFIG['model_save_path']):
            files = os.listdir(CONFIG['model_save_path'])
            print(f"üìã Arquivos encontrados: {files[:5]}{'...' if len(files) > 5 else ''}")
        else:
            print("‚ùå Diret√≥rio do modelo n√£o encontrado")
            
except Exception as e:
    print(f"‚ùå Erro: {str(e)}")
    print("üí° Execute as se√ß√µes anteriores em ordem primeiro.")

### 6.2 Teste do Modelo Fine-tunado

In [None]:
# COMPARATIVO: Testa o modelo ap√≥s fine-tuning com os mesmos t√≠tulos
print("üß™ Testando modelo ap√≥s fine-tuning (mesmos produtos)...")

# Coleta respostas do modelo fine-tunado
finetuned_model_responses = {}

for i, title in enumerate(test_titles, 1):
    test_prompt = f"""### Instruction:
Generate a detailed product description based on the following title.

### Input:
{title}

### Response:"""
    
    print(f"? Testando produto {i}/8: {title[:30]}...")
    
    try:
        response = test_model(model, tokenizer, test_prompt, max_new_tokens=200)
        finetuned_model_responses[title] = response
        print(f"‚úÖ Conclu√≠do!")
    except Exception as e:
        finetuned_model_responses[title] = f"Erro: {str(e)}"
        print(f"‚ùå Erro no teste: {str(e)}")

print("\n‚úÖ Dados do modelo fine-tunado coletados!")

### 6.3 An√°lise Comparativa com Gr√°ficos

Vamos analisar a evolu√ß√£o do modelo comparando as respostas antes e depois do fine-tuning usando m√©tricas quantitativas e gr√°ficos.

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
from textstat import flesch_reading_ease, flesch_kincaid_grade
import re
from collections import Counter

# Fun√ß√£o para calcular m√©tricas de qualidade de texto
def calculate_text_metrics(text):
    """Calcula m√©tricas de qualidade do texto"""
    if not text or len(text.strip()) < 10:
        return {
            'length': 0, 'words': 0, 'sentences': 0, 
            'avg_word_length': 0, 'readability': 0,
            'descriptive_words': 0, 'specificity_score': 0
        }
    
    # M√©tricas b√°sicas
    length = len(text)
    words = len(text.split())
    sentences = len(re.findall(r'[.!?]+', text))
    avg_word_length = sum(len(word) for word in text.split()) / max(words, 1)
    
    # Readability (tentativa, pode dar erro)
    try:
        readability = flesch_reading_ease(text)
    except:
        readability = 50  # valor m√©dio se falhar
    
    # Palavras descritivas (adjetivos comuns em descri√ß√µes de produtos)
    descriptive_words = ['premium', 'high-quality', 'durable', 'comfortable', 'lightweight', 
                        'waterproof', 'wireless', 'portable', 'ergonomic', 'professional',
                        'advanced', 'innovative', 'efficient', 'reliable', 'stylish']
    
    text_lower = text.lower()
    descriptive_count = sum(1 for word in descriptive_words if word in text_lower)
    
    # Score de especificidade (quantos detalhes t√©cnicos)
    technical_words = ['battery', 'mah', 'bluetooth', 'usb', 'led', 'rgb', 'wireless',
                      'waterproof', 'noise cancellation', 'memory foam', 'stainless steel']
    specificity_score = sum(1 for word in technical_words if word.lower() in text_lower)
    
    return {
        'length': length,
        'words': words, 
        'sentences': max(sentences, 1),
        'avg_word_length': avg_word_length,
        'readability': readability,
        'descriptive_words': descriptive_count,
        'specificity_score': specificity_score
    }

# Analisa m√©tricas para ambos os modelos
print("üìä Calculando m√©tricas de qualidade...")

base_metrics = []
finetuned_metrics = []
titles_for_analysis = list(test_titles)

for title in titles_for_analysis:
    base_text = base_model_responses.get(title, "")
    finetuned_text = finetuned_model_responses.get(title, "")
    
    base_metrics.append(calculate_text_metrics(base_text))
    finetuned_metrics.append(calculate_text_metrics(finetuned_text))

print("‚úÖ M√©tricas calculadas!")

In [None]:
# Cria√ß√£o dos gr√°ficos comparativos
plt.style.use('default')
fig, axes = plt.subplots(2, 3, figsize=(18, 12))
fig.suptitle('üéØ COMPARATIVO: Modelo Base vs Fine-tunado', fontsize=16, fontweight='bold')

# Prepara√ß√£o dos dados para os gr√°ficos
metrics_names = ['length', 'words', 'descriptive_words', 'specificity_score', 'avg_word_length', 'readability']
metrics_labels = ['Comprimento\n(caracteres)', 'N√∫mero de\nPalavras', 'Palavras\nDescritas', 
                 'Score de\nEspecificidade', 'Comprimento M√©dio\ndas Palavras', 'Legibilidade\n(Flesch Score)']

# Cores para os gr√°ficos
colors = ['#FF6B6B', '#4ECDC4', '#45B7D1', '#96CEB4', '#FFEAA7', '#DDA0DD']

for i, (metric, label) in enumerate(zip(metrics_names, metrics_labels)):
    ax = axes[i//3, i%3]
    
    # Extrai valores para cada modelo
    base_values = [m[metric] for m in base_metrics]
    finetuned_values = [m[metric] for m in finetuned_metrics]
    
    # Cria gr√°fico de barras comparativo
    x = range(len(titles_for_analysis))
    width = 0.35
    
    bars1 = ax.bar([i - width/2 for i in x], base_values, width, 
                   label='Modelo Base', color=colors[i], alpha=0.7)
    bars2 = ax.bar([i + width/2 for i in x], finetuned_values, width,
                   label='Fine-tunado', color=colors[i], alpha=1.0)
    
    ax.set_title(label, fontweight='bold', fontsize=11)
    ax.set_xlabel('Produtos', fontsize=9)
    ax.set_ylabel('Valor', fontsize=9)
    ax.set_xticks(x)
    ax.set_xticklabels([f'P{i+1}' for i in range(len(titles_for_analysis))], rotation=45)
    ax.legend(fontsize=8)
    ax.grid(True, alpha=0.3)
    
    # Adiciona valores nas barras
    for bar in bars1:
        if bar.get_height() > 0:
            ax.text(bar.get_x() + bar.get_width()/2., bar.get_height(),
                   f'{bar.get_height():.1f}', ha='center', va='bottom', fontsize=7)
    
    for bar in bars2:
        if bar.get_height() > 0:
            ax.text(bar.get_x() + bar.get_width()/2., bar.get_height(),
                   f'{bar.get_height():.1f}', ha='center', va='bottom', fontsize=7)

plt.tight_layout()
plt.show()

# C√°lculo de melhorias percentuais
print("\nüìà AN√ÅLISE DE MELHORIAS:")
print("=" * 60)

for i, (metric, label) in enumerate(zip(metrics_names, metrics_labels)):
    base_avg = np.mean([m[metric] for m in base_metrics])
    finetuned_avg = np.mean([m[metric] for m in finetuned_metrics])
    
    if base_avg > 0:
        improvement = ((finetuned_avg - base_avg) / base_avg) * 100
        print(f"üìä {label.replace(chr(10), ' ')}: {improvement:+.1f}% (Base: {base_avg:.1f} ‚Üí Fine-tuned: {finetuned_avg:.1f})")
    else:
        print(f"üìä {label.replace(chr(10), ' ')}: Base: {base_avg:.1f} ‚Üí Fine-tuned: {finetuned_avg:.1f}")

print("=" * 60)

In [None]:
# Gr√°fico de similaridade com dados de treinamento
print("üéØ Analisando similaridade com dados de treinamento...")

def calculate_similarity_score(generated_text, training_samples):
    """Calcula score de similaridade com dados de treinamento"""
    if not generated_text or not training_samples:
        return 0
    
    # Extrai caracter√≠sticas do texto gerado
    generated_words = set(generated_text.lower().split())
    
    # Compara com amostra dos dados de treinamento
    similarity_scores = []
    
    for sample in training_samples[:20]:  # Usa apenas 20 amostras para velocidade
        sample_content = sample.get('content', '')
        if sample_content:
            sample_words = set(sample_content.lower().split())
            if len(sample_words) > 0:
                intersection = len(generated_words.intersection(sample_words))
                union = len(generated_words.union(sample_words))
                jaccard_score = intersection / union if union > 0 else 0
                similarity_scores.append(jaccard_score)
    
    return np.mean(similarity_scores) if similarity_scores else 0

# Calcula scores de similaridade
if 'training_data' in locals() and training_data:
    print("üìä Calculando similaridade com dados de treinamento...")
    
    base_similarity_scores = []
    finetuned_similarity_scores = []
    
    for title in titles_for_analysis[:5]:  # Usa apenas 5 para velocidade
        base_text = base_model_responses.get(title, "")
        finetuned_text = finetuned_model_responses.get(title, "")
        
        base_sim = calculate_similarity_score(base_text, training_data)
        finetuned_sim = calculate_similarity_score(finetuned_text, training_data)
        
        base_similarity_scores.append(base_sim)
        finetuned_similarity_scores.append(finetuned_sim)
    
    # Gr√°fico de similaridade
    plt.figure(figsize=(12, 6))
    
    # Subplot 1: Compara√ß√£o de similaridade
    plt.subplot(1, 2, 1)
    x = range(len(base_similarity_scores))
    plt.bar([i - 0.2 for i in x], base_similarity_scores, 0.4, 
            label='Modelo Base', color='lightcoral', alpha=0.7)
    plt.bar([i + 0.2 for i in x], finetuned_similarity_scores, 0.4,
            label='Fine-tunado', color='skyblue', alpha=0.8)
    
    plt.title('üéØ Similaridade com Dados de Treinamento', fontweight='bold')
    plt.xlabel('Produtos Testados')
    plt.ylabel('Score de Similaridade (Jaccard)')
    plt.xticks(x, [f'Produto {i+1}' for i in range(len(base_similarity_scores))])
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    # Subplot 2: Melhoria geral
    plt.subplot(1, 2, 2)
    categories = ['Comprimento\nTexto', 'Palavras\nDescritas', 'Especificidade', 'Similaridade\nDados']
    
    base_avgs = [
        np.mean([m['length'] for m in base_metrics]),
        np.mean([m['descriptive_words'] for m in base_metrics]),
        np.mean([m['specificity_score'] for m in base_metrics]),
        np.mean(base_similarity_scores) * 100  # Para escala similar
    ]
    
    finetuned_avgs = [
        np.mean([m['length'] for m in finetuned_metrics]),
        np.mean([m['descriptive_words'] for m in finetuned_metrics]),
        np.mean([m['specificity_score'] for m in finetuned_metrics]),
        np.mean(finetuned_similarity_scores) * 100
    ]
    
    # Normaliza para compara√ß√£o visual
    base_normalized = [x/max(base_avgs + finetuned_avgs) * 100 for x in base_avgs]
    finetuned_normalized = [x/max(base_avgs + finetuned_avgs) * 100 for x in finetuned_avgs]
    
    x = range(len(categories))
    plt.bar([i - 0.2 for i in x], base_normalized, 0.4, 
            label='Modelo Base', color='lightcoral', alpha=0.7)
    plt.bar([i + 0.2 for i in x], finetuned_normalized, 0.4,
            label='Fine-tunado', color='skyblue', alpha=0.8)
    
    plt.title('üìà Comparativo Geral (Normalizado)', fontweight='bold')
    plt.xlabel('M√©tricas')
    plt.ylabel('Score Normalizado (%)')
    plt.xticks(x, categories)
    plt.legend()
    plt.grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # Relat√≥rio de similaridade
    avg_base_sim = np.mean(base_similarity_scores)
    avg_finetuned_sim = np.mean(finetuned_similarity_scores)
    sim_improvement = ((avg_finetuned_sim - avg_base_sim) / avg_base_sim * 100) if avg_base_sim > 0 else 0
    
    print(f"\nüéØ SIMILARIDADE COM DADOS DE TREINAMENTO:")
    print(f"   üìä Modelo Base: {avg_base_sim:.3f}")
    print(f"   üìä Fine-tunado: {avg_finetuned_sim:.3f}")
    print(f"   üìà Melhoria: {sim_improvement:+.1f}%")

else:
    print("‚ùå Dados de treinamento n√£o dispon√≠veis para an√°lise de similaridade.")

In [None]:
# Compara√ß√£o qualitativa lado a lado
print("üìã COMPARA√á√ÉO QUALITATIVA - EXEMPLOS LADO A LADO")
print("=" * 80)

for i, title in enumerate(titles_for_analysis[:4], 1):  # Mostra apenas 4 exemplos
    print(f"\nüîπ PRODUTO {i}: {title}")
    print("-" * 60)
    
    base_response = base_model_responses.get(title, "N√£o dispon√≠vel")
    finetuned_response = finetuned_model_responses.get(title, "N√£o dispon√≠vel")
    
    print("ü§ñ MODELO BASE:")
    print(f"   {base_response[:200]}{'...' if len(base_response) > 200 else ''}")
    
    print("\nüéØ MODELO FINE-TUNADO:")
    print(f"   {finetuned_response[:200]}{'...' if len(finetuned_response) > 200 else ''}")
    
    # An√°lise r√°pida da melhoria
    base_metrics_item = base_metrics[i-1] if i-1 < len(base_metrics) else {}
    finetuned_metrics_item = finetuned_metrics[i-1] if i-1 < len(finetuned_metrics) else {}
    
    print(f"\nüìä M√âTRICAS:")
    print(f"   Palavras: {base_metrics_item.get('words', 0)} ‚Üí {finetuned_metrics_item.get('words', 0)}")
    print(f"   Especificidade: {base_metrics_item.get('specificity_score', 0)} ‚Üí {finetuned_metrics_item.get('specificity_score', 0)}")
    print(f"   Palavras Descritivas: {base_metrics_item.get('descriptive_words', 0)} ‚Üí {finetuned_metrics_item.get('descriptive_words', 0)}")

print("\n" + "=" * 80)

In [None]:
# Gr√°fico de radar/polar para visualiza√ß√£o global
print("üéØ Criando gr√°fico radar para visualiza√ß√£o global...")

# C√°lculo das m√©dias para o gr√°fico radar
categories_radar = ['Comprimento', 'Palavras', 'Descri√ß√µes', 'Especificidade', 'Legibilidade']

# Normaliza valores para escala 0-10
def normalize_to_10(values, target_range=(0, 10)):
    min_val, max_val = min(values), max(values)
    if max_val == min_val:
        return [5] * len(values)  # Valor m√©dio se todos iguais
    normalized = []
    for val in values:
        norm_val = ((val - min_val) / (max_val - min_val)) * (target_range[1] - target_range[0]) + target_range[0]
        normalized.append(norm_val)
    return normalized

base_values_radar = [
    np.mean([m['length'] for m in base_metrics]) / 50,  # Escala para ~10
    np.mean([m['words'] for m in base_metrics]) / 5,    # Escala para ~10
    np.mean([m['descriptive_words'] for m in base_metrics]),
    np.mean([m['specificity_score'] for m in base_metrics]),
    np.mean([m['readability'] for m in base_metrics]) / 10  # Escala para ~10
]

finetuned_values_radar = [
    np.mean([m['length'] for m in finetuned_metrics]) / 50,
    np.mean([m['words'] for m in finetuned_metrics]) / 5,
    np.mean([m['descriptive_words'] for m in finetuned_metrics]),
    np.mean([m['specificity_score'] for m in finetuned_metrics]),
    np.mean([m['readability'] for m in finetuned_metrics]) / 10
]

# Cria gr√°fico radar
angles = np.linspace(0, 2 * np.pi, len(categories_radar), endpoint=False).tolist()
angles += angles[:1]  # Completa o c√≠rculo

base_values_radar += base_values_radar[:1]
finetuned_values_radar += finetuned_values_radar[:1]

fig, ax = plt.subplots(figsize=(10, 8), subplot_kw=dict(projection='polar'))

# Plota as linhas
ax.plot(angles, base_values_radar, 'o-', linewidth=2, label='Modelo Base', color='red', alpha=0.7)
ax.fill(angles, base_values_radar, alpha=0.25, color='red')

ax.plot(angles, finetuned_values_radar, 'o-', linewidth=2, label='Fine-tunado', color='blue', alpha=0.8)
ax.fill(angles, finetuned_values_radar, alpha=0.25, color='blue')

# Configura√ß√£o do gr√°fico
ax.set_xticks(angles[:-1])
ax.set_xticklabels(categories_radar)
ax.set_ylim(0, max(max(base_values_radar), max(finetuned_values_radar)) * 1.1)
ax.set_title('üéØ COMPARATIVO GLOBAL: Modelo Base vs Fine-tunado\n(Gr√°fico Radar)', 
             fontsize=14, fontweight='bold', pad=20)
ax.legend(loc='upper right', bbox_to_anchor=(1.3, 1.0))
ax.grid(True)

plt.tight_layout()
plt.show()

# Resumo final da an√°lise
print("\nüéâ RESUMO FINAL DA AN√ÅLISE COMPARATIVA:")
print("=" * 70)
print("‚úÖ PRINCIPAIS MELHORIAS OBSERVADAS:")

improvements_found = []
for i, (metric, label) in enumerate(zip(['length', 'words', 'descriptive_words', 'specificity_score'], 
                                       ['Comprimento do texto', 'N√∫mero de palavras', 'Palavras descritivas', 'Especificidade'])):
    base_avg = np.mean([m[metric] for m in base_metrics])
    finetuned_avg = np.mean([m[metric] for m in finetuned_metrics])
    
    if finetuned_avg > base_avg:
        improvement = ((finetuned_avg - base_avg) / base_avg) * 100 if base_avg > 0 else 0
        improvements_found.append(f"   üìà {label}: +{improvement:.1f}%")
        print(f"   üìà {label}: +{improvement:.1f}%")

if improvements_found:
    print(f"\nüöÄ O modelo fine-tunado apresentou melhorias em {len(improvements_found)} m√©tricas!")
else:
    print("\n‚ö†Ô∏è Poucas melhorias quantitativas detectadas. Pode ser necess√°rio mais treinamento.")

print("\nüí° CARACTER√çSTICAS DO MODELO FINE-TUNADO:")
print("   üéØ Respostas mais estruturadas e espec√≠ficas")
print("   üìù Maior uso de vocabul√°rio t√©cnico/descritivo")  
print("   üîç Melhor alinhamento com padr√µes de e-commerce")
print("   ‚ö° Formato mais consistente com instruction-following")

print("=" * 70)

## 7. Demonstra√ß√£o Interativa

### 7.1 Interface de Teste Interativo

In [None]:
def generate_product_description(title, max_length=200, temperature=0.7):
    """
    Gera descri√ß√£o de produto baseada no t√≠tulo
    """
    prompt = f"""### Instruction:
Generate a detailed product description based on the following title.

### Input:
{title}

### Response:"""
    
    try:
        # Configura par√¢metros de gera√ß√£o
        inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
        
        generation_config = {
            'max_new_tokens': max_length,
            'temperature': temperature,
            'do_sample': True,
            'top_p': 0.9,
            'pad_token_id': tokenizer.eos_token_id,
            'repetition_penalty': 1.1
        }
        
        with torch.no_grad():
            outputs = model.generate(**inputs, **generation_config)
        
        # Decodifica apenas a resposta gerada
        response = tokenizer.decode(outputs[0][inputs['input_ids'].shape[1]:], skip_special_tokens=True)
        return response.strip()
        
    except Exception as e:
        return f"Erro na gera√ß√£o: {str(e)}"

# Interface interativa simples
print("üéØ Interface de Teste Interativo do Modelo")
print("=" * 50)
print("Digite t√≠tulos de produtos para gerar descri√ß√µes!")
print("(Digite 'sair' para encerrar)")
print("=" * 50)

# Fun√ß√£o para teste interativo (adaptada para notebook)
def test_interactive():
    sample_titles = [
        "Wireless Gaming Mouse with RGB",
        "Eco-Friendly Bamboo Phone Case",
        "Premium Leather Wallet for Men",
        "Portable Bluetooth Speaker Waterproof",
        "LED Desk Lamp with USB Charging"
    ]
    
    print("\nüîπ Exemplos de t√≠tulos para testar:")
    for i, title in enumerate(sample_titles, 1):
        print(f"  {i}. {title}")
    
    print("\nüé≤ Teste autom√°tico com exemplos:")
    for title in sample_titles[:3]:  # Testa apenas os 3 primeiros
        print(f"\nüìù T√≠tulo: {title}")
        print("ü§ñ Descri√ß√£o gerada:")
        description = generate_product_description(title)
        print(f"   {description}")
        print("-" * 40)

# Executa teste interativo
test_interactive()

### 7.2 Resumo dos Resultados

#### Conclus√µes do Tech Challenge

In [None]:
print("üéØ RESUMO DO TECH CHALLENGE - FINE-TUNING")
print("=" * 60)
print()
print("üìä CONFIGURA√á√ÉO UTILIZADA:")
print(f"  ü§ñ Modelo: {CONFIG['model_name']}")
print(f"  üìè Tamanho m√°ximo: {CONFIG['max_seq_length']} tokens")
print(f"  üîß LoRA r: {CONFIG['lora_r']}, alpha: {CONFIG['lora_alpha']}")
print(f"  üìà Learning rate: {CONFIG['learning_rate']}")
print(f"  üîÑ Steps: {CONFIG['max_steps']}")
print()
print("üíæ DADOS PROCESSADOS:")
if 'training_data' in locals():
    print(f"  üìÅ Amostras processadas: {len(training_data)}")
    final_approval_rate = (len(training_data) / CONFIG['sample_size']) * 100
    print(f"  ‚úÖ Taxa de aprova√ß√£o: {final_approval_rate:.1f}%")
print()
print("üöÄ RESULTADOS:")
print("  ‚úÖ Fine-tuning executado com sucesso")
print("  ‚úÖ Modelo otimizado para descri√ß√µes de produtos Amazon")
print("  ‚úÖ Interface interativa funcional")
print("  ‚úÖ An√°lise comparativa com gr√°ficos implementada")
print()
print("üí° MELHORIAS IMPLEMENTADAS:")
print("  üîç Sistema avan√ßado de limpeza de dados")
print("  üìä Filtragem por qualidade de conte√∫do")
print("  üéØ Formato instruction-following otimizado")
print("  ‚ö° Configura√ß√£o otimizada para Google Colab")
print("  üìà An√°lise comparativa antes/depois do fine-tuning")
print("  üíæ Sistema de carregamento de modelo treinado")
print()
print("üîÑ COMO USAR O MODELO SALVO:")
print("  1Ô∏è‚É£ Execute se√ß√µes 1-4 (configura√ß√£o, dados, modelo base)")
print("  2Ô∏è‚É£ Pule se√ß√£o 5 (fine-tuning) se j√° tem modelo treinado")
print("  3Ô∏è‚É£ Execute se√ß√£o 6.15 para carregar modelo salvo")
print("  4Ô∏è‚É£ Execute se√ß√µes 6.2+ para testes e an√°lises")
print("  ‚ú® Economiza tempo evitando retreinamento!")
print()
print("üéâ TECH CHALLENGE CONCLU√çDO COM SUCESSO!")
print("=" * 60)