 1. Configura√ß√£o Inicial e Verifica√ß√£o de Ambiente (Adaptado para MacBook M3)

In [1]:

import os
import torch
import pandas as pd
from datasets import Dataset, DatasetDict
from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments, DataCollatorForLanguageModeling
from peft import LoraConfig, get_peft_model, PeftModel
from trl import SFTTrainer

# Verifica√ß√£o de ambiente para Apple Silicon (M-series)
if torch.backends.mps.is_available():
    device = "mps"
    print("üéâ Apple Silicon (MPS) detectado! Usando acelera√ß√£o via Metal Performance Shaders.")
elif torch.cuda.is_available():
    device = "cuda"
    print(f"üéâ GPU detectada! Usando: {torch.cuda.get_device_name(0)}")
else:
    device = "cpu"
    print("‚ö†Ô∏è Nenhuma GPU ou MPS detectado. O treinamento ser√° executado em CPU.")
print(f"Dispositivo selecionado para PyTorch: {device}\n")

# Para garantir a reprodutibilidade
def set_seed(seed: int = 42):
    import random
    import numpy as np
    torch.manual_seed(seed)
    np.random.seed(seed)
    random.seed(seed)
    if torch.cuda.is_available():
        torch.cuda.manual_seed_all(seed)
    
set_seed(42)

  from .autonotebook import tqdm as notebook_tqdm


üéâ Apple Silicon (MPS) detectado! Usando acelera√ß√£o via Metal Performance Shaders.
Dispositivo selecionado para PyTorch: mps



2. Carregamento e Amostragem do Dataset

In [2]:
# Defina o caminho para o seu arquivo de dados
data_file_path = 'trn.json'

print(f"Carregando o dataset '{data_file_path}'...")
try:
    
    df = pd.read_json(data_file_path, lines=True)
    print("Dataset carregado com sucesso!")
except Exception as e:
    print(f"Erro ao carregar o dataset: {e}")
    print("Verifique o caminho do arquivo e o formato. Se n√£o for JSON Lines, remova `lines=True` ou ajuste o m√©todo de leitura.")
    # Crie um DataFrame de exemplo para continuar o notebook se houver erro no carregamento real
    data = {
        'title': ['Boneca Interativa Beb√™', 'Kit Maquiagem Infantil Segura', 'Livro de Contos M√°gicos', 'Rob√¥ de Brinquedo Program√°vel', 'Carrinho de Controle Remoto'],
        'content': [
            'Minha filha adorou esta boneca! Ela interage, ri e at√© pede comida. Feita com materiais super seguros para crian√ßas pequenas, sem pe√ßas que se soltam. Perfeita para idades de 2 a 5 anos.',
            'Cores vibrantes e f√°cil de aplicar. Minha neta se sente uma estrela! Testado dermatologicamente e totalmente seguro, sem causar alergias. Vem com um estojo pr√°tico para guardar.',
            'Hist√≥rias cativantes e ilustra√ß√µes lindas. A cada p√°gina, uma nova aventura. Ideal para leitura antes de dormir, estimula a imagina√ß√£o. Capa dura e p√°ginas resistentes.',
            'Este rob√¥ √© incr√≠vel! F√°cil de programar com o aplicativo e executa comandos complexos. Horas de divers√£o para crian√ßas maiores. √ìtimo para introduzir conceitos de codifica√ß√£o.',
            'O carrinho tem uma velocidade impressionante e √≥tima durabilidade. Bateria de longa dura√ß√£o e controle preciso. Excelente presente para entusiastas de carros de todas as idades.'
        ]
    }
    df = pd.DataFrame(data)
    print("Usando um DataFrame de exemplo para demonstra√ß√£o.")


# Selecionar as colunas 'title' e 'content'
df_filtered = df[['title', 'content']]

# Criar uma amostra aleat√≥ria de 100.000 observa√ß√µes
sample_size = min(100000, len(df_filtered))
df_sample = df_filtered.sample(n=sample_size, random_state=42)

print(f"\nDataset original carregado: {len(df)} observa√ß√µes")
print(f"Dataset amostrado: {len(df_sample)} observa√ß√µes")
print("\nPrimeiras 5 linhas do dataset amostrado:")
print(df_sample.head())
print("\nInforma√ß√µes do dataset amostrado:")
df_sample.info()

Carregando o dataset 'trn.json'...
Dataset carregado com sucesso!

Dataset original carregado: 2248619 observa√ß√µes
Dataset amostrado: 100000 observa√ß√µes

Primeiras 5 linhas do dataset amostrado:
                                                     title  \
2183177         Yellow Box Women's Yulisa Flip Flop Sandal   
1878879                   Nine West Women's Eastnor Sandal   
1140718  Roma Costume Women's 1 Piece Santa's Envy-Red ...   
1082826  1 Box of 100 Sony 1.55v Silver Oxide Watch Bat...   
54788    Winning Angels: The 7 Fundamentals of Early St...   

                                                   content  
2183177                                                     
1878879                                                     
1140718                                                     
1082826  100 Sony 377 Watch Batteries Silver Oxide, Mer...  
54788    "Winning Angels is a superbly organised and in...  

Informa√ß√µes do dataset amostrado:
<class 'pandas.core.frame

3. Prepara√ß√£o dos Dados para Fine-tuning

In [None]:

from datasets import Dataset

def formatting_prompts_func(examples):
    output_texts = []
    for i in range(len(examples['content'])):
        
        content = str(examples['content'][i] if examples['content'][i] is not None else "").strip()
        title = str(examples['title'][i] if examples['title'][i] is not None else "").strip()
        if not content or not title:
            continue
        prompt = (
            f"<s>[INST] Analise o seguinte coment√°rio/descri√ß√£o de produto: {content} [/INST] "
            f"O t√≠tulo do produto que melhor corresponde a essa descri√ß√£o √©: {title}</s>"
        )
        output_texts.append(prompt)
    return {"text": output_texts}

# Converte o DataFrame para um objeto Dataset do Hugging Face
# print("Convertendo DataFrame para Dataset...")
dataset = Dataset.from_pandas(df_sample)

# Dividir em conjuntos de treinamento e valida√ß√£o
print("Dividindo dataset em treinamento e valida√ß√£o...")
train_test_split = dataset.train_test_split(test_size=0.05, seed=42)
train_dataset = train_test_split['train']
eval_dataset = train_test_split['test']

print("Aplicando fun√ß√£o de formata√ß√£o e removendo colunas desnecess√°rias nos datasets...")
train_dataset = train_dataset.map(
    formatting_prompts_func,
    batched=True,
    remove_columns=train_dataset.column_names
)
eval_dataset = eval_dataset.map(
    formatting_prompts_func,
    batched=True,
    remove_columns=eval_dataset.column_names
)

# Filtra quaisquer exemplos que possam ter resultado em 'text' vazio ap√≥s a formata√ß√£o
print("Filtrando exemplos vazios ap√≥s a formata√ß√£o...")
train_dataset = train_dataset.filter(lambda x: len(x['text']) > 0)
eval_dataset = eval_dataset.filter(lambda x: len(x['text']) > 0)

print(f"Dataset de treinamento formatado e filtrado: {len(train_dataset)} exemplos")
print(f"Dataset de valida√ß√£o formatado e filtrado: {len(eval_dataset)} exemplos")

# Exibir um exemplo formatado do dataset j√° processado
print("\nExemplo de prompt formatado no dataset final (train_dataset[0]['text'][0]):")
if len(train_dataset) > 0:
    print(train_dataset[0]['text'][0])
else:
    print("O dataset de treinamento est√° vazio ap√≥s formata√ß√£o e filtragem. Verifique seus dados originais.")


Dividindo dataset em treinamento e valida√ß√£o...
Aplicando fun√ß√£o de formata√ß√£o e removendo colunas desnecess√°rias nos datasets...


Map: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 95000/95000 [00:00<00:00, 283796.35 examples/s]
Map: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 5000/5000 [00:00<00:00, 265465.64 examples/s]


Filtrando exemplos vazios ap√≥s a formata√ß√£o...


Filter: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 58857/58857 [00:00<00:00, 1026133.63 examples/s]
Filter: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3017/3017 [00:00<00:00, 773437.76 examples/s]

Dataset de treinamento formatado e filtrado: 58857 exemplos
Dataset de valida√ß√£o formatado e filtrado: 3017 exemplos

Exemplo de prompt formatado no dataset final (train_dataset[0]['text'][0]):
<





4. Carregamento do Modelo Base e Tokenizador

In [10]:

# Define o ID do modelo base
model_id = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"

print(f"Carregando tokenizador para o modelo '{model_id}'...")
tokenizer = AutoTokenizer.from_pretrained(model_id)

tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right" # Necess√°rio para treinamento eficiente de LLMs


tokenizer.model_max_length = 512

print(f"\nCarregando modelo base '{model_id}' para {device}...\n")
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    trust_remote_code=True,
    torch_dtype=torch.bfloat16 if device == "mps" else torch.float32,
    device_map="auto"
)

# Configura√ß√µes do modelo para fine-tuning
model.config.use_cache = False
model.config.pretraining_tp = 1
print("Modelo e tokenizador carregados com sucesso!")


Carregando tokenizador para o modelo 'TinyLlama/TinyLlama-1.1B-Chat-v1.0'...

Carregando modelo base 'TinyLlama/TinyLlama-1.1B-Chat-v1.0' para mps...



`torch_dtype` is deprecated! Use `dtype` instead!


Modelo e tokenizador carregados com sucesso!


5. Configura√ß√£o do LoRA (PEFT)

In [12]:
print("Configurando LoRA (Low-Rank Adaptation)...")
lora_config = LoraConfig(
    r=16,
    lora_alpha=32,
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM",
    target_modules=["q_proj", "v_proj"]
)

# Aplica a configura√ß√£o LoRA ao modelo
model = get_peft_model(model, lora_config)

print("Modelo configurado com adaptadores LoRA:")
model.print_trainable_parameters()

Configurando LoRA (Low-Rank Adaptation)...
Modelo configurado com adaptadores LoRA:
trainable params: 2,252,800 || all params: 1,102,301,184 || trainable%: 0.2044




6. Defini√ß√£o dos Argumentos de Treinamento

In [13]:

output_dir = "./fine_tuned_llama"

print("Definindo argumentos de treinamento...")
training_arguments = TrainingArguments(
    output_dir=output_dir,
    num_train_epochs=1, # Uma √∫nica √©poca de treinamento
    per_device_train_batch_size=2, # REDUZIDO para 2 para economia de mem√≥ria
    gradient_accumulation_steps=4, # AUMENTADO para 4 para manter o effective_batch_size
    learning_rate=2e-4,
    logging_steps=100,
    save_steps=1000,
    eval_strategy="steps",
    eval_steps=1000,
    report_to="none",
    optim="adamw_torch",
    fp16=False,
    bf16=True if device == "mps" else False,
    seed=42,
)

print("Argumentos de treinamento definidos.")

Definindo argumentos de treinamento...
Argumentos de treinamento definidos.


7. Inicializa√ß√£o do SFTTrainer

In [14]:

print("Inicializando SFTTrainer...")

# Data Collator: Usado para agrupar e preencher os exemplos de dados em um batch.
# Ele usar√° o tokenizer que j√° configuramos com model_max_length.
data_collator = DataCollatorForLanguageModeling(tokenizer, mlm=False)

trainer = SFTTrainer(
    model=model,
    train_dataset=train_dataset, # Agora o dataset j√° est√° pr√©-formatado e cont√©m a coluna 'text'
    eval_dataset=eval_dataset,
    peft_config=lora_config,
    # REMOVIDO: 'formatting_func' n√£o √© mais necess√°rio aqui, pois o dataset j√° foi formatado na C√©lula 3.
    data_collator=data_collator,
    args=training_arguments,
    # REMOVIDO: 'max_seq_length' tamb√©m foi removido, pois o tokenizer e o data_collator devem lidar com isso.
)

print("SFTTrainer inicializado.")

Inicializando SFTTrainer...


Adding EOS to train dataset: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 58857/58857 [00:00<00:00, 61616.34 examples/s]
Tokenizing train dataset:   0%|          | 0/58857 [00:00<?, ? examples/s]Token indices sequence length is longer than the specified maximum sequence length for this model (2207 > 2048). Running this sequence through the model will result in indexing errors
Tokenizing train dataset: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 58857/58857 [00:11<00:00, 5076.67 examples/s]
Truncating train dataset: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 58857/58857 [00:00<00:00, 1515610.48 examples/s]
Adding EOS to eval dataset: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3017/3017 [00:00<00:00, 55961.65 examples/s]
Tokenizing eval dataset: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3017/3017 [00:00<00:00, 5113.79 examples/s]
Truncating eval dataset: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 3017/3017 [00:00<00:00, 1708182.39 examples/s]

SFTTrainer inicializado.





8. In√≠cio do Treinamento

In [8]:
print("Iniciando o treinamento do modelo...")
trainer.train()
print("Treinamento conclu√≠do!")

The tokenizer has new PAD/BOS/EOS tokens that differ from the model config and generation config. The model config and generation config were aligned accordingly, being updated with the tokenizer's values. Updated tokens: {'pad_token_id': 2}.


Iniciando o treinamento do modelo...




Step,Training Loss,Validation Loss,Entropy,Num Tokens,Mean Token Accuracy
1000,1.8652,1.897628,1.918301,1788856.0,0.609811
2000,1.9074,1.886621,1.897021,3576213.0,0.61165
3000,1.8504,1.880466,1.874104,5372447.0,0.612472
4000,1.8392,1.875961,1.869433,7158034.0,0.613233
5000,1.8678,1.872083,1.887396,8939609.0,0.613708
6000,1.8857,1.868985,1.87667,10730210.0,0.614225
7000,1.8504,1.867453,1.875877,12552728.0,0.614415


'(MaxRetryError('HTTPSConnectionPool(host=\'huggingface.co\', port=443): Max retries exceeded with url: /TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/config.json (Caused by NameResolutionError("<urllib3.connection.HTTPSConnection object at 0x1058dc7d0>: Failed to resolve \'huggingface.co\' ([Errno 8] nodename nor servname provided, or not known)"))'), '(Request ID: b854f940-89cf-4943-b433-6876c20cd9a0)')' thrown while requesting HEAD https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/config.json
Retrying in 1s [Retry 1/5].
'(MaxRetryError('HTTPSConnectionPool(host=\'huggingface.co\', port=443): Max retries exceeded with url: /TinyLlama/TinyLlama-1.1B-Chat-v1.0/resolve/main/config.json (Caused by NameResolutionError("<urllib3.connection.HTTPSConnection object at 0x324ba6f00>: Failed to resolve \'huggingface.co\' ([Errno 8] nodename nor servname provided, or not known)"))'), '(Request ID: 039de909-64eb-445d-a3ba-af7a39711812)')' thrown while requesting HEAD https:/

Treinamento conclu√≠do!


C√©lula 9 - Teste do modelo tunado

In [2]:
import torch
import os
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
from peft import PeftModel


# Detec√ß√£o de dispositivo como na primeira c√©lula
device = torch.device("mps" if torch.backends.mps.is_available() else "cpu")
print(f"Usando dispositivo: {device}")

model_id = "TinyLlama/TinyLlama-1.1B-Chat-v1.0"
print(f"Carregando modelo base '{model_id}' para infer√™ncia...")

# -- CORRE√á√ÉO PRINCIPAL AQUI --
# 1. Carregar o modelo base SEM device_map="auto" para evitar wrappers adicionais.
model = AutoModelForCausalLM.from_pretrained(
    model_id,
    torch_dtype=torch.bfloat16 if device == "mps" else torch.float32,
    # REMOVIDO: device_map="auto" aqui.
)
# O modelo ser√° carregado na CPU por padr√£o (ou o dispositivo padr√£o do PyTorch para o dtype).

print(f"Carregando tokenizer '{model_id}'...")
tokenizer = AutoTokenizer.from_pretrained(model_id)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right"
tokenizer.model_max_length = 512
print("Tokenizer carregado e configurado.")

base_output_dir = "./fine_tuned_llama"
fine_tuned_model_path = base_output_dir

# L√≥gica para encontrar o √∫ltimo checkpoint (a mais robusta)
if os.path.exists(base_output_dir):
    checkpoints = [
        os.path.join(base_output_dir, d)
        for d in os.listdir(base_output_dir)
        if os.path.isdir(os.path.join(base_output_dir, d)) and d.startswith("checkpoint-")
    ]
    if checkpoints:
        # Encontra o checkpoint com o maior n√∫mero de passos (o mais recente)
        fine_tuned_model_path = max(checkpoints, key=lambda cp: int(cp.split('-')[-1]))
        print(f"√öltimo checkpoint encontrado: {fine_tuned_model_path}")
    else:
        # Se nenhum subdiret√≥rio 'checkpoint-XXXX' for encontrado, tentamos o diret√≥rio base.
        print(f"Nenhum subdiret√≥rio 'checkpoint-XXXX' encontrado em '{base_output_dir}'. Tentando carregar diretamente de '{base_output_dir}'.")
        if not os.path.exists(os.path.join(base_output_dir, "adapter_config.json")):
             print(f"Erro: 'adapter_config.json' n√£o encontrado em '{base_output_dir}'. Verifique o diret√≥rio de sa√≠da do treinamento.")
             raise FileNotFoundError(f"N√£o foi poss√≠vel encontrar o modelo LoRA em '{fine_tuned_model_path}'")
else:
    print(f"Diret√≥rio de sa√≠da '{base_output_dir}' n√£o encontrado. Verifique se o treinamento foi conclu√≠do e salvou os arquivos.")
    raise FileNotFoundError(f"O diret√≥rio '{base_output_dir}' n√£o existe. Certifique-se de que o treinamento foi executado.")


print(f"Carregando adaptadores LoRA de '{fine_tuned_model_path}'...\n")
# Carrega os adaptadores PEFT e os anexa ao modelo base.
# 'model' aqui √© o AutoModelForCausalLM puro, sem wrappers de device_map.
model = PeftModel.from_pretrained(model, fine_tuned_model_path)

# -- SEGUNDA CORRE√á√ÉO --
# 2. Agora que o PeftModel foi criado corretamente (envolvendo o modelo base puro),
# movemos TODO o PeftModel para o dispositivo.
model.to(device)

# A linha de merge_and_unload() continua removida, pois n√£o √© a causa raiz do erro e pode
# ser problem√°tica em outros cen√°rios.
# print("Mesclando adaptadores LoRA com o modelo base...")
# model = model.merge_and_unload()

model.eval() # Coloca o modelo em modo de avalia√ß√£o

print("Modelo fine-tuned (com adaptadores LoRA) pronto para infer√™ncia!\n")

# Cria o pipeline de gera√ß√£o de texto
text_generator = pipeline(
    "text-generation",
    model=model, # Passamos o PeftModel diretamente
    tokenizer=tokenizer,
    # O device n√£o precisa ser explicitado aqui, pois o modelo j√° est√° no dispositivo correto.
    # Se quiser ser expl√≠cito, pode usar: device=0 if device == "cuda" else -1
)


def generate_product_title(description: str, max_new_tokens: int = 20) -> str:
    # O prompt deve ser exatamente como foi formatado para o treinamento,
    # at√© o ponto em que esperamos a gera√ß√£o do modelo.
    # Exemplo de treinamento: <s>[INST] {content} [/INST] O t√≠tulo do produto que melhor corresponde a essa descri√ß√£o √©: {title}</s>
    inference_prompt = (
        f"<s>[INST] Analise o seguinte coment√°rio/descri√ß√£o de produto: {description} [/INST] "
        f"O t√≠tulo do produto que melhor corresponde a essa descri√ß√£o √©: "
    )

    # Gerar a resposta
    generated_output = text_generator(
        inference_prompt,
        max_new_tokens=max_new_tokens,
        do_sample=True,
        temperature=0.7,
        top_k=50,
        pad_token_id=tokenizer.eos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        return_full_text=False # Esta op√ß√£o √© crucial para o pipeline retornar apenas o texto gerado ap√≥s o prompt
    )

    # O pipeline com return_full_text=False j√° retorna apenas a parte gerada.
    # Precisamos apenas limpar os tokens especiais residuais.
    if generated_output and len(generated_output) > 0:
        generated_title = generated_output[0]['generated_text'].strip()
    else:
        return "N√£o foi poss√≠vel gerar um t√≠tulo." # Em caso de falha na gera√ß√£o

    # Remove quaisquer tokens de parada ou marca√ß√µes do prompt que possam ter sido gerados
    # ou que o modelo "ecoou" e n√£o foram limpos automaticamente.
    # Usamos split para garantir que pegamos apenas a parte antes do primeiro token de parada.
    generated_title = generated_title.split("</s>")[0].strip()
    generated_title = generated_title.split("[/INST]")[0].strip() # Para o caso de uma gera√ß√£o incompleta ou errada

    return generated_title

# --- Exemplos de Teste (para valida√ß√£o inicial da C√©lula 9) ---
print("\n--- Testes R√°pidos do Modelo (ap√≥s C√©lula 9) ---\n")

desc1 = "Fone de ouvido sem fio com cancelamento de ru√≠do e bateria de longa dura√ß√£o."
title1 = generate_product_title(desc1)
print(f"Descri√ß√£o: '{desc1}'\nT√≠tulo Gerado: '{title1}'\n")

desc2 = "Laptop leve e potente para trabalho e jogos, com tela de 15 polegadas e processador de √∫ltima gera√ß√£o."
title2 = generate_product_title(desc2)
print(f"Descri√ß√£o: '{desc2}'\nT√≠tulo Gerado: '{title2}'\n")



Usando dispositivo: mps
Carregando modelo base 'TinyLlama/TinyLlama-1.1B-Chat-v1.0' para infer√™ncia...


`torch_dtype` is deprecated! Use `dtype` instead!


Carregando tokenizer 'TinyLlama/TinyLlama-1.1B-Chat-v1.0'...
Tokenizer carregado e configurado.
√öltimo checkpoint encontrado: ./fine_tuned_llama/checkpoint-7358
Carregando adaptadores LoRA de './fine_tuned_llama/checkpoint-7358'...



Device set to use mps:0


Modelo fine-tuned (com adaptadores LoRA) pronto para infer√™ncia!


--- Testes R√°pidos do Modelo (ap√≥s C√©lula 9) ---

Descri√ß√£o: 'Fone de ouvido sem fio com cancelamento de ru√≠do e bateria de longa dura√ß√£o.'
T√≠tulo Gerado: '2 in 1 Battery / Loudspeaker Earphone - B&amp;O'

Descri√ß√£o: 'Laptop leve e potente para trabalho e jogos, com tela de 15 polegadas e processador de √∫ltima gera√ß√£o.'
T√≠tulo Gerado: '2012 Acer Aspire 7755T-7032G'



C√©lula 10 - Teste interativo para resposta de t√≠tulos de produtos a partir das caracter√≠sticas 

In [None]:

import ipywidgets as widgets
from IPython.display import display, clear_output

# Cria o widget de entrada de texto para a descri√ß√£o do produto
description_input = widgets.Textarea(
    value='',
    placeholder='Digite a descri√ß√£o do produto aqui...',
    description='Descri√ß√£o:',
    disabled=False,
    layout=widgets.Layout(width='auto', height='100px') # Ajusta o layout para ocupar a largura total
)

# Cria um bot√£o para gerar o t√≠tulo
generate_button = widgets.Button(
    description='Gerar T√≠tulo',
    disabled=False,
    button_style='success', # Estilo visual do bot√£o (verde)
    tooltip='Clique para gerar o t√≠tulo do produto',
    icon='magic' # √çcone visual no bot√£o
)

# Cria um widget de sa√≠da para exibir o resultado e mensagens de carregamento
output_widget = widgets.Output()

# Fun√ß√£o que ser√° chamada quando o bot√£o for clicado
def on_generate_button_clicked(b):
    with output_widget:
        clear_output()
        description = description_input.value.strip()
        
        if not description:
            print("Por favor, digite uma descri√ß√£o para o produto.")
            return

        print("Gerando t√≠tulo... Isso pode levar alguns segundos. Por favor, aguarde.")
        try:
            generated_title = generate_product_title(description)
            print(f"\n--- Resultado da Gera√ß√£o ---")
            print(f"Descri√ß√£o fornecida:\n{description}")
            print(f"\nT√≠tulo Gerado:\n{generated_title}")
            print(f"\n--- Fim do Resultado ---")
        except Exception as e:
            print(f"Ocorreu um erro durante a gera√ß√£o do t√≠tulo: {e}")
            print("Verifique se o modelo foi carregado corretamente na C√©lula 9 e se a fun√ß√£o generate_product_title est√° acess√≠vel.")

# Associa a fun√ß√£o ao evento de clique do bot√£o
generate_button.on_click(on_generate_button_clicked)

# Exibe os widgets na sa√≠da da c√©lula
print("--- Interface Interativa para Testar o Modelo Tunado ---")
display(description_input, generate_button, output_widget)

print("\nInstru√ß√µes de Uso:")
print("1. Digite a descri√ß√£o completa do produto na caixa de texto acima.")
print("2. Clique no bot√£o 'Gerar T√≠tulo'.")
print("3. O t√≠tulo gerado pelo seu modelo fine-tuned aparecer√° na √°rea de resultados abaixo do bot√£o.")
print("4. Para uma nova gera√ß√£o, apague ou edite a descri√ß√£o e clique novamente.")



ipywidgets j√° est√° instalado.
--- Interface Interativa para Testar o Modelo Tunado ---


Textarea(value='', description='Descri√ß√£o:', layout=Layout(height='100px', width='auto'), placeholder='Digite ‚Ä¶

Button(button_style='success', description='Gerar T√≠tulo', icon='magic', style=ButtonStyle(), tooltip='Clique ‚Ä¶

Output()


Instru√ß√µes de Uso:
1. Digite a descri√ß√£o completa do produto na caixa de texto acima.
2. Clique no bot√£o 'Gerar T√≠tulo'.
3. O t√≠tulo gerado pelo seu modelo fine-tuned aparecer√° na √°rea de resultados abaixo do bot√£o.
4. Para uma nova gera√ß√£o, apague ou edite a descri√ß√£o e clique novamente.
