# Faz os testes no modelo treinado

In [1]:
# Biblioteca exigida para o do import da próxima célula
#!pip install ipywidgets

In [2]:
import os
from transformers import AutoTokenizer, AutoModelForCausalLM

In [3]:
# Carregar modelo ajustado
model_path = "./gpt2-finetuned"
tokenizer = AutoTokenizer.from_pretrained(model_path)
model = AutoModelForCausalLM.from_pretrained(model_path)

# Colocar o modelo em modo de inferência
model.eval()

GPT2LMHeadModel(
  (transformer): GPT2Model(
    (wte): Embedding(50257, 768)
    (wpe): Embedding(1024, 768)
    (drop): Dropout(p=0.1, inplace=False)
    (h): ModuleList(
      (0-11): 12 x GPT2Block(
        (ln_1): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
        (attn): GPT2SdpaAttention(
          (c_attn): Conv1D(nf=2304, nx=768)
          (c_proj): Conv1D(nf=768, nx=768)
          (attn_dropout): Dropout(p=0.1, inplace=False)
          (resid_dropout): Dropout(p=0.1, inplace=False)
        )
        (ln_2): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
        (mlp): GPT2MLP(
          (c_fc): Conv1D(nf=3072, nx=768)
          (c_proj): Conv1D(nf=768, nx=3072)
          (act): NewGELUActivation()
          (dropout): Dropout(p=0.1, inplace=False)
        )
      )
    )
    (ln_f): LayerNorm((768,), eps=1e-05, elementwise_affine=True)
  )
  (lm_head): Linear(in_features=768, out_features=50257, bias=False)
)

In [4]:
# Texto de entrada
# input_text = "Qual é a descrição do produto Misty of Chincoteague?"
input_text = "Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?"

In [5]:
# Tokenizar a entrada
inputs = tokenizer(input_text, return_tensors="pt")

# Gerar texto com penalidade para repetições e sampling ativado
outputs = model.generate(
    **inputs,
    max_length=50,
    pad_token_id=tokenizer.eos_token_id,
    repetition_penalty=1.2,
    no_repeat_ngram_size=3,
    temperature=0.7,
    top_p=0.9,
    do_sample=True  # Habilita geração com sampling
)

# Decodificar a saída
output_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("Saída do modelo:", output_text)

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


## Criei uma função para usar as mesmas perguntas que fiz no 2-Foudantion Model

In [6]:
def get_content(input_text):
    # Tokenizar a entrada
    inputs = tokenizer(input_text, return_tensors="pt")
    # Decodificar a saída
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

In [8]:
print("Saída do modelo:", get_content("Qual é a descrição do produto Adult Ballet Tutu Purple?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


In [9]:
print("Saída do modelo:", get_content("Qual é a descrição do produto The Way Things Work: An Illustrated Encyclopedia of Technology?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


In [10]:
print("Saída do modelo:", get_content("Qual é a descrição do produto Misty of Chincoteague?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


In [11]:
print("Saída do modelo:", get_content("Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


In [12]:
print("Saída do modelo:", get_content("Qual é a descrição do produto Dr. Seuss ABC (Dr.Seuss Classic Collection)?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


In [13]:
print("Saída do modelo:", get_content("Qual é a descrição do produto Adult Ballet Tutu Purple?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart


In [14]:
print("Saída do modelo:", get_content("Qual a descrição do produto Girls Ballet Tutu Neon Pink?"))

Saída do modelo: Qual é a descrição do produto Hilda Boswell's Treasury of Fairy Tales?  The most complete collection of the famous fairy tales ever published! --Bass and Garden, September 1996This is one book that will delight your heart
