<a href="https://colab.research.google.com/github/ThamirisAdriano/iadt-prompts/blob/master/iadt_perplexidade.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Importação das bibliotecas:

torch: É usada para cálculos matemáticos, especialmente com modelos de aprendizado profundo.

transformers: Biblioteca que fornece ferramentas para trabalhar com modelos de linguagem pré-treinados, como o GPT-2.

O GPT2Tokenizer e o GPT2LMHeadModel são componentes que fazem a tokenização (converter texto em números que o modelo entende) e carregam o modelo GPT-2.

In [2]:
import torch
from transformers import GPT2Tokenizer, GPT2LMHeadModel


**Carregar o tokenizador e o modelo pré-treinado:**

O tokenizer é responsável por transformar o texto em uma sequência de números.

O model é o GPT-2 pré-treinado, usado para processar o texto.

In [3]:
tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
model = GPT2LMHeadModel.from_pretrained('gpt2')

**Função calcular_perplexidade:**

Recebe um texto (prompt) como entrada.

Converte esse texto em tensores (números que o modelo GPT-2 pode processar) usando o tokenizer.

O modelo gera uma previsão e calcula a loss (uma medida de quão bem o modelo previu as próximas palavras no texto).

**A perplexidade é obtida aplicando a função exp() à loss.
Isso transforma a perda em uma medida de incerteza: uma perplexidade menor significa que o modelo está mais confiante sobre suas previsões.**

In [5]:

def calcular_perplexidade(prompt):
    inputs = tokenizer(prompt, return_tensors='pt')
    outputs = model(**inputs, labels=inputs['input_ids'])
    loss = outputs.loss
    perplexidade = torch.exp(loss)
    return perplexidade.item()



In [4]:
prompt1 = "Descreva a estrutura e usos do ácido acético."
prompt2 = "Fale sobre o ácido acético."

perplexidade1 = calcular_perplexidade(prompt1)
perplexidade2 = calcular_perplexidade(prompt2)


In [7]:

print(f"Perplexidade do Prompt 1: {perplexidade1}")
print(f"Perplexidade do Prompt 2: {perplexidade2}")

Perplexidade do Prompt 1: 228.68093872070312
Perplexidade do Prompt 2: 440.08837890625


Perplexidade mais baixa (Prompt 1): O modelo encontrou uma sequência de palavras que ele reconheceu mais facilmente. Portanto, o modelo está mais "confiante" ao processar o primeiro prompt.

Perplexidade mais alta (Prompt 2): O segundo prompt foi mais difícil para o modelo prever, o que pode ocorrer porque ele é mais curto ou genérico, e o modelo fica mais incerto sobre qual direção seguir.