<a href="https://colab.research.google.com/github/jsansao/teic-20231/blob/main/TEIC_Licao32bis_GPT_2_PreTreinado.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🚀 Demonstração: Inferência com GPT-2 Pré-Treinado (Hugging Face)

Este notebook demonstra como usar um modelo GPT-2 já treinado para gerar texto. Este processo é chamado de **inferência**.

Usaremos a biblioteca `transformers` (Hugging Face) e um modelo treinado em português do Brasil: `neuralmind/gpt2-medium-portuguese`.

### Passo 1: Instalar e Importar as Bibliotecas

Primeiro, instalamos a biblioteca `transformers` e importamos a `pipeline`, que é a ferramenta mais fácil para realizar tarefas de PLN.

In [1]:
# 1. Instalar a biblioteca 'transformers' do Hugging Face
!pip install transformers

# 2. Importar a ferramenta 'pipeline'
from transformers import pipeline

print("Biblioteca 'transformers' instalada e importada com sucesso.")

Biblioteca 'transformers' instalada e importada com sucesso.


### Passo 2: Carregar o Modelo (Exemplo Simples)

Vamos carregar a `pipeline` de "text-generation" com o modelo em português. Na primeira vez que você rodar esta célula, o Colab baixará os arquivos do modelo (pode levar um minuto).

In [3]:
print("Baixando e carregando o modelo (isso só acontece na primeira vez)...")

# 3. Carregar a pipeline de geração de texto
#    - 'task="text-generation"' : Especifica o que queremos fazer.
#    - 'model="neuralmind/gpt2-medium-portuguese"' : O modelo que queremos usar.
gerador_de_texto = pipeline('text-generation', model='pierreguillou/gpt2-small-portuguese')

print("Modelo carregado com sucesso!")
print("-" * 20)

# 4. Definir nosso prompt (o texto inicial)
prompt_inicial = "O Brasil é um país de proporções continentais, conhecido por"

# 5. Gerar o texto!
#    - 'max_length=100' : Define o tamanho máximo do texto gerado (incluindo o prompt).
#    - 'num_return_sequences=1' : Quantas versões diferentes queremos gerar.
resultado = gerador_de_texto(
    prompt_inicial,
    max_length=100,
    num_return_sequences=1
)

# 6. Mostrar o resultado
print("Texto gerado:")
print(resultado[0]['generated_text'])

Baixando e carregando o modelo (isso só acontece na primeira vez)...


config.json:   0%|          | 0.00/666 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/510M [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/510M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/92.0 [00:00<?, ?B/s]

vocab.json: 0.00B [00:00, ?B/s]

merges.txt: 0.00B [00:00, ?B/s]

special_tokens_map.json:   0%|          | 0.00/120 [00:00<?, ?B/s]

Device set to use cpu
Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Both `max_new_tokens` (=256) and `max_length`(=100) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Modelo carregado com sucesso!
--------------------
Texto gerado:
O Brasil é um país de proporções continentais, conhecido por seus baixos índices de desenvolvimento, e que possui uma longa história de desenvolvimento humano. A maior parte dos países desenvolvidos são subdesenvolvidos, e a região do Planalto do Sul da Ásia é o segundo maior produtor de combustíveis do mundo. Os países com menor desenvolvimento humano são China, Índia, Indonésia, Filipinas, Malásia, Indonésia, Malásia, Brunei, Timor-Leste, Japão, Vietnã, Hong Kong, República Popular da China, Vietnã, República Popular da China, Coreia do Sul, Indonésia e Vietname. A Região Sudeste do Brasil é uma região de destaque na área de ciências naturais e ciências biológicas, sendo o país com o maior número de cientistas no mundo e com a maior produção científica brasileira. 

O Brasil está localizado na região de transição entre duas regiões: a primeira, de grande desenvolvimento mundial, e a segunda, de menor desenvolvimento pop

### Passo 3: Geração Avançada (Controlando a Criatividade)

Para obter resultados melhores e menos repetitivos, podemos ajustar parâmetros que controlam o processo de "amostragem" (sampling).

In [4]:
# (Não é preciso carregar o 'gerador_de_texto' de novo, ele já está na memória)

prompt_criativo = "A inteligência artificial está transformando o mundo de maneiras"

print("Gerando texto com parâmetros avançados...")

# Gerando 3 opções diferentes e mais criativas
resultados_criativos = gerador_de_texto(
    prompt_criativo,
    max_length=150,           # Texto um pouco mais longo
    num_return_sequences=3, # Pedimos 3 resultados diferentes

    # --- Parâmetros de Criatividade ---

    do_sample=True,           # LIGA o modo de amostragem (essencial para os parâmetros abaixo)
    temperature=0.8,          # "Temperatura": < 1.0 torna o texto mais focado, > 1.0 torna mais "criativo" ou aleatório.
    top_k=50,                 # Considera apenas as 50 palavras mais prováveis em cada etapa.
    top_p=0.95,               # Considera o menor conjunto de palavras cuja probabilidade somada seja 95%.

    # Evita repetições
    repetition_penalty=1.2
)

# Mostrar os 3 resultados
for i, resultado in enumerate(resultados_criativos):
    print(f"\n--- OPÇÃO {i+1} ---")
    print(resultado['generated_text'])

Both `max_new_tokens` (=256) and `max_length`(=150) seem to have been set. `max_new_tokens` will take precedence. Please refer to the documentation for more information. (https://huggingface.co/docs/transformers/main/en/main_classes/text_generation)


Gerando texto com parâmetros avançados...

--- OPÇÃO 1 ---
A inteligência artificial está transformando o mundo de maneiras muito mais complexas, e com isso é criando novas formas de poder.

O planeta Terra foi descoberto em 1533 por William Herschel, que estava estudando a Terra, como uma espécie de sistema estelar no céu noturno; como ele havia estudado as estrelas do sol e da lua durante seu período na Terra, a descoberta de um novo sistema planetário permitiu ao homem prever a natureza das estrelas existentes naquela região. Herschel observou os movimentos dos planetas de uma maneira surpreendente: ele notou que elas tinham características físicas semelhantes às propriedades terrestres observadas até então pela maioria das galáxias.

Um objeto tão massivo que parecia flutuar à deriva no oceano pode ter sido visto apenas pelo olho nu, mas o estudo de Herschel revelou que ela se tratava de um corpo rochoso que não poderia ser visualizado a olho nu. A Terra era vista quase que totalme

### Explicação dos Parâmetros:

* **`do_sample=True`**: Por padrão, o modelo pode usar "greedy search" (sempre escolhe a palavra mais provável). Ligar o `sample` permite que ele seja mais criativo.
* **`temperature`**: O parâmetro mais importante para controlar a criatividade.
    * `0.7` - `0.8` (bom para escrita criativa e coerente)
    * `1.0` (padrão, mais aleatório)
    * `0.2` (bem "chato" e focado, quase determinístico)
* **`top_k` / `top_p`**: Duas formas de filtrar o vocabulário em cada etapa para evitar que o modelo escolha palavras muito improváveis (que soariam estranhas).
* **`repetition_penalty`**: Um valor maior que 1.0 (ex: `1.2`) penaliza o modelo por repetir palavras ou frases que ele acabou de usar.