# Cap√≠tulo 05 ‚Äî Pr√©-Treinamento: O Nascimento da Intelig√™ncia

Neste cap√≠tulo, vamos tirar o nosso GPTMini da in√©rcia. Vamos aliment√°-lo com dados e observar o momento exato em que ele deixa de escolher letras aleat√≥rias e come√ßa a formar palavras e frases.

--- 
### üè≠ A F√°brica de Predi√ß√£o
O pr√©-treinamento ensina ao modelo a base da nossa l√≠ngua. Ele aprende que depois de "o g" provavelmente vem um "a", formando "o ga...".

![Pipeline de Treinamento](./infograficos/01-pipeline-treinamento.png)

In [None]:
# ============================================================
# Setup do reposit√≥rio no Colab
# ============================================================
import os, sys
REPO_NAME = "fazendo-um-llm-do-zero"
if 'google.colab' in str(get_ipython()):
    if not os.path.exists(REPO_NAME):
        get_ipython().system(f"git clone https://github.com/vongrossi/{REPO_NAME}.git")
    if os.path.exists(REPO_NAME) and os.getcwd().split('/')[-1] != REPO_NAME:
        os.chdir(REPO_NAME)
if os.getcwd() not in sys.path: sys.path.append(os.getcwd())
print("üìÇ Diret√≥rio atual:", os.getcwd())

In [None]:
# Setup e Imports
import os, sys, torch
import torch.nn as nn
import torch.nn.functional as F
import matplotlib.pyplot as plt
import numpy as np
from lib.gptmini import GPTConfig, GPTMini

device = "cuda" if torch.cuda.is_available() else "cpu"
torch.manual_seed(42)
print(f"‚úÖ Oficina pronta! Usando: {device}")

## 1. O Combust√≠vel: Texto com Estrutura

Para que o modelo funcione nos cap√≠tulos seguintes, vamos inclu√≠r os s√≠mbolos `###`, `:`, `?` e quebras de linha no treino base.

In [None]:
text = """
### comando:
o que o gato fez?
### resposta:
o gato subiu no telhado e pulou o muro.

### comando:
onde o cachorro dormiu?
### resposta:
o cachorro dormiu no sofa e no tapete.

inteligencia artificial e o estudo de algoritmos.
machine learning permite que sistemas aprendam padroes.
o gato dormiu no sofa enquanto o cachorro pulou o portao.
""".strip().lower()

chars = sorted(list(set(text)))
vocab_size = len(chars)
stoi = { ch:i for i,ch in enumerate(chars) }
itos = { i:ch for i,ch in enumerate(chars) }

encode = lambda s: [stoi[c] for c in s if c in stoi]
decode = lambda l: ''.join([itos[i] for i in l])

data = torch.tensor(encode(text), dtype=torch.long).to(device)
print(f"Vocabul√°rio: {''.join(chars)} | Tamanho: {vocab_size}")

## 2. Treinamento: Memorizando Padr√µes

O modelo olha para os √∫ltimos `context_size` caracteres para prever o pr√≥ximo.

In [None]:
context_size = 32
def get_batch(data, batch_size=16):
    ix = torch.randint(len(data) - context_size, (batch_size,))
    x = torch.stack([data[i:i+context_size] for i in ix])
    y = torch.stack([data[i+1:i+context_size+1] for i in ix])
    return x, y

config = GPTConfig(vocab_size=vocab_size, context_size=context_size, d_model=128, n_heads=4, n_layers=3)
model = GPTMini(config).to(device)
optimizer = torch.optim.AdamW(model.parameters(), lr=1e-3)

loss_history = []
print("üî® Treinando o modelo...")
model.train()
for step in range(1501):
    xb, yb = get_batch(data)
    logits, loss = model(xb, yb)
    optimizer.zero_grad(set_to_none=True)
    loss.backward()
    optimizer.step()
    loss_history.append(loss.item())
    if step % 500 == 0: print(f"Step {step:04d} | Loss: {loss.item():.4f}")

plt.figure(figsize=(8, 3))
plt.plot(loss_history, color='#1A73E8')
plt.title("Aprendizado do Modelo (Loss)")
plt.show()

## 3. Teste de Gera√ß√£o

Agora o modelo deve completar frases de forma minimamente coerente.

In [None]:
@torch.no_grad()
def generate(model, start_str, max_new=100):
    model.eval()
    idx = torch.tensor(encode(start_str)).unsqueeze(0).to(device)
    for _ in range(max_new):
        idx_cond = idx[:, -context_size:]
        logits, _ = model(idx_cond)
        next_id = torch.argmax(logits[:, -1, :], dim=-1, keepdim=True)
        idx = torch.cat([idx, next_id], dim=1)
        if itos[next_id.item()] == ".": break
    return decode(idx[0].tolist())

print("‚ú® TESTE DE COMPLETUDE:")
print(generate(model, "### comando:\no que o gato fez?"))

## 4. Persist√™ncia: Salvando a Intelig√™ncia

O arquivo `gpt_checkpoint.pt` ser√° usado nos cap√≠tulos seguintes.

![Checkpoints](./infograficos/05-checkpoints.png)

In [None]:
checkpoint = {
    "state_dict": model.state_dict(),
    "stoi": stoi, "itos": itos, "config": config
}
torch.save(checkpoint, "gpt_checkpoint.pt")
print("‚úÖ Checkpoint completo salvo!")
if 'google.colab' in str(get_ipython()):
    from google.colab import files
    files.download("gpt_checkpoint.pt")

## üèÅ Conclus√£o

Voc√™ acabou de ensinar um GPT a aprender linguagem. No pr√≥ximo cap√≠tulo, vamos aprender como fazer o **Fine-Tuning** para tarefas espec√≠ficas.