# Cap√≠tulo 08 ‚Äî Explora√ß√µes Extras e Reflex√µes

Este notebook acompanha o Cap√≠tulo 08 da s√©rie **Fazendo um LLM do Zero**.
Ele √© um laborat√≥rio aberto para experimentar limites, comparar estrat√©gias e refletir sobre o comportamento do modelo.

üéØ **Objetivos deste notebook:**
- Limita√ß√µes dos modelos did√°ticos
- Impacto do tamanho do dataset
- Compara√ß√µes entre estrat√©gias
- Gera√ß√£o multi-turno
- Experimentos livres

**Nota importante:** este modelo usa um vocabul√°rio e dataset pequenos.
Entradas fora do vocabul√°rio s√£o normalizadas (acentos removidos e caracteres desconhecidos viram espa√ßo).
Isso pode simplificar a sa√≠da ‚Äî esse efeito √© esperado e faz parte do experimento.

![Teoria vs Pr√°tica](./infograficos/02-teoria-vs-pratica.png)

---

![Caminhos Futuros](./infograficos/01-caminhos-futuros.png)

---


## 1. Setup e Configura√ß√£o

In [None]:
# ============================================================
# Setup do reposit√≥rio
# ============================================================
import os

REPO_URL = "https://github.com/vongrossi/fazendo-um-llm-do-zero.git"
REPO_DIR = "fazendo-um-llm-do-zero"

if not os.path.exists(REPO_DIR):
    !git clone {REPO_URL}

os.chdir(REPO_DIR)
print("Diret√≥rio atual:", os.getcwd())


### 1.1 Depend√™ncias e Imports

In [None]:
!pip -q install -r 08-extras/requirements.txt

import torch
import random
import numpy as np
import matplotlib.pyplot as plt
import sys

# Adiciona raiz ao path
sys.path.append(os.getcwd())

device = "cuda" if torch.cuda.is_available() else "cpu"
print("Device:", device)


Carregar Modelo Instruction Tuned

In [None]:
from lib.gptmini import GPTConfig, GPTMini

# ============================================================
# Carregando o modelo treinado (base para os experimentos)
# ============================================================
ckpt_path = None
for p in ["07_instruction_gpt.pt", "gpt_checkpoint.pt",
          "../07-instruction-tuning/07_instruction_gpt.pt", "../gpt_checkpoint.pt"]:
    if os.path.exists(p):
        ckpt_path = p
        break

if ckpt_path is None:
    from google.colab import files
    print("üì§ Checkpoint n√£o encontrado. Fa√ßa upload do gpt_checkpoint.pt:")
    uploaded = files.upload()
    ckpt_path = next(iter(uploaded.keys()))

ckpt = torch.load(ckpt_path, map_location=device, weights_only=False)
stoi, itos = ckpt['stoi'], ckpt['itos']
config = ckpt['config']

model = GPTMini(config).to(device)
model.load_state_dict(ckpt['state_dict'])
print(f"Modelo carregado ‚úÖ | vocab={len(stoi)} | context={config.context_size}")


### 2.1 Fun√ß√µes de Tokeniza√ß√£o

In [None]:
import unicodedata

def normalize_text(text):
    text = text.lower()
    text = ''.join(c for c in unicodedata.normalize('NFD', text) if unicodedata.category(c) != 'Mn')
    return text

def sanitize_text(text):
    text = normalize_text(text)
    unk = []
    out = []
    for c in text:
        if c in stoi:
            out.append(c)
        else:
            out.append(' ')
            unk.append(c)
    # colapsa espacos
    s = ' '.join(''.join(out).split())
    return s, sorted(set(unk))

def encode(text):
    text, _ = sanitize_text(text)
    unk_id = stoi.get(' ', 0)
    return [stoi.get(c, unk_id) for c in text]

def decode(tokens):
    return "".join([itos[t] for t in tokens])


**Nota sobre vocabul√°rio e dados**
Este modelo foi treinado com um vocabul√°rio pequeno e dataset did√°tico.
Entradas fora do vocabul√°rio s√£o normalizadas (acentos removidos e caracteres desconhecidos viram espa√ßo).
Por isso, respostas podem parecer simplificadas ‚Äî isso √© esperado e faz parte do experimento.


## 3. Experimento 1 ‚Äî Impacto do Tamanho da Instru√ß√£o

Aqui vamos observar como o tamanho do contexto influencia a resposta do modelo.

In [None]:
@torch.no_grad()
def generate(model, input_text, max_tokens=80, show_sanitized=False):
    safe_text, unk = sanitize_text(input_text)
    if show_sanitized and unk:
        print(f"‚ö†Ô∏è Caracteres fora do vocab: {unk}")
        print(f"‚û°Ô∏è Entrada normalizada: {safe_text}")

    tokens = encode(safe_text)
    tokens = torch.tensor(tokens).unsqueeze(0).to(device)

    for _ in range(max_tokens):
        idx_cond = tokens[:, -config.context_size:]
        logits, _ = model(idx_cond)
        next_token = torch.argmax(logits[:, -1, :], dim=-1)
        tokens = torch.cat([tokens, next_token.unsqueeze(1)], dim=1)
        if itos[next_token.item()] == '\n':
            break

    return decode(tokens.squeeze().tolist())


In [None]:
input_curto = "explique ia"
input_longo = "explique ia considerando aprendizado supervisionado e nao supervisionado"

print(generate(model, input_curto, show_sanitized=True))
print("\n---\n")
print(generate(model, input_longo, show_sanitized=True))


## 4. Experimento 2 ‚Äî Limita√ß√£o de Dataset Pequeno

Vamos observar comportamento fora do dom√≠nio treinado.

In [None]:
print(generate(model, "explique fisica quantica"))


## 5. Experimento 3 ‚Äî Simulando Conversa Multi-turno

Aqui simulamos uma intera√ß√£o cont√≠nua com o modelo.

In [None]:
conversation = """
usuario: o que e machine learning?
assistente:
"""

print(generate(model, conversation))


## 6. Experimento 4 ‚Äî Comparar Temperatura

Criatividade vs Determinismo

In [None]:
def generate_temp(model, input_text, temperature=1.0, max_tokens=80):
    tokens = encode(input_text)
    tokens = torch.tensor(tokens).unsqueeze(0).to(device)

    for _ in range(max_tokens):
        idx_cond = tokens[:, -config.context_size:]
        logits, _ = model(idx_cond)
        probs = torch.softmax(logits[:, -1, :] / temperature, dim=-1)
        next_token = torch.multinomial(probs, 1)
        tokens = torch.cat([tokens, next_token], dim=1)
        if itos[next_token.item()] == '\n':
            break

    return decode(tokens.squeeze().tolist())


In [None]:
print(generate_temp(model, "explique ia", temperature=0.3))
print("\n---\n")
print(generate_temp(model, "explique ia", temperature=1.2))


## 7. Experimento 5 ‚Äî Demonstrando Hallucination

In [None]:
print(generate(model, "quem descobriu a linguagem python em 1800"))


### 7.1 O Que Esses Experimentos Mostram

Modelos pequenos:

‚Ä¢ dependem fortemente do dataset  
‚Ä¢ podem produzir respostas plaus√≠veis mas incorretas  
‚Ä¢ possuem limita√ß√£o de contexto  
‚Ä¢ demonstram comportamento probabil√≠stico  

Essas caracter√≠sticas tamb√©m existem em modelos maiores, embora com menor frequ√™ncia.


üß™ Experimento 6 ‚Äî Engenharia de Instru√ß√£o

In [None]:
print(generate(model, "responda como professor explicando ia para iniciantes"))


## 9. Visualizando Distribui√ß√£o de Probabilidades

In [None]:
show_next_token_distribution(model, "explique ia")


In [None]:
show_next_token_distribution(model, "Explique IA:")


## 10. Reflex√µes Finais

Este notebook demonstrou que:

‚Ä¢ Modelos did√°ticos possuem limita√ß√µes claras  
‚Ä¢ Compreender fundamentos permite interpretar comportamento  
‚Ä¢ Pequenas mudan√ßas em dados e instru√ß√µes impactam resultados  
‚Ä¢ LLMs s√£o sistemas probabil√≠sticos, n√£o sistemas conscientes  

Este laborat√≥rio marca o encerramento da jornada pr√°tica da s√©rie.
