# üé≠ O Grande Teatro dos LLMs: Conhecendo os Diferentes Tipos de Modelos

**M√≥dulo 6 - Introdu√ß√£o √† LLMs**

*Por Pedro Nunes Guth*

---

Bora! Chegou a hora de conhecer os diferentes "personagens" do mundo dos LLMs! üé™

T√°, mas Pedro, por que "teatro"? Simples! Cada tipo de modelo tem sua especialidade, seu papel espec√≠fico no palco da IA. √â como uma companhia teatral: tem o protagonista, o coadjuvante, o especialista em com√©dia, o dram√°tico... cada um brilha de um jeito!

Neste m√≥dulo vamos explorar:
- üèóÔ∏è **Modelos Base vs. Modelos Especializados**
- üéØ **Decoder-Only, Encoder-Only e Encoder-Decoder**
- üöÄ **Modelos Generativos vs. Discriminativos**
- üîß **Fine-tuning e Especializa√ß√£o**
- üìä **Compara√ß√£o de Performance**

In [None]:
# Setup inicial - Preparando nosso laborat√≥rio!
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from IPython.display import display, Markdown, HTML
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes visuais
plt.style.use('seaborn-v0_8')
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("üé≠ Ambiente configurado! Bora conhecer os tipos de modelos!")
print("üìö Lembra dos m√≥dulos anteriores:")
print("   ‚Ä¢ Transformers (M√≥dulo 3)")
print("   ‚Ä¢ Tokens (M√≥dulo 4)")
print("   ‚Ä¢ Embeddings (M√≥dulo 5)")
print("Agora vamos ver como tudo isso se junta em diferentes tipos!")

## üèóÔ∏è Modelos Base vs. Modelos Especializados

T√°, vamos come√ßar com o b√°sico! Imagina que voc√™ tem uma padaria:

- **Modelo Base**: √â como um padeiro que sabe fazer p√£o b√°sico muito bem, mas ainda n√£o se especializou em nada espec√≠fico
- **Modelo Especializado**: √â o mesmo padeiro depois de fazer curso de confeitaria, agora ele faz bolos incr√≠veis!

### Modelos Base (Foundation Models)

S√£o os modelos "crus", treinados em grandes quantidades de texto para aprender padr√µes gerais da linguagem. Eles sabem:
- Completar frases
- Entender contexto b√°sico
- Gerar texto coerente

**Exemplos**: GPT-3 base, LLaMA base, PaLM base

### Modelos Especializados (Fine-tuned Models)

S√£o modelos base que passaram por treinamento adicional para tarefas espec√≠ficas:
- **Instru√ß√£o**: ChatGPT, Claude (seguem comandos)
- **Conversa√ß√£o**: Bard, Assistant models
- **C√≥digo**: CodeT5, GitHub Copilot
- **Dom√≠nio espec√≠fico**: BioBERT (medicina), FinBERT (finan√ßas)

**üéØ Dica do Pedro**: Pense assim - modelo base √© como saber portugu√™s, modelo especializado √© como ser jornalista, advogado ou poeta!

In [None]:
# Vamos criar uma visualiza√ß√£o dos tipos de modelos!
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle, FancyBboxPatch

fig, ax = plt.subplots(figsize=(14, 10))

# Modelo Base (Foundation)
base_box = FancyBboxPatch((1, 7), 4, 2, 
                         boxstyle="round,pad=0.1", 
                         facecolor='lightblue', 
                         edgecolor='navy', linewidth=2)
ax.add_patch(base_box)
ax.text(3, 8, 'MODELO BASE\n(Foundation)', ha='center', va='center', 
        fontsize=12, fontweight='bold')

# Modelos Especializados
specializations = [
    ('Chat/Instru√ß√£o\n(ChatGPT)', 0.5, 4, 'lightgreen'),
    ('C√≥digo\n(Copilot)', 2.5, 4, 'lightyellow'),
    ('Dom√≠nio\n(BioBERT)', 4.5, 4, 'lightcoral'),
    ('Classifica√ß√£o\n(Sentiment)', 6.5, 4, 'lightpink')
]

for name, x, y, color in specializations:
    spec_box = FancyBboxPatch((x, y), 1.8, 1.5, 
                             boxstyle="round,pad=0.1", 
                             facecolor=color, 
                             edgecolor='darkred', linewidth=1.5)
    ax.add_patch(spec_box)
    ax.text(x + 0.9, y + 0.75, name, ha='center', va='center', 
            fontsize=10, fontweight='bold')
    
    # Setas do modelo base para especializados
    ax.arrow(3, 7, x + 0.9 - 3, y + 1.5 - 7, 
             head_width=0.1, head_length=0.1, 
             fc='gray', ec='gray', alpha=0.7)

# T√≠tulo e labels
ax.text(4, 9.5, 'üé≠ Evolu√ß√£o dos Modelos: Do Geral ao Espec√≠fico', 
        ha='center', va='center', fontsize=16, fontweight='bold')

ax.text(3, 6, 'Fine-tuning / Especializa√ß√£o', ha='center', va='center', 
        fontsize=12, style='italic', color='red')

ax.set_xlim(0, 8)
ax.set_ylim(3, 10)
ax.axis('off')

plt.tight_layout()
plt.show()

print("üéØ Liiindo! Viu como funciona a evolu√ß√£o?")
print("Base ‚Üí Especializa√ß√£o = Padeiro ‚Üí Confeiteiro!")

## üèõÔ∏è Arquiteturas: Decoder-Only, Encoder-Only e Encoder-Decoder

Lembra do M√≥dulo 3 sobre Transformers? Agora vamos ver como as diferentes partes s√£o usadas!

Pensa no Transformer como uma f√°brica com duas se√ß√µes:
- **Encoder**: A se√ß√£o que "entende" (l√™ e processa)
- **Decoder**: A se√ß√£o que "produz" (gera e cria)

### üîç Encoder-Only (S√≥ Entendimento)

**O que faz**: Especialista em entender e analisar texto
**Como funciona**: L√™ todo o texto de uma vez, cria representa√ß√µes ricas
**Melhor para**: Classifica√ß√£o, an√°lise de sentimento, Q&A

**Exemplo cl√°ssico**: BERT
- L√™ "O filme foi _____ bom" 
- Entende o contexto todo
- Preenche a lacuna ou classifica sentimento

### üéØ Decoder-Only (S√≥ Gera√ß√£o)

**O que faz**: Especialista em gerar texto novo
**Como funciona**: L√™ palavra por palavra, gera a pr√≥xima
**Melhor para**: Gera√ß√£o de texto, conversa√ß√£o, cria√ß√£o

**Exemplo cl√°ssico**: GPT fam√≠lia toda
- L√™ "Era uma vez"
- Gera "uma princesa que vivia em um castelo..."

### üîÑ Encoder-Decoder (Transforma√ß√£o)

**O que faz**: Especialista em transformar um tipo de texto em outro
**Como funciona**: Encoder entende, Decoder produz algo diferente
**Melhor para**: Tradu√ß√£o, sumariza√ß√£o, convers√£o

**Exemplo cl√°ssico**: T5, mT5
- Encoder l√™: "Hello world" (ingl√™s)
- Decoder gera: "Ol√° mundo" (portugu√™s)

In [None]:
# Vamos simular como cada arquitetura processa texto!

def simular_encoder_only(texto):
    """Simula um modelo Encoder-Only (como BERT)"""
    tokens = texto.split()
    print(f"üîç ENCODER-ONLY processando: '{texto}'")
    print("üìä An√°lise:")
    
    # Simula an√°lise de sentimento
    palavras_positivas = ['bom', '√≥timo', 'excelente', 'incr√≠vel', 'maravilhoso']
    palavras_negativas = ['ruim', 'p√©ssimo', 'terr√≠vel', 'horr√≠vel', 'detesto']
    
    score = 0
    for palavra in tokens:
        if palavra.lower() in palavras_positivas:
            score += 1
        elif palavra.lower() in palavras_negativas:
            score -= 1
    
    if score > 0:
        sentimento = "üòä POSITIVO"
    elif score < 0:
        sentimento = "üòû NEGATIVO"
    else:
        sentimento = "üòê NEUTRO"
    
    print(f"   Sentimento: {sentimento}")
    print(f"   Confian√ßa: {abs(score * 20)}%")
    return sentimento

def simular_decoder_only(prompt):
    """Simula um modelo Decoder-Only (como GPT)"""
    print(f"üéØ DECODER-ONLY gerando a partir de: '{prompt}'")
    
    # Simula gera√ß√£o baseada no prompt
    continuacoes = {
        "era uma vez": "uma princesa que vivia em um reino distante...",
        "python √©": "uma linguagem de programa√ß√£o poderosa e vers√°til...",
        "intelig√™ncia artificial": "√© uma √°rea da computa√ß√£o que busca criar sistemas inteligentes...",
        "o futuro da tecnologia": "ser√° moldado pela integra√ß√£o entre IA, IoT e computa√ß√£o qu√¢ntica..."
    }
    
    prompt_lower = prompt.lower()
    continuacao = "ser√° algo incr√≠vel e transformador para a humanidade!"
    
    for key, value in continuacoes.items():
        if key in prompt_lower:
            continuacao = value
            break
    
    print(f"‚ú® Gera√ß√£o: {continuacao}")
    return continuacao

def simular_encoder_decoder(texto_origem, tarefa):
    """Simula um modelo Encoder-Decoder (como T5)"""
    print(f"üîÑ ENCODER-DECODER - Tarefa: {tarefa}")
    print(f"üì• Entrada: '{texto_origem}'")
    
    if tarefa == "tradu√ß√£o":
        traducoes = {
            "hello world": "ol√° mundo",
            "good morning": "bom dia",
            "artificial intelligence": "intelig√™ncia artificial",
            "machine learning": "aprendizado de m√°quina"
        }
        resultado = traducoes.get(texto_origem.lower(), "tradu√ß√£o n√£o encontrada")
    
    elif tarefa == "sumariza√ß√£o":
        if len(texto_origem.split()) > 5:
            resultado = " ".join(texto_origem.split()[:5]) + "..."
        else:
            resultado = "Texto j√° est√° resumido"
    
    else:
        resultado = "Tarefa n√£o reconhecida"
    
    print(f"üì§ Resultado: '{resultado}'")
    return resultado

# Testando as tr√™s arquiteturas!
print("üß™ LABORAT√ìRIO DAS ARQUITETURAS\n")

# Teste 1: Encoder-Only
simular_encoder_only("Este filme foi realmente incr√≠vel")
print("\n" + "="*50 + "\n")

# Teste 2: Decoder-Only
simular_decoder_only("Python √©")
print("\n" + "="*50 + "\n")

# Teste 3: Encoder-Decoder
simular_encoder_decoder("hello world", "tradu√ß√£o")
print("\nüé≠ Cada arquitetura tem sua especialidade!")

```mermaid
graph TD
    A[Texto de Entrada] --> B{Que tipo de tarefa?}
    
    B -->|Entender/Classificar| C[Encoder-Only]
    B -->|Gerar/Criar| D[Decoder-Only] 
    B -->|Transformar/Traduzir| E[Encoder-Decoder]
    
    C --> F["üîç An√°lise<br/>Sentimento<br/>Classifica√ß√£o<br/>Q&A"]
    D --> G["üéØ Gera√ß√£o<br/>Chat<br/>Continua√ß√£o<br/>Cria√ß√£o"]
    E --> H["üîÑ Transforma√ß√£o<br/>Tradu√ß√£o<br/>Sumariza√ß√£o<br/>Convers√£o"]
    
    F --> I[BERT, RoBERTa]
    G --> J[GPT, LLaMA]
    H --> K[T5, BART]
```

In [None]:
# Vamos criar uma compara√ß√£o visual das arquiteturas!
fig, axes = plt.subplots(1, 3, figsize=(18, 6))

# Cores para cada arquitetura
cores = ['lightblue', 'lightgreen', 'lightcoral']
arquiteturas = ['Encoder-Only', 'Decoder-Only', 'Encoder-Decoder']
exemplos = ['BERT\nRoBERTa\nDeBERTa', 'GPT-3/4\nLLaMA\nPaLM', 'T5\nBART\nmT5']
tarefas = ['‚Ä¢ Classifica√ß√£o\n‚Ä¢ An√°lise Sentimento\n‚Ä¢ Q&A\n‚Ä¢ NER', 
          '‚Ä¢ Gera√ß√£o de Texto\n‚Ä¢ Chat\n‚Ä¢ Completar\n‚Ä¢ Cria√ß√£o',
          '‚Ä¢ Tradu√ß√£o\n‚Ä¢ Sumariza√ß√£o\n‚Ä¢ Par√°frase\n‚Ä¢ Convers√£o']

for i, (arq, ex, tar, cor) in enumerate(zip(arquiteturas, exemplos, tarefas, cores)):
    ax = axes[i]
    
    # Fundo colorido
    ax.add_patch(Rectangle((0, 0), 1, 1, facecolor=cor, alpha=0.3))
    
    # T√≠tulo da arquitetura
    ax.text(0.5, 0.9, arq, ha='center', va='center', 
            fontsize=14, fontweight='bold', transform=ax.transAxes)
    
    # Exemplos de modelos
    ax.text(0.5, 0.7, ex, ha='center', va='center', 
            fontsize=12, fontweight='bold', color='navy',
            transform=ax.transAxes)
    
    # Tarefas principais
    ax.text(0.5, 0.4, tar, ha='center', va='center', 
            fontsize=10, transform=ax.transAxes)
    
    ax.set_xlim(0, 1)
    ax.set_ylim(0, 1)
    ax.axis('off')
    
    # Borda
    for spine in ax.spines.values():
        spine.set_visible(True)
        spine.set_linewidth(2)
        spine.set_color('navy')

plt.suptitle('üèõÔ∏è As Tr√™s Grandes Arquiteturas dos LLMs', 
             fontsize=16, fontweight='bold', y=0.95)

plt.tight_layout()
plt.show()

print("üéØ Dica do Pedro: Cada arquitetura √© como uma ferramenta espec√≠fica!")
print("üîç Encoder-Only = Lupa (para analisar)")
print("üéØ Decoder-Only = Caneta (para criar)")
print("üîÑ Encoder-Decoder = Tradutor (para transformar)")

## üé® Modelos Generativos vs. Discriminativos

T√°, agora vamos falar de uma diferen√ßa fundamental! √â como a diferen√ßa entre um artista e um cr√≠tico de arte:

### üé® Modelos Generativos

**O que fazem**: Criam conte√∫do novo do zero
**Como pensam**: "Vou criar algo baseado no que aprendi"
**Analogia**: Escritor criando um livro

**Caracter√≠sticas**:
- Aprendem a distribui√ß√£o dos dados
- Conseguem gerar amostras novas
- Podem ser criativos e surpreendentes
- Mais complexos computacionalmente

**Exemplos**: GPT-4, DALL-E, Stable Diffusion

### üîç Modelos Discriminativos

**O que fazem**: Classificam e categorizam conte√∫do existente
**Como pensam**: "Vou analisar e decidir em qual categoria isso se encaixa"
**Analogia**: Cr√≠tico avaliando uma obra

**Caracter√≠sticas**:
- Aprendem fronteiras entre classes
- Focam em distin√ß√£o e classifica√ß√£o
- Mais eficientes para tarefas espec√≠ficas
- Geralmente mais r√°pidos

**Exemplos**: BERT para classifica√ß√£o, modelos de sentiment analysis

**üéØ Dica do Pedro**: Generativo = "Vou criar!", Discriminativo = "Vou julgar!"

In [None]:
# Vamos simular a diferen√ßa entre modelos generativos e discriminativos
import random

class ModeloGenerativo:
    """Simula um modelo generativo simples"""
    
    def __init__(self):
        # "Aprendeu" padr√µes de diferentes tipos de texto
        self.padroes = {
            'poesia': ['verso', 'rima', 'alma', 'cora√ß√£o', 'lua', 'estrela'],
            'tecnologia': ['algoritmo', 'dados', 'rede', 'sistema', 'c√≥digo', 'digital'],
            'culinaria': ['receita', 'ingrediente', 'sabor', 'tempero', 'cozinha', 'prato']
        }
    
    def gerar_texto(self, categoria, tamanho=5):
        """Gera texto novo baseado nos padr√µes aprendidos"""
        palavras = self.padroes.get(categoria, ['palavra', 'gen√©rica'])
        texto_gerado = []
        
        for _ in range(tamanho):
            palavra = random.choice(palavras)
            texto_gerado.append(palavra)
        
        return ' '.join(texto_gerado)

class ModeloDiscriminativo:
    """Simula um modelo discriminativo simples"""
    
    def __init__(self):
        # "Aprendeu" a distinguir entre categorias
        self.palavras_chave = {
            'poesia': ['verso', 'rima', 'alma', 'cora√ß√£o', 'lua', 'estrela'],
            'tecnologia': ['algoritmo', 'dados', 'rede', 'sistema', 'c√≥digo', 'digital'],
            'culinaria': ['receita', 'ingrediente', 'sabor', 'tempero', 'cozinha', 'prato']
        }
    
    def classificar_texto(self, texto):
        """Classifica texto em uma das categorias"""
        palavras = texto.lower().split()
        pontuacoes = {}
        
        for categoria, chaves in self.palavras_chave.items():
            pontuacao = sum(1 for palavra in palavras if palavra in chaves)
            pontuacoes[categoria] = pontuacao
        
        categoria_predita = max(pontuacoes, key=pontuacoes.get)
        confianca = pontuacoes[categoria_predita] / len(palavras) * 100
        
        return categoria_predita, confianca

# Testando os dois tipos!
print("üß™ LABORAT√ìRIO: GENERATIVO vs DISCRIMINATIVO\n")

# Criando os modelos
gerador = ModeloGenerativo()
classificador = ModeloDiscriminativo()

print("üé® MODELO GENERATIVO em a√ß√£o:")
print("=" * 40)

for categoria in ['poesia', 'tecnologia', 'culinaria']:
    texto_gerado = gerador.gerar_texto(categoria)
    print(f"üìù Gerando {categoria}: '{texto_gerado}'")

print("\nüîç MODELO DISCRIMINATIVO em a√ß√£o:")
print("=" * 40)

textos_teste = [
    "o algoritmo processa dados na rede",
    "a lua brilha no verso da alma",
    "a receita leva tempero e sabor"
]

for texto in textos_teste:
    categoria, confianca = classificador.classificar_texto(texto)
    print(f"üìä Texto: '{texto}'")
    print(f"    Categoria: {categoria} (confian√ßa: {confianca:.1f}%)\n")

print("‚ú® Resumo:")
print("üé® Generativo: CRIA conte√∫do novo")
print("üîç Discriminativo: ANALISA conte√∫do existente")

## üéØ Modelos por Tamanho e Capacidade

Agora vamos falar de tamanho! E n√£o, n√£o √© s√≥ "quanto maior, melhor". √â mais como escolher o carro certo para cada situa√ß√£o:

### üöó Modelos Pequenos (< 1B par√¢metros)
**Analogia**: Carro compacto - econ√¥mico e eficiente para o dia a dia
- **Vantagens**: R√°pidos, baratos, rodam localmente
- **Desvantagens**: Menos "inteligentes", conhecimento limitado
- **Exemplos**: DistilBERT, TinyBERT, modelos mobile

### üöô Modelos M√©dios (1B - 10B par√¢metros)
**Analogia**: SUV - bom equil√≠brio entre performance e praticidade
- **Vantagens**: Boa performance, custo razo√°vel
- **Desvantagens**: Ainda limitados para tarefas complexas
- **Exemplos**: BERT-base, GPT-2, alguns modelos LLaMA

### üöõ Modelos Grandes (10B - 100B par√¢metros)
**Analogia**: Caminh√£o - potente para trabalhos pesados
- **Vantagens**: Muito capaz, conhecimento amplo
- **Desvantagens**: Caro, lento, precisa de infraestrutura
- **Exemplos**: GPT-3, PaLM, alguns LLaMA

### üöÄ Modelos Gigantes (> 100B par√¢metros)
**Analogia**: Foguete - para miss√µes imposs√≠veis
- **Vantagens**: Estado da arte, capacidades emergentes
- **Desvantagens**: Extremamente caro e complexo
- **Exemplos**: GPT-4, PaLM-2, Gemini Ultra

**üéØ Dica do Pedro**: O segredo √© escolher o tamanho certo para sua tarefa! N√£o precisa de foguete para ir ao mercado!

In [None]:
# Vamos criar uma visualiza√ß√£o dos tamanhos e custos!
import numpy as np

# Dados dos modelos (aproximados)
modelos = {
    'DistilBERT': {'params': 0.066, 'performance': 75, 'custo': 1, 'velocidade': 95},
    'BERT-base': {'params': 0.11, 'performance': 80, 'custo': 2, 'velocidade': 85},
    'GPT-2': {'params': 1.5, 'performance': 82, 'custo': 5, 'velocidade': 75},
    'LLaMA-7B': {'params': 7, 'performance': 85, 'custo': 15, 'velocidade': 60},
    'GPT-3': {'params': 175, 'performance': 90, 'custo': 100, 'velocidade': 30},
    'GPT-4': {'params': 1000, 'performance': 95, 'custo': 500, 'velocidade': 15}
}

# Extraindo dados para visualiza√ß√£o
nomes = list(modelos.keys())
params = [modelos[nome]['params'] for nome in nomes]
performance = [modelos[nome]['performance'] for nome in nomes]
custo = [modelos[nome]['custo'] for nome in nomes]
velocidade = [modelos[nome]['velocidade'] for nome in nomes]

# Criando visualiza√ß√£o com m√∫ltiplos subplots
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 1. Par√¢metros vs Performance
scatter = ax1.scatter(params, performance, s=[c*5 for c in custo], 
                    c=velocidade, cmap='RdYlGn', alpha=0.7)
ax1.set_xscale('log')
ax1.set_xlabel('Par√¢metros (B)')
ax1.set_ylabel('Performance (%)')
ax1.set_title('üéØ Par√¢metros vs Performance')
ax1.grid(True, alpha=0.3)

# Adicionando labels
for i, nome in enumerate(nomes):
    ax1.annotate(nome, (params[i], performance[i]), 
                xytext=(5, 5), textcoords='offset points', fontsize=9)

# 2. Custo vs Performance
ax2.bar(nomes, custo, color=['lightblue' if c < 10 else 'orange' if c < 100 else 'red' 
                            for c in custo])
ax2.set_yscale('log')
ax2.set_ylabel('Custo Relativo')
ax2.set_title('üí∞ Custo por Modelo')
ax2.tick_params(axis='x', rotation=45)

# 3. Velocidade vs Tamanho
ax3.plot(params, velocidade, 'ro-', linewidth=2, markersize=8)
ax3.set_xscale('log')
ax3.set_xlabel('Par√¢metros (B)')
ax3.set_ylabel('Velocidade Relativa')
ax3.set_title('‚ö° Velocidade vs Tamanho')
ax3.grid(True, alpha=0.3)

# 4. Radar chart das caracter√≠sticas
# Escolhendo 3 modelos representativos
modelos_radar = ['DistilBERT', 'LLaMA-7B', 'GPT-4']
categorias = ['Performance', 'Velocidade', 'Efici√™ncia\n(inverso do custo)']

angles = np.linspace(0, 2 * np.pi, len(categorias), endpoint=False).tolist()
angles += angles[:1]  # Fechando o c√≠rculo

ax4 = plt.subplot(2, 2, 4, projection='polar')

for modelo in modelos_radar:
    valores = [
        modelos[modelo]['performance'],
        modelos[modelo]['velocidade'],
        100 - modelos[modelo]['custo']  # Inverso do custo = efici√™ncia
    ]
    valores += valores[:1]  # Fechando o c√≠rculo
    
    ax4.plot(angles, valores, 'o-', linewidth=2, label=modelo)
    ax4.fill(angles, valores, alpha=0.1)

ax4.set_xticks(angles[:-1])
ax4.set_xticklabels(categorias)
ax4.set_ylim(0, 100)
ax4.set_title('üìä Compara√ß√£o Multi-dimensional')
ax4.legend(loc='upper right', bbox_to_anchor=(1.3, 1.0))

plt.tight_layout()
plt.show()

print("üéØ Insights importantes:")
print("üìà Mais par√¢metros = Melhor performance (mas nem sempre vale a pena!)")
print("üí∞ Custo cresce exponencialmente com o tamanho")
print("‚ö° Velocidade diminui drasticamente com mais par√¢metros")
print("üé™ Cada modelo tem seu 'sweet spot' para diferentes usos!")

## üîß Fine-tuning e Especializa√ß√£o

Agora vamos falar do processo que transforma um modelo "gen√©rico" em um especialista! √â como pegar um m√©dico rec√©m-formado e fazer ele se especializar em cardiologia.

### O que √© Fine-tuning?

√â pegar um modelo j√° treinado (que custou milh√µes para treinar) e dar um "cursinho" espec√≠fico para ele ficar expert em algo.

**Processo**:
1. **Modelo Base**: J√° sabe linguagem em geral
2. **Dataset Espec√≠fico**: Dados da tarefa que queremos
3. **Treinamento Adicional**: Algumas √©pocas de ajuste fino
4. **Modelo Especializado**: Expert na nova tarefa!

### Tipos de Fine-tuning

#### üéØ **Instruction Tuning**
- **O que √©**: Ensina o modelo a seguir instru√ß√µes
- **Dataset**: Pares de (instru√ß√£o, resposta esperada)
- **Resultado**: ChatGPT, Claude, Bard
- **Exemplo**: "Resuma este texto" ‚Üí modelo aprende a resumir

#### üèÜ **RLHF (Reinforcement Learning from Human Feedback)**
- **O que √©**: Usa feedback humano para melhorar respostas
- **Processo**: Humanos rankeiam respostas, modelo aprende o que √© "melhor"
- **Resultado**: Modelos mais alinhados e √∫teis
- **Exemplo**: GPT-4 usa muito RLHF

#### üé® **Domain-Specific Fine-tuning**
- **O que √©**: Especializa√ß√£o em uma √°rea espec√≠fica
- **Exemplos**: 
  - BioBERT (medicina)
  - FinBERT (finan√ßas)
  - CodeT5 (programa√ß√£o)
  - LegalBERT (direito)

**üéØ Dica do Pedro**: Fine-tuning √© como personalizar um carro - voc√™ pega a base e adapta para suas necessidades espec√≠ficas!

In [None]:
# Vamos simular o processo de fine-tuning!
import random
import matplotlib.pyplot as plt

class ModeloBase:
    """Simula um modelo base gen√©rico"""
    
    def __init__(self):
        self.conhecimento_geral = {
            'linguagem': 85,
            'contexto': 80,
            'coerencia': 75
        }
        self.especializacoes = {}  # Come√ßa sem especializa√ß√µes
    
    def responder_generico(self, pergunta):
        """Resposta gen√©rica sem especializa√ß√£o"""
        respostas_genericas = [
            "Essa √© uma pergunta interessante sobre {}",
            "Posso tentar ajudar com informa√ß√µes gerais sobre {}",
            "Com base no meu conhecimento geral, {} √© um t√≥pico complexo"
        ]
        return random.choice(respostas_genericas).format(pergunta)

class ModeloEspecializado(ModeloBase):
    """Simula um modelo ap√≥s fine-tuning"""
    
    def __init__(self, especializacao):
        super().__init__()
        self.especializacao = especializacao
        self.fazer_fine_tuning()
    
    def fazer_fine_tuning(self):
        """Simula o processo de fine-tuning"""
        print(f"üîß Iniciando fine-tuning para {self.especializacao}...")
        
        # Define conhecimentos espec√≠ficos por √°rea
        especializacoes_data = {
            'medicina': {
                'diagnostico': 90,
                'sintomas': 88,
                'tratamentos': 85,
                'respostas': {
                    'dor de cabe√ßa': 'Pode ser tensional, enxaqueca ou sinusite. Recomendo avalia√ß√£o m√©dica.',
                    'febre': 'Sinal de infec√ß√£o. Hidrata√ß√£o e antipir√©tico podem ajudar.',
                    'diabetes': 'Doen√ßa metab√≥lica que requer controle glic√™mico e acompanhamento.'
                }
            },
            'programacao': {
                'sintaxe': 95,
                'algoritmos': 90,
                'debugging': 87,
                'respostas': {
                    'python': 'Linguagem vers√°til, ideal para IA, web e automa√ß√£o.',
                    'bug': 'Use print statements, debugger ou testes unit√°rios para identificar.',
                    'algoritmo': 'Sequ√™ncia de passos para resolver um problema computacional.'
                }
            },
            'culinaria': {
                'receitas': 92,
                'ingredientes': 89,
                'tecnicas': 86,
                'respostas': {
                    'bolo': 'Misture ingredientes secos, adicione l√≠quidos, asse a 180¬∞C.',
                    'tempero': 'Sal, pimenta, alho e cebola s√£o bases universais.',
                    'massa': 'Farinha, ovos e √°gua. Sove bem e deixe descansar.'
                }
            }
        }
        
        if self.especializacao in especializacoes_data:
            self.especializacoes = especializacoes_data[self.especializacao]
            print(f"‚úÖ Fine-tuning conclu√≠do! Especializa√ß√£o em {self.especializacao}")
        else:
            print(f"‚ùå Especializa√ß√£o {self.especializacao} n√£o dispon√≠vel")
    
    def responder_especializado(self, pergunta):
        """Resposta especializada ap√≥s fine-tuning"""
        pergunta_lower = pergunta.lower()
        
        # Procura por palavras-chave especializadas
        if 'respostas' in self.especializacoes:
            for keyword, resposta in self.especializacoes['respostas'].items():
                if keyword in pergunta_lower:
                    return f"[ESPECIALISTA {self.especializacao.upper()}]: {resposta}"
        
        # Se n√£o encontrou, usa conhecimento geral melhorado
        return f"[{self.especializacao.upper()}]: Com minha especializa√ß√£o, posso dizer que {pergunta} √© um t√≥pico que requer an√°lise detalhada."

# Demonstra√ß√£o do fine-tuning
print("üß™ LABORAT√ìRIO: ANTES vs DEPOIS DO FINE-TUNING\n")

# Modelo base (gen√©rico)
modelo_base = ModeloBase()
print("ü§ñ MODELO BASE (sem especializa√ß√£o):")
print("=" * 50)

perguntas_teste = ['diabetes', 'python', 'bolo']
for pergunta in perguntas_teste:
    resposta = modelo_base.responder_generico(pergunta)
    print(f"‚ùì {pergunta}: {resposta}")

print("\n" + "="*70 + "\n")

# Modelos especializados
especializacoes = ['medicina', 'programacao', 'culinaria']
perguntas_especializada = ['diabetes', 'python', 'bolo']

for i, (spec, pergunta) in enumerate(zip(especializacoes, perguntas_especializada)):
    print(f"üéØ MODELO ESPECIALIZADO ({spec.upper()}):")
    modelo_especializado = ModeloEspecializado(spec)
    resposta = modelo_especializado.responder_especializado(pergunta)
    print(f"‚ùì {pergunta}: {resposta}\n")

print("‚ú® Resumo:")
print("ü§ñ Base: Conhecimento amplo mas superficial")
print("üéØ Especializado: Conhecimento focado e profundo")
print("üîß Fine-tuning = Transformar generalista em especialista!")

```mermaid
graph LR
    A[Modelo Base<br/>GPT-3] --> B[Dataset<br/>Especializado]
    B --> C[Fine-tuning<br/>Process]
    C --> D[Modelo<br/>Especializado]
    
    B1["üìö Instruction<br/>Dataset"] --> C
    B2["üë®‚Äç‚öïÔ∏è Medical<br/>Dataset"] --> C
    B3["üíª Code<br/>Dataset"] --> C
    
    D --> E1["ü§ñ ChatGPT<br/>(Instructions)"]
    D --> E2["‚öïÔ∏è BioBERT<br/>(Medicine)"]
    D --> E3["üíª CodeT5<br/>(Programming)"]
```

In [None]:
# Vamos visualizar o impacto do fine-tuning na performance!
import numpy as np

# Dados simulados de performance antes e depois do fine-tuning
tarefas = ['Classifica√ß√£o\nSentimento', 'Gera√ß√£o\nC√≥digo', 'Diagn√≥stico\nM√©dico', 
          'Tradu√ß√£o', 'Sumariza√ß√£o', 'Q&A Espec√≠fico']

# Performance do modelo base (gen√©rico)
perf_base = [65, 45, 40, 70, 60, 50]

# Performance ap√≥s fine-tuning espec√≠fico
perf_finetuned = [88, 85, 82, 90, 85, 87]

# Criando visualiza√ß√£o comparativa
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 8))

# Gr√°fico 1: Compara√ß√£o lado a lado
x = np.arange(len(tarefas))
width = 0.35

bars1 = ax1.bar(x - width/2, perf_base, width, label='Modelo Base', 
               color='lightcoral', alpha=0.8)
bars2 = ax1.bar(x + width/2, perf_finetuned, width, label='Ap√≥s Fine-tuning', 
               color='lightgreen', alpha=0.8)

ax1.set_xlabel('Tarefas')
ax1.set_ylabel('Performance (%)')
ax1.set_title('üéØ Impacto do Fine-tuning na Performance')
ax1.set_xticks(x)
ax1.set_xticklabels(tarefas, rotation=45, ha='right')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Adicionando valores nas barras
for bar in bars1:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height + 1,
             f'{height}%', ha='center', va='bottom', fontsize=9)

for bar in bars2:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height + 1,
             f'{height}%', ha='center', va='bottom', fontsize=9)

# Gr√°fico 2: Ganho percentual
ganho = [(f - b) / b * 100 for f, b in zip(perf_finetuned, perf_base)]
cores_ganho = ['green' if g > 50 else 'orange' if g > 25 else 'red' for g in ganho]

bars3 = ax2.bar(tarefas, ganho, color=cores_ganho, alpha=0.7)
ax2.set_xlabel('Tarefas')
ax2.set_ylabel('Ganho de Performance (%)')
ax2.set_title('üìà Ganho Relativo com Fine-tuning')
ax2.tick_params(axis='x', rotation=45)
ax2.grid(True, alpha=0.3)

# Linha de refer√™ncia
ax2.axhline(y=50, color='red', linestyle='--', alpha=0.7, label='50% de ganho')
ax2.legend()

# Adicionando valores
for bar, valor in zip(bars3, ganho):
    height = bar.get_height()
    ax2.text(bar.get_x() + bar.get_width()/2., height + 2,
             f'+{valor:.0f}%', ha='center', va='bottom', fontsize=10, fontweight='bold')

plt.tight_layout()
plt.show()

# An√°lise dos resultados
print("üéØ AN√ÅLISE DOS RESULTADOS:")
print("=" * 40)
ganho_medio = np.mean(ganho)
melhor_ganho = max(ganho)
pior_ganho = min(ganho)

print(f"üìä Ganho m√©dio: {ganho_medio:.1f}%")
print(f"üèÜ Melhor ganho: {melhor_ganho:.1f}% ({tarefas[ganho.index(melhor_ganho)]})")
print(f"ü§î Menor ganho: {pior_ganho:.1f}% ({tarefas[ganho.index(pior_ganho)]})")
print(f"\n‚ú® Conclus√£o: Fine-tuning pode dobrar a performance em tarefas espec√≠ficas!")
print(f"üéØ Dica do Pedro: Vale muito a pena especializar quando voc√™ tem uma tarefa espec√≠fica!")

## üèÜ Compara√ß√£o Pr√°tica: Qual Modelo Usar Quando?

T√°, Pedro, mas na pr√°tica, qual modelo eu uso para cada situa√ß√£o? Bora criar um guia pr√°tico!

### üéØ Guia de Escolha por Caso de Uso

#### üìù **Para An√°lise de Texto**
- **Classifica√ß√£o de Sentimento**: BERT, RoBERTa (Encoder-Only)
- **Detec√ß√£o de Spam**: Modelos pequenos especializados
- **An√°lise de T√≥picos**: BERT + clustering
- **Extra√ß√£o de Entidades**: spaCy + BERT

#### ü§ñ **Para Gera√ß√£o de Conte√∫do**
- **Chat/Conversa√ß√£o**: GPT-4, Claude, Bard
- **Cria√ß√£o de Artigos**: GPT-3.5/4 + prompting
- **Copywriting**: Modelos instruction-tuned
- **Poesia/Criatividade**: Modelos grandes generativos

#### üîÑ **Para Transforma√ß√£o de Texto**
- **Tradu√ß√£o**: T5, mT5, modelos espec√≠ficos (Google Translate)
- **Sumariza√ß√£o**: BART, T5, Pegasus
- **Par√°frase**: T5 fine-tuned
- **Corre√ß√£o Gramatical**: T5 + datasets espec√≠ficos

#### üíª **Para C√≥digo**
- **Gera√ß√£o**: GitHub Copilot, CodeT5, StarCoder
- **Revis√£o**: CodeBERT especializados
- **Documenta√ß√£o**: GPT-4 + prompting espec√≠fico
- **Debug**: Modelos treinados em bugs/fixes

#### üè¢ **Para Dom√≠nios Espec√≠ficos**
- **Medicina**: BioBERT, ClinicalBERT, Med-PaLM
- **Finan√ßas**: FinBERT, BloombergGPT
- **Direito**: LegalBERT, modelos espec√≠ficos
- **Ci√™ncia**: SciBERT, Galactica

**üéØ Dica do Pedro**: Sempre comece com o mais simples que resolve seu problema!

In [None]:
# Vamos criar um sistema de recomenda√ß√£o de modelos!
class RecomendadorModelos:
    """Sistema inteligente para recomendar o melhor modelo para cada caso"""
    
    def __init__(self):
        self.modelos_db = {
            # Modelos para an√°lise
            'analise': {
                'BERT-base': {
                    'tipo': 'Encoder-Only',
                    'tamanho': 'M√©dio (110M)',
                    'velocidade': 'R√°pida',
                    'custo': 'Baixo',
                    'casos': ['classifica√ß√£o', 'sentimento', 'qa'],
                    'pros': ['Boa performance', 'Eficiente', 'Bem documentado'],
                    'contras': ['N√£o gera texto', 'Limitado a 512 tokens']
                },
                'RoBERTa': {
                    'tipo': 'Encoder-Only',
                    'tamanho': 'M√©dio (125M)',
                    'velocidade': 'R√°pida',
                    'custo': 'Baixo',
                    'casos': ['classifica√ß√£o', 'an√°lise', 'ner'],
                    'pros': ['Melhor que BERT', 'Robusto', 'Estado da arte'],
                    'contras': ['Maior que BERT', 'S√≥ an√°lise']
                }
            },
            
            # Modelos para gera√ß√£o
            'geracao': {
                'GPT-3.5-turbo': {
                    'tipo': 'Decoder-Only',
                    'tamanho': 'Grande (~20B)',
                    'velocidade': 'M√©dia',
                    'custo': 'M√©dio',
                    'casos': ['chat', 'gera√ß√£o', 'criatividade'],
                    'pros': ['Vers√°til', 'Boa qualidade', 'API f√°cil'],
                    'contras': ['Pago', 'Online only', 'Alucina√ß√µes']
                },
                'LLaMA-7B': {
                    'tipo': 'Decoder-Only',
                    'tamanho': 'M√©dio (7B)',
                    'velocidade': 'M√©dia',
                    'custo': 'M√©dio',
                    'casos': ['gera√ß√£o', 'chat', 'fine-tuning'],
                    'pros': ['Open source', 'Boa qualidade', 'Customiz√°vel'],
                    'contras': ['Precisa GPU', 'Setup complexo']
                }
            },
            
            # Modelos para transforma√ß√£o
            'transformacao': {
                'T5-base': {
                    'tipo': 'Encoder-Decoder',
                    'tamanho': 'M√©dio (220M)',
                    'velocidade': 'M√©dia',
                    'custo': 'M√©dio',
                    'casos': ['tradu√ß√£o', 'sumariza√ß√£o', 'qa'],
                    'pros': ['Vers√°til', 'Text-to-text', 'Bem treinado'],
                    'contras': ['Complexo', 'Precisa fine-tuning']
                },
                'BART': {
                    'tipo': 'Encoder-Decoder',
                    'tamanho': 'M√©dio (140M)',
                    'velocidade': 'R√°pida',
                    'custo': 'Baixo',
                    'casos': ['sumariza√ß√£o', 'par√°frase'],
                    'pros': ['√ìtimo para resumos', 'Eficiente'],
                    'contras': ['Limitado em dom√≠nio']
                }
            }
        }
    
    def recomendar(self, tarefa, orcamento='m√©dio', velocidade_necessaria='m√©dia'):
        """Recomenda o melhor modelo baseado nos crit√©rios"""
        print(f"üéØ RECOMENDA√á√ÉO PARA: {tarefa.upper()}")
        print(f"üí∞ Or√ßamento: {orcamento} | ‚ö° Velocidade: {velocidade_necessaria}")
        print("=" * 60)
        
        # Mapeia tarefas para categorias
        mapa_tarefas = {
            'classifica√ß√£o': 'analise',
            'sentimento': 'analise',
            'ner': 'analise',
            'qa': 'analise',
            'chat': 'geracao',
            'gera√ß√£o': 'geracao',
            'criatividade': 'geracao',
            'tradu√ß√£o': 'transformacao',
            'sumariza√ß√£o': 'transformacao',
            'par√°frase': 'transformacao'
        }
        
        categoria = mapa_tarefas.get(tarefa, 'geracao')
        modelos_categoria = self.modelos_db[categoria]
        
        # Filtra modelos baseado nos crit√©rios
        recomendacoes = []
        
        for nome, info in modelos_categoria.items():
            if tarefa in info['casos']:
                score = self._calcular_score(info, orcamento, velocidade_necessaria)
                recomendacoes.append((nome, info, score))
        
        # Ordena por score
        recomendacoes.sort(key=lambda x: x[2], reverse=True)
        
        # Apresenta as recomenda√ß√µes
        for i, (nome, info, score) in enumerate(recomendacoes[:3]):
            emoji = "ü•á" if i == 0 else "ü•à" if i == 1 else "ü•â"
            print(f"{emoji} **{nome}** (Score: {score:.1f}/10)")
            print(f"   üìä {info['tipo']} | {info['tamanho']} | {info['velocidade']} | {info['custo']}")
            print(f"   ‚úÖ Pros: {', '.join(info['pros'])}")
            print(f"   ‚ö†Ô∏è  Contras: {', '.join(info['contras'])}")
            print()
        
        return recomendacoes[0][0] if recomendacoes else None
    
    def _calcular_score(self, info, orcamento, velocidade):
        """Calcula score baseado nos crit√©rios"""
        score = 5.0  # Base
        
        # Ajuste por or√ßamento
        if orcamento == 'baixo' and info['custo'] == 'Baixo':
            score += 2
        elif orcamento == 'alto' and info['custo'] == 'Alto':
            score += 1
        elif orcamento != info['custo'].lower():
            score -= 1
        
        # Ajuste por velocidade
        if velocidade == 'r√°pida' and info['velocidade'] == 'R√°pida':
            score += 2
        elif velocidade != info['velocidade'].lower():
            score -= 0.5
        
        return min(10, max(0, score))

# Testando o sistema de recomenda√ß√£o!
recomendador = RecomendadorModelos()

print("ü§ñ SISTEMA DE RECOMENDA√á√ÉO DE MODELOS\n")

# Casos de teste
casos_teste = [
    ('sentimento', 'baixo', 'r√°pida'),
    ('chat', 'm√©dio', 'm√©dia'),
    ('sumariza√ß√£o', 'baixo', 'm√©dia')
]

for tarefa, orcamento, velocidade in casos_teste:
    melhor_modelo = recomendador.recomendar(tarefa, orcamento, velocidade)
    print(f"üéØ Melhor escolha: {melhor_modelo}")
    print("\n" + "="*70 + "\n")

print("‚ú® Dica do Pedro: Use este sistema como ponto de partida!")
print("üß™ Sempre teste na pr√°tica para validar a escolha!")

## üß™ Exerc√≠cio Pr√°tico 1: Classifica√ß√£o de Modelos

**Desafio**: Dado um conjunto de modelos e suas caracter√≠sticas, classifique-os nas categorias corretas!

Vou te dar as caracter√≠sticas, voc√™ me diz:
1. Arquitetura (Encoder-Only, Decoder-Only, Encoder-Decoder)
2. Tipo (Generativo ou Discriminativo)
3. Melhor caso de uso

**üéØ Dica do Pedro**: Lembra das caracter√≠sticas que aprendemos!

In [None]:
# EXERC√çCIO 1: Sistema de Quiz sobre Tipos de Modelos
import random

class QuizModelos:
    def __init__(self):
        self.perguntas = [
            {
                'modelo': 'DistilBERT',
                'caracter√≠sticas': ['L√™ texto completo de uma vez', 'Excelente para classifica√ß√£o', 'N√£o gera texto novo', 'Menor que BERT original'],
                'arquitetura': 'Encoder-Only',
                'tipo': 'Discriminativo',
                'uso': 'An√°lise de sentimento'
            },
            {
                'modelo': 'GPT-2',
                'caracter√≠sticas': ['Gera uma palavra por vez', 'Excelente para criar hist√≥rias', 'L√™ da esquerda para direita', 'Pode continuar qualquer texto'],
                'arquitetura': 'Decoder-Only',
                'tipo': 'Generativo',
                'uso': 'Gera√ß√£o de texto'
            },
            {
                'modelo': 'T5',
                'caracter√≠sticas': ['Transforma um texto em outro', '√ìtimo para tradu√ß√£o', 'Usa formato "text-to-text"', 'Tem encoder e decoder'],
                'arquitetura': 'Encoder-Decoder',
                'tipo': 'Generativo',
                'uso': 'Tradu√ß√£o'
            },
            {
                'modelo': 'RoBERTa',
                'caracter√≠sticas': ['Vers√£o melhorada do BERT', 'Apenas analisa, n√£o gera', 'Bidirecional', '√ìtimo para Q&A'],
                'arquitetura': 'Encoder-Only',
                'tipo': 'Discriminativo',
                'uso': 'Question Answering'
            }
        ]
        self.pontuacao = 0
        self.total_perguntas = 0
    
    def fazer_pergunta(self, pergunta_data):
        print(f"ü§ñ MODELO: {pergunta_data['modelo']}")
        print("üìã CARACTER√çSTICAS:")
        for i, carac in enumerate(pergunta_data['caracter√≠sticas'], 1):
            print(f"   {i}. {carac}")
        print()
        
        # Pergunta 1: Arquitetura
        print("‚ùì Qual a arquitetura deste modelo?")
        print("   A) Encoder-Only")
        print("   B) Decoder-Only")
        print("   C) Encoder-Decoder")
        
        resposta_arq = input("Sua resposta (A/B/C): ").upper().strip()
        arquiteturas = {'A': 'Encoder-Only', 'B': 'Decoder-Only', 'C': 'Encoder-Decoder'}
        
        if arquiteturas.get(resposta_arq) == pergunta_data['arquitetura']:
            print("‚úÖ Correto!")
            self.pontuacao += 1
        else:
            print(f"‚ùå Incorreto. Resposta: {pergunta_data['arquitetura']}")
        
        # Pergunta 2: Tipo
        print("\n‚ùì Este modelo √©:")
        print("   A) Generativo (cria conte√∫do novo)")
        print("   B) Discriminativo (classifica/analisa)")
        
        resposta_tipo = input("Sua resposta (A/B): ").upper().strip()
        tipos = {'A': 'Generativo', 'B': 'Discriminativo'}
        
        if tipos.get(resposta_tipo) == pergunta_data['tipo']:
            print("‚úÖ Correto!")
            self.pontuacao += 1
        else:
            print(f"‚ùå Incorreto. Resposta: {pergunta_data['tipo']}")
        
        self.total_perguntas += 2
        print(f"\nüìä Pontua√ß√£o atual: {self.pontuacao}/{self.total_perguntas}")
        print("="*50)
    
    def executar_quiz(self, num_perguntas=2):
        print("üéØ QUIZ: TIPOS DE MODELOS")
        print("Vamos testar seu conhecimento!\n")
        
        perguntas_selecionadas = random.sample(self.perguntas, min(num_perguntas, len(self.perguntas)))
        
        for pergunta in perguntas_selecionadas:
            self.fazer_pergunta(pergunta)
            input("\nPressione Enter para continuar...")
            print("\n")
        
        # Resultado final
        percentual = (self.pontuacao / self.total_perguntas) * 100
        print("üèÜ RESULTADO FINAL")
        print(f"üìä Pontua√ß√£o: {self.pontuacao}/{self.total_perguntas} ({percentual:.1f}%)")
        
        if percentual >= 80:
            print("ü•á Excelente! Voc√™ domina os tipos de modelos!")
        elif percentual >= 60:
            print("ü•à Bom trabalho! Voc√™ entende bem o assunto!")
        else:
            print("üìö Continue estudando! Releia o material!")

# Executando o quiz (vers√£o autom√°tica para o notebook)
print("üéØ QUIZ AUTOM√ÅTICO - TIPOS DE MODELOS\n")

# Simulando respostas para demonstra√ß√£o
quiz = QuizModelos()
exemplos = [
    {
        'modelo': 'BERT',
        'caracter√≠sticas': ['Bidirecional', 'M√°scara tokens', 'Classifica√ß√£o', 'N√£o gera'],
        'resposta_arq': 'Encoder-Only',
        'resposta_tipo': 'Discriminativo'
    },
    {
        'modelo': 'GPT-3',
        'caracter√≠sticas': ['Autoregressivo', 'Gera texto', 'Uma palavra por vez', 'Criativo'],
        'resposta_arq': 'Decoder-Only',
        'resposta_tipo': 'Generativo'
    }
]

for exemplo in exemplos:
    print(f"ü§ñ MODELO: {exemplo['modelo']}")
    print("üìã CARACTER√çSTICAS:")
    for i, carac in enumerate(exemplo['caracter√≠sticas'], 1):
        print(f"   {i}. {carac}")
    print(f"\n‚úÖ Arquitetura: {exemplo['resposta_arq']}")
    print(f"‚úÖ Tipo: {exemplo['resposta_tipo']}")
    print("="*50 + "\n")

print("üéØ Agora √© sua vez! Tente classificar outros modelos que voc√™ conhece!")

## üöÄ Exerc√≠cio Pr√°tico 2: Cen√°rio de Escolha de Modelo

**Cen√°rio Real**: Voc√™ foi contratado por uma startup brasileira de e-commerce para implementar IA em diferentes partes do sistema.

**Requisitos**:
1. **An√°lise de Reviews**: Classificar reviews em positivo/negativo
2. **Chatbot**: Responder d√∫vidas dos clientes
3. **Tradu√ß√£o**: Traduzir produtos para outros idiomas
4. **Gera√ß√£o de Descri√ß√µes**: Criar descri√ß√µes autom√°ticas de produtos

**Restri√ß√µes**:
- Or√ßamento limitado (startup!)
- Precisa de respostas r√°pidas
- Dados em portugu√™s
- Alguns dados sens√≠veis (n√£o pode usar APIs externas)

**Sua miss√£o**: Escolha o modelo ideal para cada caso e justifique!

In [None]:
# EXERC√çCIO 2: Solucionando Cen√°rio Real de E-commerce

class ConsultorIA:
    """Simula√ß√£o de um consultor especialista em IA"""
    
    def __init__(self):
        self.solucoes = {
            'reviews': {
                'problema': 'Classificar reviews em positivo/negativo',
                'requisitos': ['R√°pido', 'Baixo custo', 'Portugu√™s', 'Offline'],
                'modelo_recomendado': 'BERT-base multilingual fine-tuned',
                'justificativa': [
                    '‚úÖ Encoder-Only: Perfeito para classifica√ß√£o',
                    '‚úÖ Discriminativo: Foco em an√°lise, n√£o gera√ß√£o',
                    '‚úÖ Multilingual: Suporta portugu√™s nativamente',
                    '‚úÖ Fine-tuning: Pode especializar em reviews',
                    '‚úÖ Offline: Roda localmente, dados seguros',
                    '‚úÖ Custo: Relativamente barato de rodar'
                ],
                'alternativas': ['RoBERTa-PT', 'DistilBERT (mais r√°pido)'],
                'implementacao': 'Transformers + PyTorch, fine-tune com reviews brasileiros'
            },
            
            'chatbot': {
                'problema': 'Responder d√∫vidas dos clientes',
                'requisitos': ['Conversacional', 'Portugu√™s', 'Custo moderado', 'Contextual'],
                'modelo_recomendado': 'LLaMA-7B fine-tuned + RAG',
                'justificativa': [
                    '‚úÖ Decoder-Only: Excelente para conversa√ß√£o',
                    '‚úÖ Generativo: Cria respostas naturais',
                    '‚úÖ 7B: Bom equil√≠brio tamanho/qualidade',
                    '‚úÖ Fine-tuning: Especializar em e-commerce',
                    '‚úÖ RAG: Conecta com base de conhecimento',
                    '‚úÖ Open-source: Sem custos de API'
                ],
                'alternativas': ['GPT-3.5 (se budget permitir)', 'Alpaca-7B'],
                'implementacao': 'LangChain + Chroma DB para RAG, fine-tune com conversas'
            },
            
            'traducao': {
                'problema': 'Traduzir produtos para outros idiomas',
                'requisitos': ['Transforma√ß√£o texto', 'M√∫ltiplos idiomas', 'Qualidade alta'],
                'modelo_recomendado': 'mT5 ou MarianMT espec√≠fico',
                'justificativa': [
                    '‚úÖ Encoder-Decoder: Ideal para tradu√ß√£o',
                    '‚úÖ Multilingual: Suporta v√°rios idiomas',
                    '‚úÖ Especializado: Foco em tradu√ß√£o',
                    '‚úÖ Open-source: Sem custos por uso',
                    '‚úÖ Fine-tuning: Pode melhorar para e-commerce'
                ],
                'alternativas': ['Google Translate API (pago)', 'OPUS-MT'],
                'implementacao': 'Transformers, modelos espec√≠ficos por par de idiomas'
            },
            
            'descricoes': {
                'problema': 'Gerar descri√ß√µes autom√°ticas de produtos',
                'requisitos': ['Criativo', 'Persuasivo', 'Portugu√™s', 'Baseado em features'],
                'modelo_recomendado': 'GPT-3.5-turbo com prompting ou T5 fine-tuned',
                'justificativa': [
                    '‚úÖ Generativo: Cria conte√∫do original',
                    '‚úÖ Criativo: Textos persuasivos de marketing',
                    '‚úÖ Estruturado: Pode seguir templates',
                    '‚úÖ Prompting: Controle sobre estilo e tom',
                    '‚ö†Ô∏è Custo: GPT-3.5 √© pago, T5 offline'
                ],
                'alternativas': ['LLaMA fine-tuned', 'T5 + templates'],
                'implementacao': 'API OpenAI ou T5 fine-tuned com descri√ß√µes existentes'
            }
        }
    
    def analisar_caso(self, caso):
        """Analisa um caso espec√≠fico e apresenta a solu√ß√£o"""
        if caso not in self.solucoes:
            print(f"‚ùå Caso '{caso}' n√£o encontrado!")
            return
        
        solucao = self.solucoes[caso]
        
        print(f"üéØ CASO: {solucao['problema'].upper()}")
        print("="*60)
        
        print("üìã REQUISITOS:")
        for req in solucao['requisitos']:
            print(f"   ‚Ä¢ {req}")
        
        print(f"\nüèÜ MODELO RECOMENDADO: {solucao['modelo_recomendado']}")
        
        print("\nüí° JUSTIFICATIVA:")
        for just in solucao['justificativa']:
            print(f"   {just}")
        
        print(f"\nüîÑ ALTERNATIVAS: {', '.join(solucao['alternativas'])}")
        
        print(f"\nüõ†Ô∏è IMPLEMENTA√á√ÉO: {solucao['implementacao']}")
        
        return solucao
    
    def resumo_arquitetura(self):
        """Apresenta resumo da arquitetura completa"""
        print("üèóÔ∏è ARQUITETURA COMPLETA DA SOLU√á√ÉO")
        print("="*60)
        
        arquitetura = {
            'üîç Reviews (An√°lise)': 'BERT multilingual ‚Üí Classifica√ß√£o Sentimento',
            'ü§ñ Chatbot (Conversa√ß√£o)': 'LLaMA-7B + RAG ‚Üí Respostas Contextuais',
            'üåç Tradu√ß√£o (Transforma√ß√£o)': 'mT5/MarianMT ‚Üí M√∫ltiplos Idiomas',
            '‚úçÔ∏è Descri√ß√µes (Gera√ß√£o)': 'GPT-3.5 ou T5 ‚Üí Conte√∫do Criativo'
        }
        
        for funcao, solucao in arquitetura.items():
            print(f"{funcao}: {solucao}")
        
        print("\nüí∞ ESTIMATIVA DE CUSTOS (mensal):")
        custos = {
            'Infrastructure (GPU)': 'R$ 2.000',
            'GPT-3.5 API': 'R$ 500-1.500',
            'Storage & Compute': 'R$ 300',
            'Total estimado': 'R$ 2.800-3.800/m√™s'
        }
        
        for item, valor in custos.items():
            print(f"   {item}: {valor}")

# Executando a an√°lise completa
consultor = ConsultorIA()

print("üöÄ CONSULTORIA IA: E-COMMERCE BRASILEIRO\n")

casos = ['reviews', 'chatbot', 'traducao', 'descricoes']

for caso in casos:
    consultor.analisar_caso(caso)
    print("\n" + "*"*70 + "\n")

consultor.resumo_arquitetura()

print("\nüéØ DICAS FINAIS:")
print("1. üß™ Sempre fa√ßa POC (Proof of Concept) antes")
print("2. üìä Me√ßa performance em dados reais brasileiros")
print("3. üîÑ Comece simples, evolua conforme necessidade")
print("4. üí∞ Monitore custos constantemente")
print("5. üõ°Ô∏è Considere privacidade e LGPD")

## üé≠ Resumo: O Grande Teatro dos LLMs

Liiindo! Chegamos ao final da nossa jornada pelo mundo dos tipos de modelos! üé™

### üéØ O que aprendemos:

#### üèóÔ∏è **Divis√£o Fundamental**
- **Modelos Base**: O "padeiro gen√©rico" que sabe o b√°sico
- **Modelos Especializados**: O "confeiteiro expert" focado em algo espec√≠fico

#### üèõÔ∏è **Arquiteturas (as ferramentas)**
- **Encoder-Only** üîç: A lupa - para analisar e entender
- **Decoder-Only** üéØ: A caneta - para criar e gerar
- **Encoder-Decoder** üîÑ: O tradutor - para transformar

#### üé® **Tipos Fundamentais**
- **Generativo**: O artista que cria do zero
- **Discriminativo**: O cr√≠tico que analisa e julga

#### üìè **Tamanhos e Capacidades**
- **Pequenos**: Carro compacto - econ√¥mico para o dia a dia
- **M√©dios**: SUV - equil√≠brio entre performance e praticidade
- **Grandes**: Caminh√£o - potente para trabalhos pesados
- **Gigantes**: Foguete - para miss√µes imposs√≠veis

#### üîß **Fine-tuning: A Especializa√ß√£o**
- Transformar generalista em especialista
- Instruction Tuning, RLHF, Domain-specific
- Como personalizar um carro para suas necessidades

### üéØ **Dicas de Ouro do Pedro:**

1. **Comece Simples**: Nem sempre precisa do GPT-4!
2. **Conhe√ßa seu Problema**: An√°lise ‚Üí Encoder, Gera√ß√£o ‚Üí Decoder, Transforma√ß√£o ‚Üí Encoder-Decoder
3. **Considere Recursos**: Tempo, dinheiro, infraestrutura
4. **Teste na Pr√°tica**: POC antes de produ√ß√£o
5. **Evolua Gradualmente**: Comece pequeno, cres√ßa conforme necessidade

### üîÆ **Preparando para o Pr√≥ximo M√≥dulo**

No **M√≥dulo 7 - Treinamento e Pre-treinamento**, vamos descobrir:
- Como esses modelos s√£o "nascidos" e "educados"
- O processo completo de treinamento
- Pre-training vs Fine-tuning em detalhes
- Custos e desafios do treinamento

**üé™ At√© a pr√≥xima, e lembra: cada modelo tem seu palco onde brilhar!**

In [None]:
# C√©lula final - Recapitula√ß√£o visual e pr√≥ximos passos
import matplotlib.pyplot as plt
import numpy as np
from matplotlib.patches import FancyBboxPatch

# Criando um mapa mental visual do que aprendemos
fig, ax = plt.subplots(figsize=(16, 12))

# Centro - Tipos de Modelos
centro = FancyBboxPatch((7, 5.5), 2, 1, boxstyle="round,pad=0.1", 
                       facecolor='gold', edgecolor='darkred', linewidth=3)
ax.add_patch(centro)
ax.text(8, 6, 'TIPOS DE\nMODELOS', ha='center', va='center', 
        fontsize=14, fontweight='bold')

# Categorias principais
categorias = [
    # (nome, x, y, cor, conte√∫do)
    ('ARQUITETURAS', 3, 9, 'lightblue', 'Encoder-Only\nDecoder-Only\nEncoder-Decoder'),
    ('TAMANHOS', 13, 9, 'lightgreen', 'Pequenos (<1B)\nM√©dios (1-10B)\nGrandes (10-100B)\nGigantes (>100B)'),
    ('TIPOS', 3, 3, 'lightcoral', 'Generativo\n(Cria)\nDiscriminativo\n(Analisa)'),
    ('ESPECIALIZA√á√ÉO', 13, 3, 'lightyellow', 'Base Models\nFine-tuned\nInstruction\nRLHF'),
]

for nome, x, y, cor, conteudo in categorias:
    # Caixa da categoria
    caixa = FancyBboxPatch((x-1, y-1), 2, 2, boxstyle="round,pad=0.1", 
                          facecolor=cor, edgecolor='navy', linewidth=2)
    ax.add_patch(caixa)
    
    # T√≠tulo da categoria
    ax.text(x, y+0.7, nome, ha='center', va='center', 
            fontsize=11, fontweight='bold')
    
    # Conte√∫do
    ax.text(x, y-0.2, conteudo, ha='center', va='center', 
            fontsize=9)
    
    # Seta para o centro
    ax.arrow(x, y-1 if y > 6 else y+1, 8-x, (5.5 if y < 6 else 6.5)-y, 
             head_width=0.1, head_length=0.1, fc='gray', ec='gray', alpha=0.5)

# Exemplos pr√°ticos nas laterais
exemplos_esq = ['BERT\n(An√°lise)', 'T5\n(Tradu√ß√£o)', 'GPT\n(Chat)']
exemplos_dir = ['BioBERT\n(Medicina)', 'CodeT5\n(C√≥digo)', 'FinBERT\n(Finan√ßas)']

for i, (esq, dir) in enumerate(zip(exemplos_esq, exemplos_dir)):
    y_pos = 8 - i * 2
    
    # Esquerda
    ax.text(0.5, y_pos, esq, ha='center', va='center', 
            fontsize=10, bbox=dict(boxstyle="round,pad=0.3", facecolor='lightpink'))
    
    # Direita
    ax.text(15.5, y_pos, dir, ha='center', va='center', 
            fontsize=10, bbox=dict(boxstyle="round,pad=0.3", facecolor='lightcyan'))

# T√≠tulo
ax.text(8, 11, 'üé≠ MAPA MENTAL: TIPOS DE MODELOS LLM', 
        ha='center', va='center', fontsize=18, fontweight='bold')

# Rodap√© com pr√≥ximos passos
ax.text(8, 0.5, 'üîÆ PR√ìXIMO: M√≥dulo 7 - Treinamento e Pre-treinamento', 
        ha='center', va='center', fontsize=12, style='italic', 
        bbox=dict(boxstyle="round,pad=0.5", facecolor='lavender'))

ax.set_xlim(-1, 17)
ax.set_ylim(0, 12)
ax.axis('off')

plt.tight_layout()
plt.show()

print("üéØ PARAB√âNS! Voc√™ completou o M√≥dulo 6!")
print("\nüìö CHECKLIST DO QUE VOC√ä APRENDEU:")
checklist = [
    "‚úÖ Diferen√ßa entre modelos base e especializados",
    "‚úÖ Tr√™s arquiteturas principais (Encoder/Decoder/Both)",
    "‚úÖ Generativo vs Discriminativo",
    "‚úÖ Impacto do tamanho nos modelos",
    "‚úÖ Processo de fine-tuning",
    "‚úÖ Como escolher modelo para cada tarefa",
    "‚úÖ Casos pr√°ticos de uso"
]

for item in checklist:
    print(f"   {item}")

print("\nüöÄ VOC√ä EST√Å PRONTO PARA:")
print("   ‚Ä¢ Escolher o modelo certo para cada projeto")
print("   ‚Ä¢ Entender custos e trade-offs")
print("   ‚Ä¢ Planejar arquiteturas de IA")
print("   ‚Ä¢ Aprender sobre treinamento (pr√≥ximo m√≥dulo!)")

print("\nüé™ At√© o pr√≥ximo m√≥dulo! Bora descobrir como esses modelos 'nascem'!")