# 🎭 O Grande Teatro dos LLMs: Conhecendo os Diferentes Tipos de Modelos

**Módulo 6 - Introdução à LLMs**

*Por Pedro Nunes Guth*

---

Bora! Chegou a hora de conhecer os diferentes "personagens" do mundo dos LLMs! 🎪

Tá, mas Pedro, por que "teatro"? Simples! Cada tipo de modelo tem sua especialidade, seu papel específico no palco da IA. É como uma companhia teatral: tem o protagonista, o coadjuvante, o especialista em comédia, o dramático... cada um brilha de um jeito!

Neste módulo vamos explorar:
- 🏗️ **Modelos Base vs. Modelos Especializados**
- 🎯 **Decoder-Only, Encoder-Only e Encoder-Decoder**
- 🚀 **Modelos Generativos vs. Discriminativos**
- 🔧 **Fine-tuning e Especialização**
- 📊 **Comparação de Performance**

In [None]:
# Setup inicial - Preparando nosso laboratório!
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
from IPython.display import display, Markdown, HTML
import warnings
warnings.filterwarnings('ignore')

# Configurações visuais
plt.style.use('seaborn-v0_8')
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

print("🎭 Ambiente configurado! Bora conhecer os tipos de modelos!")
print("📚 Lembra dos módulos anteriores:")
print("   • Transformers (Módulo 3)")
print("   • Tokens (Módulo 4)")
print("   • Embeddings (Módulo 5)")
print("Agora vamos ver como tudo isso se junta em diferentes tipos!")

## 🏗️ Modelos Base vs. Modelos Especializados

Tá, vamos começar com o básico! Imagina que você tem uma padaria:

- **Modelo Base**: É como um padeiro que sabe fazer pão básico muito bem, mas ainda não se especializou em nada específico
- **Modelo Especializado**: É o mesmo padeiro depois de fazer curso de confeitaria, agora ele faz bolos incríveis!

### Modelos Base (Foundation Models)

São os modelos "crus", treinados em grandes quantidades de texto para aprender padrões gerais da linguagem. Eles sabem:
- Completar frases
- Entender contexto básico
- Gerar texto coerente

**Exemplos**: GPT-3 base, LLaMA base, PaLM base

### Modelos Especializados (Fine-tuned Models)

São modelos base que passaram por treinamento adicional para tarefas específicas:
- **Instrução**: ChatGPT, Claude (seguem comandos)
- **Conversação**: Bard, Assistant models
- **Código**: CodeT5, GitHub Copilot
- **Domínio específico**: BioBERT (medicina), FinBERT (finanças)

**🎯 Dica do Pedro**: Pense assim - modelo base é como saber português, modelo especializado é como ser jornalista, advogado ou poeta!

In [None]:
# Vamos criar uma visualização dos tipos de modelos!
import matplotlib.pyplot as plt
from matplotlib.patches import Rectangle, FancyBboxPatch

fig, ax = plt.subplots(figsize=(14, 10))

# Modelo Base (Foundation)
base_box = FancyBboxPatch((1, 7), 4, 2, 
                         boxstyle="round,pad=0.1", 
                         facecolor='lightblue', 
                         edgecolor='navy', linewidth=2)
ax.add_patch(base_box)
ax.text(3, 8, 'MODELO BASE\n(Foundation)', ha='center', va='center', 
        fontsize=12, fontweight='bold')

# Modelos Especializados
specializations = [
    ('Chat/Instrução\n(ChatGPT)', 0.5, 4, 'lightgreen'),
    ('Código\n(Copilot)', 2.5, 4, 'lightyellow'),
    ('Domínio\n(BioBERT)', 4.5, 4, 'lightcoral'),
    ('Classificação\n(Sentiment)', 6.5, 4, 'lightpink')
]

for name, x, y, color in specializations:
    spec_box = FancyBboxPatch((x, y), 1.8, 1.5, 
                             boxstyle="round,pad=0.1", 
                             facecolor=color, 
                             edgecolor='darkred', linewidth=1.5)
    ax.add_patch(spec_box)
    ax.text(x + 0.9, y + 0.75, name, ha='center', va='center', 
            fontsize=10, fontweight='bold')
    
    # Setas do modelo base para especializados
    ax.arrow(3, 7, x + 0.9 - 3, y + 1.5 - 7, 
             head_width=0.1, head_length=0.1, 
             fc='gray', ec='gray', alpha=0.7)

# Título e labels
ax.text(4, 9.5, '🎭 Evolução dos Modelos: Do Geral ao Específico', 
        ha='center', va='center', fontsize=16, fontweight='bold')

ax.text(3, 6, 'Fine-tuning / Especialização', ha='center', va='center', 
        fontsize=12, style='italic', color='red')

ax.set_xlim(0, 8)
ax.set_ylim(3, 10)
ax.axis('off')

plt.tight_layout()
plt.show()

print("🎯 Liiindo! Viu como funciona a evolução?")
print("Base → Especialização = Padeiro → Confeiteiro!")

## 🏛️ Arquiteturas: Decoder-Only, Encoder-Only e Encoder-Decoder

Lembra do Módulo 3 sobre Transformers? Agora vamos ver como as diferentes partes são usadas!

Pensa no Transformer como uma fábrica com duas seções:
- **Encoder**: A seção que "entende" (lê e processa)
- **Decoder**: A seção que "produz" (gera e cria)

### 🔍 Encoder-Only (Só Entendimento)

**O que faz**: Especialista em entender e analisar texto
**Como funciona**: Lê todo o texto de uma vez, cria representações ricas
**Melhor para**: Classificação, análise de sentimento, Q&A

**Exemplo clássico**: BERT
- Lê "O filme foi _____ bom" 
- Entende o contexto todo
- Preenche a lacuna ou classifica sentimento

### 🎯 Decoder-Only (Só Geração)

**O que faz**: Especialista em gerar texto novo
**Como funciona**: Lê palavra por palavra, gera a próxima
**Melhor para**: Geração de texto, conversação, criação

**Exemplo clássico**: GPT família toda
- Lê "Era uma vez"
- Gera "uma princesa que vivia em um castelo..."

### 🔄 Encoder-Decoder (Transformação)

**O que faz**: Especialista em transformar um tipo de texto em outro
**Como funciona**: Encoder entende, Decoder produz algo diferente
**Melhor para**: Tradução, sumarização, conversão

**Exemplo clássico**: T5, mT5
- Encoder lê: "Hello world" (inglês)
- Decoder gera: "Olá mundo" (português)

In [None]:
# Vamos simular como cada arquitetura processa texto!

def simular_encoder_only(texto):
    """Simula um modelo Encoder-Only (como BERT)"""
    tokens = texto.split()
    print(f"🔍 ENCODER-ONLY processando: '{texto}'")
    print("📊 Análise:")
    
    # Simula análise de sentimento
    palavras_positivas = ['bom', 'ótimo', 'excelente', 'incrível', 'maravilhoso']
    palavras_negativas = ['ruim', 'péssimo', 'terrível', 'horrível', 'detesto']
    
    score = 0
    for palavra in tokens:
        if palavra.lower() in palavras_positivas:
            score += 1
        elif palavra.lower() in palavras_negativas:
            score -= 1
    
    if score > 0:
        sentimento = "😊 POSITIVO"
    elif score < 0:
        sentimento = "😞 NEGATIVO"
    else:
        sentimento = "😐 NEUTRO"
    
    print(f"   Sentimento: {sentimento}")
    print(f"   Confiança: {abs(score * 20)}%")
    return sentimento

def simular_decoder_only(prompt):
    """Simula um modelo Decoder-Only (como GPT)"""
    print(f"🎯 DECODER-ONLY gerando a partir de: '{prompt}'")
    
    # Simula geração baseada no prompt
    continuacoes = {
        "era uma vez": "uma princesa que vivia em um reino distante...",
        "python é": "uma linguagem de programação poderosa e versátil...",
        "inteligência artificial": "é uma área da computação que busca criar sistemas inteligentes...",
        "o futuro da tecnologia": "será moldado pela integração entre IA, IoT e computação quântica..."
    }
    
    prompt_lower = prompt.lower()
    continuacao = "será algo incrível e transformador para a humanidade!"
    
    for key, value in continuacoes.items():
        if key in prompt_lower:
            continuacao = value
            break
    
    print(f"✨ Geração: {continuacao}")
    return continuacao

def simular_encoder_decoder(texto_origem, tarefa):
    """Simula um modelo Encoder-Decoder (como T5)"""
    print(f"🔄 ENCODER-DECODER - Tarefa: {tarefa}")
    print(f"📥 Entrada: '{texto_origem}'")
    
    if tarefa == "tradução":
        traducoes = {
            "hello world": "olá mundo",
            "good morning": "bom dia",
            "artificial intelligence": "inteligência artificial",
            "machine learning": "aprendizado de máquina"
        }
        resultado = traducoes.get(texto_origem.lower(), "tradução não encontrada")
    
    elif tarefa == "sumarização":
        if len(texto_origem.split()) > 5:
            resultado = " ".join(texto_origem.split()[:5]) + "..."
        else:
            resultado = "Texto já está resumido"
    
    else:
        resultado = "Tarefa não reconhecida"
    
    print(f"📤 Resultado: '{resultado}'")
    return resultado

# Testando as três arquiteturas!
print("🧪 LABORATÓRIO DAS ARQUITETURAS\n")

# Teste 1: Encoder-Only
simular_encoder_only("Este filme foi realmente incrível")
print("\n" + "="*50 + "\n")

# Teste 2: Decoder-Only
simular_decoder_only("Python é")
print("\n" + "="*50 + "\n")

# Teste 3: Encoder-Decoder
simular_encoder_decoder("hello world", "tradução")
print("\n🎭 Cada arquitetura tem sua especialidade!")

```mermaid
graph TD
    A[Texto de Entrada] --> B{Que tipo de tarefa?}
    
    B -->|Entender/Classificar| C[Encoder-Only]
    B -->|Gerar/Criar| D[Decoder-Only] 
    B -->|Transformar/Traduzir| E[Encoder-Decoder]
    
    C --> F["🔍 Análise<br/>Sentimento<br/>Classificação<br/>Q&A"]
    D --> G["🎯 Geração<br/>Chat<br/>Continuação<br/>Criação"]
    E --> H["🔄 Transformação<br/>Tradução<br/>Sumarização<br/>Conversão"]
    
    F --> I[BERT, RoBERTa]
    G --> J[GPT, LLaMA]
    H --> K[T5, BART]
```

In [None]:
# Vamos criar uma comparação visual das arquiteturas!
fig, axes = plt.subplots(1, 3, figsize=(18, 6))

# Cores para cada arquitetura
cores = ['lightblue', 'lightgreen', 'lightcoral']
arquiteturas = ['Encoder-Only', 'Decoder-Only', 'Encoder-Decoder']
exemplos = ['BERT\nRoBERTa\nDeBERTa', 'GPT-3/4\nLLaMA\nPaLM', 'T5\nBART\nmT5']
tarefas = ['• Classificação\n• Análise Sentimento\n• Q&A\n• NER', 
          '• Geração de Texto\n• Chat\n• Completar\n• Criação',
          '• Tradução\n• Sumarização\n• Paráfrase\n• Conversão']

for i, (arq, ex, tar, cor) in enumerate(zip(arquiteturas, exemplos, tarefas, cores)):
    ax = axes[i]
    
    # Fundo colorido
    ax.add_patch(Rectangle((0, 0), 1, 1, facecolor=cor, alpha=0.3))
    
    # Título da arquitetura
    ax.text(0.5, 0.9, arq, ha='center', va='center', 
            fontsize=14, fontweight='bold', transform=ax.transAxes)
    
    # Exemplos de modelos
    ax.text(0.5, 0.7, ex, ha='center', va='center', 
            fontsize=12, fontweight='bold', color='navy',
            transform=ax.transAxes)
    
    # Tarefas principais
    ax.text(0.5, 0.4, tar, ha='center', va='center', 
            fontsize=10, transform=ax.transAxes)
    
    ax.set_xlim(0, 1)
    ax.set_ylim(0, 1)
    ax.axis('off')
    
    # Borda
    for spine in ax.spines.values():
        spine.set_visible(True)
        spine.set_linewidth(2)
        spine.set_color('navy')

plt.suptitle('🏛️ As Três Grandes Arquiteturas dos LLMs', 
             fontsize=16, fontweight='bold', y=0.95)

plt.tight_layout()
plt.show()

print("🎯 Dica do Pedro: Cada arquitetura é como uma ferramenta específica!")
print("🔍 Encoder-Only = Lupa (para analisar)")
print("🎯 Decoder-Only = Caneta (para criar)")
print("🔄 Encoder-Decoder = Tradutor (para transformar)")

## 🎨 Modelos Generativos vs. Discriminativos

Tá, agora vamos falar de uma diferença fundamental! É como a diferença entre um artista e um crítico de arte:

### 🎨 Modelos Generativos

**O que fazem**: Criam conteúdo novo do zero
**Como pensam**: "Vou criar algo baseado no que aprendi"
**Analogia**: Escritor criando um livro

**Características**:
- Aprendem a distribuição dos dados
- Conseguem gerar amostras novas
- Podem ser criativos e surpreendentes
- Mais complexos computacionalmente

**Exemplos**: GPT-4, DALL-E, Stable Diffusion

### 🔍 Modelos Discriminativos

**O que fazem**: Classificam e categorizam conteúdo existente
**Como pensam**: "Vou analisar e decidir em qual categoria isso se encaixa"
**Analogia**: Crítico avaliando uma obra

**Características**:
- Aprendem fronteiras entre classes
- Focam em distinção e classificação
- Mais eficientes para tarefas específicas
- Geralmente mais rápidos

**Exemplos**: BERT para classificação, modelos de sentiment analysis

**🎯 Dica do Pedro**: Generativo = "Vou criar!", Discriminativo = "Vou julgar!"

In [None]:
# Vamos simular a diferença entre modelos generativos e discriminativos
import random

class ModeloGenerativo:
    """Simula um modelo generativo simples"""
    
    def __init__(self):
        # "Aprendeu" padrões de diferentes tipos de texto
        self.padroes = {
            'poesia': ['verso', 'rima', 'alma', 'coração', 'lua', 'estrela'],
            'tecnologia': ['algoritmo', 'dados', 'rede', 'sistema', 'código', 'digital'],
            'culinaria': ['receita', 'ingrediente', 'sabor', 'tempero', 'cozinha', 'prato']
        }
    
    def gerar_texto(self, categoria, tamanho=5):
        """Gera texto novo baseado nos padrões aprendidos"""
        palavras = self.padroes.get(categoria, ['palavra', 'genérica'])
        texto_gerado = []
        
        for _ in range(tamanho):
            palavra = random.choice(palavras)
            texto_gerado.append(palavra)
        
        return ' '.join(texto_gerado)

class ModeloDiscriminativo:
    """Simula um modelo discriminativo simples"""
    
    def __init__(self):
        # "Aprendeu" a distinguir entre categorias
        self.palavras_chave = {
            'poesia': ['verso', 'rima', 'alma', 'coração', 'lua', 'estrela'],
            'tecnologia': ['algoritmo', 'dados', 'rede', 'sistema', 'código', 'digital'],
            'culinaria': ['receita', 'ingrediente', 'sabor', 'tempero', 'cozinha', 'prato']
        }
    
    def classificar_texto(self, texto):
        """Classifica texto em uma das categorias"""
        palavras = texto.lower().split()
        pontuacoes = {}
        
        for categoria, chaves in self.palavras_chave.items():
            pontuacao = sum(1 for palavra in palavras if palavra in chaves)
            pontuacoes[categoria] = pontuacao
        
        categoria_predita = max(pontuacoes, key=pontuacoes.get)
        confianca = pontuacoes[categoria_predita] / len(palavras) * 100
        
        return categoria_predita, confianca

# Testando os dois tipos!
print("🧪 LABORATÓRIO: GENERATIVO vs DISCRIMINATIVO\n")

# Criando os modelos
gerador = ModeloGenerativo()
classificador = ModeloDiscriminativo()

print("🎨 MODELO GENERATIVO em ação:")
print("=" * 40)

for categoria in ['poesia', 'tecnologia', 'culinaria']:
    texto_gerado = gerador.gerar_texto(categoria)
    print(f"📝 Gerando {categoria}: '{texto_gerado}'")

print("\n🔍 MODELO DISCRIMINATIVO em ação:")
print("=" * 40)

textos_teste = [
    "o algoritmo processa dados na rede",
    "a lua brilha no verso da alma",
    "a receita leva tempero e sabor"
]

for texto in textos_teste:
    categoria, confianca = classificador.classificar_texto(texto)
    print(f"📊 Texto: '{texto}'")
    print(f"    Categoria: {categoria} (confiança: {confianca:.1f}%)\n")

print("✨ Resumo:")
print("🎨 Generativo: CRIA conteúdo novo")
print("🔍 Discriminativo: ANALISA conteúdo existente")

## 🎯 Modelos por Tamanho e Capacidade

Agora vamos falar de tamanho! E não, não é só "quanto maior, melhor". É mais como escolher o carro certo para cada situação:

### 🚗 Modelos Pequenos (< 1B parâmetros)
**Analogia**: Carro compacto - econômico e eficiente para o dia a dia
- **Vantagens**: Rápidos, baratos, rodam localmente
- **Desvantagens**: Menos "inteligentes", conhecimento limitado
- **Exemplos**: DistilBERT, TinyBERT, modelos mobile

### 🚙 Modelos Médios (1B - 10B parâmetros)
**Analogia**: SUV - bom equilíbrio entre performance e praticidade
- **Vantagens**: Boa performance, custo razoável
- **Desvantagens**: Ainda limitados para tarefas complexas
- **Exemplos**: BERT-base, GPT-2, alguns modelos LLaMA

### 🚛 Modelos Grandes (10B - 100B parâmetros)
**Analogia**: Caminhão - potente para trabalhos pesados
- **Vantagens**: Muito capaz, conhecimento amplo
- **Desvantagens**: Caro, lento, precisa de infraestrutura
- **Exemplos**: GPT-3, PaLM, alguns LLaMA

### 🚀 Modelos Gigantes (> 100B parâmetros)
**Analogia**: Foguete - para missões impossíveis
- **Vantagens**: Estado da arte, capacidades emergentes
- **Desvantagens**: Extremamente caro e complexo
- **Exemplos**: GPT-4, PaLM-2, Gemini Ultra

**🎯 Dica do Pedro**: O segredo é escolher o tamanho certo para sua tarefa! Não precisa de foguete para ir ao mercado!

In [None]:
# Vamos criar uma visualização dos tamanhos e custos!
import numpy as np

# Dados dos modelos (aproximados)
modelos = {
    'DistilBERT': {'params': 0.066, 'performance': 75, 'custo': 1, 'velocidade': 95},
    'BERT-base': {'params': 0.11, 'performance': 80, 'custo': 2, 'velocidade': 85},
    'GPT-2': {'params': 1.5, 'performance': 82, 'custo': 5, 'velocidade': 75},
    'LLaMA-7B': {'params': 7, 'performance': 85, 'custo': 15, 'velocidade': 60},
    'GPT-3': {'params': 175, 'performance': 90, 'custo': 100, 'velocidade': 30},
    'GPT-4': {'params': 1000, 'performance': 95, 'custo': 500, 'velocidade': 15}
}

# Extraindo dados para visualização
nomes = list(modelos.keys())
params = [modelos[nome]['params'] for nome in nomes]
performance = [modelos[nome]['performance'] for nome in nomes]
custo = [modelos[nome]['custo'] for nome in nomes]
velocidade = [modelos[nome]['velocidade'] for nome in nomes]

# Criando visualização com múltiplos subplots
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(16, 12))

# 1. Parâmetros vs Performance
scatter = ax1.scatter(params, performance, s=[c*5 for c in custo], 
                    c=velocidade, cmap='RdYlGn', alpha=0.7)
ax1.set_xscale('log')
ax1.set_xlabel('Parâmetros (B)')
ax1.set_ylabel('Performance (%)')
ax1.set_title('🎯 Parâmetros vs Performance')
ax1.grid(True, alpha=0.3)

# Adicionando labels
for i, nome in enumerate(nomes):
    ax1.annotate(nome, (params[i], performance[i]), 
                xytext=(5, 5), textcoords='offset points', fontsize=9)

# 2. Custo vs Performance
ax2.bar(nomes, custo, color=['lightblue' if c < 10 else 'orange' if c < 100 else 'red' 
                            for c in custo])
ax2.set_yscale('log')
ax2.set_ylabel('Custo Relativo')
ax2.set_title('💰 Custo por Modelo')
ax2.tick_params(axis='x', rotation=45)

# 3. Velocidade vs Tamanho
ax3.plot(params, velocidade, 'ro-', linewidth=2, markersize=8)
ax3.set_xscale('log')
ax3.set_xlabel('Parâmetros (B)')
ax3.set_ylabel('Velocidade Relativa')
ax3.set_title('⚡ Velocidade vs Tamanho')
ax3.grid(True, alpha=0.3)

# 4. Radar chart das características
# Escolhendo 3 modelos representativos
modelos_radar = ['DistilBERT', 'LLaMA-7B', 'GPT-4']
categorias = ['Performance', 'Velocidade', 'Eficiência\n(inverso do custo)']

angles = np.linspace(0, 2 * np.pi, len(categorias), endpoint=False).tolist()
angles += angles[:1]  # Fechando o círculo

ax4 = plt.subplot(2, 2, 4, projection='polar')

for modelo in modelos_radar:
    valores = [
        modelos[modelo]['performance'],
        modelos[modelo]['velocidade'],
        100 - modelos[modelo]['custo']  # Inverso do custo = eficiência
    ]
    valores += valores[:1]  # Fechando o círculo
    
    ax4.plot(angles, valores, 'o-', linewidth=2, label=modelo)
    ax4.fill(angles, valores, alpha=0.1)

ax4.set_xticks(angles[:-1])
ax4.set_xticklabels(categorias)
ax4.set_ylim(0, 100)
ax4.set_title('📊 Comparação Multi-dimensional')
ax4.legend(loc='upper right', bbox_to_anchor=(1.3, 1.0))

plt.tight_layout()
plt.show()

print("🎯 Insights importantes:")
print("📈 Mais parâmetros = Melhor performance (mas nem sempre vale a pena!)")
print("💰 Custo cresce exponencialmente com o tamanho")
print("⚡ Velocidade diminui drasticamente com mais parâmetros")
print("🎪 Cada modelo tem seu 'sweet spot' para diferentes usos!")

## 🔧 Fine-tuning e Especialização

Agora vamos falar do processo que transforma um modelo "genérico" em um especialista! É como pegar um médico recém-formado e fazer ele se especializar em cardiologia.

### O que é Fine-tuning?

É pegar um modelo já treinado (que custou milhões para treinar) e dar um "cursinho" específico para ele ficar expert em algo.

**Processo**:
1. **Modelo Base**: Já sabe linguagem em geral
2. **Dataset Específico**: Dados da tarefa que queremos
3. **Treinamento Adicional**: Algumas épocas de ajuste fino
4. **Modelo Especializado**: Expert na nova tarefa!

### Tipos de Fine-tuning

#### 🎯 **Instruction Tuning**
- **O que é**: Ensina o modelo a seguir instruções
- **Dataset**: Pares de (instrução, resposta esperada)
- **Resultado**: ChatGPT, Claude, Bard
- **Exemplo**: "Resuma este texto" → modelo aprende a resumir

#### 🏆 **RLHF (Reinforcement Learning from Human Feedback)**
- **O que é**: Usa feedback humano para melhorar respostas
- **Processo**: Humanos rankeiam respostas, modelo aprende o que é "melhor"
- **Resultado**: Modelos mais alinhados e úteis
- **Exemplo**: GPT-4 usa muito RLHF

#### 🎨 **Domain-Specific Fine-tuning**
- **O que é**: Especialização em uma área específica
- **Exemplos**: 
  - BioBERT (medicina)
  - FinBERT (finanças)
  - CodeT5 (programação)
  - LegalBERT (direito)

**🎯 Dica do Pedro**: Fine-tuning é como personalizar um carro - você pega a base e adapta para suas necessidades específicas!

In [None]:
# Vamos simular o processo de fine-tuning!
import random
import matplotlib.pyplot as plt

class ModeloBase:
    """Simula um modelo base genérico"""
    
    def __init__(self):
        self.conhecimento_geral = {
            'linguagem': 85,
            'contexto': 80,
            'coerencia': 75
        }
        self.especializacoes = {}  # Começa sem especializações
    
    def responder_generico(self, pergunta):
        """Resposta genérica sem especialização"""
        respostas_genericas = [
            "Essa é uma pergunta interessante sobre {}",
            "Posso tentar ajudar com informações gerais sobre {}",
            "Com base no meu conhecimento geral, {} é um tópico complexo"
        ]
        return random.choice(respostas_genericas).format(pergunta)

class ModeloEspecializado(ModeloBase):
    """Simula um modelo após fine-tuning"""
    
    def __init__(self, especializacao):
        super().__init__()
        self.especializacao = especializacao
        self.fazer_fine_tuning()
    
    def fazer_fine_tuning(self):
        """Simula o processo de fine-tuning"""
        print(f"🔧 Iniciando fine-tuning para {self.especializacao}...")
        
        # Define conhecimentos específicos por área
        especializacoes_data = {
            'medicina': {
                'diagnostico': 90,
                'sintomas': 88,
                'tratamentos': 85,
                'respostas': {
                    'dor de cabeça': 'Pode ser tensional, enxaqueca ou sinusite. Recomendo avaliação médica.',
                    'febre': 'Sinal de infecção. Hidratação e antipirético podem ajudar.',
                    'diabetes': 'Doença metabólica que requer controle glicêmico e acompanhamento.'
                }
            },
            'programacao': {
                'sintaxe': 95,
                'algoritmos': 90,
                'debugging': 87,
                'respostas': {
                    'python': 'Linguagem versátil, ideal para IA, web e automação.',
                    'bug': 'Use print statements, debugger ou testes unitários para identificar.',
                    'algoritmo': 'Sequência de passos para resolver um problema computacional.'
                }
            },
            'culinaria': {
                'receitas': 92,
                'ingredientes': 89,
                'tecnicas': 86,
                'respostas': {
                    'bolo': 'Misture ingredientes secos, adicione líquidos, asse a 180°C.',
                    'tempero': 'Sal, pimenta, alho e cebola são bases universais.',
                    'massa': 'Farinha, ovos e água. Sove bem e deixe descansar.'
                }
            }
        }
        
        if self.especializacao in especializacoes_data:
            self.especializacoes = especializacoes_data[self.especializacao]
            print(f"✅ Fine-tuning concluído! Especialização em {self.especializacao}")
        else:
            print(f"❌ Especialização {self.especializacao} não disponível")
    
    def responder_especializado(self, pergunta):
        """Resposta especializada após fine-tuning"""
        pergunta_lower = pergunta.lower()
        
        # Procura por palavras-chave especializadas
        if 'respostas' in self.especializacoes:
            for keyword, resposta in self.especializacoes['respostas'].items():
                if keyword in pergunta_lower:
                    return f"[ESPECIALISTA {self.especializacao.upper()}]: {resposta}"
        
        # Se não encontrou, usa conhecimento geral melhorado
        return f"[{self.especializacao.upper()}]: Com minha especialização, posso dizer que {pergunta} é um tópico que requer análise detalhada."

# Demonstração do fine-tuning
print("🧪 LABORATÓRIO: ANTES vs DEPOIS DO FINE-TUNING\n")

# Modelo base (genérico)
modelo_base = ModeloBase()
print("🤖 MODELO BASE (sem especialização):")
print("=" * 50)

perguntas_teste = ['diabetes', 'python', 'bolo']
for pergunta in perguntas_teste:
    resposta = modelo_base.responder_generico(pergunta)
    print(f"❓ {pergunta}: {resposta}")

print("\n" + "="*70 + "\n")

# Modelos especializados
especializacoes = ['medicina', 'programacao', 'culinaria']
perguntas_especializada = ['diabetes', 'python', 'bolo']

for i, (spec, pergunta) in enumerate(zip(especializacoes, perguntas_especializada)):
    print(f"🎯 MODELO ESPECIALIZADO ({spec.upper()}):")
    modelo_especializado = ModeloEspecializado(spec)
    resposta = modelo_especializado.responder_especializado(pergunta)
    print(f"❓ {pergunta}: {resposta}\n")

print("✨ Resumo:")
print("🤖 Base: Conhecimento amplo mas superficial")
print("🎯 Especializado: Conhecimento focado e profundo")
print("🔧 Fine-tuning = Transformar generalista em especialista!")

```mermaid
graph LR
    A[Modelo Base<br/>GPT-3] --> B[Dataset<br/>Especializado]
    B --> C[Fine-tuning<br/>Process]
    C --> D[Modelo<br/>Especializado]
    
    B1["📚 Instruction<br/>Dataset"] --> C
    B2["👨‍⚕️ Medical<br/>Dataset"] --> C
    B3["💻 Code<br/>Dataset"] --> C
    
    D --> E1["🤖 ChatGPT<br/>(Instructions)"]
    D --> E2["⚕️ BioBERT<br/>(Medicine)"]
    D --> E3["💻 CodeT5<br/>(Programming)"]
```

In [None]:
# Vamos visualizar o impacto do fine-tuning na performance!
import numpy as np

# Dados simulados de performance antes e depois do fine-tuning
tarefas = ['Classificação\nSentimento', 'Geração\nCódigo', 'Diagnóstico\nMédico', 
          'Tradução', 'Sumarização', 'Q&A Específico']

# Performance do modelo base (genérico)
perf_base = [65, 45, 40, 70, 60, 50]

# Performance após fine-tuning específico
perf_finetuned = [88, 85, 82, 90, 85, 87]

# Criando visualização comparativa
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 8))

# Gráfico 1: Comparação lado a lado
x = np.arange(len(tarefas))
width = 0.35

bars1 = ax1.bar(x - width/2, perf_base, width, label='Modelo Base', 
               color='lightcoral', alpha=0.8)
bars2 = ax1.bar(x + width/2, perf_finetuned, width, label='Após Fine-tuning', 
               color='lightgreen', alpha=0.8)

ax1.set_xlabel('Tarefas')
ax1.set_ylabel('Performance (%)')
ax1.set_title('🎯 Impacto do Fine-tuning na Performance')
ax1.set_xticks(x)
ax1.set_xticklabels(tarefas, rotation=45, ha='right')
ax1.legend()
ax1.grid(True, alpha=0.3)

# Adicionando valores nas barras
for bar in bars1:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height + 1,
             f'{height}%', ha='center', va='bottom', fontsize=9)

for bar in bars2:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height + 1,
             f'{height}%', ha='center', va='bottom', fontsize=9)

# Gráfico 2: Ganho percentual
ganho = [(f - b) / b * 100 for f, b in zip(perf_finetuned, perf_base)]
cores_ganho = ['green' if g > 50 else 'orange' if g > 25 else 'red' for g in ganho]

bars3 = ax2.bar(tarefas, ganho, color=cores_ganho, alpha=0.7)
ax2.set_xlabel('Tarefas')
ax2.set_ylabel('Ganho de Performance (%)')
ax2.set_title('📈 Ganho Relativo com Fine-tuning')
ax2.tick_params(axis='x', rotation=45)
ax2.grid(True, alpha=0.3)

# Linha de referência
ax2.axhline(y=50, color='red', linestyle='--', alpha=0.7, label='50% de ganho')
ax2.legend()

# Adicionando valores
for bar, valor in zip(bars3, ganho):
    height = bar.get_height()
    ax2.text(bar.get_x() + bar.get_width()/2., height + 2,
             f'+{valor:.0f}%', ha='center', va='bottom', fontsize=10, fontweight='bold')

plt.tight_layout()
plt.show()

# Análise dos resultados
print("🎯 ANÁLISE DOS RESULTADOS:")
print("=" * 40)
ganho_medio = np.mean(ganho)
melhor_ganho = max(ganho)
pior_ganho = min(ganho)

print(f"📊 Ganho médio: {ganho_medio:.1f}%")
print(f"🏆 Melhor ganho: {melhor_ganho:.1f}% ({tarefas[ganho.index(melhor_ganho)]})")
print(f"🤔 Menor ganho: {pior_ganho:.1f}% ({tarefas[ganho.index(pior_ganho)]})")
print(f"\n✨ Conclusão: Fine-tuning pode dobrar a performance em tarefas específicas!")
print(f"🎯 Dica do Pedro: Vale muito a pena especializar quando você tem uma tarefa específica!")

## 🏆 Comparação Prática: Qual Modelo Usar Quando?

Tá, Pedro, mas na prática, qual modelo eu uso para cada situação? Bora criar um guia prático!

### 🎯 Guia de Escolha por Caso de Uso

#### 📝 **Para Análise de Texto**
- **Classificação de Sentimento**: BERT, RoBERTa (Encoder-Only)
- **Detecção de Spam**: Modelos pequenos especializados
- **Análise de Tópicos**: BERT + clustering
- **Extração de Entidades**: spaCy + BERT

#### 🤖 **Para Geração de Conteúdo**
- **Chat/Conversação**: GPT-4, Claude, Bard
- **Criação de Artigos**: GPT-3.5/4 + prompting
- **Copywriting**: Modelos instruction-tuned
- **Poesia/Criatividade**: Modelos grandes generativos

#### 🔄 **Para Transformação de Texto**
- **Tradução**: T5, mT5, modelos específicos (Google Translate)
- **Sumarização**: BART, T5, Pegasus
- **Paráfrase**: T5 fine-tuned
- **Correção Gramatical**: T5 + datasets específicos

#### 💻 **Para Código**
- **Geração**: GitHub Copilot, CodeT5, StarCoder
- **Revisão**: CodeBERT especializados
- **Documentação**: GPT-4 + prompting específico
- **Debug**: Modelos treinados em bugs/fixes

#### 🏢 **Para Domínios Específicos**
- **Medicina**: BioBERT, ClinicalBERT, Med-PaLM
- **Finanças**: FinBERT, BloombergGPT
- **Direito**: LegalBERT, modelos específicos
- **Ciência**: SciBERT, Galactica

**🎯 Dica do Pedro**: Sempre comece com o mais simples que resolve seu problema!

In [None]:
# Vamos criar um sistema de recomendação de modelos!
class RecomendadorModelos:
    """Sistema inteligente para recomendar o melhor modelo para cada caso"""
    
    def __init__(self):
        self.modelos_db = {
            # Modelos para análise
            'analise': {
                'BERT-base': {
                    'tipo': 'Encoder-Only',
                    'tamanho': 'Médio (110M)',
                    'velocidade': 'Rápida',
                    'custo': 'Baixo',
                    'casos': ['classificação', 'sentimento', 'qa'],
                    'pros': ['Boa performance', 'Eficiente', 'Bem documentado'],
                    'contras': ['Não gera texto', 'Limitado a 512 tokens']
                },
                'RoBERTa': {
                    'tipo': 'Encoder-Only',
                    'tamanho': 'Médio (125M)',
                    'velocidade': 'Rápida',
                    'custo': 'Baixo',
                    'casos': ['classificação', 'análise', 'ner'],
                    'pros': ['Melhor que BERT', 'Robusto', 'Estado da arte'],
                    'contras': ['Maior que BERT', 'Só análise']
                }
            },
            
            # Modelos para geração
            'geracao': {
                'GPT-3.5-turbo': {
                    'tipo': 'Decoder-Only',
                    'tamanho': 'Grande (~20B)',
                    'velocidade': 'Média',
                    'custo': 'Médio',
                    'casos': ['chat', 'geração', 'criatividade'],
                    'pros': ['Versátil', 'Boa qualidade', 'API fácil'],
                    'contras': ['Pago', 'Online only', 'Alucinações']
                },
                'LLaMA-7B': {
                    'tipo': 'Decoder-Only',
                    'tamanho': 'Médio (7B)',
                    'velocidade': 'Média',
                    'custo': 'Médio',
                    'casos': ['geração', 'chat', 'fine-tuning'],
                    'pros': ['Open source', 'Boa qualidade', 'Customizável'],
                    'contras': ['Precisa GPU', 'Setup complexo']
                }
            },
            
            # Modelos para transformação
            'transformacao': {
                'T5-base': {
                    'tipo': 'Encoder-Decoder',
                    'tamanho': 'Médio (220M)',
                    'velocidade': 'Média',
                    'custo': 'Médio',
                    'casos': ['tradução', 'sumarização', 'qa'],
                    'pros': ['Versátil', 'Text-to-text', 'Bem treinado'],
                    'contras': ['Complexo', 'Precisa fine-tuning']
                },
                'BART': {
                    'tipo': 'Encoder-Decoder',
                    'tamanho': 'Médio (140M)',
                    'velocidade': 'Rápida',
                    'custo': 'Baixo',
                    'casos': ['sumarização', 'paráfrase'],
                    'pros': ['Ótimo para resumos', 'Eficiente'],
                    'contras': ['Limitado em domínio']
                }
            }
        }
    
    def recomendar(self, tarefa, orcamento='médio', velocidade_necessaria='média'):
        """Recomenda o melhor modelo baseado nos critérios"""
        print(f"🎯 RECOMENDAÇÃO PARA: {tarefa.upper()}")
        print(f"💰 Orçamento: {orcamento} | ⚡ Velocidade: {velocidade_necessaria}")
        print("=" * 60)
        
        # Mapeia tarefas para categorias
        mapa_tarefas = {
            'classificação': 'analise',
            'sentimento': 'analise',
            'ner': 'analise',
            'qa': 'analise',
            'chat': 'geracao',
            'geração': 'geracao',
            'criatividade': 'geracao',
            'tradução': 'transformacao',
            'sumarização': 'transformacao',
            'paráfrase': 'transformacao'
        }
        
        categoria = mapa_tarefas.get(tarefa, 'geracao')
        modelos_categoria = self.modelos_db[categoria]
        
        # Filtra modelos baseado nos critérios
        recomendacoes = []
        
        for nome, info in modelos_categoria.items():
            if tarefa in info['casos']:
                score = self._calcular_score(info, orcamento, velocidade_necessaria)
                recomendacoes.append((nome, info, score))
        
        # Ordena por score
        recomendacoes.sort(key=lambda x: x[2], reverse=True)
        
        # Apresenta as recomendações
        for i, (nome, info, score) in enumerate(recomendacoes[:3]):
            emoji = "🥇" if i == 0 else "🥈" if i == 1 else "🥉"
            print(f"{emoji} **{nome}** (Score: {score:.1f}/10)")
            print(f"   📊 {info['tipo']} | {info['tamanho']} | {info['velocidade']} | {info['custo']}")
            print(f"   ✅ Pros: {', '.join(info['pros'])}")
            print(f"   ⚠️  Contras: {', '.join(info['contras'])}")
            print()
        
        return recomendacoes[0][0] if recomendacoes else None
    
    def _calcular_score(self, info, orcamento, velocidade):
        """Calcula score baseado nos critérios"""
        score = 5.0  # Base
        
        # Ajuste por orçamento
        if orcamento == 'baixo' and info['custo'] == 'Baixo':
            score += 2
        elif orcamento == 'alto' and info['custo'] == 'Alto':
            score += 1
        elif orcamento != info['custo'].lower():
            score -= 1
        
        # Ajuste por velocidade
        if velocidade == 'rápida' and info['velocidade'] == 'Rápida':
            score += 2
        elif velocidade != info['velocidade'].lower():
            score -= 0.5
        
        return min(10, max(0, score))

# Testando o sistema de recomendação!
recomendador = RecomendadorModelos()

print("🤖 SISTEMA DE RECOMENDAÇÃO DE MODELOS\n")

# Casos de teste
casos_teste = [
    ('sentimento', 'baixo', 'rápida'),
    ('chat', 'médio', 'média'),
    ('sumarização', 'baixo', 'média')
]

for tarefa, orcamento, velocidade in casos_teste:
    melhor_modelo = recomendador.recomendar(tarefa, orcamento, velocidade)
    print(f"🎯 Melhor escolha: {melhor_modelo}")
    print("\n" + "="*70 + "\n")

print("✨ Dica do Pedro: Use este sistema como ponto de partida!")
print("🧪 Sempre teste na prática para validar a escolha!")

## 🧪 Exercício Prático 1: Classificação de Modelos

**Desafio**: Dado um conjunto de modelos e suas características, classifique-os nas categorias corretas!

Vou te dar as características, você me diz:
1. Arquitetura (Encoder-Only, Decoder-Only, Encoder-Decoder)
2. Tipo (Generativo ou Discriminativo)
3. Melhor caso de uso

**🎯 Dica do Pedro**: Lembra das características que aprendemos!

In [None]:
# EXERCÍCIO 1: Sistema de Quiz sobre Tipos de Modelos
import random

class QuizModelos:
    def __init__(self):
        self.perguntas = [
            {
                'modelo': 'DistilBERT',
                'características': ['Lê texto completo de uma vez', 'Excelente para classificação', 'Não gera texto novo', 'Menor que BERT original'],
                'arquitetura': 'Encoder-Only',
                'tipo': 'Discriminativo',
                'uso': 'Análise de sentimento'
            },
            {
                'modelo': 'GPT-2',
                'características': ['Gera uma palavra por vez', 'Excelente para criar histórias', 'Lê da esquerda para direita', 'Pode continuar qualquer texto'],
                'arquitetura': 'Decoder-Only',
                'tipo': 'Generativo',
                'uso': 'Geração de texto'
            },
            {
                'modelo': 'T5',
                'características': ['Transforma um texto em outro', 'Ótimo para tradução', 'Usa formato "text-to-text"', 'Tem encoder e decoder'],
                'arquitetura': 'Encoder-Decoder',
                'tipo': 'Generativo',
                'uso': 'Tradução'
            },
            {
                'modelo': 'RoBERTa',
                'características': ['Versão melhorada do BERT', 'Apenas analisa, não gera', 'Bidirecional', 'Ótimo para Q&A'],
                'arquitetura': 'Encoder-Only',
                'tipo': 'Discriminativo',
                'uso': 'Question Answering'
            }
        ]
        self.pontuacao = 0
        self.total_perguntas = 0
    
    def fazer_pergunta(self, pergunta_data):
        print(f"🤖 MODELO: {pergunta_data['modelo']}")
        print("📋 CARACTERÍSTICAS:")
        for i, carac in enumerate(pergunta_data['características'], 1):
            print(f"   {i}. {carac}")
        print()
        
        # Pergunta 1: Arquitetura
        print("❓ Qual a arquitetura deste modelo?")
        print("   A) Encoder-Only")
        print("   B) Decoder-Only")
        print("   C) Encoder-Decoder")
        
        resposta_arq = input("Sua resposta (A/B/C): ").upper().strip()
        arquiteturas = {'A': 'Encoder-Only', 'B': 'Decoder-Only', 'C': 'Encoder-Decoder'}
        
        if arquiteturas.get(resposta_arq) == pergunta_data['arquitetura']:
            print("✅ Correto!")
            self.pontuacao += 1
        else:
            print(f"❌ Incorreto. Resposta: {pergunta_data['arquitetura']}")
        
        # Pergunta 2: Tipo
        print("\n❓ Este modelo é:")
        print("   A) Generativo (cria conteúdo novo)")
        print("   B) Discriminativo (classifica/analisa)")
        
        resposta_tipo = input("Sua resposta (A/B): ").upper().strip()
        tipos = {'A': 'Generativo', 'B': 'Discriminativo'}
        
        if tipos.get(resposta_tipo) == pergunta_data['tipo']:
            print("✅ Correto!")
            self.pontuacao += 1
        else:
            print(f"❌ Incorreto. Resposta: {pergunta_data['tipo']}")
        
        self.total_perguntas += 2
        print(f"\n📊 Pontuação atual: {self.pontuacao}/{self.total_perguntas}")
        print("="*50)
    
    def executar_quiz(self, num_perguntas=2):
        print("🎯 QUIZ: TIPOS DE MODELOS")
        print("Vamos testar seu conhecimento!\n")
        
        perguntas_selecionadas = random.sample(self.perguntas, min(num_perguntas, len(self.perguntas)))
        
        for pergunta in perguntas_selecionadas:
            self.fazer_pergunta(pergunta)
            input("\nPressione Enter para continuar...")
            print("\n")
        
        # Resultado final
        percentual = (self.pontuacao / self.total_perguntas) * 100
        print("🏆 RESULTADO FINAL")
        print(f"📊 Pontuação: {self.pontuacao}/{self.total_perguntas} ({percentual:.1f}%)")
        
        if percentual >= 80:
            print("🥇 Excelente! Você domina os tipos de modelos!")
        elif percentual >= 60:
            print("🥈 Bom trabalho! Você entende bem o assunto!")
        else:
            print("📚 Continue estudando! Releia o material!")

# Executando o quiz (versão automática para o notebook)
print("🎯 QUIZ AUTOMÁTICO - TIPOS DE MODELOS\n")

# Simulando respostas para demonstração
quiz = QuizModelos()
exemplos = [
    {
        'modelo': 'BERT',
        'características': ['Bidirecional', 'Máscara tokens', 'Classificação', 'Não gera'],
        'resposta_arq': 'Encoder-Only',
        'resposta_tipo': 'Discriminativo'
    },
    {
        'modelo': 'GPT-3',
        'características': ['Autoregressivo', 'Gera texto', 'Uma palavra por vez', 'Criativo'],
        'resposta_arq': 'Decoder-Only',
        'resposta_tipo': 'Generativo'
    }
]

for exemplo in exemplos:
    print(f"🤖 MODELO: {exemplo['modelo']}")
    print("📋 CARACTERÍSTICAS:")
    for i, carac in enumerate(exemplo['características'], 1):
        print(f"   {i}. {carac}")
    print(f"\n✅ Arquitetura: {exemplo['resposta_arq']}")
    print(f"✅ Tipo: {exemplo['resposta_tipo']}")
    print("="*50 + "\n")

print("🎯 Agora é sua vez! Tente classificar outros modelos que você conhece!")

## 🚀 Exercício Prático 2: Cenário de Escolha de Modelo

**Cenário Real**: Você foi contratado por uma startup brasileira de e-commerce para implementar IA em diferentes partes do sistema.

**Requisitos**:
1. **Análise de Reviews**: Classificar reviews em positivo/negativo
2. **Chatbot**: Responder dúvidas dos clientes
3. **Tradução**: Traduzir produtos para outros idiomas
4. **Geração de Descrições**: Criar descrições automáticas de produtos

**Restrições**:
- Orçamento limitado (startup!)
- Precisa de respostas rápidas
- Dados em português
- Alguns dados sensíveis (não pode usar APIs externas)

**Sua missão**: Escolha o modelo ideal para cada caso e justifique!

In [None]:
# EXERCÍCIO 2: Solucionando Cenário Real de E-commerce

class ConsultorIA:
    """Simulação de um consultor especialista em IA"""
    
    def __init__(self):
        self.solucoes = {
            'reviews': {
                'problema': 'Classificar reviews em positivo/negativo',
                'requisitos': ['Rápido', 'Baixo custo', 'Português', 'Offline'],
                'modelo_recomendado': 'BERT-base multilingual fine-tuned',
                'justificativa': [
                    '✅ Encoder-Only: Perfeito para classificação',
                    '✅ Discriminativo: Foco em análise, não geração',
                    '✅ Multilingual: Suporta português nativamente',
                    '✅ Fine-tuning: Pode especializar em reviews',
                    '✅ Offline: Roda localmente, dados seguros',
                    '✅ Custo: Relativamente barato de rodar'
                ],
                'alternativas': ['RoBERTa-PT', 'DistilBERT (mais rápido)'],
                'implementacao': 'Transformers + PyTorch, fine-tune com reviews brasileiros'
            },
            
            'chatbot': {
                'problema': 'Responder dúvidas dos clientes',
                'requisitos': ['Conversacional', 'Português', 'Custo moderado', 'Contextual'],
                'modelo_recomendado': 'LLaMA-7B fine-tuned + RAG',
                'justificativa': [
                    '✅ Decoder-Only: Excelente para conversação',
                    '✅ Generativo: Cria respostas naturais',
                    '✅ 7B: Bom equilíbrio tamanho/qualidade',
                    '✅ Fine-tuning: Especializar em e-commerce',
                    '✅ RAG: Conecta com base de conhecimento',
                    '✅ Open-source: Sem custos de API'
                ],
                'alternativas': ['GPT-3.5 (se budget permitir)', 'Alpaca-7B'],
                'implementacao': 'LangChain + Chroma DB para RAG, fine-tune com conversas'
            },
            
            'traducao': {
                'problema': 'Traduzir produtos para outros idiomas',
                'requisitos': ['Transformação texto', 'Múltiplos idiomas', 'Qualidade alta'],
                'modelo_recomendado': 'mT5 ou MarianMT específico',
                'justificativa': [
                    '✅ Encoder-Decoder: Ideal para tradução',
                    '✅ Multilingual: Suporta vários idiomas',
                    '✅ Especializado: Foco em tradução',
                    '✅ Open-source: Sem custos por uso',
                    '✅ Fine-tuning: Pode melhorar para e-commerce'
                ],
                'alternativas': ['Google Translate API (pago)', 'OPUS-MT'],
                'implementacao': 'Transformers, modelos específicos por par de idiomas'
            },
            
            'descricoes': {
                'problema': 'Gerar descrições automáticas de produtos',
                'requisitos': ['Criativo', 'Persuasivo', 'Português', 'Baseado em features'],
                'modelo_recomendado': 'GPT-3.5-turbo com prompting ou T5 fine-tuned',
                'justificativa': [
                    '✅ Generativo: Cria conteúdo original',
                    '✅ Criativo: Textos persuasivos de marketing',
                    '✅ Estruturado: Pode seguir templates',
                    '✅ Prompting: Controle sobre estilo e tom',
                    '⚠️ Custo: GPT-3.5 é pago, T5 offline'
                ],
                'alternativas': ['LLaMA fine-tuned', 'T5 + templates'],
                'implementacao': 'API OpenAI ou T5 fine-tuned com descrições existentes'
            }
        }
    
    def analisar_caso(self, caso):
        """Analisa um caso específico e apresenta a solução"""
        if caso not in self.solucoes:
            print(f"❌ Caso '{caso}' não encontrado!")
            return
        
        solucao = self.solucoes[caso]
        
        print(f"🎯 CASO: {solucao['problema'].upper()}")
        print("="*60)
        
        print("📋 REQUISITOS:")
        for req in solucao['requisitos']:
            print(f"   • {req}")
        
        print(f"\n🏆 MODELO RECOMENDADO: {solucao['modelo_recomendado']}")
        
        print("\n💡 JUSTIFICATIVA:")
        for just in solucao['justificativa']:
            print(f"   {just}")
        
        print(f"\n🔄 ALTERNATIVAS: {', '.join(solucao['alternativas'])}")
        
        print(f"\n🛠️ IMPLEMENTAÇÃO: {solucao['implementacao']}")
        
        return solucao
    
    def resumo_arquitetura(self):
        """Apresenta resumo da arquitetura completa"""
        print("🏗️ ARQUITETURA COMPLETA DA SOLUÇÃO")
        print("="*60)
        
        arquitetura = {
            '🔍 Reviews (Análise)': 'BERT multilingual → Classificação Sentimento',
            '🤖 Chatbot (Conversação)': 'LLaMA-7B + RAG → Respostas Contextuais',
            '🌍 Tradução (Transformação)': 'mT5/MarianMT → Múltiplos Idiomas',
            '✍️ Descrições (Geração)': 'GPT-3.5 ou T5 → Conteúdo Criativo'
        }
        
        for funcao, solucao in arquitetura.items():
            print(f"{funcao}: {solucao}")
        
        print("\n💰 ESTIMATIVA DE CUSTOS (mensal):")
        custos = {
            'Infrastructure (GPU)': 'R$ 2.000',
            'GPT-3.5 API': 'R$ 500-1.500',
            'Storage & Compute': 'R$ 300',
            'Total estimado': 'R$ 2.800-3.800/mês'
        }
        
        for item, valor in custos.items():
            print(f"   {item}: {valor}")

# Executando a análise completa
consultor = ConsultorIA()

print("🚀 CONSULTORIA IA: E-COMMERCE BRASILEIRO\n")

casos = ['reviews', 'chatbot', 'traducao', 'descricoes']

for caso in casos:
    consultor.analisar_caso(caso)
    print("\n" + "*"*70 + "\n")

consultor.resumo_arquitetura()

print("\n🎯 DICAS FINAIS:")
print("1. 🧪 Sempre faça POC (Proof of Concept) antes")
print("2. 📊 Meça performance em dados reais brasileiros")
print("3. 🔄 Comece simples, evolua conforme necessidade")
print("4. 💰 Monitore custos constantemente")
print("5. 🛡️ Considere privacidade e LGPD")

## 🎭 Resumo: O Grande Teatro dos LLMs

Liiindo! Chegamos ao final da nossa jornada pelo mundo dos tipos de modelos! 🎪

### 🎯 O que aprendemos:

#### 🏗️ **Divisão Fundamental**
- **Modelos Base**: O "padeiro genérico" que sabe o básico
- **Modelos Especializados**: O "confeiteiro expert" focado em algo específico

#### 🏛️ **Arquiteturas (as ferramentas)**
- **Encoder-Only** 🔍: A lupa - para analisar e entender
- **Decoder-Only** 🎯: A caneta - para criar e gerar
- **Encoder-Decoder** 🔄: O tradutor - para transformar

#### 🎨 **Tipos Fundamentais**
- **Generativo**: O artista que cria do zero
- **Discriminativo**: O crítico que analisa e julga

#### 📏 **Tamanhos e Capacidades**
- **Pequenos**: Carro compacto - econômico para o dia a dia
- **Médios**: SUV - equilíbrio entre performance e praticidade
- **Grandes**: Caminhão - potente para trabalhos pesados
- **Gigantes**: Foguete - para missões impossíveis

#### 🔧 **Fine-tuning: A Especialização**
- Transformar generalista em especialista
- Instruction Tuning, RLHF, Domain-specific
- Como personalizar um carro para suas necessidades

### 🎯 **Dicas de Ouro do Pedro:**

1. **Comece Simples**: Nem sempre precisa do GPT-4!
2. **Conheça seu Problema**: Análise → Encoder, Geração → Decoder, Transformação → Encoder-Decoder
3. **Considere Recursos**: Tempo, dinheiro, infraestrutura
4. **Teste na Prática**: POC antes de produção
5. **Evolua Gradualmente**: Comece pequeno, cresça conforme necessidade

### 🔮 **Preparando para o Próximo Módulo**

No **Módulo 7 - Treinamento e Pre-treinamento**, vamos descobrir:
- Como esses modelos são "nascidos" e "educados"
- O processo completo de treinamento
- Pre-training vs Fine-tuning em detalhes
- Custos e desafios do treinamento

**🎪 Até a próxima, e lembra: cada modelo tem seu palco onde brilhar!**

In [None]:
# Célula final - Recapitulação visual e próximos passos
import matplotlib.pyplot as plt
import numpy as np
from matplotlib.patches import FancyBboxPatch

# Criando um mapa mental visual do que aprendemos
fig, ax = plt.subplots(figsize=(16, 12))

# Centro - Tipos de Modelos
centro = FancyBboxPatch((7, 5.5), 2, 1, boxstyle="round,pad=0.1", 
                       facecolor='gold', edgecolor='darkred', linewidth=3)
ax.add_patch(centro)
ax.text(8, 6, 'TIPOS DE\nMODELOS', ha='center', va='center', 
        fontsize=14, fontweight='bold')

# Categorias principais
categorias = [
    # (nome, x, y, cor, conteúdo)
    ('ARQUITETURAS', 3, 9, 'lightblue', 'Encoder-Only\nDecoder-Only\nEncoder-Decoder'),
    ('TAMANHOS', 13, 9, 'lightgreen', 'Pequenos (<1B)\nMédios (1-10B)\nGrandes (10-100B)\nGigantes (>100B)'),
    ('TIPOS', 3, 3, 'lightcoral', 'Generativo\n(Cria)\nDiscriminativo\n(Analisa)'),
    ('ESPECIALIZAÇÃO', 13, 3, 'lightyellow', 'Base Models\nFine-tuned\nInstruction\nRLHF'),
]

for nome, x, y, cor, conteudo in categorias:
    # Caixa da categoria
    caixa = FancyBboxPatch((x-1, y-1), 2, 2, boxstyle="round,pad=0.1", 
                          facecolor=cor, edgecolor='navy', linewidth=2)
    ax.add_patch(caixa)
    
    # Título da categoria
    ax.text(x, y+0.7, nome, ha='center', va='center', 
            fontsize=11, fontweight='bold')
    
    # Conteúdo
    ax.text(x, y-0.2, conteudo, ha='center', va='center', 
            fontsize=9)
    
    # Seta para o centro
    ax.arrow(x, y-1 if y > 6 else y+1, 8-x, (5.5 if y < 6 else 6.5)-y, 
             head_width=0.1, head_length=0.1, fc='gray', ec='gray', alpha=0.5)

# Exemplos práticos nas laterais
exemplos_esq = ['BERT\n(Análise)', 'T5\n(Tradução)', 'GPT\n(Chat)']
exemplos_dir = ['BioBERT\n(Medicina)', 'CodeT5\n(Código)', 'FinBERT\n(Finanças)']

for i, (esq, dir) in enumerate(zip(exemplos_esq, exemplos_dir)):
    y_pos = 8 - i * 2
    
    # Esquerda
    ax.text(0.5, y_pos, esq, ha='center', va='center', 
            fontsize=10, bbox=dict(boxstyle="round,pad=0.3", facecolor='lightpink'))
    
    # Direita
    ax.text(15.5, y_pos, dir, ha='center', va='center', 
            fontsize=10, bbox=dict(boxstyle="round,pad=0.3", facecolor='lightcyan'))

# Título
ax.text(8, 11, '🎭 MAPA MENTAL: TIPOS DE MODELOS LLM', 
        ha='center', va='center', fontsize=18, fontweight='bold')

# Rodapé com próximos passos
ax.text(8, 0.5, '🔮 PRÓXIMO: Módulo 7 - Treinamento e Pre-treinamento', 
        ha='center', va='center', fontsize=12, style='italic', 
        bbox=dict(boxstyle="round,pad=0.5", facecolor='lavender'))

ax.set_xlim(-1, 17)
ax.set_ylim(0, 12)
ax.axis('off')

plt.tight_layout()
plt.show()

print("🎯 PARABÉNS! Você completou o Módulo 6!")
print("\n📚 CHECKLIST DO QUE VOCÊ APRENDEU:")
checklist = [
    "✅ Diferença entre modelos base e especializados",
    "✅ Três arquiteturas principais (Encoder/Decoder/Both)",
    "✅ Generativo vs Discriminativo",
    "✅ Impacto do tamanho nos modelos",
    "✅ Processo de fine-tuning",
    "✅ Como escolher modelo para cada tarefa",
    "✅ Casos práticos de uso"
]

for item in checklist:
    print(f"   {item}")

print("\n🚀 VOCÊ ESTÁ PRONTO PARA:")
print("   • Escolher o modelo certo para cada projeto")
print("   • Entender custos e trade-offs")
print("   • Planejar arquiteturas de IA")
print("   • Aprender sobre treinamento (próximo módulo!)")

print("\n🎪 Até o próximo módulo! Bora descobrir como esses modelos 'nascem'!")