# 🚧 Os Perrengues dos LLMs: Limitações e Desafios na Era da IA

**Módulo 11 - Introdução à LLMs**

*Por Pedro Nunes Guth*

---

Eaí, pessoal! 👋

Bora falar sobre a parte que ninguém gosta muito de discutir mas que é FUNDAMENTAL: as limitações dos LLMs! 

Tá, imagina que os LLMs são como aquele amigo super inteligente que sabe sobre TUDO, mas às vezes inventa umas histórias mirabolantes, não consegue fazer contas direito e ainda por cima gasta uma fortuna em energia elétrica. É isso aí que vamos destrinchar hoje!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/introdução-à-llms-modulo-11_img_01.png)

## 🎯 O que vamos aprender hoje?

- **Limitações técnicas**: Por que os LLMs não são perfeitos
- **Desafios computacionais**: O custo da inteligência artificial
- **Problemas éticos**: Os dilemas que enfrentamos
- **Limitações de conhecimento**: O que eles não sabem
- **Como lidar com essas limitações**: Estratégias práticas

**Dica do Pedro**: Conhecer as limitações é tão importante quanto conhecer as capacidades. É como dirigir um carro - você precisa saber onde estão os freios!

In [None]:
# Setup inicial - vamos importar tudo que precisamos
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

# Configuração dos gráficos
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

print("🚀 Setup concluído! Bora para os perrengues dos LLMs!")

## 1. 🧠 Limitações Cognitivas: O que os LLMs não conseguem fazer

Tá, mas antes de mais nada, vamos entender uma coisa: **LLMs não pensam como humanos**. Eles são tipo aquele estudante que decorou toda a Wikipedia mas não consegue aplicar o conhecimento de forma criativa.

### Principais limitações cognitivas:

1. **Raciocínio lógico complexo** - Não conseguem fazer inferências profundas
2. **Matemática avançada** - Erram cálculos que uma calculadora de R$ 5 faz
3. **Planejamento de longo prazo** - Não conseguem manter consistência em projetos longos
4. **Compreensão causal** - Confundem correlação com causação
5. **Criatividade genuína** - Só recombina o que já existe

In [None]:
# Vamos simular alguns problemas típicos de raciocínio lógico
# que LLMs têm dificuldade

def teste_raciocinio_logico():
    """
    Simula problemas que LLMs têm dificuldade para resolver
    """
    problemas = {
        "Matemática básica": {
            "problema": "347 * 823 = ?",
            "resposta_correta": 347 * 823,
            "erro_comum_llm": "Aproximadamente 285,000 (erro de cálculo)"
        },
        "Lógica temporal": {
            "problema": "Se hoje é segunda e daqui a 100 dias?",
            "resposta_correta": "Terça-feira",
            "erro_comum_llm": "Confunde contagem de dias"
        },
        "Raciocínio espacial": {
            "problema": "Quantos cubos cabem numa caixa 3x3x3?",
            "resposta_correta": 27,
            "erro_comum_llm": "Às vezes responde 9 (só 2D)"
        }
    }
    
    print("🧮 Problemas que dão dor de cabeça nos LLMs:")
    print("=" * 50)
    
    for tipo, info in problemas.items():
        print(f"\n📝 {tipo}:")
        print(f"   Problema: {info['problema']}")
        print(f"   ✅ Correto: {info['resposta_correta']}")
        print(f"   ❌ Erro comum: {info['erro_comum_llm']}")

teste_raciocinio_logico()

## 2. 💰 Desafios Computacionais: O Preço da Inteligência

Liiindo! Agora vamos falar do elefante na sala: **CUSTO**! 🐘

Treinar um LLM é tipo construir um estádio da Copa do Mundo - custa uma fortuna, demora anos e consome energia suficiente para abastecer uma cidade pequena!

### Os principais custos:

- **Energia elétrica**: GPT-3 consumiu ~1,300 MWh para treinar
- **Hardware**: GPUs custam centenas de milhares de dólares
- **Tempo de treinamento**: Meses rodando 24/7
- **Armazenamento**: Terabytes de dados
- **Inferência**: Cada resposta custa centavos/dólares

In [None]:
# Vamos calcular os custos de treinamento de diferentes modelos
import numpy as np

def calcular_custos_treinamento():
    """
    Estima custos de treinamento de diferentes LLMs
    Valores aproximados baseados em estimativas públicas
    """
    
    modelos = {
        'GPT-2': {
            'parametros': '1.5B',
            'custo_usd': 50_000,
            'energia_mwh': 50,
            'tempo_dias': 30
        },
        'GPT-3': {
            'parametros': '175B', 
            'custo_usd': 4_600_000,
            'energia_mwh': 1_300,
            'tempo_dias': 120
        },
        'GPT-4': {
            'parametros': '~1T',
            'custo_usd': 100_000_000,  # Estimativa
            'energia_mwh': 20_000,     # Estimativa
            'tempo_dias': 365
        }
    }
    
    df = pd.DataFrame(modelos).T
    
    print("💸 Custos de Treinamento dos LLMs")
    print("=" * 40)
    
    for modelo, dados in modelos.items():
        print(f"\n🤖 {modelo}:")
        print(f"   Parâmetros: {dados['parametros']}")
        print(f"   Custo: ${dados['custo_usd']:,}")
        print(f"   Energia: {dados['energia_mwh']} MWh")
        print(f"   Tempo: {dados['tempo_dias']} dias")
        
        # Equivalência em casas brasileiras (consumo médio 200 kWh/mês)
        casas = (dados['energia_mwh'] * 1000) / 200
        print(f"   📏 Energia = {casas:.0f} casas por 1 mês")
    
    return df

df_custos = calcular_custos_treinamento()

In [None]:
# Visualização dos custos crescentes
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 10))

modelos = ['GPT-2', 'GPT-3', 'GPT-4']
custos = [50_000, 4_600_000, 100_000_000]
energia = [50, 1_300, 20_000]
tempo = [30, 120, 365]

# Gráfico 1: Custos em escala log
ax1.bar(modelos, custos, color=['lightblue', 'orange', 'red'], alpha=0.7)
ax1.set_yscale('log')
ax1.set_ylabel('Custo (USD)')
ax1.set_title('💰 Custos de Treinamento (Escala Log)')
ax1.grid(True, alpha=0.3)

# Gráfico 2: Consumo de energia
ax2.bar(modelos, energia, color=['green', 'yellow', 'red'], alpha=0.7)
ax2.set_ylabel('Energia (MWh)')
ax2.set_title('⚡ Consumo de Energia')
ax2.grid(True, alpha=0.3)

# Gráfico 3: Tempo de treinamento
ax3.bar(modelos, tempo, color=['lightgreen', 'gold', 'crimson'], alpha=0.7)
ax3.set_ylabel('Dias')
ax3.set_title('⏰ Tempo de Treinamento')
ax3.grid(True, alpha=0.3)

# Gráfico 4: Custo por parâmetro (estimativa)
parametros_num = [1.5, 175, 1000]  # Em bilhões
custo_por_param = [c/p for c, p in zip(custos, parametros_num)]

ax4.plot(modelos, custo_por_param, 'o-', linewidth=3, markersize=8, color='purple')
ax4.set_ylabel('USD por Bilhão de Parâmetros')
ax4.set_title('📊 Eficiência de Custo')
ax4.grid(True, alpha=0.3)

plt.tight_layout()
plt.suptitle('🚧 A Escalada dos Custos dos LLMs', fontsize=16, y=1.02)
plt.show()

print("\n🔍 Observações importantes:")
print("- Custos crescem exponencialmente com o tamanho")
print("- GPT-4 custou ~2000x mais que GPT-2 para treinar")
print("- Energia suficiente para abastecer cidades pequenas")

```mermaid
graph TD
    A[Dados de Treinamento] --> B[Preprocessamento]
    B --> C[Cluster de GPUs]
    C --> D{Custo Crescente}
    D -->|Energia| E[Milhares de MWh]
    D -->|Hardware| F[Milhões de USD]
    D -->|Tempo| G[Meses/Anos]
    E --> H[Impacto Ambiental]
    F --> I[Barreira de Entrada]
    G --> J[Time-to-Market]
```

## 3. 🎭 Alucinações: Quando o LLM "Inventa" Coisas

Tá, agora vamos falar de um dos problemas mais famosos: **alucinações**! 🤯

Não, não é que o LLM tá vendo unicórnios. Alucinação em IA é quando o modelo gera informações que parecem plausíveis mas são completamente inventadas.

É tipo aquele tio no churrasco que conta histórias incríveis que nunca aconteceram, mas conta com tanta convicção que você quase acredita!

### Tipos de alucinações:

1. **Fatos inventados**: Criar eventos históricos que nunca existiram
2. **Citações falsas**: Atribuir frases a pessoas que nunca as disseram
3. **Referências inexistentes**: Citar papers ou livros que não existem
4. **Estatísticas inventadas**: Números que saem do nada

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/introdução-à-llms-modulo-11_img_02.png)

In [None]:
def simular_alucinacoes():
    """
    Exemplos típicos de alucinações que LLMs podem gerar
    ATENÇÃO: Estes são exemplos FICTÍCIOS para demonstrar o problema!
    """
    
    alucinacoes_tipicas = {
        "Histórica": {
            "pergunta": "Quando foi a Guerra do Paraguai?",
            "resposta_correta": "1864-1870",
            "alucinacao": "A Segunda Guerra do Paraguai foi de 1889-1892",
            "problema": "Inventou uma segunda guerra que não existiu"
        },
        "Científica": {
            "pergunta": "Qual a velocidade da luz?",
            "resposta_correta": "299,792,458 m/s",
            "alucinacao": "Segundo Einstein em 1920, é 300,000,000 m/s",
            "problema": "Data errada e valor aproximado apresentado como exato"
        },
        "Literatura": {
            "pergunta": "Livros de Machado de Assis",
            "resposta_correta": "Dom Casmurro, O Cortiço...",
            "alucinacao": "'As Aventuras de Capitu' (1881)",
            "problema": "Livro que não existe"
        },
        "Matemática": {
            "pergunta": "Quanto é 127 x 89?",
            "resposta_correta": 127 * 89,
            "alucinacao": "Aproximadamente 11,500",
            "problema": f"Valor real é {127 * 89}, erro de ~1,000"
        }
    }
    
    print("🎭 Exemplos de Alucinações em LLMs")
    print("=" * 50)
    print("⚠️  ATENÇÃO: Exemplos fictícios para demonstração!")
    print()
    
    for categoria, exemplo in alucinacoes_tipicas.items():
        print(f"📂 {categoria}:")
        print(f"   ❓ Pergunta: {exemplo['pergunta']}")
        print(f"   ✅ Correto: {exemplo['resposta_correta']}")
        print(f"   ❌ Alucinação: {exemplo['alucinacao']}")
        print(f"   🔍 Problema: {exemplo['problema']}")
        print()
    
    return alucinacoes_tipicas

exemplos = simular_alucinacoes()

In [None]:
# Vamos simular como detectar alucinações
import random

def detectar_alucinacao(resposta, fonte_confiavel):
    """
    Simula um sistema de detecção de alucinações
    """
    # Simula diferentes tipos de verificação
    verificacoes = {
        'consistencia_interna': random.uniform(0.6, 0.9),
        'fonte_externa': random.uniform(0.4, 0.8),
        'probabilidade_tokens': random.uniform(0.5, 0.95),
        'validacao_cruzada': random.uniform(0.3, 0.85)
    }
    
    score_confiabilidade = np.mean(list(verificacoes.values()))
    
    return verificacoes, score_confiabilidade

# Teste com diferentes tipos de resposta
tipos_resposta = [
    "Resposta factual verificável",
    "Informação com data específica", 
    "Citação de pessoa famosa",
    "Estatística numérica",
    "Referência acadêmica"
]

print("🔍 Sistema de Detecção de Alucinações")
print("=" * 45)

resultados = []
for tipo in tipos_resposta:
    verificacoes, score = detectar_alucinacao(tipo, True)
    resultados.append(score)
    
    status = "🟢 CONFIÁVEL" if score > 0.7 else "🟡 SUSPEITO" if score > 0.5 else "🔴 PROVÁVEL ALUCINAÇÃO"
    
    print(f"\n📝 {tipo}:")
    print(f"   Score: {score:.2f} - {status}")
    print(f"   Detalhes: {verificacoes}")

print(f"\n📊 Score médio de confiabilidade: {np.mean(resultados):.2f}")

## 4. ⚖️ Desafios Éticos: O Lado Sombrio da IA

Bora falar sério agora! Os LLMs não são neutros - eles herdam todos os preconceitos dos dados de treinamento. É tipo ensinar uma criança só com livros de história escritos por uma única perspectiva.

### Principais desafios éticos:

1. **Viés e discriminação**: Reproduzem preconceitos sociais
2. **Desinformação**: Podem ser usados para fake news
3. **Privacidade**: Dados de treinamento podem vazar informações
4. **Direitos autorais**: Usam conteúdo sem permissão
5. **Impacto no emprego**: Automatizam trabalhos humanos
6. **Concentração de poder**: Poucos controlam a tecnologia

**Dica do Pedro**: Ética em IA não é opcional - é fundamental! É como usar cinto de segurança: parece chato, mas salva vidas.

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/introdução-à-llms-modulo-11_img_03.png)

In [None]:
# Simulação de diferentes tipos de viés em LLMs
def analisar_vieses():
    """
    Simula como diferentes vieses podem aparecer em LLMs
    """
    
    vieses_comuns = {
        "Gênero": {
            "exemplo": "Enfermeiro vs Enfermeira",
            "problema": "Associa profissões a gêneros específicos",
            "impacto": "Perpetua estereótipos de gênero",
            "solucao": "Balanceamento de dados, fine-tuning ético"
        },
        "Racial": {
            "exemplo": "Descrições de pessoas",
            "problema": "Associações negativas com certas etnias",
            "impacto": "Discriminação sistêmica",
            "solucao": "Auditoria constante, datasets diversos"
        },
        "Socioeconômico": {
            "exemplo": "Aprovação de crédito",
            "problema": "Favorece classes mais altas",
            "impacto": "Aumenta desigualdade",
            "solucao": "Métricas de fairness, regulamentação"
        },
        "Geográfico": {
            "exemplo": "Conhecimento sobre países",
            "problema": "Mais dados do hemisfério norte",
            "impacto": "Invisibiliza culturas",
            "solucao": "Datasets multilinguísticos, inclusão ativa"
        },
        "Temporal": {
            "exemplo": "Eventos recentes",
            "problema": "Conhecimento desatualizado",
            "impacto": "Decisões baseadas em info antiga",
            "solucao": "Re-treinamento periódico, RAG"
        }
    }
    
    print("⚖️  Mapeamento de Vieses em LLMs")
    print("=" * 40)
    
    for tipo, info in vieses_comuns.items():
        print(f"\n🎯 Viés {tipo}:")
        print(f"   📝 Exemplo: {info['exemplo']}")
        print(f"   ⚠️  Problema: {info['problema']}")
        print(f"   💥 Impacto: {info['impacto']}")
        print(f"   🔧 Solução: {info['solucao']}")
    
    return vieses_comuns

vieses = analisar_vieses()

In [None]:
# Visualização do impacto dos vieses
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(15, 6))

# Gráfico 1: Gravidade dos diferentes vieses
tipos_vieses = list(vieses.keys())
gravidade = [9, 10, 8, 7, 6]  # Scores de impacto (0-10)
cores = ['red', 'darkred', 'orange', 'gold', 'yellow']

bars = ax1.barh(tipos_vieses, gravidade, color=cores, alpha=0.7)
ax1.set_xlabel('Gravidade do Impacto (0-10)')
ax1.set_title('🎯 Gravidade dos Diferentes Vieses')
ax1.grid(True, alpha=0.3)

# Adicionar valores nas barras
for i, (bar, valor) in enumerate(zip(bars, gravidade)):
    ax1.text(valor + 0.1, i, f'{valor}', va='center')

# Gráfico 2: Evolução temporal dos problemas éticos
anos = np.array([2018, 2019, 2020, 2021, 2022, 2023, 2024])
problemas_reportados = np.array([10, 25, 45, 80, 120, 180, 250])  # Números simulados
consciencia_publica = np.array([5, 15, 30, 60, 85, 95, 98])  # Percentual

ax2_twin = ax2.twinx()

line1 = ax2.plot(anos, problemas_reportados, 'ro-', linewidth=2, label='Problemas Reportados')
line2 = ax2_twin.plot(anos, consciencia_publica, 'bo-', linewidth=2, label='Consciência Pública (%)')

ax2.set_xlabel('Ano')
ax2.set_ylabel('Problemas Reportados', color='red')
ax2_twin.set_ylabel('Consciência Pública (%)', color='blue')
ax2.set_title('📈 Evolução da Consciência Ética em IA')

# Combinar legendas
lines = line1 + line2
labels = [l.get_label() for l in lines]
ax2.legend(lines, labels, loc='center left')

ax2.grid(True, alpha=0.3)
ax2.tick_params(axis='y', labelcolor='red')
ax2_twin.tick_params(axis='y', labelcolor='blue')

plt.tight_layout()
plt.show()

print("\n🔍 Observações importantes:")
print("- Viés racial e de gênero são os mais críticos")
print("- Consciência pública cresceu exponencialmente")
print("- Problemas reportados aumentam com popularização da IA")

```mermaid
graph TD
    A[Dados de Treinamento] --> B{Vieses Implícitos}
    B -->|Gênero| C[Estereótipos Profissionais]
    B -->|Racial| D[Discriminação Sistêmica]
    B -->|Socioeconômico| E[Desigualdade Amplificada]
    B -->|Cultural| F[Invisibilização de Minorias]
    
    C --> G[Impacto Social]
    D --> G
    E --> G
    F --> G
    
    G --> H[Necessidade de Regulamentação]
    G --> I[Desenvolvimento Responsável]
    G --> J[Auditoria Contínua]
```

## 5. 📚 Limitações de Conhecimento: O que os LLMs não sabem

Tá, imagina que o conhecimento dos LLMs é como uma biblioteca gigantesca, mas com algumas prateleiras vazias e outras com livros desatualizados. Eles têm um "knowledge cutoff" - uma data limite do conhecimento!

### Principais limitações:

1. **Data de corte**: Não sabem eventos após o treinamento
2. **Informações dinâmicas**: Preços, clima, notícias em tempo real
3. **Conhecimento especializado**: Áreas muito técnicas ou nicho
4. **Informações privadas**: Dados não públicos
5. **Contexto pessoal**: Não conhecem você especificamente

**Dica do Pedro**: Sempre pergunte "quando" o modelo foi treinado. É como verificar a validade de um remédio!

In [None]:
# Simulação de limitações temporais de conhecimento
from datetime import datetime, timedelta

def simular_conhecimento_temporal():
    """
    Simula como o conhecimento dos LLMs fica desatualizado
    """
    
    # Datas de cutoff de diferentes modelos
    modelos_cutoff = {
        'GPT-3.5': '2021-09',
        'GPT-4': '2023-04', 
        'Claude-2': '2023-01',
        'PaLM-2': '2023-02',
        'Llama-2': '2023-07'
    }
    
    hoje = datetime.now()
    
    print("📅 Análise de Defasagem de Conhecimento")
    print("=" * 45)
    
    for modelo, cutoff in modelos_cutoff.items():
        # Converte string para datetime
        cutoff_date = datetime.strptime(cutoff + '-01', '%Y-%m-%d')
        defasagem = hoje - cutoff_date
        
        print(f"\n🤖 {modelo}:")
        print(f"   📊 Cutoff: {cutoff}")
        print(f"   ⏰ Defasagem: {defasagem.days} dias")
        print(f"   📉 Status: {'🟢 Atual' if defasagem.days < 180 else '🟡 Desatualizado' if defasagem.days < 365 else '🔴 Muito desatualizado'}")
    
    return modelos_cutoff

def exemplos_conhecimento_limitado():
    """
    Exemplos de perguntas que LLMs não conseguem responder
    """
    
    limitacoes = {
        "Tempo Real": [
            "Que horas são agora?",
            "Qual o preço atual do Bitcoin?",
            "Como está o trânsito em São Paulo?"
        ],
        "Eventos Recentes": [
            "Quem ganhou a Copa do Mundo 2024?",
            "Última decisão do STF?",
            "Lançamentos da Netflix esta semana?"
        ],
        "Informações Pessoais": [
            "Qual meu saldo bancário?",
            "Onde estão minhas chaves?",
            "Que compromisso tenho amanhã?"
        ],
        "Dados Privados": [
            "Estratégias internas da empresa X",
            "Pesquisas não publicadas",
            "Informações classificadas"
        ]
    }
    
    print("\n❌ Tipos de Perguntas que LLMs Não Conseguem Responder")
    print("=" * 55)
    
    for categoria, perguntas in limitacoes.items():
        print(f"\n📂 {categoria}:")
        for pergunta in perguntas:
            print(f"   ❓ {pergunta}")
    
    return limitacoes

cutoffs = simular_conhecimento_temporal()
limitacoes = exemplos_conhecimento_limitado()

## 6. 🛠️ Estratégias para Lidar com as Limitações

Liiindo! Agora que conhecemos os problemas, vamos às soluções! É tipo conhecer os buracos da estrada para poder desviar deles. 🛣️

### Estratégias principais:

1. **RAG (Retrieval-Augmented Generation)**: Conecta com bases de conhecimento atuais
2. **Fine-tuning específico**: Treina para domínios específicos
3. **Validação cruzada**: Verifica informações em múltiplas fontes
4. **Prompting cuidadoso**: Usa técnicas para reduzir alucinações
5. **Sistemas híbridos**: Combina IA com validação humana

**Dica do Pedro**: Não confie cegamente no LLM. Trate-o como um assistente muito esperto, mas que precisa de supervisão!

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/introdução-à-llms-modulo-11_img_04.png)

In [None]:
# Implementação de estratégias para lidar com limitações
import random

class LimitationHandler:
    """
    Sistema para lidar com limitações de LLMs
    """
    
    def __init__(self):
        self.estrategias = {
            'rag': self.usar_rag,
            'validacao_cruzada': self.validar_cruzado,
            'prompt_cuidadoso': self.prompt_seguro,
            'deteccao_alucinacao': self.detectar_alucinacao,
            'fallback_humano': self.escalate_para_humano
        }
    
    def usar_rag(self, pergunta):
        """Simula busca em base de conhecimento externa"""
        confiabilidade = random.uniform(0.8, 0.95)
        return {
            'metodo': 'RAG',
            'resultado': f"Informação atual encontrada para: {pergunta}",
            'confiabilidade': confiabilidade,
            'fonte': 'Base de dados atualizada'
        }
    
    def validar_cruzado(self, resposta):
        """Simula validação em múltiplas fontes"""
        num_fontes = random.randint(2, 5)
        concordancia = random.uniform(0.6, 0.9)
        return {
            'metodo': 'Validação Cruzada',
            'fontes_consultadas': num_fontes,
            'concordancia': concordancia,
            'status': 'Validado' if concordancia > 0.7 else 'Conflitante'
        }
    
    def prompt_seguro(self, pergunta):
        """Usa técnicas de prompt para reduzir alucinações"""
        return {
            'metodo': 'Prompt Seguro',
            'tecnica': 'Chain-of-thought + disclaimers',
            'prompt_usado': f"Baseado apenas em fatos verificáveis: {pergunta}",
            'reducao_alucinacao': random.uniform(0.3, 0.7)
        }
    
    def detectar_alucinacao(self, resposta):
        """Sistema de detecção de alucinações"""
        score = random.uniform(0.4, 0.9)
        return {
            'metodo': 'Detector de Alucinação',
            'score_confiabilidade': score,
            'status': 'Seguro' if score > 0.7 else 'Suspeito',
            'acao_recomendada': 'Usar resposta' if score > 0.7 else 'Validar manualmente'
        }
    
    def escalate_para_humano(self, pergunta):
        """Quando precisa de intervenção humana"""
        return {
            'metodo': 'Escalação Humana',
            'razao': 'Pergunta complexa ou crítica',
            'tempo_resposta': f"{random.randint(15, 120)} minutos",
            'especialista_necessario': True
        }
    
    def processar_pergunta(self, pergunta, estrategia='auto'):
        """Processa pergunta usando estratégia apropriada"""
        
        if estrategia == 'auto':
            # Escolhe estratégia baseada no tipo de pergunta
            if 'atual' in pergunta.lower() or 'hoje' in pergunta.lower():
                estrategia = 'rag'
            elif 'quanto é' in pergunta.lower():
                estrategia = 'validacao_cruzada' 
            elif 'crítico' in pergunta.lower():
                estrategia = 'fallback_humano'
            else:
                estrategia = 'prompt_cuidadoso'
        
        resultado = self.estrategias[estrategia](pergunta)
        return resultado

# Teste do sistema
handler = LimitationHandler()

perguntas_teste = [
    "Qual a cotação atual do dólar?",
    "Quanto é 234 x 567?",
    "Decisão crítica sobre investimento de R$ 1M",
    "Quem foi Dom Pedro II?"
]

print("🛠️  Sistema de Mitigação de Limitações")
print("=" * 45)

for i, pergunta in enumerate(perguntas_teste, 1):
    resultado = handler.processar_pergunta(pergunta)
    
    print(f"\n🔍 Teste {i}: {pergunta}")
    print(f"   Método: {resultado['metodo']}")
    
    # Mostra informações específicas baseadas no método
    for key, value in resultado.items():
        if key != 'metodo':
            print(f"   {key.replace('_', ' ').title()}: {value}")

## 🏋️‍♂️ Exercício Prático 1: Detectando Limitações

Bora praticar! Agora é sua vez de identificar e categorizar diferentes tipos de limitações em cenários reais.

**Desafio**: Para cada cenário abaixo, identifique:
1. Que tipo de limitação está presente
2. Qual seria a estratégia mais adequada
3. Como você validaria a resposta

In [None]:
# Exercício: Identificar e categorizar limitações

def exercicio_limitacoes():
    """
    Exercício para praticar identificação de limitações
    """
    
    cenarios = {
        "Cenário A": {
            "situacao": "LLM afirma que a Copa do Mundo de 2026 será no Brasil",
            "pergunta": "Que tipos de limitação/problema você identifica?",
            "opcoes": [
                "a) Alucinação factual",
                "b) Conhecimento desatualizado", 
                "c) Viés geográfico",
                "d) Todas as anteriores"
            ],
            "resposta_correta": "a",
            "explicacao": "Copa 2026 será EUA/México/Canadá. É alucinação factual."
        },
        
        "Cenário B": {
            "situacao": "LLM sugere apenas homens para cargo de CEO",
            "pergunta": "Qual o principal problema?",
            "opcoes": [
                "a) Conhecimento limitado",
                "b) Viés de gênero",
                "c) Alucinação", 
                "d) Problema computacional"
            ],
            "resposta_correta": "b",
            "explicacao": "Claro viés de gênero reproduzido dos dados de treinamento."
        },
        
        "Cenário C": {
            "situacao": "LLM não consegue calcular 1847 x 2394 corretamente",
            "pergunta": "Que limitação isso representa?",
            "opcoes": [
                "a) Limitação de raciocínio matemático",
                "b) Problema de tokenização",
                "c) Alucinação numérica",
                "d) Todas as anteriores"
            ],
            "resposta_correta": "d",
            "explicacao": "LLMs têm dificuldade com matemática por múltiplas razões."
        }
    }
    
    print("🏋️‍♂️ EXERCÍCIO: Detectando Limitações de LLMs")
    print("=" * 50)
    print("📋 Para cada cenário, escolha a resposta mais adequada:\n")
    
    for nome, cenario in cenarios.items():
        print(f"📝 {nome}:")
        print(f"   Situação: {cenario['situacao']}")
        print(f"   Pergunta: {cenario['pergunta']}")
        print("   Opções:")
        for opcao in cenario['opcoes']:
            print(f"      {opcao}")
        print(f"\n   ✅ Resposta: {cenario['resposta_correta'].upper()}")
        print(f"   💡 Explicação: {cenario['explicacao']}")
        print("\n" + "-"*40 + "\n")
    
    return cenarios

exercicio = exercicio_limitacoes()

## 🎯 Exercício Prático 2: Construindo um Sistema de Validação

Agora vamos construir um sistema mais sofisticado para detectar e mitigar limitações dos LLMs!

In [None]:
# Exercício: Construir sistema de validação

class ValidadorLLM:
    """
    Sistema para validar respostas de LLMs e detectar limitações
    COMPLETE AS FUNÇÕES MARCADAS COM 'TODO'
    """
    
    def __init__(self):
        self.tipos_limitacao = {
            'alucinacao': 0,
            'viés': 0, 
            'conhecimento_limitado': 0,
            'raciocinio_falho': 0
        }
        
    def detectar_alucinacao_matematica(self, pergunta, resposta):
        """
        TODO: Implemente detecção de alucinações em cálculos matemáticos
        Dica: Use eval() com cuidado ou regex para extrair operações
        """
        # COMPLETE ESTA FUNÇÃO
        import re
        
        # Procura por operações matemáticas simples
        operacao = re.search(r'(\d+)\s*[x\*]\s*(\d+)', pergunta)
        if operacao:
            num1, num2 = int(operacao.group(1)), int(operacao.group(2))
            resultado_correto = num1 * num2
            
            # Extrai número da resposta
            resp_num = re.search(r'\d+', str(resposta))
            if resp_num:
                resposta_numerica = int(resp_num.group())
                erro_percentual = abs(resposta_numerica - resultado_correto) / resultado_correto
                
                return {
                    'e_matematica': True,
                    'correto': resultado_correto,
                    'resposta': resposta_numerica,
                    'erro_percentual': erro_percentual,
                    'alucinacao': erro_percentual > 0.1  # Mais de 10% de erro
                }
        
        return {'e_matematica': False}
    
    def detectar_data_impossivel(self, resposta):
        """
        TODO: Detecta datas impossíveis ou eventos futuros apresentados como fatos
        """
        # COMPLETE ESTA FUNÇÃO
        import re
        from datetime import datetime
        
        # Procura anos na resposta
        anos = re.findall(r'\b(19|20)\d{2}\b', str(resposta))
        ano_atual = datetime.now().year
        
        for ano in anos:
            ano_int = int(ano)
            if ano_int > ano_atual + 1:  # Eventos muito futuros
                return {
                    'data_impossivel': True,
                    'ano_problematico': ano_int,
                    'motivo': 'Evento futuro apresentado como fato'
                }
            
        return {'data_impossivel': False}
    
    def avaliar_resposta(self, pergunta, resposta):
        """
        Avalia uma resposta de LLM para detectar limitações
        """
        resultado = {
            'pergunta': pergunta,
            'resposta': resposta,
            'limitacoes_detectadas': [],
            'score_confiabilidade': 1.0
        }
        
        # Testa matemática
        teste_math = self.detectar_alucinacao_matematica(pergunta, resposta)
        if teste_math.get('alucinacao', False):
            resultado['limitacoes_detectadas'].append('Alucinação matemática')
            resultado['score_confiabilidade'] -= 0.5
            self.tipos_limitacao['alucinacao'] += 1
        
        # Testa datas
        teste_data = self.detectar_data_impossivel(resposta)
        if teste_data.get('data_impossivel', False):
            resultado['limitacoes_detectadas'].append('Data impossível')
            resultado['score_confiabilidade'] -= 0.4
            self.tipos_limitacao['conhecimento_limitado'] += 1
        
        # TODO: Adicione mais testes aqui
        # - Detecção de viés
        # - Inconsistência lógica
        # - Fontes inexistentes
        
        return resultado

# Teste do sistema
validador = ValidadorLLM()

testes = [
    {
        'pergunta': 'Quanto é 234 x 567?',
        'resposta': '130000'  # Resposta incorreta
    },
    {
        'pergunta': 'Quando foi a independência do Brasil?',
        'resposta': 'A independência do Brasil foi em 2025'  # Data futura impossível
    },
    {
        'pergunta': 'Quanto é 10 x 10?',
        'resposta': '100'  # Resposta correta
    }
]

print("🔍 TESTE DO SISTEMA DE VALIDAÇÃO")
print("=" * 40)

for i, teste in enumerate(testes, 1):
    resultado = validador.avaliar_resposta(teste['pergunta'], teste['resposta'])
    
    print(f"\n📝 Teste {i}:")
    print(f"   P: {resultado['pergunta']}")
    print(f"   R: {resultado['resposta']}")
    print(f"   Score: {resultado['score_confiabilidade']:.2f}")
    
    if resultado['limitacoes_detectadas']:
        print(f"   🚨 Limitações: {', '.join(resultado['limitacoes_detectadas'])}")
    else:
        print(f"   ✅ Nenhuma limitação detectada")

print(f"\n📊 Estatísticas finais:")
print(f"   Alucinações detectadas: {validador.tipos_limitacao['alucinacao']}")
print(f"   Problemas de conhecimento: {validador.tipos_limitacao['conhecimento_limitado']}")

## 🌟 Resumo: O que Aprendemos Hoje

Liiindo! Chegamos ao final de mais um módulo intenso! Vamos recapitular os pontos principais:

### 🔑 Pontos-chave:

1. **LLMs não são perfeitos** - Têm limitações cognitivas importantes
2. **Custo é um fator crítico** - Treinamento e inferência são caros
3. **Alucinações são reais** - Podem inventar informações plausíveis
4. **Vieses são inevitáveis** - Herdam preconceitos dos dados
5. **Conhecimento tem prazo** - Ficam desatualizados rapidamente
6. **Mitigation é possível** - Existem estratégias para contornar limitações

### 🛠️ Ferramentas aprendidas:

- Detecção de alucinações matemáticas
- Sistemas de validação cruzada
- Estratégias de mitigação (RAG, prompting, etc.)
- Análise de vieses e impactos éticos

**Dica do Pedro**: Lembrem-se: conhecer as limitações não é desencorajador - é EMPODERANTE! Agora vocês sabem como usar LLMs de forma responsável e eficaz!

In [None]:
# Visualização final: Mapa mental das limitações e soluções
fig, ax = plt.subplots(figsize=(14, 10))

# Dados para o gráfico de radar das limitações
categorias = ['Alucinações', 'Vieses', 'Custos', 'Conhecimento\nLimitado', 
              'Raciocínio\nLógico', 'Ética']

# Impacto das limitações (0-10)
impacto_atual = [8, 9, 7, 6, 8, 9]
# Após aplicar mitigações
impacto_mitigado = [5, 6, 7, 4, 6, 6]

# Converte para coordenadas polares
angles = np.linspace(0, 2 * np.pi, len(categorias), endpoint=False).tolist()
angles += angles[:1]  # Completa o círculo

impacto_atual += impacto_atual[:1]
impacto_mitigado += impacto_mitigado[:1]

# Cria subplot polar
ax = plt.subplot(111, projection='polar')

# Plota os dados
ax.plot(angles, impacto_atual, 'o-', linewidth=2, label='Sem Mitigação', color='red')
ax.fill(angles, impacto_atual, alpha=0.25, color='red')

ax.plot(angles, impacto_mitigado, 'o-', linewidth=2, label='Com Mitigação', color='green')
ax.fill(angles, impacto_mitigado, alpha=0.25, color='green')

# Configurações
ax.set_xticks(angles[:-1])
ax.set_xticklabels(categorias)
ax.set_ylim(0, 10)
ax.set_yticks([2, 4, 6, 8, 10])
ax.set_yticklabels(['2', '4', '6', '8', '10'])
ax.grid(True)

plt.legend(loc='upper right', bbox_to_anchor=(1.3, 1.0))
plt.title('🎯 Impacto das Limitações: Antes e Depois da Mitigação\n', 
          size=14, fontweight='bold', pad=20)

plt.tight_layout()
plt.show()

print("\n🎉 PARABÉNS! Vocês agora são experts em limitações de LLMs!")
print("\n🚀 Próximo módulo: Projeto Final - onde vamos aplicar TUDO que aprendemos!")
print("\n💡 Lembrem-se: Um bom profissional de IA conhece tanto as capacidades quanto as limitações!")

## 🔗 Conectando com o Próximo Módulo

Agora que dominamos as limitações e desafios dos LLMs, estamos prontos para o **Projeto Final**! 🚀

No próximo módulo vamos:
- Aplicar todo conhecimento adquirido nos 11 módulos anteriores
- Construir um sistema completo que lida com limitações
- Implementar guardrails e validações
- Criar uma aplicação real e robusta

### 📚 Para se preparar:
- Revise os conceitos de prompting (Módulo 8)
- Relembre as técnicas de avaliação (Módulo 9) 
- Pense em como aplicar os guardrails (Módulo 10)
- Tenha em mente as limitações que acabamos de estudar

**Dica do Pedro**: O projeto final será seu portfólio! Caprichem que vai valer a pena! 💪

---

![](/Users/pedroguth/Downloads/Projetos/Book Maker/5-Imagens/introdução-à-llms-modulo-11_img_05.png)

**Até o próximo módulo, pessoal! Bora colocar a mão na massa! 🛠️**