In [3]:
# ============================================
# C√âLULA 2: AUTO-CONFIGURA√á√ÉO HAIKU 4.5
# ============================================
import boto3
import json
import pandas as pd
from datetime import datetime
from xhtml2pdf import pisa
import os
from pathlib import Path
import pickle

print("üìö Bibliotecas importadas!\n")

# Configurar Bedrock Runtime
bedrock_client = boto3.client(
    service_name='bedrock-runtime',
    region_name="us-east-2"
)

print("‚úÖ Cliente AWS Bedrock configurado!")
print("üîç Tentando configurar Claude Haiku 4.5...\n")

# ==============================================================
# ESTRAT√âGIA: Tentar m√∫ltiplas formas de acessar Haiku 4.5
# ==============================================================

MODEL_ID = None
MODEL_NAME = None

# TENTATIVA 1: Usar Application Inference Profile (cross-region)
print("üìå Tentativa 1: Application Inference Profile...")
try:
    # Para cross-region inference, usamos um formato especial
    # que roteia automaticamente para a regi√£o com capacidade
    test_model_id = 'us.anthropic.claude-haiku-4-5-20251001-v1:0'
    
    # Testar com uma chamada m√≠nima
    test_config = {
        "anthropic_version": "bedrock-2023-05-31",
        "max_tokens": 10,
        "messages": [{"role": "user", "content": "test"}]
    }
    
    response = bedrock_client.invoke_model(
        body=json.dumps(test_config),
        modelId=test_model_id,
        accept="application/json",
        contentType="application/json"
    )
    
    MODEL_ID = test_model_id
    MODEL_NAME = "Claude Haiku 4.5"
    print("   ‚úÖ SUCESSO! Claude Haiku 4.5 dispon√≠vel!\n")
    
except Exception as e:
    print(f"   ‚ùå N√£o dispon√≠vel: {str(e)[:100]}...\n")

# TENTATIVA 2: Inference Profile ARN direto
if not MODEL_ID:
    print("üìå Tentativa 2: ARN de Foundation Model...")
    try:
        test_model_id = 'arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-haiku-4-5-20251001-v1:0'
        
        test_config = {
            "anthropic_version": "bedrock-2023-05-31",
            "max_tokens": 10,
            "messages": [{"role": "user", "content": "test"}]
        }
        
        response = bedrock_client.invoke_model(
            body=json.dumps(test_config),
            modelId=test_model_id,
            accept="application/json",
            contentType="application/json"
        )
        
        MODEL_ID = test_model_id
        MODEL_NAME = "Claude Haiku 4.5"
        print("   ‚úÖ SUCESSO via ARN!\n")
        
    except Exception as e:
        print(f"   ‚ùå N√£o dispon√≠vel: {str(e)[:100]}...\n")

# TENTATIVA 3: Listar inference profiles dispon√≠veis
if not MODEL_ID:
    print("üìå Tentativa 3: Buscando Inference Profiles...")
    try:
        bedrock_config = boto3.client('bedrock', region_name="us-east-2")
        response = bedrock_config.list_inference_profiles()
        
        # Procurar por Haiku 4.5
        for profile in response.get('inferenceProfileSummaries', []):
            profile_id = profile.get('inferenceProfileId', '').lower()
            profile_arn = profile.get('inferenceProfileArn', '')
            
            if 'haiku' in profile_id and '4' in profile_id:
                # Testar este profile
                try:
                    test_config = {
                        "anthropic_version": "bedrock-2023-05-31",
                        "max_tokens": 10,
                        "messages": [{"role": "user", "content": "test"}]
                    }
                    
                    response = bedrock_client.invoke_model(
                        body=json.dumps(test_config),
                        modelId=profile_arn,
                        accept="application/json",
                        contentType="application/json"
                    )
                    
                    MODEL_ID = profile_arn
                    MODEL_NAME = "Claude Haiku 4.5"
                    print(f"   ‚úÖ SUCESSO! Profile encontrado: {profile_id}\n")
                    break
                    
                except:
                    continue
        
        if not MODEL_ID:
            print("   ‚ö†Ô∏è  Nenhum profile Haiku 4.5 funcional encontrado\n")
            
    except Exception as e:
        print(f"   ‚ùå Erro ao listar profiles: {str(e)[:100]}...\n")

# FALLBACK: Claude 3.5 Haiku (SEMPRE FUNCIONA)
if not MODEL_ID:
    print("üìå Fallback: Usando Claude 3.5 Haiku")
    MODEL_ID = 'us.anthropic.claude-3-5-haiku-20241022-v1:0'
    MODEL_NAME = "Claude 3.5 Haiku"
    print("   ‚úÖ Configurado!\n")

# ==============================================================
# RESUMO DA CONFIGURA√á√ÉO
# ==============================================================

print("="*60)
print(f"ü§ñ MODELO FINAL: {MODEL_NAME}")
print(f"üìç ID: {MODEL_ID}")
print("="*60)

if "4.5" in MODEL_NAME or "4-5" in MODEL_ID:
    print("\nüéâ √ìTIMA NOT√çCIA! Claude Haiku 4.5 est√° funcionando!")
    print("\nüí∞ CUSTOS ESTIMADOS:")
    print("   ‚Ä¢ Por quest√£o: ~$0.0008")
    print("   ‚Ä¢ 220 quest√µes: ~$0.18 USD")
    print("\n‚≠ê QUALIDADE:")
    print("   ‚Ä¢ Near-frontier performance")
    print("   ‚Ä¢ Melhor modelo custo-benef√≠cio dispon√≠vel")
    print("   ‚Ä¢ Ideal para an√°lises em escala")
else:
    print("\nüí° Usando Claude 3.5 Haiku (excelente op√ß√£o!)")
    print("\nüí∞ CUSTOS ESTIMADOS:")
    print("   ‚Ä¢ Por quest√£o: ~$0.003")
    print("   ‚Ä¢ 220 quest√µes: ~$0.66 USD")
    print("\n‚≠ê QUALIDADE:")
    print("   ‚Ä¢ Excelente performance")
    print("   ‚Ä¢ Comprovado e est√°vel")
    print("   ‚Ä¢ Com nosso prompt otimizado = √ìtimos resultados")

print("\n" + "="*60)
print("‚úÖ CONFIGURA√á√ÉO COMPLETA E TESTADA!")
print("üìå Pr√≥ximo: Execute C√©lula 3")
print("="*60)

üìö Bibliotecas importadas!

‚úÖ Cliente AWS Bedrock configurado!
üîç Tentando configurar Claude Haiku 4.5...

üìå Tentativa 1: Application Inference Profile...
   ‚úÖ SUCESSO! Claude Haiku 4.5 dispon√≠vel!

ü§ñ MODELO FINAL: Claude Haiku 4.5
üìç ID: us.anthropic.claude-haiku-4-5-20251001-v1:0

üéâ √ìTIMA NOT√çCIA! Claude Haiku 4.5 est√° funcionando!

üí∞ CUSTOS ESTIMADOS:
   ‚Ä¢ Por quest√£o: ~$0.0008
   ‚Ä¢ 220 quest√µes: ~$0.18 USD

‚≠ê QUALIDADE:
   ‚Ä¢ Near-frontier performance
   ‚Ä¢ Melhor modelo custo-benef√≠cio dispon√≠vel
   ‚Ä¢ Ideal para an√°lises em escala

‚úÖ CONFIGURA√á√ÉO COMPLETA E TESTADA!
üìå Pr√≥ximo: Execute C√©lula 3


In [4]:
# ============================================
# C√âLULA 3: PROMPT OTIMIZADO PARA PORTUGU√äS
# ============================================

# PROMPT ESPECIALIZADO PARA AN√ÅLISE DE QUEST√ïES DE PORTUGU√äS
# Adaptado para Sonnet 4.5 - An√°lise profunda e pedag√≥gica

PROMPT_PORTUGUES_OTIMIZADO = """Voc√™ √© um Professor Especialista em L√≠ngua Portuguesa com 15 anos de experi√™ncia analisando quest√µes de concursos p√∫blicos.

MISS√ÉO: Criar an√°lise pedag√≥gica COMPLETA e PROFISSIONAL desta quest√£o de Portugu√™s.

‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë  ESTRUTURA OBRIGAT√ìRIA DA AN√ÅLISE (SIGA RIGOROSAMENTE!)     ‚ïë
‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù

1Ô∏è‚É£ IDENTIFICA√á√ÉO R√ÅPIDA
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
üéØ Tema Central: [Ex: Concord√¢ncia Verbal, Interpreta√ß√£o Textual, Figuras de Linguagem]
üìö √Årea: [GRAM√ÅTICA / INTERPRETA√á√ÉO / LITERATURA / REDA√á√ÉO OFICIAL]
üìñ Sub√°rea: [Ex: Sintaxe, Sem√¢ntica, Morfologia, Compreens√£o, etc.]
üéì N√≠vel: [B√ÅSICO / INTERMEDI√ÅRIO / AVAN√áADO]
üé™ Padr√£o da Banca: [Tipo de enunciado usado]
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ


2Ô∏è‚É£ CONCEITOS-CHAVE (Memorize!)
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
Liste 4-5 conceitos lingu√≠sticos essenciais:

‚úì Conceito 1: [Nome] ‚Üí [Defini√ß√£o t√©cnica em 1 linha]
‚úì Conceito 2: [Nome] ‚Üí [Defini√ß√£o t√©cnica em 1 linha]
‚úì Conceito 3: [Nome] ‚Üí [Defini√ß√£o t√©cnica em 1 linha]
‚úì Conceito 4: [Nome] ‚Üí [Defini√ß√£o t√©cnica em 1 linha]
‚úì Conceito 5: [Nome] ‚Üí [Defini√ß√£o t√©cnica em 1 linha]

üìù REGRA GRAMATICAL APLIC√ÅVEL (se for quest√£o de gram√°tica):
[Cite a regra espec√≠fica da norma culta]
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ


3Ô∏è‚É£ AN√ÅLISE DE CADA ALTERNATIVA (CR√çTICO!)
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

Para CADA alternativa, estruture assim:

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ üî§ ALTERNATIVA A                                            ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

üìÑ Conte√∫do: [Reproduza ou resuma a alternativa]

Status: ‚ùå INCORRETA  (ou ‚úÖ CORRETA)

üìñ Fundamento Lingu√≠stico:
[Cite regra gramatical, teoria liter√°ria, ou t√©cnica de interpreta√ß√£o]
[Ex: "Segundo a NBV (Nomenclatura Gramatical Brasileira)..."]
[Ex: "Conforme Bechara/Cunha & Cintra/Celso Pedro Luft..."]

üí° An√°lise T√©cnica Detalhada:
[Para GRAM√ÅTICA: Explique a estrutura sint√°tica, morfol√≥gica ou sem√¢ntica]
[Para INTERPRETA√á√ÉO: Analise o texto-base, identifique infer√™ncias]
[Para LITERATURA: Contextualize escola liter√°ria, autor, caracter√≠sticas]
[Identifique elementos-chave: palavras, express√µes, estruturas]

üîç An√°lise Espec√≠fica:
- Classe gramatical: [Se aplic√°vel]
- Fun√ß√£o sint√°tica: [Se aplic√°vel]
- Rela√ß√£o sem√¢ntica: [Se aplic√°vel]
- Elementos textuais: [Se aplic√°vel]

‚ö†Ô∏è Pegadinha (se houver):
[Explique a armadilha da banca: troca de sentido, confus√£o de termos, etc.]

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ üî§ ALTERNATIVA B                                            ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

[Repita estrutura completa]

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ üî§ ALTERNATIVA C                                            ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

[Repita estrutura completa]

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ üî§ ALTERNATIVA D                                            ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

[Repita estrutura completa]

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
‚îÇ üî§ ALTERNATIVA E                                            ‚îÇ
‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò

[Repita estrutura completa]

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ


4Ô∏è‚É£ GABARITO DEFINITIVO
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
‚úÖ GABARITO: {gabarito}

üéØ Por que esta √© a √öNICA correta:
[Reforce o racioc√≠nio lingu√≠stico em 2-3 linhas]
[Cite a regra ou princ√≠pio que fundamenta]

üìù Resumo em 1 frase:
[S√≠ntese t√©cnica da resposta correta]

üîë Palavra-chave da quest√£o:
[Identifique o termo ou express√£o que resolve a quest√£o]
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ


5Ô∏è‚É£ PEGADINHAS IDENTIFICADAS
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
Liste TODAS as pegadinhas desta quest√£o:

‚ö†Ô∏è Pegadinha 1: [Ex: Troca de sentido sutil, paron√≠mia]
‚ö†Ô∏è Pegadinha 2: [Ex: Estrutura sint√°tica similar mas com erro]
‚ö†Ô∏è Pegadinha 3: [Ex: Interpreta√ß√£o literal vs. infer√™ncia]

üö´ ARMADILHAS LINGU√çSTICAS encontradas:
- Palavras confund√≠veis: [Liste pares como mal/mau, mas/mais]
- Estruturas amb√≠guas: [Identifique]
- Mudan√ßas de sentido: [Destaque]
- Erros sutis: [Aponte]

üìä DISTRATORES (alternativas incorretas):
[Explique por que as incorretas parecem corretas]
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ


6Ô∏è‚É£ ESTRAT√âGIA DE RESOLU√á√ÉO
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
üìö COMO ESTUDAR:
- [Dica pr√°tica 1 - Ex: "Revise regras de concord√¢ncia verbal"]
- [Dica pr√°tica 2 - Ex: "Pratique identifica√ß√£o de fun√ß√µes sint√°ticas"]
- [Dica pr√°tica 3 - Ex: "Leia textos do mesmo g√™nero"]

üîó TEMAS RELACIONADOS PARA REVISAR:
- [Tema 1 - Ex: Reg√™ncia verbal]
- [Tema 2 - Ex: Coloca√ß√£o pronominal]
- [Tema 3 - Ex: Tipologia textual]

üìñ GRAM√ÅTICOS DE REFER√äNCIA:
[Cite Bechara, Cunha & Cintra, Celso Luft, ou outros conforme tema]

‚úçÔ∏è DICA DE PROVA (OURO!):
[Uma estrat√©gia r√°pida para resolver quest√µes similares]

‚è±Ô∏è TEMPO IDEAL DE RESOLU√á√ÉO:
Iniciante: [X min] | Experiente: [Y min]
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ


7Ô∏è‚É£ AN√ÅLISE FINAL
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
üìä Dificuldade: [B√ÅSICO/INTERMEDI√ÅRIO/AVAN√áADO]
Justificativa: [Por qu√™?]

üéØ Compet√™ncia Avaliada:
[ ] Conhecimento gramatical
[ ] Interpreta√ß√£o textual
[ ] An√°lise sint√°tica
[ ] Conhecimento liter√°rio
[ ] Dom√≠nio sem√¢ntico
[ ] Norma culta vs. coloquial

üìà Frequ√™ncia em Concursos:
Este tema √©: [Muito Cobrado / M√©dio / Raro]

üéì TIPO DE QUEST√ÉO:
[ ] Decoreba (requer memoriza√ß√£o)
[ ] Racioc√≠nio (requer an√°lise)
[ ] Interpreta√ß√£o (requer compreens√£o textual)
[ ] Mista

üí° DICA FINAL DE OURO:
[Uma dica valiosa para o concurseiro dominar este tema]
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë  REGRAS OBRIGAT√ìRIAS (N√ÉO PULE NADA!)                       ‚ïë
‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù

‚úì Analise TODAS as 5 alternativas com a estrutura completa
‚úì Cite fundamentos lingu√≠sticos ESPEC√çFICOS (gram√°ticos, regras)
‚úì Identifique TODAS as pegadinhas e armadilhas
‚úì Para GRAM√ÅTICA: cite a regra e exemplifique
‚úì Para INTERPRETA√á√ÉO: relacione com o texto-base
‚úì Para LITERATURA: contextualize movimento/autor
‚úì Use linguagem T√âCNICA mas DID√ÅTICA
‚úì Seja DETALHADO (m√≠nimo 3000 caracteres)
‚úì Marque claramente ‚úÖ CORRETA ou ‚ùå INCORRETA
‚úì Mantenha a formata√ß√£o com emojis e linhas
‚úì Se houver texto-base, referencie trechos espec√≠ficos

‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê

üìä DADOS DA QUEST√ÉO:

CONTEXTO:
- Banca: {banca}
- Ano: {ano}
- √ìrg√£o: {orgao}
- Prova: {prova}
- Disciplina: {disciplina}
- Assunto: {assunto}

ENUNCIADO:
{enunciado}

ALTERNATIVAS:
A) {alt_a}
B) {alt_b}
C) {alt_c}
D) {alt_d}
E) {alt_e}

GABARITO OFICIAL: {gabarito}

‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê

IMPORTANTE: Sua an√°lise ser√° avaliada por:
‚úì Completude (analisou todas alternativas?)
‚úì Profundidade (fundamentos lingu√≠sticos citados?)
‚úì Clareza (estrutura organizada?)
‚úì Precis√£o t√©cnica (termos corretos da gram√°tica?)
‚úì Utilidade pedag√≥gica (ensina de verdade?)

ATEN√á√ÉO ESPECIAL:
- Se for quest√£o de INTERPRETA√á√ÉO: analise o texto-base linha por linha
- Se for quest√£o de GRAM√ÅTICA: cite a regra e d√™ exemplos
- Se for quest√£o de LITERATURA: contextualize escola liter√°ria
- Se for quest√£o de REDA√á√ÉO OFICIAL: cite manual (MRPR 3¬™ ed.)

Comece agora com "1Ô∏è‚É£ IDENTIFICA√á√ÉO R√ÅPIDA":"""

print("‚úÖ Prompt ULTRA-OTIMIZADO para PORTUGU√äS configurado!")
print("\nüìã Caracter√≠sticas do prompt:")
print("   ‚úì Adaptado para quest√µes de L√≠ngua Portuguesa")
print("   ‚úì Cobre: Gram√°tica, Interpreta√ß√£o, Literatura, Reda√ß√£o")
print("   ‚úì Estrutura visual clara com emojis e separadores")
print("   ‚úì Instru√ß√µes espec√≠ficas para cada tipo de quest√£o")
print("   ‚úì Refer√™ncias a gram√°ticos e norma culta")
print("   ‚úì An√°lise de pegadinhas lingu√≠sticas")
print("   ‚úì Valida√ß√£o de qualidade pedag√≥gica")
print("\n" + "="*60)
print("üìå Pr√≥ximo: Execute C√©lula 4")
print("="*60)

‚úÖ Prompt ULTRA-OTIMIZADO para PORTUGU√äS configurado!

üìã Caracter√≠sticas do prompt:
   ‚úì Adaptado para quest√µes de L√≠ngua Portuguesa
   ‚úì Cobre: Gram√°tica, Interpreta√ß√£o, Literatura, Reda√ß√£o
   ‚úì Estrutura visual clara com emojis e separadores
   ‚úì Instru√ß√µes espec√≠ficas para cada tipo de quest√£o
   ‚úì Refer√™ncias a gram√°ticos e norma culta
   ‚úì An√°lise de pegadinhas lingu√≠sticas
   ‚úì Valida√ß√£o de qualidade pedag√≥gica

üìå Pr√≥ximo: Execute C√©lula 4


In [5]:
# ============================================
# C√âLULA 4: AN√ÅLISE OTIMIZADA PARA PORTUGU√äS
# ============================================

# Criar pasta de cache
CACHE_DIR = Path('cache_analises_portugues')
CACHE_DIR.mkdir(exist_ok=True)

def validar_qualidade_analise(analise, questao_dict):
    """Valida qualidade da an√°lise de quest√µes de Portugu√™s"""
    score = 0
    
    # 1. Tamanho adequado
    tamanho = len(analise)
    if tamanho >= 3500:
        score += 20
    elif tamanho >= 2500:
        score += 15
    elif tamanho >= 1800:
        score += 10
    
    # 2. An√°lise de TODAS alternativas
    alternativas_presentes = sum([
        'ALTERNATIVA A' in analise.upper(),
        'ALTERNATIVA B' in analise.upper(),
        'ALTERNATIVA C' in analise.upper(),
        'ALTERNATIVA D' in analise.upper(),
        'ALTERNATIVA E' in analise.upper()
    ])
    score += alternativas_presentes * 12
    
    # 3. Marca√ß√£o clara de corretas/incorretas
    tem_marcacoes = analise.count('‚úÖ') + analise.count('‚ùå')
    if tem_marcacoes >= 5:
        score += 10
    elif tem_marcacoes >= 3:
        score += 5
    
    # 4. Fundamentos lingu√≠sticos (adaptado para Portugu√™s)
    termos_linguisticos = [
        'regra' in analise.lower() or 'norma' in analise.lower(),
        'gram√°tica' in analise.lower() or 'gramatical' in analise.lower(),
        'sem√¢ntica' in analise.lower() or 'sintaxe' in analise.lower(),
        'bechara' in analise.lower() or 'cunha' in analise.lower() or 'luft' in analise.lower(),
        'classe' in analise.lower() or 'fun√ß√£o' in analise.lower(),
        'interpreta√ß√£o' in analise.lower() or 'compreens√£o' in analise.lower()
    ]
    score += sum(termos_linguisticos) * 2
    
    # 5. Estrutura organizada
    tem_estrutura = all([
        'IDENTIFICA√á√ÉO' in analise.upper() or '1Ô∏è‚É£' in analise,
        'CONCEITOS' in analise.upper() or '2Ô∏è‚É£' in analise,
        'GABARITO' in analise.upper()
    ])
    if tem_estrutura:
        score += 10
    
    # 6. An√°lise de pegadinhas lingu√≠sticas
    if 'pegadinha' in analise.lower() or '‚ö†Ô∏è' in analise:
        score += 8
    
    # 7. An√°lise t√©cnica espec√≠fica de Portugu√™s
    tem_analise_tecnica = any([
        'classe gramatical' in analise.lower(),
        'fun√ß√£o sint√°tica' in analise.lower(),
        'concord√¢ncia' in analise.lower(),
        'reg√™ncia' in analise.lower(),
        'coloca√ß√£o' in analise.lower(),
        'figura de linguagem' in analise.lower()
    ])
    if tem_analise_tecnica:
        score += 5
    
    return min(score, 100)


def analisar_questao_com_ia_otimizada(questao_dict, max_tentativas=2):
    """
    An√°lise otimizada de quest√µes de Portugu√™s com retry inteligente
    """
    
    questao_id = questao_dict.get('id_questao', 'unknown')
    cache_file = CACHE_DIR / f"{questao_id}.pkl"
    
    # Verificar cache
    if cache_file.exists():
        print(f"   üíæ Cache encontrado!")
        with open(cache_file, 'rb') as f:
            return pickle.load(f)
    
    # Gerar an√°lise
    for tentativa in range(1, max_tentativas + 1):
        try:
            if tentativa > 1:
                print(f"   üîÑ Tentativa {tentativa}/{max_tentativas}...")
            
            # Montar prompt
            prompt_final = PROMPT_PORTUGUES_OTIMIZADO.format(
                banca=questao_dict.get('banca', 'N/A'),
                ano=questao_dict.get('ano', 'N/A'),
                orgao=questao_dict.get('orgao', 'N/A'),
                prova=questao_dict.get('prova', 'N/A'),
                disciplina=questao_dict.get('disciplina', 'N/A'),
                assunto=questao_dict.get('assunto', 'N/A'),
                enunciado=questao_dict.get('enunciado', 'N/A'),
                alt_a=questao_dict.get('alt_a', 'N/A'),
                alt_b=questao_dict.get('alt_b', 'N/A'),
                alt_c=questao_dict.get('alt_c', 'N/A'),
                alt_d=questao_dict.get('alt_d', 'N/A'),
                alt_e=questao_dict.get('alt_e', 'N/A'),
                gabarito=questao_dict.get('gabarito', 'N/A')
            )
            
            # ‚úÖ CONFIGURA√á√ÉO CORRIGIDA (SEM top_p)
            config = {
                "anthropic_version": "bedrock-2023-05-31",
                "max_tokens": 5000,
                "temperature": 0.3,  # ‚úÖ S√≥ temperature
                "system": """Voc√™ √© um Professor PhD em L√≠ngua Portuguesa, especialista em an√°lise pedag√≥gica de quest√µes de concursos.

SUAS CARACTER√çSTICAS:
- 15 anos de experi√™ncia em concursos p√∫blicos
- Taxa de aprova√ß√£o dos alunos: 87%
- Especialidade: Identificar pegadinhas lingu√≠sticas
- Dom√≠nio completo: Gram√°tica, Interpreta√ß√£o, Literatura, Reda√ß√£o
- M√©todo: An√°lises completas, t√©cnicas e did√°ticas

SEUS PRINC√çPIOS:
1. SEMPRE analisar TODAS as 5 alternativas
2. SEMPRE citar fundamentos lingu√≠sticos espec√≠ficos (gram√°ticos, regras NBG)
3. SEMPRE identificar pegadinhas e armadilhas
4. SEMPRE manter estrutura clara com emojis
5. SEMPRE ser t√©cnico mas did√°tico
6. Para GRAM√ÅTICA: citar regras e exemplificar
7. Para INTERPRETA√á√ÉO: referenciar o texto-base
8. Para LITERATURA: contextualizar escola/autor

Voc√™ N√ÉO aceita an√°lises superficiais. Cada resposta deve ENSINAR profundamente.""",
                "messages": [
                    {
                        "role": "user",
                        "content": prompt_final
                    }
                ]
            }
            
            # Invocar Bedrock
            response = bedrock_client.invoke_model(
                body=json.dumps(config),
                modelId=MODEL_ID,
                accept="application/json",
                contentType="application/json"
            )
            
            # Extrair resposta
            resposta = json.loads(response['body'].read().decode('utf-8'))
            analise = resposta.get('content', [{}])[0].get('text', 'Erro')
            
            # Validar qualidade
            score = validar_qualidade_analise(analise, questao_dict)
            print(f"   üìä Score de qualidade: {score}/100")
            
            # Se qualidade boa, salvar e retornar
            if score >= 65:
                print(f"   ‚úÖ An√°lise aprovada!")
                
                # Salvar no cache
                with open(cache_file, 'wb') as f:
                    pickle.dump(analise, f)
                
                return analise
            
            # Se qualidade baixa e ainda tem tentativas, ajustar
            elif tentativa < max_tentativas:
                print(f"   ‚ö†Ô∏è  Qualidade abaixo do ideal, ajustando...")
                # Na pr√≥xima tentativa, aumentar temperature
                config["temperature"] = 0.4
                
        except Exception as e:
            print(f"   ‚ùå Erro: {str(e)[:100]}")
            if tentativa == max_tentativas:
                return f"‚ùå Erro ap√≥s {max_tentativas} tentativas: {str(e)}"
            continue
    
    # Retornar √∫ltima tentativa mesmo se n√£o ideal
    with open(cache_file, 'wb') as f:
        pickle.dump(analise, f)
    return analise


print("‚úÖ Sistema de an√°lise para PORTUGU√äS criado!")
print("\nüîß Configura√ß√£o:")
print("   ‚úÖ Modelo: Claude Sonnet 4.5")
print("   ‚úÖ Temperature: 0.3 (sem top_p)")
print("   ‚úÖ Max tokens: 5000")
print("\nüìä Funcionalidades:")
print("   ‚úì Cache inteligente em: cache_analises_portugues/")
print("   ‚úì Retry autom√°tico (at√© 2 tentativas)")
print("   ‚úì Valida√ß√£o de qualidade lingu√≠stica")
print("   ‚úì Score m√≠nimo: 65/100")
print("\nüéØ Crit√©rios de valida√ß√£o:")
print("   ‚úì An√°lise de todas as 5 alternativas")
print("   ‚úì Fundamentos lingu√≠sticos citados")
print("   ‚úì Estrutura organizada com emojis")
print("   ‚úì Identifica√ß√£o de pegadinhas")
print("   ‚úì An√°lise t√©cnica (gram√°tica/interpreta√ß√£o)")
print("\n" + "="*60)
print("‚úÖ PRONTO PARA ANALISAR QUEST√ïES DE PORTUGU√äS!")
print("üìå Pr√≥ximo: Execute C√©lula 5 (carregar quest√µes)")
print("="*60)

‚úÖ Sistema de an√°lise para PORTUGU√äS criado!

üîß Configura√ß√£o:
   ‚úÖ Modelo: Claude Sonnet 4.5
   ‚úÖ Temperature: 0.3 (sem top_p)
   ‚úÖ Max tokens: 5000

üìä Funcionalidades:
   ‚úì Cache inteligente em: cache_analises_portugues/
   ‚úì Retry autom√°tico (at√© 2 tentativas)
   ‚úì Valida√ß√£o de qualidade lingu√≠stica
   ‚úì Score m√≠nimo: 65/100

üéØ Crit√©rios de valida√ß√£o:
   ‚úì An√°lise de todas as 5 alternativas
   ‚úì Fundamentos lingu√≠sticos citados
   ‚úì Estrutura organizada com emojis
   ‚úì Identifica√ß√£o de pegadinhas
   ‚úì An√°lise t√©cnica (gram√°tica/interpreta√ß√£o)

‚úÖ PRONTO PARA ANALISAR QUEST√ïES DE PORTUGU√äS!
üìå Pr√≥ximo: Execute C√©lula 5 (carregar quest√µes)


In [6]:
# ============================================
# C√âLULA 5: FUN√á√ÉO DE GERA√á√ÉO DE PDF
# ============================================

def gerar_pdf_questao(questao_dict, analise_ia, output_path):
    """
    Gera PDF formatado profissionalmente para quest√µes de Portugu√™s
    """
    
    # Fun√ß√£o para escapar HTML
    def escape_html(text):
        if pd.isna(text):
            return 'N/A'
        return (str(text)
                .replace('&', '&amp;')
                .replace('<', '&lt;')
                .replace('>', '&gt;')
                .replace('"', '&quot;')
                .replace("'", '&#39;'))
    
    # Converter an√°lise para HTML
    analise_html = escape_html(analise_ia)
    analise_html = (analise_html
                   .replace('\n\n', '</p><p>')
                   .replace('\n', '<br/>')
                   .replace('**', '<b>')
                   .replace('**', '</b>'))
    
    # Gerar HTML das alternativas
    def gerar_html_alternativas(q):
        gabarito = str(q.get('gabarito', '')).strip().upper()
        alternativas_html = ""
        
        for letra in ['A', 'B', 'C', 'D', 'E']:
            texto = escape_html(q.get(f'alt_{letra.lower()}', 'N/A'))
            eh_correta = (letra == gabarito)
            
            if eh_correta:
                estilo = 'background: linear-gradient(135deg, #d4edda 0%, #c3e6cb 100%); border-left: 5px solid #28a745; padding: 15px; margin: 12px 0; border-radius: 6px; box-shadow: 0 2px 4px rgba(0,0,0,0.1);'
                label_estilo = 'background-color: #28a745; color: white; padding: 6px 14px; border-radius: 5px; font-weight: bold; margin-right: 12px; font-size: 13pt;'
                simbolo = '‚úÖ'
            else:
                estilo = 'background-color: #f8f9fa; border-left: 4px solid #dee2e6; padding: 15px; margin: 12px 0; border-radius: 6px;'
                label_estilo = 'background-color: #6c757d; color: white; padding: 6px 14px; border-radius: 5px; font-weight: bold; margin-right: 12px; font-size: 13pt;'
                simbolo = '‚¨ú'
            
            alternativas_html += f'''
            <div style="{estilo}">
                <span style="{label_estilo}">{letra}</span>
                <span style="font-weight: bold; font-size: 12pt;">{simbolo}</span>
                <span style="font-size: 11pt;">{texto}</span>
            </div>
            '''
        
        return alternativas_html
    
    # Template HTML
    html_template = f'''
    <!DOCTYPE html>
    <html>
    <head>
        <meta charset="UTF-8"/>
        <style>
            @page {{ size: a4 portrait; margin: 1.8cm; }}
            body {{ font-family: Arial; font-size: 11pt; line-height: 1.7; color: #2c3e50; }}
            .header {{ background: linear-gradient(135deg, #667eea 0%, #764ba2 100%); color: white; padding: 28px; text-align: center; margin-bottom: 25px; border-radius: 10px; box-shadow: 0 4px 6px rgba(0,0,0,0.1); }}
            .header h1 {{ margin: 0 0 12px 0; font-size: 26pt; font-weight: bold; }}
            .metadata {{ font-size: 11pt; opacity: 0.95; line-height: 1.6; }}
            .metadata-badge {{ background-color: rgba(255,255,255,0.2); padding: 4px 12px; border-radius: 15px; margin: 3px; display: inline-block; }}
            .section {{ margin-bottom: 22px; }}
            .section-title {{ background: linear-gradient(135deg, #f8f9fa 0%, #e9ecef 100%); padding: 14px 20px; border-left: 6px solid #667eea; font-size: 15pt; font-weight: bold; margin-bottom: 16px; color: #2c3e50; border-radius: 5px; }}
            .info-grid {{ display: table; width: 100%; margin: 15px 0; }}
            .info-row {{ display: table-row; }}
            .info-label {{ display: table-cell; background-color: #f8f9fa; font-weight: bold; padding: 12px; border: 1px solid #dee2e6; width: 30%; }}
            .info-value {{ display: table-cell; padding: 12px; border: 1px solid #dee2e6; background-color: white; }}
            .enunciado {{ background: linear-gradient(135deg, #fffbea 0%, #fff8dc 100%); border: 3px solid #ffd93d; padding: 20px; margin: 18px 0; font-size: 12pt; line-height: 1.8; border-radius: 8px; }}
            .gabarito-box {{ background: linear-gradient(135deg, #28a745 0%, #20c997 100%); color: white; padding: 25px; text-align: center; font-size: 20pt; font-weight: bold; margin: 25px 0; border-radius: 10px; }}
            .analise-ia {{ background: linear-gradient(135deg, #e3f2fd 0%, #bbdefb 100%); border: 3px solid #2196f3; padding: 20px; margin: 20px 0; border-radius: 8px; line-height: 1.9; }}
            .footer {{ margin-top: 40px; padding-top: 20px; border-top: 3px solid #dee2e6; text-align: center; font-size: 9pt; color: #6c757d; }}
            .id-badge {{ background-color: #6c757d; color: white; padding: 5px 12px; border-radius: 5px; font-size: 9pt; font-weight: bold; display: inline-block; margin-top: 10px; }}
        </style>
    </head>
    <body>
        <div class="header">
            <h1>üìã AN√ÅLISE PEDAG√ìGICA - PORTUGU√äS</h1>
            <div class="metadata">
                <span class="metadata-badge">üèõÔ∏è {escape_html(questao_dict.get('banca', 'N/A'))}</span>
                <span class="metadata-badge">üìÖ {escape_html(questao_dict.get('ano', 'N/A'))}</span>
                <span class="metadata-badge">üè¢ {escape_html(questao_dict.get('orgao', 'N/A'))}</span>
                <br/><span style="font-size: 10pt;">{escape_html(questao_dict.get('prova', 'N/A'))}</span>
            </div>
        </div>
        
        <div class="section">
            <div class="section-title">üìä IDENTIFICA√á√ÉO</div>
            <div class="info-grid">
                <div class="info-row"><div class="info-label">üìö Disciplina</div><div class="info-value">{escape_html(questao_dict.get('disciplina', 'N/A'))}</div></div>
                <div class="info-row"><div class="info-label">üìñ Assunto</div><div class="info-value">{escape_html(questao_dict.get('assunto', 'N/A'))}</div></div>
                <div class="info-row"><div class="info-label">üèõÔ∏è Banca</div><div class="info-value">{escape_html(questao_dict.get('banca', 'N/A'))}</div></div>
                <div class="info-row"><div class="info-label">üìÖ Ano</div><div class="info-value">{escape_html(questao_dict.get('ano', 'N/A'))}</div></div>
                <div class="info-row"><div class="info-label">üè¢ √ìrg√£o</div><div class="info-value">{escape_html(questao_dict.get('orgao', 'N/A'))}</div></div>
                <div class="info-row"><div class="info-label">‚úÖ Gabarito</div><div class="info-value"><b style="color: #28a745; font-size: 14pt;">{escape_html(questao_dict.get('gabarito', 'N/A'))}</b></div></div>
            </div>
            <div class="id-badge">ID: {escape_html(questao_dict.get('id_questao', 'N/A'))}</div>
        </div>
        
        <div class="section">
            <div class="section-title">üìù ENUNCIADO</div>
            <div class="enunciado">{escape_html(questao_dict.get('enunciado', 'N/A'))}</div>
        </div>
        
        <div class="section">
            <div class="section-title">üî§ ALTERNATIVAS</div>
            {gerar_html_alternativas(questao_dict)}
        </div>
        
        <div class="gabarito-box">‚úÖ GABARITO: ALTERNATIVA {escape_html(questao_dict.get('gabarito', 'N/A'))}</div>
        
        <div class="section">
            <div class="section-title">ü§ñ AN√ÅLISE PEDAG√ìGICA COMPLETA</div>
            <div class="analise-ia"><p>{analise_html}</p></div>
        </div>
        
        <div class="footer">
            üìö An√°lise Lingu√≠stica Profissional<br/>
            Gerada via <b>AWS Bedrock - Claude Sonnet 4.5</b><br/>
            Sistema de An√°lise Pedag√≥gica para Portugu√™s v2.0<br/>
            {datetime.now().strftime('%d/%m/%Y √†s %H:%M:%S')}
        </div>
    </body>
    </html>
    '''
    
    # Gerar PDF
    try:
        with open(output_path, "wb") as pdf_file:
            pisa_status = pisa.CreatePDF(html_template, dest=pdf_file)
        
        if not pisa_status.err:
            print(f"   ‚úÖ PDF salvo: {output_path}")
            return True
        else:
            print(f"   ‚ùå Erro ao gerar PDF")
            return False
    except Exception as e:
        print(f"   ‚ùå Erro ao gerar PDF: {str(e)}")
        raise

print("‚úÖ Fun√ß√£o de gera√ß√£o de PDF para PORTUGU√äS criada!")
print("\nüìÑ Caracter√≠sticas do PDF:")
print("   ‚úì Layout profissional com gradientes")
print("   ‚úì Gabarito destacado em verde")
print("   ‚úì Alternativas formatadas com cores")
print("   ‚úì An√°lise pedag√≥gica completa")
print("   ‚úì Identifica√ß√£o clara do modelo (Sonnet 4.5)")
print("   ‚úì Cabe√ßalho personalizado para Portugu√™s")
print("\n" + "="*60)
print("üìå Pr√≥ximo: Execute C√©lula 6 (carregar quest√µes)")
print("="*60)

‚úÖ Fun√ß√£o de gera√ß√£o de PDF para PORTUGU√äS criada!

üìÑ Caracter√≠sticas do PDF:
   ‚úì Layout profissional com gradientes
   ‚úì Gabarito destacado em verde
   ‚úì Alternativas formatadas com cores
   ‚úì An√°lise pedag√≥gica completa
   ‚úì Identifica√ß√£o clara do modelo (Sonnet 4.5)
   ‚úì Cabe√ßalho personalizado para Portugu√™s

üìå Pr√≥ximo: Execute C√©lula 6 (carregar quest√µes)


In [7]:
# ============================================
# C√âLULA 6: CARREGAR DATASET DE PORTUGU√äS
# ============================================

# üìù INSTRU√á√ïES: Atualize o caminho para seu arquivo de quest√µes de Portugu√™s
CAMINHO_ARQUIVO = 'C:\welligton-projects-IA\RPA-PROJETO-1\questoes_PORTUGUES_TODAS_FGV_TJ.xlsx'

print(f"üìÇ Carregando dataset de Portugu√™s...")
print("‚è≥ Aguarde...\n")

try:
    df = pd.read_excel(CAMINHO_ARQUIVO)
    
    print(f"‚úÖ Dataset carregado!")
    print(f"üìä Total: {len(df)} quest√µes\n")
    
    print("üìà ESTAT√çSTICAS:")
    print(f"   üèõÔ∏è  Banca: {df['Banca'].unique()[0] if 'Banca' in df.columns else 'N/A'}")
    
    if 'Ano' in df.columns:
        anos_disponiveis = sorted(df['Ano'].dropna().unique())
        print(f"   üìÖ Anos: {anos_disponiveis}")
    
    if 'Orgao' in df.columns:
        print(f"   üè¢ √ìrg√£os: {df['Orgao'].nunique()} diferentes")
    
    if 'Assunto' in df.columns:
        print(f"   üìö Assuntos: {df['Assunto'].nunique()} temas diferentes")
        print(f"\nüìñ Principais assuntos:")
        top_assuntos = df['Assunto'].value_counts().head(5)
        for assunto, count in top_assuntos.items():
            print(f"      ‚Ä¢ {assunto}: {count} quest√µes")
    
    print("\nüìä Distribui√ß√£o de Gabaritos:")
    if 'Resposta_Correta' in df.columns:
        for gab, count in df['Resposta_Correta'].value_counts().sort_index().items():
            porc = (count / len(df)) * 100
            barra = '‚ñà' * int(porc / 2)
            print(f"   Alt {gab}: {count:3d} ({porc:5.1f}%) {barra}")
    
    print("\nüîç Colunas encontradas no dataset:")
    print(f"   {', '.join(df.columns.tolist())}")
    
    print("\n" + "="*60)
    print("‚úÖ DATASET PRONTO PARA AN√ÅLISE!")
    print("üìå Pr√≥ximo: Execute C√©lula 7 para TESTAR")
    print("="*60)
    
except FileNotFoundError:
    print(f"‚ùå ERRO: Arquivo n√£o encontrado!")
    print(f"\nüìÅ Caminho atual: {CAMINHO_ARQUIVO}")
    print("\nüí° SOLU√á√ÉO:")
    print("   1. Verifique se o arquivo existe")
    print("   2. Copie o caminho correto do arquivo")
    print("   3. Atualize a vari√°vel CAMINHO_ARQUIVO acima")
    print("   4. Use barras duplas (\\\\) no Windows")
    print("\nüìù Exemplo:")
    print("   CAMINHO_ARQUIVO = 'C:\\\\Users\\\\Seu Nome\\\\questoes_portugues.xlsx'")
    
except Exception as e:
    print(f"‚ùå ERRO: {str(e)}")
    print(f"\nüîç Detalhes: {type(e).__name__}")

  CAMINHO_ARQUIVO = 'C:\welligton-projects-IA\RPA-PROJETO-1\questoes_PORTUGUES_TODAS_FGV_TJ.xlsx'


üìÇ Carregando dataset de Portugu√™s...
‚è≥ Aguarde...

‚úÖ Dataset carregado!
üìä Total: 180 quest√µes

üìà ESTAT√çSTICAS:
   üèõÔ∏è  Banca: FGV
   üìÖ Anos: [np.int64(2008), np.int64(2013), np.int64(2014), np.int64(2015), np.int64(2018), np.int64(2019), np.int64(2020), np.int64(2021), np.int64(2022), np.int64(2023), np.int64(2024)]
   üè¢ √ìrg√£os: 18 diferentes
   üìö Assuntos: 6 temas diferentes

üìñ Principais assuntos:
      ‚Ä¢ Morfologia,: 88 quest√µes
      ‚Ä¢ Morfologia - Verbos,: 53 quest√µes
      ‚Ä¢ Ortografia,: 23 quest√µes
      ‚Ä¢ Interpreta√ß√£o de Textos,: 13 quest√µes
      ‚Ä¢ Sintaxe,: 2 quest√µes

üìä Distribui√ß√£o de Gabaritos:
   Alt A:  41 ( 22.8%) ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà
   Alt B:  37 ( 20.6%) ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà
   Alt C:  35 ( 19.4%) ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà
   Alt D:  26 ( 14.4%) ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà
   Alt E:  41 ( 22.8%) ‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà

üîç Colunas encontradas no dataset:
   ID_Questao, Indice_Pagi

In [8]:
# ============================================
# C√âLULA 7: TESTE COM 1 QUEST√ÉO DE PORTUGU√äS
# ============================================

def testar_questao(dataframe, indice=0):
    """Testa an√°lise com 1 quest√£o de Portugu√™s"""
    
    print("üß™ TESTE - Processando 1 quest√£o de Portugu√™s")
    print("="*70 + "\n")
    
    try:
        row = dataframe.iloc[indice]
        
        # Montar dicion√°rio da quest√£o
        questao = {
            'id_questao': row.get('ID_Questao', f'Q{indice+1}'),
            'banca': row.get('Banca', 'N/A'),
            'ano': row.get('Ano', 'N/A'),
            'orgao': row.get('Orgao', 'N/A'),
            'prova': row.get('Prova', 'N/A'),
            'disciplina': row.get('Disciplina', 'Portugu√™s'),
            'assunto': row.get('Assunto', 'N/A'),
            'enunciado': row.get('Enunciado', 'N/A'),
            'alt_a': row.get('Alternativa_A', 'N/A'),
            'alt_b': row.get('Alternativa_B', 'N/A'),
            'alt_c': row.get('Alternativa_C', 'N/A'),
            'alt_d': row.get('Alternativa_D', 'N/A'),
            'alt_e': row.get('Alternativa_E', 'N/A'),
            'gabarito': str(row.get('Resposta_Correta', 'N/A')).strip().upper()
        }
        
        print(f"üìã ID: {questao['id_questao']}")
        print(f"üèõÔ∏è  Banca: {questao['banca']}")
        print(f"üìÖ Ano: {questao['ano']} | üè¢ √ìrg√£o: {questao['orgao']}")
        print(f"üìñ Assunto: {questao['assunto'][:60]}...")
        print(f"‚úÖ Gabarito: {questao['gabarito']}\n")
        
        print("ü§ñ Analisando com Claude Sonnet 4.5...")
        print("‚è≥ Aguarde 20-30 segundos (an√°lise profunda)...\n")
        
        # Analisar quest√£o
        analise = analisar_questao_com_ia_otimizada(questao)
        
        # Verificar se houve erro
        if analise.startswith("‚ùå"):
            raise Exception(analise)
        
        # Mostrar preview da an√°lise
        print(f"\nüìè Tamanho da an√°lise: {len(analise)} caracteres")
        print(f"üìä Preview (primeiros 700 caracteres):\n")
        print("="*70)
        print(analise[:700] + "...")
        print("="*70 + "\n")
        
        # Gerar PDF de teste
        print("üìÑ Gerando PDF de teste...")
        output_path = f'TESTE_PORTUGUES_{questao["id_questao"]}.pdf'
        gerar_pdf_questao(questao, analise, output_path)
        
        print("\n" + "="*70)
        print("‚úÖ TESTE CONCLU√çDO COM SUCESSO!")
        print(f"üìÅ Arquivo gerado: {output_path}")
        print("="*70)
        print("\nüí° PR√ìXIMOS PASSOS:")
        print("   1. Abra o PDF e verifique a qualidade da an√°lise")
        print("   2. Se estiver satisfeito, execute C√©lula 8 para processar TODAS")
        print("   3. Se quiser testar outra quest√£o, execute:")
        print("      testar_questao(df, indice=5)  # exemplo: quest√£o 6")
        
        return questao, analise
        
    except KeyError as e:
        print(f"‚ùå ERRO: Coluna n√£o encontrada no dataset!")
        print(f"   Coluna faltando: {e}")
        print("\nüîç Colunas dispon√≠veis:")
        print(f"   {', '.join(dataframe.columns.tolist())}")
        print("\nüí° SOLU√á√ÉO:")
        print("   Verifique se os nomes das colunas no Excel correspondem a:")
        print("   - ID_Questao (ou similar)")
        print("   - Banca")
        print("   - Ano")
        print("   - Orgao")
        print("   - Disciplina")
        print("   - Assunto")
        print("   - Enunciado")
        print("   - Alternativa_A, Alternativa_B, etc.")
        print("   - Resposta_Correta")
        return None, None
        
    except Exception as e:
        print(f"‚ùå ERRO INESPERADO: {str(e)}")
        print("\nüîç Detalhes t√©cnicos:")
        import traceback
        traceback.print_exc()
        print("\nüí° Se o erro persistir, verifique:")
        print("   1. Conex√£o com AWS Bedrock")
        print("   2. Permiss√µes do modelo Sonnet 4.5")
        print("   3. Formato dos dados no Excel")
        return None, None

# EXECUTAR TESTE
print("üöÄ Iniciando teste com primeira quest√£o do dataset...\n")
questao_teste, analise_teste = testar_questao(df, indice=0)

if questao_teste and analise_teste:
    print("\n" + "üéâ"*23)
    print("SISTEMA FUNCIONANDO PERFEITAMENTE!")
    print("üéâ"*23)

üöÄ Iniciando teste com primeira quest√£o do dataset...

üß™ TESTE - Processando 1 quest√£o de Portugu√™s

üìã ID: Q3114574
üèõÔ∏è  Banca: FGV
üìÖ Ano: 2024 | üè¢ √ìrg√£o: TJ-MT
üìñ Assunto: Morfologia,...
‚úÖ Gabarito: E

ü§ñ Analisando com Claude Sonnet 4.5...
‚è≥ Aguarde 20-30 segundos (an√°lise profunda)...

   üìä Score de qualidade: 100/100
   ‚úÖ An√°lise aprovada!

üìè Tamanho da an√°lise: 13087 caracteres
üìä Preview (primeiros 700 caracteres):

# üìö AN√ÅLISE PEDAG√ìGICA COMPLETA - QUEST√ÉO FGV 2024 (TJ-MT)

---

## 1Ô∏è‚É£ IDENTIFICA√á√ÉO R√ÅPIDA
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ

üéØ **Tema Central:** Fam√≠lias de Palavras / Campos Sem√¢nticos e Etimol√≥gicos

üìö **√Årea:** MORFOLOGIA (Estrutura e Forma√ß√£o de Palavras)

üìñ **Sub√°rea:** An√°lise de Ra√≠zes Etimol√≥gicas, Campos Lexicais, Deriva√ß√£o Morfol√≥gic

In [None]:
# ============================================
# C√âLULA 8: PROCESSAR TODAS AS QUEST√ïES
# ============================================

def processar_questoes(dataframe, pasta_saida='pdfs_portugues'):
    """
    Processa todas as quest√µes: analisa com IA e gera PDFs
    
    Args:
        dataframe: DataFrame com as quest√µes de Portugu√™s
        pasta_saida: Pasta onde salvar os PDFs
    """
    
    # Criar pasta de sa√≠da
    Path(pasta_saida).mkdir(exist_ok=True)
    
    total = len(dataframe)
    sucessos = 0
    erros = 0
    erros_detalhes = []
    
    print("="*70)
    print(f"üöÄ PROCESSAMENTO EM LOTE - QUEST√ïES DE PORTUGU√äS")
    print("="*70)
    print(f"üìä Total de quest√µes: {total}")
    print(f"üìÅ Pasta de sa√≠da: {pasta_saida}/")
    print(f"ü§ñ Modelo: Claude Sonnet 4.5")
    print(f"‚è±Ô∏è  Tempo estimado: ~{total * 30} segundos (~{total * 30 / 60:.1f} minutos)")
    print(f"üí∞ Custo estimado: ~${total * 0.004:.2f} USD")
    print("="*70 + "\n")
    
    confirmacao = input("‚ö†Ô∏è  Digite 'SIM' para confirmar e iniciar: ")
    
    if confirmacao.upper() != 'SIM':
        print("‚ùå Processamento cancelado pelo usu√°rio.")
        return
    
    print("\nüöÄ Iniciando processamento em lote...\n")
    print("üí° Dica: Este processo pode demorar. Aguarde at√© o final!\n")
    
    from datetime import datetime
    inicio = datetime.now()
    
    for index, row in dataframe.iterrows():
        num_questao = index + 1
        
        try:
            print(f"{'='*70}")
            print(f"üìå QUEST√ÉO {num_questao}/{total} ({num_questao/total*100:.1f}%)")
            print(f"{'='*70}")
            
            # Montar dicion√°rio da quest√£o
            questao = {
                'id_questao': row.get('ID_Questao', f'Q{num_questao}'),
                'banca': row.get('Banca', 'N/A'),
                'ano': row.get('Ano', 'N/A'),
                'orgao': row.get('Orgao', 'N/A'),
                'prova': row.get('Prova', 'N/A'),
                'disciplina': row.get('Disciplina', 'Portugu√™s'),
                'assunto': row.get('Assunto', 'N/A'),
                'enunciado': row.get('Enunciado', 'N/A'),
                'alt_a': row.get('Alternativa_A', 'N/A'),
                'alt_b': row.get('Alternativa_B', 'N/A'),
                'alt_c': row.get('Alternativa_C', 'N/A'),
                'alt_d': row.get('Alternativa_D', 'N/A'),
                'alt_e': row.get('Alternativa_E', 'N/A'),
                'gabarito': str(row.get('Resposta_Correta', 'N/A')).strip().upper()
            }
            
            print(f"üìö ID: {questao['id_questao']}")
            print(f"üèõÔ∏è  Banca: {questao['banca']}")
            print(f"üìÖ Ano: {questao['ano']} | üè¢ √ìrg√£o: {questao['orgao']}")
            print(f"üìñ Assunto: {questao['assunto'][:50]}...")
            print(f"‚úÖ Gabarito: {questao['gabarito']}\n")
            
            # Analisar com IA (fun√ß√£o otimizada)
            print(f"ü§ñ Analisando com Claude Sonnet 4.5...")
            analise = analisar_questao_com_ia_otimizada(questao)
            
            if analise.startswith("‚ùå"):
                raise Exception(analise)
            
            print(f"‚úÖ An√°lise recebida ({len(analise)} caracteres)")
            
            # Gerar nome do arquivo
            assunto_limpo = str(questao['assunto']).replace(' ', '_').replace('/', '-')[:40]
            banca_limpa = str(questao['banca']).replace(' ', '_')[:15]
            filename = f"Q{num_questao:03d}_{banca_limpa}_{questao['ano']}_{assunto_limpo}_GAB{questao['gabarito']}.pdf"
            
            # Limpar caracteres especiais do filename
            filename = "".join(c for c in filename if c.isalnum() or c in ('_', '-', '.'))
            output_path = os.path.join(pasta_saida, filename)
            
            # Gerar PDF
            print(f"üìÑ Gerando PDF...")
            gerar_pdf_questao(questao, analise, output_path)
            
            sucessos += 1
            
            # Mostrar tempo decorrido e estimativa
            tempo_decorrido = (datetime.now() - inicio).total_seconds()
            tempo_medio = tempo_decorrido / num_questao
            tempo_restante = tempo_medio * (total - num_questao)
            
            print(f"‚úÖ Quest√£o {num_questao} conclu√≠da!")
            print(f"‚è±Ô∏è  Tempo restante estimado: {tempo_restante/60:.1f} minutos\n")
            
        except Exception as e:
            erros += 1
            erro_msg = f"Q{num_questao} (ID: {questao.get('id_questao', 'N/A')}): {str(e)[:100]}"
            erros_detalhes.append(erro_msg)
            print(f"‚ùå ERRO: {str(e)[:150]}")
            print(f"   Continuando para pr√≥xima quest√£o...\n")
            continue
    
    # Calcular tempo total
    tempo_total = (datetime.now() - inicio).total_seconds()
    
    # Resumo final
    print("\n" + "="*70)
    print("üéâ PROCESSAMENTO CONCLU√çDO!")
    print("="*70)
    print(f"‚úÖ Sucessos: {sucessos}/{total} ({sucessos/total*100:.1f}%)")
    print(f"‚ùå Erros: {erros}/{total} ({erros/total*100:.1f}%)")
    print(f"‚è±Ô∏è  Tempo total: {tempo_total/60:.1f} minutos")
    print(f"üìÅ PDFs salvos em: {os.path.abspath(pasta_saida)}/")
    
    if erros > 0:
        print(f"\n‚ö†Ô∏è  QUEST√ïES COM ERRO:")
        for i, erro in enumerate(erros_detalhes[:10], 1):  # Mostrar s√≥ as 10 primeiras
            print(f"   {i}. {erro}")
        if len(erros_detalhes) > 10:
            print(f"   ... e mais {len(erros_detalhes)-10} erros")
    
    print("="*70)
    
    # Gerar arquivo de log
    log_path = os.path.join(pasta_saida, 'log_processamento.txt')
    with open(log_path, 'w', encoding='utf-8') as f:
        f.write(f"PROCESSAMENTO DE QUEST√ïES - L√çNGUA PORTUGUESA\n")
        f.write(f"="*50 + "\n")
        f.write(f"Data: {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}\n")
        f.write(f"Modelo: Claude Sonnet 4.5\n")
        f.write(f"Total de quest√µes: {total}\n")
        f.write(f"Sucessos: {sucessos} ({sucessos/total*100:.1f}%)\n")
        f.write(f"Erros: {erros} ({erros/total*100:.1f}%)\n")
        f.write(f"Tempo total: {tempo_total/60:.1f} minutos\n")
        f.write(f"Pasta de sa√≠da: {pasta_saida}/\n")
        f.write(f"\n")
        
        if erros > 0:
            f.write(f"DETALHES DOS ERROS:\n")
            f.write(f"="*50 + "\n")
            for i, erro in enumerate(erros_detalhes, 1):
                f.write(f"{i}. {erro}\n")
    
    print(f"üìù Log detalhado salvo em: {log_path}")
    print("\nüéâ Processo finalizado com sucesso!")

print("‚úÖ Fun√ß√£o de processamento em lote criada!")
print("\nüìã Para executar, rode:")
print("   processar_questoes(df, pasta_saida='pdfs_portugues')")
print("\nüí° Ou personalize a pasta:")
print("   processar_questoes(df, pasta_saida='meus_pdfs')")
print("\n" + "="*70)
print("‚ö†Ô∏è  ATEN√á√ÉO: N√£o execute ainda se quiser fazer mais testes!")
print("üìå Execute apenas quando estiver pronto para processar TUDO")
print("="*70)

üöÄ PROCESSAMENTO EM LOTE - FGV DIREITO ADMINISTRATIVO
üìä Total de quest√µes: 220
üìÅ Pasta de sa√≠da: pdfs_fgv_direito_adm/
‚è±Ô∏è  Tempo estimado: ~5500 segundos (~91.7 minutos)
üí∞ Custo estimado: ~$0.66 USD



KeyboardInterrupt: Interrupted by user

In [None]:
# ============================================
# C√âLULA 9: ESTAT√çSTICAS DETALHADAS
# ============================================

import glob

def gerar_relatorio_completo(dataframe, pasta='pdfs_fgv_direito_adm'):
    """Gera relat√≥rio completo do processamento"""
    
    print("="*70)
    print("üìä RELAT√ìRIO COMPLETO DO PROCESSAMENTO")
    print("="*70 + "\n")
    
    # Contar PDFs gerados
    pdfs = glob.glob(f"{pasta}/*.pdf")
    total_pdfs = len(pdfs)
    
    print(f"üìÑ PDFs Gerados: {total_pdfs}/{len(dataframe)}")
    
    # Tamanho total
    if pdfs:
        tamanho_total = sum(os.path.getsize(pdf) for pdf in pdfs)
        tamanho_mb = tamanho_total / (1024 * 1024)
        print(f"üíæ Tamanho total: {tamanho_mb:.2f} MB")
        print(f"üìè Tamanho m√©dio: {tamanho_mb/total_pdfs:.2f} MB por PDF")
    
    # An√°lise por ano
    print(f"\nüìÖ QUEST√ïES POR ANO:")
    for ano, count in sorted(dataframe['Ano'].value_counts().items(), reverse=True):
        porcentagem = (count / len(dataframe)) * 100
        barra = "‚ñà" * int(porcentagem / 2)
        print(f"   {ano}: {count:3d} quest√µes ({porcentagem:5.1f}%) {barra}")
    
    # An√°lise por √≥rg√£o (top 10)
    print(f"\nüè¢ TOP 10 √ìRG√ÉOS:")
    for orgao, count in dataframe['Orgao'].value_counts().head(10).items():
        porcentagem = (count / len(dataframe)) * 100
        print(f"   {orgao:20s}: {count:3d} ({porcentagem:5.1f}%)")
    
    # An√°lise por assunto (top 10)
    print(f"\nüìñ TOP 10 ASSUNTOS:")
    for assunto, count in dataframe['Assunto'].value_counts().head(10).items():
        assunto_curto = assunto[:50] + "..." if len(assunto) > 50 else assunto
        porcentagem = (count / len(dataframe)) * 100
        print(f"   {count:3d} ({porcentagem:4.1f}%): {assunto_curto}")
    
    # Distribui√ß√£o de gabaritos
    print(f"\n‚úÖ DISTRIBUI√á√ÉO DE GABARITOS:")
    gabaritos = dataframe['Resposta_Correta'].value_counts().sort_index()
    for gab, count in gabaritos.items():
        porcentagem = (count / len(dataframe)) * 100
        barra = "‚ñì" * int(porcentagem)
        print(f"   Alternativa {gab}: {count:3d} ({porcentagem:5.1f}%) {barra}")
    
    # Teste qui-quadrado para verificar se distribui√ß√£o √© uniforme
    esperado = len(dataframe) / 5
    chi_quadrado = sum((count - esperado)**2 / esperado for count in gabaritos.values())
    print(f"\nüìà An√°lise estat√≠stica da distribui√ß√£o:")
    print(f"   Valor esperado por alternativa: {esperado:.1f}")
    print(f"   Chi-quadrado: {chi_quadrado:.2f}")
    if chi_quadrado < 9.49:  # Valor cr√≠tico para 4 graus de liberdade, 95% confian√ßa
        print(f"   ‚úÖ Distribui√ß√£o aproximadamente uniforme")
    else:
        print(f"   ‚ö†Ô∏è  Distribui√ß√£o n√£o uniforme")
    
    print("\n" + "="*70)
    print(f"üìÅ Arquivos em: {os.path.abspath(pasta)}/")
    print("="*70)

# Gerar relat√≥rio
gerar_relatorio_completo(df, pasta='pdfs_fgv_direito_adm')

In [9]:
# ============================================
# C√âLULA DEBUG: DIAGNOSTICAR LENTID√ÉO
# ============================================

import time

def testar_velocidade(questao_dict):
    """Testa velocidade e identifica gargalos"""
    
    print("üîç DIAGN√ìSTICO DE PERFORMANCE\n")
    print("="*70)
    
    # Teste 1: API Bedrock est√° respondendo?
    print("\n1Ô∏è‚É£ Testando conex√£o com AWS Bedrock...")
    inicio = time.time()
    
    try:
        test_config = {
            "anthropic_version": "bedrock-2023-05-31",
            "max_tokens": 50,  # M√≠nimo para teste r√°pido
            "temperature": 0.3,
            "messages": [{"role": "user", "content": "Responda apenas 'OK'"}]
        }
        
        response = bedrock_client.invoke_model(
            body=json.dumps(test_config),
            modelId=MODEL_ID,
            accept="application/json",
            contentType="application/json"
        )
        
        tempo_api = time.time() - inicio
        print(f"   ‚úÖ API respondeu em {tempo_api:.2f} segundos")
        
        if tempo_api > 5:
            print("   ‚ö†Ô∏è  PROBLEMA: API est√° lenta (deveria ser < 2s)")
            
    except Exception as e:
        print(f"   ‚ùå ERRO na API: {str(e)}")
        return
    
    # Teste 2: An√°lise completa
    print("\n2Ô∏è‚É£ Testando an√°lise completa...")
    inicio = time.time()
    
    try:
        analise = analisar_questao_com_ia_otimizada(questao_dict)
        tempo_total = time.time() - inicio
        
        print(f"   ‚úÖ An√°lise conclu√≠da em {tempo_total:.2f} segundos")
        print(f"   üìè Tamanho: {len(analise)} caracteres")
        
        if tempo_total > 60:
            print("   üö® PROBLEMA GRAVE: Tempo > 1 minuto!")
        elif tempo_total > 30:
            print("   ‚ö†Ô∏è  Um pouco lento, mas aceit√°vel")
        else:
            print("   ‚úÖ Tempo normal!")
            
    except Exception as e:
        print(f"   ‚ùå ERRO: {str(e)}")
        return
    
    # Teste 3: Verificar cache
    print("\n3Ô∏è‚É£ Testando cache...")
    inicio = time.time()
    
    analise2 = analisar_questao_com_ia_otimizada(questao_dict)
    tempo_cache = time.time() - inicio
    
    print(f"   ‚è±Ô∏è  Segunda chamada: {tempo_cache:.2f} segundos")
    
    if tempo_cache < 1:
        print("   ‚úÖ Cache funcionando perfeitamente!")
    else:
        print("   ‚ö†Ô∏è  Cache pode n√£o estar funcionando")
    
    print("\n" + "="*70)
    print("üìä RESUMO:")
    print(f"   API b√°sica: {tempo_api:.2f}s")
    print(f"   An√°lise completa: {tempo_total:.2f}s")
    print(f"   Com cache: {tempo_cache:.2f}s")
    print("="*70)
    
    # Diagn√≥stico
    print("\nüí° DIAGN√ìSTICO:")
    if tempo_api > 5:
        print("   üî¥ Problema: Conex√£o AWS/Bedrock lenta")
        print("      Solu√ß√£o: Verifique regi√£o, rede, credenciais")
    elif tempo_total > 90:
        print("   üî¥ Problema: max_tokens muito alto ou retry infinito")
        print("      Solu√ß√£o: Reduza max_tokens para 3000")
    elif tempo_total > 45:
        print("   üü° Problema: Score baixo causando retries")
        print("      Solu√ß√£o: Reduza score m√≠nimo para 50")
    else:
        print("   üü¢ Tudo normal! Apenas o modelo Sonnet √© mais lento que Haiku")

# EXECUTAR DIAGN√ìSTICO
if 'questao_teste' in globals() and questao_teste:
    testar_velocidade(questao_teste)
else:
    print("‚ùå Execute primeiro a C√©lula 7 para ter uma quest√£o de teste")

‚ùå Execute primeiro a C√©lula 7 para ter uma quest√£o de teste
