# üöÄ GPT-4-ENEM no Google Colab

Este notebook configura o ambiente para avaliar modelos de linguagem no ENEM usando GPUs do Google Colab (A100, T4, V100, etc.)

## üìã Pr√©-requisitos
- Conta Google (para acessar Colab)
- Chave API da Maritaca (ou OpenAI)
- Acesso a GPU (gratuito ou Colab Pro)


## 1Ô∏è‚É£ Configurar GPU

**IMPORTANTE**: V√° em **Runtime ‚Üí Change runtime type ‚Üí Hardware accelerator ‚Üí GPU**

Para A100: Requer **Colab Pro** ou **Colab Pro+**


In [None]:
# Verificar GPU dispon√≠vel
import torch

if torch.cuda.is_available():
    print(f"‚úÖ GPU detectada: {torch.cuda.get_device_name(0)}")
    print(f"   Mem√≥ria total: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
    print(f"   CUDA version: {torch.version.cuda}")
else:
    print("‚ö†Ô∏è  GPU n√£o detectada. Certifique-se de ativar GPU em Runtime ‚Üí Change runtime type")


## 2Ô∏è‚É£ Instalar Depend√™ncias


In [None]:
# Instalar depend√™ncias principais
!pip install -q torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
!pip install -q transformers datasets scikit-learn
!pip install -q sqlitedict pytablewriter sacrebleu rouge-score
!pip install -q pycountry numexpr tqdm jsonlines
!pip install -q openai fschat
!pip install -q git+https://github.com/lm-sys/FastChat.git


In [None]:
# Clonar reposit√≥rio (ou fazer upload manual)
import os

# Op√ß√£o 1: Clonar do GitHub
!git clone https://github.com/piresramon/gpt-4-enem.git
os.chdir('gpt-4-enem')

# Op√ß√£o 2: Se j√° tiver os arquivos, fazer upload manual via Colab
# Files ‚Üí Upload ‚Üí selecionar arquivos do projeto

print("‚úÖ Reposit√≥rio clonado/configurado")


In [None]:
# Instalar projeto em modo desenvolvimento
!pip install -e .

print("‚úÖ Projeto instalado")


## 3Ô∏è‚É£ Configurar Chaves API


In [None]:
import os

# Configurar chave API da Maritaca
# SUBSTITUA pela sua chave real
os.environ['CURSORMINIMAC'] = '107341642936117619902_e1ed52697ebc2587'

# Alternativamente, use:
# os.environ['MARITALK_API_SECRET_KEY'] = 'sua-chave-aqui'

# Para OpenAI (se necess√°rio):
# os.environ['OPENAI_API_SECRET_KEY'] = 'sk-sua-chave-aqui'

print("‚úÖ Chaves API configuradas")
print(f"   Maritaca: {'‚úÖ' if os.environ.get('CURSORMINIMAC') or os.environ.get('MARITALK_API_SECRET_KEY') else '‚ùå'}")
print(f"   OpenAI: {'‚úÖ' if os.environ.get('OPENAI_API_SECRET_KEY') else '‚ùå (opcional)'}")


In [None]:
# Testar conex√£o com API Maritaca
import openai

api_key = os.environ.get('CURSORMINIMAC') or os.environ.get('MARITALK_API_SECRET_KEY')

if api_key:
    openai.api_base = "https://chat.maritaca.ai/api"
    
    # Detectar vers√£o do openai
    openai_version = openai.__version__
    major_version = int(openai_version.split('.')[0])
    
    if major_version >= 1:
        client = openai.OpenAI(api_key=api_key, base_url="https://chat.maritaca.ai/api")
        response = client.chat.completions.create(
            model="sabia-3",
            messages=[{"role": "user", "content": "Responda apenas: OK"}],
            max_tokens=5
        )
        print(f"‚úÖ API funcionando! Resposta: {response.choices[0].message.content}")
    else:
        openai.api_key = api_key
        response = openai.ChatCompletion.create(
            model="sabia-3",
            messages=[{"role": "user", "content": "Responda apenas: OK"}],
            max_tokens=5
        )
        print(f"‚úÖ API funcionando! Resposta: {response.choices[0].message.content}")
else:
    print("‚ùå Chave API n√£o configurada")


## 4Ô∏è‚É£ Verificar Dados ENEM


In [None]:
import json
from pathlib import Path

# Verificar se os dados est√£o presentes
data_dir = Path('data/enem')

if data_dir.exists():
    print("‚úÖ Diret√≥rio de dados encontrado")
    for file in data_dir.glob('*.jsonl'):
        count = sum(1 for _ in open(file))
        print(f"   {file.name}: {count} quest√µes")
else:
    print("‚ö†Ô∏è  Diret√≥rio de dados n√£o encontrado")
    print("   Os dados ser√£o baixados automaticamente na primeira execu√ß√£o")


## 5Ô∏è‚É£ Executar Avalia√ß√£o

Agora voc√™ pode executar avalia√ß√µes do ENEM!


In [None]:
# Exemplo: Avaliar Sabi√°-3 no ENEM 2024 (teste r√°pido com --limit)
!python main.py \
    --model maritalk \
    --model_args engine=sabia-3 \
    --tasks enem_cot_2024_blind \
    --description_dict_path description.json \
    --num_fewshot 3 \
    --conversation_template chatgpt \
    --limit 5 \
    --output_path results/teste_rapido.json


In [None]:
# Avalia√ß√£o completa (sem --limit)
# ‚ö†Ô∏è  Isso pode levar muito tempo e consumir muitos cr√©ditos da API

# !python main.py \
#     --model maritalk \
#     --model_args engine=sabia-3 \
#     --tasks enem_cot_2024_blind \
#     --description_dict_path description.json \
#     --num_fewshot 3 \
#     --conversation_template chatgpt \
#     --output_path results/sabia3_enem2024_completo.json


## 6Ô∏è‚É£ Analisar Resultados


In [None]:
# Carregar e visualizar resultados
import json
from pathlib import Path

# Criar diret√≥rio de resultados se n√£o existir
Path('results').mkdir(exist_ok=True)

# Carregar resultados (ajuste o caminho conforme necess√°rio)
result_file = 'results/teste_rapido.json'

if Path(result_file).exists():
    with open(result_file, 'r', encoding='utf-8') as f:
        results = json.load(f)
    
    print("üìä Resultados da Avalia√ß√£o:")
    print("=" * 70)
    
    if 'results' in results:
        for task_name, task_results in results['results'].items():
            print(f"\nüìã Tarefa: {task_name}")
            if 'acc' in task_results:
                print(f"   ‚úÖ Acur√°cia geral: {task_results['acc']:.2%}")
            
            # √Åreas de conhecimento
            areas = {
                'languages': 'Linguagens e C√≥digos',
                'human-sciences': 'Ci√™ncias Humanas',
                'natural-sciences': 'Ci√™ncias da Natureza',
                'mathematics': 'Matem√°tica'
            }
            
            for area_key, area_name in areas.items():
                if area_key in task_results:
                    acuracia = task_results[area_key]
                    barra = "‚ñà" * int(acuracia * 30)
                    print(f"   ‚Ä¢ {area_name:25s}: {acuracia:6.2%} {barra}")
    else:
        print(json.dumps(results, indent=2, ensure_ascii=False))
else:
    print(f"‚ö†Ô∏è  Arquivo n√£o encontrado: {result_file}")
    print("   Execute uma avalia√ß√£o primeiro!")


In [None]:
# Visualiza√ß√£o gr√°fica dos resultados (opcional)
try:
    import matplotlib.pyplot as plt
    import numpy as np
    
    result_file = 'results/teste_rapido.json'
    
    if Path(result_file).exists():
        with open(result_file, 'r') as f:
            results = json.load(f)
        
        if 'results' in results:
            for task_name, task_results in results['results'].items():
                areas = {
                    'languages': 'Linguagens',
                    'human-sciences': 'Humanas',
                    'natural-sciences': 'Natureza',
                    'mathematics': 'Matem√°tica'
                }
                
                area_names = []
                acuracias = []
                
                for area_key, area_name in areas.items():
                    if area_key in task_results:
                        area_names.append(area_name)
                        acuracias.append(task_results[area_key])
                
                if area_names:
                    plt.figure(figsize=(10, 6))
                    bars = plt.bar(area_names, acuracias, color=['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728'])
                    plt.title(f'Acur√°cia por √Årea - {task_name}', fontsize=14, fontweight='bold')
                    plt.ylabel('Acur√°cia (%)', fontsize=12)
                    plt.ylim(0, 1)
                    plt.grid(axis='y', alpha=0.3)
                    
                    # Adicionar valores nas barras
                    for bar, acc in zip(bars, acuracias):
                        plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.01,
                               f'{acc:.1%}', ha='center', va='bottom', fontweight='bold')
                    
                    plt.tight_layout()
                    plt.show()
except ImportError:
    print("üí° Instale matplotlib para visualiza√ß√µes: !pip install matplotlib")
except Exception as e:
    print(f"‚ö†Ô∏è  Erro na visualiza√ß√£o: {e}")


## 7Ô∏è‚É£ Download dos Resultados

Para baixar os resultados, use:
- **Files ‚Üí Download** (clique com bot√£o direito no arquivo)
- Ou execute a c√©lula abaixo


In [None]:
from google.colab import files

# Listar arquivos de resultados dispon√≠veis
result_files = list(Path('results').glob('*.json'))

if result_files:
    print("üìÅ Arquivos de resultados dispon√≠veis:")
    for i, file in enumerate(result_files, 1):
        size = file.stat().st_size / 1024  # KB
        print(f"   {i}. {file.name} ({size:.1f} KB)")
    
    print("\nüí° Para fazer download:")
    print("   1. V√° em Files (√≠cone de pasta √† esquerda)")
    print("   2. Navegue at√© results/")
    print("   3. Clique com bot√£o direito ‚Üí Download")
    print("\n   Ou descomente a linha abaixo para download autom√°tico:")
    print("   # files.download('results/teste_rapido.json')")
else:
    print("‚ö†Ô∏è  Nenhum arquivo de resultados encontrado")
    print("   Execute uma avalia√ß√£o primeiro!")


## üí° Dicas e Observa√ß√µes

### GPU
- **Gratuito**: T4 (15GB RAM)
- **Colab Pro**: T4, V100, A100 (40GB RAM)
- **Colab Pro+**: A100 priorit√°rio

### Limites
- Sess√µes gratuitas: ~12 horas
- Colab Pro: ~24 horas
- Use `--limit` para testes r√°pidos

### Custos API
- Monitore uso da API Maritaca
- Avalia√ß√£o completa pode ser cara
- Use cache quando poss√≠vel (`--no_cache` desabilitado)

### Performance
- API Maritaca n√£o usa GPU local (√© API remota)
- GPU √© √∫til para modelos locais (transformers)
- Para API, GPU n√£o √© necess√°ria, mas Colab oferece ambiente est√°vel

### Backup
- ‚ö†Ô∏è **IMPORTANTE**: Fa√ßa download dos resultados regularmente
- Dados s√£o tempor√°rios e ser√£o perdidos ao desconectar
- Use `--output_path` para salvar resultados


## üîÑ Exemplos de Uso Avan√ßado

### M√∫ltiplas Tarefas


In [None]:
# Avaliar m√∫ltiplas tarefas de uma vez
# !python main.py \
#     --model maritalk \
#     --model_args engine=sabia-3 \
#     --tasks enem_cot_2024_blind,enem_cot_2024_captions \
#     --description_dict_path description.json \
#     --num_fewshot 3 \
#     --conversation_template chatgpt \
#     --output_path results/multiplas_tarefas.json


### Comparar Diferentes Configura√ß√µes


In [None]:
# Comparar diferentes n√∫meros de few-shot
# for num_fewshot in [0, 1, 3]:
#     !python main.py \
#         --model maritalk \
#         --model_args engine=sabia-3 \
#         --tasks enem_cot_2024_blind \
#         --description_dict_path description.json \
#         --num_fewshot {num_fewshot} \
#         --conversation_template chatgpt \
#         --limit 10 \
#         --output_path results/fewshot_{num_fewshot}.json


### Verificar Status da Sess√£o


In [None]:
# Verificar informa√ß√µes da sess√£o
import psutil
import os
from datetime import datetime

print("üìä Status da Sess√£o Colab")
print("=" * 50)
print(f"üïê Hora atual: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
print(f"üíæ RAM dispon√≠vel: {psutil.virtual_memory().available / 1e9:.2f} GB")
print(f"üíæ RAM total: {psutil.virtual_memory().total / 1e9:.2f} GB")
print(f"üìÅ Diret√≥rio atual: {os.getcwd()}")

if torch.cuda.is_available():
    print(f"üéÆ GPU: {torch.cuda.get_device_name(0)}")
    print(f"üíæ Mem√≥ria GPU: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
    print(f"üíæ GPU livre: {torch.cuda.memory_reserved(0) / 1e9:.2f} GB")
else:
    print("‚ö†Ô∏è  GPU n√£o dispon√≠vel")
