# Nota Esperada - Zero Shot JBSC

Este notebook calcula as notas esperadas (expected grades) usando softmax e probabilidades para os modelos zero-shot JBSC.


In [None]:
# === IMPORTS ===
from datasets import load_dataset
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import torch.nn.functional as F
from tqdm.notebook import tqdm
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
import ast


In [None]:
from google.colab import drive
drive.mount('/content/drive')

DRIVE_BASE_PATH = "/content/drive/MyDrive/enem_tcc_resultados"
os.makedirs(DRIVE_BASE_PATH, exist_ok=True)
print(f"‚úì Google Drive montado. Resultados ser√£o salvos em: {DRIVE_BASE_PATH}")

SAVE_DIR = os.path.join(DRIVE_BASE_PATH, "grade_expectation", "zero_shot_jbsc")
os.makedirs(SAVE_DIR, exist_ok=True)
print(f"‚úì Diret√≥rio de resultados: {SAVE_DIR}")


In [None]:
# === CARREGAR DATASET ===
print("Carregando o dataset...")
dataset = load_dataset("laisnuto/self-collected-ENEM-dataset", split="train")

# Filtrar apenas os anos de teste usados no fine-tuning
anos_teste = [2016, 2018, 2022, 2023]
df_full = dataset.to_pandas()
df_test = df_full[df_full["ano"].isin(anos_teste)].reset_index(drop=True)
dataset = dataset.filter(lambda x: x["ano"] in anos_teste)

print(f"‚úì Dataset carregado: {len(df_test)} reda√ß√µes")
dataset.to_pandas().head()


In [None]:
# === CONFIGURA√á√ÉO DOS MODELOS ===
device = "cuda" if torch.cuda.is_available() else "cpu"
if torch.cuda.is_available():
    print(f"‚úÖ GPU dispon√≠vel: {torch.cuda.get_device_name(0)}")
else:
    print("‚ö†Ô∏è GPU n√£o dispon√≠vel, usando CPU")

competencias = [1, 2, 3, 4, 5]

model_types = {
    "bert-base": "kamel-usp/jbcs2025_bert-base-multilingual-cased-encoder_classification-C{}-essay_only",
    "bertugues": "kamel-usp/jbcs2025_BERTugues-base-portuguese-cased-encoder_classification-C{}-essay_only",
    "bertimbau": "kamel-usp/jbcs2025_bertimbau_base-C{}"
}

# Carregar modelos e tokenizers
models = {}
tokenizers = {}

for model_key, model_path_template in model_types.items():
    print(f"\nüì¶ Carregando modelos: {model_key}")
    models[model_key] = {}
    tokenizers[model_key] = {}

    for c in competencias:
        comp_key = f"C{c}"
        try:
            model_name = model_path_template.format(c)
            print(f"‚û°Ô∏è {comp_key} | Modelo: {model_name}")

            if model_key == "bertimbau":
                tokenizer = AutoTokenizer.from_pretrained("neuralmind/bert-base-portuguese-cased")
                tokenizer.model_max_length = 512
            else:
                tokenizer = AutoTokenizer.from_pretrained(model_name)

            model = AutoModelForSequenceClassification.from_pretrained(model_name)
            model = model.eval()

            if torch.cuda.is_available():
                model = model.to(device)
                print(f"   ‚úì Modelo movido para GPU")

            models[model_key][comp_key] = model
            tokenizers[model_key][comp_key] = tokenizer
        except Exception as e:
            print(f"‚ùå Erro ao carregar modelo {model_name}: {e}")
            models[model_key][comp_key] = None
            tokenizers[model_key][comp_key] = None

print("\n‚úÖ Carregamento conclu√≠do!")


In [None]:
# === FUN√á√ÉO PARA CALCULAR NOTA ESPERADA ===
def calcular_nota_esperada(model, tokenizer, text, device="cpu"):
    """
    Calcula a nota esperada usando softmax e probabilidades.
    Retorna a nota esperada como float.
    """
    # Tokenizar texto
    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True, max_length=512)
    inputs = {k: v.to(device) for k, v in inputs.items()}
    
    # Obter sa√≠da do modelo
    with torch.no_grad():
        outputs = model(**inputs)
    
    # Calcular probabilidades usando softmax
    probabilities = F.softmax(outputs.logits, dim=-1)[0]
    
    # Calcular nota esperada: 0*P(0) + 40*P(40) + 80*P(80) + 120*P(120) + 160*P(160) + 200*P(200)
    nota_esperada = (0 * probabilities[0] + 
                     40 * probabilities[1] + 
                     80 * probabilities[2] + 
                     120 * probabilities[3] + 
                     160 * probabilities[4] + 
                     200 * probabilities[5]).item()
    
    return nota_esperada


In [None]:
# === CALCULAR NOTAS ESPERADAS ===
resultados_por_modelo = {}

for model_key in model_types.keys():
    print(f"\nüìä Calculando notas esperadas para: {model_key}")
    
    csv_path = os.path.join(SAVE_DIR, f"notas_esperadas_{model_key}_zero_shot_jbsc.csv")
    
    # Verificar se j√° existe CSV
    if os.path.exists(csv_path):
        print(f"‚úÖ Carregando notas esperadas existentes de {csv_path}")
        df_resultados = pd.read_csv(csv_path)
        print(f"   Carregadas {len(df_resultados)} notas esperadas")
        resultados_por_modelo[model_key] = df_resultados
        continue
    
    # Calcular notas esperadas
    textos = dataset["texto"]
    notas_esperadas = {f"C{c}": [] for c in competencias}
    
    for texto in tqdm(textos, desc=f"Processando {model_key}"):
        for c in competencias:
            comp_key = f"C{c}"
            
            if models[model_key][comp_key] is None:
                notas_esperadas[comp_key].append(np.nan)
                continue
            
            try:
                nota = calcular_nota_esperada(
                    models[model_key][comp_key],
                    tokenizers[model_key][comp_key],
                    texto,
                    device
                )
                notas_esperadas[comp_key].append(nota)
            except Exception as e:
                print(f"‚ö†Ô∏è Erro ao calcular nota para {comp_key}: {e}")
                notas_esperadas[comp_key].append(np.nan)
    
    # Criar DataFrame com resultados
    df_resultados = dataset.to_pandas().copy()
    for c in competencias:
        comp_key = f"C{c}"
        df_resultados[f"nota_esperada_{comp_key}"] = notas_esperadas[comp_key]
    
    # Salvar CSV
    df_resultados.to_csv(csv_path, index=False)
    print(f"‚úÖ Notas esperadas salvas em: {csv_path}")
    
    resultados_por_modelo[model_key] = df_resultados


In [None]:
# === PLOTAR GR√ÅFICOS ===
for model_key, df_resultados in resultados_por_modelo.items():
    print(f"\nüìà Gerando gr√°ficos para: {model_key}")
    
    # Processar coluna 'notas' se existir
    if "notas" in df_resultados.columns:
        df_resultados["notas"] = df_resultados["notas"].apply(
            lambda x: ast.literal_eval(x) if isinstance(x, str) else x
        )
    
    r2_scores = {}
    
    # Criar figura com 5 subplots lado a lado
    fig, axes = plt.subplots(1, 5, figsize=(30, 6))
    fig.suptitle(f'Nota Real vs Nota Esperada por Compet√™ncia - Modelo {model_key} (Zero Shot JBSC)',
                 fontsize=18, fontweight='bold', y=1.02)
    
    for idx, c in enumerate(competencias):
        comp_key = f"C{c}"
        ax = axes[idx]
        
        # Extrair notas reais e esperadas
        if "notas" in df_resultados.columns:
            y_real = df_resultados["notas"].apply(lambda x: x[c-1] if isinstance(x, (list, tuple)) else np.nan)
        else:
            y_real = df_resultados[comp_key] if comp_key in df_resultados.columns else pd.Series(dtype=float)
        
        y_esperada = df_resultados[f"nota_esperada_{comp_key}"]
        
        # Remover NaN
        pares = pd.DataFrame({"r": y_real, "e": y_esperada}).dropna()
        y_real_clean = pares["r"].astype(int).values
        y_esperada_clean = pares["e"].astype(float).values
        
        if len(y_real_clean) == 0:
            ax.text(0.5, 0.5, 'Sem dados', ha='center', va='center', transform=ax.transAxes)
            ax.set_title(f'{comp_key}', fontsize=14, fontweight='bold')
            continue
        
        # Calcular regress√£o linear: Y = nota esperada, X = nota real
        X = y_real_clean.reshape(-1, 1)  # X = nota real
        y = y_esperada_clean  # Y = nota esperada
        reg = LinearRegression()
        reg.fit(X, y)
        slope = reg.coef_[0]
        intercept = reg.intercept_
        
        # Calcular R¬≤
        r2 = reg.score(X, y)
        r2_scores[comp_key] = r2
        
        # Gerar pontos para a linha de regress√£o
        x_line = np.array([0, 200])
        y_line = slope * x_line + intercept
        
        # Criar scatter plot (sem jitter)
        ax.scatter(y_real_clean, y_esperada_clean, alpha=0.5, s=30, edgecolors='black', linewidths=0.3)
        
        # Adicionar linha de refer√™ncia (y = x)
        ax.plot([0, 200], [0, 200], 'r--', linewidth=2, label='y = x', alpha=0.8)
        
        # Adicionar linha de regress√£o linear
        ax.plot(x_line, y_line, 'b-', linewidth=2,
                label=f'Regress√£o: y = {slope:.3f}x + {intercept:.2f}', alpha=0.8)
        
        # Configurar eixos (X = nota real, Y = nota esperada)
        ax.set_xlabel('Nota Real', fontsize=12, fontweight='bold')
        if idx == 0:
            ax.set_ylabel('Nota Esperada', fontsize=12, fontweight='bold')
        ax.set_title(f'{comp_key}\nR¬≤ = {r2:.4f}',
                     fontsize=13, fontweight='bold')
        
        # Configurar limites e ticks do eixo X (nota real: 0-200, de 20 em 20)
        ax.set_xlim(-10, 210)
        ax.set_xticks(range(0, 201, 20))
        ax.set_xticklabels(range(0, 201, 20), rotation=45, ha='right', fontsize=9)
        
        # Configurar limites e ticks do eixo Y (nota esperada: 0-200, de 20 em 20)
        ax.set_ylim(-10, 210)
        ax.set_yticks(range(0, 201, 20))
        ax.set_yticklabels(range(0, 201, 20), fontsize=9)
        
        # Grid
        ax.grid(True, alpha=0.3, linestyle='--', linewidth=0.8)
        
        # Legenda
        ax.legend(loc='upper left', fontsize=8, framealpha=0.9)
        
        # Ajustar layout
        ax.set_aspect('equal', adjustable='box')
    
    plt.tight_layout()
    
    # Salvar gr√°fico
    plot_path = os.path.join(SAVE_DIR, f"grafico_nota_real_vs_esperada_{model_key}_zero_shot_jbsc.png")
    plt.savefig(plot_path, dpi=300, bbox_inches='tight')
    print(f"‚úÖ Gr√°fico salvo em: {plot_path}")
    
    # Mostrar gr√°fico
    plt.show()
    
    # Imprimir resumo dos R¬≤
    print(f"\nüìä Resumo das M√©tricas por Compet√™ncia - {model_key.upper()}:")
    print("=" * 60)
    print(f"{'Compet√™ncia':<12} {'R¬≤':<12}")
    print("-" * 60)
    for comp_key in competencias:
        comp_key_str = f"C{comp_key}"
        if comp_key_str in r2_scores:
            print(f"{comp_key_str:<12} {r2_scores[comp_key_str]:<12.4f}")
    print("-" * 60)
    if r2_scores:
        print(f"{'M√âDIO':<12} {np.mean(list(r2_scores.values())):<12.4f}")
    print("=" * 60)
