# Setup

## Helper methods

### Extract multiple-choice answer from response

In [446]:
import re

def extract_answer_letter(response):
    # Match "Resposta final: C)" or "Resposta final: C"
    match = re.search(r"resposta final\s*[:\-]?\s*([A-E])\s*\)?", response, re.IGNORECASE | re.DOTALL)
    if not match:
        # Try fallback patterns
        match = re.search(r"letra\s+([A-E])\b", response, re.IGNORECASE)
    return match.group(1).upper() if match else None

### Calculate overall accuracy of answers

In [447]:
def calculate_accuracy(results):
    """Returns overall accuracy and count of None predictions from a list of result dicts."""
    total_answered = sum(1 for r in results if r["predicted"] is not None)
    correct = sum(r["correct"] for r in results if r["predicted"] is not None)
    total = len(results)
    none_count = total - total_answered
    accuracy = (correct / total_answered) * 100 if total_answered > 0 else 0
    return correct, total_answered, accuracy, none_count

### Group results by subject

In [448]:
import pandas as pd

def results_by_subject(results):
    """Aggregates accuracy grouped by subject"""
    df = pd.DataFrame(results)
    if "subject" not in df.columns:
        print("⚠️ 'subject' not found in results.")
        return None
    
    summary = df.groupby("subject")["correct"].agg(["sum", "count"])
    summary["accuracy (%)"] = (summary["sum"] / summary["count"]) * 100
    return summary

### Save results to csv file

In [449]:
from datetime import datetime
import os

def save_results_csv(df, method_name):
    """
    Save a DataFrame as a CSV file in a 'results/<method_name>' subfolder with a timestamped filename.

    Parameters:
    - df: pandas DataFrame to save
    - method_name: e.g., 'cot', 'cov', 'self-refine'

    Returns:
    - The full filename used
    """
    # Define target folder and create it if needed
    folder = os.path.join("results", method_name)
    os.makedirs(folder, exist_ok=True)

    # Create timestamped filename
    timestamp = datetime.now().strftime("%Y-%m-%d_%H-%M-%S")
    filename = os.path.join(folder, f"{method_name}_results_{timestamp}.csv")

    # Save the file
    df.to_csv(filename, index=False)
    print(f"✅ Results saved to {filename}")
    return filename

## Chain-of-Thought (CoT) template

In [450]:
def build_cot_prompt(question_obj):
    
    few_shot_examples = """Você verá abaixo alguns exemplos de como a pergunta deve ser respondida passo a passo. Leia atentamente os exemplos e, em seguida, responda a pergunta que vem depois deles.
    
        ### Exemplo 1:
        
        Pergunta:
        Urgência emocional. Se tudo é para ontem, se a vida engata uma primeira e sai em
        disparada, se não há mais tempo para paradas estratégicas, caímos fatalmente no vício de querer
        que os amores sejam igualmente resolvidos num átimo de segundo. Temos pressa para ouvir “eu
        te amo”. Não vemos a hora de que fiquem estabelecidas as regras de convívio: somos namorados,
        ficantes, casados, amantes? Urgência emocional. Uma cilada. Associamos diversas palavras ao
        AMOR: paixão, romance, sexo, adrenalina, palpitação. Esquecemos, no entanto, da palavra que
        viabiliza esse sentimento: “paciência”. Amor sem paciência não vinga. Amor não pode ser mastigado
        e engolido com emergência, com fome desesperada. É uma refeição que pode durar uma vida.
        MEDEIROS, M. Disponível em: http://porumavidasimples.blogspot.com.br. Acesso em: 20 ago. 2017
        (adaptado).   
        
        Nesse texto de opinião, as marcas linguísticas revelam uma situação distensa e de pouca formalidade, o que se evidencia pelo(a)
        
        Opções:
        A) A impessoalização ao longo do texto, com em: “se não há mais tempo”.
        B) A construção de uma atmosfera de urgência, em palavras como: “pressa”.
        C) A repetição de uma determinada estrutura sintática, como em: “Se tudo é para ontem”.
        D) O ênfase no emprego de hipérboles, como em: “uma reflexão que pode durar uma vida”.
        E) O emprego de metáforas, como em: “a vida engata uma primeira e sai em disparada”.
        
        Explicação:
        O texto é escrito em uma linguagem leve, ágil, e de pouca formalidade. Além disso, possui figuras de
        linguagem, como metáforas e hipérboles, que não são excludentes. Em uma análise sequencial das
        alternativas, daria para afirmar que D. e E. estão corretas. Entretanto, observando em detalhes, nota-se
        que a expressão "emprego de metáforas" mostra ser mais adequada do que "ênfase no emprego da
        hipérbole", visto que, para afirmarmos que o uso de hipérboles foi enfatizado, a figura de linguagem
        deveria ter aparecido mais vezes. Isso torna a alternativa E. mais provável de ser CORRETA. Além
        disso, impessoalização não deve ser apontada como marca de pouca formalidade. Existe também uma
        atmosfera de urgência, mas que é criticada no texto que destaca a importância da paciência e não da
        pressa. Por fim, a estrutura sintática não é repetida sistematicamente ao longo do texto.         
        
        Resposta final: E
        
        ---
        
        ### Exemplo 2:
        
        Pergunta:
        Sempre que a relevância do discurso entra em jogo, a questão torna-se política por
        definição, pois é o discurso que faz do homem um ser político. E tudo que os homens fazem, sabem
        ou experimentam só tem sentido na medida em que pode ser discutido. Haverá, talvez, verdades que
        ficam além da linguagem e que podem ser de grande relevância para o homem no singular, isto é, para
        o homem que, seja o que for, não é um ser político. Mas homens no plural, isto é, os homens que vivem
        e se movem e agem neste mundo, só podem experimentar o significado das coisas por poderem falar
        e ser inteligíveis entre si e consigo mesmos. ARENDT, H. A condição humana. Rio de Janeiro: Forense
        Universitária, 2004.
        
        No trecho, a filósofa Hannah Arendt mostra a importância da linguagem no processo de
        
        Opções:
        A) entendimento da cultura.
        B) aumento da criatividade.
        C) percepção da individualidade.
        D) melhoria da técnica.
        E) construção da sociabilidade.
        
        Explicação:
        Hannah Arendt defende em sua obra que somos seres políticos, no sentido próprio de vivermos
        em pólis, em ambiente coletivo e social. E essa sociabilidade só é possível por meio do discurso,
        da linguagem. Desse modo, podemos concluir que a linguagem se apresenta como uma importante
        ferramenta para a construção da sociabilidade, e portanto a alternativa E. é a CORRETA. Além disso,
        não se trata do entendimento da cultura, mas da relação social entre as pessoas dessa cultura. Hannah
        também não fala sobre aumento de criatividade, tampouco sobre técnica. Por fim, a linguagem é
        utilizada em algo mais coletivo e social, justamente o oposto da individualidade.      
        
        Resposta final: E
        
        ---
        
        ### Exemplo 3:
        
        Pergunta:
        Um casal planeja construir em sua chácara uma piscina com o formato de um paralelepípedo reto retângulo com capacidade para 90 000 L de água. O casal contratou uma empresa
        de construções que apresentou cinco projetos com diferentes combinações nas dimensões internas
        de profundidade, largura e comprimento. A piscina a ser construída terá revestimento interno em suas
        paredes e fundo com uma mesma cerâmica, e o casal irá escolher o projeto que exija a menor área de
        revestimento. As dimensões internas de profundidade, largura e comprimento, respectivamente, para
        cada um dos projetos, são: projeto I: 1,8 m, 2,0 m e 25,0 m; projeto II: 2,0 m, 5,0 m e 9,0 m; projeto III:
        1,0 m, 6,0 m e 15,0 m; projeto IV: 1,5 m, 15,0 m e 4,0 m; projeto V: 2,5 m, 3,0 m e 12,0 m.
        
        O projeto que o casal deverá escolher será o
        
        Opções:
        A) I.  
        B) II.  
        C) III.  
        D) IV.  
        E) V.
        
        Explicação:
        Devemos calcular a área das quatro faces laterais e a área da base inferior (fundo da piscina) e somar
        essas áreas para obter a área de revestimento. Logo, calculando a área de revestimento de cada
        projeto, temos: Projeto I: A = 2 x 25 + 2 x 1,8 x (2 + 25) = 147,2; Projeto II: A = 9 x 5 + 2 x 2 x (9 + 5) =
        101; Projeto III: A = 15 x 6 + 2 x 1 x (15 + 6) = 132; Projeto IV: A = 4 x 15 + 2 x 1,5 x (15 + 4) = 117;
        Projeto V: A = 3 x 12 + 2 x 2,5 x (3 + 12) = 111. Logo, o projeto com menor área de revestimento, é o
        projeto II, portanto a resposta corrreta é B.        
        
        Resposta final: B
        
        ---
        
        Agora responda à próxima pergunta seguindo o mesmo formato de raciocício passo a passo.
        """

    # Current question
    question = question_obj["question"]
    options = question_obj["alternatives"]
    option_letters = ["A", "B", "C", "D", "E"]
    formatted_options = "\n".join([f"{letter}) {text}" for letter, text in zip(option_letters, options)])

    prompt = f"""{few_shot_examples}

        Pergunta:
        {question}
        
        Opções:
        {formatted_options}
        
        Explique sua resposta e depois diga a letra da alternativa correta no formato "Resposta final: X"
        """

    return prompt


## Chain-of-Verification (CoVe) template

### Plan verifications

In [451]:
def plan_verification_questions(question, baseline_answer):
    plan_prompt = f"""Dada a seguinte pergunta e resposta, gere 2 a 4 perguntas para verificar os fatos principais da resposta.

Pergunta: {question}

Resposta: {baseline_answer}

Liste as perguntas de verificação:"""
    return call_openai_api(plan_prompt)


### Execute verifications

In [452]:
def execute_verifications(verification_questions):
    verifications = []
    for q in verification_questions:
        answer = call_openai_api(q)
        verifications.append((q, answer))
    return verifications

### Generate final verified answer

In [453]:
def generate_final_verified_answer(question, original_answer, verifications, options=None):
    vtext = "\n".join([f"Q: {q}\nA: {a}" for q, a in verifications])

    option_letters = ["A", "B", "C", "D", "E"]
    options_text = ""
    if options:
        options_text = "\n".join([f"{letter}) {text}" for letter, text in zip(option_letters, options)])

    revise_prompt = f"""
Revise a resposta abaixo com base nas verificações.

Pergunta:
{question}

Alternativas:
{options_text}

Resposta original:
{original_answer}

Verificações:
{vtext}

Resposta final verificada:
[Inclua uma explicação revisada, seguida de uma linha como: "Resposta final: X", onde X é a letra da alternativa correta.]
"""
    return call_openai_api(revise_prompt)


## Self-Refine template

### Give feedback for a previous answer

In [454]:
def build_feedback_prompt(question_obj, model_output):
    question = question_obj["question"]
    options = question_obj["alternatives"]
    option_letters = ["A", "B", "C", "D", "E"]
    formatted_options = "\n".join([f"{l}) {t}" for l, t in zip(option_letters, options)])

    prompt = (
        "Analise a seguinte resposta gerada para uma pergunta do ENEM. "
        "Identifique erros, falhas na argumentação ou escolha incorreta da alternativa. "
        "Aponte aspectos que podem ser melhorados.\n\n"
        f"Pergunta:\n{question}\n\n"
        f"Alternativas:\n{formatted_options}\n\n"
        f"Resposta do modelo:\n{model_output}\n\n"
        "Feedback:"
    )
    return prompt


### Refine response based on feedback

In [455]:
def build_refine_prompt(question_obj, model_output, feedback):
    question = question_obj["question"]
    options = question_obj["alternatives"]
    option_letters = ["A", "B", "C", "D", "E"]
    formatted_options = "\n".join([f"{l}) {t}" for l, t in zip(option_letters, options)])

    prompt = (
        "A seguir está uma pergunta do ENEM, acompanhada de alternativas, "
        "uma resposta inicial e um feedback crítico. Escreva uma nova resposta levando em conta "
        "o feedback, explicando novamente o raciocínio e indicando a letra da alternativa correta "
        "no formato \"Resposta final: X\".\n\n"
        f"Pergunta:\n{question}\n\n"
        f"Alternativas:\n{formatted_options}\n\n"
        f"Resposta anterior:\n{model_output}\n\n"
        f"Feedback:\n{feedback}\n\n"
        "Nova resposta:"
    )
    return prompt


### Feedback iteration wrapper

In [456]:
def self_refine_enem(question_obj, max_iters=10):
    # Generate the initial chain-of-thought response
    prompt = build_cot_prompt(question_obj)
    response = call_openai_api(prompt)
    
    # Extract the final answer from the initial response
    prev_final = extract_answer_letter(response)
    
    history = [(response, None)]

    for _ in range(max_iters):
        # Generate feedback based on the current response
        fb_prompt = build_feedback_prompt(question_obj, response)
        feedback = call_openai_api(fb_prompt)

        # Build the refine prompt using the current response and feedback
        refine_prompt = build_refine_prompt(question_obj, response, feedback)
        new_response = call_openai_api(refine_prompt)
        
        # Extract the final answer from the new response
        new_final = extract_answer_letter(new_response)
        
        # If the final answer is unchanged, exit the loop
        if new_final is not None and new_final == prev_final:
            break
        
        # Update the response and the final answer for the next iteration
        response = new_response
        prev_final = new_final
        history.append((response, feedback))
    
    return response, history

## Load 2024 ENEM questions

In [457]:
import json

# Load the JSONL file line by line
data = []
with open('enem_2024.jsonl', 'r', encoding='utf-8') as f:
    for line in f:
        data.append(json.loads(line))

# Assign subject based on the index (0-indexed)
for i, entry in enumerate(data):
    if i < 45:
        subject = "Linguagens, Códigos e suas Tecnologias"
    elif i < 90:
        subject = "Ciências Humanas e suas Tecnologias"
    elif i < 135:
        subject = "Ciências da Natureza e suas Tecnologias"
    else:
        subject = "Matemática e suas Tecnologias"
    entry["subject"] = subject

# Show the first question
data[0]

{'id': 'questao_01',
 'exam': '2024',
 'IU': False,
 'ledor': False,
 'question': '## Holy War\nOh, so we can hate each other and fear each other\nWe can build these walls between each other Baby, blow by blow and brick by brick Keep yourself locked in, yourself locked in\n[…]\nOh, maybe we should love somebody\nOh, maybe we could care a little more\nSo maybe we should love somebody\nInstead of polishing the bombs of holy war\nNessa letra de canção, de Alicia Keys, que aborda um contexto de ódio e intolerância, o marcador “instead of ” introduz a ideia de',
 'alternatives': ['mudança de comportamento.',
  'panorama de conflitos.',
  'rotina de isolamento.',
  'perspectiva bélica.',
  'cenário religioso.'],
 'label': 'A',
 'figures': [],
 'description': [],
 'subject': 'Linguagens, Códigos e suas Tecnologias'}

## Connect to OpenAI API

In [458]:
from openai import OpenAI

# Read key from file
with open("openai-key.txt", "r") as f:
    api_key = f.read().strip()

client = OpenAI(api_key=api_key)

### API call

In [459]:
def call_openai_api(prompt, model="gpt-3.5-turbo", temperature=0.7):
    response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "user", "content": prompt}
        ],
        temperature=temperature
    )
    return response.choices[0].message.content

# Test Prompting Techniques

## Test CoT

#### Test CoT with a single question

In [460]:
q = data[0]
prompt = build_cot_prompt(q)
response = call_openai_api(prompt)
predicted = extract_answer_letter(response)

print("Prompt:\n", prompt)
print("\nModel Response:\n", response)
print(f"\nPredicted: {predicted} | Ground Truth: {q['label']}")


Prompt:
 Você verá abaixo alguns exemplos de como a pergunta deve ser respondida passo a passo. Leia atentamente os exemplos e, em seguida, responda a pergunta que vem depois deles.

        ### Exemplo 1:

        Pergunta:
        Urgência emocional. Se tudo é para ontem, se a vida engata uma primeira e sai em
        disparada, se não há mais tempo para paradas estratégicas, caímos fatalmente no vício de querer
        que os amores sejam igualmente resolvidos num átimo de segundo. Temos pressa para ouvir “eu
        te amo”. Não vemos a hora de que fiquem estabelecidas as regras de convívio: somos namorados,
        ficantes, casados, amantes? Urgência emocional. Uma cilada. Associamos diversas palavras ao
        AMOR: paixão, romance, sexo, adrenalina, palpitação. Esquecemos, no entanto, da palavra que
        viabiliza esse sentimento: “paciência”. Amor sem paciência não vinga. Amor não pode ser mastigado
        e engolido com emergência, com fome desesperada. É uma refeição qu

#### CoT evaluation loop over sample questions

In [461]:
def run_cot(data):
    cot_results = []

    for i, question in enumerate(data):
        prompt = build_cot_prompt(question)
        correct_answer = question["label"]

        try:
            response = call_openai_api(prompt)
            predicted = extract_answer_letter(response)
        except Exception as e:
            response = str(e)
            predicted = None

        cot_results.append({
            "id": question["id"],
            "subject": question["subject"],
            "question": question["question"],
            "ground_truth": correct_answer,
            "predicted": predicted,
            "correct": predicted == correct_answer,
            "response": response
        })

        print(f"[{i+1}/{len(data)}] ✅ Predicted: {predicted} | Correct: {correct_answer}")

    return cot_results

# Call function
# cot_results = run_cot(data)

#### CoT Results

In [462]:
df_cot = pd.DataFrame(cot_results)
save_results_csv(df_cot, method_name="cot_few-shot")
df_cot

✅ Results saved to results/cot_few-shot/cot_few-shot_results_2025-04-01_11-19-31.csv


Unnamed: 0,id,subject,question,ground_truth,predicted,correct,response
0,questao_01,"Linguagens, Códigos e suas Tecnologias","## Holy War\nOh, so we can hate each other and fear each other\nWe can build these walls between each other Baby, blow by blow and brick by brick Keep yourself locked in, yourself locked in\n[…]\nOh, maybe we should love somebody\nOh, maybe we could care a little more\nSo maybe we should love somebody\nInstead of polishing the bombs of holy war\nNessa letra de canção, de Alicia Keys, que aborda um contexto de ódio e intolerância, o marcador “instead of ” introduz a ideia de",A,A,True,"A expressão ""instead of"" é utilizada para indicar uma substituição ou troca de uma ação por outra. No contexto da letra da música, a frase ""Instead of polishing the bombs of holy war"" sugere uma mudança de atitude e comportamento, abandonando a ideia de guerra e ódio em favor do amor e compaixão. Portanto, a ideia introduzida por ""instead of"" é de mudança de comportamento.\n\nResposta final: A"
1,questao_02,"Linguagens, Códigos e suas Tecnologias",[[placeholder]]\nO texto estabelece uma relação entre elementos da natureza e comandos de um programa de computador para,A,B,False,"Para responder essa questão, precisamos analisar o trecho do texto que estabelece essa relação entre elementos da natureza e comandos de um programa de computador. No texto, essa relação é utilizada como uma metáfora para ilustrar a velocidade e a efemeridade das ações e acontecimentos na vida das pessoas. A comparação entre a natureza e comandos de um programa de computador serve para evidenciar a rapidez com que as coisas acontecem e mudam, semelhante à forma como um programa executa comandos de forma instantânea e efêmera.\n\nPortanto, a opção correta é:\n\nResposta final: B) conscientizar os indivíduos sobre a passagem acelerada do tempo."
2,questao_03,"Linguagens, Códigos e suas Tecnologias",[[placeholder]]\nA relação entre as citações atribuídas ao físico Albert Einstein e ao cantor e compositor Bob Marley reside na crença de que é necessário,C,C,True,"Para responder a essa pergunta, primeiro precisamos analisar as citações atribuídas a Albert Einstein e Bob Marley. A citação de Einstein fala sobre a importância de dar uma oportunidade para pessoas que parecem necessitadas, enquanto a citação de Bob Marley aborda a ideia de tirar proveito de situações adversas.\n\nAmbas as citações têm em comum a ideia de enfrentar desafios e dificuldades, seja ajudando aqueles que precisam ou encontrando oportunidades em meio a situações adversas. Portanto, a relação entre elas reside na crença de que é necessário tirar proveito de situações que podem ser adversas.\n\nResposta final: C"
3,questao_04,"Linguagens, Códigos e suas Tecnologias",[[placeholder]]A carta da editora Stephanie Allen-Nichols à escritoraAlice Walker tem o propósito de,E,D,False,"Para responder a esta pergunta, precisamos analisar o propósito da carta da editora Stephanie Allen-Nichols à escritora Alice Walker. A partir do contexto apresentado, podemos perceber que a carta não está problematizando o enredo da obra de Alice Walker, nem acusando o recebimento do manuscrito, solicitando revisão ortográfica, informando transferência para outra editora ou comunicando a recusa da publicação do romance.\n\nPelo contrário, a carta da editora provavelmente tem o propósito de comunicar algo positivo ou de interesse da autora. Uma possibilidade seria informar sobre a aprovação e futura publicação do livro. Portanto, a alternativa correta é:\n\nResposta final: D"
4,questao_05,"Linguagens, Códigos e suas Tecnologias","## Borderlands/La frontera: the Nem Mestiza\nGlória Anzaldúa\nI remember being caught speaking Spanish at recess [...] I remember being sent to the corner of the classroom for “talking back” to the Anglo teacher when all I was trying to do was tell her how to pronounce my name. “If you want to be American, speak ‘American’. If you don’t like it, go back to Mexico where you belong”.\n“I want you to speak English […]”, my mother would say, mortified that I spoke English like a Mexican. At Pan American University, I and all Chicano students were required to take two speech classes. Their purpose: to get rid of our accents.\nO problema abordado nesse texto sobre imigrantes residentes nos Estados Unidos diz respeito aos prejuízos gerados pelo(a)",A,A,True,"O texto aborda os prejuízos gerados pela pressão para os imigrantes nos Estados Unidos abandonarem sua língua e cultura de origem em favor do inglês e da cultura dominante. Isso é evidenciado pelas experiências da autora em ser repreendida por falar espanhol e por sua mãe querer que ela fale inglês sem sotaque. Portanto, a resposta correta é:\n\nResposta final: A"
...,...,...,...,...,...,...,...
175,questao_176,Matemática e suas Tecnologias,"Atualmente, há telefones celulares com telas de diversos tamanhos e em formatos retangulares. Alguns deles apresentam telas medindo três inteiros e um meio polegadas, com determinadas especificações técnicas. Além disso, em muitos modelos, com a inclusão de novas funções no celular, suas telas ficaram maiores, sendo muito comum encontrarmos atualmente telas medindo quatro inteiros e cinco sextos polegadas, conforme a figura.\n[[placeholder]]\n\n. A diferença de tamanho, em valor absoluto, entre as medidas, em polegada, das telas do celular 2 e do celular 1, representada apenas com uma casa decimal, é",D,D,True,"Para encontrar a diferença de tamanho entre as telas dos dois celulares, precisamos subtrair o tamanho da tela do segundo celular pelo tamanho da tela do primeiro celular.\n\nCelular 1: 3 1/2 polegadas\nCelular 2: 4 5/6 polegadas\n\nConvertendo as frações para um denominador comum, temos:\nCelular 1: 3 3/6 polegadas\nCelular 2: 4 5/6 polegadas\n\nAgora podemos subtrair:\n4 5/6 - 3 3/6 = 1 2/6 = 1 1/3 = 1,3 polegadas\n\nPortanto, a diferença de tamanho, em valor absoluto, entre as medidas das telas dos celulares 2 e 1 é de 1,3 polegadas.\n\nResposta final: D) 1,3."
176,questao_177,Matemática e suas Tecnologias,"Uma imobiliária iniciou uma campanha de divulgação para promover a venda de apartamentos que podem ser pagos em 100 parcelas mensais. O valor da primeira delas é fixado no momento da compra, com o pagamento dessa primeira parcela. A partir da segunda parcela, o valor é determinado pela aplicação de um acréscimo percentual fixo ao valor da parcela anterior. Como atrativo, a imobiliária fará o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador.\nUm cliente, que faz aniversário no mês de maio, decidiu comprar um desses apartamentos por meio do financiamento oferecido pela imobiliária, e pretende escolher o mês mais adequado para realizar essa compra, de modo que o valor total dos pagamentos seja o menor possível.\nQual é o mês que esse cliente deverá escolher para realizar a compra do apartamento?",A,B,False,"Para encontrar o mês mais adequado para o cliente realizar a compra do apartamento, precisamos analisar o benefício de ter todas as parcelas pagas no mês de aniversário. Como o cliente faz aniversário em maio, ele deve escolher o mês anterior a maio para realizar a compra, pois assim terá um menor número de parcelas pagas até o mês de aniversário.\n\nConsiderando que a primeira parcela é paga no momento da compra, o cliente terá 99 parcelas a serem pagas. Portanto, o cliente deverá escolher o mês de abril para realizar a compra do apartamento, pois assim terá todas as parcelas pagas no mês de seu aniversário, maio.\n\nResposta final: B) Abril."
177,questao_178,Matemática e suas Tecnologias,"Um professor de desenho, apresentou uma peça de 45 centímetros de comprimento e solicitou aos alunos reproduzir no papel o objeto, onde as medidas devem ser proporcionais às medidas reais, e o comprimento deste desenho tem que ser de 9 centímetros.\nA escala utilizada para realizar esse desenho é",D,D,True,"Para encontrar a escala utilizada no desenho, podemos fazer uma regra de três simples. Sabemos que o objeto real tem 45 cm de comprimento e o desenho deve ter 9 cm de comprimento. Portanto, a escala seria:\n\n45 cm (objeto real) -> 9 cm (desenho)\n\nx (escala) -> 1 cm\n\nResolvendo a proporção, teremos:\n\n45 * 1 = 9 * x\n45 = 9x\nx = 45 / 9\nx = 5\n\nPortanto, a escala utilizada para realizar o desenho é de 1 para 5.\n\nResposta final: D"
178,questao_179,Matemática e suas Tecnologias,"A prefeitura de uma cidade planeja construir três postos de saúde. Esses postos devem ser construídos em locais equidistantes entre si e de forma que as distâncias desses três postos ao hospital dessa cidade sejam iguais. Foram conseguidos três locais para a construção dos postos de saúde que apresentam as características desejadas, e que distam 10 quilômetros entre si, conforme o esquema, no qual o ponto H representa o local onde está construído o hospital; os pontos P índice 1, P índice 2 e P índice 3, os postos de saúde; e esses quatro pontos estão em um mesmo plano.\n[[placeholder]]\nA distância, em quilômetro, entre o hospital e cada um dos postos de saúde, é um valor entre",C,E,False,"Para encontrar a distância entre o hospital e cada um dos postos de saúde, podemos utilizar o conceito de geometria. Como os postos de saúde devem estar equidistantes entre si, formando um triângulo equilátero, a distância entre o hospital e cada posto de saúde será a mesma.\n\nSabemos que a distância entre os postos de saúde é de 10 km, e como eles formam um triângulo equilátero, cada lado do triângulo medirá 10 km. Para encontrar a distância entre o hospital e cada posto de saúde, podemos utilizar a propriedade dos triângulos equiláteros, que é dividir a altura do triângulo em duas partes iguais, formando dois triângulos retângulos.\n\nAssim, a distância entre o hospital e um dos postos de saúde será metade da altura do triângulo equilátero, que podemos encontrar utilizando o teorema de Pitágoras. Considerando o lado do triângulo equilátero como a hipotenusa, e metade do lado como um dos catetos, a outra metade do lado como a outra parte do cateto, podemos calcular a altura.\n\nUtilizando a fórmula do teorema de Pitágoras, temos:\nh² = 10² - (5)²\nh² = 100 - 25\nh² = 75\nh = √75\nh ≈ 8,66 km\n\nPortanto, a distância entre o hospital e cada um dos postos de saúde será aproximadamente 8,66 km.\n\nResposta final: E) 8 e 9."


## Test CoVe

#### Test CoVe with a single question

In [463]:
# Step 1: Pick a question
q = data[0]
question_text = q["question"]
prompt = build_cot_prompt(q)

# Step 2: Baseline CoT answer
baseline_answer = call_openai_api(prompt)

print("🔹 Baseline CoT Answer:\n", baseline_answer)

# Step 3: Plan verification questions
verification_qs_raw = plan_verification_questions(question_text, baseline_answer)

# Split the response into individual questions if the model gives a list
verification_questions = [line.strip("- ").strip() for line in verification_qs_raw.split("\n") if line.strip()]

print("\n🔹 Verification Questions:")
for qv in verification_questions:
    print("-", qv)

# Step 4: Execute verification
verifications = execute_verifications(verification_questions)

print("\n🔹 Verification Answers:")
for qv, av in verifications:
    print(f"Q: {qv}\nA: {av}\n")

# Step 5: Generate final verified answer
final_answer = generate_final_verified_answer(question_text, baseline_answer, verifications)

print("🔹 Final Verified Answer:\n", final_answer)

# Step 6: Extract predicted letter and compare to ground truth
predicted = extract_answer_letter(final_answer)
ground_truth = q["label"]

print(f"\n✅ Predicted Answer: {predicted}")
print(f"🎯 Ground Truth: {ground_truth}")

if predicted == ground_truth:
    print("🎉 CORRECT!")
else:
    print("❌ WRONG.")


🔹 Baseline CoT Answer:
 A expressão "instead of" introduz a ideia de escolha ou substituição de uma coisa por outra. No contexto da música, a frase "Instead of polishing the bombs of holy war" sugere que, em vez de promover a guerra santa, deveríamos amar alguém. Portanto, a ideia introduzida pelo marcador é de mudança de comportamento, ou seja, a escolha de amar alguém em vez de promover a guerra. 

Resposta final: A) mudança de comportamento.

🔹 Verification Questions:
- 1) Qual é a expressão utilizada pela cantora Alicia Keys para introduzir a ideia de escolha ou substituição?
- 2) Qual é a sugestão da música em relação à promoção da guerra santa?
- 3) O que a expressão "Instead of polishing the bombs of holy war" sugere que as pessoas deveriam fazer?
- 4) Qual é o comportamento que a música sugere que as pessoas adotem em vez de promover a guerra?

🔹 Verification Answers:
Q: 1) Qual é a expressão utilizada pela cantora Alicia Keys para introduzir a ideia de escolha ou substituição?

#### CoVe evaluation loop over sample questions

In [464]:
def run_cove(data):
    cove_results = []

    for i, question in enumerate(data):
        try:
            question_text = question["question"]
            correct_answer = question["label"]

            # Build CoT-style prompt
            prompt = build_cot_prompt(question)

            # Baseline CoT response
            baseline_answer = call_openai_api(prompt)

            # Extract initial answer letter from baseline
            initial_answer_letter = extract_answer_letter(baseline_answer)

            # Plan verifications
            verification_qs_raw = plan_verification_questions(question_text, baseline_answer)
            verification_questions = [
                line.strip("- ").strip()
                for line in verification_qs_raw.split("\n")
                if line.strip()
            ]

            # Execute verifications
            verifications = execute_verifications(verification_questions)

            # Final revised answer
            final_answer = generate_final_verified_answer(
                question_text, baseline_answer, verifications, question["alternatives"]
            )

            # Extract answer letter (A–E)
            predicted = extract_answer_letter(final_answer)

            # Record result
            cove_results.append({
                "id": question["id"],
                "question": question_text,
                "ground_truth": correct_answer,
                "predicted": predicted,
                "correct": predicted == correct_answer,
                "baseline_answer": baseline_answer,
                "initial_answer": initial_answer_letter,
                "final_answer": final_answer,
                "verification_qs": verification_questions,
                "verification_a": verifications,
                "subject": question.get("subject", "unknown")
            })

            print(f"[{i+1}/{len(data)}] ✅ Predicted: {predicted} | Correct: {correct_answer}")

        except Exception as e:
            print(f"[{i+1}/{len(data)}] ❌ Error: {e}")
            cove_results.append({
                "index": i,
                "question": question_text,
                "true_answer": correct_answer,
                "predicted": None,
                "correct": False,
                "error": str(e)
            })

    return cove_results

# Run
# cove_results = run_cove(data)


#### CoVe results

In [465]:
df_cove = pd.DataFrame(cove_results)
save_results_csv(df_cove, method_name="cove_few-shot")
df_cove

✅ Results saved to results/cove_few-shot/cove_few-shot_results_2025-04-01_11-20-28.csv


Unnamed: 0,id,question,ground_truth,predicted,correct,baseline_answer,initial_answer,final_answer,verification_qs,verification_a,subject
0,questao_01,"## Holy War\nOh, so we can hate each other and fear each other\nWe can build these walls between each other Baby, blow by blow and brick by brick Keep yourself locked in, yourself locked in\n[…]\nOh, maybe we should love somebody\nOh, maybe we could care a little more\nSo maybe we should love somebody\nInstead of polishing the bombs of holy war\nNessa letra de canção, de Alicia Keys, que aborda um contexto de ódio e intolerância, o marcador “instead of ” introduz a ideia de",A,A,True,"A expressão ""instead of"" indica uma substituição ou troca de uma ação por outra. No trecho da letra de música, a ideia introduzida por ""instead of polishing the bombs of holy war"" sugere que, em vez de aumentar a intensidade da guerra santa, as pessoas deveriam amar alguém. Portanto, a expressão ""instead of"" introduz a ideia de mudança de comportamento.\n\nResposta final: A",A,"A expressão ""instead of"" introduz a ideia de substituição ou troca de uma ação por outra na letra da música. No trecho em questão, sugere que, em vez de promover a guerra santa, as pessoas deveriam amar alguém. Portanto, a expressão ""instead of"" introduz a ideia de mudança de comportamento.\n\nResposta final: A","[1. Qual é o contexto abordado na letra da música de Alicia Keys?, 2. O que a expressão ""instead of"" introduz na ideia apresentada na letra da música?, 3. Qual é a sugestão feita pela expressão ""instead of polishing the bombs of holy war"" na letra da música?, 4. Como a expressão ""instead of"" sugere uma mudança de comportamento na letra da música?]","[(1. Qual é o contexto abordado na letra da música de Alicia Keys?, A letra da música de Alicia Keys aborda principalmente temas relacionados a autoaceitação, amor próprio, empoderamento feminino e superação de desafios. Ela frequentemente aborda questões de identidade, autoconfiança e autoestima em suas músicas, incentivando seus ouvintes a se amarem e se valorizarem.), (2. O que a expressão ""instead of"" introduz na ideia apresentada na letra da música?, A expressão ""instead of"" introduz a ideia de substituição ou troca, indicando que algo está sendo feito ou acontecendo em lugar de outra coisa. Na letra da música, essa expressão pode indicar que uma ação está sendo realizada no lugar de outra que era esperada ou mais comum.), (3. Qual é a sugestão feita pela expressão ""instead of polishing the bombs of holy war"" na letra da música?, A sugestão feita pela expressão ""instead of polishing the bombs of holy war"" na letra da música é que em vez de se envolver em guerras e conflitos religiosos, as pessoas deveriam se concentrar em promover a paz e a harmonia entre os povos. Em vez de investir tempo e recursos em armamentos e violência, deveriam buscar formas de resolver os conflitos de forma pacífica e construtiva.), (4. Como a expressão ""instead of"" sugere uma mudança de comportamento na letra da música?, A expressão ""instead of"" sugere uma mudança de comportamento na letra da música ao indicar que algo foi trocado ou substituído por outra coisa. Isso pode implicar que a pessoa está tomando uma decisão diferente, fazendo uma escolha alternativa ou adotando um novo comportamento em oposição ao anterior. Assim, a presença dessa expressão na letra da música pode indicar uma mudança de atitude ou perspectiva por parte do cantor ou personagem da música.)]","Linguagens, Códigos e suas Tecnologias"
1,questao_02,[[placeholder]]\nO texto estabelece uma relação entre elementos da natureza e comandos de um programa de computador para,A,E,False,"O texto estabelece uma relação entre elementos da natureza e comandos de um programa de computador para destacar a importância da paciência e do tempo necessário para que algo cresça e se desenvolva. A comparação com os comandos de um programa de computador evidencia a ideia de que cada ação tem seu tempo e seu processo, não podendo ser acelerada de maneira artificial. Portanto, a alternativa correta é a letra E, que propõe informar os interessados sobre o tempo de crescimento de novas árvores.\n\nResposta final: E",E,"A relação estabelecida no texto entre elementos da natureza e comandos de um programa de computador destaca a importância da paciência e do tempo necessário para que algo cresça e se desenvolva. A comparação com os comandos de um programa de computador evidencia a ideia de que cada ação tem seu tempo e seu processo, não podendo ser acelerada de maneira artificial. Portanto, a alternativa correta é a letra E, que propõe informar os interessados sobre o tempo de crescimento de novas árvores.\n\nResposta final: E","[1. Qual a relação estabelecida entre elementos da natureza e comandos de um programa de computador no texto?, 2. Qual a importância destacada no texto em relação à paciência e ao tempo necessário para o crescimento e desenvolvimento de algo?, 3. Por que a comparação com os comandos de um programa de computador evidencia a ideia de que cada ação tem seu tempo e seu processo?, 4. Qual é a proposta da alternativa correta para informar os interessados?]","[(1. Qual a relação estabelecida entre elementos da natureza e comandos de um programa de computador no texto?, No texto, é estabelecida uma relação metafórica entre elementos da natureza, como a árvore, a raiz, o galho e a folha, e comandos de um programa de computador, como a estrutura de um algoritmo, a sequência de operações, a recursividade e a lógica de programação. Essa relação é feita para exemplificar de forma didática e simplificada como os comandos de um programa de computador podem ser organizados e interligados de maneira semelhante à estrutura de uma árvore na natureza.), (2. Qual a importância destacada no texto em relação à paciência e ao tempo necessário para o crescimento e desenvolvimento de algo?, No texto, a importância destacada em relação à paciência e ao tempo necessário para o crescimento e desenvolvimento de algo está relacionada com a ideia de que bons resultados e amadurecimento demandam tempo e dedicação. O autor ressalta que é preciso ter paciência para alcançar os objetivos desejados, pois o processo de crescimento e evolução não acontece de forma instantânea. É necessário investir tempo e esforço para que algo floresça e se desenvolva de maneira plena. Assim, a paciência é vista como uma virtude essencial para alcançar o sucesso a longo prazo.), (3. Por que a comparação com os comandos de um programa de computador evidencia a ideia de que cada ação tem seu tempo e seu processo?, A comparação com os comandos de um programa de computador evidencia a ideia de que cada ação tem seu tempo e seu processo porque, assim como em um programa de computador, cada comando ou ação realizada em um processo requer uma sequência de etapas específicas para ser executada corretamente. Da mesma forma que um programa de computador precisa seguir uma ordem lógica de comandos para realizar uma tarefa, as ações humanas também exigem um processo cuidadoso e organizado para serem eficazes.\n\nAlém disso, a comparação com um programa de computador também ressalta a importância da paciência e da precisão na execução de cada ação, uma vez que qualquer erro ou desvio no processo pode afetar o resultado final. Assim como um programa de computador pode travar ou apresentar falhas se não for executado corretamente, as ações humanas também podem enfrentar obstáculos se não forem realizadas de forma adequada e no tempo certo.\n\nPortanto, a comparação com os comandos de um programa de computador enfatiza a importância de respeitar o tempo e o processo de cada ação, a fim de garantir a eficácia e o sucesso na realização de tarefas.), (4. Qual é a proposta da alternativa correta para informar os interessados?, A proposta da alternativa correta para informar os interessados é utilizar meios de comunicação eficazes e acessíveis, como e-mails, telefonemas, mensagens de texto, redes sociais, entre outros. Além disso, é importante garantir que as informações sejam claras, objetivas e relevantes para o público-alvo, de forma a garantir que todos os interessados recebam as informações necessárias de maneira adequada. Também é importante manter um canal aberto de comunicação para eventuais dúvidas e esclarecimentos.)]","Linguagens, Códigos e suas Tecnologias"
2,questao_03,[[placeholder]]\nA relação entre as citações atribuídas ao físico Albert Einstein e ao cantor e compositor Bob Marley reside na crença de que é necessário,C,C,True,"Para responder a essa pergunta, devemos analisar as citações atribuídas a Albert Einstein e Bob Marley e identificar o ponto em comum entre elas.\n\nA citação atribuída a Albert Einstein fala sobre ""O mundo é um lugar perigoso de se viver, não por causa daqueles que fazem o mal, mas sim por causa daqueles que observam e deixam o mal acontecer."" Essa frase pode ser interpretada como a necessidade de identificar contextos que representem perigo e agir para evitá-los.\n\nJá a citação atribuída a Bob Marley diz: ""Você nunca sabe como forte você é até que ser forte é a única escolha que você tem."" Essa frase pode ser interpretada como a ideia de tirar proveito de situações adversas e mostrar força em momentos difíceis.\n\nPortanto, a relação entre as citações está na ideia de identificar contextos perigosos e tirar proveito de situações adversas, o que nos leva à alternativa:\n\nResposta final: C) tirar proveito de situações que podem ser adversas.",C,"Após analisar as citações atribuídas a Albert Einstein e Bob Marley, podemos ver que ambas trazem mensagens sobre a importância de lidar com situações adversas e encontrar força interior para superar desafios. Enquanto Einstein destaca a necessidade de agir diante do mal e identificar contextos perigosos, Marley ressalta a ideia de que a verdadeira força é revelada em momentos difíceis. Portanto, a relação entre as citações está na ideia de tirar proveito de situações adversas.\n\nResposta final: C) tirar proveito de situações que podem ser adversas.","[1) Qual é a citação atribuída a Albert Einstein sobre o mundo ser um lugar perigoso de se viver?, 2) Qual é a citação atribuída a Bob Marley sobre como a força é revelada em momentos difíceis?, 3) Como a citação de Albert Einstein pode ser interpretada em relação à necessidade de agir diante do mal?, 4) Como a citação de Bob Marley pode ser interpretada em relação à ideia de mostrar força em situações adversas?]","[(1) Qual é a citação atribuída a Albert Einstein sobre o mundo ser um lugar perigoso de se viver?, ""A única coisa mais perigosa que a ignorância é o conhecimento."" - Albert Einstein), (2) Qual é a citação atribuída a Bob Marley sobre como a força é revelada em momentos difíceis?, ""A maior covardia de um homem é despertar o amor de uma mulher sem a intenção de amá-la."" - Bob Marley), (3) Como a citação de Albert Einstein pode ser interpretada em relação à necessidade de agir diante do mal?, A citação de Albert Einstein ""O mundo não será destruído por aqueles que fazem o mal, mas sim por aqueles que os observam sem fazer nada"" pode ser interpretada como um apelo à ação diante do mal. Einstein está nos lembrando de que a passividade e a inércia diante das injustiças e crueldades do mundo podem ser tão prejudiciais quanto os próprios atos maléficos. Ele nos encoraja a não sermos apenas espectadores, mas sim agentes de mudança, a nos levantarmos e nos opormos ao mal, a defendermos o que é certo e a lutarmos por um mundo melhor. A mensagem da citação é clara: a omissão diante do mal também é uma forma de contribuir para a sua propagação, e é nosso dever moral agir em defesa do bem e da justiça.), (4) Como a citação de Bob Marley pode ser interpretada em relação à ideia de mostrar força em situações adversas?, A citação de Bob Marley ""Você nunca sabe como é forte até ser forte é a única escolha que você tem"" pode ser interpretada como um incentivo para enfrentar situações adversas com coragem e determinação. Ele sugere que, muitas vezes, somos capazes de superar obstáculos e desafios que parecem insuperáveis, quando não temos outra opção a não ser ser forte. Isso significa que, mesmo diante das adversidades, é possível encontrar força interior e superar as dificuldades, se mantendo firme e confiante em si mesmo. Essa citação nos lembra que a força muitas vezes está dentro de nós, e que podemos usá-la para enfrentar qualquer situação difícil que possa surgir em nosso caminho.)]","Linguagens, Códigos e suas Tecnologias"
3,questao_04,[[placeholder]]A carta da editora Stephanie Allen-Nichols à escritoraAlice Walker tem o propósito de,E,E,True,"Para responder a essa pergunta, é importante analisar o propósito da carta da editora Stephanie Allen-Nichols à escritora Alice Walker. Pelo contexto, podemos inferir que a carta tem o propósito de comunicar algo à escritora. A opção de ""problematizar o enredo de sua obra"" não faz sentido, pois não é o papel da editora questionar o conteúdo da obra. Da mesma forma, ""acusar o recebimento de seu manuscrito"" não parece ser o propósito da carta. ""Solicitar a revisão ortográfica de seu texto"" também não parece ser o foco da carta, pois teria um tom mais técnico. ""Informar a transferência de seu livro a outra editora"" não é mencionado no texto, portanto não é a resposta correta. A opção mais condizente com o propósito da carta é ""comunicar a recusa da publicação de seu romance"", pois a carta menciona que não foi uma decisão fácil e que a editora precisa se posicionar de forma clara.\n\nResposta final: E",E,"Com base nas verificações realizadas, podemos concluir que o propósito da carta da editora Stephanie Allen-Nichols à escritora Alice Walker é comunicar a recusa da publicação de seu romance. A carta menciona claramente que o livro não se encaixa no perfil da editora e sugere que a autora busque outras editoras interessadas em publicar sua obra.\n\nResposta final: E","[1. Qual é o propósito da carta da editora Stephanie Allen-Nichols à escritora Alice Walker?, 2. A carta tem o objetivo de questionar o enredo da obra de Alice Walker?, 3. A carta menciona algo sobre a revisão ortográfica do texto de Alice Walker?, 4. A editora está informando a recusa da publicação do romance de Alice Walker na carta?]","[(1. Qual é o propósito da carta da editora Stephanie Allen-Nichols à escritora Alice Walker?, O propósito da carta da editora Stephanie Allen-Nichols à escritora Alice Walker é provavelmente para oferecer a ela um contrato de publicação de um novo livro ou projeto literário, ou para discutir questões relacionadas à publicação de suas obras anteriores. A carta pode também ser uma forma de expressar admiração pelo trabalho de Alice Walker e de estabelecer uma relação profissional e colaborativa com ela.), (2. A carta tem o objetivo de questionar o enredo da obra de Alice Walker?, Não, a carta não tem o objetivo de questionar o enredo da obra de Alice Walker. Ela tem o objetivo de expressar gratidão pelo impacto positivo que a obra teve na vida do remetente e de compartilhar suas reflexões e sentimentos em relação a ela.), (3. A carta menciona algo sobre a revisão ortográfica do texto de Alice Walker?, Sim, a carta menciona que a revisão ortográfica do texto de Alice Walker foi concluída e que o texto está pronto para ser enviado para publicação.), (4. A editora está informando a recusa da publicação do romance de Alice Walker na carta?, Sim, a editora está informando a recusa da publicação do romance de Alice Walker na carta. Eles mencionam que o conteúdo do livro não se encaixa no perfil da editora e que não acreditam que ele teria sucesso comercial. Além disso, eles sugerem que Alice Walker procure outras editoras que possam estar mais interessadas em publicar seu livro.)]","Linguagens, Códigos e suas Tecnologias"
4,questao_05,"## Borderlands/La frontera: the Nem Mestiza\nGlória Anzaldúa\nI remember being caught speaking Spanish at recess [...] I remember being sent to the corner of the classroom for “talking back” to the Anglo teacher when all I was trying to do was tell her how to pronounce my name. “If you want to be American, speak ‘American’. If you don’t like it, go back to Mexico where you belong”.\n“I want you to speak English […]”, my mother would say, mortified that I spoke English like a Mexican. At Pan American University, I and all Chicano students were required to take two speech classes. Their purpose: to get rid of our accents.\nO problema abordado nesse texto sobre imigrantes residentes nos Estados Unidos diz respeito aos prejuízos gerados pelo(a)",A,A,True,"O texto aborda o preconceito e discriminação sofridos pelos imigrantes residentes nos Estados Unidos em relação ao uso da língua espanhola. Os imigrantes são incentivados a abandonar seu sotaque espanhol, a língua materna é desvalorizada e até mesmo ridicularizada. Portanto, o problema abordado no texto diz respeito ao repúdio ao sotaque espanhol no uso do inglês.\n\nResposta final: A",A,"O texto aborda o preconceito e discriminação sofridos pelos imigrantes residentes nos Estados Unidos em relação ao uso da língua espanhola. Eles são incentivados a abandonar seu sotaque espanhol e sua língua materna é desvalorizada e ridicularizada. Portanto, o problema abordado no texto diz respeito ao repúdio ao sotaque espanhol no uso do inglês.\n\nResposta final: A","[1. Como os imigrantes residentes nos Estados Unidos são incentivados a abandonar seu sotaque espanhol?, 2. Qual é a reação dos imigrantes ao serem incentivados a abandonar seu sotaque espanhol?, 3. Como a língua materna dos imigrantes é desvalorizada e ridicularizada nos Estados Unidos?, 4. Qual é o principal problema abordado no texto em relação ao uso da língua espanhola pelos imigrantes nos Estados Unidos?]","[(1. Como os imigrantes residentes nos Estados Unidos são incentivados a abandonar seu sotaque espanhol?, Os imigrantes residentes nos Estados Unidos são incentivados a abandonar seus sotaques espanhóis através de programas de ensino de inglês, como ESL (English as a Second Language), que ajudam a melhorar suas habilidades linguísticas em inglês. Além disso, a exposição constante ao idioma inglês no ambiente de trabalho, na comunidade e na mídia também contribui para a redução do sotaque espanhol. Por fim, alguns imigrantes também optam por participar de aulas de dicção e pronúncia para aprimorar sua pronúncia em inglês.), (2. Qual é a reação dos imigrantes ao serem incentivados a abandonar seu sotaque espanhol?, A reação dos imigrantes ao serem incentivados a abandonar seu sotaque espanhol pode variar. Alguns imigrantes podem se sentir pressionados a assimilar-se à cultura dominante e abandonar sua identidade linguística e cultural, enquanto outros podem resistir a essa pressão e continuar a falar com seu sotaque espanhol com orgulho. Alguns imigrantes podem ver o incentivo a abandonar seu sotaque como uma forma de discriminação ou tentativa de assimilação forçada, enquanto outros podem ver como uma oportunidade de melhorar suas habilidades de comunicação e integração na sociedade de acolhimento. Em última análise, a reação dos imigrantes dependerá de sua própria experiência, identidade e perspectiva individual.), (3. Como a língua materna dos imigrantes é desvalorizada e ridicularizada nos Estados Unidos?, A língua materna dos imigrantes nos Estados Unidos é frequentemente desvalorizada e ridicularizada de várias maneiras. Isso pode ocorrer através de piadas, insultos ou estereótipos negativos associados à língua e à cultura dos imigrantes.\n\nAlém disso, muitas vezes os imigrantes são pressionados a abandonar sua língua materna em favor do inglês, como se a sua língua e cultura não tivessem valor ou importância. Isso pode causar sentimentos de inferioridade e alienação nos imigrantes, além de dificultar a transmissão da língua e cultura para as gerações futuras.\n\nAlém disso, a mídia e a sociedade em geral muitas vezes retratam as línguas dos imigrantes como inferiores ou engraçadas, reforçando estereótipos e preconceitos. Isso contribui para a marginalização e discriminação dos imigrantes baseada em sua língua e origem cultural.), (4. Qual é o principal problema abordado no texto em relação ao uso da língua espanhola pelos imigrantes nos Estados Unidos?, O principal problema abordado no texto em relação ao uso da língua espanhola pelos imigrantes nos Estados Unidos é a discriminação e o preconceito enfrentados por esses indivíduos devido ao seu idioma nativo. Eles são frequentemente alvo de discriminação e marginalização, sendo obrigados a se adaptar à cultura dominante e a aprender o inglês para serem aceitos na sociedade americana. Essa situação gera dificuldades de integração e limita as oportunidades de emprego e educação para os imigrantes hispânicos nos Estados Unidos.)]","Linguagens, Códigos e suas Tecnologias"
...,...,...,...,...,...,...,...,...,...,...,...
175,questao_176,"Atualmente, há telefones celulares com telas de diversos tamanhos e em formatos retangulares. Alguns deles apresentam telas medindo três inteiros e um meio polegadas, com determinadas especificações técnicas. Além disso, em muitos modelos, com a inclusão de novas funções no celular, suas telas ficaram maiores, sendo muito comum encontrarmos atualmente telas medindo quatro inteiros e cinco sextos polegadas, conforme a figura.\n[[placeholder]]\n\n. A diferença de tamanho, em valor absoluto, entre as medidas, em polegada, das telas do celular 2 e do celular 1, representada apenas com uma casa decimal, é",D,D,True,"Para encontrar a diferença de tamanho em polegadas entre as telas dos dois celulares, precisamos subtrair o tamanho da tela do celular 1 do tamanho da tela do celular 2.\n\nTamanho da tela do celular 1: 3,5 polegadas\nTamanho da tela do celular 2: 4,83 polegadas\n\nSubtraindo:\n4,83 - 3,5 = 1,33\n\nPortanto, a diferença de tamanho, em valor absoluto, entre as medidas das telas do celular 2 e do celular 1 é de 1,3 polegadas.\n\nResposta final: D",D,"Para encontrar a diferença de tamanho em polegadas entre as telas dos dois celulares, precisamos subtrair o tamanho da tela do celular 1 do tamanho da tela do celular 2.\n\nTamanho da tela do celular 1: 3,5 polegadas\nTamanho da tela do celular 2: 4,83 polegadas\n\nSubtraindo:\n4,83 - 3,5 = 1,33\n\nO valor absoluto da diferença de tamanho entre as medidas das telas dos celulares é de 1,3 polegadas, representado com uma casa decimal.\n\nResposta final: D","[1. Qual o tamanho da tela do celular 1 em polegadas?, 2. Qual o tamanho da tela do celular 2 em polegadas?, 3. Como foi feita a operação para encontrar a diferença de tamanho entre as telas dos celulares?, 4. Qual é o valor absoluto da diferença de tamanho das telas dos celulares, representado com uma casa decimal?]","[(1. Qual o tamanho da tela do celular 1 em polegadas?, Desculpe, mas não consigo responder a essa pergunta sem mais informações sobre o celular em questão. Você poderia fornecer mais detalhes para que eu possa ajudá-lo?), (2. Qual o tamanho da tela do celular 2 em polegadas?, O tamanho da tela do celular 2 em polegadas é de 6.5 polegadas.), (3. Como foi feita a operação para encontrar a diferença de tamanho entre as telas dos celulares?, Para encontrar a diferença de tamanho entre as telas dos celulares, foi feita uma subtração simples entre os tamanhos das telas dos dois celulares. Por exemplo, se um celular tem uma tela de 6 polegadas e o outro tem uma tela de 5 polegadas, a diferença de tamanho entre as telas seria de 1 polegada (6 - 5 = 1). Essa operação foi realizada para cada par de celulares comparados para determinar a diferença de tamanho entre suas telas.), (4. Qual é o valor absoluto da diferença de tamanho das telas dos celulares, representado com uma casa decimal?, O valor absoluto da diferença de tamanho das telas dos celulares é 0.1 polegadas.)]",Matemática e suas Tecnologias
176,questao_177,"Uma imobiliária iniciou uma campanha de divulgação para promover a venda de apartamentos que podem ser pagos em 100 parcelas mensais. O valor da primeira delas é fixado no momento da compra, com o pagamento dessa primeira parcela. A partir da segunda parcela, o valor é determinado pela aplicação de um acréscimo percentual fixo ao valor da parcela anterior. Como atrativo, a imobiliária fará o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador.\nUm cliente, que faz aniversário no mês de maio, decidiu comprar um desses apartamentos por meio do financiamento oferecido pela imobiliária, e pretende escolher o mês mais adequado para realizar essa compra, de modo que o valor total dos pagamentos seja o menor possível.\nQual é o mês que esse cliente deverá escolher para realizar a compra do apartamento?",A,C,False,"Para encontrar o melhor mês para o cliente comprar o apartamento, precisamos escolher o mês que resultará no menor valor total dos pagamentos. \n\nO cliente faz aniversário em maio, o que significa que as parcelas correspondentes a esse mês serão pagas pela imobiliária. Portanto, o cliente deve escolher um mês que tenha a maior quantidade possível de parcelas pagas pela imobiliária.\n\nSe o cliente escolher o mês de maio para a compra, ele terá as parcelas de maio pagas pela imobiliária, resultando em uma economia. Assim, o valor total dos pagamentos será menor se ele escolher o mês de maio para a compra.\n\nResposta final: C",C,"Para encontrar o melhor mês para o cliente comprar o apartamento, devemos considerar que a imobiliária oferece o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador. Como o cliente faz aniversário em maio, ele deve escolher o mês de maio para a compra, pois terá as parcelas desse mês pagas pela imobiliária, resultando em uma economia. Assim, o valor total dos pagamentos será menor se ele escolher o mês de maio para a compra.\n\nResposta final: C","[1. A imobiliária oferece o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador?, 2. O valor da primeira parcela é fixo no momento da compra?, 3. O valor das parcelas a partir da segunda é determinado pela aplicação de um acréscimo percentual fixo ao valor da parcela anterior?, 4. Qual é o mês de aniversário do cliente que pretende comprar o apartamento?]","[(1. A imobiliária oferece o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador?, Isso pode variar de imobiliária para imobiliária. Algumas podem oferecer o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador como uma forma de incentivo ou promoção, mas isso não é uma prática comum. Recomenda-se verificar diretamente com a imobiliária em questão para saber se essa opção está disponível.), (2. O valor da primeira parcela é fixo no momento da compra?, Geralmente, o valor da primeira parcela é fixo no momento da compra, a menos que haja alguma mudança nas condições de pagamento acordadas com a loja ou fornecedor. É importante verificar as informações detalhadas sobre as parcelas antes de efetuar a compra para evitar surpresas no futuro.), (3. O valor das parcelas a partir da segunda é determinado pela aplicação de um acréscimo percentual fixo ao valor da parcela anterior?, Sim, o valor das parcelas a partir da segunda é determinado pela aplicação de um acréscimo percentual fixo ao valor da parcela anterior. Isso significa que o valor de cada parcela subsequente será calculado adicionando-se ao valor da parcela anterior um determinado percentual fixo, estabelecido previamente. Essa prática é comum em financiamentos, empréstimos e outros tipos de parcelamentos.), (4. Qual é o mês de aniversário do cliente que pretende comprar o apartamento?, Desculpe, mas como um assistente de IA, não tenho acesso a informações pessoais dos clientes, como a data de aniversário. Sugiro que você entre em contato diretamente com o cliente para obter essa informação.)]",Matemática e suas Tecnologias
177,questao_178,"Um professor de desenho, apresentou uma peça de 45 centímetros de comprimento e solicitou aos alunos reproduzir no papel o objeto, onde as medidas devem ser proporcionais às medidas reais, e o comprimento deste desenho tem que ser de 9 centímetros.\nA escala utilizada para realizar esse desenho é",D,D,True,"Para calcular a escala utilizada no desenho, podemos usar a fórmula:\n\nEscala = Medida no desenho / Medida real\n\nNo caso do enunciado, a medida no desenho é de 9 cm e a medida real é de 45 cm, então a escala seria:\n\nEscala = 9 / 45 = 1 / 5\n\nPortanto, a escala utilizada para realizar o desenho é de 1 para 5.\n\nResposta final: D",D,"Após revisar as verificações, podemos concluir que a resposta original está correta com base nas informações fornecidas no enunciado. A escala utilizada para realizar o desenho é de 1 para 5, pois a medida no desenho é de 9 cm e a medida real é de 45 cm.\n\nResposta final: D","[1. Qual é a fórmula utilizada para calcular a escala em um desenho?, 2. Qual é a medida no desenho do objeto apresentado pelo professor?, 3. Qual é a medida real do objeto apresentado pelo professor?, 4. Qual é a escala utilizada para realizar o desenho conforme a explicação fornecida?]","[(1. Qual é a fórmula utilizada para calcular a escala em um desenho?, A fórmula utilizada para calcular a escala em um desenho é:\n\nEscala = Tamanho do desenho / Tamanho real), (2. Qual é a medida no desenho do objeto apresentado pelo professor?, Não é possível determinar a medida do objeto no desenho sem mais informações específicas fornecidas pelo professor. A medida pode variar dependendo das dimensões do objeto e da escala utilizada no desenho. Seria necessário ter mais detalhes do desenho ou da descrição feita pelo professor para responder com precisão.), (3. Qual é a medida real do objeto apresentado pelo professor?, Para determinar a medida real do objeto apresentado pelo professor, é necessário utilizar uma régua ou fita métrica para medir o objeto em questão. Com a medida obtida em centímetros ou metros, é possível determinar a medida real do objeto.), (4. Qual é a escala utilizada para realizar o desenho conforme a explicação fornecida?, Não foi fornecida uma explicação específica sobre o desenho em questão, portanto não é possível determinar a escala utilizada. A escala pode variar dependendo do tipo de desenho e do propósito para o qual está sendo feito. Em desenhos técnicos, por exemplo, é comum utilizar escalas como 1:10, 1:50, 1:100, entre outras. Se tiver mais informações sobre o desenho em questão, posso tentar ajudá-lo a determinar a escala utilizada.)]",Matemática e suas Tecnologias
178,questao_179,"A prefeitura de uma cidade planeja construir três postos de saúde. Esses postos devem ser construídos em locais equidistantes entre si e de forma que as distâncias desses três postos ao hospital dessa cidade sejam iguais. Foram conseguidos três locais para a construção dos postos de saúde que apresentam as características desejadas, e que distam 10 quilômetros entre si, conforme o esquema, no qual o ponto H representa o local onde está construído o hospital; os pontos P índice 1, P índice 2 e P índice 3, os postos de saúde; e esses quatro pontos estão em um mesmo plano.\n[[placeholder]]\nA distância, em quilômetro, entre o hospital e cada um dos postos de saúde, é um valor entre",C,C,True,"Para que os postos de saúde estejam equidistantes entre si e em relação ao hospital, a distância entre cada posto de saúde e o hospital deve ser a mesma. Como os postos de saúde estão a 10 km de distância entre si, então a distância entre o hospital e cada posto de saúde deve ser igual a metade dessa distância, ou seja, 5 km.\n\nPortanto, a alternativa correta é:\n\nResposta final: C) 5 e 6.",C,"Considerando que os postos de saúde estão a 10 km de distância entre si, a distância entre o hospital e cada posto de saúde deve ser igual a metade dessa distância, ou seja, 5 km. Portanto, a distância entre o hospital e cada posto de saúde deve estar entre 5 e 6 quilômetros.\n\nResposta final: C) 5 e 6.","[1. Os postos de saúde estão realmente a 10 km de distância entre si?, 2. A distância entre o hospital e cada posto de saúde é realmente a metade da distância entre os postos de saúde?, 3. Os postos de saúde foram construídos em locais equidistantes entre si?, 4. Todos os pontos estão realmente em um mesmo plano?]","[(1. Os postos de saúde estão realmente a 10 km de distância entre si?, Isso pode variar de acordo com a região e a localização dos postos de saúde. Em alguns casos, os postos de saúde podem estar mais próximos ou mais distantes, dependendo da densidade populacional da área, da disponibilidade de recursos e da política de saúde do município. O ideal é verificar a localização exata dos postos de saúde na sua região para ter uma noção mais precisa da distância entre eles.), (2. A distância entre o hospital e cada posto de saúde é realmente a metade da distância entre os postos de saúde?, Para determinar se a distância entre o hospital e cada posto de saúde é realmente a metade da distância entre os postos de saúde, precisamos de informações adicionais, como as distâncias exatas envolvidas. \n\nSe tivermos as distâncias entre o hospital e cada posto de saúde, bem como as distâncias entre os postos de saúde, podemos calcular se a primeira é realmente a metade da segunda. Caso contrário, não podemos afirmar com certeza se essa afirmação é verdadeira.), (3. Os postos de saúde foram construídos em locais equidistantes entre si?, Isso pode variar dependendo da região e da estratégia de distribuição de postos de saúde adotada pelo governo local. Em alguns casos, os postos de saúde podem ser construídos em locais equidistantes entre si para garantir um acesso mais igualitário aos serviços de saúde pela população. No entanto, em outras situações, os postos de saúde podem ser concentrados em áreas com maior demanda ou necessidade de atendimento, resultando em uma distribuição desigual entre eles. É importante avaliar cada caso específico para compreender a razão por trás da localização dos postos de saúde em uma determinada região.), (4. Todos os pontos estão realmente em um mesmo plano?, Para determinar se todos os pontos estão em um mesmo plano, é necessário verificar se eles satisfazem a equação geral de um plano. A equação geral de um plano é dada por Ax + By + Cz + D = 0, onde A, B, C e D são constantes e (x, y, z) são as coordenadas dos pontos.\n\nSe todos os pontos satisfizerem a equação do mesmo plano, então estarão em um mesmo plano. Para verificar isso, substitua as coordenadas dos pontos na equação do plano e veja se ela é satisfeita para todos os pontos. Se a equação for satisfeita para todos os pontos, então os pontos estão em um mesmo plano. Se a equação não for satisfeita para um dos pontos, então os pontos não estão em um mesmo plano.)]",Matemática e suas Tecnologias


## Test Self-Refine

#### Test Self-Refine with a single question 

In [466]:
q = data[0]
final_response, trace = self_refine_enem(q)
predicted = extract_answer_letter(final_response)

print("Prompt inicial (iteração 0):\n", build_cot_prompt(q))
print("\nResposta final após refinamento:\n", final_response)
print(f"\nAlternativa prevista: {predicted} | Gabarito: {q['label']}")

print("\nHistórico de iterações:")
for i, (resp, fb) in enumerate(trace):
    print(f"\n--- Iteração {i} ---")
    print("Resposta:", resp)
    if fb:
        print("Feedback:", fb)


Prompt inicial (iteração 0):
 Você verá abaixo alguns exemplos de como a pergunta deve ser respondida passo a passo. Leia atentamente os exemplos e, em seguida, responda a pergunta que vem depois deles.

        ### Exemplo 1:

        Pergunta:
        Urgência emocional. Se tudo é para ontem, se a vida engata uma primeira e sai em
        disparada, se não há mais tempo para paradas estratégicas, caímos fatalmente no vício de querer
        que os amores sejam igualmente resolvidos num átimo de segundo. Temos pressa para ouvir “eu
        te amo”. Não vemos a hora de que fiquem estabelecidas as regras de convívio: somos namorados,
        ficantes, casados, amantes? Urgência emocional. Uma cilada. Associamos diversas palavras ao
        AMOR: paixão, romance, sexo, adrenalina, palpitação. Esquecemos, no entanto, da palavra que
        viabiliza esse sentimento: “paciência”. Amor sem paciência não vinga. Amor não pode ser mastigado
        e engolido com emergência, com fome desespera

#### Self-Refine evaluation loop over sample questions

In [467]:
def run_self_refine(data):
    self_refine_results = []

    for i, question in enumerate(data):
        try:
            question_text = question["question"]
            correct_answer = question["label"]

            # Run SELF-REFINE
            final_answer, trace = self_refine_enem(question, max_iters=3)
            predicted = extract_answer_letter(final_answer)

            # Extract intermediate answers from trace
            answer_sequence = []
            baseline_answer = None

            for step, (response, feedback) in enumerate(trace):
                try:
                    letter = extract_answer_letter(response)
                except Exception:
                    letter = None
                answer_sequence.append(letter)
                if step == 0:
                    baseline_answer = response

            # Record result
            self_refine_results.append({
                "id": question["id"],
                "question": question_text,
                "ground_truth": correct_answer,
                "predicted": predicted,
                "correct": predicted == correct_answer,
                "initial_answer": extract_answer_letter(baseline_answer),
                "final_answer": final_answer,
                "answer_sequence": answer_sequence,
                "baseline_answer": baseline_answer,
                "trace": trace,
                "subject": question.get("subject", "unknown")
            })

            print(f"[{i+1}/{len(data)}] ✅ Predicted: {predicted} | Correct: {correct_answer}")

        except Exception as e:
            print(f"[{i+1}/{len(data)}] ❌ Error: {e}")
            self_refine_results.append({
                "id": i,
                "question": question.get("question", ""),
                "ground_truth": question.get("label", ""),
                "predicted": None,
                "correct": False,
                "error": str(e),
                "subject": question.get("subject", "unknown")
            })

    return self_refine_results

# Run
# self_refine_results = run_self_refine(data)


#### Self-Refine Results

In [468]:
df_self_refine = pd.DataFrame(self_refine_results)
save_results_csv(df_self_refine, method_name="self-refine_few-shot")
df_self_refine

✅ Results saved to results/self-refine_few-shot/self-refine_few-shot_results_2025-04-01_11-20-51.csv


Unnamed: 0,id,question,ground_truth,predicted,correct,initial_answer,final_answer,answer_sequence,baseline_answer,trace,subject
0,questao_01,"## Holy War\nOh, so we can hate each other and fear each other\nWe can build these walls between each other Baby, blow by blow and brick by brick Keep yourself locked in, yourself locked in\n[…]\nOh, maybe we should love somebody\nOh, maybe we could care a little more\nSo maybe we should love somebody\nInstead of polishing the bombs of holy war\nNessa letra de canção, de Alicia Keys, que aborda um contexto de ódio e intolerância, o marcador “instead of ” introduz a ideia de",A,A,True,A,"A expressão ""instead of"" é usada para indicar uma substituição, ou seja, algo que deve ser feito no lugar de outra coisa. No trecho da letra da música, a sugestão é amar alguém e se importar mais ao invés de alimentar a guerra santa. Portanto, o marcador ""instead of"" introduz a ideia de mudança de comportamento, escolhendo o amor e a empatia em vez da violência e ódio.\n\nResposta final: A) mudança de comportamento.",[A],"A expressão ""instead of"" é usada para indicar uma substituição, ou seja, algo que deve ser feito no lugar de outra coisa. No trecho da letra da música, a sugestão é amar alguém e se importar mais ao invés de alimentar a guerra santa. Portanto, o marcador ""instead of"" introduz a ideia de mudança de comportamento, escolhendo o amor e a empatia em vez da violência e ódio.\n\nResposta final: A) mudança de comportamento.","[(A expressão ""instead of"" é usada para indicar uma substituição, ou seja, algo que deve ser feito no lugar de outra coisa. No trecho da letra da música, a sugestão é amar alguém e se importar mais ao invés de alimentar a guerra santa. Portanto, o marcador ""instead of"" introduz a ideia de mudança de comportamento, escolhendo o amor e a empatia em vez da violência e ódio.\n\nResposta final: A) mudança de comportamento., None)]","Linguagens, Códigos e suas Tecnologias"
1,questao_02,[[placeholder]]\nO texto estabelece uma relação entre elementos da natureza e comandos de um programa de computador para,A,E,False,D,"Ao analisarmos o trecho que estabelece a relação entre elementos da natureza e comandos de um programa de computador, percebemos que a comparação feita é entre a rapidez da luz, o tempo de crescimento de uma árvore, os ciclos da água e as colheitas, que possuem a mesma duração. Essa comparação tem o objetivo de mostrar que, assim como um programa segue uma sequência de comandos, a natureza também segue um ciclo específico e ordenado.\n\nDessa forma, a relação estabelecida no texto visa informar os interessados sobre o tempo de crescimento de novas árvores, o que reflete a analogia feita entre elementos naturais e comandos de um programa de computador.\n\nResposta final: E","[D, E]","Para responder a essa pergunta, precisamos analisar o trecho que estabelece a relação entre elementos da natureza e comandos de um programa de computador. Nesse trecho, é mencionado que ""a rapidez da luz, o tempo de crescimento de uma árvore, os ciclos da água e as colheitas têm a mesma duração"". Essa comparação entre elementos naturais e comandos de um programa de computador tem o objetivo de mostrar que, assim como um programa segue uma sequência de comandos, a natureza também segue um ciclo específico e ordenado.\n\nPortanto, a opção correta que melhor reflete essa relação estabelecida no texto é a alternativa:\n\nD) orientar os usuários sobre o emprego sustentável das novas tecnologias.\n\nResposta final: D","[(Para responder a essa pergunta, precisamos analisar o trecho que estabelece a relação entre elementos da natureza e comandos de um programa de computador. Nesse trecho, é mencionado que ""a rapidez da luz, o tempo de crescimento de uma árvore, os ciclos da água e as colheitas têm a mesma duração"". Essa comparação entre elementos naturais e comandos de um programa de computador tem o objetivo de mostrar que, assim como um programa segue uma sequência de comandos, a natureza também segue um ciclo específico e ordenado.\n\nPortanto, a opção correta que melhor reflete essa relação estabelecida no texto é a alternativa:\n\nD) orientar os usuários sobre o emprego sustentável das novas tecnologias.\n\nResposta final: D, None), (Ao analisarmos o trecho que estabelece a relação entre elementos da natureza e comandos de um programa de computador, percebemos que a comparação feita é entre a rapidez da luz, o tempo de crescimento de uma árvore, os ciclos da água e as colheitas, que possuem a mesma duração. Essa comparação tem o objetivo de mostrar que, assim como um programa segue uma sequência de comandos, a natureza também segue um ciclo específico e ordenado.\n\nDessa forma, a relação estabelecida no texto visa informar os interessados sobre o tempo de crescimento de novas árvores, o que reflete a analogia feita entre elementos naturais e comandos de um programa de computador.\n\nResposta final: E, A resposta apresentada possui alguns problemas. Primeiramente, a relação estabelecida no texto não tem como objetivo alertar sobre a rápida destruição da natureza, conscientizar sobre a passagem acelerada do tempo, apresentar avanços tecnológicos na agricultura ou informar sobre o tempo de crescimento de árvores. Portanto, a escolha da alternativa D está incorreta.\n\nAlém disso, a argumentação poderia ser mais clara e precisa ao explicar a relação entre elementos da natureza e comandos de um programa de computador, destacando a importância da sustentabilidade e do uso consciente das tecnologias.\n\nUma resposta mais adequada poderia ser a alternativa E) informar os interessados sobre o tempo de crescimento de novas árvores, uma vez que a relação estabelecida no texto está relacionada ao ciclo de crescimento das árvores.)]","Linguagens, Códigos e suas Tecnologias"
2,questao_03,[[placeholder]]\nA relação entre as citações atribuídas ao físico Albert Einstein e ao cantor e compositor Bob Marley reside na crença de que é necessário,C,C,True,C,"A citação atribuída a Albert Einstein fala sobre a importância de aproveitar as oportunidades que surgem em meio às dificuldades. Já a citação atribuída a Bob Marley destaca a necessidade de identificar os momentos de perigo e de saber agir diante deles. Portanto, a relação entre as duas citações está na ideia de tirar proveito de situações que podem ser adversas, como forma de crescimento e superação.\n\nResposta final: C",[C],"A citação atribuída a Albert Einstein fala sobre a importância de aproveitar as oportunidades que surgem em meio às dificuldades. Já a citação atribuída a Bob Marley destaca a necessidade de identificar os momentos de perigo e de saber agir diante deles. Portanto, a relação entre as duas citações está na ideia de tirar proveito de situações que podem ser adversas, como forma de crescimento e superação.\n\nResposta final: C","[(A citação atribuída a Albert Einstein fala sobre a importância de aproveitar as oportunidades que surgem em meio às dificuldades. Já a citação atribuída a Bob Marley destaca a necessidade de identificar os momentos de perigo e de saber agir diante deles. Portanto, a relação entre as duas citações está na ideia de tirar proveito de situações que podem ser adversas, como forma de crescimento e superação.\n\nResposta final: C, None)]","Linguagens, Códigos e suas Tecnologias"
3,questao_04,[[placeholder]]A carta da editora Stephanie Allen-Nichols à escritoraAlice Walker tem o propósito de,E,D,False,D,"Para responder a essa pergunta, primeiramente precisamos analisar o texto em questão, que é a carta da editora Stephanie Allen-Nichols à escritora Alice Walker. A partir dessa análise, podemos identificar o propósito da carta.\n\nAo ler a carta, percebemos que a editora expressa sua profunda admiração pelo talento literário de Alice Walker, destacando o impacto positivo de suas obras. A carta também menciona a importância de publicar novos trabalhos da autora e ressalta o interesse da editora em continuar colaborando com ela.\n\nPortanto, o propósito da carta de Stephanie Allen-Nichols à escritora Alice Walker não é problematizar o enredo de sua obra, acusar o recebimento de seu manuscrito, solicitar a revisão ortográfica de seu texto, informar a transferência de seu livro a outra editora ou comunicar a recusa da publicação de seu romance.\n\nCom base nessa análise, a alternativa correta é:\n\nResposta final: D) informar a transferência de seu livro a outra editora.",[D],"Para responder a essa pergunta, primeiramente precisamos analisar o texto em questão, que é a carta da editora Stephanie Allen-Nichols à escritora Alice Walker. A partir dessa análise, podemos identificar o propósito da carta.\n\nAo ler a carta, percebemos que a editora expressa sua profunda admiração pelo talento literário de Alice Walker, destacando o impacto positivo de suas obras. A carta também menciona a importância de publicar novos trabalhos da autora e ressalta o interesse da editora em continuar colaborando com ela.\n\nPortanto, o propósito da carta de Stephanie Allen-Nichols à escritora Alice Walker não é problematizar o enredo de sua obra, acusar o recebimento de seu manuscrito, solicitar a revisão ortográfica de seu texto, informar a transferência de seu livro a outra editora ou comunicar a recusa da publicação de seu romance.\n\nCom base nessa análise, a alternativa correta é:\n\nResposta final: D) informar a transferência de seu livro a outra editora.","[(Para responder a essa pergunta, primeiramente precisamos analisar o texto em questão, que é a carta da editora Stephanie Allen-Nichols à escritora Alice Walker. A partir dessa análise, podemos identificar o propósito da carta.\n\nAo ler a carta, percebemos que a editora expressa sua profunda admiração pelo talento literário de Alice Walker, destacando o impacto positivo de suas obras. A carta também menciona a importância de publicar novos trabalhos da autora e ressalta o interesse da editora em continuar colaborando com ela.\n\nPortanto, o propósito da carta de Stephanie Allen-Nichols à escritora Alice Walker não é problematizar o enredo de sua obra, acusar o recebimento de seu manuscrito, solicitar a revisão ortográfica de seu texto, informar a transferência de seu livro a outra editora ou comunicar a recusa da publicação de seu romance.\n\nCom base nessa análise, a alternativa correta é:\n\nResposta final: D) informar a transferência de seu livro a outra editora., None)]","Linguagens, Códigos e suas Tecnologias"
4,questao_05,"## Borderlands/La frontera: the Nem Mestiza\nGlória Anzaldúa\nI remember being caught speaking Spanish at recess [...] I remember being sent to the corner of the classroom for “talking back” to the Anglo teacher when all I was trying to do was tell her how to pronounce my name. “If you want to be American, speak ‘American’. If you don’t like it, go back to Mexico where you belong”.\n“I want you to speak English […]”, my mother would say, mortified that I spoke English like a Mexican. At Pan American University, I and all Chicano students were required to take two speech classes. Their purpose: to get rid of our accents.\nO problema abordado nesse texto sobre imigrantes residentes nos Estados Unidos diz respeito aos prejuízos gerados pelo(a)",A,B,False,A,"Nesse texto, a autora aborda o problema enfrentado por imigrantes residentes nos Estados Unidos em relação ao apagamento da língua materna, o espanhol, e a imposição do inglês como língua única e correta. Isso gera prejuízos para esses imigrantes, como a perda da conexão com suas raízes e identidade cultural, além de dificuldades de comunicação e integração na sociedade. Portanto, a alternativa correta é:\n\nResposta final: B) resignação diante do apagamento da língua materna.","[A, B, A, B]","Nesse texto, a autora aborda o problema enfrentado por imigrantes residentes nos Estados Unidos em relação à pressão para se adaptarem à cultura dominante, que inclui o apagamento do sotaque espanhol e a imposição do inglês como língua única e correta. Isso gera prejuízos para esses imigrantes, como a perda da conexão com sua língua materna e a imposição de uma identidade que não corresponde à sua origem.\n\nPortanto, a alternativa correta é:\n\nResposta final: A) repúdio ao sotaque espanhol no uso do inglês.","[(Nesse texto, a autora aborda o problema enfrentado por imigrantes residentes nos Estados Unidos em relação à pressão para se adaptarem à cultura dominante, que inclui o apagamento do sotaque espanhol e a imposição do inglês como língua única e correta. Isso gera prejuízos para esses imigrantes, como a perda da conexão com sua língua materna e a imposição de uma identidade que não corresponde à sua origem.\n\nPortanto, a alternativa correta é:\n\nResposta final: A) repúdio ao sotaque espanhol no uso do inglês., None), (Nesse texto, a autora aborda o problema enfrentado por imigrantes residentes nos Estados Unidos em relação ao apagamento da língua materna, o espanhol, e a imposição do inglês como língua única e correta. Isso gera prejuízos para esses imigrantes, como a perda da conexão com suas raízes e identidade cultural. \n\nPortanto, a alternativa correta é:\n\nResposta final: B) resignação diante do apagamento da língua materna., A resposta apresentada aborda de forma adequada o problema abordado no texto, destacando a pressão para se adaptarem à cultura dominante e a imposição do inglês como língua única. No entanto, poderia ter sido mais claro na escolha da alternativa, pois a resposta correta seria a letra B) resignação diante do apagamento da língua materna, já que o texto ressalta a perda da conexão com a língua materna dos imigrantes. Além disso, poderia ter sido mais explícito na explicação dos prejuízos gerados por essa situação. Portanto, a resposta poderia ser aprimorada para ser mais precisa e completa.), (Nesse texto, a autora aborda o problema enfrentado por imigrantes residentes nos Estados Unidos em relação ao apagamento da língua materna, o espanhol, e a imposição do inglês como língua única e correta. Isso gera prejuízos para esses imigrantes, como a perda da conexão com suas raízes e identidade cultural, além de dificuldades de comunicação e integração na sociedade. Portanto, a alternativa correta é:\n\nResposta final: A) repúdio ao sotaque espanhol no uso do inglês., A resposta apresentada está correta ao identificar o problema abordado no texto, que é o apagamento da língua materna dos imigrantes nos Estados Unidos. No entanto, a argumentação poderia ser mais desenvolvida, citando mais exemplos do texto que evidenciem esse apagamento e os prejuízos gerados. Além disso, a opção ""resignação"" pode não ser a melhor escolha, já que os imigrantes enfrentam o apagamento da língua materna de forma forçada, não necessariamente por resignação. Portanto, a resposta poderia ser aprimorada nesse aspecto.), (Nesse texto, a autora aborda o problema enfrentado por imigrantes residentes nos Estados Unidos em relação ao apagamento da língua materna, o espanhol, e a imposição do inglês como língua única e correta. Isso gera prejuízos para esses imigrantes, como a perda da conexão com suas raízes e identidade cultural, além de dificuldades de comunicação e integração na sociedade. Portanto, a alternativa correta é:\n\nResposta final: B) resignação diante do apagamento da língua materna., A resposta do modelo apresenta alguns pontos que podem ser melhorados. Primeiramente, a alternativa correta seria a B) resignação diante do apagamento da língua materna, pois o texto aborda a imposição do inglês e a tentativa de eliminar o sotaque e a língua materna dos imigrantes. Além disso, a argumentação poderia ser mais clara e direta, destacando os prejuízos causados pelo apagamento da língua materna e a imposição do inglês. Também seria interessante incluir exemplos específicos do texto para reforçar a argumentação. Portanto, a resposta final correta seria a B) resignação diante do apagamento da língua materna.)]","Linguagens, Códigos e suas Tecnologias"
...,...,...,...,...,...,...,...,...,...,...,...
175,questao_176,"Atualmente, há telefones celulares com telas de diversos tamanhos e em formatos retangulares. Alguns deles apresentam telas medindo três inteiros e um meio polegadas, com determinadas especificações técnicas. Além disso, em muitos modelos, com a inclusão de novas funções no celular, suas telas ficaram maiores, sendo muito comum encontrarmos atualmente telas medindo quatro inteiros e cinco sextos polegadas, conforme a figura.\n[[placeholder]]\n\n. A diferença de tamanho, em valor absoluto, entre as medidas, em polegada, das telas do celular 2 e do celular 1, representada apenas com uma casa decimal, é",D,D,True,D,"Para encontrar a diferença de tamanho entre as telas dos dois celulares, precisamos subtrair as medidas de tela do segundo celular pelas medidas do primeiro celular.\n\n- Celular 1: 3 1/2 polegadas\n- Celular 2: 4 5/6 polegadas\n\nConvertendo as frações para o mesmo denominador, temos:\n- Celular 1: 7/2 polegadas\n- Celular 2: 29/6 polegadas\n\nAgora, subtraímos:\n29/6 - 7/2 = 29/6 - 21/6 = 8/6 = 4/3 = 1 1/3 polegadas\n\nPortanto, a diferença de tamanho entre as telas dos dois celulares é de 1,3 polegadas.\n\nResposta final: D) 1,3.",[D],"Para encontrar a diferença de tamanho entre as telas dos dois celulares, precisamos subtrair as medidas de tela do segundo celular pelas medidas do primeiro celular.\n\n- Celular 1: 3 1/2 polegadas\n- Celular 2: 4 5/6 polegadas\n\nConvertendo as frações para o mesmo denominador, temos:\n- Celular 1: 7/2 polegadas\n- Celular 2: 29/6 polegadas\n\nAgora, subtraímos:\n29/6 - 7/2 = 29/6 - 21/6 = 8/6 = 4/3 = 1 1/3 polegadas\n\nPortanto, a diferença de tamanho entre as telas dos dois celulares é de 1,3 polegadas.\n\nResposta final: D) 1,3.","[(Para encontrar a diferença de tamanho entre as telas dos dois celulares, precisamos subtrair as medidas de tela do segundo celular pelas medidas do primeiro celular.\n\n- Celular 1: 3 1/2 polegadas\n- Celular 2: 4 5/6 polegadas\n\nConvertendo as frações para o mesmo denominador, temos:\n- Celular 1: 7/2 polegadas\n- Celular 2: 29/6 polegadas\n\nAgora, subtraímos:\n29/6 - 7/2 = 29/6 - 21/6 = 8/6 = 4/3 = 1 1/3 polegadas\n\nPortanto, a diferença de tamanho entre as telas dos dois celulares é de 1,3 polegadas.\n\nResposta final: D) 1,3., None)]",Matemática e suas Tecnologias
176,questao_177,"Uma imobiliária iniciou uma campanha de divulgação para promover a venda de apartamentos que podem ser pagos em 100 parcelas mensais. O valor da primeira delas é fixado no momento da compra, com o pagamento dessa primeira parcela. A partir da segunda parcela, o valor é determinado pela aplicação de um acréscimo percentual fixo ao valor da parcela anterior. Como atrativo, a imobiliária fará o pagamento de todas as parcelas correspondentes ao mês de aniversário do comprador.\nUm cliente, que faz aniversário no mês de maio, decidiu comprar um desses apartamentos por meio do financiamento oferecido pela imobiliária, e pretende escolher o mês mais adequado para realizar essa compra, de modo que o valor total dos pagamentos seja o menor possível.\nQual é o mês que esse cliente deverá escolher para realizar a compra do apartamento?",A,B,False,B,"Para determinar o mês mais adequado para o cliente realizar a compra do apartamento de forma a minimizar o valor total dos pagamentos, devemos considerar que a imobiliária pagará todas as parcelas correspondentes ao mês de aniversário do comprador. Portanto, o cliente deverá escolher o mês mais próximo possível ao mês de maio, para que seja beneficiado com o menor número de parcelas pagas.\n\nConsiderando que o cliente faz aniversário em maio, o mês mais adequado para ele realizar a compra do apartamento será o mês anterior ao seu aniversário, ou seja, abril. Dessa forma, o cliente terá o menor número de parcelas pagas no total.\n\nResposta final: B) Abril.",[B],"Para determinar o mês mais adequado para o cliente realizar a compra do apartamento de forma a minimizar o valor total dos pagamentos, devemos considerar que a imobiliária pagará todas as parcelas correspondentes ao mês de aniversário do comprador. Portanto, o cliente deverá escolher o mês mais próximo possível ao mês de maio, para que seja beneficiado com o menor número de parcelas pagas.\n\nConsiderando que o cliente faz aniversário em maio, o mês mais adequado para ele realizar a compra do apartamento será o mês anterior ao seu aniversário, ou seja, abril. Dessa forma, o cliente terá o menor número de parcelas pagas no total.\n\nResposta final: B) Abril.","[(Para determinar o mês mais adequado para o cliente realizar a compra do apartamento de forma a minimizar o valor total dos pagamentos, devemos considerar que a imobiliária pagará todas as parcelas correspondentes ao mês de aniversário do comprador. Portanto, o cliente deverá escolher o mês mais próximo possível ao mês de maio, para que seja beneficiado com o menor número de parcelas pagas.\n\nConsiderando que o cliente faz aniversário em maio, o mês mais adequado para ele realizar a compra do apartamento será o mês anterior ao seu aniversário, ou seja, abril. Dessa forma, o cliente terá o menor número de parcelas pagas no total.\n\nResposta final: B) Abril., None)]",Matemática e suas Tecnologias
177,questao_178,"Um professor de desenho, apresentou uma peça de 45 centímetros de comprimento e solicitou aos alunos reproduzir no papel o objeto, onde as medidas devem ser proporcionais às medidas reais, e o comprimento deste desenho tem que ser de 9 centímetros.\nA escala utilizada para realizar esse desenho é",D,D,True,D,"Para descobrir a escala utilizada no desenho, basta dividir o comprimento real do objeto pelo comprimento do desenho. Nesse caso, a peça tem 45 cm de comprimento e o desenho tem 9 cm. Portanto, a escala utilizada é de 45 dividido por 9, resultando em 5.\n\nResposta final: D) 1 para 5.",[D],"Para descobrir a escala utilizada no desenho, basta dividir o comprimento real do objeto pelo comprimento do desenho. Nesse caso, a peça tem 45 cm de comprimento e o desenho tem 9 cm. Portanto, a escala utilizada é de 45 dividido por 9, resultando em 5.\n\nResposta final: D) 1 para 5.","[(Para descobrir a escala utilizada no desenho, basta dividir o comprimento real do objeto pelo comprimento do desenho. Nesse caso, a peça tem 45 cm de comprimento e o desenho tem 9 cm. Portanto, a escala utilizada é de 45 dividido por 9, resultando em 5.\n\nResposta final: D) 1 para 5., None)]",Matemática e suas Tecnologias
178,questao_179,"A prefeitura de uma cidade planeja construir três postos de saúde. Esses postos devem ser construídos em locais equidistantes entre si e de forma que as distâncias desses três postos ao hospital dessa cidade sejam iguais. Foram conseguidos três locais para a construção dos postos de saúde que apresentam as características desejadas, e que distam 10 quilômetros entre si, conforme o esquema, no qual o ponto H representa o local onde está construído o hospital; os pontos P índice 1, P índice 2 e P índice 3, os postos de saúde; e esses quatro pontos estão em um mesmo plano.\n[[placeholder]]\nA distância, em quilômetro, entre o hospital e cada um dos postos de saúde, é um valor entre",C,C,True,C,"Para que os postos de saúde sejam construídos em locais equidistantes entre si, formando um triângulo equilátero, a distância entre cada posto de saúde e o hospital deve ser igual. Como as distâncias entre os postos de saúde são de 10 quilômetros entre si, o triângulo formado é equilátero. \n\nEm um triângulo equilátero, a distância do ponto central (hospital) até cada vértice (posto de saúde) é igual à metade do comprimento de um lado do triângulo. Portanto, a distância entre o hospital e cada um dos postos de saúde é de 5 quilômetros.\n\nResposta final: C",[C],"Para que os postos de saúde sejam construídos em locais equidistantes entre si, formando um triângulo equilátero, a distância entre cada posto de saúde e o hospital deve ser igual. Como as distâncias entre os postos de saúde são de 10 quilômetros entre si, o triângulo formado é equilátero. \n\nEm um triângulo equilátero, a distância do ponto central (hospital) até cada vértice (posto de saúde) é igual à metade do comprimento de um lado do triângulo. Portanto, a distância entre o hospital e cada um dos postos de saúde é de 5 quilômetros.\n\nResposta final: C","[(Para que os postos de saúde sejam construídos em locais equidistantes entre si, formando um triângulo equilátero, a distância entre cada posto de saúde e o hospital deve ser igual. Como as distâncias entre os postos de saúde são de 10 quilômetros entre si, o triângulo formado é equilátero. \n\nEm um triângulo equilátero, a distância do ponto central (hospital) até cada vértice (posto de saúde) é igual à metade do comprimento de um lado do triângulo. Portanto, a distância entre o hospital e cada um dos postos de saúde é de 5 quilômetros.\n\nResposta final: C, None)]",Matemática e suas Tecnologias


## Test all methods - Loop

In [474]:
num_iterations = 2

for iteration in range(num_iterations):
    print(f"\n=== Iteration {iteration + 1} of {num_iterations} ===")

    # --- CoVe ---
    # cove_results = run_cove(data)
    # df_cove = pd.DataFrame(cove_results)
    # save_results_csv(df_cove, method_name=f"cove_few-shot")
    # print("CoVe results saved to CSV.")
    
    # --- Self-Refine ---
    # self_refine_results = run_self_refine(data)
    # df_self_refine = pd.DataFrame(self_refine_results)
    # save_results_csv(df_self_refine, method_name=f"self-refine_few-shot")
    # print("Self-Refine results saved to CSV.")
    
    # --- CoT ---
    cot_results = run_cot(data)
    df_cot = pd.DataFrame(cot_results)
    save_results_csv(df_cot, method_name=f"cot_few-shot")
    print("CoT results saved to CSV.")



=== Iteration 1 of 2 ===
[1/180] ✅ Predicted: A | Correct: A
[2/180] ✅ Predicted: D | Correct: A
[3/180] ✅ Predicted: C | Correct: C
[4/180] ✅ Predicted: None | Correct: E
[5/180] ✅ Predicted: A | Correct: A
[6/180] ✅ Predicted: C | Correct: C
[7/180] ✅ Predicted: B | Correct: B
[8/180] ✅ Predicted: E | Correct: E
[9/180] ✅ Predicted: A | Correct: D
[10/180] ✅ Predicted: A | Correct: A
[11/180] ✅ Predicted: D | Correct: D
[12/180] ✅ Predicted: E | Correct: E
[13/180] ✅ Predicted: E | Correct: E
[14/180] ✅ Predicted: B | Correct: B
[15/180] ✅ Predicted: D | Correct: D
[16/180] ✅ Predicted: D | Correct: D
[17/180] ✅ Predicted: B | Correct: B
[18/180] ✅ Predicted: D | Correct: D
[19/180] ✅ Predicted: B | Correct: B
[20/180] ✅ Predicted: B | Correct: B
[21/180] ✅ Predicted: D | Correct: C
[22/180] ✅ Predicted: A | Correct: E
[23/180] ✅ Predicted: E | Correct: E
[24/180] ✅ Predicted: B | Correct: C
[25/180] ✅ Predicted: B | Correct: B
[26/180] ✅ Predicted: C | Correct: D
[27/180] ✅ Predict