### Evaluador V3

In [24]:
!pip -q install openpyxl

In [25]:
import pandas as pd
import hashlib

def calculate_total_points(row):
    """Calcula el total de puntos para una fila del DataFrame."""
    score_columns = ['Puntuación 1', 'Puntuación 2', 'Puntuación 3']
    return sum(row[col] for col in score_columns if pd.notnull(row[col]))

def calculate_total_points_to_consider(row):
    """Calcula el total de puntos a considerar para una fila del DataFrame."""
    point_columns = ['Punto 1', 'Punto 2', 'Punto 3']
    return sum(1 for col in point_columns if row[col] != '')


# Cargar el archivo CSV
df = pd.read_csv('/workspaces/codespaces-jupyter/data/Pauta-Control4.csv')

df = df.fillna('')

df = df.drop(df.columns[2], axis=1)

df.columns = ['Tópico', 'Pregunta', 'Punto 1', 'Puntuación 1', 'Punto 2', 'Puntuación 2', 'Punto 3', 'Puntuación 3']

# Generar un ID único para cada pregunta usando una función de hash
df['ID'] = df['Pregunta'].apply(lambda x: hashlib.sha256(x.encode()).hexdigest())

# Convertir las columnas de puntuación a numéricas para poder sumarlas
df['Puntuación 1'] = pd.to_numeric(df['Puntuación 1'], errors='coerce').fillna(0)
df['Puntuación 2'] = pd.to_numeric(df['Puntuación 2'], errors='coerce').fillna(0)
df['Puntuación 3'] = pd.to_numeric(df['Puntuación 3'], errors='coerce').fillna(0)

# Calcular el total de puntos para cada pregunta y el total de puntos a considerar
df['Total Puntos'] = df.apply(calculate_total_points, axis=1)
df['Total Puntos a Considerar'] = df.apply(calculate_total_points_to_consider, axis=1)

# Reordenar las columnas
df = df[['Tópico', 'Pregunta', 'Total Puntos', 'Total Puntos a Considerar', 'Punto 1', 'Puntuación 1', 'Punto 2', 'Puntuación 2', 'Punto 3', 'Puntuación 3', 'ID']]

# Guardar el DataFrame como CSV y Excel en carpeta data
df.to_csv('/workspaces/codespaces-jupyter/data/pauta.csv', index=False)
df.to_excel('/workspaces/codespaces-jupyter/data/pauta.xlsx', index=False)


In [26]:
df

Unnamed: 0,Tópico,Pregunta,Total Puntos,Total Puntos a Considerar,Punto 1,Puntuación 1,Punto 2,Puntuación 2,Punto 3,Puntuación 3,ID
0,Montículo,"En un montículo de máximos, ¿dónde se encuentr...",2.0,2,El máximo se encuentra en la raíz,1.0,El mínimo se encuentra en una hoja (que no es ...,1.0,,0.0,c4f6c99ba30f4d5f46848e0e601c89658a56f8aa7ec746...
1,Montículo,"En un montículo de máximos, ¿cómo encuentro el...",2.0,2,Revisar el arreglo (las hojas),1.0,Usar una variable auxiliar para ir almacenando...,1.0,,0.0,ef837014740ada5351f39db6910208979dac8b81cd79a1...
2,Montículo,¿Qué propiedad básica de la estructura de árbo...,2.0,1,Cada nodo es mayor o igual a sus hijos,2.0,,0.0,,0.0,f057dab5ea2d18b3914d62f6fd8025b37b62585756582a...
3,Montículo,¿Cómo se representa un montículo binario en me...,2.0,1,Se debe utilizar un arreglo.,2.0,,0.0,,0.0,cd6b2697a4a7ba4a519314646d2afba3f506f2ffcfb745...
4,Montículo,¿Por qué se dice que la inserción en un montíc...,2.0,1,La cantidad de niveles que debe subir el nuevo...,2.0,,0.0,,0.0,8df7b012e5f89cf02629e4f9193e95768b083d18b5c983...
...,...,...,...,...,...,...,...,...,...,...,...
62,Uso TDAs,¿Qué TDA(s) usaría para construir un sistema d...,2.0,2,"Mapa de productos, con clave nombre o id de pr...",1.0,Explicación clara y concisa de como utilizar e...,1.0,,0.0,95c338c15b9b66a09e44cbb4e73a915cf5ac3fe519bcb2...
63,Uso TDAs,¿Qué TDA(s) usaría para realizar operaciones d...,2.0,2,Mapas para organizar por distintos criterios (...,1.0,Explicación clara y concisa de como utilizar e...,1.0,,0.0,7c3edcc9d0a4500d83781b722683dd3bb450cb5f3e763b...
64,Uso TDAs,¿Qué TDA(s) usaría para programar la ruta más ...,2.0,2,Grafo explicitando a qué corresponden los nodo...,1.0,Explicación clara y concisa de como utilizar e...,1.0,,0.0,fb1016134fc0a8a9523de70f97f12662ffd2d0c3673397...
65,Uso TDAs,¿Qué TDA(s) usaría para mantener el seguimient...,2.0,2,Mapa o lista de tareas pendientes,1.0,Explicación clara y concisa de como utilizar e...,1.0,,0.0,7f8ee62de6d70a52e7bed692bf7575b88151e9cc2847ef...


In [None]:
!pip -q install langchain openai tiktoken cohere

In [None]:
import json
import time
# from google.colab import drive
from langchain.prompts import ChatPromptTemplate
from langchain.chat_models import ChatOpenAI

from langchain.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field, validator
from typing import List


#drive.mount('/content/drive')

class EvalInfo(BaseModel):
    reasoning: str = Field(description="Argumento")
    score: float = Field(description="Puntuación")

    @validator('score')
    def check_score(cls, score):
        if score < 0 or score > 3:
            raise ValueError("La puntuación debe estar entre 0 y 3")
        return score

class QuestionInfo:
    student: str
    question: str
    answer: str
    evals: list #list of EvalInfo

    def __init__(self, student, question, answer):
      self.student = student
      self.question = question
      self.answer = answer
      self.evals = []


    def to_dict(self):
        evals_dict = [eval_info.dict() for eval_info in self.evals]
        return {
            "student": self.student,
            "question": self.question,
            "answer": self.answer,
            "evals": evals_dict
        }

path=input('Ingrese la ruta del archivo')# Abrir el archivo JSON en modo lectura

with open(path+'Control3-ICI.json', 'r') as archivo:
    contenido = archivo.read()
    datos = json.loads(contenido)[0]

#with open(path+'Control3-ICD.json', 'r') as archivo:
#    contenido = archivo.read()
#    datos += json.loads(contenido)[0]

with open(path+'correct_answers.json', 'r') as archivo:
    contenido = archivo.read()
    scoring_guideline = json.loads(contenido)

questions = []
for data in datos:
  name=data[0]+' '+data[1]

  questions.append(QuestionInfo(name,data[-6],data[-5]))
  questions.append(QuestionInfo(name,data[-4],data[-3]))
  questions.append(QuestionInfo(name,data[-2],data[-1]))

len(questions)

In [None]:
import os
import openai
import langchain
os.environ["OPENAI_API_KEY"] = input("OPEN AI TOKEN:")

In [None]:
template_string = """System Message:
Tu tarea es evaluar respuestas de estudiantes a preguntas relacionadas con las estructuras de datos bien conocidas. Deberás usar la guía de puntuación proporcionada para asignar una puntuación y proporcionar una justificación para la puntuación. Recuerda respetar el formato JSON para la respuesta.

Ahora evalúa la siguiente respuesta:

Pregunta:
```
{question}
```
Respuesta del estudiante:
```
{student_answer}
```
Guía de puntuación:
```
{scoring_guideline}
```
Evalúa la respuesta del estudiante basándonos en la guía de puntuación. Proporciona un argumento breve para la puntuación y una puntuación. Respeta el formato JSON.```
{format_instructions}

"""
pydantic_parser = PydanticOutputParser(pydantic_object=EvalInfo)
format_instructions = pydantic_parser.get_format_instructions()
prompt = ChatPromptTemplate.from_template(template=template_string)

In [None]:
import statistics

llm = ChatOpenAI(temperature=0)
n_revs = 2
n_exceptions=0

for q in questions:
  if len(q.evals) == n_revs: continue
  guideline=""
  for cor in scoring_guideline[q.question]:
    guideline += f"{cor[0]}({cor[1]} puntos); "

  messages = prompt.format_messages(question=q.question, student_answer=q.answer,
                                  scoring_guideline=guideline,
                                  format_instructions=format_instructions)


  #print(messages[0].content); break

  scores = []
  while len(q.evals)< n_revs:
    output = llm(messages)
    try:
      eval = pydantic_parser.parse(output.content)
      q.evals.append(eval)
    except Exception as e:
      n_exceptions += 1
      if n_exceptions>10: break
      pass

  scores = [ev.score for ev in q.evals]

  # Calculate the mean
  mean = statistics.mean(scores)
  # Calculate the standard deviation
  stdev = statistics.stdev(scores)

  print([round(mean,1), round(stdev,2), q.question, q.answer])


  # Serialize the QuestionInfo object to JSON

  questions_json = []
  for q2 in questions: questions_json.append(json.dumps(q2.to_dict()))
  # Write the object to the JSON file
  with open(path+"scores.json", "w") as file:
    json.dump(questions_json, file)