In [1]:
import pandas as pd

# Import selected questions
selected_questions_df = pd.read_csv('../data/new/sample_200_renamed.csv')

# Display info about the imported data
print("Selected questions dataset info:")
print(selected_questions_df.info())

print("\nSample of selected questions:")
print(selected_questions_df.head())


Selected questions dataset info:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 200 entries, 0 to 199
Data columns (total 16 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0   answerId             200 non-null    int64  
 1   isCorrect            200 non-null    bool   
 2   questionTitle        200 non-null    object 
 3   correctOptionLetter  200 non-null    object 
 4   studentAnswerLetter  200 non-null    object 
 5   studentAge           147 non-null    float64
 6   userLevel            200 non-null    float64
 7   userLevelPercentile  200 non-null    float64
 8   topicName            200 non-null    object 
 9   subjectName          200 non-null    object 
 10  axisName             200 non-null    object 
 11  optionA              200 non-null    object 
 12  optionB              200 non-null    object 
 13  optionC              200 non-null    object 
 14  optionD              200 non-null    object 
 15  optionE

In [2]:
import google.generativeai as genai

genai.configure(api_key="")

model = genai.GenerativeModel("gemini-2.0-flash-thinking-exp-01-21")

In [4]:
def get_prerequisites_for_question(row):
    """
    Get prerequisite topics for a given question by querying Gemini AI model.
    
    Args:
        row: Row from the questions dataframe
        
    Returns:
        String with the ids of the 5 most important/relevant topics as prerequisites for the question
    """
    response = model.generate_content(
        f"""Para la siguiente pregunta necesito que la revises detenidamente (la pregunta, el topico al que pertenece, el contexto del estudiante que la debe responder, etc) y luego revises la lista de topicos que te voy a compartir. Quiero que identifiques los 5 topicos de la lista más importantes/relevantes que debería saber un estudiante como prerequisito para responder la pregunta.

        Esta es la pregunta:
        %%%%
        <questionTitle>
        {row['questionTitle']}
        </questionTitle>

        <studentAge>
        {row['studentAge']}
        </studentAge>

        <topicName>
        {row['topicName']}
        </topicName>

        <subjectName>
        {row['subjectName']}
        </subjectName>

        <axisName>
        {row['axisName']}
        </axisName>
        %%%%

        Y esta es la lista de topicos de la cual quiero que identifiques los 5 más importantes/relevantes que debería saber un estudiante para responder correctamente la pregunta. En otras palabras, los topicos prerequisitos al topico de la pregunta. Esta es la lista:
        %%%%
        | topicId | topicName                                                                                   | subjectName                                       | axisName                    |
| ------- | ------------------------------------------------------------------------------------------- | ------------------------------------------------- | --------------------------- |
| 588     | Perímetro y Área del círculo                                                                | Círculo y circunferencia                          | Geometría                   |
| 661     | Multiplicación por decenas, centenas y unidades de 1.000                                    | Números Naturales                                 | Números                     |
| 666     | Ecuaciones e inecuaciones con adición y sustracción                                         | Ecuaciones de primer grado                        | Álgebra                     |
| 447     | Productos notables                                                                          | Productos Notables                                | Álgebra                     |
| 446     | Factorización                                                                               | Factorización                                     | Álgebra                     |
| 512     | Regla de LaPlace                                                                            | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 439     | Composición de funciones                                                                    | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 585     | eliminar esto                                                                               | Logaritmos                                        | Números                     |
| 502     | Propiedades y análisis gráfico                                                              | Distribución normal                               | Probabilidad y estadísticas |
| 428     | Propiedades de las raíces                                                                   | Raíces                                            | Números                     |
| 550     | Adición y sustracción de números enteros                                                    | Números Enteros                                   | Números                     |
| 449     | Desigualdades e intervalos                                                                  | Inecuaciones y sistemas de inecuaciones           | Álgebra                     |
| 662     | Comparación de Decimales                                                                    | Números racionales                                | Números                     |
| 667     | Diagrama de Tallo y Hojas                                                                   | Organización y representación de datos            | Probabilidad y estadísticas |
| 575     | Función Inyectiva                                                                           | Clasificación de Funciones y Función Inversa      | Álgebra                     |
| 577     | Función Biyectiva                                                                           | Clasificación de Funciones y Función Inversa      | Álgebra                     |
| 576     | Función Epiyectiva                                                                          | Clasificación de Funciones y Función Inversa      | Álgebra                     |
| 628     | Gráfico de barras dobles y circular                                                         | Organización y representación de datos            | Probabilidad y estadísticas |
| 594     | Muestreo Aleatorio                                                                          | Muestreo aleatorio                                | Probabilidad y estadísticas |
| 651     | Gráfica de Función de Probabilidad y de Distribución                                        | Variable aleatoria discreta y continua            | Probabilidad y estadísticas |
| 658     | Valor Posicional                                                                            | Números Naturales                                 | Números                     |
| 663     | Información en Tablas de Frecuencia                                                         | Organización y representación de datos            | Probabilidad y estadísticas |
| 613     | Lenguaje Algebraico                                                                         | Conceptos básicos algebraicos                     | Álgebra                     |
| 621     | Construcción de triángulos                                                                  | Figuras Geométricas                               | Geometría                   |
| 618     | Medición de Longitudes                                                                      | Unidad de Medida                                  | Geometría                   |
| 625     | Comprensión e interpretación del promedio                                                   | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 626     | Resultados Posibles                                                                         | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 627     | Tendencia de Resultados en experimentos aleatorios                                          | Muestreo aleatorio                                | Probabilidad y estadísticas |
| 432     | Ecuaciones lineales con coeficientes enteros de la forma ax=b; x/a=b                        | Ecuaciones de primer grado                        | Álgebra                     |
| 484     | Teorema de Tales                                                                            | Homotecia y Teorema de Tales                      | Geometría                   |
| 498     | Comparación de conjuntos de datos                                                           | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 655     | Vectores 3D                                                                                 | Puntos, planos y vectores                         | Geometría                   |
| 659     | Aproximación por redondeo                                                                   | Números Naturales                                 | Números                     |
| 664     | Gráfico de Barras y Líneas                                                                  | Organización y representación de datos            | Probabilidad y estadísticas |
| 642     | Magnitud de vectores                                                                        | Puntos, planos y vectores                         | Geometría                   |
| 508     | Tablas de frecuencia                                                                        | Organización y representación de datos            | Probabilidad y estadísticas |
| 497     | Rango de un conjunto de datos                                                               | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 595     | Medidas de Tendencia Central                                                                | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 495     | Medidas de tendencia central con datos agrupados                                            | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 494     | Medidas de tendencia central con datos no agrupados                                         | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 596     | Cálculo y Comparación de Probabilidades                                                     | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 496     | Medidas de posición                                                                         | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 426     | Diagrama de Cajón                                                                           | Medidas de tendencia central y posición           | Probabilidad y estadísticas |
| 630     | Representaciones Gráficas                                                                   | Organización y representación de datos            | Probabilidad y estadísticas |
| 631     | Principio Combinatorio Multiplicativo                                                       | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 520     | Análisis de Dos Poblaciones                                                                 | Organización y representación de datos            | Probabilidad y estadísticas |
| 513     | Suma y producto de probabilidades                                                           | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 514     | Probabilidad condicional                                                                    | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 648     | Tabla de Galton                                                                             | Comportamiento Aleatorio                          | Probabilidad y estadísticas |
| 649     | Paseos Aleatorios                                                                           | Comportamiento Aleatorio                          | Probabilidad y estadísticas |
| 499     | Número y análisis de muestras                                                               | Muestreo aleatorio                                | Probabilidad y estadísticas |
| 509     | Histogramas                                                                                 | Organización y representación de datos            | Probabilidad y estadísticas |
| 515     | Ley de los grandes números                                                                  | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 510     | Polígonos de frecuencia                                                                     | Organización y representación de datos            | Probabilidad y estadísticas |
| 503     | Función de probabilidad y de distribución                                                   | Variable aleatoria discreta y continua            | Probabilidad y estadísticas |
| 511     | Técnicas de conteo                                                                          | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 652     | Probabilidad en la sociedad                                                                 | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 469     | Teorema de pitágoras                                                                        | Figuras Geométricas                               | Geometría                   |
| 519     | Perímetro y Área de sectores y segmentos circulares                                         | Círculo y circunferencia                          | Geometría                   |
| 656     | Modelos a Escala                                                                            | Semejanza y congruencia                           | Geometría                   |
| 475     | Operatoria de vectores                                                                      | Puntos, planos y vectores                         | Geometría                   |
| 528     | Proyecciones de Vectores con Razones Trigonométricas                                        | Trigonometría                                     | Geometría                   |
| 598     | Operaciones de Expresiones Algebraicas                                                      | Expresiones algebraicas                           | Álgebra                     |
| 427     | Problemas con expresiones algebraicas                                                       | Expresiones algebraicas                           | Álgebra                     |
| 653     | Probabilidad Total                                                                          | Cálculo de probabilidades                         | Probabilidad y estadísticas |
| 507     | Aproximación de la probabilidad binomial por la probabilidad de la normal.                  | Variable aleatoria discreta y continua            | Probabilidad y estadísticas |
| 500     | Distribución normal estándar                                                                | Distribución normal                               | Probabilidad y estadísticas |
| 504     | Valor esperado                                                                              | Variable aleatoria discreta y continua            | Probabilidad y estadísticas |
| 505     | Distribución binomial                                                                       | Variable aleatoria discreta y continua            | Probabilidad y estadísticas |
| 506     | Función de densidad                                                                         | Variable aleatoria discreta y continua            | Probabilidad y estadísticas |
| 501     | Intervalos de confianza                                                                     | Distribución normal                               | Probabilidad y estadísticas |
| 615     | Puntos y figuras en el plano cartesiano                                                     | Puntos, planos y vectores                         | Geometría                   |
| 616     | Caras, aristas y lados paralelos o perpendiculares                                          | Figuras Geométricas                               | Geometría                   |
| 482     | Congruencia de figuras                                                                      | Semejanza y congruencia                           | Geometría                   |
| 617     | Transformaciones isométricas, congruencia y figuras congruentes                             | Transformaciones isométricas                      | Geometría                   |
| 619     | Transformación de unidades de medida de longitud                                            | Unidad de Medida                                  | Geometría                   |
| 634     | Área de triángulos, paralelogramos, trapecios y figuras irregulares                         | Figuras Geométricas                               | Geometría                   |
| 622     | Ángulos en rectas que se intersectan                                                        | Ángulos                                           | Geometría                   |
| 623     | Cálculo de área de cubos y paralelepipedos                                                  | Cuerpos geométricos                               | Geometría                   |
| 624     | Cálculo de volumen de cubos y paralelepipedos                                               | Cuerpos geométricos                               | Geometría                   |
| 644     | Estimación y medición de ángulos                                                            | Ángulos                                           | Geometría                   |
| 467     | Ángulos complementarios y suplementarios                                                    | Ángulos                                           | Geometría                   |
| 587     | Suma de ángulos interiores y exteriores de polígonos                                        | Ángulos                                           | Geometría                   |
| 468     | Elementos secundarios del triángulos                                                        | Figuras Geométricas                               | Geometría                   |
| 589     | Área de paralelogramos, triángulos y trapecios                                              | Figuras Geométricas                               | Geometría                   |
| 590     | Vector Desplazamiento                                                                       | Puntos, planos y vectores                         | Geometría                   |
| 489     | Volumen de cuerpos geométricos                                                              | Cuerpos geométricos                               | Geometría                   |
| 488     | Área de cuerpos geometricos                                                                 | Cuerpos geométricos                               | Geometría                   |
| 478     | Traslación                                                                                  | Transformaciones isométricas                      | Geometría                   |
| 479     | Reflexión                                                                                   | Transformaciones isométricas                      | Geometría                   |
| 480     | Rotación                                                                                    | Transformaciones isométricas                      | Geometría                   |
| 481     | Composición de transformaciones                                                             | Transformaciones isométricas                      | Geometría                   |
| 522     | Volumen del Cono                                                                            | Cuerpos geométricos                               | Geometría                   |
| 487     | Homotecia de figuras planas                                                                 | Homotecia y Teorema de Tales                      | Geometría                   |
| 485     | División de segmentos                                                                       | Homotecia y Teorema de Tales                      | Geometría                   |
| 486     | Teorema de Euclides                                                                         | Semejanza y congruencia                           | Geometría                   |
| 483     | Semejanza de figuras                                                                        | Semejanza y congruencia                           | Geometría                   |
| 527     | Homotecia de Forma Vectorial                                                                | Homotecia y Teorema de Tales                      | Geometría                   |
| 529     | Gráficos XY y Nubes de Puntos                                                               | Puntos, planos y vectores                         | Geometría                   |
| 476     | Ecuación vectorial de la recta en 2D                                                        | Puntos, planos y vectores                         | Geometría                   |
| 477     | Ecuación vectorial de la recta en 3D                                                        | Puntos, planos y vectores                         | Geometría                   |
| 470     | Área del Cono                                                                               | Cuerpos geométricos                               | Geometría                   |
| 521     | Área y Volumen de la Esfera                                                                 | Cuerpos geométricos                               | Geometría                   |
| 525     | Razones Trigonométricas                                                                     | Trigonometría                                     | Geometría                   |
| 472     | Teoremas de cuerdas, secantes y tangentes.                                                  | Círculo y circunferencia                          | Geometría                   |
| 471     | Ángulos, arcos y sectores en la circunferencia                                              | Círculo y circunferencia                          | Geometría                   |
| 473     | Figuras geométricas en el plano                                                             | Puntos, planos y vectores                         | Geometría                   |
| 612     | Patrones de formación y secuencias                                                          | Conceptos básicos algebraicos                     | Álgebra                     |
| 607     | Razones                                                                                     | Proporcionalidad                                  | Álgebra                     |
| 614     | Representación y resolución de ecuaciones                                                   | Ecuaciones de primer grado                        | Álgebra                     |
| 639     | Valorización de expresiones algebraicas                                                     | Expresiones algebraicas                           | Álgebra                     |
| 448     | Lenguaje Algebraico                                                                         | Expresiones algebraicas                           | Álgebra                     |
| 445     | Reducción de expresiones algebraicas                                                        | Expresiones algebraicas                           | Álgebra                     |
| 629     | Proporcionalidad directa e inversa                                                          | Proporcionalidad                                  | Álgebra                     |
| 536     | Razones y tablas                                                                            | Proporcionalidad                                  | Álgebra                     |
| 450     | Inecuaciones lineales con coeficientes enteros de la forma ax=b; x/a=b                      | Inecuaciones y sistemas de inecuaciones           | Álgebra                     |
| 435     | Problemas con Ecuaciones lineales con coeficientes enteros de la forma ax=b; x/a=b          | Ecuaciones de primer grado                        | Álgebra                     |
| 458     | Dominio, recorrido y tipos de funciones                                                     | Clasificación de Funciones y Función Inversa      | Álgebra                     |
| 460     | Función lineal                                                                              | Función lineal y afín                             | Álgebra                     |
| 433     | Ecuaciones con coeficientes racionales                                                      | Ecuaciones de primer grado                        | Álgebra                     |
| 592     | Ecuaciones lineales con coeficientes enteros de la forma ax = b; x a(x+b)= c; ax + b=cx + d | Ecuaciones de primer grado                        | Álgebra                     |
| 593     | Inecuaciones lineales con coeficientes racionales                                           | Inecuaciones y sistemas de inecuaciones           | Álgebra                     |
| 459     | Función afín                                                                                | Función lineal y afín                             | Álgebra                     |
| 462     | Problemas de funciones afin y lineal                                                        | Función lineal y afín                             | Álgebra                     |
| 574     | Factorización: Otros                                                                        | Factorización                                     | Álgebra                     |
| 573     | Factorización: Trinomio de la forma x^2+px+q                                                | Factorización                                     | Álgebra                     |
| 571     | Factorización: Trinomio cuadrado perfecto                                                   | Factorización                                     | Álgebra                     |
| 572     | Factorización: Diferencia de cuadrados                                                      | Factorización                                     | Álgebra                     |
| 570     | Factorización: Factor Común (normal y compuesto)                                            | Factorización                                     | Álgebra                     |
| 569     | Productos Notables: Otros                                                                   | Productos Notables                                | Álgebra                     |
| 568     | Productos Notables: Binomio con término común                                               | Productos Notables                                | Álgebra                     |
| 567     | Productos Notables: Suma por Diferencia                                                     | Productos Notables                                | Álgebra                     |
| 566     | Productos Notables: Cuadrado de Binomio                                                     | Productos Notables                                | Álgebra                     |
| 453     | Existencia y pertinencia de soluciones                                                      | Sistemas de ecuaciones                            | Álgebra                     |
| 454     | Análisis gráfico                                                                            | Sistemas de ecuaciones                            | Álgebra                     |
| 641     | Ecuaciones lineales con 2 incógnitas                                                        | Ecuaciones de primer grado                        | Álgebra                     |
| 452     | Resolución de sistemas de ecuaciones                                                        | Sistemas de ecuaciones                            | Álgebra                     |
| 657     | Resolución de Sistema de Ecuaciones con única solución, infinitas soluciones o sin solución | Sistemas de ecuaciones                            | Álgebra                     |
| 548     | Problemas con sistema de ecuaciones                                                         | Sistemas de ecuaciones                            | Álgebra                     |
| 526     | Relaciones Lineales de Dos Variables                                                        | Función lineal y afín                             | Álgebra                     |
| 434     | Ecuaciones con coeficientes literales                                                       | Ecuaciones de primer grado                        | Álgebra                     |
| 442     | Suma y resta                                                                                | Fracciones algebraicas                            | Álgebra                     |
| 443     | Multiplicación y división                                                                   | Fracciones algebraicas                            | Álgebra                     |
| 444     | Simplificación                                                                              | Fracciones algebraicas                            | Álgebra                     |
| 451     | Sistemas de inecuaciones de primer grado                                                    | Inecuaciones y sistemas de inecuaciones           | Álgebra                     |
| 461     | Composición de funciones                                                                    | Función lineal y afín                             | Álgebra                     |
| 540     | Álgebra básica                                                                              | Conceptos básicos algebraicos                     | Álgebra                     |
| 546     | Problemas con Ecuaciones con coeficientes racionales                                        | Ecuaciones de primer grado                        | Álgebra                     |
| 465     | Análisis gráfico y discriminante                                                            | Función cuadrática                                | Álgebra                     |
| 463     | Intersección de la gráfica con los ejes coordenados                                         | Función cuadrática                                | Álgebra                     |
| 466     | Modelamiento de situaciones cotidianas                                                      | Función cuadrática                                | Álgebra                     |
| 650     | Variación de parámetros de la función cuadrática                                            | Función cuadrática                                | Álgebra                     |
| 464     | Vértice y eje de simetría                                                                   | Función cuadrática                                | Álgebra                     |
| 456     | Análisis de soluciones                                                                      | Ecuaciones de segundo grado                       | Álgebra                     |
| 457     | Propiedades de las soluciones                                                               | Ecuaciones de segundo grado                       | Álgebra                     |
| 455     | Resolución de ecuaciones de segundo grado                                                   | Ecuaciones de segundo grado                       | Álgebra                     |
| 438     | Función raíz                                                                                | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 440     | Función Inversa                                                                             | Clasificación de Funciones y Función Inversa      | Álgebra                     |
| 556     | Varianza y Desviación Estándar                                                              | Medidas de dispersión                             | Álgebra                     |
| 436     | Función exponencial                                                                         | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 437     | Función logarítmica                                                                         | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 441     | Traslación de gráfica de función exponencial                                                | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 647     | Traslación de gráfica de función logarítmica                                                | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 555     | Función Potencia                                                                            | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 646     | Traslación de gráfica de función potencia                                                   | Función exponencial, logarítmica, raíz y potencia | Álgebra                     |
| 474     | Distancia entre dos puntos y punto medio                                                    | Ecuación de la recta                              | Álgebra                     |
| 490     | Pendiente de una recta                                                                      | Ecuación de la recta                              | Álgebra                     |
| 491     | Ecuación punto-punto y punto-pendiente                                                      | Ecuación de la recta                              | Álgebra                     |
| 492     | Ecuación principal y general de la recta                                                    | Ecuación de la recta                              | Álgebra                     |
| 493     | Rectas paralelas y perpendiculares                                                          | Ecuación de la recta                              | Álgebra                     |
| 600     | Multiplicación entre números de dos cifras                                                  | Números Naturales                                 | Números                     |
| 601     | División por números de una cifra                                                           | Números Naturales                                 | Números                     |
| 603     | Problemas con cuatro operaciones                                                            | Números Naturales                                 | Números                     |
| 604     | Fracciones propias, equivalentes y comparación de fracciones                                | Números racionales                                | Números                     |
| 542     | Amplificación y simplificación de fracciones                                                | Números racionales                                | Números                     |
| 605     | Números mixtos y fracciones impropias                                                       | Números racionales                                | Números                     |
| 544     | Adición y Sustracción de números decimales                                                  | Números racionales                                | Números                     |
| 533     | División de números naturales                                                               | Números Naturales                                 | Números                     |
| 534     | Operatoria combinada de números naturales                                                   | Números Naturales                                 | Números                     |
| 532     | Multiplicación de números naturales                                                         | Números Naturales                                 | Números                     |
| 635     | Fracciones y Números Mixtos                                                                 | Números racionales                                | Números                     |
| 543     | Ejercicios de suma y resta de fracciones                                                    | Números racionales                                | Números                     |
| 610     | Multiplicación y división de números decimales                                              | Números racionales                                | Números                     |
| 611     | Problemas de adición y sustracción de fracciones, números mixtos y decimales                | Números racionales                                | Números                     |
| 554     | Problemas de adición y sustracción de números enteros                                       | Números Enteros                                   | Números                     |
| 549     | Ubicación y orden de números enteros en la recta numérica                                   | Números Enteros                                   | Números                     |
| 636     | Multiplicación y división entre números decimales                                           | Números racionales                                | Números                     |
| 547     | División de fracciones                                                                      | Números racionales                                | Números                     |
| 545     | Multiplicación de fracciones                                                                | Números racionales                                | Números                     |
| 413     | Transformación de decimal a fracción                                                        | Números racionales                                | Números                     |
| 421     | Valor Absoluto                                                                              | Números Enteros                                   | Números                     |
| 412     | Transformación de fracción a decimal                                                        | Números racionales                                | Números                     |
| 416     | Fracciones como porcentajes                                                                 | Números racionales                                | Números                     |
| 551     | Multiplicación de números enteros                                                           | Números Enteros                                   | Números                     |
| 552     | División de números enteros                                                                 | Números Enteros                                   | Números                     |
| 409     | Suma y resta de números racionales                                                          | Números racionales                                | Números                     |
| 410     | Multiplicación y división de números racionales                                             | Números racionales                                | Números                     |
| 541     | Fracciones Negativas                                                                        | Números racionales                                | Números                     |
| 411     | Representación de números racionales en la recta numérica                                   | Números racionales                                | Números                     |
| 415     | Orden de números racionales                                                                 | Números racionales                                | Números                     |
| 579     | Propiedad: Potencia de una potencia                                                         | Potencias                                         | Números                     |
| 583     | Suma y Resta de Potencias                                                                   | Potencias                                         | Números                     |
| 580     | Propiedad: Multiplicación y división de una potencia con distinta base e igual exponente    | Potencias                                         | Números                     |
| 578     | Propiedad: Multiplicación y División de potencias con igual base y distinto exponente       | Potencias                                         | Números                     |
| 597     | Variación Porcentual                                                                        | Números Enteros                                   | Números                     |
| 643     | Operaciones combinadas de números racionales                                                | Números racionales                                | Números                     |
| 524     | Potencias de Base Racional y Exponente Entero                                               | Potencias                                         | Números                     |
| 581     | Propiedad: Potencia de exponente negativo                                                   | Potencias                                         | Números                     |
| 584     | Multiplicación y División de Potencias                                                      | Potencias                                         | Números                     |
| 530     | Suma de números naturales                                                                   | Números Naturales                                 | Números                     |
| 531     | Resta de números naturales                                                                  | Números Naturales                                 | Números                     |
| 535     | Problemas de números naturales                                                              | Números Naturales                                 | Números                     |
| 538     | Potencias de base y exponente natural                                                       | Potencias                                         | Números                     |
| 602     | Operaciones combinadas de números naturales                                                 | Números Naturales                                 | Números                     |
| 417     | Identificar números racionales e irracionales                                               | Números reales                                    | Números                     |
| 419     | Aproximación de números reales                                                              | Números reales                                    | Números                     |
| 418     | Ubicación de números reales en la recta numérica                                            | Números reales                                    | Números                     |
| 420     | Orden de números reales                                                                     | Números reales                                    | Números                     |
| 414     | Aproximación de racionales                                                                  | Números racionales                                | Números                     |
| 645     | Operaciones con números reales                                                              | Números reales                                    | Números                     |
| 430     | Relación entre Potencias, Raíces y Logaritmos                                               | Logaritmos                                        | Números                     |
| 429     | Descomposición de Raíces                                                                    | Raíces                                            | Números                     |
| 431     | Ejercitación variada de logaritmos                                                          | Logaritmos                                        | Números                     |
| 563     | Propiedad: Logaritmo de la multiplicación                                                   | Logaritmos                                        | Números                     |
| 565     | Propiedad: Cambio de Base                                                                   | Logaritmos                                        | Números                     |
| 564     | Propiedad: Logaritmo de la división                                                         | Logaritmos                                        | Números                     |
| 539     | Raíces exactas                                                                              | Raíces                                            | Números                     |
| 559     | Propiedad: Multiplicación y División de Raíces con igual índice                             | Raíces                                            | Números                     |
| 561     | Propiedad: Raíz de una raíz                                                                 | Raíces                                            | Números                     |
| 558     | Multiplicación y División de Raíces                                                         | Raíces                                            | Números                     |
| 562     | Propiedad: Logaritmo de la unidad, de la base y de la potencia                              | Logaritmos                                        | Números                     |
| 582     | Propiedad: Potencia de exponente racional                                                   | Potencias                                         | Números                     |
| 560     | Propiedad: Multiplicación y División de Raíces con igual cantidad subradical                | Raíces                                            | Números                     |
| 586     | Ejercitación variada de raíces                                                              | Raíces                                            | Números                     |
| 422     | Introducción y propiedades                                                                  | Números complejos                                 | Números                     |
| 423     | Suma y resta de números complejos                                                           | Números complejos                                 | Números                     |
| 424     | Multiplicación de números complejos                                                         | Números complejos                                 | Números                     |
| 425     | División de números complejos                                                               | Números complejos                                 | Números                     |
| 537     | Porcentajes                                                                                 | Porcentajes                                       | Números                     |
| 654     | Toma de decisiones aplicando porcentajes                                                    | Porcentajes                                       | Números                     |
| 591     | Raíz Cuadrada                                                                               | Raíces                                            | Números                     |
| 557     | Suma y Resta de Raíces                                                                      | Raíces                                            | Números                     |
| 553     | Operatoria combinada de números enteros                                                     | Números Enteros                                   | Números                     |
| 523     | Cambio Porcentual Constante, Interés Compuesto                                              | Números racionales                                | Números                     |
| 660     | Comparación de números naturales                                                            | Números Naturales                                 | Números                     |
| 665     | Incógnitas con adición y sustracción                                                        | Expresiones algebraicas                           | Álgebra                     |
        %%%%

        Al final de tu respuesta debes escribir los ids en este formato: <ids>412,114,723,12,5532</ids> par que yo pueda extraer tu respuesta y procesarla.
        """
    )

    # Extract IDs between tags
    start_tag = '<ids>'
    end_tag = '</ids>'
    start_idx = response.text.find(start_tag) + len(start_tag)
    end_idx = response.text.find(end_tag)
    return response.text[start_idx:end_idx]


In [5]:
# Create new columns for prerequisite topic IDs
selected_questions_df[['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']] = None

print(f"Processing {len(selected_questions_df)} questions to find prerequisites...")

# Iterate through rows and get prerequisites 
for idx, row in selected_questions_df.iterrows():
    try:
        print(f"\nProcessing question {idx} ({row['topicName']})...")
        
        # Get prerequisite IDs string
        prereq_ids = get_prerequisites_for_question(row)
        print(f"Retrieved prerequisite IDs: {prereq_ids}")
        
        # Split into list and pad with None if less than 5 IDs
        id_list = prereq_ids.strip().split(',')
        id_list.extend([None] * (5 - len(id_list)))
        print(f"Padded ID list: {id_list[:5]}")
        
        # Assign to new columns
        selected_questions_df.loc[idx, ['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']] = id_list[:5]
        print(f"Row {idx} prerequisites:", selected_questions_df.loc[idx, ['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']])
        
    except Exception as e:
        print(f"Error processing row {idx}: {e}")
        selected_questions_df.loc[idx, ['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']] = [None] * 5

print("\nFinished processing all questions")




Processing 200 questions to find prerequisites...

Processing question 0 (Porcentajes )...
Retrieved prerequisite IDs: 661,550,532,603,530
Padded ID list: ['661', '550', '532', '603', '530']
Row 0 prerequisites: pre1Id    661
pre2Id    550
pre3Id    532
pre4Id    603
pre5Id    530
Name: 0, dtype: object

Processing question 1 (Suma y resta de números racionales)...
Retrieved prerequisite IDs: 604,542,550,532,660
Padded ID list: ['604', '542', '550', '532', '660']
Row 1 prerequisites: pre1Id    604
pre2Id    542
pre3Id    550
pre4Id    532
pre5Id    660
Name: 1, dtype: object

Processing question 2 (Operatoria combinada de números enteros)...
Retrieved prerequisite IDs: 550,551,552,534,549
Padded ID list: ['550', '551', '552', '534', '549']
Row 2 prerequisites: pre1Id    550
pre2Id    551
pre3Id    552
pre4Id    534
pre5Id    549
Name: 2, dtype: object

Processing question 3 (Cambio Porcentual Constante, Interés Compuesto)...
Retrieved prerequisite IDs: 537,544,610,412,659
Padded ID lis

TypeError: int() argument must be a string, a bytes-like object or a real number, not 'NoneType'

In [6]:
# First convert None values to NaN
selected_questions_df[['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']] = selected_questions_df[['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']].fillna(-1)

# Then convert to int
selected_questions_df[['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']] = selected_questions_df[['pre1Id', 'pre2Id', 'pre3Id', 'pre4Id', 'pre5Id']].astype(int)

# Save the dataframe with prerequisites to CSV
selected_questions_df.to_csv('../data/new/selected_questions_with_prereqs_200.csv', index=False)
print("Saved dataframe with prerequisites to data/new/selected_questions_with_prereqs_200.csv")

Saved dataframe with prerequisites to data/new/selected_questions_with_prereqs_200.csv


In [7]:
# Import topics data
topics_df = pd.read_csv('../data/new/topics_full.csv')
print(f"Loaded {len(topics_df)} topics from topics_full.csv")

# Add prerequisite topic names
for i in range(1,6):
    # Join with topics_df to get names for each prerequisite ID
    selected_questions_df[f'pre{i}TopicName'] = selected_questions_df[f'pre{i}Id'].map(
        topics_df.set_index('topicId')['topicName']
    )
    selected_questions_df[f'pre{i}SubjectName'] = selected_questions_df[f'pre{i}Id'].map(
        topics_df.set_index('topicId')['subjectName']
    )
    selected_questions_df[f'pre{i}AxisName'] = selected_questions_df[f'pre{i}Id'].map(
        topics_df.set_index('topicId')['axisName']
    )

selected_questions_df.head()

Loaded 246 topics from topics_full.csv


Unnamed: 0,answerId,isCorrect,questionTitle,correctOptionLetter,studentAnswerLetter,studentAge,userLevel,userLevelPercentile,topicName,subjectName,...,pre2AxisName,pre3TopicName,pre3SubjectName,pre3AxisName,pre4TopicName,pre4SubjectName,pre4AxisName,pre5TopicName,pre5SubjectName,pre5AxisName
0,1347929,False,"En un estacionamiento hay `1.200` vehículos, d...",`300`,`250`,13.0,0.166604,66.0,Porcentajes,Porcentajes,...,Números,Multiplicación de números naturales,Números Naturales,Números,Problemas con cuatro operaciones,Números Naturales,Números,Suma de números naturales,Números Naturales,Números
1,1452301,False,¿Cuál es el valor de la expresión `1/5-2/3`?<b...,`-7/15`,`-1/15`,16.0,-0.15274,58.0,Suma y resta de números racionales,Números racionales,...,Números,Adición y sustracción de números enteros,Números Enteros,Números,Multiplicación de números naturales,Números Naturales,Números,Comparación de números naturales,Números Naturales,Números
2,1593181,False,`487 - (-462 ÷ 11) + (1 · 31) + (125 - 96) = `,`589`,`590`,,-3.0,0.0,Operatoria combinada de números enteros,Números Enteros,...,Números,División de números enteros,Números Enteros,Números,Operatoria combinada de números naturales,Números Naturales,Números,Ubicación y orden de números enteros en la rec...,Números Enteros,Números
3,1462188,False,"<div>La siguiente tabla, muestra la proyección...","IV=1,006","IV=2,006",,-1.014222,39.0,"Cambio Porcentual Constante, Interés Compuesto",Números racionales,...,Números,Multiplicación y división de números decimales,Números racionales,Números,Transformación de fracción a decimal,Números racionales,Números,Aproximación por redondeo,Números Naturales,Números
4,1491793,False,<div>Juan estaba apostando en el casino con ci...,`9` dólares australianos,`19` dólares australianos,13.0,-2.263959,14.0,División por números de una cifra,Números Naturales,...,Números,Multiplicación de números naturales,Números Naturales,Números,División de números naturales,Números Naturales,Números,Valor Posicional,Números Naturales,Números


In [8]:
# Load master data
master_df = pd.read_csv('../data/new/master_final.csv')
print(f"Loaded {len(master_df)} rows from master_final.csv")

# Add user_id column by matching answer_id with master_df
selected_questions_df['userId'] = selected_questions_df['answerId'].map(
    master_df.set_index('answer_id')['user_id']
)
print(f"Added user_id column to selected_questions_df")

Loaded 196083 rows from master_final.csv
Added user_id column to selected_questions_df


In [9]:
# Create columns for prerequisite levels
for i in range(1,6):
    # Initialize empty column
    selected_questions_df[f'pre{i}Level'] = None
    
    # For each row in selected_questions_df
    for idx, row in selected_questions_df.iterrows():
        # Get relevant answers from master_df:
        # - Same user_id as current question
        # - Same topic_id as prerequisite i
        # - answer_id less than current question's answer_id
        relevant_answers = master_df[
            (master_df['user_id'] == row['userId']) & 
            (master_df['topic_id'] == row[f'pre{i}Id']) &
            (master_df['answer_id'] < row['answerId'])
        ]
        
        # If there are relevant answers, get the level from the most recent one
        if len(relevant_answers) > 0:
            most_recent = relevant_answers.nlargest(1, 'answer_id')
            selected_questions_df.at[idx, f'pre{i}Level'] = most_recent['user_level'].iloc[0]

print("Added prerequisite level columns")

# Save the dataframe to CSV
output_path = '../data/new/questions_with_prerequisites.csv'
selected_questions_df.to_csv(output_path, index=False)
print(f"Saved dataframe to {output_path}")



Added prerequisite level columns
Saved dataframe to ../data/new/questions_with_prerequisites.csv


I want to create 5 new columns in selected_questions_df: pre1Level, pre2Level, pre3Level, pre4Level, pre5Level. Those levels are stored in the user_level column of the master_df. To get the level of each prerequisite, you have to find the rows that have the same userId (user_id) and topic_id, and get the user_level.
But here is the catch: you have to order the answers in master_df by answer_id and then get the one with largest answer_id but that is lower than the answer_id of the question. (that way we get the most recent one, but without looking into the future)