# Evaluación

<a href="https://github.com/luiggix/Python_cero_a_experto">Python de cero a experto</a> by Luis M. de la Cruz Salas and Miguel Angel Pérez León is licensed under <a href="https://creativecommons.org/licenses/by-nc-nd/4.0?ref=chooser-v1">Attribution-NonCommercial-NoDerivatives 4.0 International</a>

# *NBGrader*

**Objetivo general**
- Conocer las ventajas de la bibliotecas de evaluación MACTI_lib y *NBGrader* y cómo usarlas para evaluar de manera automatizada los conocimientos.

**Objetivos particulares**
- Familiarizarse con la estructura y herramientas de MACTI_lin, asi como *NBGrader*.
- Generar notebooks que puedan ser evaluados de manera automatizada.
- Integrar la evaluación automatizada a los materiales generados de manera propia.


## Introducción

La labor de evaluar el conocimiento frecuentemente se convierte en una labor repetitiva y tediosa, sin embargo hoy en día existen herramientas que facilitan en gran media esta tarea. Tareas repetitivas como, descargar tareas o revisar el mismo código se facilitan mucho con estas herramientas.

## Biblioteca *macti_lib*

La biblioteca *macti_lib* ha sido desarrollada dentro del marco del proyecto MACTI misma que ya se encuentra instalada en el servidor de MACTI y únicamente tenemos que importarla para hacer uso de ella, sin embargo vale la pena mencionar los siguientes detalles.

Primero es necesario importar las bibliotecas necesarias, en particular la clase `FileAnswer`.

In [None]:
import pandas as pd
import numpy as np
import sympy as sy

from macti.evaluation import FileAnswer
file_answer = FileAnswer()

### Construcción de las respuestas

Una vez que ya creamos un objeto de la clase `FileAnswer`, ya podemos comenzar a crear las respuestas.

Imaginemos que ya tenemos un *notebook* en el cual las respuestas a algunos ejercicios son las que se definen a continuación.

In [None]:
opcion = 'c'
derivada = 'x**2'

t = np.linspace(1,10,10)
print(t)
w = np.sin(t)

matriz_np = np.array([[0.10, -1.],[0.30,-1.]] )
array_np = np.array([-200, 20])

flotante = 0.0
entero = 1
complejo = 1 + 5j
logico = True

lista_num = [0, 1, 3.4]
tupla_num = (1.2, 3.1416, np.pi)
conjunto_num = {3, 5, 6, 2, 9,8}

lista = ['luis', 'miguel', 'delacruz']
tupla = ('a', 'b', 'c')
conjunto = {'a', 'b', 'c'}
diccionario = {'k1':3.446, 'k2':5.6423, 'k3':2.234324}
array_no_num = np.array(['a', 'x', 'w'])

x = sy.Symbol('x')
y = sy.Symbol('y')
A, B, C = matriz_np, array_np, flotante
forma_cuadratica = 0.5 * A[0,0] * x**2 + 0.5 * A[1,1] * y**2 + 0.5 * (A[0,1]+A[1,0])* x * y - B[0] * x - B[1] * y + C

[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]


### Almacenamiento de las respuestas

Ya con las respuestas creadas, lo siguiente es hacer uso del método `write`, para guardar las respuestas dentro del objeto `file_answer`. El método `write` nos pide indicar el número (carater en general), la respuesta y una ayuda en texto.

Veamos la siguiente celda.

In [None]:
file_answer.write('1', opcion, 'Las opciones válidas son ...')
file_answer.write('2', derivada, 'Checa las reglas de derivación')

file_answer.write('3a', t, 'Deberías checar ...')

mensaje ="""Puedes poner mucho texto y ver que sucede en la impresión del hint,
quizá es necesario usar triples comillas"""
file_answer.write('3b', w, mensaje)

file_answer.write('4', matriz_np, 'Checa las entradas de la matriz A')
file_answer.write('5', array_np, 'Checa las entradas del vector B')

file_answer.write('6', flotante, 'Checa el valor de flotante')
file_answer.write('7', entero, 'Checa el valor de entero')
file_answer.write('8', complejo, 'Checa el valor de complejo')
file_answer.write('9', logico, 'Checa  logico')

file_answer.write('10', lista_num, 'Checa la lista numérica')
file_answer.write('11', tupla_num, 'Checa la tupla numérica')
file_answer.write('12', conjunto_num, 'No es posible usar conjuntos numéricos')

file_answer.write('13', lista, 'Checa la lista')
file_answer.write('14', tupla, 'Checa la tupla')
file_answer.write('15', conjunto, 'Checa la conjunto')
file_answer.write('16', diccionario, 'Checa la diccionario')
file_answer.write('17', array_no_num, 'Checa el nd.array')

file_answer.write('18', str(forma_cuadratica),'Revisa tus operaciones algebráicas para calcular f(x)')
file_answer.to_file('1')

El directorio :/home/jovyan/TallerMACTI/.ans/Evaluacion/ ya existe
Respuestas y retroalimentación almacenadas.


Finalmente el método `to_file` con el parámetro '1', **almacena en la ruta mostrada** las respuestas generadas para este *notebook*. Vale la pena mencionar que el parámetro que recibe este método nos permite indicar a que bloque pertenecen estas respuestas, ya que puede haber más de un bloque por *notebook*

También es posible cambiar la *verbosidad* de las respuestas, es decir, que tanta ayuda vamos a dar cuando la respuesta sea incorrecta.

In [None]:
# Cambiando la verbosidad de la retroalimentación
file_answer.verb = 2 # (Default) se da toda la retroalimentación posible.
#file_answer.verb = 1 # Se proporciona poca ayuda.
#file_answer.verb = 0 # No se da nada de ayuda
file_answer.to_file('1') # Se debe escribir el archivo nuevamente.

El directorio :/home/jovyan/TallerMACTI/.ans/Evaluacion/ ya existe
Respuestas y retroalimentación almacenadas.


### Evaluación de las respuestas

Una vez almacenadas las respuestas, lo siguiente es hacer uso de la clase `Quizz` para evaluar las respuestas.

La clase `Quizz`, recibe como parámetros, el bloque de respuestas, el nombre del tema (en este caso TallerMACTI) y finalmente `local` nos sirve para indicar que las respuestas se van a buscar en la ruta local del usuario, este parámetro nos permite realizar pruebas y una vez que el *notebook* se encuentre en su versión final, para ser liberada, es necesario eliminar este parámetro.

In [None]:
from macti.evaluation import *

# Usamos un objeto de la clase Quizz para evaluar las respuestas
# El primer parámetro debe ser igual al parámetro usado en file_answer.to_file()
quizz = Quizz('1', 'TallerMACTI', 'local')

#### Pregunta 1. `eval_option()`

Esta función nos permite evaluar una opción, por ejemplo un caracter.

In [None]:
quizz.eval_option('1', 'C')

[39m----------------------------------------
[32mTu respuesta: [39mC[32m, es correcta.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_option('1', 'a')

#### Pregunta 2. `eval_expression()`

Podémos evaluar una expresión usando `SymPy`.

¿Cuál es la derivada de $f(x) = \frac{x^3}{3}$?

In [None]:
x = sy.Symbol('x')
resultado = x**2
quizz.eval_expression('2', resultado)

[39m----------------------------------------
[32mTu respuesta:


x**2

[32mes correcta.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#x = sy.Symbol('x')
#resultado = x**3
#quizz.eval_expression('2', resultado)

#### Pregunta 3a. `eval_numeric()` (arreglo)

Frecuentemente es necesario evaluar un arreglo y la función `eval_numeric()` nos permite hacer esto.

In [None]:
quizz.eval_numeric('3a', t)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('3a', t * 0.3)

#### Pregunta 3b. `eval_numeric()` (arreglo)

In [None]:
quizz.eval_numeric('3b', w)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('3b', w * 2.0)

#### Pregunta 4. `eval_numeric()` (matriz)

También es posible evaluar matrices.

In [None]:
quizz.eval_numeric('4', matriz_np)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('4', np.array([[1,2],[3,4]]))

#### Pregunta 5. `eval_numeric()` (arreglo)

In [None]:
quizz.eval_numeric('5', array_np)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('5', array_np*0.1)

#### Pregunta 6. `eval_numeric()` (flotante)

In [None]:
quizz.eval_numeric('6', flotante)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('6', 3.1516)

#### Pregunta 7. `eval_numeric()` (entero)

In [None]:
quizz.eval_numeric('7', entero)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('7', 1000)

#### Pregunta 8. `eval_numeric()` (complejo)

In [None]:
quizz.eval_numeric('8', complejo)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('8', complejo*2)

#### Pregunta 9. `eval_numeric()` (lógico)

In [None]:
quizz.eval_numeric('9', logico)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('9', False)

#### Pregunta 10. `eval_numeric()` (lista numérica)

In [None]:
quizz.eval_numeric('10', lista_num)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('10', [3, 4, 5])

#### Pregunta 11. `eval_numeric()` (tupla numérica)

In [None]:
quizz.eval_numeric('11', tupla_num)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#quizz.eval_numeric('11', (8, 6, 7))

## Pregunta 13. `eval_datastruct()` (lista)

También es posible evaluar estructuras de datos, por ejemplo una lista.

**Ojo**: nos saltamos el índice 12, no es necesario que estén todos los números en secuencia para los ejercicios.

In [None]:
quizz.eval_datastruct('13', lista)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# La lista puede estar en desorden
print(lista)
quizz.eval_datastruct('13', ['delacruz', 'luis', 'miguel'])

['luis', 'miguel', 'delacruz']
[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#print(lista)
#quizz.eval_datastruct('13', ['delacruz', 'miguel'])

## Pregunta 14. `eval_datastruct()` (lista)

In [None]:
quizz.eval_datastruct('14', tupla)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# La tupla puede estar en desorden
print(tupla)
quizz.eval_datastruct('14', ('c', 'b', 'a'))

('a', 'b', 'c')
[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#print(tupla)
#quizz.eval_datastruct('14', ('c', 'b', 'd'))

## Pregunta 15. `eval_datastruct()` (conjunto)

In [None]:
quizz.eval_datastruct('15', conjunto)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# En un conjunto no importa el orden
print(conjunto)
quizz.eval_datastruct('15', {'c', 'b', 'a'})

{'b', 'c', 'a'}
[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#print(conjunto)
#quizz.eval_datastruct('15', {'c', 'b', 'a', 'd'})

## Pregunta 16. `eval_datastruct()` (diccionario)

In [None]:
quizz.eval_datastruct('16', diccionario)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
# En esta versión un diccionario necesariamente debe estar en orden
#print(diccionario)
#quizz.eval_datastruct('16', {'k1':3.446,  'k3':2.234324, 'k2':5.6423})

In [None]:
# Respuesta incorrecta
#print(diccionario)
#quizz.eval_datastruct('16', {'k1':3.446,  'k2':5.6423, 'k4':2.234324, })

## Pregunta 17. `eval_datastruct()` (nd.array no numérico)

In [None]:
quizz.eval_datastruct('17', array_no_num)

[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# El arreglo puede estar en desorden
print(array_no_num)
quizz.eval_datastruct('17', np.array(['x', 'a', 'w']))

['a' 'x' 'w']
[39m----------------------------------------
[32mTu resultado es correcto.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#print(array_no_num)
#quizz.eval_datastruct('17', np.array(['x', 'z', 'w']))

## Pregunta 18. `eval_expression()`
**Forma cuadrática**

$$ f(\mathbf{x}) = \dfrac{1}{2} \mathbf{x}^T A \mathbf{x} - \mathbf{b}^T \mathbf{x} + c $$

Usando los valores de $A$, $B$ y $C$ calcula la forma de $f(\mathbf{x})$

In [None]:
# Construimos la forma cuadrática
x = sy.Symbol('x')
y = sy.Symbol('y')
A, B, C = matriz_np, array_np, flotante
mi_respuesta = 0.5 * A[0,0] * x**2 + 0.5 * A[1,1] * y**2 + 0.5 * (A[0,1]+A[1,0])* x * y - B[0] * x - B[1] * y + C

In [None]:
print(forma_cuadratica)
print(mi_respuesta)
display(forma_cuadratica)
display(mi_respuesta)

0.05*x**2 - 0.35*x*y + 200*x - 0.5*y**2 - 20*y
0.05*x**2 - 0.35*x*y + 200*x - 0.5*y**2 - 20*y


0.05*x**2 - 0.35*x*y + 200*x - 0.5*y**2 - 20*y

0.05*x**2 - 0.35*x*y + 200*x - 0.5*y**2 - 20*y

In [None]:
quizz.eval_expression('18', mi_respuesta)

[39m----------------------------------------
[32mTu respuesta:


0.05*x**2 - 0.35*x*y + 200*x - 0.5*y**2 - 20*y

[32mes correcta.
[39m----------------------------------------


In [None]:
# Respuesta incorrecta
#otra_respuesta = 0.25 * A[0,0] * x**2 + 0.5 * A[1,1] * y**2 + 0.5 * (A[0,1]+A[1,0])* x * y - B[0] * x - B[1] * y + C
#quizz.eval_expression('18', otra_respuesta)

## *NBGrader*

*NBGrader* es una biblioteca que nos permite automatizar y organizar de mejor manera la evaluación de los conocimientos generados mediante notebooks.

En general podemos decir que *NBGrader* es un conjunto de herramientas escritas para el lenguaje *Python* que nos permiten automatizar la evaluación de los contenidos. De manera práctica *NBGrader* agrega elementos al proyecto *Jupyter Notebook* para aligerar la tarea de evaluar a los alumnos.

En este <a href="https://youtu.be/5WUm0QuJdFw">link</a> puedes ver un video muy completo sobre el proyecto *NBGrader* y como se usa.

### Estructura *NBGrader*

Una de las primeras cosas de que tenemos que aprender de *NBGrader* es que para evaluar los *notebooks*, vamos a tener 2 versiones del mismo, una de ellas es la versión del profesor (está contiene las preguntas y respuestas) y la versión del estudiante (esta contiene las preguntas sin las respuestas).

Para comenzar con el desarrollo de materiales haciendo uso de *NBGrader* es necesario familiarizarse con 3 elementos básicos de la herramienta:

- 1 - *Formgrader*: es un nuevo elemento en la *GUI* de *Jupyter Notebook* que nos permite generar notebooks que serán evaluados de manera automatizada.
- 2 - *source*: es el folder donde se almacena la versión del profesor.
- 3 - *release*: es el folder donde se almacena la versión del estudiante.

Para que se genere el folder *source* (y posteriormente release) es necesario crear un *assignment*, un *assignment* es un *notebook* que queremos que sea evaluado y para crearlo es necesario seleccionar *Formgrader*.

Posteriormente es necesario seleccionar *Add new asignment*

Le podemos dar cualquier nombre al *asignment* aunque se recomienda un nombre que facilite identificar de qué se trata el material dentro del *asignment*. En este caso le vamos a dar el nombre *Prueba* y una vez creado el *asignment* el resto es tan sencillo como crear un *notebook* tradicional.

### Tipo de celdas *NBGrader*

*NBGrader* agrega nuevos tipos de celdas (además de las ya conocidas), mediante las cuales podemos tener más control y sobretodo estas nuevas celdas son las que nos permiten automatizar la evaluación, estas son:

- *readonly*: permite deshabilitar la edición de las celdas, se usa principalmente para celdas de texto.
- *manually graded answer*: son celdas que serán evaluadas de manera manual.
- *manually graded task*: son celdas que serán evaluadas de manera manual y que formarán parte de la evaluación total del curso.
- *auto graded answer*: son celdas que contienen los elementos a evaluar y qué *NBGrader* identifica para eliminar el código necesario.
- *auto graded test*: son celdas que serán evaluadas de manera AUTOMATICA y que le permiten a alumno saber si acerto o tuvo errores y que no pueden ser modificadas por el alumno.


### Evaluación automatizada de celdas

Ya que tenemos la estructura necesaria y acceso a todas las herramientas de evaluación lo siguiente que necesitamos es identificar el conocimiento que deseamos evaluar y cómo lo vamos a hacer.

Para este ejemplo sencillo vamos a generar una celda de evaluación automatizada (*auto graded answer*) y dejaremos que *NBGrader* se encargue de la evaluación.

**Importante:** *NBGrader* permite automatizar y organizar de manera más completa el proceso de evaluación del conocimiento, pero por motivos de alcance del taller no las veremos. Se recomienda revisar el video mencionado en la parte inicial para más detalle.

Los siguientes pasos para la evaluación los podemos definir de la siguiente manera:

- **Identificar el conocimiento a evaluar**: puede ser desde un simple cálculo numérico (cálculo de un área, operación aritmética, etc.) hasta un procedimiento más complejo como puede ser un método numérico o un algoritmo más sofisticado.
- **Escribir el código asociado a la evaluación**: para poder evaluar el conocimiento, es necesario tener la respuesta, por lo que es necesario escribir el código completo (versión del profesor) dentro de una o más celdas a evaluar.
- **Seleccionar la sección que debe responder el alumno**: partiendo del código escrito en el paso previo, ahora es necesario seleccionar la parte del mismo que va a ser eliminada por *NBGrader* y que debe completar el alumno.
- **Contrastar la respuesta correcta contra la del alumno**: existen varias formas de llevar a cabo este paso, pero uno de los más sencillos es usar alguna herramienta (por ejemplo `macti_lib`).
- **Dejar que *NBGrader* elimine las secciones**: ya que sabemos cuales son las secciones a evaluar, *NBGRader* las sustituye por un mensaje de error para que el alumno lo complete.

### **Ejemplo 1 - Evaluación automatizada**

Para este ejemplo sencillo, vamos a pedirle al alumno que complete la función `area_cuadrado(lado)`, misma que va a recibir la longitud del lado como parámetro y debe devolver el área del cuadrado.

Una vez que generamos un *notebook* llamado "Evaluacion", dentro del *assignment* "Prueba" dentro del mismo vamos a agregar la (o las) celda a evaluar.

Lo primero que debemos notar es que la plantilla (estructura de la prueba) ya fue definida por el profesor, es decir que la definición de la función y algunos elementos del código ya fueron definidos y eso permite restringir los posibles errores o confusiones de parte del alumno.

Por otro lado, la sección que debe definir el alumno se encuentra en una celda de tipo *autograded answer* y la celda que se encarga de la evaluación se encuentra en una celda de tipo *autograded test*.

Además es importante notar que la sección que debe completar (y que posteriormente será eliminada por *NBGrader*) debe estar acotada por los comentarios `#BEGIN SOLUTION` y `#END SOLUTION`.

Ya que tenemos la versión del profesor de este *notebook* ("Evaluacion") la cual contiene todos los elementos necesarios y validamos que la prueba funciona de manera correcta, lo siguiente es que *NBGrader* se encargue de generar la versión del estudiante que no contiene las respuestas.

Para hacer esto es necesario volver a la sección *Formgrader* y ubicar el *assignment* en cuestión (que en este caso es "Prueba"), en esta parte vamos a ver un par de íconos relevantes, pero el que nos interesa en este momento es el ícono del birrete que se encuentra sobre la columna *Generate*.

Al presionar este ícono *NBGrader* lleva a cabo ciertas validaciones y en caso de pasarlas se muestra un mensaje indicando que la versión del estudiante se generó de manera correcta, la cual podemos visualizar con el ícono *preview*.

En caso de tener que modificar la versión del profesor podemos dar click en el ícono *Edit* y eso nos permite realizar las modificaciones necesarias.

Por último es importante notar que la versión del profesor (versión completa) de este *notebook* se encuentra en la ruta *source/Prueba/Evaluacion* y la versión del estudiante se encuentra en la ruta *release/Prueba/Evaluacion*, es importante notar que ambas versiones (profesor y estudiante) de este *notebook* tienen el mismo nombre pero son versiones distintas, por lo que una vez que vayan a ser distribuidos es buena idea renombrarlos para poder identificarlos de manera más sencilla.
