<a name="Inicio"></a>
# Learning Paths with Generic Bricks

#### Autor: *Ángel Pérez Lemonche*


## Descripción general
-

Los tipos de *brick* son los siguientes:

- V: ***brick de vídeo***, de los cuales solo se consideran los eventos que están en negrita.
    - **play_video**
    - seek_video
    - pause_video
    - load_video
    - stop_video
    
- E: ***brick de ejercicio (de vídeo)***. Los *brick de ejercicio* son eventos de tipo **problem_check**, pero no todos los eventos *problem_check* son ejercicios de vídeo, por eso se hace uso del orden natural de problemas y ejercicios para filtrarlos.

- A: ***brick de actividad***. De igual modo, los *brick de actividad* son eventos de tipo **problem_check**, pero no todos los eventos *problem_check* son ejercicios de actividad, por eso se hace uso del orden natural de problemas y ejercicios para filtrarlos.

- F: ***brick de foro***, de los cuales solo se consideran los eventos que están en negrita.
    - **edx.forum.searched**
    - **edx.forum.comment.created**
    - **edx.forum.response.created**
    - **edx.forum.thread.created**
- P: *brick de proyecto*, de los cuales solo se consideran los eventos que están en negrita.
    - **openassessmentblock.self_assess**
    
- D: *brick de documento*, de los cuales solo se consideran los eventos que están en negrita.
    - **textbook.pdf.chapter.navigated**
    
- I: ***brick de ejercicio inicial***. Los *brick de ejercicio inicial* no son evaluativos y ocurren siempre en la *Semana 0*, por lo que no se incluyen en este análisis. Los *brick de ejercicio inicial* son eventos de tipo **problem_check**, pero no todos los eventos *problem_check* son ejercicios iniciales, por eso se hace uso del orden natural de problemas y ejercicios para filtrarlos.

- X: ***brick de ejercicio de examen***. Los *brick de ejercicio de examen* ocurren siempre en la *Semana 7* y no se incluyen en este análisis. Los *brick de ejercicio de examen* son eventos de tipo **problem_check**, pero no todos los eventos *problem_check* son ejercicios de examen, por eso se hace uso del orden natural de problemas y ejercicios para filtrarlos.

Se pueden incluir el ***brick de pausa*** (S), el cual se puede configurar la cantididad de tiempo (en minutos) en el que se considera que el usuario ha hecho una pausa.

-

**Nota 1**: En este script se filtra las repeticiones de interacciones de eventos de vídeos cuando el usuario se encuentra en el mismo vídeo. Esto es, por ejemplo, si un usuario realiza la siguiente secuencia:

    play_video_1 - t0, pause_video_1 - t1, play_video_1 - t2

solo se anotaría un *brick de vídeo* en tiempo t0 y **no** se añadiría *brick de pausa* mientras siga interactuando sobre el mismo vídeo, a no ser que interacciones dos interacciones consecutivas entre eventos del mismo vídeo tarden más que el tiempo de pausa.

--

- [Tarea 1: Procesamiento del fichero de eventos a *bricks*](#T1)
- [Tarea 2: Generación de las matrices de transiciones](#T2)
- [Tarea 3: Representación de las matrices de transiciones](#T3)

### Importación de librerías y declaración de funciones

In [1]:
# Librerías
import json
from datetime import datetime

In [2]:
# Orden natural de problemas y ejercicios

## Debido a que los eventos de tipo "problem_check" pueden ser bien ejercicicios iniciales,
##  ejercicios de vídeo, actividades o bien ejercicios de examen, aquí se hace una división
##  según el tipo que sea.

ejercicios = [[15,28],[42,60],[79,84],[92,101],[110,117],[126,131]]
actividades = [[29,41],[61,78],[85,91],[102,109],[118,125],[132,135]]
iniciales = [[1,14]]
examen = [[136,196]]

## Correspondencia de eventos a bricks. en el caso de "problem_check" se marca como "N" de
##  "no definido", hasta que se haga uso del orden natural de problemas y ejercicios.
## Los eventos marcados sin brick ("") no se tienen en cuenta para hacer el este análisis.

correspondencia = {
            "play_video":"V",
            "seek_video":"V",
            "pause_video":"",
            "load_video":"",
            "stop_video":"",
            "problem_check":"N",
            "edx.forum.searched":"F",
            "edx.forum.comment.created":"F",
            "edx.forum.response.created":"F",
            "edx.forum.thread.created":"F",
            "openassessmentblock.self_assess":"P",
            "textbook.pdf.chapter.navigated":"D"}

In [3]:
# Conversión de eventos a bricks

## Utiliza el diccionario de correspondencia anteriormente declarado para pasar de evento
##  a brick. En el caso en el que el evento sea de tipo "problem_check" utiliza el orden
##  natural de problemas y ejercicios para asignarle un brick.
## Los bricks de "ejercicios iniciales" y de "ejercicios de exámenes" no se tendrán en cuenta
##  en este análisis.

def proc_event(event):
    brick = ""
    
    # Si el brick no se encuentra en la correspondencia, se considera un brick nulo.
    try:
        brick = correspondencia[str(event["evento"])]
    except:
        brick = "" # BRICK NULO, NO CONSIDERADO
        
    # Si es brick es de tipo "no definido" es porque es de tipo "problem_check", luego hay que
    #  hacer uso del orden natural de problemas y ejercicios para saber si se trata de un
    #  ejercicio de vídeo, de una actividad, de un ejercicio inicial o de un ejercicio de examen.
    
    if brick == "N":
        num = int(event["id_problema"])
        flag = True
        
        # Comprobamos si se trata de un ejercicio...
        for rango in ejercicios:
            if num>=rango[0] and num <=rango[1]:
                brick = "E"
                flag = False
                # ... y si es así, salimos del bucle del intervalo de ejercicios.
                break
                
        # Si no era un ejercicio...
        if flag:
            # Comprobamos si se trata de una actividad...
            for rango in actividades:
                if num>=rango[0] and num <=rango[1]:
                    brick = "A"
                    flag = False
                    # ... y si es así, salimos del bucle de intervalo de actividad.
                    break
                    
        # Si no era un ejercicio ni una actividad...
        if flag:
            # Comprobamos si se trata de un ejercicio inicial...
            for rango in iniciales:
                if num>=rango[0] and num <=rango[1]:
                    brick = "" # BRICK NULO, NO CONSIDERADO
                    # ... y si es así, salimos del bucle de intervalo de ejercicio inicial.
                    flag = False
                    break
    
        # Si no era un ejercicio, ni una actividad, ni un ejercicio inicial...
        if flag:
            # Comprobamos si se trata de un ejercicio de examen...
            for rango in examen:
                if num>=rango[0] and num <=rango[1]:
                    brick = "" # BRICK NULO, NO CONSIDERADO
                    # ... y si es así, salimos del bucle de intervalo de ejercicio de examen.
                    flag = False
                    break
                    
        # Si no era un ejercicio, ni una actividad, ni un ejercicio inicial, ni un ejercicio de examen...
        if flag:
            brick = "" #BRICK NULO, NO CONSIDERADO
            
    return brick

In [4]:
# Convierte una fecha a epoch

## Pues eso, se trabaja mejor con epoch :)

def toepoch(date):
    strdate = str(date)
    strdate = strdate[0:19]
    dt = datetime.strptime(strdate,'%Y-%m-%dT%H:%M:%S')
    return (dt - datetime(1970,1,1)).total_seconds()

In [5]:
# Convierte una fecha a semana

## En función de cuando se haya producido el evento le asignamos una semana.
## Si la semana no coincide con la de los intervalos, asignamos por defecto la Semana 0.

def toweeks(epoch):
    if epoch >= 1424736000 and epoch < 1425340800: #24F y 3M
        return 1
    elif epoch >= 1425340800 and epoch < 1425945600: #3M y 10M
        return 2
    elif epoch >= 1425945600 and epoch < 1426550400: #10M y 17M
        return 3
    elif epoch >= 1426550400 and epoch < 1427155200: #17M y 24M
        return 4
    elif epoch >= 1427155200 and epoch < 1427760000: #24M y 31M
        return 5
    elif epoch >= 1427760000 and epoch < 1428364800: #31M y 7A
        return 6
    elif epoch >= 1428364800 and epoch < 1428969600: #7A y 14A
        return 7
    else:
        return 0

<a name="T1"></a>

## Tarea 1: Procesamiento del fichero de eventos a *bricks*

Este script procesa los eventos del fichero "eventos_final.json" generado por Miguel Gonzázlez-Gallego y genera un JSON con la siguiente estructura:

- Usuario ("Usuario")
- Eventos ("Eventos")
    - Semana ("s")
    - Brick ("b")
    - Tiempo epoch ("ts")

El nombre del fichero que se propone es "eventos\_brick\_*tpausa*.json".

--

- [Inicio](#Inicio)
- [Tarea 2: Generación de las matrices de transiciones](#T2)
- [Tarea 3: Representación de las matrices de transiciones](#T3)

### *Variables*: tiempo mínimo de pausa y nombres de ficheros de entrada y salida

In [33]:
pausa_min = 0 #min
t_pausa = pausa_min*60 #seg

In [34]:
infile_name = './files/eventos_final.json'
outfile_name = './files/eventos_bricks'+str(int(pausa_min))+'.json'

#infile_name = './dos_usuarios.json'
#outfile_name = './eventos_bricks'+str(int(pausa_min))+'.json'

### Ejecución de la Tarea 1: Procesamiento del fichero de eventos a *bricks*


In [35]:
# Fichero de escritura
outfile = open(outfile_name,"w")

# Fichero de lectura
with open(infile_name,"r") as infile:
    # Cada línea del fichero de entrada es un usuario diferente.
    for line in infile:
        data_in = json.loads(line)
        # Inicialización de variables.
        JSON = {}
        JSONListEv = []
        ts_prev = 0
        sem_prev = 0
        idVold = 0
        idVnew = 0
        
        JSON["Usuario"] = str(data_in["Usuario"])

        # Procesamiento de todos los eventos que haya hecho un usuario.
        for evento in data_in["Eventos"]:
            brick = proc_event(evento)
                    
            # Si el evento es evaluable extraemos el tiempo y la semana.
            if brick != "":
                timestamp = toepoch(evento["tiempo"])
                semana = toweeks(timestamp)
                
                # Si el evento es de vídeo... (leer "Nota 1")
                if brick == "V":
                    # Tomamos la id_vídeo
                    idVnew = int(evento["id_video"])
                    
                    # Si interacciona sobre el mismo video y no ha pasado entre
                    #  eventos de vídeo el tiempo de pausa, guardamos el timestamp
                    #  y continuamos (no añadimos este nuevo evento de vídeo).
                    
                    if idVnew == idVold and (timestamp - ts_prev < t_pausa or t_pausa == 0):
                        ts_prev = timestamp
                        continue
                    else:
                        idVold = idVnew
                    
                # Si la semana se analiza (es decir, no es Semana 0 ni Semana 7)
                if semana != 7 and semana != 0:
                    
                    # Procesamiento de pausas
                    
                    # Si no es el el primer evento, y el tiempo entre eventos es mayor
                    #  que el tiempo de pausa añadimos una pausa antes del evento.
                    if ts_prev != 0 and timestamp - ts_prev > t_pausa and t_pausa != 0:
                        
                        # Introducción de una pausa a la lista
                        dicEv = {
                            "s": sem_prev,
                            "b": "S",
                            "ts": int(ts_prev + t_pausa)
                        }
                        JSONListEv.append(dicEv)
                    
                    # Introducción de un nuevo brick a la lista
                    dicEv = {
                        "s": semana,
                        "b": brick,
                        "ts": int(timestamp)
                    }
                    JSONListEv.append(dicEv)
                    
                    # Actualización de parámetros
                    ts_prev = timestamp
                    sem_prev = semana

        # Introducción de la pausa final (el usuario no realiza más eventos).
        if sem_prev != 0 and t_pausa != 0:
            dicEv = {
                "s": sem_prev,
                "b": "S",
                "ts": int(ts_prev + t_pausa)
            }
            JSONListEv.append(dicEv)

        # Si ha realizado al menos un evento, escribimos en el fichero de salida.
        if JSONListEv != [] and JSON["Usuario"] != "":
            JSON["Eventos"] = JSONListEv
            json.dump(JSON, outfile)
            outfile.write('\n')
outfile.close()

<a name="T2"></a>
## Tarea 2: Generación de las matrices de transiciones

Este script procesa los eventos del fichero JSON aquí generado (eventos\_bricks\_*tpausa*.json) y genera un fichero JSON con la siguiente estructura:

- Usuario (Usuario)
- Caracteristicas (Caracteristicas)
    - Semana (s)
    - Número transiciones (nt)
    - Matriz de transiciones (tm)

, donde *Caracteristicas* es una lista de *Matrices de transiciones* por semanas. Solo se guardará información de aquellas semanas donde se haya realizado algún evento.

Esta matriz de transición de tamaño 7 x 7 de la siguiente forma:

|   | V   | E   | A   | P   | D   | F   | S   |
|---|-----|-----|-----|-----|-----|-----|-----|
| **V**| V2V | V2E | V2A | V2P | V2D | V2F | V2S |
| **E** | E2V | E2E | E2A | E2P | E2D | E2F | E2S |
| **A** | A2V | A2E | A2A | A2P | A2D | A2F | A2S |
| **P** | P2V | P2E | P2A | P2P | P2D | P2F | P2S |
| **D** | D2V | D2E | D2A | D2P | D2D | D2F | D2S |
| **F** | F2V | F2E | F2A | F2P | F2D | F2F | F2S |
| **S** | S2V | S2E | S2A | S2P | S2D | S2F | S2S |

, la cual se almacena en el fichero JSON por filas en orden descendente.

--

- [Inicio](#Inicio)
- [Tarea 1: Procesamiento del fichero de eventos a *bricks*](#T1)
- [Tarea 3: Representación de las matrices de transiciones](#T3)

### *Variables*: nombres de ficheros de entrada y salida

In [36]:
infile_name2 = outfile_name
outfile_name2 = './brick_freq0h.json'

### Declaración de funciones

In [37]:
# Diccionario de traducción de bricks a índices

ev = {'V': 0,
      'E': 1,
      'A': 2,
      'P': 3,
      'D': 4,
      'F': 5,
      'S': 6}

In [38]:
# Función que comprueba si una matriz de transiciones es nula.
# deprecated!
def MisNull(M):
    for r in M:
        for c in r:
            if c != 0:
                return False
    return True

### Ejecución de la Tarea 2:  Generación de las matrices de transiciones

In [39]:
# Fichero de escritura
outfile = open(outfile_name2,"w")

# Fichero de lectura
with open(infile_name2,"r") as infile:
    
    # Cada línea del fichero de entrada es un usuario diferente.
    for line in infile:
        data_in = json.loads(line)
        
        # Inicialización de variables.
        JSON = {}
        JSONTable = []
        sem_prev = -1
        brick_prev = ""
        ntrans = 0
        TM = []
        
        JSON["Usuario"] = str(data_in["Usuario"])

        # Procesamiento bricks a matrices de transicion.
        
        # Por cada brick que se haya generado...
        for evento in data_in["Eventos"]:
            semana = int(evento["s"])
            
            # Si es una nueva semana
            if semana != sem_prev:
                
                # Añadimos la anterior semana al conjunto de características
                #  si esta no es nula y no es la primera iteración.
                if sem_prev != -1 and ntrans != 0:
                    dicCar = {
                        "s": sem_prev,
                        "tm": TM,
                        "nt": ntrans
                    }
                    JSONTable.append(dicCar)
                
                # Inicializamos la matriz, brick previo y semana previa
                TM = [[0]*7,[0]*7,[0]*7,[0]*7,[0]*7,[0]*7,[0]*7]
                brick_prev = str(evento["b"])
                sem_prev = semana
                ntrans = 0
                
            # Si no es una semana nueva y ya tiene una matriz de transiciones, añadimos la nueva transición.
            else:
                brick = str(evento["b"])
                TM[ev[brick_prev]][ev[brick]] += 1
                brick_prev = brick
                ntrans += 1

        # Añadimos la última semana al conjunto de características
        if ntrans != 0:
            dicCar = {
                "s": sem_prev,
                "tm": TM,
                "nt": ntrans
            }
            JSONTable.append(dicCar)
                        
        # Añadimos la tabla a las características y escribimos en el fichero de salida.
        JSON["Caracteristicas"] = JSONTable
        json.dump(JSON, outfile)
        outfile.write('\n')
outfile.close()

<a name="T3"></a>
## Tarea 3: Representación de las matrices de transiciones

Este script representa ĺas matrices de transiciones de un usuario con el fin de visualizarlas.

--

- [Inicio](#Inicio)
- [Tarea 1: Procesamiento del fichero de eventos a *bricks*](#T1)
- [Tarea 2: Generación de las matrices de transiciones](#T2)


In [29]:
infile_name3 = outfile_name2

In [30]:
# 

def printTM(TM):
    print "|\t\tV\tE\tA\tP\tD\tF\tS"
    print "|\tV [\t",TM[0][0],"\t",TM[0][1],"\t",TM[0][2],"\t",TM[0][3],"\t",TM[0][4],"\t",TM[0][5],"\t",TM[0][6],"\t]"
    print "|\tE [\t",TM[1][0],"\t",TM[1][1],"\t",TM[1][2],"\t",TM[1][3],"\t",TM[1][4],"\t",TM[1][5],"\t",TM[1][6],"\t]"
    print "|\tA [\t",TM[2][0],"\t",TM[2][1],"\t",TM[2][2],"\t",TM[2][3],"\t",TM[2][4],"\t",TM[2][5],"\t",TM[2][6],"\t]"
    print "|\tP [\t",TM[3][0],"\t",TM[3][1],"\t",TM[3][2],"\t",TM[3][3],"\t",TM[3][4],"\t",TM[3][5],"\t",TM[3][6],"\t]"
    print "|\tD [\t",TM[4][0],"\t",TM[4][1],"\t",TM[4][2],"\t",TM[4][3],"\t",TM[4][4],"\t",TM[4][5],"\t",TM[4][6],"\t]"
    print "|\tF [\t",TM[5][0],"\t",TM[5][1],"\t",TM[5][2],"\t",TM[5][3],"\t",TM[5][4],"\t",TM[5][5],"\t",TM[5][6],"\t]"
    print "|\tS [\t",TM[6][0],"\t",TM[6][1],"\t",TM[6][2],"\t",TM[6][3],"\t",TM[6][4],"\t",TM[6][5],"\t",TM[6][6],"\t]"
    
    
def printUser(data):
    print "|"
    print "| USUARIO:", data["Usuario"]
    print "|\tSemanas: ",
    for tab in data["Caracteristicas"]:
        print tab["s"],
    print
    print "|"
    for tab in data["Caracteristicas"]:
        print "| Semana ", tab["s"]
        print "| -----------"
        printTM(tab["tm"])
        print "|"
        print "| Número de Transiciones: ", tab["nt"]
        print "|"


In [31]:
nuser = 1
nuser = 2349
nline = 0
with open(infile_name3) as infile:
    for line in infile:
        nline +=1
        if nuser == nline:
            data = json.loads(line)
            printUser(data)


|
| USUARIO: 6130312
|	Semanas:  1 2 3 4 5 6
|
| Semana  1
| -----------
|		V	E	A	P	D	F	S
|	V [	0 	0 	0 	0 	0 	0 	0 	]
|	E [	0 	0 	0 	0 	0 	0 	0 	]
|	A [	0 	0 	0 	0 	0 	0 	0 	]
|	P [	0 	0 	0 	0 	0 	0 	0 	]
|	D [	0 	0 	0 	0 	10 	0 	5 	]
|	F [	0 	0 	0 	0 	0 	0 	0 	]
|	S [	0 	0 	0 	0 	4 	0 	0 	]
|
| Número de Transiciones:  19
|
| Semana  2
| -----------
|		V	E	A	P	D	F	S
|	V [	8 	7 	5 	0 	1 	0 	1 	]
|	E [	6 	18 	4 	0 	0 	0 	2 	]
|	A [	4 	3 	13 	0 	0 	1 	2 	]
|	P [	0 	0 	0 	0 	0 	0 	0 	]
|	D [	0 	0 	1 	0 	0 	0 	0 	]
|	F [	1 	0 	0 	0 	0 	0 	0 	]
|	S [	2 	2 	1 	0 	0 	0 	0 	]
|
| Número de Transiciones:  82
|
| Semana  3
| -----------
|		V	E	A	P	D	F	S
|	V [	1 	1 	0 	1 	0 	0 	2 	]
|	E [	2 	10 	3 	0 	0 	0 	0 	]
|	A [	0 	0 	19 	0 	0 	0 	3 	]
|	P [	0 	1 	0 	0 	0 	0 	0 	]
|	D [	0 	0 	0 	0 	0 	0 	0 	]
|	F [	1 	0 	0 	0 	0 	3 	1 	]
|	S [	1 	2 	0 	0 	0 	2 	0 	]
|
| Número de Transiciones:  53
|
| Semana  4
| -----------
|		V	E	A	P	D	F	S
|	V [	1 	5 	0 	0 	0 	0 	1 	]
|	E [	4 	5 	1 	0 	0 	0 	0 	]
|	A [	0