In [1]:
import pandas as pd
import json
from collections import defaultdict
import re
from utilities import Tiempo
import dataExtraction

#### Con este bucle obtenemos los datos sobre la inicialización de todos los niveles jugados

In [2]:
def extraerTiempos(rawData, minTiempoInactivo):
    #HAY QUE COMPROBAR QUE minTiempoInactivo es positivo
    erInitialized = re.compile(r'\binitialized$\b')
    erCompleted = re.compile(r'\bcompleted$\b')
    erAccessed = re.compile(r'\baccessed$\b')
    erInteracted = re.compile(r'\binteracted$\b')

    erLevel = re.compile(r'\blevel$\b')
    erIdLevel = re.compile(r'/')
    erSeriousGame = re.compile(r'\bserious-game$\b')
    erGameObject = re.compile(r'\bgame-object$\b')
    erScreen = re.compile(r'\bscreen$\b')

    erExitGamePanel = re.compile(r'\bexit_game_panel$\b')
    erExitGamePanelCloseButton = re.compile(r'\bexit_game_panel_close_button$\b')
    
    data = defaultdict(defaultdict)
    ultimaTrazaRegistrada = defaultdict()
    tiemposInactivo = defaultdict(list)
    inicioYFinJuego = defaultdict(list)
    anomalias = []
    
    for evento in rawData:         
        verb = evento["verb"]["id"]
        obj = evento["object"]["definition"]["type"]
        name = evento["actor"]["name"]
        timestamp = evento["timestamp"]
        objectId = evento["object"]["id"]
        
        if erLevel.search(obj): #Si el objeto de la acción es un nivel
            levelCode = erIdLevel.split(objectId)[-1]
            if erInitialized.search(verb): #Si la acción es inicio o reinicio
                if "result" in evento: #Significa que ha iniciado el nivel desde el menu
                    if levelCode in data[name]:
                        data[name][levelCode].append({"ini" : timestamp, "fin" : "", "stars" : ""})
                    else:
                        data[name][levelCode] = [{"ini" : timestamp, "fin" : "", "stars" : ""}]
                #else: #-> sería cuando un nivel es reiniciado, por ahora no vamos a tenerlo en cuenta
            elif erCompleted.search(verb):
                if evento["result"]["success"]: #Significa que el nivel se ha completado con éxito
                    if levelCode in data[name]:
                        data[name][levelCode][-1]["fin"] = timestamp
                        data[name][levelCode][-1]["stars"] = evento["result"]["score"]["raw"]
                    else: #Significa que hay un evento de finalizar que no tiene un evento de inicio
                        anomalias.append(evento)
                else:
                    if levelCode in data[name]:
                        data[name][levelCode][-1]["fin"] = None #Porque el jugador sale al menú o cierra el juego
                    else: #Significa que hay un evento de finalizar que no tiene un evento de inicio
                        anomalias.append(evento)
        
        #Algunos jugadores cierran el juego el juego con Alt+F4 o dando a la x de la ventana, esto no queda registrado
        #Para poder tener esto en cuenta habría que recorrer los datos 2 veces ya que no podemos quedarnos con el último 
        #valor antes del initialized porque los timestamps no vienen bien ordenados
        
        elif erSeriousGame.search(obj) and erInitialized.search(verb): #Nos indica que el jugador ha abierto el juego
            inicioYFinJuego[name].append({"inicio" : timestamp, "fin" : None, "exit-type": "inesperado"})
            
        elif erAccessed.search(verb) and erScreen.search(obj) and erExitGamePanel.search(objectId): #El jugador ha abierto el panel para cerrar el juego
            inicioYFinJuego[name][-1]["fin"] = timestamp
            inicioYFinJuego[name][-1]["exit-type"] = "normal"
      
    for evento in rawData:
        name = evento["actor"]["name"]
        timestamp = evento["timestamp"]
                
        for i in range(len(inicioYFinJuego[name])):
            if inicioYFinJuego[name][i]["fin"] == None or inicioYFinJuego[name][i]["exit-type"] == "inesperado": #No hemos conseguido obtener el final porque se ha cerrado el juego
                if (i + 1) < len(inicioYFinJuego[name]): #No estamos en la ultima partida del jugador
                    if Tiempo(timestamp, inicioYFinJuego[name][i+1]["inicio"]) > Tiempo("1s"): #No es una trazas que aparece antes de iniciar el juego
                        inicioYFinJuego[name][i]["fin"] = timestamp
                else:
                    inicioYFinJuego[name][i]["fin"] = timestamp
                    
        if name in ultimaTrazaRegistrada:
                t = Tiempo(ultimaTrazaRegistrada[name], timestamp)
                if t > minTiempoInactivo:
                    tiemposInactivo[name].append(t);
                   
                    for ini in inicioYFinJuego[name]:
                        if(Tiempo(ini["inicio"], timestamp) < Tiempo("1s")):
                            del tiemposInactivo[name][-1] #Eliminamos los tiempos inactivos que sean de distintos inicios del juego
                            break
                        
        ultimaTrazaRegistrada[name] = timestamp
                    
                    
    return {"tiemposNivel" : data, "tiempoTotal" : inicioYFinJuego, "anomalias" : anomalias, "tiemposInactivo" : tiemposInactivo}              

In [3]:
def tiempoTotalJuego(inicioYFinJuego):
    tiempoTotal = defaultdict()
    for player in inicioYFinJuego:
        for time in inicioYFinJuego[player]:
            if time["fin"] != None:
                if player in tiempoTotal:
                    tiempoTotal[player] += Tiempo(time["inicio"], time["fin"])
                else:
                    tiempoTotal[player] = Tiempo(time["inicio"], time["fin"])
    return tiempoTotal

In [4]:
def tiempoPorNiveles(data, anomalias):
    tiemposJugados = defaultdict(defaultdict)
    for player in data:
        for level in data[player]:
            for times in data[player][level]:
                if times["fin"] != None: #Si no se aborto el intento del nivel
                    try:
                        timeDifference = Tiempo(times["ini"], times["fin"])
                        if level in tiemposJugados[player]:
                            tiemposJugados[player][level].append({"time" : timeDifference, "stars" : times["stars"]})
                        else:
                            tiemposJugados[player][level] = [{"time" : timeDifference, "stars" : times["stars"]}]
                    except ValueError: #Algunos timestamps de finalizacion estan vacios, ¿Tiene que ser asi?
                        anomalias.append({"jugador" : player,
                                  "nivel" : level,
                                  "Timestamp-Inicio" : times["ini"],
                                  "Timestamp-Fin" : times["fin"],
                                  "Descripcion:" : "No se ha podido parsear uno de los 2 timestamps"})
    return tiemposJugados

In [5]:
def buscarTarjetas(rawData):
    data = []
    erIdLevel = re.compile(r'/')
    for evento in rawData:
        idJugador = evento["actor"]["name"]
        levelCode = erIdLevel.split(evento["object"]["id"])[-1]
        if idJugador == "bdwyj" and "result" in evento and "extensions" in evento["result"] and "level" in evento["result"]["extensions"]:
            if evento["result"]["extensions"]["level"] == "variables_9":
                data.append(evento)
        elif idJugador == "bdwyj" and levelCode == "variables_9":
            data.append(evento)
    return data

In [6]:
def getMediaTiemposYEstrellas(data):
    tiemposYEstrellasMedios = defaultdict()
    sumasTotales = defaultdict()
    for user in data:
        for level in data[user]:
            for time in data[user][level]:
                if level in tiemposYEstrellasMedios:
                    tiemposYEstrellasMedios[level]["tiempo"] += time["time"]
                    tiemposYEstrellasMedios[level]["stars"] += time["stars"]
                    sumasTotales[level] += 1
                else:
                    tiemposYEstrellasMedios[level] = {"tiempo" : time["time"], "stars" : time["stars"]}
                    sumasTotales[level] = 1
    for level in tiemposYEstrellasMedios:
        tiemposYEstrellasMedios[level]["tiempo"] = tiemposYEstrellasMedios[level]["tiempo"]/sumasTotales[level];
        tiemposYEstrellasMedios[level]["stars"] = round(tiemposYEstrellasMedios[level]["stars"]/sumasTotales[level], 2);
    return tiemposYEstrellasMedios

In [7]:
def getDesempenioJugadores(tiempos, tiemposMedios, porcDebajo, porcEncima, primerIntento = True):
    #tiempos -> diccionario con los tiempos de cada jugador en cada nivel
    #tiemporMedios -> media de los tiempos por nivel
    #porcDebajo -> porcentaje que se usara para filtrar a los jugadores con un tiempo igual o inferior a este
    #porcEncima -> porcentaje que se usara para filtrar a los jugadores con un tiempo igual o superior a este
    #primerIntento -> true cuando solo se quiere tener en cuenta el primer intento del jugador, false cuando no
    jugadoresPorDebajo = defaultdict(defaultdict) #Jugadores con buen desempeño, menor tiempo que media
    jugadoresPorEncima = defaultdict(defaultdict) #Jugaodre con mal desempeño, mayor tiempo que media

    for player in tiempos:
        for level in tiempos[player]:
            for time in tiempos[player][level]:
                if time["time"] <= (tiemposMedios[level]["tiempo"]*(1-porcDebajo)):
                    if level in jugadoresPorDebajo[player]:
                        jugadoresPorDebajo[player][level].append(time["time"])
                    else:
                        jugadoresPorDebajo[player][level] = [time["time"]]
                        
                elif time["time"] >= (tiemposMedios[level]["tiempo"]*(1+porcEncima)):
                    if level in jugadoresPorEncima[player]:
                        jugadoresPorEncima[player][level].append(time["time"])
                    else:
                        jugadoresPorEncima[player][level] = [time["time"]]
                        
                if primerIntento:
                    break
                    
    return jugadoresPorDebajo, jugadoresPorEncima

In [8]:
pd.options.display.max_columns = None
pd.set_option('display.max_colwidth', None)
pd.options.display.max_rows = None

In [10]:
JSONFile = open('traces_Articoding_Escolapias.json')
rawData = json.load(JSONFile)
minTiempoInactivo = Tiempo("1m/30s")
result = extraerTiempos(rawData, minTiempoInactivo)
JSONFile.close()
#pd.DataFrame(result["data"])
#pd.DataFrame.from_dict(result["tiempoTotal"], orient='index').transpose()
pd.DataFrame.from_dict(result["tiemposInactivo"], orient='index').transpose()
#tiempoTJuego = tiempoTotalJuego(result["tiempoTotal"])
#pd.DataFrame(tiempoTJuego, index = ["Tiempo"])

Unnamed: 0,hgfx,bdwyj,zxvkj,vsxld,eprdu,khadt,pbgky,fkmtp,srjon,sxipu,hjpbw,ikcar,xnpqf,ipdcp,zwzfv,kmqou,gleqe,ejeuw,loemd,rdiaf,zcibf,pygoc,dunul,accul,dwqwi,kkoif,bhyhw,auvqa,yfohf,swvxx,onyep,edxmq,grkij,cmbfi,ubmtx,tjfzy,tekwp,krahz,yvpmf,oahey,nmveq,uzzpo,gcpze,qeqyj,ftpnb,asopk,sjpkc,gqoj,ewqbs,lwryl,tinco,mymho,hpdxj,wjaxi,tgwmn,fivin,mjiso,camhi,psido,fyyya,ztyed,kkliq,gdljy,hqmhq,zbgwk,rziia,yxewz,yxjji,dvmlu,dmwvy,gguuc,ucdvy,stiry,ahxym,rqlug,vddlg,huyyb,idmzi,tvxow,zdnso,lhrbj,tavin,jhbuv,aotlm,jozyx,knewj,xtdrq,bjvnt,qfsdj,wqmgq,vvqlm,atlzs,ngavz,mgaak,yazod,tqgyp,pzfdd,qwnpf,sbexy,fmtrq,nhbnj,icllt,khfha,buvgs,itkas,hcbyl,thaho,kzles,rkmrw,rqaby,esrit,nplrf,mewpz,uniee,yyvas,pbwkf,ptmkr,qgcgc,prpej,cojqb,tflzv,qbsjv,eayrh,fbldj,olugf,bajbm,vkfnt,tcvyz,ixrux,sybwc,raqdt,blvkx,orjyn,xbmmw,rsjxu,pleui,fmupf,pqwaf,rfofs,lohyo,nuasx,epjcx
0,,4m/33s,4m/4s,2m/20s,4m/5s,3m,4m/55s,3m/4s,1m/56s,4m/14s,4m/54s,1m/48s,5m/56s,2m/37s,5m/48s,1m/40s,1m/38s,1m/44s,3m/31s,3m/14s,2m/40s,2m/5s,3m/25s,2m/14s,2m/47s,3m/11s,1m/41s,2m/22s,4m/27s,1m/41s,2m/36s,4m/58s,1m/36s,3m/24s,1m/33s,1m/47s,2m/4s,2m/58s,1m/41s,2m,1m/43s,3m,4m/8s,2m/39s,4m/59s,1m/47s,5m/3s,2m/30s,3m/33s,,1m/34s,3m/13s,2m/39s,1m/33s,2m/59s,3m/5s,1m/34s,4m/38s,1m/53s,4m/50s,3m/14s,1m/39s,1m/47s,5m/16s,2m/30s,1m/52s,5m/2s,2m/10s,1m/46s,3m/7s,2m/21s,5m/32s,1m/46s,1m/59s,1m/42s,1m/52s,1m/32s,1m/42s,1m/35s,2m/38s,2m/50s,1m/41s,1m/47s,1m/37s,1m/36s,1m/54s,1m/41s,1m/34s,1m/59s,1m/31s,3m/14s,2m/28s,1m/45s,8m/2s,2m/53s,1m/39s,,,3m/24s,2m/49s,4m/9s,2m/7s,2m/52s,4m,,4m/17s,4m/17s,5m/12s,5m/21s,3m/52s,1m/50s,1m/33s,3m/36s,2m/24s,2m/30s,1m/32s,,1m/40s,1m/41s,1m/50s,2m/55s,4m/20s,1m/34s,,3m/21s,2m/39s,3m/22s,1m/54s,4m/46s,4m/21s,4m/43s,3m/23s,2m/14s,3m/12s,5m/11s,4m/45s,3m/13s,3m/33s,3m/48s,3m/6s,1m/44s,3m/25s
1,,,,,,,,,,,,1m/36s,,1m/47s,,3m/25s,7m/13s,2m/22s,,,6m/23s,4m/25s,,,,,,4m,1m/32s,4m/43s,,1m/52s,1m/47s,,3m/5s,3m/46s,2m/21s,2m/5s,,4m,1m/38s,,,2m/1s,,2m/27s,,,,,,,1m/56s,5m/49s,,,,2m/7s,7m/31s,1m/33s,1m/31s,,2m/12s,,,2m/14s,1m/53s,1m/38s,3m/21s,1m/40s,2m/19s,,1m/49s,1m/38s,1m/34s,1m/36s,1m/37s,2m/45s,1m/45s,1m/41s,2m/9s,1m/52s,1m/50s,2m/39s,2m/26s,1m/35s,2m/42s,2m/4s,1m/45s,,1m/35s,3m/8s,,4m/7s,1m/59s,,,,2m/39s,3m/37s,1m/59s,2m/2s,,,,,,,,,2m/39s,1m/46s,,,,1m/48s,,3m/51s,1m/50s,,,,3m/35s,,3m/20s,2m/5s,,1m/50s,1m/33s,,,,,,,,4m/31s,,1m/38s,,1m/37s,1m/32s
2,,,,,,,,,,,,3m/20s,,,,,,1m/37s,,,3m/22s,,,,,,,,5m/35s,,,3m/37s,1m/39s,,,,1m/32s,5m/13s,,1m/45s,2m/40s,,,4m/27s,,,,,,,,,,,,,,1m/49s,,1m/38s,1m/49s,,3m/7s,,,2m/58s,2m/55s,1m/43s,,5m/52s,2m/19s,,1m/53s,2m/15s,3m/46s,1m/54s,1m/34s,2m/41s,2m/38s,3m/26s,2m/6s,1m/58s,2m/7s,3m/4s,1m/53s,1m/43s,1m/38s,6m/17s,,,5m,2m/10s,,,3m/5s,,,,,,3m/35s,,,,,,,,,,1m/31s,3m/57s,,,,1m/52s,,,,,,,,,1m/40s,1m/53s,,,3m/34s,,,,,,,,,,1m/52s,,4m/2s,
3,,,,,,,,,,,,,,,,,,1m/45s,,,,,,,,,,,,,,,2m/33s,,,,,,,4m/30s,,,,,,,,,,,,,,,,,,12m/29s,,4m/7s,1m/34s,,,,,,1m/45s,2m/51s,,1m/59s,2m/44s,,1m/46s,2m/36s,14m/2s,2m/13s,2m,5m/27s,2m/2s,,1m/51s,1m/51s,3m/31s,4m/46s,1m/38s,1m/34s,1m/31s,6m/15s,,,3m/12s,4m/15s,,,,,,,,,,,,,,,,,,,2m/56s,,,,,5m/8s,,,,,,,,,8m/38s,1m/47s,,,,,,,,,,,,,1m/55s,,,
4,,,,,,,,,,,,,,,,,,4m/52s,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,2m/12s,4m/7s,,,,,,2m/46s,2m/49s,,2m,1m/32s,,17m/59s,1m/57s,1m/37s,3m/53s,2m/7s,5m/27s,1m/48s,,1m/43s,,2m/23s,11m/37s,1m/31s,1m/42s,1m/43s,47m/27s,,,,,,,,,,,,,,,,,,,,,,,4m/45s,,,,,,,,,,,,,,1m/39s,2m/16s,,,,,,,,,,,,,3m/24s,,,
5,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,10m/29s,,,,,,,,2m/21s,,6m/29s,2m/7s,,,1m/56s,,1m/42s,5m/40s,6m/53s,2m/10s,,2m/4s,,,2m/48s,2m/6s,4m/12s,9m/18s,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1m/38s,5m/5s,,,,,,,,,,,,,4m/19s,,,
6,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,3m/4s,,2m/55s,3m/1s,,,2m/41s,,58m/5s,4m/20s,6m/10s,11m/5s,,1m/36s,,,,2m/46s,1m/41s,10m/8s,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,4m/48s,,,,,,,,,,,,,,,,,
7,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,2m/5s,,3m/54s,,,,3m/7s,,,,3m/59s,9m/58s,,3m/21s,,,,12m/11s,22m/53s,2m/17s,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,3m/31s,,,,,,,,,,,,,,,,,
8,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,3m/38s,,,,,,,,,1m/31s,,,,,,11m/57s,19m/37s,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
9,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,2m/14s,1m/39s,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,


In [None]:
tiemposJ = tiempoPorNiveles(result["tiemposNivel"], result["anomalias"])
pd.DataFrame(tiemposJ)

In [None]:
tiemposMedios = getMediaTiemposYEstrellas(tiemposJ)
pd.DataFrame(tiemposMedios)

In [None]:
porcentajePorDebajo = 0.2
porcentajePorEncima = 0.5
jPorDebajo, jPorEncima = getDesempenioJugadores(tiemposJ, tiemposMedios, porcentajePorDebajo, porcentajePorEncima)
pd.DataFrame(jPorEncima)

In [None]:
Tiempo("2022-05-18T07:13:48.865Z", "2022-05-18T06:13:48.865Z").positivo