2019 Data Science Bowl
===
By Type  
Damien Park  
2019.12.17

In [None]:
import pandas as pd
import numpy as np

import json

from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import train_test_split
from catboost import CatBoostClassifier
# from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import AdaBoostClassifier

import keras

import pprint
import gc
import matplotlib.pyplot as plt
import seaborn as sns

# pandas display option
pd.set_option('display.max_columns', 500)
pd.set_option('display.max_row', 1500)
pd.set_option('max_colwidth', 1500)
pd.set_option('display.float_format', '{:.2f}'.format)

In [None]:
train = pd.read_csv("/kaggle/input/data-science-bowl-2019/train.csv")
# test = pd.read_csv("/kaggle/input/data-science-bowl-2019/test.csv")
label = pd.read_csv("/kaggle/input/data-science-bowl-2019/train_labels.csv")
# sample = pd.read_csv("/kaggle/input/data-science-bowl-2019/sample_submission.csv")
specs = pd.read_csv("/kaggle/input/data-science-bowl-2019/specs.csv")

In [None]:
# df = train.merge(label, how="left", on=["installation_id", "game_session", "title"])
# df.timestamp = pd.to_datetime(df.timestamp)
# df.sort_values(["timestamp", "event_count"], ascending=True, inplace=True)
# del train, label
# gc.collect()

In [None]:
train.timestamp = pd.to_datetime(train.timestamp)
df = train.sort_values(["timestamp", "event_count"], ascending=True)
df = df.merge(label, how="left", on=["installation_id", "game_session", "title"])
df = df.merge(specs, how="left", on=["event_id"])
del train
gc.collect()
pd.unique(df.type)

## 1. Type==Game
Title:  
Scrub-A-Dub, Bubble Bath, All Star Sorting, Chow Time,   
Dino Dive, Happy Camel, Leaf Leader, Pan Balance,   
Dino Drink, Crystals Rule, Air Show  
  
All of Type Game contain round.

In [None]:
# ['Scrub-A-Dub', 'Bubble Bath', 'All Star Sorting', 'Chow Time',
#  'Dino Dive', 'Happy Camel', 'Leaf Leader', 'Pan Balance',
#  'Dino Drink', 'Crystals Rule', 'Air Show']

### Scrub-A-Dub

In [None]:
df.head()

In [None]:
title_select = "Scrub-A-Dub"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Scrub-A-Dub"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Bubble Bath

In [None]:
title_select = "Bubble Bath"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Bubble Bath"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### All Star Sorting

In [None]:
title_select = "All Star Sorting"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "All Star Sorting"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Chow Time

In [None]:
title_select = "Chow Time"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Chow Time"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Dino Dive

In [None]:
title_select = "Dino Dive"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Dino Dive"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Happy Camel

In [None]:
title_select = "Happy Camel"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Happy Camel"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Leaf Leader

In [None]:
title_select = "Leaf Leader"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Leaf Leader"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Pan Balance

In [None]:
title_select = "Pan Balance"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Pan Balance"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Dino Drink

In [None]:
title_select = "Dino Drink"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Dino Drink"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Crystals Rule

In [None]:
title_select = "Crystals Rule"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Crystals Rule"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

### Air Show

In [None]:
title_select = "Air Show"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data", "event_id"]]
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
title_select = "Air Show"
_ = df.query("type=='Game' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_data"]]
_["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
_["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

plt.figure(figsize=(25, 7))
plt.subplot(1, 2, 1)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)
plt.subplot(1, 2, 2)
sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
plt.legend()
plt.title(title_select)

plt.show()

In [None]:
np.unique(_.levels)

## 2. Type==Assessment
There are 5 type of Assessment

In [None]:
class accuracy:
    def __init__(self, df):
        self.df = df

        
    # Assessment evaluation-Cart Balancer (Assessment)
    def cart_assessment(self):
        _ = self.df.query("title=='Cart Balancer (Assessment)' and event_id=='d122731b'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
        _["num_correct_"]=0
        _["num_incorrect_"]=0
        _.loc[_.correct==True, "num_correct_"] = 1
        _.loc[_.correct==False, "num_incorrect_"] = 1
        _ = _.groupby(["installation_id", "game_session"]).sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
        _["accuracy_group_"] = _["num_incorrect_"].apply(lambda x : 3 if x==0 else (2 if x==1 else 1))*_["num_correct_"]

        return _.loc[:, ["installation_id", "game_session", "num_correct_", "num_incorrect_", "accuracy_", "accuracy_group_"]]

    def cart_assessment_2(self):
        _ = self.df.query("title=='Cart Balancer (Assessment)' and event_id=='b74258a0'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["misses"] = _.event_data.apply(lambda x:(json.loads(x)["misses"] if "misses" in json.loads(x).keys() else -999))
        _["num_correct_"]=1
        _ = _.groupby("game_session").sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["misses"])

        return _.loc[:, ["game_session", "num_correct_", "misses", "accuracy_"]]
    
    
    # Assessment evaluation-Chest Sorter (Assessment)
    def chest_assessment(self):
        _ = self.df.query("title=='Chest Sorter (Assessment)' and event_id=='93b353f2'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
        _["num_correct_"]=0
        _["num_incorrect_"]=0
        _.loc[_.correct==True, "num_correct_"] = 1
        _.loc[_.correct==False, "num_incorrect_"] = 1
        _ = _.groupby(["installation_id", "game_session"]).sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
        _["accuracy_group_"] = _["num_incorrect_"].apply(lambda x : 3 if x==0 else (2 if x==1 else 1))*_["num_correct_"]

        return _.loc[:, ["installation_id", "game_session", "num_correct_", "num_incorrect_", "accuracy_", "accuracy_group_"]]
    
    def chest_assessment_2(self):
        _ = self.df.query("title=='Chest Sorter (Assessment)' and event_id=='38074c54'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["misses"] = _.event_data.apply(lambda x:(json.loads(x)["misses"] if "misses" in json.loads(x).keys() else -999))
        _["num_correct_"]=1
        _ = _.groupby("game_session").sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["misses"])

        return _.loc[:, ["game_session", "num_correct_", "misses", "accuracy_"]]
    
    
    # Assessment evaluation-Cauldron Filler (Assessment)
    def cauldron_assessment(self):
        _ = self.df.query("title=='Cauldron Filler (Assessment)' and event_id=='392e14df'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
        _["num_correct_"] = 0
        _["num_incorrect_"] = 0
        _.loc[_.correct==True, "num_correct_"] = 1
        _.loc[_.correct==False, "num_incorrect_"] = 1
        _ = _.groupby(["installation_id", "game_session"]).sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
        _["accuracy_group_"] = _["num_incorrect_"].apply(lambda x : 3 if x==0 else (2 if x==1 else 1))*_["num_correct_"]

        return _.loc[:, ["installation_id", "game_session", "num_correct_", "num_incorrect_", "accuracy_", "accuracy_group_"]]

    def cauldron_assessment_2(self):
        _ = self.df.query("title=='Cauldron Filler (Assessment)' and event_id=='28520915'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["misses"] = _.event_data.apply(lambda x:(json.loads(x)["misses"] if "misses" in json.loads(x).keys() else -999))
        _["num_correct_"] = 1
        _ = _.groupby("game_session").sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["misses"])

        return _.loc[:, ["game_session", "num_correct_", "misses", "accuracy_"]]
    
    
    # Assessment evaluation-Mushroom Sorter (Assessment)
    def mushroom_assessment(self):
        _ = self.df.query("title=='Mushroom Sorter (Assessment)' and event_id=='25fa8af4'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
        _["num_correct_"]=0
        _["num_incorrect_"]=0
        _.loc[_.correct==True, "num_correct_"] = 1
        _.loc[_.correct==False, "num_incorrect_"] = 1
        _ = _.groupby(["installation_id", "game_session"]).sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
        _["accuracy_group_"] = _["num_incorrect_"].apply(lambda x : 3 if x==0 else (2 if x==1 else 1))*_["num_correct_"]

        return _.loc[:, ["installation_id", "game_session", "num_correct_", "num_incorrect_", "accuracy_", "accuracy_group_"]]
    
    def mushroom_assessment_2(self):
        _ = self.df.query("title=='Mushroom Sorter (Assessment)' and event_id=='6c930e6e'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["misses"] = _.event_data.apply(lambda x:(json.loads(x)["misses"] if "misses" in json.loads(x).keys() else -999))
        _["num_correct_"] = 1
        _ = _.groupby("game_session").sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["misses"])

        return _.loc[:, ["game_session", "num_correct_", "misses", "accuracy_"]]
    
    
    # Assessment evaluation-Bird Measurer (Assessment)
    def bird_assessment(self):
        _ = self.df.query("title=='Bird Measurer (Assessment)' and event_id=='17113b36'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
        _["num_correct_"]=0
        _["num_incorrect_"]=0
        _.loc[_.correct==True, "num_correct_"] = 1
        _.loc[_.correct==False, "num_incorrect_"] = 1
        _ = _.groupby(["installation_id", "game_session"]).sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
        _["accuracy_group_"] = _["num_incorrect_"].apply(lambda x : 3 if x==0 else (2 if x==1 else 1))*_["num_correct_"]

        return _.loc[:, ["installation_id", "game_session", "num_correct_", "num_incorrect_", "accuracy_", "accuracy_group_"]]
    
    def bird_assessment_2(self):
        _ = self.df.query("title=='Bird Measurer (Assessment)' and event_id=='f6947f54'")
        _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
        _["misses"] = _.event_data.apply(lambda x:(json.loads(x)["misses"] if "misses" in json.loads(x).keys() else -999))
        _["num_correct_"] = 1
        _ = _.groupby("game_session").sum().reset_index()
        _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["misses"])

        return _.loc[:, ["game_session", "num_correct_", "misses", "accuracy_"]]

In [None]:
_ = df.query("type=='Assessment'")
pd.unique(_.event_code)
_.loc[:, ["event_code", "event_id", "info", "title"]].drop_duplicates(["event_code", "event_id", "info", "title"])\
.sort_values("event_code").reset_index(drop=True).groupby(["event_code"]).size()

In [None]:
temp_title = _.loc[:, ["event_code", "event_id", "info", "title"]].drop_duplicates(["event_code", "event_id", "info", "title"])
temp = pd.DataFrame(_.loc[:, ["event_code", "event_id", "info", "title"]].drop_duplicates(["event_code", "event_id", "info", "title"])\
                    .sort_values("event_code").reset_index(drop=True).groupby(["event_code", "info"]).size()).reset_index()

In [None]:
temp.merge(temp_title)

모든 assessment는 같은 event_code를 공유 그 안에서 세부 내역이 달라짐(몇몇 예외의 경우 존재)

### 2.1 Cart Balancer
CRYSTALCAVES  
카트의 균형을 맞추는 과제  
Each event_code have only one event_id

In [None]:
temp.merge(temp_title).query("title=='Cart Balancer (Assessment)'")

event_code: 2020 / event_id: 65a38bf7  
라운드 시작 이벤트는 라운드 시작시 플레이어가 광산 카트의 균형을 맞추라는 메시지가 표시 될 때 트리거됩니다. 경기당 한 라운드 만 있습니다. 이 이벤트는 라운드의 게임 특성 (예 : 리소스, 목표, 설정)에 대한 정보를 제공합니다. 라운드에서 소요 된 시간 (속도 및 정확도), 라운드 해결 시도, 플레이어가 방문한 라운드 수 (노출) 등을 계산하는 데 사용됩니다.

In [None]:
json.loads(specs.query("event_id=='65a38bf7'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='65a38bf7'").reset_index(drop=True)["event_data"][0])

In [None]:
json.loads(df.query("event_id=='65a38bf7'").reset_index(drop=True)["event_data"][4000])

event_code: 2030 / event_id: b74258a0  
플레이어가 카트를 성공적으로 균형을 잡고 솔루션을 제출하여 라운드를 마치면 비트 라운드 이벤트가 트리거됩니다. 이 이벤트는 한 라운드에서 소요 된 시간 (속도 및 정확도), 라운드 해결 시도 및 플레이어가 완료 한 라운드 수 (완료)를 계산하는 데 사용됩니다.  

* duration은 game_time과 다름  
* 각 수레에 담긴 보석의 갯수

In [None]:
json.loads(specs.query("event_id=='b74258a0'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='b74258a0'").reset_index(drop=True)["event_data"][0])

In [None]:
json.loads(df.query("event_id=='b74258a0'").reset_index(drop=True)["event_data"][1298])

event_code: 3010 / event_id: 795e4a37  
시스템이 시작한 명령 이벤트는 게임이 플레이어에게 명령을 전달할 때 발생합니다. 명령 내용을 설명하는 정보가 들어 있습니다. 이 이벤트는 이벤트 3020 및 3021과 다릅니다. 플레이어 동작에 대한 응답으로 제공되지 않은 명령을 캡처하기 때문입니다. 이러한 이벤트는 지침의 효과를 결정하는 데 사용됩니다. "명령어를 받지 않은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.  

description에 세가지 경우가 존재  
identifier는 세가지 경우 존재  
media_type은 오로지 audio  
total_duration은 세가지 경우 존재(6970, 2250, 3000)

In [None]:
json.loads(specs.query("event_id=='795e4a37'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='795e4a37'").reset_index(drop=True)["event_data"][0])

In [None]:
json.loads(df.query("event_id=='795e4a37'").reset_index(drop=True)["event_data"][3])

In [None]:
desc = df.query("event_id=='795e4a37'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["description"]))
iden = df.query("event_id=='795e4a37'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["identifier"]))
medi = df.query("event_id=='795e4a37'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["media_type"]))
dura = df.query("event_id=='795e4a37'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["total_duration"]))
pd.unique(desc), pd.unique(iden), pd.unique(medi), pd.unique(dura)

event_code: 3020 / event_id: 5de79a6a  
시스템이 시작한 피드백 (잘못된) 이벤트는 게임이 잘못된 라운드 시도에 대한 응답으로 플레이어에게 피드백을 전달하기 시작할 때 발생합니다 (올바르지 않은 응답으로 이동 버튼 누름). 명령 내용을 설명하는 정보가 들어 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "피드백 X를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.  

description은 두가지 경우가 존재  
identifier는 두가지 경우 존재  
total_duration은 두가지 경우 존재(3490, 3000)

In [None]:
json.loads(specs.query("event_id=='5de79a6a'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='5de79a6a'").reset_index(drop=True)["event_data"][0])

In [None]:
desc = df.query("event_id=='5de79a6a'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["description"]))
iden = df.query("event_id=='5de79a6a'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["identifier"]))
medi = df.query("event_id=='5de79a6a'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["media_type"]))
dura = df.query("event_id=='5de79a6a'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["total_duration"]))
pd.unique(desc), pd.unique(iden), pd.unique(medi), pd.unique(dura)

In [None]:
np.unique(dura)

event_code: 3021 / event_id: a8876db3  
시스템이 시작한 피드백 (올바른) 이벤트는 올바른 라운드 시도 (정답으로 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하기 시작할 때 발생합니다. 여기에는 명령어의 내용을 설명하는 정보가 포함되어 있으며 비트 라운드 이벤트와 관련하여 발생할 수 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "피드백 X를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.  



description은 한가지 경우가 존재  
identifier는 한가지 경우 존재  
total_duration은 한가지 경우 존재

In [None]:
json.loads(specs.query("event_id=='a8876db3'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='a8876db3'").reset_index(drop=True)["event_data"][0])

In [None]:
desc = df.query("event_id=='a8876db3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["description"]))
iden = df.query("event_id=='a8876db3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["identifier"]))
medi = df.query("event_id=='a8876db3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["media_type"]))
dura = df.query("event_id=='a8876db3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["total_duration"]))
pd.unique(desc), pd.unique(iden), pd.unique(medi), pd.unique(dura)

event_code: 3110 / event_id: 828e68f9  
시스템이 시작한 명령 이벤트의 끝은 게임이 플레이어에게 명령을 전달한 후에 발생합니다. 기간을 포함하여 명령의 내용을 설명하는 정보가 들어 있습니다. 이 이벤트는 지침의 효과 및 사용 시간을 결정하는 데 사용됩니다. "게임이 지시를 내리는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.  

description은 세가지 경우가 존재  
identifier는 세가지 경우 존재  
total_duration 없음

In [None]:
json.loads(specs.query("event_id=='828e68f9'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='828e68f9'").reset_index(drop=True)["event_data"][0])

In [None]:
desc = df.query("event_id=='828e68f9'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["description"]))
iden = df.query("event_id=='828e68f9'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["identifier"]))
medi = df.query("event_id=='828e68f9'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["media_type"]))
dura = df.query("event_id=='828e68f9'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(desc), pd.unique(iden), pd.unique(medi)

In [None]:
np.unique(dura)

In [None]:
plt.figure(figsize=(20, 10))
plt.hist(dura[dura<20000], bins=100)
plt.show()

event_code: 3120 / event_id: 31973d56  
시스템이 시작한 피드백의 끝 (잘못된) 이벤트는 잘못된 라운드 시도 (잘못된 대답을 하고 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하는 것을 마치면 발생합니다. 명령 내용을 설명하는 정보가 들어 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "게임이 피드백을 제시하는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

description은 두가지 경우가 존재  
identifier는 두가지 경우 존재  
total_duration 없음

In [None]:
json.loads(specs.query("event_id=='31973d56'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='31973d56'").reset_index(drop=True)["event_data"][0])

In [None]:
desc = df.query("event_id=='31973d56'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["description"]))
iden = df.query("event_id=='31973d56'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["identifier"]))
medi = df.query("event_id=='31973d56'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["media_type"]))
dura = df.query("event_id=='31973d56'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(desc), pd.unique(iden), pd.unique(medi)

In [None]:
plt.figure(figsize=(20, 10))
plt.hist(dura[dura<5000], bins=100)
plt.show()

event_code: 3121 / event_id: ecaab346  
시스템이 시작한 피드백의 끝 (정정) 이벤트는 올바른 라운드 시도 (정답으로 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하는 것을 마치면 발생합니다. 여기에는 명령의 지속 시간과 내용을 설명하는 정보가 포함되며 비트 라운드 이벤트와 함께 발생할 수 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "게임이 피드백을 제시하는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

description은 한가지 경우가 존재  
identifier는 한가지 경우 존재  
total_duration 없음

In [None]:
json.loads(specs.query("event_id=='ecaab346'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='ecaab346'").reset_index(drop=True)["event_data"][0])

In [None]:
desc = df.query("event_id=='ecaab346'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["description"]))
iden = df.query("event_id=='ecaab346'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["identifier"]))
medi = df.query("event_id=='ecaab346'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["media_type"]))
dura = df.query("event_id=='ecaab346'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(desc), pd.unique(iden), pd.unique(medi)

In [None]:
plt.figure(figsize=(20, 10))
plt.hist(dura[dura<10000], bins=100)
plt.show()

event_code: 4020 / event_id: 5c2f29ca  
이 이벤트는 플레이어가 광산 카트에 크리스탈을 놓을 때 발생합니다. 배치 된 결정과 배치가 발생한 위치에 대한 정보가 포함되어 있습니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* coordinates가 존재하는데 어느 위치에 놓았는지 알 수 있는 좌표값, 추가적으로 스테이지의 넓이와 높이를 알 수있다.  
x좌표의 경우 왼쪽 오른쪽 하나씩 분포가 존재, y좌표의 경우 하나의 중심만 존재  
* side는 이 이벤트에 어디 방향으로 크리스탈을 놓았는지  
* duration은 크리스탈을 드레그해서 얼마나 긴 시간동안 끌고왔는지
* source는 어디에 있는 크리스탈을 끌고왔는지



In [None]:
json.loads(specs.query("event_id=='5c2f29ca'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='5c2f29ca'").reset_index(drop=True)["event_data"][0])

In [None]:
coor = df.query("event_id=='5c2f29ca'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["coordinates"]))
side = df.query("event_id=='5c2f29ca'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["side"]))
sour = df.query("event_id=='5c2f29ca'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["source"]))
dura = df.query("event_id=='5c2f29ca'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(side), pd.unique(sour), pd.unique(dura)

In [None]:
pd.unique(coor.apply(lambda x : x["stage_width"])), \
pd.unique(coor.apply(lambda x : x["stage_height"]))

In [None]:
a = coor.apply(lambda x : x["stage_width"])
b = coor.apply(lambda x : x["stage_height"])
c = zip(a, b)
set(c)

In [None]:
plt.figure(figsize=(20, 7))
plt.subplot(1, 3, 1)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 2)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 3)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.show()

In [None]:
plt.figure(figsize=(15, 7))
plt.subplot(1, 2, 1)
plt.hist(coor.apply(lambda x : x["x"]))
plt.subplot(1, 2, 2)
plt.hist(coor.apply(lambda x : x["y"]))
plt.show()

event_code: 4030 / event_id: 5e109ec3  
이 이벤트는 플레이어가 결정을 클릭하여 선택하거나 결정을 끌기 시작할 때 발생합니다. 여기에는 픽업 된 상자 및 상자 위치에 대한 정보가 포함됩니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.  

* coordinates 존재  
x, y좌표가 4020과 다른 분포를 보임


In [None]:
json.loads(specs.query("event_id=='5e109ec3'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='5e109ec3'").reset_index(drop=True)["event_data"][1])

In [None]:
coor = df.query("event_id=='5e109ec3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["coordinates"]))
# side = df.query("event_id=='5e109ec3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["side"]))
sour = df.query("event_id=='5e109ec3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["source"]))
# dura = df.query("event_id=='5e109ec3'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(sour)

In [None]:
pd.unique(coor.apply(lambda x : x["stage_width"])), \
pd.unique(coor.apply(lambda x : x["stage_height"]))

In [None]:
a = coor.apply(lambda x : x["stage_width"])
b = coor.apply(lambda x : x["stage_height"])
c = zip(a, b)
set(c)

In [None]:
plt.figure(figsize=(20, 7))
plt.subplot(1, 3, 1)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 2)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 3)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.show()

In [None]:
plt.figure(figsize=(15, 7))
plt.subplot(1, 2, 1)
plt.hist(coor.apply(lambda x : x["x"]))
plt.subplot(1, 2, 2)
plt.hist(coor.apply(lambda x : x["y"]))
plt.show()

event_code: 4035 / event_id: 3d63345e  
이 이벤트는 플레이어가 자원에서 광산 카트 이외의 장소로 크리스탈을 끌 때 발생합니다. 이동중인 상자와 목적지에 대한 정보가 들어 있습니다. 드래그가 해제되고 크리스탈이 놓이면 이벤트가 발생합니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.  

* coordinates 존재
* duration 존재


In [None]:
json.loads(specs.query("event_id=='3d63345e'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='3d63345e'").reset_index(drop=True)["event_data"][1])

In [None]:
coor = df.query("event_id=='3d63345e'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["coordinates"]))
# side = df.query("event_id=='3d63345e'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["side"]))
sour = df.query("event_id=='3d63345e'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["source"]))
dura = df.query("event_id=='3d63345e'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(sour), pd.unique(dura)

In [None]:
pd.unique(coor.apply(lambda x : x["stage_width"])), \
pd.unique(coor.apply(lambda x : x["stage_height"]))

In [None]:
a = coor.apply(lambda x : x["stage_width"])
b = coor.apply(lambda x : x["stage_height"])
c = zip(a, b)
set(c)

In [None]:
plt.figure(figsize=(20, 7))
plt.subplot(1, 3, 1)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 2)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 3)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.show()

In [None]:
plt.figure(figsize=(15, 7))
plt.subplot(1, 2, 1)
plt.hist(coor.apply(lambda x : x["x"]))
plt.subplot(1, 2, 2)
plt.hist(coor.apply(lambda x : x["y"]))
plt.show()

In [None]:
plt.figure(figsize=(20, 10))
plt.hist(dura[dura<5000], bins=100)
plt.show()

event_code: 4040 / event_id: 9d4e7b25  
이 이벤트는 플레이어가 크리스탈을 카트에서 자원(resource) 영역으로 끌 때 발생합니다. 이동중인 크리스탈과 대상에 대한 정보가 들어 있습니다. 드래그가 해제되고 크리스탈이 놓이면 이벤트가 발생합니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.  

* cordinates 존재


In [None]:
json.loads(specs.query("event_id=='9d4e7b25'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='9d4e7b25'").reset_index(drop=True)["event_data"][1])

In [None]:
coor = df.query("event_id=='9d4e7b25'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["coordinates"]))
sour = df.query("event_id=='9d4e7b25'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["source"]))
dura = df.query("event_id=='9d4e7b25'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
pd.unique(sour), pd.unique(dura)

In [None]:
pd.unique(coor.apply(lambda x : x["stage_width"])), \
pd.unique(coor.apply(lambda x : x["stage_height"]))

In [None]:
a = coor.apply(lambda x : x["stage_width"])
b = coor.apply(lambda x : x["stage_height"])
c = zip(a, b)
set(c)

In [None]:
plt.figure(figsize=(20, 7))
plt.subplot(1, 3, 1)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 2)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 3)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.show()

In [None]:
plt.figure(figsize=(15, 7))
plt.subplot(1, 2, 1)
plt.hist(coor.apply(lambda x : x["x"]))
plt.subplot(1, 2, 2)
plt.hist(coor.apply(lambda x : x["y"]))
plt.show()

In [None]:
plt.figure(figsize=(20, 10))
plt.hist(dura[dura<5000], bins=100)
plt.show()

event_code: 4070 / event_id: acf5c23f  
이 이벤트는 플레이어가 다른 곳에서 다루지 않은 것을 클릭 할 때 발생합니다. 게임에서주의가 산만 해 보이는지 (플레이어가해야 할 일이지만하지 말아야 할 것)가 있는지 판단하거나, 기계적인 어려움이있는 선수를 진단하는 데 유용합니다 (미스 근처).  

* cordinates 존재


In [None]:
json.loads(specs.query("event_id=='acf5c23f'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='acf5c23f'").reset_index(drop=True)["event_data"][1])

In [None]:
coor = df.query("event_id=='acf5c23f'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["coordinates"]))
# sour = df.query("event_id=='acf5c23f'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["source"]))
# dura = df.query("event_id=='acf5c23f'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["duration"]))
# pd.unique(sour), pd.unique(dura)

In [None]:
pd.unique(coor.apply(lambda x : x["stage_width"])), \
pd.unique(coor.apply(lambda x : x["stage_height"]))

In [None]:
a = coor.apply(lambda x : x["stage_width"])
b = coor.apply(lambda x : x["stage_height"])
c = zip(a, b)
set(c)

In [None]:
plt.figure(figsize=(20, 7))
plt.subplot(1, 3, 1)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==748 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 2)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1015 and x["stage_height"]==762 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.subplot(1, 3, 3)
x_cor = coor.apply(lambda x : x["x"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
y_cor = coor.apply(lambda x : x["y"] if x["stage_width"]==1267 and x["stage_height"]==800 else None)
plt.scatter(x=x_cor, y=y_cor)

plt.show()

In [None]:
df.query("event_id=='acf5c23f'").reset_index(drop=True).accuracy_group

In [None]:
plt.figure(figsize=(15, 7))
plt.subplot(1, 2, 1)
plt.hist(coor.apply(lambda x : x["x"]))
plt.subplot(1, 2, 2)
plt.hist(coor.apply(lambda x : x["y"]))
plt.show()

In [None]:
plt.figure(figsize=(15, 15))
plt.scatter(x=coor.apply(lambda x : x["x"]), y=coor.apply(lambda x : x["y"]))
plt.show()

event_code: 4080 / event_id: ecc6157f  
이 이벤트는 플레이어가 대화 형 개체 위로 마우스를 가져갈 때 발생합니다. 마우스 아래에있는 개체 및 호버 기간에 대한 정보가 들어 있습니다. 이 이벤트는 계획과 같은 것들을 진단하고 (타일을 사용하기 전에 타일 위에 마우스를 오랫동안 놓았는지) 플레이어가 중요하다고 생각하는 객체를 결정하는 데 사용될 수 있습니다.  

* dwelltime 이 존재
* 12번 밖에 안나옴

In [None]:
json.loads(specs.query("event_id=='ecc6157f'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='ecc6157f'").reset_index(drop=True)["event_data"][1])

In [None]:
dwell = df.query("event_id=='ecc6157f'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["dwell_time"]))
obj = df.query("event_id=='ecc6157f'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["object"]))
np.unique(dwell, return_counts=True), pd.unique(obj)

In [None]:
len(df.query("event_id=='ecc6157f'"))

event_code: 4090 / event_id: 4e5fc6f5  
이 이벤트는 플레이어가 힌트를 제공하는 캐릭터를 클릭 할 때 발생합니다 (죄송합니다, 이름을 모르겠습니다). 플레이어가 도움을 요청했을 때의 게임 상태에 대한 정보가 들어 있습니다. 이 이벤트는 일반적으로 3010 (시스템 시작 명령어) 이벤트가 뒤 따릅니다. 플레이어가 너무 어렵다고 생각하는 포인트를 식별하는 데 도움이됩니다.  

* 

In [None]:
json.loads(specs.query("event_id=='4e5fc6f5'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='4e5fc6f5'").reset_index(drop=True)["event_data"][0])

In [None]:
df.query("game_session=='f20ba87c8f78fffd'").iloc[:, :-3]

event_code: 4100 / event_id: d122731b  
이 이벤트는 완료 단추의 플레이어가 솔루션을 제출할 때 발생합니다. 카트에 넣은 결정에 대한 정보와 작업의 정확성이 포함되어 있습니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.  

* 

In [None]:
json.loads(specs.query("event_id=='d122731b'").reset_index(drop=True)["args"][0])

In [None]:
json.loads(df.query("event_id=='d122731b'").reset_index(drop=True)["event_data"][0])

In [None]:
cor = df.query("event_id=='d122731b'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["correct"]))
# obj = df.query("event_id=='d122731b'").reset_index(drop=True)["event_data"].apply((lambda x: json.loads(x)["object"]))
np.unique(cor, return_counts=True)

---

In [None]:
_ = df.query("type=='Assessment' and title=='Cart Balancer (Assessment)'")
pd.unique(_.title)

In [None]:
pd.unique(_.event_id), pd.unique(_.event_code)

In [None]:
_ = df.query("type=='Assessment'")

In [None]:
_

In [None]:
_.loc[:, ["event_code", "event_id", "info", "title"]].drop_duplicates(["event_code", "event_id", "info", "title"]).sort_values("event_code").reset_index(drop=True)

In [None]:
# for i in pd.unique(_.event_id):
#     pprint.pprint([i, list(specs.query("event_id==@i")["info"])], width=150, indent=0, depth=2)

In [None]:
_.loc[:, ["event_code", "event_id"]].drop_duplicates(["event_code", "event_id"]).sort_values("event_code").reset_index(drop=True)

In [None]:
specs.query("event_id=='7ad3efc6'")

In [None]:
specs.query("info=='The start game event is triggered at the very beginning of the level (after the game finishes loading, don\\'t wait for intro movie to finish). This is used to compute things like time spent in game.'")

**Description**
* 7ad3efc6  
The start game event is triggered at the very beginning of the level (after the game finishes loading, don't wait for intro movie to finish). This is used to compute things like time spent in game.

* 65a38bf7 
The start round event is triggered at the start of a round when the player is prompted to balance the mine carts. There is only one round per play through. This event provides information about the game characteristics of the round (i.e. resources, objectives, setup). It is used in calculating things like time spent in a round (for speed and accuracy), attempts at solving a round, and the number of rounds the player has visited (exposures).

* 795e4a37  
The system-initiated instruction event occurs when the game delivers instructions to the player. It contains information that describes the content of the instruction. This event differs from events 3020 and 3021 as it captures instructions that are not given in response to player action. These events are used to determine the effectiveness of the instructions. We can answer questions like, "did players who received instruction X do better than those who did not?

* 828e68f9  
The end of system-initiated instruction event occurs when the game finishes delivering instructions to the player. It contains information that describes the content of the instruction including duration. These events are used to determine the effectiveness of the instructions and the amount of time they consume. We can answer questions like, "how much time elapsed while the game was presenting instruction?"

* 5e109ec3  
This event occurs when the player picks up a crystal by clicking on it, or begins dragging a crystal. It contains information about the chest that was picked up and the position of the chest. This event is used to calculate accuracy and to diagnose player strategies and understanding.

* 5c2f29ca  
This event occurs when the player places a crystal in a mine cart. It contains information about the crystal that was placed and where the placement occurred. This event is used to calculate accuracy and to diagnose player strategies and understanding.

* acf5c23f  
This event occurs when the player clicks on something that isn’t covered elsewhere. It can be useful in determining if there are attractive distractions (things the player think should do something, but don’t) in the game, or diagnosing players who are having mechanical difficulties (near misses).

* 9d4e7b25  
This event occurs when the player drags a crystal from the cart to the resource area. It contains information about the crystal being moved and the destination. The event should occur when the drag is released and the crystal is placed. These events are used to diagnose player strategies and understanding.

* d122731b  
This event occurs when the player on the done button to submit a solution. It contains information about the crystals placed in the carts and the correctness of the action. This event is used to calculate accuracy and to diagnose player strategies and understanding.

* a8876db3  
The system-initiated feedback (Correct) event occurs when the game starts delivering feedback to the player in response to a correct round attempt (pressing the go button with the correct answer). It contains information that describes the content of the instruction, and will likely occur in conjunction with a beat round event. These events are used to determine the effectiveness of the feedback. We can answer questions like, "did players who received feedback X do better than those who did not?"

* ecaab346  
The end of system-initiated feedback (Correct) event occurs when the game finishes delivering feedback to the player in response to a correct round attempt (pressing the go button with the correct answer). It contains information that describes the duration and content of the instruction, and will likely occur in conjunction with a beat round event. These events are used to determine the effectiveness of the feedback. We can answer questions like, "how much time elapsed while the game was presenting feedback?"

* b74258a0  
The beat round event is triggered when the player finishes a round by successfully balancing the carts and submitting the solution. This event is used for calculating time spent in a round (for speed and accuracy), attempts at solving a round, and the number of rounds the player has completed (completion).

* b2e5b0f1  
The exit game event is triggered when the game is quit. This is used to compute things like time spent in game. Depending on platform this may / may not be possible. NOTE: “quit” also means navigating away from game.

* 3d63345e  
This event occurs when the player drags a crystal from the resources to someplace other than the mine carts. It contains information about the chest being moved and the destination. The event should occur when the drag is released and the crystal is placed. These events are used to diagnose player strategies and understanding.

* 4e5fc6f5  
This event occurs when the player clicks on the character that provides a hint (Sorry, I don't know his name). It contains information about the state of the game when the player chooses to seek help. This event is usually followed by a 3010 (system-initiated instruction) event. It helps identify points that players feel are too difficult.

* 5de79a6a  
The system-initiated feedback (Incorrect) event occurs when the game starts delivering feedback to the player in response to an incorrect round attempt (pressing the go button with the incorrect answer). It contains information that describes the content of the instruction. These events are used to determine the effectiveness of the feedback. We can answer questions like, "did players who received feedback X do better than those who did not?"

* 31973d56  
The end of system-initiated feedback (Incorrect) event occurs when the game finishes delivering feedback to the player in response to an incorrect round attempt (pressing the go button with the incorrect answer). It contains information that describes the content of the instruction. These events are used to determine the effectiveness of the feedback. We can answer questions like, "how much time elapsed while the game was presenting feedback?"

* ecc6157f  
This event occurs when the player hovers the mouse over an interactive object. It contains information about the object under the mouse, and the duration of the hover. This event can be used to diagnose things like planning (are they hovering the mouse over tiles for long periods before they use those tiles), and determine which objects the player thinks are important.

**Description**
* 7ad3efc6  
게임 시작 이벤트는 레벨의 맨 처음에 시작됩니다(게임 로딩이 완료된 후 인트로 영화가 끝날 때까지 기다리지 마십시오). 이 id는 게임에서 보낸 시간과 같은 것들을 계산하는 데 사용됩니다.

* 65a38bf7  
라운드 시작 이벤트는 라운드 시작시 플레이어가 광산 카트의 균형을 맞추라는 메시지가 표시 될 때 트리거됩니다. 경기당 한 라운드 만 있습니다. 이 이벤트는 라운드의 게임 특성 (예 : 리소스, 목표, 설정)에 대한 정보를 제공합니다. 라운드에서 소요 된 시간 (속도 및 정확도), 라운드 해결 시도, 플레이어가 방문한 라운드 수(노출) 등을 계산하는 데 사용됩니다.

* 795e4a37  
시스템이 시작한(system-initiated) 명령 이벤트는 게임이 플레이어에게 명령을 전달할 때 발생합니다. 명령 내용을 설명하는 정보가 들어 있습니다. 이 이벤트는 이벤트 코드 3020 및 3021과 다릅니다. 플레이어 동작에 대한 응답으로 제공되지 않은 명령을 캡처하기 때문입니다. 이러한 이벤트는 지침의 효과를 결정하는 데 사용됩니다. "X 명령을받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?와 같은 질문에 대답 할 수 있습니다. 

* 828e68f9  
시스템이 시작한(system-initiated) 명령 이벤트의 끝은 게임이 플레이어에게 명령을 전달한 후에 발생합니다. 기간을 포함하여 명령의 내용을 설명하는 정보가 들어 있습니다. 이 이벤트는 지침의 효과 및 사용 시간을 결정하는 데 사용됩니다. "게임이 지시를 내리는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

* 5e109ec3  
이 이벤트는 플레이어가 결정을 클릭하여 선택하거나 결정을 끌기 시작할 때 발생합니다. 여기에는 픽업 된 상자 및 상자 위치에 대한 정보가 포함됩니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 5c2f29ca  
이 이벤트는 플레이어가 광산 카트에 크리스탈을 놓을 때 발생합니다. 배치 된 결정과 배치가 발생한 위치에 대한 정보가 포함되어 있습니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* acf5c23f  
이 이벤트는 플레이어가 다른 곳에서 다루지 않은 것을 클릭 할 때 발생합니다. 게임에서주의가 산만 해 보이는지 (플레이어가해야 할 일이지만하지 말아야 할 것)가 있는지 판단하거나, 기계적인 어려움을 겪고있는 선수를 진단하는 데 유용 할 수 있습니다 (미스 근처).

* 9d4e7b25  
이 이벤트는 플레이어가 수정을 카트에서 자원 영역으로 끌 때 발생합니다. 이동중인 크리스탈과 대상에 대한 정보가 들어 있습니다. 드래그가 해제되고 크리스탈이 놓이면 이벤트가 발생합니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* d122731b  
이 이벤트는 플레이어가 솔루션을 제출할 때 발생합니다. 카트에 넣은 결정에 대한 정보와 작업의 정확성이 포함되어 있습니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* a8876db3  
시스템이 시작한 피드백 (올바른) 이벤트는 올바른 라운드 시도 (정답을 가지고 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하기 시작할 때 발생합니다. 여기에는 명령어의 내용을 설명하는 정보가 포함되어 있으며 비트 라운드 이벤트와 관련하여 발생할 수 있습니다.(It contains information that describes the content of the instruction, and will likely occur in conjunction with a beat round event.) 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "피드백 X를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.

* ecaab346  
시스템이 시작한 피드백의 끝 (정정) 이벤트는 올바른 라운드 시도 (정답을 가지고 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하는 것을 마치면 발생합니다. 여기에는 명령의 지속 시간과 내용을 설명하는 정보가 포함되며 비트 라운드 이벤트와 함께 발생할 수 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "게임이 피드백을 제시하는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

* b74258a0  
플레이어가 카트를 성공적으로 균형을 잡고 솔루션을 제출하여 라운드를 마치면 비트 라운드(beat round) 이벤트가 트리거됩니다. 이 이벤트는 한 라운드에서 소요 된 시간 (속도 및 정확도), 라운드 해결 시도 및 플레이어가 완료 한 라운드 수 (완료)를 계산하는 데 사용됩니다.

* b2e5b0f1  
게임 종료시 게임 종료이벤트가 트리거 됩니다. 게임에서 보낸 시간과 같은 것들을 계산하는 데 사용됩니다. 플랫폼에 따라 가능하지 않을 수도 있습니다. 참고 :“quit”은 게임에서 벗어나는 것을 의미합니다.

* 3d63345e  
이 이벤트는 플레이어가 자원에서 광산 카트 이외의 장소로 크리스탈을 끌 때 발생합니다. 이동중인 상자와 대상에 대한 정보가 들어 있습니다. 드래그가 해제되고 크리스탈이 놓이면 이벤트가 발생합니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 4e5fc6f5  
이 이벤트는 플레이어가 힌트를 제공하는 캐릭터를 클릭 할 때 발생합니다 (죄송합니다, 이름을 모르겠습니다)[???]. 플레이어가 도움을 요청했을 때의 게임 상태에 대한 정보가 들어 있습니다. 이 이벤트는 일반적으로 3010 (시스템 시작 명령어) 이벤트가 뒤 따릅니다. 플레이어가 너무 어렵다고 생각하는 포인트를 식별하는 데 도움이됩니다.

* 5de79a6a  
시스템이 시작한(system-initiated) 피드백 (잘못된) 이벤트는 게임이 잘못된 라운드 시도에 대한 응답으로 플레이어에게 피드백을 전달하기 시작할 때 발생합니다 (올바르지 않은 응답을 가지고 이동 버튼 누름). 명령 내용을 설명하는 정보가 들어 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "피드백 X를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.

* 31973d56  
시스템이 시작한 피드백의 끝 (잘못된) 이벤트는 잘못된 라운드 시도 (올바르지않은 응답을 가지고 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하는 것을 마치면 발생합니다. 명령 내용을 설명하는 정보가 들어 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "게임이 피드백을 제시하는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

* ecc6157f  
이 이벤트는 플레이어가 대화 형 개체 위로 마우스를 가져갈 때 발생합니다. 마우스 아래에있는 개체 및 호버 기간에 대한 정보가 들어 있습니다. 이 이벤트는 계획과 같은 것들을 진단하고 (타일을 사용하기 전에 타일 위에 마우스를 오랫동안 놓았는지) 플레이어가 중요하다고 생각하는 객체를 결정하는 데 사용될 수 있습니다.

In [None]:
# Assessment evaluation-Cart Balancer (Assessment)
_ = accuracy(df).cart_assessment()
_

In [None]:
temp = label.merge(_, on=["game_session"])

In [None]:
len(temp), sum(temp["accuracy_group"] != temp["accuracy_group_"])

In [None]:
temp[temp["accuracy_group"] != temp["accuracy_group_"]]

### 2.2 Chest Sorter
Each event_code have only one event_id

In [None]:
temp.merge(temp_title).query("title=='Chest Sorter (Assessment)'")

In [None]:
_ = df.query("type=='Assessment' and title=='Chest Sorter (Assessment)'")
pd.unique(_.title)

In [None]:
pd.unique(_.event_id), pd.unique(_.event_code)

In [None]:
# for i in pd.unique(_.event_id):
#     pprint.pprint([i, list(specs.query("event_id==@i")["info"])], width=150, indent=0, depth=2)

In [None]:
_.loc[:, ["event_code", "event_id"]].drop_duplicates(["event_code", "event_id"]).sort_values("event_code").reset_index(drop=True)

**Description**
* 5b49460a  
The start game event is triggered at the very beginning of the level (after the game finishes loading, don't wait for intro movie to finish). This is used to compute things like time spent in game.

* 155f62a4  
The start round event is triggered at the start of a round when the player is prompted to weigh and arrange the chests. There is only one round per playthrough. This event provides information about the game characteristics of the round (i.e. resources, objectives, setup). It is used in calculating things like time spent in a round (for speed and accuracy), attempts at solving a round, and the number of rounds the player has visited (exposures).

* 3dcdda7f  
The system-initiated instruction event occurs when the game delivers instructions to the player. It contains information that describes the content of the instruction. This event differs from events 3020 and 3021 as it captures instructions that are not given in response to player action. These events are used to determine the effectiveness of the instructions. We can answer questions like, "did players who received instruction X do better than those who did not?"

* 3ccd3f02  
The end of system-initiated instruction event occurs when the game finishes delivering instructions to the player. It contains information that describes the content of the instruction including duration. These events are used to determine the effectiveness of the instructions and the amount of time they consume. We can answer questions like, "how much time elapsed while the game was presenting instruction?"

* bd612267  
This event occurs when the player clicks on something that isn’t covered elsewhere. It can be useful in determining if there are attractive distractions (things the player think should do something, but don’t) in the game, or diagnosing players who are having mechanical difficulties (near misses).

* a8efe47b  
This event occurs when the player picks up a chest by clicking on it, or begins dragging a chest. It contains information about the chest that was picked up and the position of the chest. This event is used to calculate accuracy and to diagnose player strategies and understanding.

* 562cec5f  
This event occurs when the player places a chest on one the scale. It contains information about the chest that was placed and where the placement occurred. This event is used to diagnose player strategies and understanding.

* 3d0b9317  
This event occurs when the player drags a chest to the resource area. It contains information about the chest being moved. The event should occur when the drag is released and the chest is placed. These events are used to diagnose player strategies and understanding.

* 9ce586dd  
This event occurs when the player drags a chest to someplace other than an acceptable destination for the chest. It contains information about the chest being moved and the destination. The event should occur when the drag is released and the chest is placed. These events are used to diagnose player strategies and understanding.

* 93b353f2  
This event occurs when the player on the done button to submit a solution. It contains information about the chests placed on the pillars and the correctness of the action. This event is used to calculate accuracy and to diagnose player strategies and understanding.

* ea296733  
The system-initiated feedback (Incorrect) event occurs when the game starts delivering feedback to the player in response to an incorrect round attempt (pressing the go button with the incorrect answer). It contains information that describes the content of the instruction. These events are used to determine the effectiveness of the feedback. We can answer questions like, "did players who received feedback X do better than those who did not?"

* df4fe8b6  
The end of system-initiated feedback (Incorrect) event occurs when the game finishes delivering feedback to the player in response to an incorrect round attempt (pressing the go button with the incorrect answer). It contains information that describes the content of the instruction. These events are used to determine the effectiveness of the feedback. We can answer questions like, "how much time elapsed while the game was presenting feedback?"

* 0db6d71d  
This event occurs when the player places a chest on one of the three pillars. It contains information about the chest that was placed, the correctness of the action, and where the placement occurred. This event is used to calculate accuracy and to diagnose player strategies and understanding.

* 3afb49e6  
The system-initiated feedback (Correct) event occurs when the game starts delivering feedback to the player in response to a correct round attempt (pressing the go button with the correct answer). It contains information that describes the content of the instruction, and will likely occur in conjunction with a beat round event. These events are used to determine the effectiveness of the feedback. We can answer questions like, "did players who received feedback X do better than those who did not?"

* e4f1efe6  
The end of system-initiated feedback (Correct) event occurs when the game finishes delivering feedback to the player in response to a correct round attempt (pressing the go button with the correct answer). It contains information that describes the duration and content of the instruction, and will likely occur in conjunction with a beat round event. These events are used to determine the effectiveness of the feedback. We can answer questions like, "how much time elapsed while the game was presenting feedback?"

* 38074c54  
The finished round event is triggered when the player finishes drawing a shape that is detected as matching the prompt. This event is used for calculating time spent drawing a shape (for speed and accuracy), attempts at drawing a shape, and the number of shapes the player has completed (completion).

* 222660ff  
The exit game event is triggered when the game is quit. This is used to compute things like time spent in game. Depending on platform this may / may not be possible. NOTE: “quit” also means navigating away from game.

* cb1178ad  
This event occurs when the player clicks on the character that provides a hint (Sorry, I don't know his name). It contains information about the state of the game when the player chooses to seek help. This event is usually followed by a 3010 (system-initiated instruction) event. It helps identify points that players feel are too difficult.

* bfc77bd6  
This event occurs when the player hovers the mouse over an interactive object. It contains information about the object under the mouse, and the duration of the hover. This event can be used to diagnose things like planning (are they hovering the mouse over tiles for long periods before they use those tiles), and determine which objects the player thinks are important.

**Description**
* 5b49460a  
게임 시작 이벤트는 레벨의 맨 처음에 시작됩니다 (게임 로딩이 완료된 후 인트로 영화가 끝날 때까지 기다리지 마십시오). 게임에서 보낸 시간과 같은 것들을 계산하는 데 사용됩니다.

* 155f62a4  
라운드 시작 이벤트는 라운드 시작시 플레이어에게 상자 무게를 달고 정렬하라는 메시지가 표시 될 때 트리거됩니다. 플레이 당 한 라운드 만 있습니다. 이 이벤트는 라운드의 게임 특성 (예 : 리소스, 목표, 설정)에 대한 정보를 제공합니다. 라운드에서 소요 된 시간 (속도 및 정확도), 라운드 해결 시도, 플레이어가 방문한 라운드 수 (노출) 등을 계산하는 데 사용됩니다.

* 3dcdda7f  
The system-initiated instruction event occurs when the game delivers instructions to the player. It contains information that describes the content of the instruction. This event differs from events 3020 and 3021 as it captures instructions that are not given in response to player action. These events are used to determine the effectiveness of the instructions. We can answer questions like, "did players who received instruction X do better than those who did not?"
시스템이 시작한 명령 이벤트는 게임이 플레이어에게 명령을 전달할 때 발생합니다. 명령 내용을 설명하는 정보가 들어 있습니다. 이 이벤트는 이벤트 3020 및 3021과 다릅니다. 플레이어 동작에 대한 응답으로 제공되지 않은 명령을 캡처하기 때문입니다. 이러한 이벤트는 지침의 효과를 결정하는 데 사용됩니다. "X 명령어를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.

* 3ccd3f02  
The end of system-initiated instruction event occurs when the game finishes delivering instructions to the player. It contains information that describes the content of the instruction including duration. These events are used to determine the effectiveness of the instructions and the amount of time they consume. We can answer questions like, "how much time elapsed while the game was presenting instruction?"
시스템이 시작한 명령 이벤트의 끝은 게임이 플레이어에게 명령을 전달한 후에 발생합니다. 기간을 포함하여 명령의 내용을 설명하는 정보가 들어 있습니다. 이 이벤트는 지침의 효과 및 사용 시간을 결정하는 데 사용됩니다. "게임이 지시를 내리는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

* bd612267  
This event occurs when the player clicks on something that isn’t covered elsewhere. It can be useful in determining if there are attractive distractions (things the player think should do something, but don’t) in the game, or diagnosing players who are having mechanical difficulties (near misses
이 이벤트는 플레이어가 다른 곳에서 다루지 않은 것을 클릭 할 때 발생합니다. 게임에서주의가 산만 해 보이는지 (플레이어가해야 할 일이지만하지 말아야 할 것)가 있는지 판단하거나, 기계적인 어려움이있는 선수를 진단하는 데 유용합니다 (미스 근처).

* a8efe47b  
This event occurs when the player picks up a chest by clicking on it, or begins dragging a chest. It contains information about the chest that was picked up and the position of the chest. This event is used to calculate accuracy and to diagnose player strategies and understanding.
이 이벤트는 플레이어가 상자를 클릭하여 상자를 집거나 상자를 끌기 시작할 때 발생합니다. 여기에는 픽업 된 가슴 및 가슴 위치에 대한 정보가 포함됩니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 562cec5f  
This event occurs when the player places a chest on one the scale. It contains information about the chest that was placed and where the placement occurred. This event is used to diagnose player strategies and understanding.
이 이벤트는 플레이어가 가슴에 가슴을 둘 때 발생합니다. 배치 된 가슴 및 배치 위치에 대한 정보가 포함되어 있습니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 3d0b9317  
This event occurs when the player drags a chest to the resource area. It contains information about the chest being moved. The event should occur when the drag is released and the chest is placed. These events are used to diagnose player strategies and understanding.
이 이벤트는 플레이어가 상자를 자원 영역으로 끌 때 발생합니다. 이동중인 가슴에 대한 정보가 들어 있습니다. 드래그가 해제되고 가슴이 놓이면 이벤트가 발생합니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 9ce586dd  
This event occurs when the player drags a chest to someplace other than an acceptable destination for the chest. It contains information about the chest being moved and the destination. The event should occur when the drag is released and the chest is placed. These events are used to diagnose player strategies and understanding.
이 이벤트는 플레이어가 상자를 상자의 대상이 아닌 다른 곳으로 끌 때 발생합니다. 이동중인 가슴과 대상에 대한 정보가 들어 있습니다. 드래그가 해제되고 가슴이 놓이면 이벤트가 발생합니다. 이 이벤트는 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 93b353f2  
This event occurs when the player on the done button to submit a solution. It contains information about the chests placed on the pillars and the correctness of the action. This event is used to calculate accuracy and to diagnose player strategies and understanding.
이 이벤트는 완료 단추의 플레이어가 솔루션을 제출할 때 발생합니다. 기둥에 놓인 가슴과 행동의 정확성에 대한 정보가 들어 있습니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* ea296733  
The system-initiated feedback (Incorrect) event occurs when the game starts delivering feedback to the player in response to an incorrect round attempt (pressing the go button with the incorrect answer). It contains information that describes the content of the instruction. These events are used to determine the effectiveness of the feedback. We can answer questions like, "did players who received feedback X do better than those who did not?"
시스템이 시작한 피드백 (잘못된) 이벤트는 게임이 잘못된 라운드 시도에 대한 응답으로 플레이어에게 피드백을 전달하기 시작할 때 발생합니다 (올바르지 않은 응답으로 이동 버튼 누름). 명령 내용을 설명하는 정보가 들어 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "피드백 X를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.

* df4fe8b6  
The end of system-initiated feedback (Incorrect) event occurs when the game finishes delivering feedback to the player in response to an incorrect round attempt (pressing the go button with the incorrect answer). It contains information that describes the content of the instruction. These events are used to determine the effectiveness of the feedback. We can answer questions like, "how much time elapsed while the game was presenting feedback?"
시스템이 시작한 피드백의 끝 (잘못된) 이벤트는 잘못된 라운드 시도 (응답이없는 상태에서 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하는 것을 마치면 발생합니다. 명령 내용을 설명하는 정보가 들어 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "게임이 피드백을 제시하는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

* 0db6d71d  
This event occurs when the player places a chest on one of the three pillars. It contains information about the chest that was placed, the correctness of the action, and where the placement occurred. This event is used to calculate accuracy and to diagnose player strategies and understanding.
이 이벤트는 플레이어가 세 기둥 중 하나에 가슴을 놓을 때 발생합니다. 배치 된 가슴, 조치의 정확성 및 배치가 발생한 위치에 대한 정보가 들어 있습니다. 이 이벤트는 정확도를 계산하고 플레이어 전략과 이해를 진단하는 데 사용됩니다.

* 3afb49e6  
The system-initiated feedback (Correct) event occurs when the game starts delivering feedback to the player in response to a correct round attempt (pressing the go button with the correct answer). It contains information that describes the content of the instruction, and will likely occur in conjunction with a beat round event. These events are used to determine the effectiveness of the feedback. We can answer questions like, "did players who received feedback X do better than those who did not?"
시스템이 시작한 피드백 (올바른) 이벤트는 올바른 라운드 시도 (정답으로 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하기 시작할 때 발생합니다. 여기에는 명령어의 내용을 설명하는 정보가 포함되어 있으며 비트 라운드 이벤트와 관련하여 발생할 수 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "피드백 X를받은 플레이어가 그렇지 않은 플레이어보다 더 나은가요?"와 같은 질문에 대답 할 수 있습니다.

* e4f1efe6  
The end of system-initiated feedback (Correct) event occurs when the game finishes delivering feedback to the player in response to a correct round attempt (pressing the go button with the correct answer). It contains information that describes the duration and content of the instruction, and will likely occur in conjunction with a beat round event. These events are used to determine the effectiveness of the feedback. We can answer questions like, "how much time elapsed while the game was presenting feedback?"
시스템이 시작한 피드백의 끝 (정정) 이벤트는 올바른 라운드 시도 (정답으로 이동 버튼을 누름)에 대한 응답으로 게임이 플레이어에게 피드백을 전달하는 것을 마치면 발생합니다. 여기에는 명령의 지속 시간과 내용을 설명하는 정보가 포함되며 비트 라운드 이벤트와 함께 발생할 수 있습니다. 이러한 이벤트는 피드백의 효과를 결정하는 데 사용됩니다. "게임이 피드백을 제시하는 동안 얼마나 많은 시간이 걸렸습니까?"와 같은 질문에 대답 할 수 있습니다.

* 38074c54  
The finished round event is triggered when the player finishes drawing a shape that is detected as matching the prompt. This event is used for calculating time spent drawing a shape (for speed and accuracy), attempts at drawing a shape, and the number of shapes the player has completed (completion).
완료된 라운드 이벤트는 플레이어가 프롬프트와 일치하는 것으로 감지 된 도형 그리기를 완료하면 트리거됩니다. 이 이벤트는 도형을 그리는 데 소요 된 시간 (속도 및 정확도), 도형을 그리기위한 시도 및 플레이어가 완료 한 도형 수 (완료)를 계산하는 데 사용됩니다.

* 222660ff  
The exit game event is triggered when the game is quit. This is used to compute things like time spent in game. Depending on platform this may / may not be possible. NOTE: “quit” also means navigating away from game.
게임 종료시 게임이 종료됩니다. 게임에서 보낸 시간과 같은 것들을 계산하는 데 사용됩니다. 플랫폼에 따라 가능하지 않을 수도 있습니다. 참고 :“quit”은 게임에서 벗어나는 것을 의미합니다.

* cb1178ad  
This event occurs when the player clicks on the character that provides a hint (Sorry, I don't know his name). It contains information about the state of the game when the player chooses to seek help. This event is usually followed by a 3010 (system-initiated instruction) event. It helps identify points that players feel are too difficult.
이 이벤트는 플레이어가 힌트를 제공하는 캐릭터를 클릭 할 때 발생합니다 (죄송합니다, 이름을 모르겠습니다). 플레이어가 도움을 요청했을 때의 게임 상태에 대한 정보가 들어 있습니다. 이 이벤트는 일반적으로 3010 (시스템 시작 명령어) 이벤트가 뒤 따릅니다. 플레이어가 너무 어렵다고 생각하는 포인트를 식별하는 데 도움이됩니다.

* bfc77bd6  
This event occurs when the player hovers the mouse over an interactive object. It contains information about the object under the mouse, and the duration of the hover. This event can be used to diagnose things like planning (are they hovering the mouse over tiles for long periods before they use those tiles), and determine which objects the player thinks are important.
이 이벤트는 플레이어가 대화 형 개체 위로 마우스를 가져갈 때 발생합니다. 마우스 아래에있는 개체 및 호버 기간에 대한 정보가 들어 있습니다. 이 이벤트는 계획과 같은 것들을 진단하고 (타일을 사용하기 전에 타일 위에 마우스를 오랫동안 놓았는지) 플레이어가 중요하다고 생각하는 객체를 결정하는 데 사용될 수 있습니다.

In [None]:
# Assessment evaluation-Chest Sorter (Assessment)
_ = accuracy(df).chest_assessment()
_

In [None]:
plt.hist(temp.accuracy_)

In [None]:
plt.hist(temp.accuracy)

In [None]:
temp = label.merge(_, on=["game_session"])

In [None]:
len(temp), sum(temp["accuracy_group"] != temp["accuracy_group_"])

In [None]:
temp[temp["accuracy_group"] != temp["accuracy_group_"]]

---

In [None]:
# Assessment evaluation-Cauldron Filler (Assessment)
def cauldron_assessment(df):
    _ = df.query("title=='Cauldron Filler (Assessment)' and event_id=='392e14df'")
    _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
    _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
    _["num_correct_"]=0
    _["num_incorrect_"]=0
    _.loc[_.correct==True, "num_correct_"] = 1
    _.loc[_.correct==False, "num_incorrect_"] = 1
    _ = _.groupby("game_session").sum().reset_index()
    _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
    
    return _

In [None]:
_ = cauldron_assessment(df)
temp = label.merge(_, on=["game_session"])

In [None]:
len(temp), sum(temp["accuracy"] != temp["accuracy_"])

In [None]:
temp[temp["accuracy"] != temp["accuracy_"]]

In [None]:
# Assessment evaluation-Mushroom Sorter (Assessment)
def mushroom_assessment(df):
    _ = df.query("title=='Mushroom Sorter (Assessment)' and event_id=='25fa8af4'")
    _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
    _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
    _["num_correct_"]=0
    _["num_incorrect_"]=0
    _.loc[_.correct==True, "num_correct_"] = 1
    _.loc[_.correct==False, "num_incorrect_"] = 1
    _ = _.groupby("game_session").sum().reset_index()
    _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
    
    return _

In [None]:
_ = mushroom_assessment(df)
temp = label.merge(_, on=["game_session"])

In [None]:
len(temp), sum(temp["accuracy"] != temp["accuracy_"])

In [None]:
temp[temp["accuracy"] != temp["accuracy_"]]

In [None]:
# Assessment evaluation-Bird Measurer (Assessment)
def bird_assessment(df):
    _ = df.query("title=='Bird Measurer (Assessment)' and event_id=='17113b36'")
    _ = _.loc[:, ["game_session", "installation_id", "event_data"]]
    _["correct"] = _.event_data.apply(lambda x:(json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))
    _["num_correct_"]=0
    _["num_incorrect_"]=0
    _.loc[_.correct==True, "num_correct_"] = 1
    _.loc[_.correct==False, "num_incorrect_"] = 1
    _ = _.groupby("game_session").sum().reset_index()
    _["accuracy_"] = _["num_correct_"]/(_["num_correct_"]+_["num_incorrect_"])
    
    return _

In [None]:
_ = bird_assessment(df)
temp = label.merge(_, on=["game_session"])

In [None]:
len(temp), sum(temp["accuracy"] != temp["accuracy_"])

In [None]:
temp[temp["accuracy"] != temp["accuracy_"]]

In [None]:
sns.distplot(label.accuracy)
plt.show()

In [None]:
_ = cart_assessment(df)
_ = _.append(chest_assessment(df))
_ = _.append(cauldron_assessment(df))
_ = _.append(mushroom_assessment(df))
_ = _.append(bird_assessment(df))

### Cart Balancer (Assessment)
In event_data, crystals seems to be important.  
crystals is composed of a type of json  
event_id a8876db3 and ecaab346 are important too.(what is diffrent between a8876db3 and ecaab346? These are id when session is over)  
828e68f9 and 795e4a37(These are id when player submit wrong assessment.)

저울의 균형을 맞추는 문제

In [None]:
title_select = "Cart Balancer (Assessment)"
_ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
_ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data", "event_code"]]
_["crystals"] = _.event_data.apply(lambda x: (json.loads(x)["crystals"] if "crystals" in json.loads(x).keys() else -999))
_["description"] = _.event_data.apply(lambda x: (json.loads(x)["description"] if "description" in json.loads(x).keys() else -999))
_["correct"] = _.event_data.apply(lambda x: (json.loads(x)["correct"] if "correct" in json.loads(x).keys() else -999))

In [None]:
# _ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
# _ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]
# # _["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
# _["crystals"] = _.event_data.apply(lambda x: (json.loads(x)["crystals"] if "crystals" in json.loads(x).keys() else -999))

# # bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
# bins_levels = len(np.unique(_.groupby("game_session").crystals.max()))

# plt.figure(figsize=(25, 7))
# # sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").crystals.max(), bins=bins_levels, label="levels")
# plt.legend()
# plt.title(title_select)

# plt.show()

### Chest Sorter (Assessment)

In [None]:
title_select = "Chest Sorter (Assessment)"
_ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Cauldron Filler (Assessment)

In [None]:
title_select = "Cauldron Filler (Assessment)"
_ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Mushroom Sorter (Assessment)

In [None]:
title_select = "Mushroom Sorter (Assessment)"
_ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Bird Measurer (Assessment)

In [None]:
title_select = "Bird Measurer (Assessment)"
_ = df.query("type=='Assessment' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:

# _["rounds"] = _.event_data.apply(lambda x: json.loads(x)["round"])
# _["levels"] = _.event_data.apply(lambda x: (json.loads(x)["level"] if "level" in json.loads(x).keys() else -999))

# bins_rounds = len(np.unique(_.groupby("game_session").rounds.max()))
# bins_levels = len(np.unique(_.groupby("game_session").levels.max()))

# plt.figure(figsize=(25, 7))
# plt.subplot(1, 2, 1)
# sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
# plt.legend()
# plt.title(title_select)
# plt.subplot(1, 2, 2)
# sns.distplot(_.groupby("game_session").rounds.max(), bins=bins_rounds, label="rounds")
# sns.distplot(_.groupby("game_session").levels.max(), bins=bins_levels, label="levels")
# plt.legend()
# plt.title(title_select)

# plt.show()

In [None]:
# 하나의 game_session에는 하나의 title
_ = df.groupby("game_session").title.unique()
_ = _.reset_index().groupby("game_session").size()
__ = _.reset_index().rename(columns={0:"counts"})
__[__.counts!=1]

In [None]:
df.query("game_session=='000050630c4b081b'")

In [None]:
df.head()

## 3. Type==Clip

In [None]:
_ = df.query("type=='Clip'")

In [None]:
pd.unique(_.title)

In [None]:
_ = df.query("type=='Clip'")
for i in pd.unique(_.title):
    _ = df.query("type=='Clip' and title==@i").reset_index(drop=True)
    _ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]
    for j in pd.unique(_.event_id):
        print(i, j, json.loads(_.query("event_id==@j").reset_index(drop=True).loc[0, "event_data"]).keys())

## 4. Type==Activity

In [None]:
_ = df.query("type=='Activity'")
pd.unique(_.title)

### Sandcastle Builder (Activity)

In [None]:
title_select = "Sandcastle Builder (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
# _.query("game_session=='905b19967a1974d7'")

### Watering Hole (Activity)

In [None]:
title_select = "Watering Hole (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Bottle Filler (Activity)

In [None]:
title_select = "Bottle Filler (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Chicken Balancer (Activity)

In [None]:
title_select = "Chicken Balancer (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Fireworks (Activity)

In [None]:
title_select = "Fireworks (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Flower Waterer (Activity)

In [None]:
title_select = "Flower Waterer (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Egg Dropper (Activity)

In [None]:
title_select = "Egg Dropper (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

### Bug Measurer (Activity)

In [None]:
title_select = "Bug Measurer (Activity)"
_ = df.query("type=='Activity' and title==@title_select").reset_index(drop=True)
_ = _.loc[:, ["installation_id", "game_session", "event_id", "event_data"]]

In [None]:
for i in pd.unique(_.event_id):
    print(i, json.loads(_.query("event_id==@i").reset_index(drop=True).loc[0, "event_data"]).keys())

In [None]:
# accuracy = _.query("((event_code==2000) or (event_code==4100 and title!='Bird Measurer (Assessment)') or \
#                      (event_code==4110 and title=='Bird Measurer (Assessment)')) and (type=='Assessment')").reset_index(drop=True)

# accuracy["event_data_json"] = accuracy["event_data"].apply(lambda x: json.loads(x))

# accuracy["num_incorrect"] = accuracy["event_data_json"].apply(lambda x: (0 if x["correct"] else 1) if "correct" in x  else 0)
# accuracy["num_correct"] = accuracy["event_data_json"].apply(lambda x: (1 if x["correct"] else 0)  if "correct" in x  else 0)

# accuracy = accuracy.groupby(["installation_id", "game_session"]).agg(num_correct_pred = ("num_correct", "max"), num_incorrect_pred = ("num_incorrect", "sum"), ).reset_index()
# accuracy["accuracy_group_pred"] = accuracy["num_incorrect_pred"].apply(lambda x: 3 if x == 0 else (2 if x == 1 else 1)) * accuracy["num_correct_pred"]

# accuracy = accuracy.groupby(["installation_id"]).last().reset_index()
# accuracy.drop("game_session", axis=1, inplace=True)

---
The end of notebook