# Analýza dat zaznamenaných aplikací

Webová aplikace zaznamenává data do SQLite3 databáze `chatbot.db`. Základní informace o tom, jaké tabulky databáze obsahuje, si můžeme zobrazit pomocí programu pro příkazovou řádku `sqlite3`. Ten můžeme přímo z notebooku spustit tak, že před příkaz napíšeme `!`, a místo Pythonu ho zpracuje příkazová řádka:

In [None]:
# chatbot.db je cesta k souboru z databází; .schema je dotaz, který databázi
# pokládáme (jeho význam je přibližně "vypiš mi všechny tabulky v databázi")
!sqlite3 chatbot.db .schema

V databázi jsou zdá se dvě tabulky, `user` a `turn`, každá obsahuje různé sloupce, v nichž jsou zaznamenané interakce s chatbotem. Následuje pár tipů, jak tyto tabulky načíst do Pythonu pomocí knihovny `pandas` a dál s nimi pracovat.

In [None]:
import pandas as pd

In [None]:
db = "sqlite:///chatbot.db"

In [None]:
users = pd.read_sql("user", db)
users

In [None]:
users.info()

In [None]:
turns = pd.read_sql("turn", db)
turns

In [None]:
turns.info()

In [None]:
# uživatel: počet replik v rozhovoru
turns.groupby("user_id").count()["text"].to_dict()

In [None]:
# kolik vteřin po předcházející replice přichází následující?
turns["wait_before_reply"] = turns.groupby("user_id")["date"].diff().dt.total_seconds()
turns

In [None]:
# jen uživatel č. 1
turns.loc[turns["user_id"] == 1, :]

In [None]:
# stejný výsledek jako výše, jen pomocí speciálního dotazovacího jazyka,
# který někomu lépe vyhovuje
turns.query("user_id == 1")

In [None]:
# chatbot (nepřekvapivě) reaguje téměř okamžitě
turns.query("by_user == False")

In [None]:
# uživatel naopak ne nutně
turns.query("by_user == True")

In [None]:
# exportovat pro další práci v Excelu
turns.to_excel("turns.xlsx", index=False)