### Cloned Hidden Markov Model

##### Структура проекта:

`chmm/
    configs/
        --hmm_default.yaml
        --hmm_runner.yaml
        --mpg_default.yaml
    mylib/
        --__init__.py
        --chmm.py
        --mpg.py
        --hmm_runner.py
`

`chmm.py` --- содержит класс `CHMM` в котором нужно дописать методы, чтобы выполнить задание

`mpg.py` --- генератор последовательностей символов, соответствующих марковскому процессу, представленному на рисунке. Ноды данной сети представляют собой скрытые состояния процесса, стрелочки --- возможные переходы между ними. Цифры около стрелок указывают вероятность перехода, а буквы --- генерируемые символы в результате данного перехода. Таким образом, данный марковский процесс задаёт некоторую грамматику.

![mpg](assets/mpg.png)

Примеры возможных последовательностей:

* BTXSE
* BPTTTTVVE
* BTSSSXXVVE

и так далее.

`hmm_runner.py` --- запускает обучение `CHMM` на последовательностях, сгенерированных в ходе марковского процесса. Здача модели --- научиться минимизировать неожиданность входных наблюдений. В ходе обучения вычисляются метрики качества: неожиданность ($-\log P(o)$), расстояние Кульбака-Лейблера и строится сглаженный портрет предсказываемых распределений в каждом состоянии марковского процесса.  


#### Задание:

1. Прочитать [статью](http://arxiv.org/abs/1905.00507).
2. Установить пакеты из `requirements.txt`
3. Реализовать _CHMM_, дописав методы в `chmm.py`. Можно написать свой класс, главное, чтобы были методы и атрибуты, используемые в `hmm_runner.py`, который запускает тестирование модели. Самостоятельно реализовать онлайн вариант алгоритма Баума-Вельша (Baum-Welch), описанный в статье из пункта 1.
4. Из библиотеки [hmmlearn](https://hmmlearn.readthedocs.io/en/latest/) запустить готовую реализацию `HMM` для этой же задачи и сравнить с реализацией `CHMM`, полученной во втором пункте.

__Замечания__

_Результатом работы должен быть код в `chmm.py` и логи из [`wandb`](https://wandb.ai/site) проекта._ 

_Логгинг в `wandb` уже реализован, нужно только определить `WANDB_ENTITY` переменную в окружении, в которую нужно записать имя аккаунта в `wandb`._

_Задачу можно решать и в свободной форме (без использования `hmm_runner.py`), главное, чтобы были понятные графики обучения и полученных распределений._

In [None]:
import wandb
import yaml
import os

from mylib.hmm_runner import HMMRunner

In [None]:
os.environ['WANDB_ENTITY'] = 'your_login'

In [None]:
config_path = 'configs/hmm_runner.yaml'

In [None]:
# load configs

config = dict()

with open(config_path, 'r') as file:
    config['run'] = yaml.load(file, Loader=yaml.Loader)

with open(config['run']['hmm_conf'], 'r') as file:
    config['hmm'] = yaml.load(file, Loader=yaml.Loader)

with open(config['run']['mpg_conf'], 'r') as file:
    config['mpg'] = yaml.load(file, Loader=yaml.Loader)


if config['run']['log']:
    logger = wandb.init(
        project=config['run']['project_name'], entity=os.environ['WANDB_ENTITY'],
        config=config
    )
else:
    logger = None

In [None]:
config

In [None]:
runner = HMMRunner(logger, config)
runner.run()