# Оптимизация гиперпараметров

Для оптимизации гиперпараметров вместо `pykeen.pipeline.pipeline` можно использовать `pykeen.hpo.hpo_pipeline`. Как и в случае `pipeline` нужно указать модель и датасет + добавить параметр `n_trials` (или `timeout`)

`hpo_pipeline` умеет настраивать параметры для `*_kwargs` из `pipeline`.

In [1]:
from pykeen.hpo import hpo_pipeline

По умолчанию все параметры моделей соответствуют тем, которые заявлены в авторских статьях (если явно не указано иное). Если в статьях не были заявлены параметры, авторы PyKEEN подбирали их сами. 

Существует следующий приоритет действий по поводу того, что будет предпринято для поиска гиперпараметров: заданное значение > стратегия поиска гиперпараметров > стратегия поиска гиперпараметров по умолчанию > стратегия по умолчанию

HPO стратегия представляет собой словарь. В нем обязательно должен быть ключ `type` в одним из значений: `"categorical"`, `bool`, `int`, `float`. 

Для переопределения стратегии какого-то из параметров, мы в `hpo_pipeline` передаем аргумент `*_kwargs_ranges` со значением в виде словаря, где ключ - это имя параметра, а значение - HPO стратегия

## Параметры стратегий:

- categorical
    - type = 'categorical'
    - choices

- boolean
    - type = bool

- int, float
    - type = int / float
    - low
    - high
    - scale = "linear" / "power" 
        - base, если используем "power"
    - log = True / False
    - step


In [2]:
hpo_pipeline_result = hpo_pipeline(
    dataset='Nations',
    model='TransE',
    model_kwargs_ranges=dict(
        embedding_dim=dict(type=int, low=16, high=256, step=32),
    ),
    timeout=15
)

[32m[I 2021-10-08 20:36:23,596][0m A new study created in memory with name: no-name-d6650370-251d-4d6c-a2e1-85347e28dba2[0m
No random seed is specified. Setting to 2809158345.
Training epochs on cuda: 100%|██████████| 1000/1000 [04:22<00:00,  3.80epoch/s, loss=0.00143, prev_loss=0.00145]
INFO:pykeen.evaluation.evaluator:Starting batch_size search for evaluation now...
INFO:pykeen.evaluation.evaluator:Concluded batch_size search with batch_size=199.
Evaluating on cuda: 100%|██████████| 199/199 [00:00<00:00, 9.95ktriple/s]
INFO:pykeen.evaluation.evaluator:Evaluation took 0.02s seconds
[32m[I 2021-10-08 20:40:49,345][0m Trial 0 finished with value: 0.39284563325813726 and parameters: {'model.embedding_dim': 144, 'model.scoring_fct_norm': 1, 'loss.margin': 2, 'loss.margin_activation': 'relu', 'optimizer.lr': 0.03687296136499884, 'negative_sampler.num_negs_per_pos': 69, 'training.num_epochs': 1000, 'training.batch_size': 932}. Best is trial 0 with value: 0.39284563325813726.[0m
