deeppavlov/configs/squad/multi_squad_noans.json

{
  "dataset_reader": {
    "class_name": "squad_dataset_reader",
    "dataset": "MultiSQuAD",
    "data_path": "{DOWNLOADS_PATH}/multi_squad/"
  },
  "dataset_iterator": {
    "class_name": "multi_squad_iterator",
    "seed": 1337,
    "shuffle": true,
    "with_answer_rate": 0.666
  },
  "chainer": {
    "in": ["context_raw", "question_raw"],
    "in_y": ["ans_raw", "ans_raw_start"],
    "pipe": [
      {
        "class_name": "squad_preprocessor",
        "id": "squad_prepr",
        "context_limit": 400,
        "question_limit": 150,
        "char_limit": 16,
        "in": ["context_raw", "question_raw"],
        "out": ["context", "context_tokens", "context_chars",
                "c_r2p", "c_p2r", "question",
                "question_tokens", "question_chars", "spans"]
      },
      {
        "class_name": "squad_ans_preprocessor",
        "id": "squad_ans_prepr",
        "in": ["ans_raw", "ans_raw_start", "c_r2p", "spans"],
        "out": ["ans", "ans_start", "ans_end"]
      },
      {
        "class_name": "squad_vocab_embedder",
        "id": "vocab_embedder",
        "level": "token",
        "emb_folder": "{DOWNLOADS_PATH}/embeddings/",
        "emb_url": "http://files.deeppavlov.ai/embeddings/wiki-news-300d-1M.vec",
        "save_path": "{MODELS_PATH}/multi_squad_model_noans/emb/vocab_embedder.pckl",
        "load_path": "{MODELS_PATH}/multi_squad_model_noans/emb/vocab_embedder.pckl",
        "context_limit": "#squad_prepr.context_limit",
        "question_limit": "#squad_prepr.question_limit",
        "char_limit": "#squad_prepr.char_limit",
        "fit_on": ["context_tokens", "question_tokens"],
        "in": ["context_tokens", "question_tokens"],
        "out": ["context_tokens_idxs", "question_tokens_idxs"]
      },
      {
        "class_name": "squad_vocab_embedder",
        "id": "char_vocab_embedder",
        "level": "char",
        "emb_folder": "{DOWNLOADS_PATH}/embeddings/",
        "emb_url": "http://files.deeppavlov.ai/embeddings/wiki-news-300d-1M-char.vec",
        "save_path": "{MODELS_PATH}/multi_squad_model_noans/emb/char_vocab_embedder.pckl",
        "load_path": "{MODELS_PATH}/multi_squad_model_noans/emb/char_vocab_embedder.pckl",
        "context_limit": "#squad_prepr.context_limit",
        "question_limit": "#squad_prepr.question_limit",
        "char_limit": "#squad_prepr.char_limit",
        "fit_on": ["context_chars", "question_chars"],
        "in": ["context_chars", "question_chars"],
        "out": ["context_chars_idxs", "question_chars_idxs"]
      },
      {
        "class_name": "squad_model",
        "id": "squad",
        "word_emb": "#vocab_embedder.emb_mat",
        "char_emb": "#char_vocab_embedder.emb_mat",
        "context_limit": "#squad_prepr.context_limit",
        "question_limit": "#squad_prepr.question_limit",
        "char_limit": "#squad_prepr.char_limit",
        "train_char_emb": true,
        "char_hidden_size": 100,
        "encoder_hidden_size": 75,
        "attention_hidden_size": 75,
        "learning_rate": 0.1,
        "min_learning_rate": 0.001,
        "learning_rate_patience": 5,
        "keep_prob": 0.7,
        "grad_clip": 5.0,
        "weight_decay": 1.0,
        "noans_token": true,
        "save_path": "{MODELS_PATH}/multi_squad_model_noans/model",
        "load_path": "{MODELS_PATH}/multi_squad_model_noans/model",
        "in": {
          "c_tokens": "context_tokens_idxs",
          "c_chars": "context_chars_idxs",
          "q_tokens": "question_tokens_idxs",
          "q_chars": "question_chars_idxs"
        },
        "in_y": {
          "y1s": "ans_start",
          "y2s": "ans_end"
        },
        "out": ["ans_start_predicted", "ans_end_predicted", "prob", "score"]
      },
      {
        "class_name": "squad_ans_postprocessor",
        "id": "squad_ans_postprepr",
        "in": ["ans_start_predicted", "ans_end_predicted", "context_raw", "c_p2r", "spans"],
        "out": ["ans_predicted", "ans_start_predicted", "ans_end_predicted"]
      }
    ],
    "out": ["ans_predicted", "ans_start_predicted", "score"]
  },
  "train": {
    "show_examples": false,
    "log_every_n_batches": 250,
    "val_every_n_epochs": 1,
    "batch_size": 64,
    "pytest_max_batches": 2,
    "validation_patience": 10,
    "metrics": [
      {
        "name": "squad_v2_f1",
        "inputs": ["ans_raw", "ans_predicted"]
      },
      {
        "name": "squad_v2_em",
        "inputs": ["ans_raw", "ans_predicted"]
      }
    ],
    "tensorboard_log_dir": "{MODELS_PATH}/multi_squad_model_noans/logs",
    "evaluation_targets": ["valid"],
    "class_name": "nn_trainer"
  },
  "metadata": {
    "variables": {
      "ROOT_PATH": "~/.deeppavlov",
      "DOWNLOADS_PATH": "{ROOT_PATH}/downloads",
      "MODELS_PATH": "{ROOT_PATH}/models"
    },
    "requirements": [
      "{DEEPPAVLOV_PATH}/requirements/tf.txt"
    ],
    "download": [
      {
        "url": "http://files.deeppavlov.ai/deeppavlov_data/multi_squad_model_noans_1.1.tar.gz",
        "subdir": "{MODELS_PATH}"
      },
      {
        "url": "http://files.deeppavlov.ai/embeddings/wiki-news-300d-1M.vec",
        "subdir": "{DOWNLOADS_PATH}/embeddings"
      },
      {
        "url": "http://files.deeppavlov.ai/embeddings/wiki-news-300d-1M-char.vec",
        "subdir": "{DOWNLOADS_PATH}/embeddings"
      }
    ]
  }
}