deeppavlov/configs/spelling_correction/levenshtein_corrector_ru.json

{
  "chainer":{
    "in": ["x"],
    "pipe": [
      {
        "class_name": "str_lower",
        "id": "lower",
        "in": ["x"],
        "out": ["x_lower"]
      },
      {
        "class_name": "nltk_moses_tokenizer",
        "id": "tokenizer",
        "in": ["x_lower"],
        "out": ["x_tokens"]
      },
      {
        "id": "vocab",
        "class_name": "simple_vocab",
        "save_path": "{DOWNLOADS_PATH}/vocabs/russian_words_vocab.dict",
        "load_path": "{DOWNLOADS_PATH}/vocabs/russian_words_vocab.dict"
      },
      {
        "in": ["x_tokens"],
        "out": ["tokens_candidates"],
        "class_name": "deeppavlov.models.spelling_correction.levenshtein.searcher_component:LevenshteinSearcherComponent",
        "words": "#vocab.keys()"
      },
      {
        "class_name": "deeppavlov.models.spelling_correction.electors.kenlm_elector:KenlmElector",
        "in": ["tokens_candidates"],
        "out": ["y_predicted_tokens"],
        "load_path": "{DOWNLOADS_PATH}/language_models/ru_wiyalen_no_punkt.arpa.binary"
      },
      {
        "ref": "tokenizer",
        "in": ["y_predicted_tokens"],
        "out": ["y_predicted"]
      }
    ],
    "out": ["y_predicted"]
  },
  "metadata": {
    "variables": {
      "ROOT_PATH": "~/.deeppavlov",
      "DOWNLOADS_PATH": "{ROOT_PATH}/downloads",
      "MODELS_PATH": "{ROOT_PATH}/models"
    },
    "requirements": [
      "{DEEPPAVLOV_PATH}/requirements/spelling.txt"
    ],
    "labels": {
      "telegram_utils": "ErrorModel",
      "server_utils": "ErrorModel"
    },
    "download": [
      {
        "url": "http://files.deeppavlov.ai/deeppavlov_data/vocabs/russian_words_vocab.dict.gz",
        "subdir": "{DOWNLOADS_PATH}/vocabs"
      },
      {
        "url": "http://files.deeppavlov.ai/lang_models/ru_wiyalen_no_punkt.arpa.binary.gz",
        "subdir": "{DOWNLOADS_PATH}/language_models"
      }
    ]
  }
}