In [1]:
import pymongo


class MongoStorage:
    """Class for working with MongoDB"""

    db: pymongo.database.Database
    col: pymongo.collection.Collection

    def __init__(self, db: pymongo.database.Database, col: pymongo.collection.Collection):
        self.db = db
        self.col = col

    @classmethod
    def connect(cls, host: str, port=27017, db_name='wiki', col_name='articles'):
        db = pymongo.MongoClient(host, port, unicode_decode_error_handler='ignore')[db_name]
        return cls(
            db=db,
            col=db[col_name])

    def get_articles(self, count=0) -> list:
        return list(self.col.find({}).limit(count))

    def get_article(self, title) -> dict:
        doc = self.col.find_one({'title': title})
        return doc if doc else {}

    def get_articles_headings_texts(self, count=0) -> list:
        articles = self.get_articles(count)
        return [article['text']['Заголовок']['text'] for article in articles]


In [2]:
import psycopg2


class PostgresStorage:

    def __init__(self, conn):
        self.conn = conn
        self.cursor = conn.cursor()

    @staticmethod
    def connect(host, port=5432, user='postgres', password='password', dbname='habr'):
        return PostgresStorage(conn=psycopg2.connect(
            host=host, port=port, user=user, password=password, dbname=dbname)
        )

    def get_posts(self, count=0) -> list:
        if count > 0:
            self.cursor.execute('SELECT * FROM posts LIMIT %d' % count)
        else:
            self.cursor.execute('SELECT * FROM posts')
        posts = list(self.cursor.fetchall())
        return posts

    def get_posts_texts(self, count=0) -> list:
        posts_list = self.get_posts(count)
        return [post[2] for post in posts_list]


In [3]:
storage = PostgresStorage.connect(
            host='172.17.0.2')
posts = storage.get_posts_texts(1000)
posts[999]

' \n\nЭто не готовая инструкция, с большим количеством кода, а скорее описание алгоритма и результатов чего мы добились.\n\nИтак, не так давно у нас появился новый клиент. У него было несколько нетипичных для нас требований: использовать для конфигурирования серверов ansible, контент сайта хранится в git, каждый сайт находится на своей виртуальной машине. Все это не сулило ничего хорошего, так как совсем не укладывалось в стандартную схему «Клиент всегда прав!», и мы начали разрабатывать новую схему. Но обо всем по порядку. \n\nИсходные данные: есть клиент, у которого более 30 сайтов которые надо перенести на нашу площадку. Каждый сайт должен располагаться в отдельном контейнере (мы используем OpenVZ контейнеры). Используется только один внешний IP. Для конфигурирования серверов используется ansible. Для каждого сайта есть архив с конфигурационными файлами. Контент сайта находится в git. \n \nИ мы начали творить… Что у нас получилось, можно посмотреть под катом. Забегая вперед, скажу, 

In [4]:
import re


class Tokenizer:

    to_sentences = re.compile(r'(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s')
    remove_brackets = re.compile(r' \((.*?)\)')
    remove_punctuation = re.compile(r'[^a-zA-Zа-яА-Я ]')

    @classmethod
    def tokenize(cls, text: str, remove_punctuation=True, remove_brackets=True, remove_endings=True) -> list:
        buf = text.split('\n')
        buf = [item for item in buf if item]
        sentences = []
        if not remove_endings:
            for sentence in cls.to_sentences.split(' '.join(buf)):
                buf_list = [item for item in sentence.split('!') if item]
                for item in buf_list:
                    if item[-1] == '.' or item[-1] == '?':
                        sentences.append(item.lower())
                    else:
                        sentences.append(item.lower() + '!')
        else:
            sentences = [sentence[:-1].lower() for sentence in cls.to_sentences.split(' '.join(buf)) if sentence[:-1]]
        if remove_brackets:
            sentences = [cls.remove_brackets.sub('', sentence) for sentence in sentences]
        if remove_punctuation:
            return [cls.remove_punctuation.sub('', sentence) for sentence in sentences]
        return sentences


class TextProcessor:

    tokenizer = Tokenizer()

    @classmethod
    def __get_sentences_list(cls, text_list: list, remove_brackets=True, remove_endings=True) -> list:
        sentences_list = []
        for text in text_list:
            sentences_list += cls.tokenizer.tokenize(
                text=text,
                remove_brackets=remove_brackets,
                remove_endings=remove_endings)
        return sentences_list

    @classmethod
    def process_text_list(cls, text_list: list, window_size=1, remove_brackets=True, remove_endings=True) -> str:
        text = ''
        sentences_list = cls.__get_sentences_list(
            text_list=text_list,
            remove_brackets=remove_brackets,
            remove_endings=remove_endings)
        for sentence_num in range(len(sentences_list)):
            sentence = sentences_list[sentence_num]
            for i in range(window_size):
                text += (' '.join(sentence.split()[i:]) + '\n')
        return text[:-1]


In [5]:
import sys

!{sys.executable} -m pip install nltk



In [6]:
from nltk import ngrams

sentence = posts[0]

N = 3
sixgrams = ngrams(sentence, N)

%timeit [''.join(ngram) for ngram in sixgrams]

283 ns ± 46.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [7]:
from itertools import islice, tee
trigrams = zip(*(islice(seq, index, None) for index, seq in enumerate(tee(sentence, N))))
%timeit [''.join(ngram) for ngram in trigrams]

231 ns ± 37.1 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [8]:
for first, *second in ngrams([''.join(ngram) for ngram in ngrams(sentence, N)], 3):
    print(first, ' => ', second)


Уж  =>  ['Уже', 'же ']
Уже  =>  ['же ', 'е 2']
же   =>  ['е 2', ' 29']
е 2  =>  [' 29', '29 ']
 29  =>  ['29 ', '9 о']
29   =>  ['9 о', ' ок']
9 о  =>  [' ок', 'окт']
 ок  =>  ['окт', 'ктя']
окт  =>  ['ктя', 'тяб']
ктя  =>  ['тяб', 'ябр']
тяб  =>  ['ябр', 'бря']
ябр  =>  ['бря', 'ря ']
бря  =>  ['ря ', 'я в']
ря   =>  ['я в', ' в ']
я в  =>  [' в ', 'в О']
 в   =>  ['в О', ' Ол']
в О  =>  [' Ол', 'Оли']
 Ол  =>  ['Оли', 'лим']
Оли  =>  ['лим', 'имп']
лим  =>  ['имп', 'мпи']
имп  =>  ['мпи', 'пий']
мпи  =>  ['пий', 'ийс']
пий  =>  ['ийс', 'йск']
ийс  =>  ['йск', 'ско']
йск  =>  ['ско', 'ком']
ско  =>  ['ком', 'ом ']
ком  =>  ['ом ', 'м п']
ом   =>  ['м п', ' пр']
м п  =>  [' пр', 'про']
 пр  =>  ['про', 'рой']
про  =>  ['рой', 'ойд']
рой  =>  ['ойд', 'йду']
ойд  =>  ['йду', 'дут']
йду  =>  ['дут', 'ут ']
дут  =>  ['ут ', 'т б']
ут   =>  ['т б', ' бо']
т б  =>  [' бо', 'бои']
 бо  =>  ['бои', 'ои ']
бои  =>  ['ои ', 'и р']
ои   =>  ['и р', ' ро']
и р  =>  [' ро', 'роб']
 ро  =>  ['роб',

ежд  =>  ['жде', 'де ']
жде  =>  ['де ', 'е п']
де   =>  ['е п', ' пр']
е п  =>  [' пр', 'пра']
 пр  =>  ['пра', 'рав']
пра  =>  ['рав', 'ави']
рав  =>  ['ави', 'вил']
ави  =>  ['вил', 'ила']
вил  =>  ['ила', 'ла ']
ила  =>  ['ла ', 'а п']
ла   =>  ['а п', ' пр']
а п  =>  [' пр', 'про']
 пр  =>  ['про', 'рос']
про  =>  ['рос', 'ост']
рос  =>  ['ост', 'сты']
ост  =>  ['сты', 'ты:']
сты  =>  ['ты:', 'ы: ']
ты:  =>  ['ы: ', ': д']
ы:   =>  [': д', ' дв']
: д  =>  [' дв', 'дво']
 дв  =>  ['дво', 'вое']
дво  =>  ['вое', 'ое ']
вое  =>  ['ое ', 'е з']
ое   =>  ['е з', ' за']
е з  =>  [' за', 'зах']
 за  =>  ['зах', 'ахо']
зах  =>  ['ахо', 'ход']
ахо  =>  ['ход', 'одя']
ход  =>  ['одя', 'дят']
одя  =>  ['дят', 'ят ']
дят  =>  ['ят ', 'т н']
ят   =>  ['т н', ' на']
т н  =>  [' на', 'на ']
 на  =>  ['на ', 'а а']
на   =>  ['а а', ' ар']
а а  =>  [' ар', 'аре']
 ар  =>  ['аре', 'рен']
аре  =>  ['рен', 'ену']
рен  =>  ['ену', 'ну,']
ену  =>  ['ну,', 'у, ']
ну,  =>  ['у, ', ', о']
у,   =>  [', о',

er   =>  ['r —', ' — ']
r —  =>  [' — ', '— о']
 —   =>  ['— о', ' он']
— о  =>  [' он', 'они']
 он  =>  ['они', 'ни ']
они  =>  ['ни ', 'и у']
ни   =>  ['и у', ' уж']
и у  =>  [' уж', 'уже']
 уж  =>  ['уже', 'же ']
уже  =>  ['же ', 'е в']
же   =>  ['е в', ' вы']
е в  =>  [' вы', 'выс']
 вы  =>  ['выс', 'ыст']
выс  =>  ['ыст', 'сту']
ыст  =>  ['сту', 'туп']
сту  =>  ['туп', 'упи']
туп  =>  ['упи', 'пил']
упи  =>  ['пил', 'или']
пил  =>  ['или', 'ли ']
или  =>  ['ли ', 'и н']
ли   =>  ['и н', ' на']
и н  =>  [' на', 'на ']
 на  =>  ['на ', 'а ч']
на   =>  ['а ч', ' че']
а ч  =>  [' че', 'чем']
 че  =>  ['чем', 'емп']
чем  =>  ['емп', 'мпи']
емп  =>  ['мпи', 'пио']
мпи  =>  ['пио', 'ион']
пио  =>  ['ион', 'она']
ион  =>  ['она', 'нат']
она  =>  ['нат', 'ате']
нат  =>  ['ате', 'те ']
ате  =>  ['те ', 'е в']
те   =>  ['е в', ' в ']
е в  =>  [' в ', 'в А']
 в   =>  ['в А', ' Ан']
в А  =>  [' Ан', 'Анг']
 Ан  =>  ['Анг', 'нгл']
Анг  =>  ['нгл', 'гли']
нгл  =>  ['гли', 'лии']
гли  =>  ['лии',

и н  =>  [' не', 'нез']
 не  =>  ['нез', 'еза']
нез  =>  ['еза', 'зав']
еза  =>  ['зав', 'ави']
зав  =>  ['ави', 'вис']
ави  =>  ['вис', 'иси']
вис  =>  ['иси', 'сим']
иси  =>  ['сим', 'имы']
сим  =>  ['имы', 'мых']
имы  =>  ['мых', 'ых ']
мых  =>  ['ых ', 'х с']
ых   =>  ['х с', ' сп']
х с  =>  [' сп', 'спа']
 сп  =>  ['спа', 'пар']
спа  =>  ['пар', 'арр']
пар  =>  ['арр', 'рри']
арр  =>  ['рри', 'рин']
рри  =>  ['рин', 'инг']
рин  =>  ['инг', 'нга']
инг  =>  ['нга', 'гах']
нга  =>  ['гах', 'ах.']
гах  =>  ['ах.', 'х. ']
ах.  =>  ['х. ', '. \n']
х.   =>  ['. \n', ' \n\n']
. 
  =>  [' \n\n', '\n\nВ']
 

  =>  ['\n\nВ', '\nВс']


В  =>  ['\nВс', 'Все']

Вс  =>  ['Все', 'сех']
Все  =>  ['сех', 'ех,']
сех  =>  ['ех,', 'х, ']
ех,  =>  ['х, ', ', к']
х,   =>  [', к', ' ко']
, к  =>  [' ко', 'кот']
 ко  =>  ['кот', 'от ']
кот  =>  ['от ', 'т в']
от   =>  ['т в', ' вс']
т в  =>  [' вс', 'вст']
 вс  =>  ['вст', 'ста']
вст  =>  ['ста', 'тан']
ста  =>  ['тан', 'ане']
тан  =>  ['ане', 'нет']
ане 

ора  =>  ['рая', 'ая ']
рая  =>  ['ая ', 'я н']
ая   =>  ['я н', ' на']
я н  =>  [' на', 'на ']
 на  =>  ['на ', 'а с']
на   =>  ['а с', ' се']
а с  =>  [' се', 'сег']
 се  =>  ['сег', 'его']
сег  =>  ['его', 'год']
его  =>  ['год', 'одн']
год  =>  ['одн', 'дня']
одн  =>  ['дня', 'няш']
дня  =>  ['няш', 'яшн']
няш  =>  ['яшн', 'шни']
яшн  =>  ['шни', 'ний']
шни  =>  ['ний', 'ий ']
ний  =>  ['ий ', 'й м']
ий   =>  ['й м', ' мо']
й м  =>  [' мо', 'мом']
 мо  =>  ['мом', 'оме']
мом  =>  ['оме', 'мен']
оме  =>  ['мен', 'ент']
мен  =>  ['ент', 'нт ']
ент  =>  ['нт ', 'т п']
нт   =>  ['т п', ' пр']
т п  =>  [' пр', 'пре']
 пр  =>  ['пре', 'ред']
пре  =>  ['ред', 'едс']
ред  =>  ['едс', 'дст']
едс  =>  ['дст', 'ста']
дст  =>  ['ста', 'тав']
ста  =>  ['тав', 'авл']
тав  =>  ['авл', 'вля']
авл  =>  ['вля', 'ляе']
вля  =>  ['ляе', 'яет']
ляе  =>  ['яет', 'ет ']
яет  =>  ['ет ', 'т с']
ет   =>  ['т с', ' см']
т с  =>  [' см', 'сме']
 см  =>  ['сме', 'мес']
сме  =>  ['мес', 'есь']
мес  =>  ['есь',

е в  =>  [' вы', 'выш']
 вы  =>  ['выш', 'ышл']
выш  =>  ['ышл', 'шло']
ышл  =>  ['шло', 'ло.']
шло  =>  ['ло.', 'о. ']
ло.  =>  ['о. ', '. Е']
о.   =>  ['. Е', ' Ес']
. Е  =>  [' Ес', 'Ест']
 Ес  =>  ['Ест', 'сть']
Ест  =>  ['сть', 'ть ']
сть  =>  ['ть ', 'ь е']
ть   =>  ['ь е', ' ещ']
ь е  =>  [' ещ', 'ещё']
 ещ  =>  ['ещё', 'щё ']
ещё  =>  ['щё ', 'ё о']
щё   =>  ['ё о', ' ог']
ё о  =>  [' ог', 'огр']
 ог  =>  ['огр', 'гра']
огр  =>  ['гра', 'ран']
гра  =>  ['ран', 'ани']
ран  =>  ['ани', 'нич']
ани  =>  ['нич', 'иче']
нич  =>  ['иче', 'чен']
иче  =>  ['чен', 'енн']
чен  =>  ['енн', 'нны']
енн  =>  ['нны', 'ный']
нны  =>  ['ный', 'ый ']
ный  =>  ['ый ', 'й б']
ый   =>  ['й б', ' бо']
й б  =>  [' бо', 'бое']
 бо  =>  ['бое', 'оез']
бое  =>  ['оез', 'еза']
оез  =>  ['еза', 'зап']
еза  =>  ['зап', 'апа']
зап  =>  ['апа', 'пас']
апа  =>  ['пас', 'ас ']
пас  =>  ['ас ', 'с г']
ас   =>  ['с г', ' га']
с г  =>  [' га', 'газ']
 га  =>  ['газ', 'аза']
газ  =>  ['аза', 'за.']
аза  =>  ['за.',

еск  =>  ['ски', 'ких']
ски  =>  ['ких', 'их ']
ких  =>  ['их ', 'х р']
их   =>  ['х р', ' ре']
х р  =>  [' ре', 'реш']
 ре  =>  ['реш', 'еше']
реш  =>  ['еше', 'шен']
еше  =>  ['шен', 'ени']
шен  =>  ['ени', 'ний']
ени  =>  ['ний', 'ий,']
ний  =>  ['ий,', 'й, ']
ий,  =>  ['й, ', ', п']
й,   =>  [', п', ' пр']
, п  =>  [' пр', 'при']
 пр  =>  ['при', 'рив']
при  =>  ['рив', 'иво']
рив  =>  ['иво', 'вод']
иво  =>  ['вод', 'оди']
вод  =>  ['оди', 'дит']
оди  =>  ['дит', 'ит ']
дит  =>  ['ит ', 'т к']
ит   =>  ['т к', ' к ']
т к  =>  [' к ', 'к р']
 к   =>  ['к р', ' ри']
к р  =>  [' ри', 'рис']
 ри  =>  ['рис', 'иск']
рис  =>  ['иск', 'ска']
иск  =>  ['ска', 'кам']
ска  =>  ['кам', 'ам ']
кам  =>  ['ам ', 'м о']
ам   =>  ['м о', ' от']
м о  =>  [' от', 'отк']
 от  =>  ['отк', 'тка']
отк  =>  ['тка', 'каз']
тка  =>  ['каз', 'аза']
каз  =>  ['аза', 'за ']
аза  =>  ['за ', 'а п']
за   =>  ['а п', ' по']
а п  =>  [' по', 'под']
 по  =>  ['под', 'одс']
под  =>  ['одс', 'дси']
одс  =>  ['дси',

эле  =>  ['лек', 'ект']
лек  =>  ['ект', 'ктр']
ект  =>  ['ктр', 'три']
ктр  =>  ['три', 'рич']
три  =>  ['рич', 'иче']
рич  =>  ['иче', 'чес']
иче  =>  ['чес', 'еск']
чес  =>  ['еск', 'ски']
еск  =>  ['ски', 'кий']
ски  =>  ['кий', 'ий ']
кий  =>  ['ий ', 'й п']
ий   =>  ['й п', ' по']
й п  =>  [' по', 'под']
 по  =>  ['под', 'одъ']
под  =>  ['одъ', 'дъе']
одъ  =>  ['дъе', 'ъем']
дъе  =>  ['ъем', 'емн']
ъем  =>  ['емн', 'мни']
емн  =>  ['мни', 'ник']
мни  =>  ['ник', 'ик\n']
ник  =>  ['ик\n', 'к\nБ']
ик
  =>  ['к\nБ', '\nБр']
к
Б  =>  ['\nБр', 'Бро']

Бр  =>  ['Бро', 'рон']
Бро  =>  ['рон', 'оня']
рон  =>  ['оня', 'ня ']
оня  =>  ['ня ', 'я —']
ня   =>  ['я —', ' — ']
я —  =>  [' — ', '— 2']
 —   =>  ['— 2', ' 2 ']
— 2  =>  [' 2 ', '2 м']
 2   =>  ['2 м', ' мм']
2 м  =>  [' мм', 'мм ']
 мм  =>  ['мм ', 'м с']
мм   =>  ['м с', ' ст']
м с  =>  [' ст', 'ста']
 ст  =>  ['ста', 'тал']
ста  =>  ['тал', 'али']
тал  =>  ['али', 'ли\n']
али  =>  ['ли\n', 'и\nС']
ли
  =>  ['и\nС', '\nСи']
и
С  

про  =>  ['ров', 'ове']
ров  =>  ['ове', 'вед']
ове  =>  ['вед', 'еде']
вед  =>  ['еде', 'ден']
еде  =>  ['ден', 'ени']
ден  =>  ['ени', 'ния']
ени  =>  ['ния', 'ия\n']
ния  =>  ['ия\n', 'я\nТ']
ия
  =>  ['я\nТ', '\nТо']
я
Т  =>  ['\nТо', 'Топ']

То  =>  ['Топ', 'опо']
Топ  =>  ['опо', 'пор']
опо  =>  ['пор', 'ор ']
пор  =>  ['ор ', 'р о']
ор   =>  ['р о', ' ор']
р о  =>  [' ор', 'ору']
 ор  =>  ['ору', 'руж']
ору  =>  ['руж', 'ужи']
руж  =>  ['ужи', 'жия']
ужи  =>  ['жия', 'ия\n']
жия  =>  ['ия\n', 'я\nЗ']
ия
  =>  ['я\nЗ', '\nЗа']
я
З  =>  ['\nЗа', 'Защ']

За  =>  ['Защ', 'ащи']
Защ  =>  ['ащи', 'щит']
ащи  =>  ['щит', 'ита']
щит  =>  ['ита', 'та ']
ита  =>  ['та ', 'а 3']
та   =>  ['а 3', ' 3,']
а 3  =>  [' 3,', '3,2']
 3,  =>  ['3,2', ',2 ']
3,2  =>  [',2 ', '2 м']
,2   =>  ['2 м', ' мм']
2 м  =>  [' мм', 'мм ']
 мм  =>  ['мм ', 'м и']
мм   =>  ['м и', ' из']
м и  =>  [' из', 'из ']
 из  =>  ['из ', 'з з']
из   =>  ['з з', ' за']
з з  =>  [' за', 'зак']
 за  =>  ['зак', 'ака']
зак 

тра  =>  ['ран', 'ана']
ран  =>  ['ана', 'на:']
ана  =>  ['на:', 'а: ']
на:  =>  ['а: ', ': Н']
а:   =>  [': Н', ' Ни']
: Н  =>  [' Ни', 'Нид']
 Ни  =>  ['Нид', 'иде']
Нид  =>  ['иде', 'дер']
иде  =>  ['дер', 'ерл']
дер  =>  ['ерл', 'рла']
ерл  =>  ['рла', 'лан']
рла  =>  ['лан', 'анд']
лан  =>  ['анд', 'нды']
анд  =>  ['нды', 'ды\n']
нды  =>  ['ды\n', 'ы\nР']
ды
  =>  ['ы\nР', '\nРо']
ы
Р  =>  ['\nРо', 'Роб']

Ро  =>  ['Роб', 'обо']
Роб  =>  ['обо', 'бот']
обо  =>  ['бот', 'от:']
бот  =>  ['от:', 'т: ']
от:  =>  ['т: ', ': T']
т:   =>  [': T', ' TM']
: T  =>  [' TM', 'TMH']
 TM  =>  ['TMH', 'MHW']
TMH  =>  ['MHW', 'HWK']
MHW  =>  ['HWK', 'WK\n']
HWK  =>  ['WK\n', 'K\nО']
WK
  =>  ['K\nО', '\nОп']
K
О  =>  ['\nОп', 'Опы']

Оп  =>  ['Опы', 'пыт']
Опы  =>  ['пыт', 'ыт:']
пыт  =>  ['ыт:', 'т: ']
ыт:  =>  ['т: ', ': 1']
т:   =>  [': 1', ' 10']
: 1  =>  [' 10', '10 ']
 10  =>  ['10 ', '0 и']
10   =>  ['0 и', ' из']
0 и  =>  [' из', 'из ']
 из  =>  ['из ', 'з 1']
из   =>  ['з 1', ' 10']
з 1 

тан  =>  ['ан ', 'н А']
ан   =>  ['н А', ' Ал']
н А  =>  [' Ал', 'Але']
 Ал  =>  ['Але', 'лек']
Але  =>  ['лек', 'екс']
лек  =>  ['екс', 'кс ']
екс  =>  ['кс ', 'с Б']
кс   =>  ['с Б', ' Бр']
с Б  =>  [' Бр', 'Бра']
 Бр  =>  ['Бра', 'рау']
Бра  =>  ['рау', 'аун']
рау  =>  ['аун', 'ун ']
аун  =>  ['ун ', 'н и']
ун   =>  ['н и', ' и ']
н и  =>  [' и ', 'и е']
 и   =>  ['и е', ' ег']
и е  =>  [' ег', 'его']
 ег  =>  ['его', 'го ']
его  =>  ['го ', 'о р']
го   =>  ['о р', ' ро']
о р  =>  [' ро', 'род']
 ро  =>  ['род', 'оди']
род  =>  ['оди', 'дит']
оди  =>  ['дит', 'ите']
дит  =>  ['ите', 'тел']
ите  =>  ['тел', 'ели']
тел  =>  ['ели', 'ли ']
ели  =>  ['ли ', 'и В']
ли   =>  ['и В', ' Ве']
и В  =>  [' Ве', 'Вен']
 Ве  =>  ['Вен', 'енд']
Вен  =>  ['енд', 'нди']
енд  =>  ['нди', 'ди ']
нди  =>  ['ди ', 'и и']
ди   =>  ['и и', ' и ']
и и  =>  [' и ', 'и К']
 и   =>  ['и К', ' Кл']
и К  =>  [' Кл', 'Кла']
 Кл  =>  ['Кла', 'лай']
Кла  =>  ['лай', 'айв']
лай  =>  ['айв', 'йв.']
айв  =>  ['йв.',

от   =>  ['т с', ' с ']
т с  =>  [' с ', 'с 3']
 с   =>  ['с 3', ' 36']
с 3  =>  [' 36', '360']
 36  =>  ['360', '60-']
360  =>  ['60-', '0-г']
60-  =>  ['0-г', '-гр']
0-г  =>  ['-гр', 'гра']
-гр  =>  ['гра', 'рад']
гра  =>  ['рад', 'аду']
рад  =>  ['аду', 'дус']
аду  =>  ['дус', 'усн']
дус  =>  ['усн', 'сны']
усн  =>  ['сны', 'ным']
сны  =>  ['ным', 'ым ']
ным  =>  ['ым ', 'м п']
ым   =>  ['м п', ' по']
м п  =>  [' по', 'под']
 по  =>  ['под', 'одъ']
под  =>  ['одъ', 'дъе']
одъ  =>  ['дъе', 'ъем']
дъе  =>  ['ъем', 'емн']
ъем  =>  ['емн', 'мны']
емн  =>  ['мны', 'ным']
мны  =>  ['ным', 'ым ']
ным  =>  ['ым ', 'м к']
ым   =>  ['м к', ' ко']
м к  =>  [' ко', 'ков']
 ко  =>  ['ков', 'овш']
ков  =>  ['овш', 'вшо']
овш  =>  ['вшо', 'шом']
вшо  =>  ['шом', 'ом,']
шом  =>  ['ом,', 'м, ']
ом,  =>  ['м, ', ', ч']
м,   =>  [', ч', ' чт']
, ч  =>  [' чт', 'что']
 чт  =>  ['что', 'тоб']
что  =>  ['тоб', 'обы']
тоб  =>  ['обы', 'бы ']
обы  =>  ['бы ', 'ы в']
бы   =>  ['ы в', ' вы']
ы в  =>  [' вы',

лер  =>  ['ер\n', 'р\nВ']
ер
  =>  ['р\nВ', '\nВе']
р
В  =>  ['\nВе', 'Вес']

Ве  =>  ['Вес', 'ес:']
Вес  =>  ['ес:', 'с: ']
ес:  =>  ['с: ', ': 1']
с:   =>  [': 1', ' 10']
: 1  =>  [' 10', '109']
 10  =>  ['109', '09 ']
109  =>  ['09 ', '9 к']
09   =>  ['9 к', ' кг']
9 к  =>  [' кг', 'кг\n']
 кг  =>  ['кг\n', 'г\nС']
кг
  =>  ['г\nС', '\nСк']
г
С  =>  ['\nСк', 'Ско']

Ск  =>  ['Ско', 'кор']
Ско  =>  ['кор', 'оро']
кор  =>  ['оро', 'рос']
оро  =>  ['рос', 'ост']
рос  =>  ['ост', 'сть']
ост  =>  ['сть', 'ть:']
сть  =>  ['ть:', 'ь: ']
ть:  =>  ['ь: ', ': 1']
ь:   =>  [': 1', ' 16']
: 1  =>  [' 16', '16,']
 16  =>  ['16,', '6,0']
16,  =>  ['6,0', ',09']
6,0  =>  [',09', '09 ']
,09  =>  ['09 ', '9 к']
09   =>  ['9 к', ' км']
9 к  =>  [' км', 'км ']
 км  =>  ['км ', 'м /']
км   =>  ['м /', ' / ']
м /  =>  [' / ', '/ ч']
 /   =>  ['/ ч', ' ч\n']
/ ч  =>  [' ч\n', 'ч\nГ']
 ч
  =>  ['ч\nГ', '\nГо']
ч
Г  =>  ['\nГо', 'Год']

Го  =>  ['Год', 'од ']
Год  =>  ['од ', 'д п']
од   =>  ['д п', ' по']

ом   =>  ['м и', ' и ']
м и  =>  [' и ', 'и п']
 и   =>  ['и п', ' по']
и п  =>  [' по', 'пов']
 по  =>  ['пов', 'ова']
пов  =>  ['ова', 'вад']
ова  =>  ['вад', 'адк']
вад  =>  ['адк', 'дка']
адк  =>  ['дка', 'кам']
дка  =>  ['кам', 'ами']
кам  =>  ['ами', 'ми ']
ами  =>  ['ми ', 'и х']
ми   =>  ['и х', ' хи']
и х  =>  [' хи', 'хищ']
 хи  =>  ['хищ', 'ищн']
хищ  =>  ['ищн', 'щни']
ищн  =>  ['щни', 'ник']
щни  =>  ['ник', 'ика']
ник  =>  ['ика', 'ка,']
ика  =>  ['ка,', 'а, ']
ка,  =>  ['а, ', ', З']
а,   =>  [', З', ' Зв']
, З  =>  [' Зв', 'Зве']
 Зв  =>  ['Зве', 'вер']
Зве  =>  ['вер', 'ерь']
вер  =>  ['ерь', 'рь ']
ерь  =>  ['рь ', 'ь с']
рь   =>  ['ь с', ' сп']
ь с  =>  [' сп', 'спо']
 сп  =>  ['спо', 'пос']
спо  =>  ['пос', 'осо']
пос  =>  ['осо', 'соб']
осо  =>  ['соб', 'обе']
соб  =>  ['обе', 'бен']
обе  =>  ['бен', 'ен ']
бен  =>  ['ен ', 'н н']
ен   =>  ['н н', ' на']
н н  =>  [' на', 'най']
 на  =>  ['най', 'айт']
най  =>  ['айт', 'йти']
айт  =>  ['йти', 'ти ']
йти  =>  ['ти ',

ник  =>  ['ик.', 'к.\n']
ик.  =>  ['к.\n', '.\n\n']
к.
  =>  ['.\n\n', '\n\n\n']
.

  =>  ['\n\n\n', '\n\n\n']



  =>  ['\n\n\n', '\n\nК']



  =>  ['\n\nК', '\nКо']


К  =>  ['\nКо', 'Ком']

Ко  =>  ['Ком', 'ома']
Ком  =>  ['ома', 'ман']
ома  =>  ['ман', 'анд']
ман  =>  ['анд', 'нда']
анд  =>  ['нда', 'да:']
нда  =>  ['да:', 'а: ']
да:  =>  ['а: ', ': T']
а:   =>  [': T', ' Te']
: T  =>  [' Te', 'Tea']
 Te  =>  ['Tea', 'eam']
Tea  =>  ['eam', 'am ']
eam  =>  ['am ', 'm B']
am   =>  ['m B', ' Be']
m B  =>  [' Be', 'Bea']
 Be  =>  ['Bea', 'eas']
Bea  =>  ['eas', 'ast']
eas  =>  ['ast', 'st ']
ast  =>  ['st ', 't \n']
st   =>  ['t \n', ' \nГ']
t 
  =>  [' \nГ', '\nГо']
 
Г  =>  ['\nГо', 'Год']

Го  =>  ['Год', 'од ']
Год  =>  ['од ', 'д с']
од   =>  ['д с', ' со']
д с  =>  [' со', 'соз']
 со  =>  ['соз', 'озд']
соз  =>  ['озд', 'зда']
озд  =>  ['зда', 'дан']
зда  =>  ['дан', 'ани']
дан  =>  ['ани', 'ния']
ани  =>  ['ния', 'ия:']
ния  =>  ['ия:', 'я: ']
ия:  =>  ['я: ', ': 2']
я:   =>  [

ния  =>  ['ия)', 'я)\n']
ия)  =>  ['я)\n', ')\n\n']
я)
  =>  [')\n\n', '\n\n\n']
)

  =>  ['\n\n\n', '\n\n\n']



  =>  ['\n\n\n', '\n\n3']



  =>  ['\n\n3', '\n3 ']


3  =>  ['\n3 ', '3 р']

3   =>  ['3 р', ' ра']
3 р  =>  [' ра', 'раз']
 ра  =>  ['раз', 'аза']
раз  =>  ['аза', 'за ']
аза  =>  ['за ', 'а ч']
за   =>  ['а ч', ' че']
а ч  =>  [' че', 'чем']
 че  =>  ['чем', 'емп']
чем  =>  ['емп', 'мпи']
емп  =>  ['мпи', 'пио']
мпи  =>  ['пио', 'ион']
пио  =>  ['ион', 'он ']
ион  =>  ['он ', 'н В']
он   =>  ['н В', ' Ве']
н В  =>  [' Ве', 'Вел']
 Ве  =>  ['Вел', 'ели']
Вел  =>  ['ели', 'лик']
ели  =>  ['лик', 'ико']
лик  =>  ['ико', 'коб']
ико  =>  ['коб', 'обр']
коб  =>  ['обр', 'бри']
обр  =>  ['бри', 'рит']
бри  =>  ['рит', 'ита']
рит  =>  ['ита', 'тан']
ита  =>  ['тан', 'ани']
тан  =>  ['ани', 'нии']
ани  =>  ['нии', 'ии ']
нии  =>  ['ии ', 'и и']
ии   =>  ['и и', ' и ']
и и  =>  [' и ', 'и 1']
 и   =>  ['и 1', ' 1 ']
и 1  =>  [' 1 ', '1 р']
 1   =>  ['1 р', ' ра']
1 р  =>  [' ра',

ный  =>  ['ый ', 'й р']
ый   =>  ['й р', ' ро']
й р  =>  [' ро', 'роб']
 ро  =>  ['роб', 'обо']
роб  =>  ['обо', 'бот']
обо  =>  ['бот', 'от.']
бот  =>  ['от.', 'т.\n']
от.  =>  ['т.\n', '.\nС']
т.
  =>  ['.\nС', '\nСл']
.
С  =>  ['\nСл', 'Сла']

Сл  =>  ['Сла', 'лаб']
Сла  =>  ['лаб', 'абы']
лаб  =>  ['абы', 'бые']
абы  =>  ['бые', 'ые ']
бые  =>  ['ые ', 'е с']
ые   =>  ['е с', ' ст']
е с  =>  [' ст', 'сто']
 ст  =>  ['сто', 'тор']
сто  =>  ['тор', 'оро']
тор  =>  ['оро', 'рон']
оро  =>  ['рон', 'оны']
рон  =>  ['оны', 'ны:']
оны  =>  ['ны:', 'ы: ']
ны:  =>  ['ы: ', ': н']
ы:   =>  [': н', ' не']
: н  =>  [' не', 'нет']
 не  =>  ['нет', 'ет ']
нет  =>  ['ет ', 'т д']
ет   =>  ['т д', ' до']
т д  =>  [' до', 'дос']
 до  =>  ['дос', 'осп']
дос  =>  ['осп', 'спе']
осп  =>  ['спе', 'пех']
спе  =>  ['пех', 'ехо']
пех  =>  ['ехо', 'хов']
ехо  =>  ['хов', 'ов\n']
хов  =>  ['ов\n', 'в\n\n']
ов
  =>  ['в\n\n', '\n\n8']
в

  =>  ['\n\n8', '\n8.']


8  =>  ['\n8.', '8. ']

8.  =>  ['8. ', '. Р'

 со  =>  ['соз', 'озд']
соз  =>  ['озд', 'зда']
озд  =>  ['зда', 'дан']
зда  =>  ['дан', 'ани']
дан  =>  ['ани', 'ния']
ани  =>  ['ния', 'ия:']
ния  =>  ['ия:', 'я: ']
ия:  =>  ['я: ', ': 2']
я:   =>  [': 2', ' 20']
: 2  =>  [' 20', '201']
 20  =>  ['201', '013']
201  =>  ['013', '13\n']
013  =>  ['13\n', '3\nВ']
13
  =>  ['3\nВ', '\nВе']
3
В  =>  ['\nВе', 'Вес']

Ве  =>  ['Вес', 'ес:']
Вес  =>  ['ес:', 'с: ']
ес:  =>  ['с: ', ': 1']
с:   =>  [': 1', ' 10']
: 1  =>  [' 10', '100']
 10  =>  ['100', '00 ']
100  =>  ['00 ', '0 к']
00   =>  ['0 к', ' кг']
0 к  =>  [' кг', 'кг\n']
 кг  =>  ['кг\n', 'г\nС']
кг
  =>  ['г\nС', '\nСк']
г
С  =>  ['\nСк', 'Ско']

Ск  =>  ['Ско', 'кор']
Ско  =>  ['кор', 'оро']
кор  =>  ['оро', 'рос']
оро  =>  ['рос', 'ост']
рос  =>  ['ост', 'сть']
ост  =>  ['сть', 'ть:']
сть  =>  ['ть:', 'ь: ']
ть:  =>  ['ь: ', ': 1']
ь:   =>  [': 1', ' 19']
: 1  =>  [' 19', '19 ']
 19  =>  ['19 ', '9 к']
19   =>  ['9 к', ' км']
9 к  =>  [' км', 'км/']
 км  =>  ['км/', 'м/ч']
км/ 

от   =>  ['т с', ' с ']
т с  =>  [' с ', 'с н']
 с   =>  ['с н', ' не']
с н  =>  [' не', 'нео']
 не  =>  ['нео', 'еоб']
нео  =>  ['еоб', 'обы']
еоб  =>  ['обы', 'быч']
обы  =>  ['быч', 'ычн']
быч  =>  ['ычн', 'чны']
ычн  =>  ['чны', 'ным']
чны  =>  ['ным', 'ым ']
ным  =>  ['ым ', 'м п']
ым   =>  ['м п', ' пе']
м п  =>  [' пе', 'пер']
 пе  =>  ['пер', 'ере']
пер  =>  ['ере', 'ред']
ере  =>  ['ред', 'едн']
ред  =>  ['едн', 'дни']
едн  =>  ['дни', 'ним']
дни  =>  ['ним', 'им ']
ним  =>  ['им ', 'м ш']
им   =>  ['м ш', ' ша']
м ш  =>  [' ша', 'шар']
 ша  =>  ['шар', 'арн']
шар  =>  ['арн', 'рни']
арн  =>  ['рни', 'нир']
рни  =>  ['нир', 'ирн']
нир  =>  ['ирн', 'рны']
ирн  =>  ['рны', 'ным']
рны  =>  ['ным', 'ым ']
ным  =>  ['ым ', 'м ф']
ым   =>  ['м ф', ' фл']
м ф  =>  [' фл', 'фли']
 фл  =>  ['фли', 'лип']
фли  =>  ['лип', 'ипп']
лип  =>  ['ипп', 'ппе']
ипп  =>  ['ппе', 'пер']
ппе  =>  ['пер', 'еро']
пер  =>  ['еро', 'ром']
еро  =>  ['ром', 'ом,']
ром  =>  ['ом,', 'м, ']
ом,  =>  ['м, ',

 19  =>  ['19 ', '9 к']
19   =>  ['9 к', ' км']
9 к  =>  [' км', 'км/']
 км  =>  ['км/', 'м/ч']
км/  =>  ['м/ч', '/ча']
м/ч  =>  ['/ча', 'час']
/ча  =>  ['час', 'ас\n']
час  =>  ['ас\n', 'с\nБ']
ас
  =>  ['с\nБ', '\nБр']
с
Б  =>  ['\nБр', 'Бро']

Бр  =>  ['Бро', 'рон']
Бро  =>  ['рон', 'оня']
рон  =>  ['оня', 'ня:']
оня  =>  ['ня:', 'я: ']
ня:  =>  ['я: ', ': 3']
я:   =>  [': 3', ' 3.']
: 3  =>  [' 3.', '3.2']
 3.  =>  ['3.2', '.2 ']
3.2  =>  ['.2 ', '2 м']
.2   =>  ['2 м', ' ми']
2 м  =>  [' ми', 'мил']
 ми  =>  ['мил', 'илл']
мил  =>  ['илл', 'лли']
илл  =>  ['лли', 'лим']
лли  =>  ['лим', 'име']
лим  =>  ['име', 'мет']
име  =>  ['мет', 'етр']
мет  =>  ['етр', 'тра']
етр  =>  ['тра', 'ра ']
тра  =>  ['ра ', 'а с']
ра   =>  ['а с', ' ст']
а с  =>  [' ст', 'ста']
 ст  =>  ['ста', 'тал']
ста  =>  ['тал', 'али']
тал  =>  ['али', 'ли ']
али  =>  ['ли ', 'и H']
ли   =>  ['и H', ' Ha']
и H  =>  [' Ha', 'Har']
 Ha  =>  ['Har', 'ard']
Har  =>  ['ard', 'rdo']
ard  =>  ['rdo', 'dox']
rdo  =>  [

"
   =>  ['\n \n', ' \n1']

 
  =>  [' \n1', '\n12']
 
1  =>  ['\n12', '12.']

12  =>  ['12.', '2. ']
12.  =>  ['2. ', '. W']
2.   =>  ['. W', ' WA']
. W  =>  [' WA', 'WAS']
 WA  =>  ['WAS', 'ASH']
WAS  =>  ['ASH', 'SHE']
ASH  =>  ['SHE', 'HER']
SHE  =>  ['HER', 'ER ']
HER  =>  ['ER ', 'R (']
ER   =>  ['R (', ' (С']
R (  =>  [' (С', '(СШ']
 (С  =>  ['(СШ', 'США']
(СШ  =>  ['США', 'ША)']
США  =>  ['ША)', 'А)\n']
ША)  =>  ['А)\n', ')\n\n']
А)
  =>  [')\n\n', '\n\nГ']
)

  =>  ['\n\nГ', '\nГр']


Г  =>  ['\nГр', 'Гро']

Гр  =>  ['Гро', 'роз']
Гро  =>  ['роз', 'озн']
роз  =>  ['озн', 'зны']
озн  =>  ['зны', 'ный']
зны  =>  ['ный', 'ый ']
ный  =>  ['ый ', 'й р']
ый   =>  ['й р', ' ро']
й р  =>  [' ро', 'роб']
 ро  =>  ['роб', 'обо']
роб  =>  ['обо', 'бот']
обо  =>  ['бот', 'от,']
бот  =>  ['от,', 'т, ']
от,  =>  ['т, ', ', е']
т,   =>  [', е', ' ед']
, е  =>  [' ед', 'еди']
 ед  =>  ['еди', 'дин']
еди  =>  ['дин', 'инс']
дин  =>  ['инс', 'нст']
инс  =>  ['нст', 'ств']
нст  =>  ['ств', 'тве'

  =>  ['7\nВ', '\nВе']
7
В  =>  ['\nВе', 'Вес']

Ве  =>  ['Вес', 'ес:']
Вес  =>  ['ес:', 'с: ']
ес:  =>  ['с: ', ': 4']
с:   =>  [': 4', ' 40']
: 4  =>  [' 40', '40\n']
 40  =>  ['40\n', '0\nС']
40
  =>  ['0\nС', '\nСк']
0
С  =>  ['\nСк', 'Ско']

Ск  =>  ['Ско', 'кор']
Ско  =>  ['кор', 'оро']
кор  =>  ['оро', 'рос']
оро  =>  ['рос', 'ост']
рос  =>  ['ост', 'сть']
ост  =>  ['сть', 'ть:']
сть  =>  ['ть:', 'ь: ']
ть:  =>  ['ь: ', ': 1']
ь:   =>  [': 1', ' 15']
: 1  =>  [' 15', '15к']
 15  =>  ['15к', '5км']
15к  =>  ['5км', 'км/']
5км  =>  ['км/', 'м/ч']
км/  =>  ['м/ч', '/ч\n']
м/ч  =>  ['/ч\n', 'ч\nБ']
/ч
  =>  ['ч\nБ', '\nБр']
ч
Б  =>  ['\nБр', 'Бро']

Бр  =>  ['Бро', 'рон']
Бро  =>  ['рон', 'оня']
рон  =>  ['оня', 'ня:']
оня  =>  ['ня:', 'я: ']
ня:  =>  ['я: ', ': с']
я:   =>  [': с', ' су']
: с  =>  [' су', 'сус']
 су  =>  ['сус', 'уса']
сус  =>  ['уса', 'сал']
уса  =>  ['сал', 'аль']
сал  =>  ['аль', 'льн']
аль  =>  ['льн', 'ьно']
льн  =>  ['ьно', 'ное']
ьно  =>  ['ное', 'ое ']
ное 

и и  =>  [' и ', 'и в']
 и   =>  ['и в', ' вы']
и в  =>  [' вы', 'выж']
 вы  =>  ['выж', 'ыжи']
выж  =>  ['ыжи', 'жив']
ыжи  =>  ['жив', 'ива']
жив  =>  ['ива', 'вае']
ива  =>  ['вае', 'ает']
вае  =>  ['ает', 'ет ']
ает  =>  ['ет ', 'т о']
ет   =>  ['т о', ' от']
т о  =>  [' от', 'от ']
 от  =>  ['от ', 'т с']
от   =>  ['т с', ' си']
т с  =>  [' си', 'сил']
 си  =>  ['сил', 'иль']
сил  =>  ['иль', 'льн']
иль  =>  ['льн', 'ьне']
льн  =>  ['ьне', 'ней']
ьне  =>  ['ней', 'ейш']
ней  =>  ['ейш', 'йши']
ейш  =>  ['йши', 'ших']
йши  =>  ['ших', 'их ']
ших  =>  ['их ', 'х у']
их   =>  ['х у', ' уд']
х у  =>  [' уд', 'уда']
 уд  =>  ['уда', 'дар']
уда  =>  ['дар', 'аро']
дар  =>  ['аро', 'ров']
аро  =>  ['ров', 'ов ']
ров  =>  ['ов ', 'в п']
ов   =>  ['в п', ' пр']
в п  =>  [' пр', 'про']
 пр  =>  ['про', 'рот']
про  =>  ['рот', 'оти']
рот  =>  ['оти', 'тив']
оти  =>  ['тив', 'ивн']
тив  =>  ['ивн', 'вни']
ивн  =>  ['вни', 'ник']
вни  =>  ['ник', 'ико']
ник  =>  ['ико', 'ков']
ико  =>  ['ков',

рпу  =>  ['пус', 'усо']
пус  =>  ['усо', 'сом']
усо  =>  ['сом', 'ом,']
сом  =>  ['ом,', 'м, ']
ом,  =>  ['м, ', ', к']
м,   =>  [', к', ' ко']
, к  =>  [' ко', 'кот']
 ко  =>  ['кот', 'ото']
кот  =>  ['ото', 'тор']
ото  =>  ['тор', 'оры']
тор  =>  ['оры', 'рый']
оры  =>  ['рый', 'ый ']
рый  =>  ['ый ', 'й в']
ый   =>  ['й в', ' вр']
й в  =>  [' вр', 'вра']
 вр  =>  ['вра', 'ращ']
вра  =>  ['ращ', 'аща']
ращ  =>  ['аща', 'щае']
аща  =>  ['щае', 'ает']
щае  =>  ['ает', 'етс']
ает  =>  ['етс', 'тся']
етс  =>  ['тся', 'ся ']
тся  =>  ['ся ', 'я с']
ся   =>  ['я с', ' со']
я с  =>  [' со', 'со ']
 со  =>  ['со ', 'о с']
со   =>  ['о с', ' ск']
о с  =>  [' ск', 'ско']
 ск  =>  ['ско', 'кор']
ско  =>  ['кор', 'оро']
кор  =>  ['оро', 'рос']
оро  =>  ['рос', 'ост']
рос  =>  ['ост', 'сть']
ост  =>  ['сть', 'тью']
сть  =>  ['тью', 'ью ']
тью  =>  ['ью ', 'ю 4']
ью   =>  ['ю 4', ' 40']
ю 4  =>  [' 40', '400']
 40  =>  ['400', '000']
400  =>  ['000', '00о']
000  =>  ['00о', '0об']
00о  =>  ['0об',

орт  =>  ['рти', 'тик']
рти  =>  ['тик', 'ик.']
тик  =>  ['ик.', 'к. ']
ик.  =>  ['к. ', '. В']
к.   =>  ['. В', ' Вн']
. В  =>  [' Вн', 'Вне']
 Вн  =>  ['Вне', 'неш']
Вне  =>  ['неш', 'ешн']
неш  =>  ['ешн', 'шне']
ешн  =>  ['шне', 'не ']
шне  =>  ['не ', 'е о']
не   =>  ['е о', ' он']
е о  =>  [' он', 'он ']
 он  =>  ['он ', 'н б']
он   =>  ['н б', ' бу']
н б  =>  [' бу', 'буд']
 бу  =>  ['буд', 'уде']
буд  =>  ['уде', 'дет']
уде  =>  ['дет', 'ет ']
дет  =>  ['ет ', 'т в']
ет   =>  ['т в', ' во']
т в  =>  [' во', 'воз']
 во  =>  ['воз', 'озд']
воз  =>  ['озд', 'зду']
озд  =>  ['зду', 'душ']
зду  =>  ['душ', 'ушн']
душ  =>  ['ушн', 'шны']
ушн  =>  ['шны', 'ным']
шны  =>  ['ным', 'ым ']
ным  =>  ['ым ', 'м и']
ым   =>  ['м и', ' и ']
м и  =>  [' и ', 'и л']
 и   =>  ['и л', ' ле']
и л  =>  [' ле', 'лег']
 ле  =>  ['лег', 'егк']
лег  =>  ['егк', 'гки']
егк  =>  ['гки', 'ким']
гки  =>  ['ким', 'им,']
ким  =>  ['им,', 'м, ']
им,  =>  ['м, ', ', н']
м,   =>  [', н', ' но']
, н  =>  [' но',

от   =>  ['т н', ' на']
т н  =>  [' на', 'нап']
 на  =>  ['нап', 'апа']
нап  =>  ['апа', 'пад']
апа  =>  ['пад', 'аде']
пад  =>  ['аде', 'ден']
аде  =>  ['ден', 'ени']
ден  =>  ['ени', 'ний']
ени  =>  ['ний', 'ий.']
ний  =>  ['ий.', 'й.\n']
ий.  =>  ['й.\n', '.\nс']
й.
  =>  ['.\nс', '\nсл']
.
с  =>  ['\nсл', 'сла']

сл  =>  ['сла', 'лаб']
сла  =>  ['лаб', 'абы']
лаб  =>  ['абы', 'бые']
абы  =>  ['бые', 'ые ']
бые  =>  ['ые ', 'е с']
ые   =>  ['е с', ' ст']
е с  =>  [' ст', 'сто']
 ст  =>  ['сто', 'тор']
сто  =>  ['тор', 'оро']
тор  =>  ['оро', 'рон']
оро  =>  ['рон', 'оны']
рон  =>  ['оны', 'ны:']
оны  =>  ['ны:', 'ы: ']
ны:  =>  ['ы: ', ': н']
ы:   =>  [': н', ' не']
: н  =>  [' не', 'не ']
 не  =>  ['не ', 'е н']
не   =>  ['е н', ' на']
е н  =>  [' на', 'най']
 на  =>  ['най', 'айд']
най  =>  ['айд', 'йде']
айд  =>  ['йде', 'ден']
йде  =>  ['ден', 'ены']
ден  =>  ['ены', 'ны.']
ены  =>  ['ны.', 'ы. ']
ны.  =>  ['ы. ', '. \n']
ы.   =>  ['. \n', ' \n\n']
. 
  =>  [' \n\n', '\n\n1']
 


е с  =>  [' ст', 'сто']
 ст  =>  ['сто', 'тор']
сто  =>  ['тор', 'оро']
тор  =>  ['оро', 'рон']
оро  =>  ['рон', 'оны']
рон  =>  ['оны', 'ны:']
оны  =>  ['ны:', 'ы: ']
ны:  =>  ['ы: ', ': п']
ы:   =>  [': п', ' па']
: п  =>  [' па', 'пад']
 па  =>  ['пад', 'аде']
пад  =>  ['аде', 'ден']
аде  =>  ['ден', 'ени']
ден  =>  ['ени', 'ние']
ени  =>  ['ние', 'ие ']
ние  =>  ['ие ', 'е н']
ие   =>  ['е н', ' на']
е н  =>  [' на', 'на ']
 на  =>  ['на ', 'а б']
на   =>  ['а б', ' бо']
а б  =>  [' бо', 'бок']
 бо  =>  ['бок', 'ок ']
бок  =>  ['ок ', 'к о']
ок   =>  ['к о', ' об']
к о  =>  [' об', 'обе']
 об  =>  ['обе', 'без']
обе  =>  ['без', 'езд']
без  =>  ['езд', 'здв']
езд  =>  ['здв', 'дви']
здв  =>  ['дви', 'виж']
дви  =>  ['виж', 'ижи']
виж  =>  ['ижи', 'жит']
ижи  =>  ['жит', 'ит ']
жит  =>  ['ит ', 'т \n']
ит   =>  ['т \n', ' \n\n']
т 
  =>  [' \n\n', '\n\n1']
 

  =>  ['\n\n1', '\n17']


1  =>  ['\n17', '17.']

17  =>  ['17.', '7. ']
17.  =>  ['7. ', '. Б']
7.   =>  ['. Б', ' Ба']
. Б 

 кВ  =>  ['кВт', 'Вт\n']
кВт  =>  ['Вт\n', 'т\nО']
Вт
  =>  ['т\nО', '\nОр']
т
О  =>  ['\nОр', 'Ору']

Ор  =>  ['Ору', 'руж']
Ору  =>  ['руж', 'ужи']
руж  =>  ['ужи', 'жие']
ужи  =>  ['жие', 'ие:']
жие  =>  ['ие:', 'е: ']
ие:  =>  ['е: ', ': Ф']
е:   =>  [': Ф', ' Фл']
: Ф  =>  [' Фл', 'Фли']
 Фл  =>  ['Фли', 'лип']
Фли  =>  ['лип', 'ипп']
лип  =>  ['ипп', 'ппе']
ипп  =>  ['ппе', 'пер']
ппе  =>  ['пер', 'ер\n']
пер  =>  ['ер\n', 'р\nС']
ер
  =>  ['р\nС', '\nСи']
р
С  =>  ['\nСи', 'Сил']

Си  =>  ['Сил', 'иль']
Сил  =>  ['иль', 'льн']
иль  =>  ['льн', 'ьны']
льн  =>  ['ьны', 'ные']
ьны  =>  ['ные', 'ые ']
ные  =>  ['ые ', 'е с']
ые   =>  ['е с', ' ст']
е с  =>  [' ст', 'сто']
 ст  =>  ['сто', 'тор']
сто  =>  ['тор', 'оро']
тор  =>  ['оро', 'рон']
оро  =>  ['рон', 'оны']
рон  =>  ['оны', 'ны:']
оны  =>  ['ны:', 'ы: ']
ны:  =>  ['ы: ', ': М']
ы:   =>  [': М', ' Мо']
: М  =>  [' Мо', 'Мощ']
 Мо  =>  ['Мощ', 'ощн']
Мощ  =>  ['ощн', 'щно']
ощн  =>  ['щно', 'ное']
щно  =>  ['ное', 'ое ']
ное 

 св  =>  ['сво', 'вои']
сво  =>  ['вои', 'оим']
вои  =>  ['оим', 'ими']
оим  =>  ['ими', 'ми ']
ими  =>  ['ми ', 'и с']
ми   =>  ['и с', ' си']
и с  =>  [' си', 'сил']
 си  =>  ['сил', 'ила']
сил  =>  ['ила', 'лам']
ила  =>  ['лам', 'ами']
лам  =>  ['ами', 'ми ']
ами  =>  ['ми ', 'и с']
ми   =>  ['и с', ' со']
и с  =>  [' со', 'соб']
 со  =>  ['соб', 'обр']
соб  =>  ['обр', 'бра']
обр  =>  ['бра', 'рав']
бра  =>  ['рав', 'авш']
рав  =>  ['авш', 'вши']
авш  =>  ['вши', 'ший']
вши  =>  ['ший', 'ий ']
ший  =>  ['ий ', 'й к']
ий   =>  ['й к', ' ко']
й к  =>  [' ко', 'ком']
 ко  =>  ['ком', 'ома']
ком  =>  ['ома', 'ман']
ома  =>  ['ман', 'анд']
ман  =>  ['анд', 'нду']
анд  =>  ['нду', 'ду ']
нду  =>  ['ду ', 'у у']
ду   =>  ['у у', ' ув']
у у  =>  [' ув', 'увл']
 ув  =>  ['увл', 'вле']
увл  =>  ['вле', 'леч']
вле  =>  ['леч', 'ече']
леч  =>  ['ече', 'чен']
ече  =>  ['чен', 'енн']
чен  =>  ['енн', 'нны']
енн  =>  ['нны', 'ных']
нны  =>  ['ных', 'ых ']
ных  =>  ['ых ', 'х р']
ых   =>  ['х р',

ниц  =>  ['ицы', 'цы)']
ицы  =>  ['цы)', 'ы).']
цы)  =>  ['ы).', '). ']
ы).  =>  ['). ', '. Н']
).   =>  ['. Н', ' Не']
. Н  =>  [' Не', 'Неб']
 Не  =>  ['Неб', 'ебо']
Неб  =>  ['ебо', 'бол']
ебо  =>  ['бол', 'оль']
бол  =>  ['оль', 'льш']
оль  =>  ['льш', 'ьша']
льш  =>  ['ьша', 'шая']
ьша  =>  ['шая', 'ая ']
шая  =>  ['ая ', 'я в']
ая   =>  ['я в', ' вы']
я в  =>  [' вы', 'выс']
 вы  =>  ['выс', 'ысо']
выс  =>  ['ысо', 'сот']
ысо  =>  ['сот', 'ота']
сот  =>  ['ота', 'та,']
ота  =>  ['та,', 'а, ']
та,  =>  ['а, ', ', н']
а,   =>  [', н', ' ни']
, н  =>  [' ни', 'низ']
 ни  =>  ['низ', 'изк']
низ  =>  ['изк', 'зки']
изк  =>  ['зки', 'кий']
зки  =>  ['кий', 'ий ']
кий  =>  ['ий ', 'й ц']
ий   =>  ['й ц', ' це']
й ц  =>  [' це', 'цен']
 це  =>  ['цен', 'ент']
цен  =>  ['ент', 'нтр']
ент  =>  ['нтр', 'тр ']
нтр  =>  ['тр ', 'р т']
тр   =>  ['р т', ' тя']
р т  =>  [' тя', 'тяж']
 тя  =>  ['тяж', 'яже']
тяж  =>  ['яже', 'жес']
яже  =>  ['жес', 'ест']
жес  =>  ['ест', 'сти']
ест  =>  ['сти',

счи  =>  ['чит', 'ита']
чит  =>  ['ита', 'тае']
ита  =>  ['тае', 'аем']
тае  =>  ['аем', 'ем ']
аем  =>  ['ем ', 'м ч']
ем   =>  ['м ч', ' чт']
м ч  =>  [' чт', 'что']
 чт  =>  ['что', 'то ']
что  =>  ['то ', 'о п']
то   =>  ['о п', ' пр']
о п  =>  [' пр', 'при']
 пр  =>  ['при', 'ри ']
при  =>  ['ри ', 'и у']
ри   =>  ['и у', ' ум']
и у  =>  [' ум', 'уме']
 ум  =>  ['уме', 'мел']
уме  =>  ['мел', 'ело']
мел  =>  ['ело', 'лом']
ело  =>  ['лом', 'ом,']
лом  =>  ['ом,', 'м, ']
ом,  =>  ['м, ', ', т']
м,   =>  [', т', ' та']
, т  =>  [' та', 'так']
 та  =>  ['так', 'акт']
так  =>  ['акт', 'кти']
акт  =>  ['кти', 'тич']
кти  =>  ['тич', 'ичн']
тич  =>  ['ичн', 'чно']
ичн  =>  ['чно', 'ном']
чно  =>  ['ном', 'ом ']
ном  =>  ['ом ', 'м у']
ом   =>  ['м у', ' уп']
м у  =>  [' уп', 'упр']
 уп  =>  ['упр', 'пра']
упр  =>  ['пра', 'рав']
пра  =>  ['рав', 'авл']
рав  =>  ['авл', 'вле']
авл  =>  ['вле', 'лен']
вле  =>  ['лен', 'ени']
лен  =>  ['ени', 'нии']
ени  =>  ['нии', 'ии ']
нии  =>  ['ии ',

ия   =>  ['я п', ' по']
я п  =>  [' по', 'по ']
 по  =>  ['по ', 'о с']
по   =>  ['о с', ' со']
о с  =>  [' со', 'сов']
 со  =>  ['сов', 'овм']
сов  =>  ['овм', 'вме']
овм  =>  ['вме', 'мещ']
вме  =>  ['мещ', 'еще']
мещ  =>  ['еще', 'щен']
еще  =>  ['щен', 'ени']
щен  =>  ['ени', 'нию']
ени  =>  ['нию', 'ию ']
нию  =>  ['ию ', 'ю о']
ию   =>  ['ю о', ' ос']
ю о  =>  [' ос', 'осе']
 ос  =>  ['осе', 'сей']
осе  =>  ['сей', 'ей ']
сей  =>  ['ей ', 'й х']
ей   =>  ['й х', ' хо']
й х  =>  [' хо', 'ход']
 хо  =>  ['ход', 'ода']
ход  =>  ['ода', 'да ']
ода  =>  ['да ', 'а и']
да   =>  ['а и', ' и ']
а и  =>  [' и ', 'и о']
 и   =>  ['и о', ' ор']
и о  =>  [' ор', 'ору']
 ор  =>  ['ору', 'руд']
ору  =>  ['руд', 'уди']
руд  =>  ['уди', 'дия']
уди  =>  ['дия', 'ия.']
дия  =>  ['ия.', 'я. ']
ия.  =>  ['я. ', '. М']
я.   =>  ['. М', ' Мы']
. М  =>  [' Мы', 'Мы ']
 Мы  =>  ['Мы ', 'ы с']
Мы   =>  ['ы с', ' сч']
ы с  =>  [' сч', 'счи']
 сч  =>  ['счи', 'чит']
счи  =>  ['чит', 'ита']
чит  =>  ['ита',

оше  =>  ['шее', 'ее ']
шее  =>  ['ее ', 'е с']
ее   =>  ['е с', ' сц']
е с  =>  [' сц', 'сце']
 сц  =>  ['сце', 'цеп']
сце  =>  ['цеп', 'епл']
цеп  =>  ['епл', 'пле']
епл  =>  ['пле', 'лен']
пле  =>  ['лен', 'ени']
лен  =>  ['ени', 'ние']
ени  =>  ['ние', 'ие ']
ние  =>  ['ие ', 'е и']
ие   =>  ['е и', ' и ']
е и  =>  [' и ', 'и ж']
 и   =>  ['и ж', ' жи']
и ж  =>  [' жи', 'жив']
 жи  =>  ['жив', 'иву']
жив  =>  ['иву', 'вуч']
иву  =>  ['вуч', 'уче']
вуч  =>  ['уче', 'чес']
уче  =>  ['чес', 'ест']
чес  =>  ['ест', 'сть']
ест  =>  ['сть', 'ть ']
сть  =>  ['ть ', 'ь р']
ть   =>  ['ь р', ' ра']
ь р  =>  [' ра', 'рам']
 ра  =>  ['рам', 'амн']
рам  =>  ['амн', 'мно']
амн  =>  ['мно', 'ной']
мно  =>  ['ной', 'ой ']
ной  =>  ['ой ', 'й к']
ой   =>  ['й к', ' ко']
й к  =>  [' ко', 'кон']
 ко  =>  ['кон', 'онс']
кон  =>  ['онс', 'нст']
онс  =>  ['нст', 'стр']
нст  =>  ['стр', 'тру']
стр  =>  ['тру', 'рук']
тру  =>  ['рук', 'укц']
рук  =>  ['укц', 'кци']
укц  =>  ['кци', 'ции']
кци  =>  ['ции',

нан  =>  ['ано', 'нос']
ано  =>  ['нос', 'оси']
нос  =>  ['оси', 'сит']
оси  =>  ['сит', 'ит ']
сит  =>  ['ит ', 'т н']
ит   =>  ['т н', ' не']
т н  =>  [' не', 'нед']
 не  =>  ['нед', 'едо']
нед  =>  ['едо', 'дос']
едо  =>  ['дос', 'ост']
дос  =>  ['ост', 'ста']
ост  =>  ['ста', 'тат']
ста  =>  ['тат', 'ато']
тат  =>  ['ато', 'точ']
ато  =>  ['точ', 'очн']
точ  =>  ['очн', 'чно']
очн  =>  ['чно', 'но ']
чно  =>  ['но ', 'о с']
но   =>  ['о с', ' си']
о с  =>  [' си', 'сил']
 си  =>  ['сил', 'иль']
сил  =>  ['иль', 'льн']
иль  =>  ['льн', 'ьно']
льн  =>  ['ьно', 'ное']
ьно  =>  ['ное', 'ое ']
ное  =>  ['ое ', 'е п']
ое   =>  ['е п', ' по']
е п  =>  [' по', 'пов']
 по  =>  ['пов', 'овр']
пов  =>  ['овр', 'вре']
овр  =>  ['вре', 'реж']
вре  =>  ['реж', 'ежд']
реж  =>  ['ежд', 'жде']
ежд  =>  ['жде', 'ден']
жде  =>  ['ден', 'ени']
ден  =>  ['ени', 'ние']
ени  =>  ['ние', 'ие ']
ние  =>  ['ие ', 'е п']
ие   =>  ['е п', ' пр']
е п  =>  [' пр', 'при']
 пр  =>  ['при', 'ри ']
при  =>  ['ри ',

р-к  =>  ['-ко', 'кол']
-ко  =>  ['кол', 'олё']
кол  =>  ['олё', 'лёс']
олё  =>  ['лёс', 'ёс ']
лёс  =>  ['ёс ', 'с о']
ёс   =>  ['с о', ' от']
с о  =>  [' от', 'от ']
 от  =>  ['от ', 'т г']
от   =>  ['т г', ' ги']
т г  =>  [' ги', 'гир']
 ги  =>  ['гир', 'иро']
гир  =>  ['иро', 'рос']
иро  =>  ['рос', 'оск']
рос  =>  ['оск', 'ску']
оск  =>  ['ску', 'кут']
ску  =>  ['кут', 'уте']
кут  =>  ['уте', 'тер']
уте  =>  ['тер', 'ера']
тер  =>  ['ера', 'ра ']
ера  =>  ['ра ', 'а п']
ра   =>  ['а п', ' по']
а п  =>  [' по', 'по ']
 по  =>  ['по ', 'о 3']
по   =>  ['о 3', ' 35']
о 3  =>  [' 35', '350']
 35  =>  ['350', '50 ']
350  =>  ['50 ', '0 В']
50   =>  ['0 В', ' Вт']
0 В  =>  [' Вт', 'Вт ']
 Вт  =>  ['Вт ', 'т к']
Вт   =>  ['т к', ' ка']
т к  =>  [' ка', 'каж']
 ка  =>  ['каж', 'ажд']
каж  =>  ['ажд', 'ждо']
ажд  =>  ['ждо', 'дое']
ждо  =>  ['дое', 'ое.']
дое  =>  ['ое.', 'е. ']
ое.  =>  ['е. ', '. З']
е.   =>  ['. З', ' За']
. З  =>  [' За', 'За ']
 За  =>  ['За ', 'а п']
За   =>  ['а п',

 .   =>  ['. П', ' Пр']
. П  =>  [' Пр', 'Пре']
 Пр  =>  ['Пре', 'ред']
Пре  =>  ['ред', 'еды']
ред  =>  ['еды', 'дыд']
еды  =>  ['дыд', 'ыду']
дыд  =>  ['ыду', 'дущ']
ыду  =>  ['дущ', 'ущи']
дущ  =>  ['ущи', 'щий']
ущи  =>  ['щий', 'ий ']
щий  =>  ['ий ', 'й р']
ий   =>  ['й р', ' ро']
й р  =>  [' ро', 'роб']
 ро  =>  ['роб', 'обо']
роб  =>  ['обо', 'бот']
обо  =>  ['бот', 'от ']
бот  =>  ['от ', 'т к']
от   =>  ['т к', ' ко']
т к  =>  [' ко', 'ком']
 ко  =>  ['ком', 'ома']
ком  =>  ['ома', 'ман']
ома  =>  ['ман', 'анд']
ман  =>  ['анд', 'нды']
анд  =>  ['нды', 'ды,']
нды  =>  ['ды,', 'ы, ']
ды,  =>  ['ы, ', ', «']
ы,   =>  [', «', ' «К']
, «  =>  [' «К', '«Ка']
 «К  =>  ['«Ка', 'Кат']
«Ка  =>  ['Кат', 'атю']
Кат  =>  ['атю', 'тюш']
атю  =>  ['тюш', 'юша']
тюш  =>  ['юша', 'ша»']
юша  =>  ['ша»', 'а»,']
ша»  =>  ['а»,', '», ']
а»,  =>  ['», ', ', п']
»,   =>  [', п', ' пр']
, п  =>  [' пр', 'при']
 пр  =>  ['при', 'рин']
при  =>  ['рин', 'ини']
рин  =>  ['ини', 'ним']
ини  =>  ['ним',

юща  =>  ['щая', 'аяс']
щая  =>  ['аяс', 'яся']
аяс  =>  ['яся', 'ся ']
яся  =>  ['ся ', 'я б']
ся   =>  ['я б', ' бр']
я б  =>  [' бр', 'бро']
 бр  =>  ['бро', 'рон']
бро  =>  ['рон', 'оня']
рон  =>  ['оня', 'ня,']
оня  =>  ['ня,', 'я, ']
ня,  =>  ['я, ', ', н']
я,   =>  [', н', ' ни']
, н  =>  [' ни', 'низ']
 ни  =>  ['низ', 'изк']
низ  =>  ['изк', 'зки']
изк  =>  ['зки', 'кий']
зки  =>  ['кий', 'ий ']
кий  =>  ['ий ', 'й ц']
ий   =>  ['й ц', ' це']
й ц  =>  [' це', 'цен']
 це  =>  ['цен', 'ент']
цен  =>  ['ент', 'нтр']
ент  =>  ['нтр', 'тр ']
нтр  =>  ['тр ', 'р м']
тр   =>  ['р м', ' ма']
р м  =>  [' ма', 'мас']
 ма  =>  ['мас', 'асс']
мас  =>  ['асс', 'сс,']
асс  =>  ['сс,', 'с, ']
сс,  =>  ['с, ', ', у']
с,   =>  [', у', ' уд']
, у  =>  [' уд', 'уда']
 уд  =>  ['уда', 'дар']
уда  =>  ['дар', 'ар ']
дар  =>  ['ар ', 'р м']
ар   =>  ['р м', ' мо']
р м  =>  [' мо', 'мол']
 мо  =>  ['мол', 'оло']
мол  =>  ['оло', 'лот']
оло  =>  ['лот', 'ото']
лот  =>  ['ото', 'том']
ото  =>  ['том',

  =>  ['т\nО', '\nОр']
т
О  =>  ['\nОр', 'Ору']

Ор  =>  ['Ору', 'руж']
Ору  =>  ['руж', 'ужи']
руж  =>  ['ужи', 'жие']
ужи  =>  ['жие', 'ие:']
жие  =>  ['ие:', 'е: ']
ие:  =>  ['е: ', ': Э']
е:   =>  [': Э', ' Эл']
: Э  =>  [' Эл', 'Эле']
 Эл  =>  ['Эле', 'лек']
Эле  =>  ['лек', 'ект']
лек  =>  ['ект', 'ктр']
ект  =>  ['ктр', 'тро']
ктр  =>  ['тро', 'рон']
тро  =>  ['рон', 'оно']
рон  =>  ['оно', 'нож']
оно  =>  ['нож', 'ожн']
нож  =>  ['ожн', 'жни']
ожн  =>  ['жни', 'ниц']
жни  =>  ['ниц', 'ицы']
ниц  =>  ['ицы', 'цы ']
ицы  =>  ['цы ', 'ы п']
цы   =>  ['ы п', ' по']
ы п  =>  [' по', 'по ']
 по  =>  ['по ', 'о м']
по   =>  ['о м', ' ме']
о м  =>  [' ме', 'мет']
 ме  =>  ['мет', 'ета']
мет  =>  ['ета', 'тал']
ета  =>  ['тал', 'алл']
тал  =>  ['алл', 'ллу']
алл  =>  ['ллу', 'лу ']
ллу  =>  ['лу ', 'у с']
лу   =>  ['у с', ' с ']
у с  =>  [' с ', 'с у']
 с   =>  ['с у', ' ус']
с у  =>  [' ус', 'уси']
 ус  =>  ['уси', 'сил']
уси  =>  ['сил', 'или']
сил  =>  ['или', 'лие']
или  =>  ['лие',

In [34]:
alphabet = ''.join([chr(i) for i in range(ord('а'), ord('я') + 1)]) + 'ё '
d = {char: i for i, char in enumerate(alphabet)}
d

{'а': 0,
 'б': 1,
 'в': 2,
 'г': 3,
 'д': 4,
 'е': 5,
 'ж': 6,
 'з': 7,
 'и': 8,
 'й': 9,
 'к': 10,
 'л': 11,
 'м': 12,
 'н': 13,
 'о': 14,
 'п': 15,
 'р': 16,
 'с': 17,
 'т': 18,
 'у': 19,
 'ф': 20,
 'х': 21,
 'ц': 22,
 'ч': 23,
 'ш': 24,
 'щ': 25,
 'ъ': 26,
 'ы': 27,
 'ь': 28,
 'э': 29,
 'ю': 30,
 'я': 31,
 'ё': 32,
 ' ': 33}

In [61]:
import itertools
len(list(itertools.permutations(alphabet, 2))), len(alphabet), 34 * 34, (' ', ' ') in l

(1122, 34, 1156, False)

In [63]:
from more_itertools import distinct_permutations
l = list(distinct_permutations(alphabet, 2))
len(l), len(alphabet), 34 * 34 , (' ', ' ') in l

(1122, 34, 1156, False)

In [66]:
p = list(itertools.product(alphabet, repeat=2))
len(p), len(alphabet), 34 * 34, (' ', ' ') in p

(1156, 34, 1156, True)

In [71]:
from itertools import product

def encode_ngrams_dicts(alphabet: str, n: int) -> list:
    ngrams_list = [''.join(ngram) for ngram in product(alphabet, repeat=n)]
    ngram2int, int2ngram = {}, {}
    for i, ngram in enumerate(ngrams_list):
        ngram2int[ngram] = i
        int2ngram[i] = ngram
    return ngram2int, int2ngram

In [77]:
from itertools import product
from nltk import ngrams


class NgramEncoder:
    
    alpabet: str
    ngram2int: dict
    int2ngram: dict
    n_gramm_state: int
        
    def __init__(self, alphabet: str, n_gramm_state: int):
        self.alphabet = alphabet
        self.n_gramm_state = n_gramm_state
        
        ngrams_list = [''.join(ngram) for ngram in product(alphabet, repeat=n_gramm_state)]
        ngram2int, int2ngram = {}, {}
        for i, ngram in enumerate(ngrams_list):
            ngram2int[ngram] = i
            int2ngram[i] = ngram
        self.ngram2int = ngram2int
        self.int2ngram = int2ngram
    
    def encode_ngrams_list(self, ngrams_list: list) -> tuple:
        return tuple(self.ngram2int[ngram] for ngram in ngrams_list)    

In [78]:
RU_ALPHABET = ''.join([chr(i) for i in range(ord('а'), ord('я') + 1)]) + 'ё'
EN_ALPHABET = ''.join([chr(i) for i in range(ord('a'), ord('z') + 1)])

class MarkovModel:
    
    model: dict
    n_gramm_state: int
    model_state: int
    encoder: NgramEncoder
    tokenizer = Tokenizer()
    
    def __init__(self, model: dict, encoder: NgramEncoder, n_gramm_state=2, model_state=3):
        self.model = model
        self.n_gramm_state = n_gramm_state
        self.model_state = model_state
        
    def __split_to_sentencies(self, text: str) -> list:
        return self.tokenizer.tokenize(text)
    
    def __split_to_n_grams(self, word: str, n: int) -> list:
        return ngrams(word, n)
    
    @classmethod
    def train(cls, 
              text_corpus: str, 
              n_gramm_state=2, 
              model_state=2, 
              alphabet=RU_ALPHABET + EN_ALPHABET + ' '):
        model = dict()
        encoder = NgramEncoder(
            alphabet=alphabet, 
            n_gramm_state=n_gramm_state)
        for sentence in cls.__split_to_sentencies(cls, text_corpus):
            for key, *ngrams_list in ngrams([''.join(ngram) for ngram in cls.__split_to_n_grams(cls, sentence, n=n_gramm_state)], model_state + 1):
                ngrams_tuple = encoder.encode_ngrams_list(ngrams_list)
                encode_ngram = encoder.ngram2int[key]
                if encode_ngram in model:
                    if ngrams_tuple in model[encode_ngram]:
                        model[encode_ngram][ngrams_tuple] += 1
                    else:
                        model[encode_ngram][ngrams_tuple] = 1
                else:
                    model[encode_ngram] = {
                        ngrams_tuple: 1
                    }
        return cls(
            model=model,
            encoder=encoder,
            n_gramm_state=n_gramm_state,
            model_state=model_state)
    
    def make_word() -> str:
        pass                     

In [79]:
model = MarkovModel.train(sentence)
model.model

{1146: {(365, 359): 7,
  (368, 485): 28,
  (368, 511): 3,
  (377, 1030): 4,
  (360, 17): 1,
  (365, 317): 1},
 365: {(359, 3599): 2,
  (313, 797): 2,
  (359, 3552): 2,
  (359, 3559): 1,
  (359, 3542): 1,
  (313, 788): 6,
  (359, 3554): 1,
  (311, 665): 1,
  (311, 687): 4,
  (313, 785): 3,
  (359, 3557): 2,
  (311, 674): 3,
  (359, 3553): 1,
  (309, 552): 1,
  (359, 3541): 1,
  (318, 1139): 3,
  (317, 1038): 1,
  (317, 1030): 1,
  (313, 793): 1},
 359: {(3599, 3554): 1,
  (3542, 136): 2,
  (3555, 911): 1,
  (3555, 914): 6,
  (3555, 916): 3,
  (3547, 420): 4,
  (3557, 1033): 1,
  (3541, 74): 6,
  (3542, 125): 2,
  (3550, 614): 7,
  (3599, 3555): 2,
  (3552, 725): 6,
  (3559, 1163): 2,
  (3542, 147): 2,
  (3542, 179): 7,
  (3548, 493): 1,
  (3547, 436): 1,
  (3557, 1020): 1,
  (3556, 974): 6,
  (3557, 1035): 2,
  (3554, 858): 3,
  (3560, 1211): 3,
  (3557, 1038): 33,
  (3599, 3543): 1,
  (3558, 1094): 3,
  (3557, 1027): 1,
  (3544, 248): 2,
  (3588, 2931): 1,
  (3548, 539): 5,
  (3550, 60