# Изучение морфологической разметки

## Токенизация датасета

In [1]:
import pandas as pd

In [2]:
# Выгрузим датасет
corpora_path = '/kaggle/input/kinoart-new-reviews/corpus.csv'
df = pd.read_csv(corpora_path, sep=',', encoding='utf-8')
df.head()

Unnamed: 0,title,date,author_name,profile_link,text
0,КТО-НИБУДЬ ВИДЕЛ СЕРГЕЯ ДОБРОТВОРСКОГО(?): КРИ...,01.02.21,Зинаида Пронченко,https://kinoart.ru/search?author=2,До российского проката добралась картина Ангел...
1,ДУША ПРИПОМИНАЕТ: «ГЕРДА» НАТАЛЬИ КУДРЯШОВОЙ,18.10.21,Ксения Ильина,https://kinoart.ru/search?author=313,"В прокате «Герда», вторая полнометражная режис..."
2,"«ВСЕМ ПЛОХО, ВСЕ НЕСЧАСТНЫ, И НЕТ СПАСЕНИЯ»: В...",13.08.20,Елена Стишова,https://kinoart.ru/search?author=32,"Проект ИК о постсоветском кино «Пролегомены», ..."
3,"ЛЮК БЕССОН, ГЕРОИНЯ И НАСИЛИЕ. О ФИЛЬМЕ «НИКИТА»",18.03.19,Михаил Трофименков,https://kinoart.ru/search?author=63,Французскому режиссеру Люку Бессону исполнилос...
4,«БРАТ И СЕСТРА»: В ПОИСКАХ ПРОЩЕНИЯ,19.09.22,Яна Телова,https://kinoart.ru/search?author=437,"В прокат вышел фильм «Брат и сестра», последня..."


В дальнейшем будем использовать текст страницы. Нужно будет токенизировать текст по словам. Будем использовать open-source библиотеку SpaCy.

In [3]:
texts = df['text'].values

In [4]:
from spacy.lang.ru import Russian



In [5]:
tokenizer = Russian()
doc = tokenizer(texts[0])
words = [token.text for token in doc]
print(words)

['До', 'российского', 'проката', 'добралась', 'картина', 'Ангелины', 'Никоновой', '«', 'Кто', '-', 'нибудь', 'видел', 'мою', 'девчонку', '?', '»', ',', 'которая', 'вызвала', 'негодование', 'среди', 'кинокритиков', 'на', 'прошлогоднем', '«', 'Кинотавре', '»', '.', 'Фильм', 'снят', 'по', 'одноименным', 'мемуарам', 'Карины', 'Добротворской', ',', 'описывающим', 'ее', 'отношения', 'с', 'известным', 'кинокритиком', 'Сергеем', 'Добротворским', '.', 'Зинаида', 'Пронченко', 'анализирует', 'картину', 'и', 'объясняет', ',', 'почему', 'экранизация', 'вышла', 'слабой', '.', '\n', '«', 'Кто', '-', 'нибудь', 'видел', 'мою', 'девчонку', '»', 'снят', 'по', 'одноименному', 'автобиографическому', 'роману', 'Карины', 'Добротворской', '.', 'Возвращаться', 'к', 'книге', 'и', 'сравнивать', 'литературный', 'источник', 'с', 'его', 'экранной', 'версией', 'мы', 'здесь', 'не', 'будем', '.', 'Ведь', 'не', 'разбирают', 'же', '«', 'Анну', 'Каренину', '»', 'Толстого', 'каждый', 'раз', ',', 'когда', 'кто', '-', 'то',

Заметно, что токенизация работает довольно хорошо и качественно. 

## Морфологический анализ

### Выбор морфопарсера

Существует множество решений, основные из которых были представлены в [MorphRuEval 2017](https://github.com/dialogue-evaluation/morphoRuEval-2017) и [GramEval 2020](https://github.com/dialogue-evaluation/GramEval2020).

* [qbic](https://github.com/DanAnastasyev/GramEval2020) - ELMO и BERT модели, которые достигли топовых метрик на соревновании. Но тем не менее, будет наблюдаться множество галлюцинаций, например при лемматизации. "потерь" -> "потеь"
* [rnnmorph](https://github.com/IlyaGusev/rnnmorph) - рекуррентная нейронная сеть, у которой для самопроверки и уменьшения галлюцинаций есть словарь. Засчет этого данная модель будет достигать наилучших результатов. 
* [pymorphy2](https://github.com/pymorphy2/pymorphy2) - статистический словарный анализатор, который не использует контекст и работает быстро. Но у него очень низкое качество засчет жадного выбора наиболее вероятного варианта.

Поэтому будем использовать rnnmorph, так как он достаточно качественный и простой в архитектуре.

### RNN Morph

In [6]:
!pip install tensorflow --ignore-installed

Collecting tensorflow
  Downloading tensorflow-2.12.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (585.9 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m585.9/585.9 MB[0m [31m1.4 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hCollecting keras<2.13,>=2.12.0
  Downloading keras-2.12.0-py2.py3-none-any.whl (1.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.7/1.7 MB[0m [31m71.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting setuptools
  Downloading setuptools-67.8.0-py3-none-any.whl (1.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.1/1.1 MB[0m [31m61.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting flatbuffers>=2.0
  Downloading flatbuffers-23.5.9-py2.py3-none-any.whl (26 kB)
Collecting protobuf!=4.21.0,!=4.21.1,!=4.21.2,!=4.21.3,!=4.21.4,!=4.21.5,<5.0.0dev,>=3.20.3
  Downloading protobuf-4.23.1-cp37-abi3-manylinux2014_x86_64.whl (304 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m 

In [7]:
!pip3 install rnnmorph

Collecting rnnmorph
  Downloading rnnmorph-0.4.1.tar.gz (19.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m19.7/19.7 MB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25h  Preparing metadata (setup.py) ... [?25ldone
Collecting pymorphy2>=0.8
  Downloading pymorphy2-0.9.1-py3-none-any.whl (55 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m55.5/55.5 kB[0m [31m6.5 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting russian-tagsets==0.6
  Downloading russian-tagsets-0.6.tar.gz (23 kB)
  Preparing metadata (setup.py) ... [?25ldone
Collecting jsonpickle>=0.9.4
  Downloading jsonpickle-3.0.1-py2.py3-none-any.whl (40 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m40.5/40.5 kB[0m [31m3.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting nltk>=3.2.5
  Downloading nltk-3.8.1-py3-none-any.whl (1.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.5/1.5 MB[0m [31m52.8 MB/s[0m eta [36m0:00:00[0m


In [8]:
from rnnmorph.predictor import RNNMorphPredictor

predictor = RNNMorphPredictor(language="ru")

forms = predictor.predict(words)



Please report this to the TensorFlow team. When filing the bug, set the verbosity to 10 (on Linux, `export AUTOGRAPH_VERBOSITY=10`) and attach the full output.
Cause: closure mismatch, requested ('self', 'step_function'), but source function had ()


In [9]:
forms

[<normal_form=до; word=До; pos=ADP; tag=_; score=1.0000>,
 <normal_form=российский; word=российского; pos=ADJ; tag=Case=Gen|Degree=Pos|Gender=Masc|Number=Sing; score=0.9999>,
 <normal_form=прокат; word=проката; pos=NOUN; tag=Case=Gen|Gender=Masc|Number=Sing; score=1.0000>,
 <normal_form=добраться; word=добралась; pos=VERB; tag=Gender=Fem|Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin|Voice=Mid; score=1.0000>,
 <normal_form=картина; word=картина; pos=NOUN; tag=Case=Nom|Gender=Fem|Number=Sing; score=1.0000>,
 <normal_form=ангелина; word=Ангелины; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Sing; score=0.9995>,
 <normal_form=никонов; word=Никоновой; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Sing; score=0.9497>,
 <normal_form=«; word=«; pos=PUNCT; tag=_; score=0.9998>,
 <normal_form=кто; word=Кто; pos=PRON; tag=Case=Nom|Number=Sing; score=1.0000>,
 <normal_form=-; word=-; pos=PUNCT; tag=_; score=1.0000>,
 <normal_form=нибыть; word=нибудь; pos=ADV; tag=Degree=Pos; score=0.9031>,
 <normal_form=вид

Теперь распарсим все слова во всех текстах и сохраним данную информацию вместе с текстами, для удобного доступа. 

In [10]:
from tqdm import tqdm

In [11]:
all_docs = [tokenizer(doc) for doc in tqdm(texts)]
all_words = [[token.text for token in doc] for doc in tqdm(all_docs)]

100%|██████████| 814/814 [00:30<00:00, 26.79it/s]
100%|██████████| 814/814 [00:01<00:00, 615.21it/s]
  0%|          | 0/814 [00:00<?, ?it/s]



  0%|          | 1/814 [00:02<32:56,  2.43s/it]



  0%|          | 2/814 [00:06<45:50,  3.39s/it]

KeyboardInterrupt: 

In [13]:
rnn_morph_tags = [predictor.predict(words) for words in tqdm(all_words)]


  0%|          | 0/814 [00:00<?, ?it/s][A




  0%|          | 1/814 [00:02<36:37,  2.70s/it][A




  0%|          | 2/814 [00:05<34:32,  2.55s/it][A




  0%|          | 3/814 [00:13<1:11:47,  5.31s/it][A




  0%|          | 4/814 [00:18<1:07:20,  4.99s/it][A




  1%|          | 5/814 [00:20<55:00,  4.08s/it]  [A




  1%|          | 6/814 [00:28<1:11:23,  5.30s/it][A




  1%|          | 7/814 [00:32<1:06:04,  4.91s/it][A




  1%|          | 8/814 [00:41<1:22:53,  6.17s/it][A




  1%|          | 9/814 [00:46<1:16:54,  5.73s/it][A



  0%|          | 2/814 [02:13<15:01:00, 66.58s/it]

  1%|          | 10/814 [00:55<1:32:34,  6.91s/it][A




  1%|▏         | 11/814 [01:01<1:28:01,  6.58s/it][A




  1%|▏         | 12/814 [01:08<1:30:37,  6.78s/it][A




  2%|▏         | 13/814 [01:13<1:20:44,  6.05s/it][A




  2%|▏         | 14/814 [01:21<1:31:12,  6.84s/it][A




  2%|▏         | 15/814 [01:24<1:13:29,  5.52s/it][A




  2%|▏         | 16/814 [01:31<1:21:40,  6.14s/it][A




  2%|▏         | 17/814 [01:33<1:04:58,  4.89s/it][A




  2%|▏         | 18/814 [01:38<1:02:57,  4.75s/it][A




  2%|▏         | 19/814 [01:46<1:16:41,  5.79s/it][A




  2%|▏         | 20/814 [01:55<1:30:31,  6.84s/it][A




  3%|▎         | 21/814 [02:00<1:20:28,  6.09s/it][A




  3%|▎         | 22/814 [02:02<1:07:29,  5.11s/it][A




  3%|▎         | 23/814 [02:07<1:04:33,  4.90s/it][A




  3%|▎         | 24/814 [02:10<56:59,  4.33s/it]  [A




  3%|▎         | 25/814 [02:14<55:04,  4.19s/it][A




  3%|▎         | 26/814 [02:18<54:20,  4.14s/it][A




  3%|▎         | 27/814 [02:20<46:30,  3.55s/it][A




  3%|▎         | 28/814 [02:24<48:39,  3.71s/it][A




  4%|▎         | 29/814 [02:28<49:23,  3.78s/it][A




  4%|▎         | 30/814 [02:37<1:10:19,  5.38s/it][A




  4%|▍         | 31/814 [02:42<1:07:42,  5.19s/it][A




  4%|▍         | 32/814 [02:46<1:02:48,  4.82s/it][A




  4%|▍         | 33/814 [02:48<54:05,  4.16s/it]  [A




  4%|▍         | 34/814 [02:52<53:11,  4.09s/it][A




  4%|▍         | 35/814 [02:56<53:20,  4.11s/it][A




  4%|▍         | 36/814 [03:01<53:46,  4.15s/it][A




  5%|▍         | 37/814 [03:04<52:10,  4.03s/it][A




  5%|▍         | 38/814 [03:14<1:15:25,  5.83s/it][A




  5%|▍         | 39/814 [03:22<1:22:59,  6.42s/it][A




  5%|▍         | 40/814 [03:30<1:29:30,  6.94s/it][A




  5%|▌         | 41/814 [03:36<1:23:16,  6.46s/it][A




  5%|▌         | 42/814 [03:39<1:09:13,  5.38s/it][A




  5%|▌         | 43/814 [03:44<1:07:46,  5.27s/it][A




  5%|▌         | 44/814 [03:47<1:02:11,  4.85s/it][A




  6%|▌         | 45/814 [03:56<1:16:43,  5.99s/it][A




  6%|▌         | 46/814 [04:04<1:25:38,  6.69s/it][A




  6%|▌         | 47/814 [04:12<1:28:38,  6.93s/it][A




  6%|▌         | 48/814 [04:20<1:32:59,  7.28s/it][A




  6%|▌         | 49/814 [04:23<1:14:47,  5.87s/it][A




  6%|▌         | 50/814 [04:27<1:10:51,  5.56s/it][A




  6%|▋         | 51/814 [04:32<1:06:37,  5.24s/it][A




  6%|▋         | 52/814 [04:37<1:04:50,  5.11s/it][A




  7%|▋         | 53/814 [04:41<1:01:36,  4.86s/it][A




  7%|▋         | 54/814 [04:44<52:36,  4.15s/it]  [A




  7%|▋         | 55/814 [04:46<47:13,  3.73s/it][A




  7%|▋         | 56/814 [04:48<40:01,  3.17s/it][A




  7%|▋         | 57/814 [04:52<44:12,  3.50s/it][A




  7%|▋         | 58/814 [05:14<1:52:51,  8.96s/it][A




  7%|▋         | 59/814 [05:17<1:30:10,  7.17s/it][A




  7%|▋         | 60/814 [05:21<1:19:15,  6.31s/it][A




  7%|▋         | 61/814 [05:26<1:11:59,  5.74s/it][A




  8%|▊         | 62/814 [05:30<1:04:35,  5.15s/it][A




  8%|▊         | 63/814 [05:35<1:04:08,  5.12s/it][A




  8%|▊         | 64/814 [05:37<54:51,  4.39s/it]  [A




  8%|▊         | 65/814 [05:53<1:37:12,  7.79s/it][A




  8%|▊         | 66/814 [06:10<2:09:53, 10.42s/it][A




  8%|▊         | 67/814 [06:25<2:26:54, 11.80s/it][A




  8%|▊         | 68/814 [06:29<1:58:05,  9.50s/it][A




  8%|▊         | 69/814 [06:39<1:59:44,  9.64s/it][A




  9%|▊         | 70/814 [06:43<1:39:03,  7.99s/it][A




  9%|▊         | 71/814 [06:47<1:25:18,  6.89s/it][A




  9%|▉         | 72/814 [06:49<1:07:16,  5.44s/it][A




  9%|▉         | 73/814 [06:53<1:01:55,  5.01s/it][A




  9%|▉         | 74/814 [07:01<1:12:06,  5.85s/it][A




  9%|▉         | 75/814 [07:04<1:00:36,  4.92s/it][A




  9%|▉         | 76/814 [07:08<57:43,  4.69s/it]  [A




  9%|▉         | 77/814 [07:11<51:44,  4.21s/it][A




 10%|▉         | 78/814 [07:14<46:51,  3.82s/it][A




 10%|▉         | 79/814 [07:18<48:38,  3.97s/it][A




 10%|▉         | 80/814 [07:27<1:06:20,  5.42s/it][A




 10%|▉         | 81/814 [07:32<1:05:24,  5.35s/it][A




 10%|█         | 82/814 [07:37<1:01:18,  5.03s/it][A




 10%|█         | 83/814 [07:41<58:49,  4.83s/it]  [A




 10%|█         | 84/814 [07:46<59:03,  4.85s/it][A




 10%|█         | 85/814 [07:48<50:49,  4.18s/it][A




 11%|█         | 86/814 [07:57<1:07:59,  5.60s/it][A




 11%|█         | 87/814 [08:00<56:13,  4.64s/it]  [A




 11%|█         | 88/814 [08:03<52:47,  4.36s/it][A




 11%|█         | 89/814 [08:12<1:08:27,  5.67s/it][A




 11%|█         | 90/814 [08:30<1:52:59,  9.36s/it][A




 11%|█         | 91/814 [08:33<1:28:04,  7.31s/it][A




 11%|█▏        | 92/814 [08:37<1:17:18,  6.43s/it][A




 11%|█▏        | 93/814 [08:39<1:02:16,  5.18s/it][A




 12%|█▏        | 94/814 [08:42<52:03,  4.34s/it]  [A




 12%|█▏        | 95/814 [08:46<51:58,  4.34s/it][A




 12%|█▏        | 96/814 [08:50<51:57,  4.34s/it][A




 12%|█▏        | 97/814 [08:55<51:14,  4.29s/it][A




 12%|█▏        | 98/814 [08:58<49:36,  4.16s/it][A




 12%|█▏        | 99/814 [09:01<43:23,  3.64s/it][A




 12%|█▏        | 100/814 [09:10<1:04:28,  5.42s/it][A




 12%|█▏        | 101/814 [09:15<1:00:57,  5.13s/it][A




 13%|█▎        | 102/814 [09:19<58:18,  4.91s/it]  [A




 13%|█▎        | 103/814 [09:24<57:43,  4.87s/it][A




 13%|█▎        | 104/814 [09:32<1:09:08,  5.84s/it][A




 13%|█▎        | 105/814 [09:37<1:05:04,  5.51s/it][A




 13%|█▎        | 106/814 [09:39<52:54,  4.48s/it]  [A




 13%|█▎        | 107/814 [09:41<44:46,  3.80s/it][A




 13%|█▎        | 108/814 [09:46<47:42,  4.05s/it][A




 13%|█▎        | 109/814 [09:54<1:01:18,  5.22s/it][A




 14%|█▎        | 110/814 [10:02<1:11:42,  6.11s/it][A




 14%|█▎        | 111/814 [10:10<1:18:05,  6.67s/it][A




 14%|█▍        | 112/814 [10:12<1:02:38,  5.35s/it][A




 14%|█▍        | 113/814 [10:14<51:54,  4.44s/it]  [A




 14%|█▍        | 114/814 [10:19<50:33,  4.33s/it][A




 14%|█▍        | 115/814 [10:29<1:11:05,  6.10s/it][A




 14%|█▍        | 116/814 [10:31<58:48,  5.06s/it]  [A




 14%|█▍        | 117/814 [10:35<55:14,  4.76s/it][A




 14%|█▍        | 118/814 [10:38<46:52,  4.04s/it][A




 15%|█▍        | 119/814 [10:42<46:51,  4.04s/it][A




 15%|█▍        | 120/814 [10:47<49:14,  4.26s/it][A




 15%|█▍        | 121/814 [10:56<1:07:40,  5.86s/it][A




 15%|█▍        | 122/814 [11:04<1:13:25,  6.37s/it][A




 15%|█▌        | 123/814 [11:08<1:06:16,  5.75s/it][A




 15%|█▌        | 124/814 [11:13<1:02:42,  5.45s/it][A




 15%|█▌        | 125/814 [11:31<1:47:51,  9.39s/it][A




 15%|█▌        | 126/814 [11:36<1:31:30,  7.98s/it][A




 16%|█▌        | 127/814 [11:39<1:15:08,  6.56s/it][A




 16%|█▌        | 128/814 [11:43<1:03:22,  5.54s/it][A




 16%|█▌        | 129/814 [11:51<1:13:03,  6.40s/it][A




 16%|█▌        | 130/814 [11:58<1:13:44,  6.47s/it][A




 16%|█▌        | 131/814 [12:00<1:00:39,  5.33s/it][A




 16%|█▌        | 132/814 [12:05<58:56,  5.19s/it]  [A




 16%|█▋        | 133/814 [12:09<54:08,  4.77s/it][A




 16%|█▋        | 134/814 [12:11<45:55,  4.05s/it][A




 17%|█▋        | 135/814 [12:27<1:27:03,  7.69s/it][A




 17%|█▋        | 136/814 [12:30<1:10:07,  6.21s/it][A




 17%|█▋        | 137/814 [12:33<57:43,  5.12s/it]  [A




 17%|█▋        | 138/814 [12:35<47:52,  4.25s/it][A




 17%|█▋        | 139/814 [12:38<44:01,  3.91s/it][A




 17%|█▋        | 140/814 [12:42<44:40,  3.98s/it][A




 17%|█▋        | 141/814 [12:47<46:04,  4.11s/it][A




 17%|█▋        | 142/814 [12:49<40:41,  3.63s/it][A




 18%|█▊        | 143/814 [12:52<36:50,  3.29s/it][A




 18%|█▊        | 144/814 [12:55<37:34,  3.36s/it][A




 18%|█▊        | 145/814 [13:03<53:39,  4.81s/it][A




 18%|█▊        | 146/814 [13:08<53:29,  4.80s/it][A




 18%|█▊        | 147/814 [13:13<52:48,  4.75s/it][A




 18%|█▊        | 148/814 [13:21<1:05:00,  5.86s/it][A




 18%|█▊        | 149/814 [13:23<52:46,  4.76s/it]  [A




 18%|█▊        | 150/814 [13:28<53:05,  4.80s/it][A




 19%|█▊        | 151/814 [13:33<51:16,  4.64s/it][A




 19%|█▊        | 152/814 [13:41<1:05:10,  5.91s/it][A




 19%|█▉        | 153/814 [13:52<1:19:51,  7.25s/it][A




 19%|█▉        | 154/814 [13:56<1:08:50,  6.26s/it][A




 19%|█▉        | 155/814 [14:00<1:01:05,  5.56s/it][A




 19%|█▉        | 156/814 [14:04<57:15,  5.22s/it]  [A




 19%|█▉        | 157/814 [14:21<1:34:16,  8.61s/it][A




 19%|█▉        | 158/814 [14:25<1:19:09,  7.24s/it][A




 20%|█▉        | 159/814 [14:29<1:09:47,  6.39s/it][A




 20%|█▉        | 160/814 [14:33<1:02:11,  5.71s/it][A




 20%|█▉        | 161/814 [14:36<53:30,  4.92s/it]  [A




 20%|█▉        | 162/814 [14:40<50:45,  4.67s/it][A




 20%|██        | 163/814 [14:43<43:26,  4.00s/it][A




 20%|██        | 164/814 [14:48<46:02,  4.25s/it][A




 20%|██        | 165/814 [14:52<45:42,  4.23s/it][A




 20%|██        | 166/814 [14:56<44:39,  4.13s/it][A




 21%|██        | 167/814 [14:59<40:33,  3.76s/it][A




 21%|██        | 168/814 [15:03<41:22,  3.84s/it][A




 21%|██        | 169/814 [15:06<40:03,  3.73s/it][A




 21%|██        | 170/814 [15:11<43:09,  4.02s/it][A




 21%|██        | 171/814 [15:16<45:03,  4.20s/it][A




 21%|██        | 172/814 [15:23<55:19,  5.17s/it][A




 21%|██▏       | 173/814 [15:33<1:11:28,  6.69s/it][A




 21%|██▏       | 174/814 [15:36<59:46,  5.60s/it]  [A




 21%|██▏       | 175/814 [15:39<49:21,  4.64s/it][A




 22%|██▏       | 176/814 [15:43<48:51,  4.60s/it][A




 22%|██▏       | 177/814 [15:48<49:27,  4.66s/it][A




 22%|██▏       | 178/814 [15:53<50:33,  4.77s/it][A




 22%|██▏       | 179/814 [15:56<44:31,  4.21s/it][A




 22%|██▏       | 180/814 [15:58<38:29,  3.64s/it][A




 22%|██▏       | 181/814 [16:07<53:27,  5.07s/it][A




 22%|██▏       | 182/814 [16:09<43:55,  4.17s/it][A




 22%|██▏       | 183/814 [16:17<56:43,  5.39s/it][A




 23%|██▎       | 184/814 [16:19<45:18,  4.32s/it][A




 23%|██▎       | 185/814 [16:24<46:50,  4.47s/it][A




 23%|██▎       | 186/814 [16:35<1:07:46,  6.47s/it][A




 23%|██▎       | 187/814 [16:38<57:19,  5.49s/it]  [A




 23%|██▎       | 188/814 [16:42<53:08,  5.09s/it][A




 23%|██▎       | 189/814 [16:45<47:48,  4.59s/it][A




 23%|██▎       | 190/814 [16:48<42:08,  4.05s/it][A




 23%|██▎       | 191/814 [16:58<58:49,  5.67s/it][A




 24%|██▎       | 192/814 [17:03<56:39,  5.47s/it][A




 24%|██▎       | 193/814 [17:07<51:44,  5.00s/it][A




 24%|██▍       | 194/814 [17:09<44:14,  4.28s/it][A




 24%|██▍       | 195/814 [17:14<44:49,  4.35s/it][A




 24%|██▍       | 196/814 [17:22<56:22,  5.47s/it][A




 24%|██▍       | 197/814 [17:26<51:24,  5.00s/it][A




 24%|██▍       | 198/814 [17:29<46:36,  4.54s/it][A




 24%|██▍       | 199/814 [17:32<42:37,  4.16s/it][A




 25%|██▍       | 200/814 [17:41<56:02,  5.48s/it][A




 25%|██▍       | 201/814 [17:45<51:32,  5.05s/it][A




 25%|██▍       | 202/814 [17:49<49:12,  4.82s/it][A




 25%|██▍       | 203/814 [17:52<44:00,  4.32s/it][A




 25%|██▌       | 204/814 [17:57<45:04,  4.43s/it][A




 25%|██▌       | 205/814 [18:02<44:50,  4.42s/it][A




 25%|██▌       | 206/814 [18:05<40:51,  4.03s/it][A




 25%|██▌       | 207/814 [18:07<35:22,  3.50s/it][A




 26%|██▌       | 208/814 [18:11<36:18,  3.59s/it][A




 26%|██▌       | 209/814 [18:15<39:27,  3.91s/it][A




 26%|██▌       | 210/814 [18:18<35:46,  3.55s/it][A




 26%|██▌       | 211/814 [18:21<32:30,  3.23s/it][A




 26%|██▌       | 212/814 [18:25<34:37,  3.45s/it][A




 26%|██▌       | 213/814 [18:29<36:32,  3.65s/it][A




 26%|██▋       | 214/814 [18:31<33:01,  3.30s/it][A




 26%|██▋       | 215/814 [18:39<46:52,  4.70s/it][A




 27%|██▋       | 216/814 [18:44<47:01,  4.72s/it][A




 27%|██▋       | 217/814 [18:48<44:59,  4.52s/it][A




 27%|██▋       | 218/814 [18:53<45:32,  4.58s/it][A




 27%|██▋       | 219/814 [18:57<43:41,  4.41s/it][A




 27%|██▋       | 220/814 [19:03<47:54,  4.84s/it][A




 27%|██▋       | 221/814 [19:05<42:09,  4.27s/it][A




 27%|██▋       | 222/814 [19:13<52:57,  5.37s/it][A




 27%|██▋       | 223/814 [19:18<49:15,  5.00s/it][A




 28%|██▊       | 224/814 [19:25<57:05,  5.81s/it][A




 28%|██▊       | 225/814 [19:29<51:56,  5.29s/it][A




 28%|██▊       | 226/814 [19:33<48:11,  4.92s/it][A




 28%|██▊       | 227/814 [19:36<40:54,  4.18s/it][A




 28%|██▊       | 228/814 [19:44<51:28,  5.27s/it][A




 28%|██▊       | 229/814 [19:48<49:36,  5.09s/it][A




 28%|██▊       | 230/814 [19:56<57:42,  5.93s/it][A




 28%|██▊       | 231/814 [19:59<49:40,  5.11s/it][A




 29%|██▊       | 232/814 [20:02<41:39,  4.29s/it][A




 29%|██▊       | 233/814 [20:06<41:55,  4.33s/it][A




 29%|██▊       | 234/814 [20:10<41:27,  4.29s/it][A




 29%|██▉       | 235/814 [20:14<40:47,  4.23s/it][A




 29%|██▉       | 236/814 [20:17<34:43,  3.60s/it][A




 29%|██▉       | 237/814 [20:19<31:19,  3.26s/it][A




 29%|██▉       | 238/814 [20:24<35:13,  3.67s/it][A




 29%|██▉       | 239/814 [20:26<31:15,  3.26s/it][A




 29%|██▉       | 240/814 [20:36<49:36,  5.18s/it][A




 30%|██▉       | 241/814 [20:40<48:01,  5.03s/it][A




 30%|██▉       | 242/814 [20:45<47:08,  4.95s/it][A




 30%|██▉       | 243/814 [20:50<46:39,  4.90s/it][A




 30%|██▉       | 244/814 [20:52<39:36,  4.17s/it][A




 30%|███       | 245/814 [20:57<40:47,  4.30s/it][A




 30%|███       | 246/814 [21:00<36:14,  3.83s/it][A




 30%|███       | 247/814 [21:04<36:30,  3.86s/it][A




 30%|███       | 248/814 [21:06<32:12,  3.41s/it][A




 31%|███       | 249/814 [21:10<33:28,  3.56s/it][A




 31%|███       | 250/814 [21:14<34:47,  3.70s/it][A




 31%|███       | 251/814 [21:18<35:26,  3.78s/it][A




 31%|███       | 252/814 [21:25<45:45,  4.88s/it][A




 31%|███       | 253/814 [21:31<46:42,  5.00s/it][A




 31%|███       | 254/814 [21:35<44:03,  4.72s/it][A




 31%|███▏      | 255/814 [21:38<39:04,  4.19s/it][A




 31%|███▏      | 256/814 [21:41<35:28,  3.81s/it][A




 32%|███▏      | 257/814 [21:49<48:27,  5.22s/it][A




 32%|███▏      | 258/814 [21:52<40:43,  4.39s/it][A




 32%|███▏      | 259/814 [21:56<40:21,  4.36s/it][A




 32%|███▏      | 260/814 [22:00<39:51,  4.32s/it][A




 32%|███▏      | 261/814 [22:09<53:10,  5.77s/it][A




 32%|███▏      | 262/814 [22:13<47:22,  5.15s/it][A




 32%|███▏      | 263/814 [22:17<45:35,  4.96s/it][A




 32%|███▏      | 264/814 [22:22<45:40,  4.98s/it][A




 33%|███▎      | 265/814 [22:25<38:57,  4.26s/it][A




 33%|███▎      | 266/814 [22:33<49:10,  5.38s/it][A




 33%|███▎      | 267/814 [22:41<55:52,  6.13s/it][A




 33%|███▎      | 268/814 [22:44<46:18,  5.09s/it][A




 33%|███▎      | 269/814 [23:04<1:26:44,  9.55s/it][A




 33%|███▎      | 270/814 [23:08<1:11:34,  7.89s/it][A




 33%|███▎      | 271/814 [23:16<1:11:39,  7.92s/it][A




 33%|███▎      | 272/814 [23:18<56:01,  6.20s/it]  [A




 34%|███▎      | 273/814 [23:22<49:47,  5.52s/it][A




 34%|███▎      | 274/814 [23:24<42:07,  4.68s/it][A




 34%|███▍      | 275/814 [23:43<1:19:05,  8.80s/it][A




 34%|███▍      | 276/814 [23:47<1:07:13,  7.50s/it][A




 34%|███▍      | 277/814 [23:50<53:03,  5.93s/it]  [A




 34%|███▍      | 278/814 [23:53<45:10,  5.06s/it][A




 34%|███▍      | 279/814 [23:57<43:20,  4.86s/it][A




 34%|███▍      | 280/814 [24:06<53:12,  5.98s/it][A




 35%|███▍      | 281/814 [24:09<47:09,  5.31s/it][A




 35%|███▍      | 282/814 [24:14<44:31,  5.02s/it][A




 35%|███▍      | 283/814 [24:20<46:48,  5.29s/it][A




 35%|███▍      | 284/814 [24:22<40:12,  4.55s/it][A




 35%|███▌      | 285/814 [24:30<48:09,  5.46s/it][A




 35%|███▌      | 286/814 [24:34<44:45,  5.09s/it][A




 35%|███▌      | 287/814 [24:42<53:01,  6.04s/it][A




 35%|███▌      | 288/814 [24:46<45:36,  5.20s/it][A




 36%|███▌      | 289/814 [25:02<1:13:57,  8.45s/it][A




 36%|███▌      | 290/814 [25:17<1:32:56, 10.64s/it][A




 36%|███▌      | 291/814 [25:27<1:29:51, 10.31s/it][A




 36%|███▌      | 292/814 [25:32<1:14:55,  8.61s/it][A




 36%|███▌      | 293/814 [25:36<1:03:27,  7.31s/it][A




 36%|███▌      | 294/814 [25:40<55:55,  6.45s/it]  [A




 36%|███▌      | 295/814 [25:44<49:20,  5.70s/it][A




 36%|███▋      | 296/814 [25:49<46:17,  5.36s/it][A




 36%|███▋      | 297/814 [26:05<1:13:58,  8.59s/it][A




 37%|███▋      | 298/814 [26:10<1:03:47,  7.42s/it][A




 37%|███▋      | 299/814 [26:12<49:51,  5.81s/it]  [A




 37%|███▋      | 300/814 [26:16<44:55,  5.24s/it][A




 37%|███▋      | 301/814 [26:32<1:13:15,  8.57s/it][A




 37%|███▋      | 302/814 [26:36<1:01:50,  7.25s/it][A




 37%|███▋      | 303/814 [26:40<53:20,  6.26s/it]  [A




 37%|███▋      | 304/814 [26:43<43:34,  5.13s/it][A




 37%|███▋      | 305/814 [26:46<40:11,  4.74s/it][A




 38%|███▊      | 306/814 [26:55<49:33,  5.85s/it][A




 38%|███▊      | 307/814 [26:58<43:03,  5.10s/it][A




 38%|███▊      | 308/814 [27:02<40:42,  4.83s/it][A




 38%|███▊      | 309/814 [27:05<35:03,  4.17s/it][A




 38%|███▊      | 310/814 [27:08<30:46,  3.66s/it][A




 38%|███▊      | 311/814 [27:12<31:58,  3.81s/it][A




 38%|███▊      | 312/814 [27:14<27:43,  3.31s/it][A




 38%|███▊      | 313/814 [27:17<26:14,  3.14s/it][A




 39%|███▊      | 314/814 [27:26<41:05,  4.93s/it][A




 39%|███▊      | 315/814 [27:34<48:29,  5.83s/it][A




 39%|███▉      | 316/814 [27:38<44:58,  5.42s/it][A




 39%|███▉      | 317/814 [27:47<53:58,  6.52s/it][A




 39%|███▉      | 318/814 [27:50<45:12,  5.47s/it][A




 39%|███▉      | 319/814 [27:58<52:08,  6.32s/it][A




 39%|███▉      | 320/814 [28:03<47:16,  5.74s/it][A




 39%|███▉      | 321/814 [28:07<43:07,  5.25s/it][A




 40%|███▉      | 322/814 [28:14<48:16,  5.89s/it][A




 40%|███▉      | 323/814 [28:19<44:02,  5.38s/it][A




 40%|███▉      | 324/814 [28:21<36:28,  4.47s/it][A




 40%|███▉      | 325/814 [28:26<36:58,  4.54s/it][A




 40%|████      | 326/814 [28:34<46:43,  5.74s/it][A




 40%|████      | 327/814 [28:36<37:45,  4.65s/it][A




 40%|████      | 328/814 [28:41<37:10,  4.59s/it][A




 40%|████      | 329/814 [28:45<36:38,  4.53s/it][A




 41%|████      | 330/814 [28:48<32:32,  4.03s/it][A




 41%|████      | 331/814 [28:52<32:45,  4.07s/it][A




 41%|████      | 332/814 [29:00<42:20,  5.27s/it][A




 41%|████      | 333/814 [29:05<39:57,  4.98s/it][A




 41%|████      | 334/814 [29:07<34:08,  4.27s/it][A




 41%|████      | 335/814 [29:12<35:40,  4.47s/it][A




 41%|████▏     | 336/814 [29:16<35:08,  4.41s/it][A




 41%|████▏     | 337/814 [29:20<33:51,  4.26s/it][A




 42%|████▏     | 338/814 [29:25<34:10,  4.31s/it][A




 42%|████▏     | 339/814 [29:29<35:01,  4.42s/it][A




 42%|████▏     | 340/814 [29:45<1:02:42,  7.94s/it][A




 42%|████▏     | 341/814 [29:50<53:47,  6.82s/it]  [A




 42%|████▏     | 342/814 [29:52<43:39,  5.55s/it][A




 42%|████▏     | 343/814 [29:55<37:34,  4.79s/it][A




 42%|████▏     | 344/814 [30:04<46:36,  5.95s/it][A




 42%|████▏     | 345/814 [30:11<50:04,  6.41s/it][A




 43%|████▎     | 346/814 [30:14<40:31,  5.20s/it][A




 43%|████▎     | 347/814 [30:18<37:33,  4.83s/it][A




 43%|████▎     | 348/814 [30:22<36:25,  4.69s/it][A




 43%|████▎     | 349/814 [30:24<30:52,  3.98s/it][A




 43%|████▎     | 350/814 [30:29<32:01,  4.14s/it][A




 43%|████▎     | 351/814 [30:39<44:39,  5.79s/it][A




 43%|████▎     | 352/814 [30:43<41:17,  5.36s/it][A




 43%|████▎     | 353/814 [30:47<37:57,  4.94s/it][A




 43%|████▎     | 354/814 [30:51<36:37,  4.78s/it][A




 44%|████▎     | 355/814 [30:55<34:30,  4.51s/it][A




 44%|████▎     | 356/814 [30:59<32:34,  4.27s/it][A




 44%|████▍     | 357/814 [31:04<33:47,  4.44s/it][A




 44%|████▍     | 358/814 [31:06<29:21,  3.86s/it][A




 44%|████▍     | 359/814 [31:09<25:45,  3.40s/it][A




 44%|████▍     | 360/814 [31:11<23:48,  3.15s/it][A




 44%|████▍     | 361/814 [31:16<28:18,  3.75s/it][A




 44%|████▍     | 362/814 [31:32<55:29,  7.37s/it][A




 45%|████▍     | 363/814 [31:37<50:39,  6.74s/it][A




 45%|████▍     | 364/814 [31:42<46:06,  6.15s/it][A




 45%|████▍     | 365/814 [31:47<43:00,  5.75s/it][A




 45%|████▍     | 366/814 [31:51<38:34,  5.17s/it][A




 45%|████▌     | 367/814 [31:55<35:58,  4.83s/it][A




 45%|████▌     | 368/814 [31:58<31:49,  4.28s/it][A




 45%|████▌     | 369/814 [32:02<31:41,  4.27s/it][A




 45%|████▌     | 370/814 [32:10<39:05,  5.28s/it][A




 46%|████▌     | 371/814 [32:15<38:14,  5.18s/it][A




 46%|████▌     | 372/814 [32:20<37:51,  5.14s/it][A




 46%|████▌     | 373/814 [32:28<43:38,  5.94s/it][A




 46%|████▌     | 374/814 [32:30<35:30,  4.84s/it][A




 46%|████▌     | 375/814 [32:34<35:07,  4.80s/it][A




 46%|████▌     | 376/814 [32:39<33:53,  4.64s/it][A




 46%|████▋     | 377/814 [32:48<43:22,  5.96s/it][A




 46%|████▋     | 378/814 [32:52<39:24,  5.42s/it][A




 47%|████▋     | 379/814 [33:00<44:20,  6.12s/it][A




 47%|████▋     | 380/814 [33:09<51:24,  7.11s/it][A




 47%|████▋     | 381/814 [33:14<45:40,  6.33s/it][A




 47%|████▋     | 382/814 [33:21<48:52,  6.79s/it][A




 47%|████▋     | 383/814 [33:25<42:20,  5.89s/it][A




 47%|████▋     | 384/814 [33:29<38:01,  5.31s/it][A




 47%|████▋     | 385/814 [33:37<42:49,  5.99s/it][A




 47%|████▋     | 386/814 [33:41<38:10,  5.35s/it][A




 48%|████▊     | 387/814 [33:45<36:00,  5.06s/it][A




 48%|████▊     | 388/814 [33:49<33:21,  4.70s/it][A




 48%|████▊     | 389/814 [33:53<32:21,  4.57s/it][A




 48%|████▊     | 390/814 [34:01<38:56,  5.51s/it][A




 48%|████▊     | 391/814 [34:05<36:53,  5.23s/it][A




 48%|████▊     | 392/814 [34:11<37:46,  5.37s/it][A




 48%|████▊     | 393/814 [34:16<35:41,  5.09s/it][A




 48%|████▊     | 394/814 [34:18<30:07,  4.30s/it][A




 49%|████▊     | 395/814 [34:23<31:38,  4.53s/it][A




 49%|████▊     | 396/814 [34:32<40:11,  5.77s/it][A




 49%|████▉     | 397/814 [34:36<37:49,  5.44s/it][A




 49%|████▉     | 398/814 [34:41<35:06,  5.06s/it][A




 49%|████▉     | 399/814 [34:45<34:03,  4.92s/it][A




 49%|████▉     | 400/814 [34:47<28:26,  4.12s/it][A




 49%|████▉     | 401/814 [34:50<24:49,  3.61s/it][A




 49%|████▉     | 402/814 [34:54<26:10,  3.81s/it][A




 50%|████▉     | 403/814 [35:04<39:17,  5.74s/it][A




 50%|████▉     | 404/814 [35:13<44:14,  6.47s/it][A




 50%|████▉     | 405/814 [35:16<37:38,  5.52s/it][A




 50%|████▉     | 406/814 [35:18<31:12,  4.59s/it][A




 50%|█████     | 407/814 [35:28<41:18,  6.09s/it][A




 50%|█████     | 408/814 [35:32<37:30,  5.54s/it][A




 50%|█████     | 409/814 [35:35<31:53,  4.72s/it][A




 50%|█████     | 410/814 [35:37<26:56,  4.00s/it][A




 50%|█████     | 411/814 [35:46<35:55,  5.35s/it][A




 51%|█████     | 412/814 [35:50<33:14,  4.96s/it][A




 51%|█████     | 413/814 [35:52<27:44,  4.15s/it][A




 51%|█████     | 414/814 [35:55<24:31,  3.68s/it][A




 51%|█████     | 415/814 [35:59<25:59,  3.91s/it][A




 51%|█████     | 416/814 [36:03<25:52,  3.90s/it][A




 51%|█████     | 417/814 [36:08<27:39,  4.18s/it][A




 51%|█████▏    | 418/814 [36:12<28:09,  4.27s/it][A




 51%|█████▏    | 419/814 [36:20<33:55,  5.15s/it][A




 52%|█████▏    | 420/814 [36:24<32:38,  4.97s/it][A




 52%|█████▏    | 421/814 [36:28<30:44,  4.69s/it][A




 52%|█████▏    | 422/814 [36:36<36:59,  5.66s/it][A




 52%|█████▏    | 423/814 [36:41<35:30,  5.45s/it][A




 52%|█████▏    | 424/814 [36:44<29:47,  4.58s/it][A




 52%|█████▏    | 425/814 [36:48<30:21,  4.68s/it][A




 52%|█████▏    | 426/814 [36:56<36:07,  5.59s/it][A




 52%|█████▏    | 427/814 [37:01<34:25,  5.34s/it][A




 53%|█████▎    | 428/814 [37:05<31:40,  4.92s/it][A




 53%|█████▎    | 429/814 [37:14<38:48,  6.05s/it][A




 53%|█████▎    | 430/814 [37:29<56:35,  8.84s/it][A




 53%|█████▎    | 431/814 [37:33<47:58,  7.52s/it][A




 53%|█████▎    | 432/814 [37:37<40:21,  6.34s/it][A




 53%|█████▎    | 433/814 [37:39<32:14,  5.08s/it][A




 53%|█████▎    | 434/814 [37:43<29:45,  4.70s/it][A




 53%|█████▎    | 435/814 [37:46<27:18,  4.32s/it][A




 54%|█████▎    | 436/814 [37:50<26:54,  4.27s/it][A




 54%|█████▎    | 437/814 [37:55<26:31,  4.22s/it][A




 54%|█████▍    | 438/814 [37:59<26:09,  4.17s/it][A




 54%|█████▍    | 439/814 [38:08<35:33,  5.69s/it][A




 54%|█████▍    | 440/814 [38:11<31:15,  5.02s/it][A




 54%|█████▍    | 441/814 [38:15<29:24,  4.73s/it][A




 54%|█████▍    | 442/814 [38:23<35:19,  5.70s/it][A




 54%|█████▍    | 443/814 [38:27<31:59,  5.17s/it][A




 55%|█████▍    | 444/814 [38:31<29:35,  4.80s/it][A




 55%|█████▍    | 445/814 [38:33<24:32,  3.99s/it][A




 55%|█████▍    | 446/814 [38:38<25:14,  4.12s/it][A




 55%|█████▍    | 447/814 [38:42<24:55,  4.08s/it][A




 55%|█████▌    | 448/814 [38:47<27:08,  4.45s/it][A




 55%|█████▌    | 449/814 [38:56<36:09,  5.94s/it][A




 55%|█████▌    | 450/814 [39:01<32:35,  5.37s/it][A




 55%|█████▌    | 451/814 [39:08<36:54,  6.10s/it][A




 56%|█████▌    | 452/814 [39:13<34:50,  5.77s/it][A




 56%|█████▌    | 453/814 [39:22<40:39,  6.76s/it][A




 56%|█████▌    | 454/814 [39:27<37:12,  6.20s/it][A




 56%|█████▌    | 455/814 [39:36<41:40,  6.96s/it][A




 56%|█████▌    | 456/814 [39:40<36:42,  6.15s/it][A




 56%|█████▌    | 457/814 [39:49<40:19,  6.78s/it][A




 56%|█████▋    | 458/814 [39:56<41:00,  6.91s/it][A




 56%|█████▋    | 459/814 [40:00<35:49,  6.05s/it][A




 57%|█████▋    | 460/814 [40:04<32:23,  5.49s/it][A




 57%|█████▋    | 461/814 [40:08<30:08,  5.12s/it][A




 57%|█████▋    | 462/814 [40:11<25:05,  4.28s/it][A




 57%|█████▋    | 463/814 [40:18<31:11,  5.33s/it][A




 57%|█████▋    | 464/814 [40:21<25:33,  4.38s/it][A




 57%|█████▋    | 465/814 [40:24<24:47,  4.26s/it][A




 57%|█████▋    | 466/814 [40:29<24:42,  4.26s/it][A




 57%|█████▋    | 467/814 [40:33<25:26,  4.40s/it][A




 57%|█████▋    | 468/814 [40:37<24:31,  4.25s/it][A




 58%|█████▊    | 469/814 [40:40<21:15,  3.70s/it][A




 58%|█████▊    | 470/814 [40:45<23:12,  4.05s/it][A




 58%|█████▊    | 471/814 [40:50<25:13,  4.41s/it][A




 58%|█████▊    | 472/814 [40:52<20:53,  3.67s/it][A




 58%|█████▊    | 473/814 [40:56<21:23,  3.76s/it][A




 58%|█████▊    | 474/814 [41:00<21:52,  3.86s/it][A




 58%|█████▊    | 475/814 [41:02<19:26,  3.44s/it][A




 58%|█████▊    | 476/814 [41:07<20:54,  3.71s/it][A




 59%|█████▊    | 477/814 [41:09<19:15,  3.43s/it][A




 59%|█████▊    | 478/814 [41:14<20:39,  3.69s/it][A




 59%|█████▉    | 479/814 [41:18<21:57,  3.93s/it][A




 59%|█████▉    | 480/814 [41:27<29:27,  5.29s/it][A




 59%|█████▉    | 481/814 [41:31<27:52,  5.02s/it][A




 59%|█████▉    | 482/814 [41:35<26:33,  4.80s/it][A




 59%|█████▉    | 483/814 [41:38<22:48,  4.13s/it][A




 59%|█████▉    | 484/814 [41:42<22:15,  4.05s/it][A




 60%|█████▉    | 485/814 [41:45<20:19,  3.71s/it][A




 60%|█████▉    | 486/814 [41:49<21:43,  3.97s/it][A




 60%|█████▉    | 487/814 [41:54<22:35,  4.14s/it][A




 60%|█████▉    | 488/814 [42:09<40:39,  7.48s/it][A




 60%|██████    | 489/814 [42:13<35:08,  6.49s/it][A




 60%|██████    | 490/814 [42:17<31:09,  5.77s/it][A




 60%|██████    | 491/814 [42:22<28:56,  5.38s/it][A




 60%|██████    | 492/814 [42:24<24:08,  4.50s/it][A




 61%|██████    | 493/814 [42:27<20:46,  3.88s/it][A




 61%|██████    | 494/814 [42:29<18:22,  3.44s/it][A




 61%|██████    | 495/814 [42:31<16:14,  3.05s/it][A




 61%|██████    | 496/814 [42:34<15:55,  3.01s/it][A




 61%|██████    | 497/814 [42:37<15:11,  2.88s/it][A




 61%|██████    | 498/814 [42:42<18:41,  3.55s/it][A




 61%|██████▏   | 499/814 [42:44<16:52,  3.21s/it][A




 61%|██████▏   | 500/814 [42:47<15:40,  2.99s/it][A




 62%|██████▏   | 501/814 [42:49<14:19,  2.75s/it][A




 62%|██████▏   | 502/814 [42:59<25:04,  4.82s/it][A




 62%|██████▏   | 503/814 [43:03<24:24,  4.71s/it][A




 62%|██████▏   | 504/814 [43:07<23:21,  4.52s/it][A




 62%|██████▏   | 505/814 [43:12<23:01,  4.47s/it][A




 62%|██████▏   | 506/814 [43:14<19:10,  3.74s/it][A




 62%|██████▏   | 507/814 [43:23<27:59,  5.47s/it][A




 62%|██████▏   | 508/814 [43:31<31:18,  6.14s/it][A




 63%|██████▎   | 509/814 [43:36<29:04,  5.72s/it][A




 63%|██████▎   | 510/814 [43:39<25:26,  5.02s/it][A




 63%|██████▎   | 511/814 [43:41<21:22,  4.23s/it][A




 63%|██████▎   | 512/814 [43:45<20:47,  4.13s/it][A




 63%|██████▎   | 513/814 [43:49<20:55,  4.17s/it][A




 63%|██████▎   | 514/814 [43:52<18:13,  3.65s/it][A




 63%|██████▎   | 515/814 [43:54<16:14,  3.26s/it][A




 63%|██████▎   | 516/814 [43:59<18:28,  3.72s/it][A




 64%|██████▎   | 517/814 [44:04<20:03,  4.05s/it][A




 64%|██████▎   | 518/814 [44:08<20:29,  4.16s/it][A




 64%|██████▍   | 519/814 [44:11<17:36,  3.58s/it][A




 64%|██████▍   | 520/814 [44:13<15:57,  3.26s/it][A




 64%|██████▍   | 521/814 [44:21<23:06,  4.73s/it][A




 64%|██████▍   | 522/814 [44:33<33:42,  6.93s/it][A




 64%|██████▍   | 523/814 [44:37<29:25,  6.07s/it][A




 64%|██████▍   | 524/814 [44:42<27:32,  5.70s/it][A




 64%|██████▍   | 525/814 [44:51<31:59,  6.64s/it][A




 65%|██████▍   | 526/814 [44:53<25:15,  5.26s/it][A




 65%|██████▍   | 527/814 [44:57<23:18,  4.87s/it][A




 65%|██████▍   | 528/814 [45:06<28:43,  6.03s/it][A




 65%|██████▍   | 529/814 [45:14<31:14,  6.58s/it][A




 65%|██████▌   | 530/814 [45:22<33:04,  6.99s/it][A




 65%|██████▌   | 531/814 [45:31<36:06,  7.66s/it][A




 65%|██████▌   | 532/814 [45:35<30:56,  6.58s/it][A




 65%|██████▌   | 533/814 [45:40<28:23,  6.06s/it][A




 66%|██████▌   | 534/814 [45:42<23:34,  5.05s/it][A




 66%|██████▌   | 535/814 [45:45<19:46,  4.25s/it][A




 66%|██████▌   | 536/814 [45:49<19:32,  4.22s/it][A




 66%|██████▌   | 537/814 [45:53<19:42,  4.27s/it][A




 66%|██████▌   | 538/814 [45:58<19:36,  4.26s/it][A




 66%|██████▌   | 539/814 [46:00<16:49,  3.67s/it][A




 66%|██████▋   | 540/814 [46:08<22:34,  4.94s/it][A




 66%|██████▋   | 541/814 [46:12<21:16,  4.68s/it][A




 67%|██████▋   | 544/814 [46:23<18:10,  4.04s/it][A




 67%|██████▋   | 545/814 [46:28<19:17,  4.30s/it][A




 67%|██████▋   | 546/814 [46:34<21:15,  4.76s/it][A
 69%|██████▉   | 562/814 [47:55<31:19,  7.46s/it][A




 69%|██████▉   | 563/814 [47:59<27:04,  6.47s/it][A




 69%|██████▉   | 564/814 [48:09<30:12,  7.25s/it][A




 69%|██████▉   | 565/814 [48:16<30:02,  7.24s/it][A




 70%|██████▉   | 566/814 [48:19<25:10,  6.09s/it][A




 70%|██████▉   | 567/814 [48:22<20:28,  4.97s/it][A




 70%|██████▉   | 568/814 [48:24<17:11,  4.19s/it][A




 70%|██████▉   | 569/814 [48:32<21:38,  5.30s/it][A




 70%|███████   | 570/814 [48:34<17:17,  4.25s/it][A




 70%|███████   | 571/814 [48:36<14:36,  3.61s/it][A




 70%|███████   | 572/814 [48:38<13:04,  3.24s/it][A




 70%|███████   | 573/814 [48:46<18:29,  4.60s/it][A




 71%|███████   | 574/814 [49:03<33:48,  8.45s/it][A




 71%|███████   | 575/814 [49:06<26:37,  6.69s/it][A




 71%|███████   | 576/814 [49:08<21:27,  5.41s/it][A




 71%|███████   | 577/814 [49:13<20:44,  5.25s/it][A




 71%|███████   | 578/814 [49:19<20:44,  5.28s/it][A




 71%|███████   | 579/814 [49:21<17:30,  4.47s/it][A




 71%|███████▏  | 580/814 [49:24<15:14,  3.91s/it][A




 71%|███████▏  | 581/814 [49:26<13:39,  3.52s/it][A




 71%|███████▏  | 582/814 [49:29<12:12,  3.16s/it][A




 72%|███████▏  | 583/814 [49:31<11:42,  3.04s/it][A




 72%|███████▏  | 584/814 [49:34<11:14,  2.93s/it][A




 72%|███████▏  | 585/814 [49:38<12:23,  3.25s/it][A




 72%|███████▏  | 586/814 [49:42<13:26,  3.54s/it][A




 72%|███████▏  | 587/814 [49:47<15:05,  3.99s/it][A




 72%|███████▏  | 588/814 [49:51<15:06,  4.01s/it][A




 72%|███████▏  | 589/814 [49:56<15:21,  4.09s/it][A




 72%|███████▏  | 590/814 [50:00<15:01,  4.03s/it][A




 73%|███████▎  | 591/814 [50:04<15:09,  4.08s/it][A




 73%|███████▎  | 592/814 [50:06<13:11,  3.56s/it][A




 73%|███████▎  | 593/814 [50:14<18:16,  4.96s/it][A




 73%|███████▎  | 594/814 [50:17<15:31,  4.23s/it][A




 73%|███████▎  | 595/814 [50:21<15:19,  4.20s/it][A




 73%|███████▎  | 596/814 [50:25<15:28,  4.26s/it][A




 73%|███████▎  | 597/814 [50:30<16:01,  4.43s/it][A




 73%|███████▎  | 598/814 [50:33<14:14,  3.96s/it][A




 74%|███████▎  | 599/814 [50:35<12:25,  3.47s/it][A




 74%|███████▎  | 600/814 [50:40<13:12,  3.70s/it][A




 74%|███████▍  | 601/814 [50:45<14:41,  4.14s/it][A




 74%|███████▍  | 602/814 [50:47<12:38,  3.58s/it][A




 74%|███████▍  | 603/814 [50:51<13:12,  3.76s/it][A




 74%|███████▍  | 604/814 [50:55<13:39,  3.90s/it][A




 74%|███████▍  | 605/814 [50:58<12:06,  3.48s/it][A




 74%|███████▍  | 606/814 [51:03<14:03,  4.05s/it][A




 75%|███████▍  | 607/814 [51:07<13:53,  4.03s/it][A




 75%|███████▍  | 608/814 [51:12<14:16,  4.16s/it][A




 75%|███████▍  | 609/814 [51:16<14:28,  4.24s/it][A




 75%|███████▍  | 610/814 [51:19<12:43,  3.74s/it][A




 75%|███████▌  | 611/814 [51:26<16:32,  4.89s/it][A




 75%|███████▌  | 612/814 [51:31<15:42,  4.66s/it][A




 75%|███████▌  | 613/814 [51:40<20:06,  6.00s/it][A




 75%|███████▌  | 614/814 [51:47<21:05,  6.33s/it][A




 76%|███████▌  | 615/814 [51:51<18:37,  5.62s/it][A




 76%|███████▌  | 616/814 [51:55<17:31,  5.31s/it][A




 76%|███████▌  | 617/814 [51:58<14:28,  4.41s/it][A




 76%|███████▌  | 618/814 [52:01<12:58,  3.97s/it][A




 76%|███████▌  | 619/814 [52:05<13:37,  4.19s/it][A




 76%|███████▌  | 620/814 [52:21<25:12,  7.80s/it][A




 76%|███████▋  | 621/814 [52:27<22:39,  7.05s/it][A




 76%|███████▋  | 622/814 [52:29<17:57,  5.61s/it][A




 77%|███████▋  | 623/814 [52:38<20:51,  6.55s/it][A




 77%|███████▋  | 624/814 [52:41<17:14,  5.44s/it][A




 77%|███████▋  | 625/814 [52:43<14:19,  4.55s/it][A




 77%|███████▋  | 626/814 [52:46<12:24,  3.96s/it][A




 77%|███████▋  | 627/814 [52:50<12:39,  4.06s/it][A




 77%|███████▋  | 628/814 [52:52<10:59,  3.55s/it][A




 77%|███████▋  | 629/814 [52:56<11:19,  3.67s/it][A




 77%|███████▋  | 630/814 [53:01<12:01,  3.92s/it][A




 78%|███████▊  | 631/814 [53:06<12:46,  4.19s/it][A




 78%|███████▊  | 632/814 [53:14<16:20,  5.38s/it][A




 78%|███████▊  | 633/814 [53:17<14:15,  4.73s/it][A




 78%|███████▊  | 634/814 [53:33<24:23,  8.13s/it][A




 78%|███████▊  | 635/814 [53:35<19:00,  6.37s/it][A




 78%|███████▊  | 636/814 [53:38<15:52,  5.35s/it][A




 78%|███████▊  | 637/814 [53:43<14:57,  5.07s/it][A




 78%|███████▊  | 638/814 [53:47<14:16,  4.87s/it][A




 79%|███████▊  | 639/814 [53:52<13:55,  4.78s/it][A




 79%|███████▊  | 640/814 [53:54<11:57,  4.12s/it][A




 79%|███████▊  | 641/814 [53:56<10:06,  3.51s/it][A




 79%|███████▉  | 642/814 [54:01<11:19,  3.95s/it][A




 79%|███████▉  | 643/814 [54:04<10:09,  3.56s/it][A




 79%|███████▉  | 644/814 [54:09<11:05,  3.92s/it][A




 79%|███████▉  | 645/814 [54:16<14:09,  5.02s/it][A




 79%|███████▉  | 646/814 [54:21<14:04,  5.03s/it][A




 79%|███████▉  | 647/814 [54:25<13:00,  4.67s/it][A




 80%|███████▉  | 648/814 [54:27<10:48,  3.91s/it][A




 80%|███████▉  | 649/814 [54:31<10:47,  3.92s/it][A




 80%|███████▉  | 650/814 [54:35<10:47,  3.95s/it][A




 80%|███████▉  | 651/814 [54:43<13:26,  4.95s/it][A




 80%|████████  | 652/814 [54:45<11:34,  4.29s/it][A




 80%|████████  | 653/814 [54:48<10:37,  3.96s/it][A




 80%|████████  | 654/814 [54:52<10:23,  3.90s/it][A




 80%|████████  | 655/814 [54:55<09:15,  3.49s/it][A




 81%|████████  | 656/814 [55:04<13:19,  5.06s/it][A




 81%|████████  | 657/814 [55:07<11:46,  4.50s/it][A




 81%|████████  | 658/814 [55:10<10:56,  4.21s/it][A




 81%|████████  | 659/814 [55:15<11:02,  4.27s/it][A




 81%|████████  | 660/814 [55:19<11:06,  4.33s/it][A




 81%|████████  | 661/814 [55:23<11:05,  4.35s/it][A




 81%|████████▏ | 662/814 [55:26<09:54,  3.91s/it][A




 81%|████████▏ | 663/814 [55:31<10:06,  4.02s/it][A




 82%|████████▏ | 664/814 [55:35<10:25,  4.17s/it][A




 82%|████████▏ | 665/814 [55:43<12:50,  5.17s/it][A




 82%|████████▏ | 666/814 [55:48<12:47,  5.18s/it][A




 82%|████████▏ | 667/814 [55:52<12:03,  4.92s/it][A




 82%|████████▏ | 668/814 [55:55<10:12,  4.20s/it][A




 82%|████████▏ | 669/814 [56:00<11:03,  4.58s/it][A




 82%|████████▏ | 670/814 [56:04<10:08,  4.22s/it][A




 82%|████████▏ | 671/814 [56:05<08:24,  3.53s/it][A




 83%|████████▎ | 672/814 [56:09<08:05,  3.42s/it][A




 83%|████████▎ | 673/814 [56:13<08:57,  3.81s/it][A




 83%|████████▎ | 674/814 [56:16<07:52,  3.38s/it][A




 83%|████████▎ | 675/814 [56:18<07:01,  3.03s/it][A




 83%|████████▎ | 676/814 [56:22<07:39,  3.33s/it][A




 83%|████████▎ | 677/814 [56:26<08:22,  3.67s/it][A




 83%|████████▎ | 678/814 [56:29<07:22,  3.26s/it][A




 83%|████████▎ | 679/814 [56:33<07:51,  3.49s/it][A




 84%|████████▎ | 680/814 [56:37<08:19,  3.73s/it][A




 84%|████████▎ | 681/814 [56:42<08:56,  4.03s/it][A




 84%|████████▍ | 682/814 [57:00<18:14,  8.29s/it][A




 84%|████████▍ | 683/814 [57:04<15:23,  7.05s/it][A




 84%|████████▍ | 684/814 [57:08<13:10,  6.08s/it][A




 84%|████████▍ | 685/814 [57:23<18:35,  8.65s/it][A




 84%|████████▍ | 686/814 [57:25<14:42,  6.90s/it][A




 84%|████████▍ | 687/814 [57:28<12:07,  5.73s/it][A




 85%|████████▍ | 688/814 [57:32<10:54,  5.20s/it][A




 85%|████████▍ | 689/814 [57:41<13:00,  6.25s/it][A




 85%|████████▍ | 690/814 [57:45<11:26,  5.54s/it][A




 85%|████████▍ | 691/814 [57:50<11:00,  5.37s/it][A




 85%|████████▌ | 692/814 [57:53<09:14,  4.54s/it][A




 85%|████████▌ | 693/814 [57:57<08:46,  4.35s/it][A




 85%|████████▌ | 694/814 [58:01<08:47,  4.39s/it][A




 85%|████████▌ | 695/814 [58:06<08:51,  4.47s/it][A




 86%|████████▌ | 696/814 [58:14<10:48,  5.50s/it][A




 86%|████████▌ | 697/814 [58:18<09:51,  5.06s/it][A




 86%|████████▌ | 698/814 [58:21<09:03,  4.68s/it][A




 86%|████████▌ | 699/814 [58:30<10:58,  5.73s/it][A




 86%|████████▌ | 700/814 [58:33<09:47,  5.16s/it][A




 86%|████████▌ | 701/814 [58:37<09:01,  4.80s/it][A




 86%|████████▌ | 702/814 [58:41<08:24,  4.51s/it][A




 86%|████████▋ | 703/814 [58:43<06:58,  3.77s/it][A




 86%|████████▋ | 704/814 [58:47<07:03,  3.85s/it][A




 87%|████████▋ | 705/814 [58:51<07:03,  3.89s/it][A




 87%|████████▋ | 706/814 [58:59<09:10,  5.09s/it][A




 87%|████████▋ | 707/814 [59:04<08:54,  4.99s/it][A




 87%|████████▋ | 708/814 [59:06<07:10,  4.07s/it][A




 87%|████████▋ | 709/814 [59:11<07:28,  4.27s/it][A




 87%|████████▋ | 710/814 [59:19<09:36,  5.54s/it][A




 87%|████████▋ | 711/814 [59:24<09:12,  5.36s/it][A




 87%|████████▋ | 712/814 [59:28<08:33,  5.04s/it][A




 88%|████████▊ | 713/814 [59:30<06:57,  4.14s/it][A




 88%|████████▊ | 714/814 [59:38<08:51,  5.31s/it][A




 88%|████████▊ | 715/814 [59:42<08:06,  4.91s/it][A




 88%|████████▊ | 716/814 [59:46<07:33,  4.62s/it][A




 88%|████████▊ | 717/814 [59:49<06:21,  3.93s/it][A




 88%|████████▊ | 718/814 [59:53<06:26,  4.02s/it][A




 88%|████████▊ | 719/814 [1:00:02<08:47,  5.55s/it][A




 88%|████████▊ | 720/814 [1:00:10<09:45,  6.23s/it][A




 89%|████████▊ | 721/814 [1:00:14<08:53,  5.74s/it][A




 89%|████████▊ | 722/814 [1:00:19<08:13,  5.37s/it][A




 89%|████████▉ | 723/814 [1:00:21<06:48,  4.49s/it][A




 89%|████████▉ | 724/814 [1:00:25<06:29,  4.32s/it][A




 89%|████████▉ | 725/814 [1:00:28<05:36,  3.78s/it][A




 89%|████████▉ | 726/814 [1:00:33<06:02,  4.12s/it][A




 89%|████████▉ | 727/814 [1:00:37<05:51,  4.04s/it][A




 89%|████████▉ | 728/814 [1:00:41<06:07,  4.28s/it][A




 90%|████████▉ | 729/814 [1:00:44<05:29,  3.88s/it][A




 90%|████████▉ | 730/814 [1:00:47<05:08,  3.67s/it][A




 90%|████████▉ | 731/814 [1:00:52<05:29,  3.97s/it][A




 90%|████████▉ | 732/814 [1:00:57<05:57,  4.36s/it][A




 90%|█████████ | 733/814 [1:01:02<06:05,  4.51s/it][A




 90%|█████████ | 734/814 [1:01:05<05:09,  3.87s/it][A




 90%|█████████ | 735/814 [1:01:09<05:17,  4.02s/it][A




 90%|█████████ | 736/814 [1:01:13<05:09,  3.97s/it][A




 91%|█████████ | 737/814 [1:01:15<04:33,  3.55s/it][A




 91%|█████████ | 738/814 [1:01:19<04:39,  3.68s/it][A




 91%|█████████ | 739/814 [1:01:24<05:03,  4.05s/it][A




 91%|█████████ | 740/814 [1:01:32<06:12,  5.03s/it][A




 91%|█████████ | 741/814 [1:01:40<07:14,  5.96s/it][A




 91%|█████████ | 742/814 [1:01:43<06:16,  5.23s/it][A




 91%|█████████▏| 743/814 [1:01:46<05:16,  4.45s/it][A




 91%|█████████▏| 744/814 [1:01:55<06:48,  5.84s/it][A




 92%|█████████▏| 745/814 [1:02:02<07:11,  6.25s/it][A




 92%|█████████▏| 746/814 [1:02:07<06:32,  5.77s/it][A




 92%|█████████▏| 747/814 [1:02:11<05:44,  5.14s/it][A




 92%|█████████▏| 748/814 [1:02:13<04:55,  4.48s/it][A




 92%|█████████▏| 749/814 [1:02:18<04:43,  4.37s/it][A




 92%|█████████▏| 750/814 [1:02:21<04:11,  3.93s/it][A




 92%|█████████▏| 751/814 [1:02:23<03:44,  3.57s/it][A




 92%|█████████▏| 752/814 [1:02:31<05:03,  4.89s/it][A




 93%|█████████▎| 753/814 [1:02:36<04:49,  4.75s/it][A




 93%|█████████▎| 754/814 [1:02:41<04:49,  4.82s/it][A




 93%|█████████▎| 755/814 [1:02:49<05:49,  5.92s/it][A




 93%|█████████▎| 756/814 [1:02:51<04:38,  4.80s/it][A




 93%|█████████▎| 757/814 [1:02:54<03:53,  4.09s/it][A




 93%|█████████▎| 758/814 [1:03:09<06:52,  7.37s/it][A




 93%|█████████▎| 759/814 [1:03:17<07:05,  7.73s/it][A




 93%|█████████▎| 760/814 [1:03:26<07:04,  7.86s/it][A




 93%|█████████▎| 761/814 [1:03:29<05:53,  6.68s/it][A




 94%|█████████▎| 762/814 [1:03:32<04:47,  5.54s/it][A




 94%|█████████▎| 763/814 [1:03:37<04:33,  5.37s/it][A




 94%|█████████▍| 764/814 [1:03:40<03:48,  4.58s/it][A




 94%|█████████▍| 765/814 [1:03:49<04:46,  5.85s/it][A




 94%|█████████▍| 766/814 [1:03:51<03:52,  4.84s/it][A




 94%|█████████▍| 767/814 [1:03:55<03:35,  4.59s/it][A




 94%|█████████▍| 768/814 [1:04:04<04:23,  5.74s/it][A




 94%|█████████▍| 769/814 [1:04:08<04:05,  5.45s/it][A




 95%|█████████▍| 770/814 [1:04:13<03:52,  5.28s/it][A




 95%|█████████▍| 771/814 [1:04:29<05:56,  8.29s/it][A




 95%|█████████▍| 772/814 [1:04:36<05:39,  8.08s/it][A




 95%|█████████▍| 773/814 [1:04:45<05:38,  8.26s/it][A




 95%|█████████▌| 774/814 [1:04:49<04:44,  7.11s/it][A




 95%|█████████▌| 775/814 [1:04:57<04:44,  7.30s/it][A




 95%|█████████▌| 776/814 [1:05:05<04:42,  7.44s/it][A




 95%|█████████▌| 777/814 [1:05:08<03:45,  6.09s/it][A




 96%|█████████▌| 778/814 [1:05:12<03:15,  5.44s/it][A




 96%|█████████▌| 779/814 [1:05:16<02:55,  5.01s/it][A




 96%|█████████▌| 780/814 [1:05:20<02:40,  4.73s/it][A




 96%|█████████▌| 781/814 [1:05:24<02:28,  4.50s/it][A




 96%|█████████▌| 782/814 [1:05:26<02:00,  3.75s/it][A




 96%|█████████▌| 783/814 [1:05:30<02:03,  3.98s/it][A




 96%|█████████▋| 784/814 [1:05:39<02:41,  5.39s/it][A




 96%|█████████▋| 785/814 [1:05:43<02:24,  4.97s/it][A




 97%|█████████▋| 786/814 [1:05:46<02:00,  4.31s/it][A




 97%|█████████▋| 787/814 [1:05:49<01:48,  4.02s/it][A




 97%|█████████▋| 788/814 [1:05:54<01:53,  4.36s/it][A




 97%|█████████▋| 789/814 [1:05:57<01:35,  3.81s/it][A




 97%|█████████▋| 790/814 [1:05:59<01:22,  3.44s/it][A




 97%|█████████▋| 791/814 [1:06:01<01:08,  2.96s/it][A




 97%|█████████▋| 792/814 [1:06:04<01:02,  2.84s/it][A




 97%|█████████▋| 793/814 [1:06:19<02:19,  6.63s/it][A




 98%|█████████▊| 794/814 [1:06:22<01:47,  5.37s/it][A




 98%|█████████▊| 795/814 [1:06:24<01:24,  4.47s/it][A




 98%|█████████▊| 796/814 [1:06:33<01:45,  5.87s/it][A




 98%|█████████▊| 797/814 [1:06:50<02:35,  9.17s/it][A




 98%|█████████▊| 798/814 [1:06:53<01:55,  7.25s/it][A




 98%|█████████▊| 799/814 [1:06:57<01:33,  6.24s/it][A




 98%|█████████▊| 800/814 [1:07:01<01:20,  5.72s/it][A




 98%|█████████▊| 801/814 [1:07:06<01:09,  5.32s/it][A




 99%|█████████▊| 802/814 [1:07:08<00:53,  4.46s/it][A




 99%|█████████▊| 803/814 [1:07:11<00:44,  4.07s/it][A




 99%|█████████▉| 804/814 [1:07:15<00:40,  4.08s/it][A




 99%|█████████▉| 805/814 [1:07:19<00:35,  3.97s/it][A




 99%|█████████▉| 806/814 [1:07:24<00:33,  4.16s/it][A




 99%|█████████▉| 807/814 [1:07:29<00:30,  4.40s/it][A




 99%|█████████▉| 808/814 [1:07:33<00:26,  4.39s/it][A




 99%|█████████▉| 809/814 [1:07:36<00:19,  3.85s/it][A




100%|█████████▉| 810/814 [1:07:39<00:15,  3.85s/it][A




100%|█████████▉| 811/814 [1:07:43<00:10,  3.65s/it][A




100%|█████████▉| 812/814 [1:07:51<00:09,  4.94s/it][A




100%|█████████▉| 813/814 [1:07:55<00:04,  4.81s/it][A




100%|██████████| 814/814 [1:08:00<00:00,  5.01s/it][A


In [None]:
config = {"punct_chars": [".", "?", "!", "。"]}
sentencizer = tokenizer.add_pipe("sentencizer", config=config)

In [31]:
import numpy as np

def sample(texts, tokenizer, predictor):
    text = np.random.choice(texts)

    tokens = tokenizer(text)
    sentences = [sent.text for sent in tokens.sents]
    sentence = np.random.choice(sentences)
    print(sentence)
    sent = tokenizer(str(sentence))
    words = [token.text for token in sent]
    
    predictions = predictor.predict(words)
    return sentence, predictions

#### Пример сэмплированного текста

In [32]:
sample(texts, tokenizer, predictor)

И одновременно — объяснение того, что собирается сделать Тодд Хейнс.


('И одновременно — объяснение того, что собирается сделать Тодд Хейнс.',
 [<normal_form=и; word=И; pos=CONJ; tag=_; score=0.8091>,
  <normal_form=одновременно; word=одновременно; pos=ADV; tag=Degree=Pos; score=0.9375>,
  <normal_form=—; word=—; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=объяснение; word=объяснение; pos=NOUN; tag=Case=Nom|Gender=Neut|Number=Sing; score=0.9997>,
  <normal_form=тот; word=того; pos=PRON; tag=Case=Gen|Gender=Neut|Number=Sing; score=0.9991>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=что; word=что; pos=PRON; tag=Case=Nom|Gender=Neut|Number=Sing; score=0.5441>,
  <normal_form=собираться; word=собирается; pos=VERB; tag=Mood=Ind|Number=Sing|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Mid; score=1.0000>,
  <normal_form=сделать; word=сделать; pos=VERB; tag=VerbForm=Inf; score=1.0000>,
  <normal_form=тодда; word=Тодд; pos=NOUN; tag=Case=Acc|Gender=Fem|Number=Plur; score=0.3173>,
  <normal_form=хейнс; word=Хейнс; pos=NOUN; tag=Case

Видно, что в основном морфопарсер справился со своей задачей. Но в то же время есть несколько существенных недочетов. 

* "Тодд" слемматизировалось до "тодда", что является ошибочным. Также неправильно определился женский род, множественное число и падеж.

    ``` <normal_form=тодда; word=Тодд; pos=NOUN; tag=Case=Acc|Gender=Fem|Number=Plur; score=0.3173>```
* В остальном ошибок не наблюдается. 

In [35]:
sample(texts, tokenizer, predictor)


Несмотря на киберпанковскую мифологию общества, в котором будущее и настоящее совпадают, фантастический дизайн фильма кажется удивительно архаичным.


('\nНесмотря на киберпанковскую мифологию общества, в котором будущее и настоящее совпадают, фантастический дизайн фильма кажется удивительно архаичным.',
 [<normal_form=
  ; word=
  ; pos=CONJ; tag=_; score=0.9918>,
  <normal_form=несмотря; word=Несмотря; pos=ADV; tag=Degree=Pos; score=0.9625>,
  <normal_form=на; word=на; pos=ADP; tag=_; score=1.0000>,
  <normal_form=киберпанковский; word=киберпанковскую; pos=ADJ; tag=Case=Acc|Degree=Pos|Gender=Fem|Number=Sing; score=0.9999>,
  <normal_form=мифология; word=мифологию; pos=NOUN; tag=Case=Acc|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=общество; word=общества; pos=NOUN; tag=Case=Gen|Gender=Neut|Number=Sing; score=0.9959>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=в; word=в; pos=ADP; tag=_; score=1.0000>,
  <normal_form=который; word=котором; pos=DET; tag=Case=Loc|Gender=Neut|Number=Sing; score=0.9853>,
  <normal_form=будущее; word=будущее; pos=NOUN; tag=Case=Nom|Gender=Neut|Number=Sing; score=0.9

В примере выше, 2 слова: "будущее" и "настоящее"- играющие одинковую роль в предложении, распарсились по разному. Модель правильно разобрала первое слово, но определила второе как прилагательное.
```
<normal_form=будущее; word=будущее; pos=NOUN; tag=Case=Nom|Gender=Neut|Number=Sing; score=0.9485>
<normal_form=настоящий; word=настоящее; pos=ADJ; tag=Case=Nom|Degree=Pos|Gender=Neut|Number=Sing; score=0.6208>
```

In [52]:
sample(texts, tokenizer, predictor)

Тут сказывается не только емкость истории, но и мастеровитость режиссера: новеллу делал Роберт Вэлли, режиссера клипов Gorillaz и пары эпизодов в анимационных сериалах «Эон Флакс» и «Трон: Восстание».


('Тут сказывается не только емкость истории, но и мастеровитость режиссера: новеллу делал Роберт Вэлли, режиссера клипов Gorillaz и пары эпизодов в анимационных сериалах «Эон Флакс» и «Трон: Восстание».',
 [<normal_form=тут; word=Тут; pos=ADV; tag=Degree=Pos; score=0.9997>,
  <normal_form=сказываться; word=сказывается; pos=VERB; tag=Mood=Ind|Number=Sing|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Mid; score=1.0000>,
  <normal_form=не; word=не; pos=PART; tag=_; score=1.0000>,
  <normal_form=только; word=только; pos=ADV; tag=Degree=Pos; score=0.9997>,
  <normal_form=ёмкость; word=емкость; pos=NOUN; tag=Case=Nom|Gender=Fem|Number=Sing; score=0.9890>,
  <normal_form=история; word=истории; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Sing; score=0.9941>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=но; word=но; pos=CONJ; tag=_; score=1.0000>,
  <normal_form=и; word=и; pos=PART; tag=_; score=0.9988>,
  <normal_form=мастеровитость; word=мастеровитость; pos=NOUN; tag=Cas

Можем заметить, что данный парсер причисляет неизвестные символы и слова на англиском ("Gorrillaz" в даном случае) к пунктуации. 
```
<normal_form=gorillaz; word=Gorillaz; pos=PUNCT; tag=_; score=1.0000>
```

#### Попробуем насэмплировать примеры, на которых модель ошибается.

In [72]:
sample(texts, tokenizer, predictor)

Dark Souls — хардкорная эшкн-РПГ, в которой игроку предстоит умереть не раз и не два.


('Dark Souls — хардкорная эшкн-РПГ, в которой игроку предстоит умереть не раз и не два.',
 [<normal_form=dark; word=Dark; pos=PUNCT; tag=_; score=0.8634>,
  <normal_form=souls; word=Souls; pos=VERB; tag=Mood=Imp|Number=Sing|Person=2|VerbForm=Fin|Voice=Act; score=0.2086>,
  <normal_form=—; word=—; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=хардкорный; word=хардкорная; pos=ADJ; tag=Case=Nom|Degree=Pos|Gender=Fem|Number=Sing; score=0.9982>,
  <normal_form=эшкн; word=эшкн; pos=NOUN; tag=Case=Nom|Gender=Fem|Number=Sing; score=0.9910>,
  <normal_form=-; word=-; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=рпг; word=РПГ; pos=NOUN; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.7992>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=в; word=в; pos=ADP; tag=_; score=1.0000>,
  <normal_form=который; word=которой; pos=DET; tag=Case=Loc|Gender=Fem|Number=Sing; score=0.9993>,
  <normal_form=игрок; word=игроку; pos=NOUN; tag=Case=Dat|Gender=Masc|Number=Sing; score=0.9

Тут заметны слудеющие интересные недочеты: 
* ```<normal_form=souls; word=Souls; pos=VERB; tag=Mood=Imp|Number=Sing|Person=2|VerbForm=Fin|Voice=Act; score=0.2086>```

    Модель видимо иногда срабатывает для слов на английском, но качество там низкое. Скорее всего это результат галлюцинации, так как в словарях нет значения "souls", которое бы было глаголом. Можно сделать предположение, что в отличие от русского языка, модель не использует словарь для англиских слов.
*  ```<normal_form=эшкн; word=эшкн; pos=NOUN; tag=Case=Nom|Gender=Fem|Number=Sing; score=0.9910>,
   <normal_form=-; word=-; pos=PUNCT; tag=_; score=1.0000>,
   <normal_form=рпг; word=РПГ; pos=NOUN; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.7992>,```
   
  Тут уже видны артефакты выбранного токенизатора, который разбивает сложные слова с дефисом.

In [88]:
sample(texts, tokenizer, predictor)


Аккурат год назад Райан Мёрфи снял сказку о том, что все могло быть иначе — хотя бы в кузнице мечт Голливуде, который то ли питается социальным запросом, то ли его формирует, — поди разберись, много на себя взяло кино или все-таки поместится еще тюк-другой.


('\nАккурат год назад Райан Мёрфи снял сказку о том, что все могло быть иначе — хотя бы в кузнице мечт Голливуде, который то ли питается социальным запросом, то ли его формирует, — поди разберись, много на себя взяло кино или все-таки поместится еще тюк-другой.',
 [<normal_form=
  ; word=
  ; pos=CONJ; tag=_; score=0.9939>,
  <normal_form=аккурат; word=Аккурат; pos=ADV; tag=Degree=Pos; score=0.9947>,
  <normal_form=год; word=год; pos=NOUN; tag=Case=Acc|Gender=Masc|Number=Sing; score=0.8504>,
  <normal_form=назад; word=назад; pos=ADP; tag=_; score=0.9999>,
  <normal_form=райан; word=Райан; pos=NOUN; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.9998>,
  <normal_form=мёрфь; word=Мёрфи; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Sing; score=0.9822>,
  <normal_form=снять; word=снял; pos=VERB; tag=Gender=Masc|Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin|Voice=Act; score=1.0000>,
  <normal_form=сказка; word=сказку; pos=NOUN; tag=Case=Acc|Gender=Fem|Number=Sing; score=0.9999>,
  <normal_form=о;

Тут интересно рассмотреть такую часть предложения: "— поди разберись, много на себя взяло кино или все-таки поместится еще тюк-другой." В данном случае "поди" распарсилось неправильно, а именно - как наречие вместо частицы. Тут могло повлиять контекстное обучение, так как слово стоит перед глаголом, что свойственно наречиям. 
```
<normal_form=поди; word=поди; pos=ADV; tag=Degree=Pos; score=0.2773>
```

In [93]:
sample(texts, tokenizer, predictor)

сигнализируют не только обломки знакомых эстетик, но и остроумный неймдроппинг.


('сигнализируют не только обломки знакомых эстетик, но и остроумный неймдроппинг.',
 [<normal_form=сигнализировать; word=сигнализируют; pos=VERB; tag=Mood=Ind|Number=Plur|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Act; score=1.0000>,
  <normal_form=не; word=не; pos=PART; tag=_; score=0.9999>,
  <normal_form=только; word=только; pos=ADV; tag=Degree=Pos; score=0.9973>,
  <normal_form=обломок; word=обломки; pos=NOUN; tag=Case=Acc|Gender=Masc|Number=Plur; score=0.8311>,
  <normal_form=знакомый; word=знакомых; pos=ADJ; tag=Case=Gen|Degree=Pos|Number=Plur; score=0.9210>,
  <normal_form=эстетика; word=эстетик; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Plur; score=0.9778>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=но; word=но; pos=CONJ; tag=_; score=1.0000>,
  <normal_form=и; word=и; pos=PART; tag=_; score=0.9748>,
  <normal_form=остроумный; word=остроумный; pos=ADJ; tag=Case=Acc|Degree=Pos|Gender=Masc|Number=Sing; score=0.9387>,
  <normal_form=неймдроппинг; word=

Тут у слов "обломки" и "неймдроппинг" неправильно определился падеж: парсер поставил винительный (Acc) вместо именительного (Pos). 
```
 <normal_form=обломок; word=обломки; pos=NOUN; tag=Case=Acc|Gender=Masc|Number=Plur; score=0.8311>
 <normal_form=неймдроппинг; word=неймдроппинг; pos=NOUN; tag=Case=Acc|Gender=Masc|Number=Sing; score=0.9371>
```

### Примеры омонимии

#### Рассмотрим лексическую (полную омонимию)

Можно конечно рассмотреть пример с лексической омонимией, но данный морфологический парсер не позволяет различать данные случаи, так как у них будут совпадать леммы и прочие параметры тэгов. 

In [94]:
# Функция, которая сэмплит предложение с вхождением данного слова
def sample_with_word(texts, tokenizer, predictor, find_word):
    found_texts = [t for t in texts if find_word in t]
    sentences = [s for t in found_texts for s in tokenizer(t).sents]
    found_sentences = [s for s in sentences if find_word in s.text]
    sentence = np.random.choice(found_sentences)

    sent = tokenizer(sentence.text)
    words = [token.text for token in sent]

    predictions = predictor.predict(words)
    return sentence.text, predictions

##### Топить

In [95]:
sample_with_word(texts, tokenizer, predictor, 'топить')

  sentence = np.random.choice(found_sentences)




('Своей похотью, своей жаждой жизни Яна способна испепелить горные долины, растопить снежные горные пики, но выбирает, чтобы огонь шел за ней, вглубь ее души, в извилины ее головы, то затухал, то занимался вновь.',
 [<normal_form=свой; word=Своей; pos=DET; tag=Case=Ins|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=похоть; word=похотью; pos=NOUN; tag=Case=Ins|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=свой; word=своей; pos=DET; tag=Case=Ins|Gender=Fem|Number=Sing; score=0.9999>,
  <normal_form=жажда; word=жаждой; pos=NOUN; tag=Case=Ins|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=жизнь; word=жизни; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Sing; score=0.9308>,
  <normal_form=ян; word=Яна; pos=NOUN; tag=Case=Nom|Gender=Fem|Number=Sing; score=0.9873>,
  <normal_form=способный; word=способна; pos=ADJ; tag=Degree=Pos|Gender=Fem|Number=Sing|Variant=Short; score=0.9999>,
  <normal_form=испепелить; word=испеп

В данном случае "растопить" определилось верно. 
```
normal_form=растопить; word=растопить; pos=VERB; tag=VerbForm=Inf; score=1.0000>
```

In [102]:
sample_with_word(texts, tokenizer, predictor, 'топить')



  sentence = np.random.choice(found_sentences)


('Десять часов его станут топить в воде, жечь заживо, использовать в политических играх и угрожать санкциями.',
 [<normal_form=десять; word=Десять; pos=NUM; tag=Case=Acc; score=0.6233>,
  <normal_form=час; word=часов; pos=NOUN; tag=Case=Gen|Gender=Masc|Number=Plur; score=0.9999>,
  <normal_form=он; word=его; pos=PRON; tag=Case=Acc|Gender=Masc|Number=Sing|Person=3; score=0.5644>,
  <normal_form=стать; word=станут; pos=VERB; tag=Mood=Ind|Number=Plur|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Act; score=1.0000>,
  <normal_form=топить; word=топить; pos=VERB; tag=VerbForm=Inf; score=1.0000>,
  <normal_form=в; word=в; pos=ADP; tag=_; score=1.0000>,
  <normal_form=вода; word=воде; pos=NOUN; tag=Case=Loc|Gender=Fem|Number=Sing; score=0.9994>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=жечь; word=жечь; pos=VERB; tag=VerbForm=Inf; score=1.0000>,
  <normal_form=заживо; word=заживо; pos=ADV; tag=Degree=Pos; score=0.9996>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; sc

Тут приведено другое значение слова "топить", а именно в смысле утопления в воде. 
```
<normal_form=топить; word=топить; pos=VERB; tag=VerbForm=Inf; score=1.0000>
```

##### мир

In [127]:
sample_with_word(texts, tokenizer, predictor, 'мира')



  sentence = np.random.choice(found_sentences)


('Впрочем, для женщин здесь мало что изменилось за последние 300 лет, и юная Ада (Милана Агузарова), подпирающая стену на остановке маршрутки, отгородившись от мира безразмерной курткой и глухим воротом спортивной кофты, занята извечным женским делом — она ждет.',
 [<normal_form=впрочем; word=Впрочем; pos=H; tag=_; score=1.0000>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=для; word=для; pos=ADP; tag=_; score=1.0000>,
  <normal_form=женщина; word=женщин; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Plur; score=0.9979>,
  <normal_form=здесь; word=здесь; pos=ADV; tag=Degree=Pos; score=0.9996>,
  <normal_form=мало; word=мало; pos=PART; tag=_; score=0.9249>,
  <normal_form=что; word=что; pos=PRON; tag=Case=Nom|Gender=Neut|Number=Sing; score=0.9873>,
  <normal_form=измениться; word=изменилось; pos=VERB; tag=Gender=Neut|Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin|Voice=Mid; score=1.0000>,
  <normal_form=за; word=за; pos=ADP; tag=_; score=1.0000>,
  <normal_form=пос

In [137]:
sample_with_word(texts, tokenizer, predictor, ' мир ')



  sentence = np.random.choice(found_sentences)


('\nНет нужды уточнять, соответствует ли этот взгляд действительности (подобного рода обобщения давно считаются неприличными, и, в общем, поделом); главное — что в нем чудится испуг пополам с восторгом, сложная, но едва ли безнадежно неприязненная эмоция, которая не слишком совпадает с образом России последних лет: фабрики троллей, тревожащего мир шатуна.',
 [<normal_form=
  ; word=
  ; pos=CONJ; tag=_; score=0.9772>,
  <normal_form=нет; word=Нет; pos=VERB; tag=Mood=Ind|Number=Sing|Person=3|Tense=Notpast|VerbForm=Fin; score=0.9984>,
  <normal_form=нужда; word=нужды; pos=NOUN; tag=Case=Gen|Gender=Fem|Number=Sing; score=0.9972>,
  <normal_form=уточнять; word=уточнять; pos=VERB; tag=VerbForm=Inf; score=1.0000>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=соответствовать; word=соответствует; pos=VERB; tag=Mood=Ind|Number=Sing|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Act; score=1.0000>,
  <normal_form=ли; word=ли; pos=PART; tag=_; score=1.0000>,
  <normal_form

#### Омоформы

##### Точно

In [140]:
sample_with_word(texts, tokenizer, predictor, ' точно ')



  sentence = np.random.choice(found_sentences)


('Почему эту яркую комедию точно не стоит пропускать и в чем ее главный месседж, рассказывает Юлия Салихова.',
 [<normal_form=почему; word=Почему; pos=ADV; tag=Degree=Pos; score=0.9992>,
  <normal_form=этот; word=эту; pos=DET; tag=Case=Acc|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=яркий; word=яркую; pos=ADJ; tag=Case=Acc|Degree=Pos|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=комедия; word=комедию; pos=NOUN; tag=Case=Acc|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=точно; word=точно; pos=CONJ; tag=_; score=0.5463>,
  <normal_form=не; word=не; pos=PART; tag=_; score=1.0000>,
  <normal_form=стоить; word=стоит; pos=VERB; tag=Mood=Ind|Number=Sing|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Act; score=1.0000>,
  <normal_form=пропускать; word=пропускать; pos=VERB; tag=VerbForm=Inf; score=1.0000>,
  <normal_form=и; word=и; pos=PART; tag=_; score=0.9407>,
  <normal_form=в; word=в; pos=ADP; tag=_; score=1.0000>,
  <normal_form=что; word=чем; pos=PRON; tag=Case=Loc|Ge

Тут слово "точно" ошибочно определилось как союз, хотя в данном случае оно является наречием.
```
<normal_form=точно; word=точно; pos=CONJ; tag=_; score=0.5463>,
```

In [148]:
sample_with_word(texts, tokenizer, predictor, ' точно ')



  sentence = np.random.choice(found_sentences)


('Теперь все точно как в комиксах: не получится просто взять с полки «Удивительного Человека-Паука» под номером 700, не проштудировав предварительно хотя бы предыдущую сотню.',
 [<normal_form=теперь; word=Теперь; pos=ADV; tag=Degree=Pos; score=0.9997>,
  <normal_form=всё; word=все; pos=PRON; tag=Case=Nom|Gender=Neut|Number=Sing|Person=3; score=0.9921>,
  <normal_form=точный; word=точно; pos=ADJ; tag=Degree=Pos|Gender=Neut|Number=Sing|Variant=Short; score=0.9638>,
  <normal_form=как; word=как; pos=CONJ; tag=_; score=0.9977>,
  <normal_form=в; word=в; pos=ADP; tag=_; score=1.0000>,
  <normal_form=комикс; word=комиксах; pos=NOUN; tag=Case=Loc|Gender=Masc|Number=Plur; score=0.9654>,
  <normal_form=:; word=:; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=не; word=не; pos=PART; tag=_; score=1.0000>,
  <normal_form=получиться; word=получится; pos=VERB; tag=Mood=Ind|Number=Sing|Person=3|Tense=Notpast|VerbForm=Fin|Voice=Mid; score=1.0000>,
  <normal_form=просто; word=просто; pos=ADV; tag=Degr

Тут снова неправильно определилось, но уже в обратном направлении. "Теперь все точно как в комиксах" - слово выступает как союз, а не прилагательное. Причем в данном случае модель показала 96% уверенности в своем прогнозе, что заставляет задуматься о ее точности. 
```
<normal_form=точный; word=точно; pos=ADJ; tag=Degree=Pos|Gender=Neut|Number=Sing|Variant=Short; score=0.9638>
```

##### дали

In [170]:
sample_with_word(texts, tokenizer, predictor, ' дали.')

  sentence = np.random.choice(found_sentences)




('\nОзону в этом идеальном teen-movie, которое он мечтал посмотреть 35 лет назад, да некому было его влажные поллюции перенести на экран, помогают любимые артисты старшего поколения: Мельвиль Пупо и Валери Бруни-Тедески — их роль сводится к оберегу, к весточке из родного дома, — а также убойный саундтрек, сплошь состоящий из хитов канувшей эпохи (тут The Cure и Род Стюарт с медляком Sailing обрамлены медоточивыми аккордами участника группы Air), ну и виды, конечно, безупречные атлантические дали.',
 [<normal_form=
  ; word=
  ; pos=CONJ; tag=_; score=0.9396>,
  <normal_form=озон; word=Озону; pos=NOUN; tag=Case=Dat|Gender=Masc|Number=Sing; score=0.9877>,
  <normal_form=в; word=в; pos=ADP; tag=_; score=1.0000>,
  <normal_form=этот; word=этом; pos=DET; tag=Case=Loc|Gender=Neut|Number=Sing; score=0.6496>,
  <normal_form=идеальный; word=идеальном; pos=ADJ; tag=Case=Loc|Degree=Pos|Gender=Neut|Number=Sing; score=0.7350>,
  <normal_form=teen; word=teen; pos=NOUN; tag=Case=Loc|Gender=Masc|Numbe

Тут "дали" ошибочно разобралось как глагол, хотя в данном случае является существительным. 
```
<normal_form=дать; word=дали; pos=VERB; tag=Mood=Ind|Number=Plur|Tense=Past|VerbForm=Fin|Voice=Act; score=0.4727>
```

In [184]:
sample_with_word(texts, tokenizer, predictor, ' дали ')

  sentence = np.random.choice(found_sentences)




('В их ослепительные дали иронически вложено замкнутое пространство военной части, где в вечном карауле, от наряда до дивана, тянется офицерская и супружеская лямка, «какая-то куцая, бескрылая жизнь, какая-то чепуха, и уйти и бежать нельзя», совершенно по Чехову или по Марко Беллоккьо, чей «Триумфальный марш» размазывал всю эту гротескную чепуху тяжелым армейским ботинком.',
 [<normal_form=в; word=В; pos=ADP; tag=_; score=1.0000>,
  <normal_form=он; word=их; pos=DET; tag=_; score=1.0000>,
  <normal_form=ослепительный; word=ослепительные; pos=ADJ; tag=Case=Acc|Degree=Pos|Number=Plur; score=0.9645>,
  <normal_form=дать; word=дали; pos=VERB; tag=Mood=Ind|Number=Plur|Tense=Past|VerbForm=Fin|Voice=Act; score=0.7867>,
  <normal_form=иронически; word=иронически; pos=ADV; tag=Degree=Pos; score=1.0000>,
  <normal_form=вложенный; word=вложено; pos=ADJ; tag=Degree=Pos|Gender=Neut|Number=Sing|Variant=Short; score=0.9995>,
  <normal_form=замкнутый; word=замкнутое; pos=ADJ; tag=Case=Nom|Degree=Pos|G

Тут снова наблюдается такая же ошибка. 
```
<normal_form=дать; word=дали; pos=VERB; tag=Mood=Ind|Number=Plur|Tense=Past|VerbForm=Fin|Voice=Act; score=0.7867>
```
Причем в обратную сторону в корпусе не допускается ошибок. Это говорит о том, что глаголы легче определять по их соотношению к существительному; также модели имеют предрасположенность при дисбалансе классов склоняться к тому, который чаще встречается (в данном случае глагол "дать" более популярен чем сущ. "даль").

### Недревесные явления

Тут уже будет легче искать явления в тексте, чем придумывать нетривиальные функция для поиска эллипсисов. 

In [153]:
def pipeline(sentence, tokenizer, predictor):
    sent = tokenizer(sentence)
    words = [token.text for token in sent]
    predictions = predictor.predict(words)
    return predictions

In [156]:
sentence = "Видимо, таков авторский вывод слегка непоследовательного, но всесторонне примечательного фильма «Проксима» — настоящее сестринство и материнство возможно, только если каждая занята своим делом (одна — покорением миров, вторая — просто учебой в школе), желательно — максимально далеко друг от друга."
sentence

'Видимо, таков авторский вывод слегка непоследовательного, но всесторонне примечательного фильма «Проксима» — настоящее сестринство и материнство возможно, только если каждая занята своим делом (одна — покорением миров, вторая — просто учебой в школе), желательно — максимально далеко друг от друга.'

In [155]:
sentence, pipeline(sentence, tokenizer, predictor)



('Видимо, таков авторский вывод слегка непоследовательного, но всесторонне примечательного фильма «Проксима» — настоящее сестринство и материнство возможно, только если каждая занята своим делом (одна — покорением миров, вторая — просто учебой в школе), желательно — максимально далеко друг от друга.',
 [<normal_form=видимо; word=Видимо; pos=ADV; tag=Degree=Pos; score=0.9999>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=таков; word=таков; pos=DET; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.9940>,
  <normal_form=авторский; word=авторский; pos=ADJ; tag=Case=Nom|Degree=Pos|Gender=Masc|Number=Sing; score=0.9984>,
  <normal_form=вывод; word=вывод; pos=NOUN; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.9996>,
  <normal_form=слегка; word=слегка; pos=ADV; tag=Degree=Pos; score=0.9619>,
  <normal_form=непоследовательный; word=непоследовательного; pos=ADJ; tag=Case=Gen|Degree=Pos|Gender=Masc|Number=Sing; score=0.9991>,
  <normal_form=,; word=,; pos=PUNCT; tag=_; 

Тут наблюдается множественная омонимия в конце предложения. В данном случае морфопарсер не допустил ошибок, при разборе данной части, так как части речи понятны и без контекста. 

In [157]:
sentence = "«Кто-нибудь видел мою девчонку» именно по этой траектории и развивается. Как эстетически, так и этически."
sentence

'«Кто-нибудь видел мою девчонку» именно по этой траектории и развивается. Как эстетически, так и этически.'

In [158]:
sentence, pipeline(sentence, tokenizer, predictor)



('«Кто-нибудь видел мою девчонку» именно по этой траектории и развивается. Как эстетически, так и этически.',
 [<normal_form=«; word=«; pos=PUNCT; tag=_; score=0.9429>,
  <normal_form=кто; word=Кто; pos=PRON; tag=Case=Nom|Number=Sing; score=1.0000>,
  <normal_form=-; word=-; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=нибыть; word=нибудь; pos=ADV; tag=Degree=Pos; score=0.8450>,
  <normal_form=видеть; word=видел; pos=VERB; tag=Gender=Masc|Mood=Ind|Number=Sing|Tense=Past|VerbForm=Fin|Voice=Act; score=1.0000>,
  <normal_form=мой; word=мою; pos=DET; tag=Case=Acc|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=девчонка; word=девчонку; pos=NOUN; tag=Case=Acc|Gender=Fem|Number=Sing; score=1.0000>,
  <normal_form=»; word=»; pos=PUNCT; tag=_; score=0.9973>,
  <normal_form=именно; word=именно; pos=PART; tag=_; score=1.0000>,
  <normal_form=по; word=по; pos=ADP; tag=_; score=1.0000>,
  <normal_form=этот; word=этой; pos=DET; tag=Case=Dat|Gender=Fem|Number=Sing; score=0.9999>,
  <normal_f

### Референциальные цепочки

Но **Вигго Мортенсен** явно другой. **Он** вообще-то лицедей по совместительству. А так **поэт**, **художник**, **фотограф**, **куратор**, **полиглот**. **Символ** мультикультурализма и интерсекционализма. Внутри **Вигго**, как в **его** любимом Нью-Йорке, встречаются все семь искусств, чтобы фонтанировать без перебоя. **Его** режиссерский дебют «Падение», наверное, личная история с элементами автобиографии, но, как иногда случается у людей тонкой душевной конструкции, личное попало в глобальное, отразило дух времени, запечатлело уходящую эпоху.

In [160]:
fragment = "Но Вигго Мортенсен явно другой. Он вообще-то лицедей по совместительству. А так поэт, художник, фотограф, куратор, полиглот. Символ мультикультурализма и интерсекционализма. Внутри Вигго, как в его любимом Нью-Йорке, встречаются все семь искусств, чтобы фонтанировать без перебоя. Его режиссерский дебют «Падение», наверное, личная история с элементами автобиографии, но, как иногда случается у людей тонкой душевной конструкции, личное попало в глобальное, отразило дух времени, запечатлело уходящую эпоху."
fragment

'Но Вигго Мортенсен явно другой. Он вообще-то лицедей по совместительству. А так поэт, художник, фотограф, куратор, полиглот. Символ мультикультурализма и интерсекционализма. Внутри Вигго, как в его любимом Нью-Йорке, встречаются все семь искусств, чтобы фонтанировать без перебоя. Его режиссерский дебют «Падение», наверное, личная история с элементами автобиографии, но, как иногда случается у людей тонкой душевной конструкции, личное попало в глобальное, отразило дух времени, запечатлело уходящую эпоху.'

In [162]:
fragment, pipeline(fragment, tokenizer, predictor)



('Но Вигго Мортенсен явно другой. Он вообще-то лицедей по совместительству. А так поэт, художник, фотограф, куратор, полиглот. Символ мультикультурализма и интерсекционализма. Внутри Вигго, как в его любимом Нью-Йорке, встречаются все семь искусств, чтобы фонтанировать без перебоя. Его режиссерский дебют «Падение», наверное, личная история с элементами автобиографии, но, как иногда случается у людей тонкой душевной конструкции, личное попало в глобальное, отразило дух времени, запечатлело уходящую эпоху.',
 [<normal_form=но; word=Но; pos=CONJ; tag=_; score=1.0000>,
  <normal_form=вигй; word=Вигго; pos=ADJ; tag=Case=Acc|Degree=Pos|Gender=Masc|Number=Sing; score=0.5005>,
  <normal_form=мортенсный; word=Мортенсен; pos=NOUN; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.9707>,
  <normal_form=явно; word=явно; pos=ADV; tag=Degree=Pos; score=0.9997>,
  <normal_form=другой; word=другой; pos=DET; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.9352>,
  <normal_form=.; word=.; pos=PUNCT; tag=_; sc

Тут видно недочет у 2 элементов цепочки:
* Неправильная лемматизация имени "Вигго" и непоследовательная его лемматизация.
    
    <normal_form=вигй; word=Вигго; pos=ADJ; tag=Case=Acc|Degree=Pos|Gender=Masc|Number=Sing; score=0.5005>
    
    <normal_form=вигго; word=Вигго; pos=NOUN; tag=Case=Gen|Gender=Masc|Number=Sing; score=0.3481>
    
В остальном именно морфологический разбор проведен верно. Но, как мне кажется, морфопарсеры не подходят для выявления референциальных цепочек, так как это другой уровень разбора ЕЯ. 

**Персонаж** Майлса Теллера — это типичный религиозный аскет. В Испании **он** стал бы монахом, в России сектантом, хлыстом (прекрасная рифма к названию фильма!), а в протестантской Америке оказался почему-то барабанщиком. По ходу фильма **он** отказывается от мирских привязанностей, семейных, любовных, дружеских связей, добровольно проходит через чудовищные унижения и муки и терпит сокрушительное поражение, которое в финале, разумеется, оборачивается немыслимым триумфом. Беда в том, что Бога в **его** мире нет, и все что **он** делает, **он** делает не во Славу Божию.

In [163]:
fragment = "Персонаж Майлса Теллера — это типичный религиозный аскет. В Испании он стал бы монахом, в России сектантом, хлыстом (прекрасная рифма к названию фильма!), а в протестантской Америке оказался почему-то барабанщиком. По ходу фильма он отказывается от мирских привязанностей, семейных, любовных, дружеских связей, добровольно проходит через чудовищные унижения и муки и терпит сокрушительное поражение, которое в финале, разумеется, оборачивается немыслимым триумфом. Беда в том, что Бога в его мире нет, и все что он делает, он делает не во Славу Божию."
fragment

'Персонаж Майлса Теллера — это типичный религиозный аскет. В Испании он стал бы монахом, в России сектантом, хлыстом (прекрасная рифма к названию фильма!), а в протестантской Америке оказался почему-то барабанщиком. По ходу фильма он отказывается от мирских привязанностей, семейных, любовных, дружеских связей, добровольно проходит через чудовищные унижения и муки и терпит сокрушительное поражение, которое в финале, разумеется, оборачивается немыслимым триумфом. Беда в том, что Бога в его мире нет, и все что он делает, он делает не во Славу Божию.'

In [164]:
fragment, pipeline(fragment, tokenizer, predictor)



('Персонаж Майлса Теллера — это типичный религиозный аскет. В Испании он стал бы монахом, в России сектантом, хлыстом (прекрасная рифма к названию фильма!), а в протестантской Америке оказался почему-то барабанщиком. По ходу фильма он отказывается от мирских привязанностей, семейных, любовных, дружеских связей, добровольно проходит через чудовищные унижения и муки и терпит сокрушительное поражение, которое в финале, разумеется, оборачивается немыслимым триумфом. Беда в том, что Бога в его мире нет, и все что он делает, он делает не во Славу Божию.',
 [<normal_form=персонаж; word=Персонаж; pos=NOUN; tag=Case=Nom|Gender=Masc|Number=Sing; score=0.9975>,
  <normal_form=майлс; word=Майлса; pos=NOUN; tag=Case=Gen|Gender=Masc|Number=Sing; score=0.9999>,
  <normal_form=теллер; word=Теллера; pos=NOUN; tag=Case=Gen|Gender=Masc|Number=Sing; score=0.9882>,
  <normal_form=—; word=—; pos=PUNCT; tag=_; score=1.0000>,
  <normal_form=это; word=это; pos=PART; tag=_; score=0.9968>,
  <normal_form=типичны

Тут уже морфопарсинг прошел правильно в таком большом фрагменте текста, несмотря на эллипсис и референциальную цепочку. Это говорит о том, что данные явления редко являются препятствием для правильного мофрологического разбора. 