Quick model to establish a pipeline and simple benchmark

In [1]:
import pandas as pd
import numpy as np
import nltk
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import TfidfVectorizer, CountVectorizer, TfidfTransformer
from sklearn.naive_bayes import MultinomialNB
from sklearn.model_selection import train_test_split, GridSearchCV, cross_val_score
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import roc_auc_score
from sklearn.linear_model import RidgeClassifier, LogisticRegression, RidgeClassifierCV
from sklearn.multiclass import OneVsRestClassifier
from sklearn.svm import LinearSVC
from sklearn.dummy import DummyClassifier
from sklearn.neural_network import MLPClassifier
from nltk import word_tokenize, sent_tokenize, WordNetLemmatizer
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer
from tqdm import tqdm, tqdm_pandas
import string
import re
from gensim.models import Word2Vec, Phrases
from gensim.utils import to_unicode
from gensim.models.phrases import Phraser
import logging

%matplotlib inline
pd.set_option('display.max_columns', None)
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)



In [2]:
train_data = pd.read_csv('data/train.csv')
test_data = pd.read_csv('data/test.csv')
sample_submission_data = pd.read_csv('data/sample_submission.csv')

In [3]:
train_data.head()
train_data.columns

Index(['id', 'comment_text', 'toxic', 'severe_toxic', 'obscene', 'threat',
       'insult', 'identity_hate'],
      dtype='object')

### Define useful helper functions

Function for cleaning and tokenizing:

In [4]:
stopset = set(stopwords.words('english')) - set(('over', 'under', 'below', 'more', 'most', 'no', 'not', 'only', 
                                                 'such', 'few', 'so', 'too', 'very', 'just', 'any', 'once'))
snow = SnowballStemmer('english')
WNlemma = WordNetLemmatizer()

def clean_text(x, normalization='stemming', for_word2vec=False):
    # split text
    words = word_tokenize(x)
    
    # remove punctuation and numbers
    words = [to_unicode(word.strip(string.punctuation).lower()) for word in words if word not in string.punctuation and not bool(re.search(r'\d', word))]
    
    if normalization == 'stemming':
        words = [snow.stem(t) for t in words] # stemming
    elif normalization == 'lemmatization':
        words = [WNlemma.lemmatize(t) for t in words] # lemmatize words (advanced stemming)
    else:
        return words
    
    if for_word2vec:
        return words
    else:
        # join list into string (needed for CountVectorizer) and remove underscore characters from words
        joined_words = ' '.join(words).replace('_', '')
    
    return joined_words

### Prepare corpus for Word2Vec training

In [5]:
# get corpus by concatenating train and test comments
corpus = train_data['comment_text'].copy().append(test_data['comment_text'].copy())

# join into one large string
corpus = '. '.join(corpus)
corpus = corpus.replace('\n', '. ')

# split into sentences
corpus = pd.Series(sent_tokenize(corpus))

In [6]:
tqdm.pandas(tqdm()) # for tracking progress
corpus = corpus.progress_apply(lambda x: clean_text(x, normalization='lemmatization', for_word2vec=True))

0it [00:00, ?it/s]
  0%|                                                                                      | 0/1975667 [00:00<?, ?it/s]
  0%|                                                                          | 2/1975667 [00:01<471:17:45,  1.16it/s]
  0%|                                                                        | 365/1975667 [00:01<329:53:31,  1.66it/s]
  0%|                                                                        | 771/1975667 [00:01<230:55:03,  2.38it/s]
  0%|                                                                       | 1134/1975667 [00:02<161:39:28,  3.39it/s]
  0%|                                                                       | 1527/1975667 [00:02<113:10:48,  4.85it/s]
  0%|                                                                        | 1933/1975667 [00:02<79:15:01,  6.92it/s]
  0%|                                                                        | 2338/1975667 [00:02<55:30:16,  9.88it/s]
  0%|                

  1%|▉                                                                       | 25792/1975667 [00:08<08:51, 3665.46it/s]
  1%|▉                                                                       | 26168/1975667 [00:08<08:48, 3691.36it/s]
  1%|▉                                                                       | 26549/1975667 [00:08<08:43, 3723.25it/s]
  1%|▉                                                                       | 26947/1975667 [00:08<08:33, 3793.83it/s]
  1%|▉                                                                       | 27364/1975667 [00:09<08:20, 3896.44it/s]
  1%|█                                                                       | 27755/1975667 [00:09<08:32, 3800.14it/s]
  1%|█                                                                       | 28137/1975667 [00:09<08:32, 3803.46it/s]
  1%|█                                                                       | 28525/1975667 [00:09<08:29, 3823.07it/s]
  1%|█                                  

  3%|█▉                                                                      | 52742/1975667 [00:15<11:00, 2911.64it/s]
  3%|█▉                                                                      | 53099/1975667 [00:16<10:24, 3080.04it/s]
  3%|█▉                                                                      | 53459/1975667 [00:16<09:57, 3217.22it/s]
  3%|█▉                                                                      | 53828/1975667 [00:16<09:34, 3343.07it/s]
  3%|█▉                                                                      | 54204/1975667 [00:16<09:16, 3455.63it/s]
  3%|█▉                                                                      | 54606/1975667 [00:16<08:57, 3571.55it/s]
  3%|██                                                                      | 54997/1975667 [00:16<08:44, 3663.62it/s]
  3%|██                                                                      | 55368/1975667 [00:16<08:44, 3663.51it/s]
  3%|██                                 

  4%|██▉                                                                     | 79234/1975667 [00:23<08:25, 3752.47it/s]
  4%|██▉                                                                     | 79621/1975667 [00:23<08:21, 3783.99it/s]
  4%|██▉                                                                     | 80008/1975667 [00:23<08:18, 3806.39it/s]
  4%|██▉                                                                     | 80416/1975667 [00:23<08:08, 3881.59it/s]
  4%|██▉                                                                     | 80826/1975667 [00:23<08:01, 3935.92it/s]
  4%|██▉                                                                     | 81222/1975667 [00:23<08:13, 3841.86it/s]
  4%|██▉                                                                     | 81624/1975667 [00:23<08:06, 3890.97it/s]
  4%|██▉                                                                     | 82015/1975667 [00:23<08:06, 3893.19it/s]
  4%|███                                

  5%|███▊                                                                   | 105324/1975667 [00:30<08:52, 3509.37it/s]
  5%|███▊                                                                   | 105698/1975667 [00:30<08:43, 3571.98it/s]
  5%|███▊                                                                   | 106092/1975667 [00:30<08:29, 3672.22it/s]
  5%|███▊                                                                   | 106466/1975667 [00:30<08:40, 3593.38it/s]
  5%|███▊                                                                   | 106830/1975667 [00:30<08:43, 3572.88it/s]
  5%|███▊                                                                   | 107191/1975667 [00:30<08:54, 3497.58it/s]
  5%|███▊                                                                   | 107578/1975667 [00:30<08:39, 3598.53it/s]
  5%|███▉                                                                   | 107973/1975667 [00:31<08:25, 3694.45it/s]
  5%|███▉                               

  7%|████▋                                                                  | 131592/1975667 [00:37<07:58, 3850.22it/s]
  7%|████▋                                                                  | 131979/1975667 [00:37<08:16, 3714.02it/s]
  7%|████▊                                                                  | 132353/1975667 [00:37<08:22, 3669.80it/s]
  7%|████▊                                                                  | 132722/1975667 [00:37<08:39, 3550.66it/s]
  7%|████▊                                                                  | 133114/1975667 [00:37<08:24, 3651.22it/s]
  7%|████▊                                                                  | 133518/1975667 [00:37<08:10, 3756.98it/s]
  7%|████▊                                                                  | 133923/1975667 [00:38<07:59, 3838.43it/s]
  7%|████▊                                                                  | 134309/1975667 [00:38<08:14, 3724.31it/s]
  7%|████▊                              

  8%|█████▋                                                                 | 158345/1975667 [00:44<08:14, 3676.80it/s]
  8%|█████▋                                                                 | 158726/1975667 [00:44<08:09, 3712.88it/s]
  8%|█████▋                                                                 | 159099/1975667 [00:44<08:11, 3698.81it/s]
  8%|█████▋                                                                 | 159470/1975667 [00:44<08:24, 3596.66it/s]
  8%|█████▋                                                                 | 159831/1975667 [00:45<08:39, 3498.23it/s]
  8%|█████▊                                                                 | 160183/1975667 [00:45<08:43, 3465.64it/s]
  8%|█████▊                                                                 | 160546/1975667 [00:45<08:37, 3510.63it/s]
  8%|█████▊                                                                 | 160959/1975667 [00:45<08:14, 3673.40it/s]
  8%|█████▊                             

  9%|██████▋                                                                | 184644/1975667 [00:51<08:29, 3512.99it/s]
  9%|██████▋                                                                | 185018/1975667 [00:51<08:20, 3575.41it/s]
  9%|██████▋                                                                | 185401/1975667 [00:51<08:11, 3645.39it/s]
  9%|██████▋                                                                | 185801/1975667 [00:51<07:58, 3742.18it/s]
  9%|██████▋                                                                | 186182/1975667 [00:52<07:56, 3753.72it/s]
  9%|██████▋                                                                | 186564/1975667 [00:52<07:54, 3769.99it/s]
  9%|██████▋                                                                | 186944/1975667 [00:52<07:53, 3775.94it/s]
  9%|██████▋                                                                | 187323/1975667 [00:52<08:18, 3589.23it/s]
  9%|██████▋                            

 11%|███████▌                                                               | 210605/1975667 [00:58<07:46, 3787.51it/s]
 11%|███████▌                                                               | 210985/1975667 [00:58<07:46, 3782.55it/s]
 11%|███████▌                                                               | 211364/1975667 [00:58<07:50, 3748.01it/s]
 11%|███████▌                                                               | 211778/1975667 [00:59<07:38, 3849.33it/s]
 11%|███████▌                                                               | 212164/1975667 [00:59<07:40, 3826.49it/s]
 11%|███████▋                                                               | 212561/1975667 [00:59<07:36, 3865.43it/s]
 11%|███████▋                                                               | 212959/1975667 [00:59<07:32, 3896.04it/s]
 11%|███████▋                                                               | 213356/1975667 [00:59<07:30, 3914.84it/s]
 11%|███████▋                           

 12%|████████▍                                                              | 236465/1975667 [01:06<07:52, 3677.48it/s]
 12%|████████▌                                                              | 236852/1975667 [01:06<07:46, 3730.31it/s]
 12%|████████▌                                                              | 237226/1975667 [01:06<07:50, 3691.49it/s]
 12%|████████▌                                                              | 237596/1975667 [01:06<07:57, 3636.16it/s]
 12%|████████▌                                                              | 237985/1975667 [01:06<07:48, 3706.31it/s]
 12%|████████▌                                                              | 238412/1975667 [01:06<07:30, 3856.34it/s]
 12%|████████▌                                                              | 238800/1975667 [01:06<07:32, 3837.37it/s]
 12%|████████▌                                                              | 239186/1975667 [01:07<07:52, 3676.04it/s]
 12%|████████▌                          

 13%|█████████▍                                                             | 263469/1975667 [01:13<07:29, 3809.45it/s]
 13%|█████████▍                                                             | 263853/1975667 [01:13<07:28, 3815.51it/s]
 13%|█████████▍                                                             | 264236/1975667 [01:14<07:45, 3673.65it/s]
 13%|█████████▌                                                             | 264612/1975667 [01:14<07:42, 3696.22it/s]
 13%|█████████▌                                                             | 265005/1975667 [01:14<07:34, 3760.50it/s]
 13%|█████████▌                                                             | 265422/1975667 [01:14<07:21, 3871.77it/s]
 13%|█████████▌                                                             | 265811/1975667 [01:14<07:31, 3783.08it/s]
 13%|█████████▌                                                             | 266191/1975667 [01:14<07:32, 3779.46it/s]
 13%|█████████▌                         

 15%|██████████▎                                                            | 288095/1975667 [01:21<08:29, 3311.68it/s]
 15%|██████████▎                                                            | 288431/1975667 [01:21<08:35, 3274.69it/s]
 15%|██████████▍                                                            | 288797/1975667 [01:21<08:19, 3378.99it/s]
 15%|██████████▍                                                            | 289162/1975667 [01:21<08:08, 3453.35it/s]
 15%|██████████▍                                                            | 289511/1975667 [01:21<08:07, 3461.49it/s]
 15%|██████████▍                                                            | 289861/1975667 [01:21<08:05, 3470.21it/s]
 15%|██████████▍                                                            | 290210/1975667 [01:21<08:13, 3417.11it/s]
 15%|██████████▍                                                            | 290553/1975667 [01:21<08:28, 3313.93it/s]
 15%|██████████▍                        

 16%|███████████▏                                                           | 312643/1975667 [01:28<08:20, 3320.01it/s]
 16%|███████████▏                                                           | 312979/1975667 [01:28<08:20, 3319.00it/s]
 16%|███████████▎                                                           | 313314/1975667 [01:28<08:52, 3120.93it/s]
 16%|███████████▎                                                           | 313642/1975667 [01:28<08:45, 3164.56it/s]
 16%|███████████▎                                                           | 313991/1975667 [01:28<08:30, 3253.21it/s]
 16%|███████████▎                                                           | 314347/1975667 [01:28<08:17, 3336.66it/s]
 16%|███████████▎                                                           | 314704/1975667 [01:29<08:08, 3401.20it/s]
 16%|███████████▎                                                           | 315052/1975667 [01:29<08:05, 3421.61it/s]
 16%|███████████▎                       

 17%|████████████▏                                                          | 337934/1975667 [01:35<08:06, 3368.03it/s]
 17%|████████████▏                                                          | 338299/1975667 [01:35<07:55, 3445.00it/s]
 17%|████████████▏                                                          | 338685/1975667 [01:35<07:40, 3557.54it/s]
 17%|████████████▏                                                          | 339063/1975667 [01:36<07:32, 3618.32it/s]
 17%|████████████▏                                                          | 339458/1975667 [01:36<07:21, 3709.43it/s]
 17%|████████████▏                                                          | 339864/1975667 [01:36<07:09, 3805.21it/s]
 17%|████████████▏                                                          | 340283/1975667 [01:36<06:58, 3910.10it/s]
 17%|████████████▏                                                          | 340677/1975667 [01:36<07:00, 3886.45it/s]
 17%|████████████▎                      

 18%|█████████████                                                          | 364476/1975667 [01:42<07:11, 3737.92it/s]
 18%|█████████████                                                          | 364851/1975667 [01:42<07:14, 3710.75it/s]
 18%|█████████████▏                                                         | 365236/1975667 [01:43<07:09, 3748.51it/s]
 19%|█████████████▏                                                         | 365612/1975667 [01:43<07:13, 3710.03it/s]
 19%|█████████████▏                                                         | 365984/1975667 [01:43<07:14, 3704.09it/s]
 19%|█████████████▏                                                         | 366371/1975667 [01:43<07:09, 3749.84it/s]
 19%|█████████████▏                                                         | 366768/1975667 [01:43<07:02, 3809.96it/s]
 19%|█████████████▏                                                         | 367150/1975667 [01:43<07:03, 3798.49it/s]
 19%|█████████████▏                     

 20%|██████████████                                                         | 390596/1975667 [01:49<06:38, 3982.14it/s]
 20%|██████████████                                                         | 391005/1975667 [01:49<06:35, 4010.35it/s]
 20%|██████████████                                                         | 391436/1975667 [01:50<06:27, 4093.07it/s]
 20%|██████████████                                                         | 391847/1975667 [01:50<07:01, 3757.07it/s]
 20%|██████████████                                                         | 392230/1975667 [01:50<07:01, 3758.54it/s]
 20%|██████████████                                                         | 392611/1975667 [01:50<07:01, 3754.12it/s]
 20%|██████████████                                                         | 393027/1975667 [01:50<06:49, 3864.83it/s]
 20%|██████████████▏                                                        | 393417/1975667 [01:50<07:02, 3743.66it/s]
 20%|██████████████▏                    

 21%|██████████████▉                                                        | 416355/1975667 [01:56<06:46, 3838.32it/s]
 21%|██████████████▉                                                        | 416741/1975667 [01:57<07:00, 3708.50it/s]
 21%|██████████████▉                                                        | 417114/1975667 [01:57<07:04, 3673.11it/s]
 21%|███████████████                                                        | 417487/1975667 [01:57<07:07, 3644.12it/s]
 21%|███████████████                                                        | 417923/1975667 [01:57<06:46, 3830.20it/s]
 21%|███████████████                                                        | 418310/1975667 [01:57<06:52, 3777.03it/s]
 21%|███████████████                                                        | 418699/1975667 [01:57<06:48, 3807.26it/s]
 21%|███████████████                                                        | 419181/1975667 [01:57<06:23, 4060.65it/s]
 21%|███████████████                    

 22%|███████████████▉                                                       | 442492/1975667 [02:04<06:54, 3700.44it/s]
 22%|███████████████▉                                                       | 442867/1975667 [02:04<06:52, 3712.23it/s]
 22%|███████████████▉                                                       | 443258/1975667 [02:04<06:46, 3766.52it/s]
 22%|███████████████▉                                                       | 443636/1975667 [02:04<06:49, 3737.57it/s]
 22%|███████████████▉                                                       | 444035/1975667 [02:04<06:42, 3807.35it/s]
 22%|███████████████▉                                                       | 444417/1975667 [02:04<06:55, 3686.51it/s]
 23%|███████████████▉                                                       | 444806/1975667 [02:04<06:49, 3742.40it/s]
 23%|███████████████▉                                                       | 445182/1975667 [02:04<06:52, 3711.32it/s]
 23%|████████████████                   

 24%|████████████████▊                                                      | 468670/1975667 [02:11<07:15, 3464.22it/s]
 24%|████████████████▊                                                      | 469029/1975667 [02:11<07:10, 3497.92it/s]
 24%|████████████████▊                                                      | 469387/1975667 [02:11<07:07, 3519.38it/s]
 24%|████████████████▉                                                      | 469744/1975667 [02:11<07:06, 3532.48it/s]
 24%|████████████████▉                                                      | 470099/1975667 [02:11<07:07, 3524.34it/s]
 24%|████████████████▉                                                      | 470453/1975667 [02:11<07:24, 3389.10it/s]
 24%|████████████████▉                                                      | 470838/1975667 [02:11<07:08, 3512.79it/s]
 24%|████████████████▉                                                      | 471215/1975667 [02:12<06:59, 3583.51it/s]
 24%|████████████████▉                  

 25%|█████████████████▊                                                     | 495054/1975667 [02:18<06:58, 3535.83it/s]
 25%|█████████████████▊                                                     | 495419/1975667 [02:18<06:55, 3566.53it/s]
 25%|█████████████████▊                                                     | 495787/1975667 [02:18<06:51, 3597.02it/s]
 25%|█████████████████▊                                                     | 496167/1975667 [02:18<06:45, 3652.79it/s]
 25%|█████████████████▊                                                     | 496569/1975667 [02:19<06:34, 3752.90it/s]
 25%|█████████████████▊                                                     | 496993/1975667 [02:19<06:21, 3873.35it/s]
 25%|█████████████████▊                                                     | 497388/1975667 [02:19<06:19, 3892.93it/s]
 25%|█████████████████▉                                                     | 497784/1975667 [02:19<06:17, 3909.74it/s]
 25%|█████████████████▉                 

 26%|██████████████████▋                                                    | 521096/1975667 [02:25<06:52, 3525.95it/s]
 26%|██████████████████▋                                                    | 521455/1975667 [02:25<07:13, 3353.07it/s]
 26%|██████████████████▊                                                    | 521847/1975667 [02:25<06:55, 3502.64it/s]
 26%|██████████████████▊                                                    | 522203/1975667 [02:26<07:23, 3278.21it/s]
 26%|██████████████████▊                                                    | 522538/1975667 [02:26<07:33, 3202.04it/s]
 26%|██████████████████▊                                                    | 522864/1975667 [02:26<07:35, 3188.27it/s]
 26%|██████████████████▊                                                    | 523187/1975667 [02:26<07:35, 3188.66it/s]
 26%|██████████████████▊                                                    | 523514/1975667 [02:26<07:32, 3210.09it/s]
 27%|██████████████████▊                

 28%|███████████████████▋                                                   | 546301/1975667 [02:33<06:03, 3934.59it/s]
 28%|███████████████████▋                                                   | 546704/1975667 [02:33<06:04, 3922.78it/s]
 28%|███████████████████▋                                                   | 547103/1975667 [02:33<06:09, 3870.62it/s]
 28%|███████████████████▋                                                   | 547495/1975667 [02:33<06:07, 3882.22it/s]
 28%|███████████████████▋                                                   | 547954/1975667 [02:33<05:50, 4067.64it/s]
 28%|███████████████████▋                                                   | 548366/1975667 [02:33<06:10, 3856.00it/s]
 28%|███████████████████▋                                                   | 548758/1975667 [02:33<06:34, 3620.86it/s]
 28%|███████████████████▋                                                   | 549156/1975667 [02:33<06:23, 3718.82it/s]
 28%|███████████████████▊               

 29%|████████████████████▌                                                  | 572821/1975667 [02:40<06:15, 3731.72it/s]
 29%|████████████████████▌                                                  | 573197/1975667 [02:40<06:16, 3720.50it/s]
 29%|████████████████████▌                                                  | 573623/1975667 [02:40<06:02, 3864.62it/s]
 29%|████████████████████▋                                                  | 574013/1975667 [02:40<06:05, 3837.70it/s]
 29%|████████████████████▋                                                  | 574399/1975667 [02:40<06:09, 3790.25it/s]
 29%|████████████████████▋                                                  | 574780/1975667 [02:40<06:13, 3748.23it/s]
 29%|████████████████████▋                                                  | 575156/1975667 [02:41<06:24, 3639.24it/s]
 29%|████████████████████▋                                                  | 575522/1975667 [02:41<06:31, 3578.28it/s]
 29%|████████████████████▋              

 30%|█████████████████████▌                                                 | 599176/1975667 [02:47<06:01, 3805.76it/s]
 30%|█████████████████████▌                                                 | 599562/1975667 [02:47<06:00, 3818.40it/s]
 30%|█████████████████████▌                                                 | 599946/1975667 [02:47<06:06, 3749.27it/s]
 30%|█████████████████████▌                                                 | 600323/1975667 [02:47<06:07, 3740.86it/s]
 30%|█████████████████████▌                                                 | 600731/1975667 [02:47<05:58, 3833.68it/s]
 30%|█████████████████████▌                                                 | 601135/1975667 [02:48<05:53, 3890.73it/s]
 30%|█████████████████████▌                                                 | 601526/1975667 [02:48<05:53, 3892.66it/s]
 30%|█████████████████████▋                                                 | 601917/1975667 [02:48<05:56, 3848.60it/s]
 30%|█████████████████████▋             

 32%|██████████████████████▍                                                | 625986/1975667 [02:54<05:53, 3817.58it/s]
 32%|██████████████████████▌                                                | 626369/1975667 [02:54<05:59, 3756.17it/s]
 32%|██████████████████████▌                                                | 626784/1975667 [02:54<05:49, 3863.48it/s]
 32%|██████████████████████▌                                                | 627172/1975667 [02:54<06:09, 3651.95it/s]
 32%|██████████████████████▌                                                | 627545/1975667 [02:54<06:07, 3672.10it/s]
 32%|██████████████████████▌                                                | 627969/1975667 [02:55<05:52, 3822.72it/s]
 32%|██████████████████████▌                                                | 628355/1975667 [02:55<10:29, 2140.58it/s]
 32%|██████████████████████▌                                                | 628756/1975667 [02:55<09:01, 2487.57it/s]
 32%|██████████████████████▌            

 33%|███████████████████████▍                                               | 652006/1975667 [03:01<05:58, 3697.02it/s]
 33%|███████████████████████▍                                               | 652377/1975667 [03:01<05:58, 3692.81it/s]
 33%|███████████████████████▍                                               | 652747/1975667 [03:02<06:02, 3648.21it/s]
 33%|███████████████████████▍                                               | 653131/1975667 [03:02<05:57, 3700.85it/s]
 33%|███████████████████████▍                                               | 653502/1975667 [03:02<05:58, 3683.67it/s]
 33%|███████████████████████▍                                               | 653875/1975667 [03:02<05:57, 3694.88it/s]
 33%|███████████████████████▌                                               | 654245/1975667 [03:02<06:33, 3355.91it/s]
 33%|███████████████████████▌                                               | 654587/1975667 [03:02<11:40, 1884.92it/s]
 33%|███████████████████████▌           

 34%|████████████████████████▎                                              | 678208/1975667 [03:09<06:02, 3578.81it/s]
 34%|████████████████████████▍                                              | 678606/1975667 [03:09<05:51, 3687.64it/s]
 34%|████████████████████████▍                                              | 679009/1975667 [03:09<05:42, 3781.33it/s]
 34%|████████████████████████▍                                              | 679397/1975667 [03:09<05:40, 3807.74it/s]
 34%|████████████████████████▍                                              | 679875/1975667 [03:09<05:19, 4052.09it/s]
 34%|████████████████████████▍                                              | 680286/1975667 [03:09<05:21, 4024.15it/s]
 34%|████████████████████████▍                                              | 680696/1975667 [03:09<05:20, 4043.72it/s]
 34%|████████████████████████▍                                              | 681103/1975667 [03:09<05:31, 3902.12it/s]
 34%|████████████████████████▍          

 36%|█████████████████████████▎                                             | 705119/1975667 [03:16<05:25, 3901.77it/s]
 36%|█████████████████████████▎                                             | 705511/1975667 [03:16<05:25, 3898.28it/s]
 36%|█████████████████████████▎                                             | 705902/1975667 [03:16<05:32, 3818.11it/s]
 36%|█████████████████████████▍                                             | 706285/1975667 [03:16<05:34, 3796.25it/s]
 36%|█████████████████████████▍                                             | 706666/1975667 [03:16<05:37, 3757.90it/s]
 36%|█████████████████████████▍                                             | 707043/1975667 [03:16<05:41, 3713.96it/s]
 36%|█████████████████████████▍                                             | 707415/1975667 [03:16<05:46, 3662.95it/s]
 36%|█████████████████████████▍                                             | 707822/1975667 [03:17<05:35, 3773.44it/s]
 36%|█████████████████████████▍         

 37%|██████████████████████████▎                                            | 731389/1975667 [03:23<05:34, 3725.12it/s]
 37%|██████████████████████████▎                                            | 731807/1975667 [03:23<05:23, 3847.99it/s]
 37%|██████████████████████████▎                                            | 732195/1975667 [03:24<05:29, 3775.90it/s]
 37%|██████████████████████████▎                                            | 732583/1975667 [03:24<05:26, 3803.55it/s]
 37%|██████████████████████████▎                                            | 733000/1975667 [03:24<05:18, 3903.22it/s]
 37%|██████████████████████████▎                                            | 733393/1975667 [03:24<05:22, 3850.89it/s]
 37%|██████████████████████████▎                                            | 733781/1975667 [03:24<05:22, 3856.50it/s]
 37%|██████████████████████████▍                                            | 734169/1975667 [03:24<05:21, 3860.48it/s]
 37%|██████████████████████████▍        

 38%|███████████████████████████▏                                           | 756968/1975667 [03:30<05:36, 3619.37it/s]
 38%|███████████████████████████▏                                           | 757344/1975667 [03:30<05:33, 3657.61it/s]
 38%|███████████████████████████▏                                           | 757756/1975667 [03:31<05:21, 3782.63it/s]
 38%|███████████████████████████▏                                           | 758142/1975667 [03:31<05:20, 3802.13it/s]
 38%|███████████████████████████▎                                           | 758524/1975667 [03:31<05:24, 3748.29it/s]
 38%|███████████████████████████▎                                           | 758900/1975667 [03:31<05:30, 3682.54it/s]
 38%|███████████████████████████▎                                           | 759297/1975667 [03:31<05:23, 3761.45it/s]
 38%|███████████████████████████▎                                           | 759675/1975667 [03:31<05:26, 3719.44it/s]
 38%|███████████████████████████▎       

 40%|████████████████████████████                                           | 782563/1975667 [03:37<05:28, 3637.42it/s]
 40%|████████████████████████████▏                                          | 782955/1975667 [03:38<05:21, 3709.73it/s]
 40%|████████████████████████████▏                                          | 783344/1975667 [03:38<05:17, 3759.12it/s]
 40%|████████████████████████████▏                                          | 783765/1975667 [03:38<05:07, 3880.68it/s]
 40%|████████████████████████████▏                                          | 784155/1975667 [03:38<05:07, 3871.74it/s]
 40%|████████████████████████████▏                                          | 784544/1975667 [03:38<05:11, 3822.99it/s]
 40%|████████████████████████████▏                                          | 784933/1975667 [03:38<05:10, 3839.40it/s]
 40%|████████████████████████████▏                                          | 785318/1975667 [03:38<05:10, 3828.44it/s]
 40%|████████████████████████████▏      

 41%|█████████████████████████████                                          | 808585/1975667 [03:45<05:12, 3733.39it/s]
 41%|█████████████████████████████                                          | 808959/1975667 [03:45<05:15, 3693.58it/s]
 41%|█████████████████████████████                                          | 809358/1975667 [03:45<05:08, 3774.58it/s]
 41%|█████████████████████████████                                          | 809847/1975667 [03:45<04:47, 4049.50it/s]
 41%|█████████████████████████████                                          | 810259/1975667 [03:45<04:51, 3995.99it/s]
 41%|█████████████████████████████▏                                         | 810664/1975667 [03:45<04:52, 3984.29it/s]
 41%|█████████████████████████████▏                                         | 811066/1975667 [03:45<04:57, 3909.60it/s]
 41%|█████████████████████████████▏                                         | 811460/1975667 [03:45<05:09, 3763.74it/s]
 41%|█████████████████████████████▏     

 42%|██████████████████████████████                                         | 835074/1975667 [03:52<05:19, 3570.99it/s]
 42%|██████████████████████████████                                         | 835434/1975667 [03:52<05:20, 3561.04it/s]
 42%|██████████████████████████████                                         | 835841/1975667 [03:52<05:08, 3692.26it/s]
 42%|██████████████████████████████                                         | 836213/1975667 [03:52<05:08, 3697.60it/s]
 42%|██████████████████████████████                                         | 836588/1975667 [03:52<05:07, 3709.84it/s]
 42%|██████████████████████████████                                         | 836961/1975667 [03:52<05:07, 3702.22it/s]
 42%|██████████████████████████████                                         | 837333/1975667 [03:52<05:24, 3510.04it/s]
 42%|██████████████████████████████                                         | 837687/1975667 [03:52<05:40, 3341.49it/s]
 42%|██████████████████████████████     

 43%|██████████████████████████████▊                                        | 856582/1975667 [03:59<06:20, 2943.40it/s]
 43%|██████████████████████████████▊                                        | 856883/1975667 [03:59<06:26, 2896.46it/s]
 43%|██████████████████████████████▊                                        | 857217/1975667 [03:59<06:11, 3010.37it/s]
 43%|██████████████████████████████▊                                        | 857611/1975667 [03:59<05:45, 3233.57it/s]
 43%|██████████████████████████████▊                                        | 858013/1975667 [03:59<05:25, 3432.82it/s]
 43%|██████████████████████████████▊                                        | 858397/1975667 [03:59<05:15, 3538.08it/s]
 43%|██████████████████████████████▊                                        | 858758/1975667 [03:59<05:46, 3226.65it/s]
 43%|██████████████████████████████▊                                        | 859091/1975667 [04:00<06:20, 2935.18it/s]
 43%|██████████████████████████████▉    

 45%|███████████████████████████████▌                                       | 879734/1975667 [04:06<05:17, 3451.70it/s]
 45%|███████████████████████████████▋                                       | 880088/1975667 [04:06<05:15, 3475.02it/s]
 45%|███████████████████████████████▋                                       | 880438/1975667 [04:06<05:20, 3418.38it/s]
 45%|███████████████████████████████▋                                       | 880782/1975667 [04:06<05:19, 3422.46it/s]
 45%|███████████████████████████████▋                                       | 881152/1975667 [04:07<05:12, 3498.59it/s]
 45%|███████████████████████████████▋                                       | 881523/1975667 [04:07<05:07, 3556.33it/s]
 45%|███████████████████████████████▋                                       | 881900/1975667 [04:07<05:02, 3615.47it/s]
 45%|███████████████████████████████▋                                       | 882270/1975667 [04:07<05:00, 3637.56it/s]
 45%|███████████████████████████████▋   

 46%|████████████████████████████████▌                                      | 906005/1975667 [04:13<04:33, 3917.73it/s]
 46%|████████████████████████████████▌                                      | 906434/1975667 [04:13<04:26, 4019.41it/s]
 46%|████████████████████████████████▌                                      | 906856/1975667 [04:13<04:22, 4073.98it/s]
 46%|████████████████████████████████▌                                      | 907265/1975667 [04:14<04:26, 4015.38it/s]
 46%|████████████████████████████████▌                                      | 907668/1975667 [04:14<04:29, 3963.50it/s]
 46%|████████████████████████████████▋                                      | 908075/1975667 [04:14<04:27, 3991.71it/s]
 46%|████████████████████████████████▋                                      | 908475/1975667 [04:14<04:32, 3914.22it/s]
 46%|████████████████████████████████▋                                      | 908868/1975667 [04:14<04:32, 3916.26it/s]
 46%|████████████████████████████████▋  

 47%|█████████████████████████████████▍                                     | 931654/1975667 [04:20<05:46, 3013.15it/s]
 47%|█████████████████████████████████▍                                     | 932007/1975667 [04:20<05:31, 3149.34it/s]
 47%|█████████████████████████████████▌                                     | 932365/1975667 [04:21<05:19, 3264.87it/s]
 47%|█████████████████████████████████▌                                     | 932752/1975667 [04:21<05:04, 3423.14it/s]
 47%|█████████████████████████████████▌                                     | 933101/1975667 [04:21<05:09, 3365.37it/s]
 47%|█████████████████████████████████▌                                     | 933480/1975667 [04:21<04:59, 3479.86it/s]
 47%|█████████████████████████████████▌                                     | 933864/1975667 [04:21<04:51, 3577.94it/s]
 47%|█████████████████████████████████▌                                     | 934246/1975667 [04:21<04:45, 3644.49it/s]
 47%|█████████████████████████████████▌ 

 48%|██████████████████████████████████▍                                    | 957190/1975667 [04:28<05:04, 3339.72it/s]
 48%|██████████████████████████████████▍                                    | 957526/1975667 [04:28<05:35, 3034.36it/s]
 48%|██████████████████████████████████▍                                    | 957839/1975667 [04:28<05:32, 3060.04it/s]
 48%|██████████████████████████████████▍                                    | 958172/1975667 [04:28<05:24, 3133.95it/s]
 49%|██████████████████████████████████▍                                    | 958521/1975667 [04:28<05:14, 3230.50it/s]
 49%|██████████████████████████████████▍                                    | 958862/1975667 [04:28<05:10, 3279.82it/s]
 49%|██████████████████████████████████▍                                    | 959193/1975667 [04:28<05:33, 3045.21it/s]
 49%|██████████████████████████████████▍                                    | 959503/1975667 [04:28<05:35, 3032.02it/s]
 49%|██████████████████████████████████▍

 49%|███████████████████████████████████▏                                   | 977681/1975667 [04:35<06:39, 2498.12it/s]
 49%|███████████████████████████████████▏                                   | 977932/1975667 [04:35<06:42, 2481.05it/s]
 50%|███████████████████████████████████▏                                   | 978212/1975667 [04:35<06:29, 2563.45it/s]
 50%|███████████████████████████████████▏                                   | 978488/1975667 [04:35<06:20, 2617.43it/s]
 50%|███████████████████████████████████▏                                   | 978791/1975667 [04:35<06:05, 2726.94it/s]
 50%|███████████████████████████████████▏                                   | 979066/1975667 [04:35<06:08, 2703.38it/s]
 50%|███████████████████████████████████▏                                   | 979352/1975667 [04:35<06:02, 2746.42it/s]
 50%|███████████████████████████████████▏                                   | 979628/1975667 [04:36<06:13, 2664.49it/s]
 50%|███████████████████████████████████

 51%|███████████████████████████████████▊                                   | 998079/1975667 [04:42<06:01, 2706.37it/s]
 51%|███████████████████████████████████▉                                   | 998363/1975667 [04:42<05:56, 2743.00it/s]
 51%|███████████████████████████████████▉                                   | 998659/1975667 [04:42<05:48, 2802.55it/s]
 51%|███████████████████████████████████▉                                   | 998989/1975667 [04:42<05:32, 2933.22it/s]
 51%|███████████████████████████████████▉                                   | 999286/1975667 [04:42<05:38, 2885.93it/s]
 51%|███████████████████████████████████▉                                   | 999595/1975667 [04:43<05:32, 2937.80it/s]
 51%|███████████████████████████████████▉                                   | 999891/1975667 [04:43<05:36, 2903.04it/s]
 51%|███████████████████████████████████▍                                  | 1000183/1975667 [04:43<05:42, 2850.33it/s]
 51%|███████████████████████████████████

 52%|████████████████████████████████████                                  | 1018900/1975667 [04:49<06:27, 2466.58it/s]
 52%|████████████████████████████████████                                  | 1019153/1975667 [04:50<06:53, 2312.62it/s]
 52%|████████████████████████████████████                                  | 1019391/1975667 [04:50<06:56, 2296.78it/s]
 52%|████████████████████████████████████▏                                 | 1019662/1975667 [04:50<06:37, 2405.16it/s]
 52%|████████████████████████████████████▏                                 | 1019962/1975667 [04:50<06:13, 2555.55it/s]
 52%|████████████████████████████████████▏                                 | 1020234/1975667 [04:50<06:07, 2600.76it/s]
 52%|████████████████████████████████████▏                                 | 1020592/1975667 [04:50<05:37, 2831.46it/s]
 52%|████████████████████████████████████▏                                 | 1020943/1975667 [04:50<05:17, 3003.69it/s]
 52%|███████████████████████████████████

 53%|████████████████████████████████████▊                                 | 1037426/1975667 [04:57<07:08, 2189.09it/s]
 53%|████████████████████████████████████▊                                 | 1037663/1975667 [04:58<06:59, 2235.52it/s]
 53%|████████████████████████████████████▊                                 | 1037892/1975667 [04:58<07:30, 2080.73it/s]
 53%|████████████████████████████████████▊                                 | 1038155/1975667 [04:58<07:02, 2218.31it/s]
 53%|████████████████████████████████████▊                                 | 1038443/1975667 [04:58<06:33, 2380.96it/s]
 53%|████████████████████████████████████▊                                 | 1038699/1975667 [04:58<06:25, 2430.06it/s]
 53%|████████████████████████████████████▊                                 | 1038959/1975667 [04:58<06:18, 2476.77it/s]
 53%|████████████████████████████████████▊                                 | 1039211/1975667 [04:58<06:20, 2462.03it/s]
 53%|███████████████████████████████████

 53%|█████████████████████████████████████▎                                | 1054563/1975667 [05:05<06:44, 2276.66it/s]
 53%|█████████████████████████████████████▎                                | 1054794/1975667 [05:05<06:47, 2257.88it/s]
 53%|█████████████████████████████████████▍                                | 1055029/1975667 [05:05<06:43, 2279.65it/s]
 53%|█████████████████████████████████████▍                                | 1055259/1975667 [05:05<06:47, 2260.27it/s]
 53%|█████████████████████████████████████▍                                | 1055486/1975667 [05:05<06:49, 2247.91it/s]
 53%|█████████████████████████████████████▍                                | 1055717/1975667 [05:05<06:46, 2264.40it/s]
 53%|█████████████████████████████████████▍                                | 1055944/1975667 [05:05<06:48, 2250.76it/s]
 53%|█████████████████████████████████████▍                                | 1056170/1975667 [05:06<06:59, 2189.40it/s]
 53%|███████████████████████████████████

 54%|█████████████████████████████████████▉                                | 1070411/1975667 [05:12<06:47, 2220.36it/s]
 54%|█████████████████████████████████████▉                                | 1070639/1975667 [05:12<06:44, 2235.03it/s]
 54%|█████████████████████████████████████▉                                | 1070864/1975667 [05:12<07:10, 2102.80it/s]
 54%|█████████████████████████████████████▉                                | 1071077/1975667 [05:13<14:25, 1044.84it/s]
 54%|█████████████████████████████████████▉                                | 1071327/1975667 [05:13<11:54, 1265.62it/s]
 54%|█████████████████████████████████████▉                                | 1071572/1975667 [05:13<10:11, 1479.59it/s]
 54%|█████████████████████████████████████▉                                | 1071818/1975667 [05:13<08:58, 1677.86it/s]
 54%|█████████████████████████████████████▉                                | 1072044/1975667 [05:13<08:17, 1817.23it/s]
 54%|███████████████████████████████████

 55%|██████████████████████████████████████▌                               | 1087519/1975667 [05:20<06:09, 2406.04it/s]
 55%|██████████████████████████████████████▌                               | 1087765/1975667 [05:20<06:22, 2323.80it/s]
 55%|██████████████████████████████████████▌                               | 1088039/1975667 [05:20<06:04, 2433.02it/s]
 55%|██████████████████████████████████████▌                               | 1088318/1975667 [05:20<05:51, 2524.87it/s]
 55%|██████████████████████████████████████▌                               | 1088656/1975667 [05:20<05:24, 2730.48it/s]
 55%|██████████████████████████████████████▌                               | 1088995/1975667 [05:20<05:05, 2897.74it/s]
 55%|██████████████████████████████████████▌                               | 1089380/1975667 [05:20<04:43, 3127.95it/s]
 55%|██████████████████████████████████████▌                               | 1089800/1975667 [05:20<04:21, 3385.16it/s]
 55%|███████████████████████████████████

 56%|███████████████████████████████████████▎                              | 1108930/1975667 [05:27<05:28, 2637.24it/s]
 56%|███████████████████████████████████████▎                              | 1109196/1975667 [05:27<05:38, 2561.58it/s]
 56%|███████████████████████████████████████▎                              | 1109455/1975667 [05:27<05:45, 2508.15it/s]
 56%|███████████████████████████████████████▎                              | 1109846/1975667 [05:27<05:08, 2808.83it/s]
 56%|███████████████████████████████████████▎                              | 1110188/1975667 [05:27<04:51, 2965.88it/s]
 56%|███████████████████████████████████████▎                              | 1110540/1975667 [05:27<04:38, 3110.69it/s]
 56%|███████████████████████████████████████▎                              | 1110861/1975667 [05:27<04:40, 3087.45it/s]
 56%|███████████████████████████████████████▎                              | 1111177/1975667 [05:27<04:57, 2908.61it/s]
 56%|███████████████████████████████████

 57%|███████████████████████████████████████▉                              | 1127827/1975667 [05:34<05:51, 2410.92it/s]
 57%|███████████████████████████████████████▉                              | 1128079/1975667 [05:34<05:47, 2440.74it/s]
 57%|███████████████████████████████████████▉                              | 1128325/1975667 [05:34<05:53, 2397.95it/s]
 57%|███████████████████████████████████████▉                              | 1128590/1975667 [05:34<05:43, 2463.10it/s]
 57%|███████████████████████████████████████▉                              | 1128840/1975667 [05:34<05:42, 2472.09it/s]
 57%|████████████████████████████████████████                              | 1129095/1975667 [05:34<05:39, 2493.02it/s]
 57%|████████████████████████████████████████                              | 1129345/1975667 [05:35<05:55, 2378.94it/s]
 57%|████████████████████████████████████████                              | 1129674/1975667 [05:35<05:26, 2592.84it/s]
 57%|███████████████████████████████████

 58%|████████████████████████████████████████▋                             | 1148048/1975667 [05:41<05:39, 2436.16it/s]
 58%|████████████████████████████████████████▋                             | 1148303/1975667 [05:41<05:35, 2467.32it/s]
 58%|████████████████████████████████████████▋                             | 1148572/1975667 [05:41<05:27, 2528.25it/s]
 58%|████████████████████████████████████████▋                             | 1148933/1975667 [05:41<04:57, 2776.27it/s]
 58%|████████████████████████████████████████▋                             | 1149257/1975667 [05:42<04:45, 2898.75it/s]
 58%|████████████████████████████████████████▋                             | 1149588/1975667 [05:42<04:34, 3008.79it/s]
 58%|████████████████████████████████████████▋                             | 1149897/1975667 [05:42<04:32, 3030.33it/s]
 58%|████████████████████████████████████████▊                             | 1150218/1975667 [05:42<04:28, 3079.71it/s]
 58%|███████████████████████████████████

 59%|█████████████████████████████████████████▍                            | 1168017/1975667 [05:48<05:41, 2362.66it/s]
 59%|█████████████████████████████████████████▍                            | 1168256/1975667 [05:49<05:43, 2347.92it/s]
 59%|█████████████████████████████████████████▍                            | 1168496/1975667 [05:49<05:41, 2361.45it/s]
 59%|█████████████████████████████████████████▍                            | 1168752/1975667 [05:49<05:34, 2415.87it/s]
 59%|█████████████████████████████████████████▍                            | 1169029/1975667 [05:49<05:21, 2510.41it/s]
 59%|█████████████████████████████████████████▍                            | 1169321/1975667 [05:49<05:09, 2604.75it/s]
 59%|█████████████████████████████████████████▍                            | 1169660/1975667 [05:49<04:48, 2797.42it/s]
 59%|█████████████████████████████████████████▍                            | 1169946/1975667 [05:49<04:56, 2721.09it/s]
 59%|███████████████████████████████████

 60%|██████████████████████████████████████████                            | 1188598/1975667 [05:56<04:54, 2673.05it/s]
 60%|██████████████████████████████████████████                            | 1188868/1975667 [05:56<04:53, 2678.95it/s]
 60%|██████████████████████████████████████████▏                           | 1189138/1975667 [05:56<05:01, 2605.22it/s]
 60%|██████████████████████████████████████████▏                           | 1189471/1975667 [05:56<04:42, 2785.34it/s]
 60%|██████████████████████████████████████████▏                           | 1189920/1975667 [05:56<04:10, 3141.60it/s]
 60%|██████████████████████████████████████████▏                           | 1190253/1975667 [05:56<04:09, 3147.99it/s]
 60%|██████████████████████████████████████████▏                           | 1190581/1975667 [05:56<04:14, 3080.55it/s]
 60%|██████████████████████████████████████████▏                           | 1190966/1975667 [05:56<03:59, 3274.80it/s]
 60%|███████████████████████████████████

 61%|██████████████████████████████████████████▉                           | 1210614/1975667 [06:03<04:13, 3019.05it/s]
 61%|██████████████████████████████████████████▉                           | 1210918/1975667 [06:03<04:15, 2991.57it/s]
 61%|██████████████████████████████████████████▉                           | 1211219/1975667 [06:03<04:18, 2959.28it/s]
 61%|██████████████████████████████████████████▉                           | 1211535/1975667 [06:03<04:13, 3014.46it/s]
 61%|██████████████████████████████████████████▉                           | 1211838/1975667 [06:04<04:13, 3012.19it/s]
 61%|██████████████████████████████████████████▉                           | 1212315/1975667 [06:04<03:45, 3384.67it/s]
 61%|██████████████████████████████████████████▉                           | 1212676/1975667 [06:04<03:41, 3446.63it/s]
 61%|██████████████████████████████████████████▉                           | 1213032/1975667 [06:04<03:44, 3392.42it/s]
 61%|███████████████████████████████████

 62%|███████████████████████████████████████████▋                          | 1233526/1975667 [06:10<04:21, 2842.07it/s]
 62%|███████████████████████████████████████████▋                          | 1233812/1975667 [06:10<04:25, 2794.97it/s]
 62%|███████████████████████████████████████████▋                          | 1234093/1975667 [06:10<04:25, 2797.24it/s]
 62%|███████████████████████████████████████████▋                          | 1234374/1975667 [06:11<04:26, 2786.30it/s]
 62%|███████████████████████████████████████████▋                          | 1234765/1975667 [06:11<04:03, 3047.28it/s]
 63%|███████████████████████████████████████████▊                          | 1235078/1975667 [06:11<04:13, 2926.80it/s]
 63%|███████████████████████████████████████████▊                          | 1235469/1975667 [06:11<03:53, 3163.56it/s]
 63%|███████████████████████████████████████████▊                          | 1235796/1975667 [06:11<03:53, 3169.00it/s]
 63%|███████████████████████████████████

 63%|████████████████████████████████████████████▎                         | 1250981/1975667 [06:18<04:21, 2772.26it/s]
 63%|████████████████████████████████████████████▎                         | 1251283/1975667 [06:18<04:15, 2840.07it/s]
 63%|████████████████████████████████████████████▎                         | 1251587/1975667 [06:18<04:10, 2895.02it/s]
 63%|████████████████████████████████████████████▎                         | 1251880/1975667 [06:18<04:09, 2898.80it/s]
 63%|████████████████████████████████████████████▎                         | 1252214/1975667 [06:18<03:59, 3016.23it/s]
 63%|████████████████████████████████████████████▍                         | 1252568/1975667 [06:18<03:49, 3149.87it/s]
 63%|████████████████████████████████████████████▍                         | 1252887/1975667 [06:18<03:54, 3081.28it/s]
 63%|████████████████████████████████████████████▍                         | 1253284/1975667 [06:18<03:38, 3300.90it/s]
 63%|███████████████████████████████████

 64%|█████████████████████████████████████████████                         | 1272692/1975667 [06:25<04:10, 2809.83it/s]
 64%|█████████████████████████████████████████████                         | 1272977/1975667 [06:25<04:27, 2624.29it/s]
 64%|█████████████████████████████████████████████                         | 1273245/1975667 [06:25<04:27, 2627.01it/s]
 64%|█████████████████████████████████████████████                         | 1273528/1975667 [06:25<04:21, 2682.74it/s]
 64%|█████████████████████████████████████████████▏                        | 1273799/1975667 [06:25<04:24, 2657.01it/s]
 64%|█████████████████████████████████████████████▏                        | 1274237/1975667 [06:25<03:52, 3010.87it/s]
 65%|█████████████████████████████████████████████▏                        | 1274556/1975667 [06:26<03:53, 3008.03it/s]
 65%|█████████████████████████████████████████████▏                        | 1274869/1975667 [06:26<03:52, 3010.45it/s]
 65%|███████████████████████████████████

 66%|█████████████████████████████████████████████▊                        | 1294128/1975667 [06:32<03:51, 2949.20it/s]
 66%|█████████████████████████████████████████████▊                        | 1294432/1975667 [06:32<04:10, 2721.32it/s]
 66%|█████████████████████████████████████████████▊                        | 1294714/1975667 [06:32<04:26, 2556.93it/s]
 66%|█████████████████████████████████████████████▉                        | 1295014/1975667 [06:32<04:14, 2673.56it/s]
 66%|█████████████████████████████████████████████▉                        | 1295315/1975667 [06:33<04:06, 2764.29it/s]
 66%|█████████████████████████████████████████████▉                        | 1295623/1975667 [06:33<03:58, 2849.88it/s]
 66%|█████████████████████████████████████████████▉                        | 1295977/1975667 [06:33<03:44, 3024.84it/s]
 66%|█████████████████████████████████████████████▉                        | 1296312/1975667 [06:33<03:38, 3113.24it/s]
 66%|███████████████████████████████████

 67%|██████████████████████████████████████████████▌                       | 1315668/1975667 [06:39<03:58, 2763.54it/s]
 67%|██████████████████████████████████████████████▋                       | 1315948/1975667 [06:39<03:59, 2755.75it/s]
 67%|██████████████████████████████████████████████▋                       | 1316226/1975667 [06:40<03:59, 2752.57it/s]
 67%|██████████████████████████████████████████████▋                       | 1316503/1975667 [06:40<03:59, 2751.47it/s]
 67%|██████████████████████████████████████████████▋                       | 1316881/1975667 [06:40<03:40, 2994.14it/s]
 67%|██████████████████████████████████████████████▋                       | 1317304/1975667 [06:40<03:20, 3279.75it/s]
 67%|██████████████████████████████████████████████▋                       | 1317646/1975667 [06:40<03:20, 3279.74it/s]
 67%|██████████████████████████████████████████████▋                       | 1317984/1975667 [06:40<03:22, 3253.94it/s]
 67%|███████████████████████████████████

 68%|███████████████████████████████████████████████▍                      | 1337307/1975667 [06:47<04:05, 2602.85it/s]
 68%|███████████████████████████████████████████████▍                      | 1337572/1975667 [06:47<04:12, 2524.83it/s]
 68%|███████████████████████████████████████████████▍                      | 1337880/1975667 [06:47<03:59, 2667.32it/s]
 68%|███████████████████████████████████████████████▍                      | 1338172/1975667 [06:47<03:52, 2736.35it/s]
 68%|███████████████████████████████████████████████▍                      | 1338482/1975667 [06:47<03:44, 2834.09it/s]
 68%|███████████████████████████████████████████████▍                      | 1338798/1975667 [06:47<03:37, 2922.41it/s]
 68%|███████████████████████████████████████████████▍                      | 1339140/1975667 [06:47<03:28, 3053.61it/s]
 68%|███████████████████████████████████████████████▍                      | 1339450/1975667 [06:47<03:30, 3024.48it/s]
 68%|███████████████████████████████████

 69%|████████████████████████████████████████████████▏                     | 1358324/1975667 [06:54<03:54, 2631.42it/s]
 69%|████████████████████████████████████████████████▏                     | 1358591/1975667 [06:54<03:59, 2575.66it/s]
 69%|████████████████████████████████████████████████▏                     | 1358953/1975667 [06:54<03:38, 2817.94it/s]
 69%|████████████████████████████████████████████████▏                     | 1359309/1975667 [06:54<03:25, 3003.88it/s]
 69%|████████████████████████████████████████████████▏                     | 1359648/1975667 [06:54<03:18, 3107.87it/s]
 69%|████████████████████████████████████████████████▏                     | 1359967/1975667 [06:54<03:21, 3061.84it/s]
 69%|████████████████████████████████████████████████▏                     | 1360300/1975667 [06:54<03:16, 3135.28it/s]
 69%|████████████████████████████████████████████████▏                     | 1360638/1975667 [06:54<03:12, 3202.46it/s]
 69%|███████████████████████████████████

 70%|████████████████████████████████████████████████▉                     | 1379479/1975667 [07:01<03:37, 2746.97it/s]
 70%|████████████████████████████████████████████████▉                     | 1379778/1975667 [07:01<03:31, 2813.53it/s]
 70%|████████████████████████████████████████████████▉                     | 1380061/1975667 [07:01<03:36, 2750.34it/s]
 70%|████████████████████████████████████████████████▉                     | 1380338/1975667 [07:01<03:36, 2754.02it/s]
 70%|████████████████████████████████████████████████▉                     | 1380615/1975667 [07:01<03:50, 2579.04it/s]
 70%|████████████████████████████████████████████████▉                     | 1380876/1975667 [07:02<03:51, 2574.68it/s]
 70%|████████████████████████████████████████████████▉                     | 1381217/1975667 [07:02<03:34, 2777.09it/s]
 70%|████████████████████████████████████████████████▉                     | 1381537/1975667 [07:02<03:25, 2885.73it/s]
 70%|███████████████████████████████████

 71%|█████████████████████████████████████████████████▋                    | 1401573/1975667 [07:09<03:25, 2792.47it/s]
 71%|█████████████████████████████████████████████████▋                    | 1401897/1975667 [07:09<03:17, 2911.09it/s]
 71%|█████████████████████████████████████████████████▋                    | 1402197/1975667 [07:09<03:15, 2926.30it/s]
 71%|█████████████████████████████████████████████████▋                    | 1402579/1975667 [07:09<03:02, 3145.12it/s]
 71%|█████████████████████████████████████████████████▋                    | 1402903/1975667 [07:10<03:07, 3049.33it/s]
 71%|█████████████████████████████████████████████████▋                    | 1403253/1975667 [07:10<03:00, 3169.56it/s]
 71%|█████████████████████████████████████████████████▋                    | 1403576/1975667 [07:10<03:01, 3156.85it/s]
 71%|█████████████████████████████████████████████████▋                    | 1403896/1975667 [07:10<03:06, 3057.91it/s]
 71%|███████████████████████████████████

 72%|██████████████████████████████████████████████████▎                   | 1421078/1975667 [07:16<05:47, 1594.41it/s]
 72%|██████████████████████████████████████████████████▎                   | 1421261/1975667 [07:17<05:34, 1657.26it/s]
 72%|██████████████████████████████████████████████████▎                   | 1421436/1975667 [07:17<05:29, 1682.72it/s]
 72%|██████████████████████████████████████████████████▎                   | 1421606/1975667 [07:17<05:35, 1652.04it/s]
 72%|██████████████████████████████████████████████████▎                   | 1421773/1975667 [07:17<05:37, 1641.38it/s]
 72%|██████████████████████████████████████████████████▍                   | 1421938/1975667 [07:17<05:41, 1623.21it/s]
 72%|██████████████████████████████████████████████████▍                   | 1422103/1975667 [07:17<05:39, 1629.87it/s]
 72%|██████████████████████████████████████████████████▍                   | 1422284/1975667 [07:17<05:29, 1678.78it/s]
 72%|███████████████████████████████████

 73%|██████████████████████████████████████████████████▉                   | 1439232/1975667 [07:24<03:08, 2841.86it/s]
 73%|███████████████████████████████████████████████████                   | 1439523/1975667 [07:24<03:07, 2859.72it/s]
 73%|███████████████████████████████████████████████████                   | 1439842/1975667 [07:24<03:01, 2949.21it/s]
 73%|███████████████████████████████████████████████████                   | 1440147/1975667 [07:24<02:59, 2976.41it/s]
 73%|███████████████████████████████████████████████████                   | 1440458/1975667 [07:24<02:57, 3012.93it/s]
 73%|███████████████████████████████████████████████████                   | 1440767/1975667 [07:24<02:56, 3033.26it/s]
 73%|███████████████████████████████████████████████████                   | 1441077/1975667 [07:24<02:55, 3046.07it/s]
 73%|███████████████████████████████████████████████████                   | 1441423/1975667 [07:24<02:49, 3157.16it/s]
 73%|███████████████████████████████████

 74%|███████████████████████████████████████████████████▋                  | 1460114/1975667 [07:31<03:06, 2762.01it/s]
 74%|███████████████████████████████████████████████████▋                  | 1460392/1975667 [07:31<03:17, 2603.81it/s]
 74%|███████████████████████████████████████████████████▊                  | 1460695/1975667 [07:31<03:09, 2716.57it/s]
 74%|███████████████████████████████████████████████████▊                  | 1461009/1975667 [07:31<03:01, 2829.05it/s]
 74%|███████████████████████████████████████████████████▊                  | 1461321/1975667 [07:31<02:56, 2908.32it/s]
 74%|███████████████████████████████████████████████████▊                  | 1461615/1975667 [07:31<02:56, 2906.77it/s]
 74%|███████████████████████████████████████████████████▊                  | 1461953/1975667 [07:31<02:49, 3023.87it/s]
 74%|███████████████████████████████████████████████████▊                  | 1462283/1975667 [07:32<02:45, 3099.39it/s]
 74%|███████████████████████████████████

 75%|████████████████████████████████████████████████████▌                 | 1481943/1975667 [07:38<02:49, 2919.87it/s]
 75%|████████████████████████████████████████████████████▌                 | 1482242/1975667 [07:38<02:47, 2938.26it/s]
 75%|████████████████████████████████████████████████████▌                 | 1482591/1975667 [07:38<02:39, 3082.37it/s]
 75%|████████████████████████████████████████████████████▌                 | 1482903/1975667 [07:38<02:40, 3072.79it/s]
 75%|████████████████████████████████████████████████████▌                 | 1483228/1975667 [07:38<02:37, 3121.50it/s]
 75%|████████████████████████████████████████████████████▌                 | 1483542/1975667 [07:38<02:40, 3064.89it/s]
 75%|████████████████████████████████████████████████████▌                 | 1483863/1975667 [07:39<02:38, 3095.63it/s]
 75%|████████████████████████████████████████████████████▌                 | 1484190/1975667 [07:39<02:36, 3143.53it/s]
 75%|███████████████████████████████████

 76%|█████████████████████████████████████████████████████▎                | 1503847/1975667 [07:45<02:51, 2751.67it/s]
 76%|█████████████████████████████████████████████████████▎                | 1504181/1975667 [07:45<02:42, 2903.16it/s]
 76%|█████████████████████████████████████████████████████▎                | 1504475/1975667 [07:45<02:47, 2819.43it/s]
 76%|█████████████████████████████████████████████████████▎                | 1504829/1975667 [07:45<02:36, 3000.75it/s]
 76%|█████████████████████████████████████████████████████▎                | 1505169/1975667 [07:46<02:31, 3108.05it/s]
 76%|█████████████████████████████████████████████████████▎                | 1505515/1975667 [07:46<02:26, 3203.51it/s]
 76%|█████████████████████████████████████████████████████▎                | 1505840/1975667 [07:46<02:26, 3200.48it/s]
 76%|█████████████████████████████████████████████████████▎                | 1506163/1975667 [07:46<02:27, 3192.43it/s]
 76%|███████████████████████████████████

 77%|██████████████████████████████████████████████████████                | 1525920/1975667 [07:52<02:23, 3141.64it/s]
 77%|██████████████████████████████████████████████████████                | 1526237/1975667 [07:52<02:30, 2978.57it/s]
 77%|██████████████████████████████████████████████████████                | 1526539/1975667 [07:52<02:32, 2944.70it/s]
 77%|██████████████████████████████████████████████████████                | 1526837/1975667 [07:53<02:31, 2952.86it/s]
 77%|██████████████████████████████████████████████████████                | 1527180/1975667 [07:53<02:25, 3079.24it/s]
 77%|██████████████████████████████████████████████████████                | 1527530/1975667 [07:53<02:20, 3192.12it/s]
 77%|██████████████████████████████████████████████████████▏               | 1527853/1975667 [07:53<02:21, 3163.14it/s]
 77%|██████████████████████████████████████████████████████▏               | 1528174/1975667 [07:53<02:20, 3174.53it/s]
 77%|███████████████████████████████████

 78%|██████████████████████████████████████████████████████▊               | 1547379/1975667 [07:59<02:32, 2807.52it/s]
 78%|██████████████████████████████████████████████████████▊               | 1547661/1975667 [08:00<02:33, 2783.99it/s]
 78%|██████████████████████████████████████████████████████▊               | 1547943/1975667 [08:00<02:33, 2792.49it/s]
 78%|██████████████████████████████████████████████████████▊               | 1548296/1975667 [08:00<02:23, 2977.21it/s]
 78%|██████████████████████████████████████████████████████▊               | 1548634/1975667 [08:00<02:18, 3085.33it/s]
 78%|██████████████████████████████████████████████████████▉               | 1548963/1975667 [08:00<02:15, 3141.61it/s]
 78%|██████████████████████████████████████████████████████▉               | 1549395/1975667 [08:00<02:04, 3419.44it/s]
 78%|██████████████████████████████████████████████████████▉               | 1549747/1975667 [08:00<02:09, 3277.39it/s]
 78%|███████████████████████████████████

 79%|███████████████████████████████████████████████████████▌              | 1568718/1975667 [08:07<03:04, 2205.51it/s]
 79%|███████████████████████████████████████████████████████▌              | 1569046/1975667 [08:07<02:46, 2444.43it/s]
 79%|███████████████████████████████████████████████████████▌              | 1569388/1975667 [08:07<02:32, 2671.52it/s]
 79%|███████████████████████████████████████████████████████▌              | 1569690/1975667 [08:07<02:26, 2765.28it/s]
 79%|███████████████████████████████████████████████████████▋              | 1570032/1975667 [08:07<02:18, 2931.77it/s]
 79%|███████████████████████████████████████████████████████▋              | 1570338/1975667 [08:07<02:18, 2932.58it/s]
 79%|███████████████████████████████████████████████████████▋              | 1570642/1975667 [08:07<02:16, 2961.69it/s]
 80%|███████████████████████████████████████████████████████▋              | 1570986/1975667 [08:07<02:11, 3084.23it/s]
 80%|███████████████████████████████████

 80%|████████████████████████████████████████████████████████▎             | 1590208/1975667 [08:14<02:15, 2840.24it/s]
 81%|████████████████████████████████████████████████████████▎             | 1590568/1975667 [08:14<02:07, 3030.18it/s]
 81%|████████████████████████████████████████████████████████▎             | 1590877/1975667 [08:14<02:10, 2949.28it/s]
 81%|████████████████████████████████████████████████████████▍             | 1591234/1975667 [08:14<02:03, 3109.43it/s]
 81%|████████████████████████████████████████████████████████▍             | 1591555/1975667 [08:14<02:02, 3136.48it/s]
 81%|████████████████████████████████████████████████████████▍             | 1591873/1975667 [08:14<02:02, 3132.93it/s]
 81%|████████████████████████████████████████████████████████▍             | 1592198/1975667 [08:14<02:01, 3164.69it/s]
 81%|████████████████████████████████████████████████████████▍             | 1592517/1975667 [08:15<02:01, 3160.28it/s]
 81%|███████████████████████████████████

 82%|█████████████████████████████████████████████████████████▏            | 1613133/1975667 [08:21<01:51, 3261.87it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1613473/1975667 [08:21<01:55, 3139.20it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1613798/1975667 [08:21<01:57, 3078.85it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1614114/1975667 [08:21<01:56, 3091.20it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1614429/1975667 [08:21<01:56, 3087.84it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1614742/1975667 [08:22<01:57, 3065.96it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1615059/1975667 [08:22<01:56, 3094.03it/s]
 82%|█████████████████████████████████████████████████████████▏            | 1615389/1975667 [08:22<01:54, 3150.66it/s]
 82%|███████████████████████████████████

 83%|█████████████████████████████████████████████████████████▉            | 1634020/1975667 [08:29<01:57, 2899.52it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1634336/1975667 [08:29<01:54, 2970.80it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1634635/1975667 [08:29<01:55, 2943.35it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1635005/1975667 [08:29<01:48, 3133.60it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1635323/1975667 [08:29<01:48, 3144.89it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1635641/1975667 [08:29<01:50, 3088.36it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1635965/1975667 [08:29<01:48, 3129.92it/s]
 83%|█████████████████████████████████████████████████████████▉            | 1636288/1975667 [08:29<01:47, 3152.18it/s]
 83%|███████████████████████████████████

 84%|██████████████████████████████████████████████████████████▋           | 1656107/1975667 [08:36<01:27, 3637.55it/s]
 84%|██████████████████████████████████████████████████████████▋           | 1656500/1975667 [08:36<01:34, 3385.44it/s]
 84%|██████████████████████████████████████████████████████████▋           | 1656862/1975667 [08:36<01:35, 3325.97it/s]
 84%|██████████████████████████████████████████████████████████▋           | 1657212/1975667 [08:36<01:35, 3339.84it/s]
 84%|██████████████████████████████████████████████████████████▋           | 1657558/1975667 [08:36<01:56, 2728.43it/s]
 84%|██████████████████████████████████████████████████████████▋           | 1657858/1975667 [08:36<02:04, 2558.08it/s]
 84%|██████████████████████████████████████████████████████████▊           | 1658178/1975667 [08:36<01:56, 2720.05it/s]
 84%|██████████████████████████████████████████████████████████▊           | 1658473/1975667 [08:37<01:53, 2783.08it/s]
 84%|███████████████████████████████████

 85%|███████████████████████████████████████████████████████████▍          | 1678439/1975667 [08:43<01:51, 2659.22it/s]
 85%|███████████████████████████████████████████████████████████▍          | 1678708/1975667 [08:43<02:18, 2142.46it/s]
 85%|███████████████████████████████████████████████████████████▍          | 1678968/1975667 [08:43<02:11, 2260.30it/s]
 85%|███████████████████████████████████████████████████████████▌          | 1679330/1975667 [08:43<01:56, 2545.92it/s]
 85%|███████████████████████████████████████████████████████████▌          | 1679640/1975667 [08:44<01:50, 2688.30it/s]
 85%|███████████████████████████████████████████████████████████▌          | 1679945/1975667 [08:44<01:46, 2785.43it/s]
 85%|███████████████████████████████████████████████████████████▌          | 1680237/1975667 [08:44<01:45, 2789.85it/s]
 85%|███████████████████████████████████████████████████████████▌          | 1680556/1975667 [08:44<01:41, 2896.84it/s]
 85%|███████████████████████████████████

 86%|████████████████████████████████████████████████████████████▎         | 1700503/1975667 [08:51<01:48, 2543.18it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1700802/1975667 [08:51<01:43, 2660.64it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1701075/1975667 [08:51<01:42, 2678.98it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1701423/1975667 [08:51<01:35, 2875.80it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1701815/1975667 [08:51<01:27, 3123.57it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1702138/1975667 [08:51<01:26, 3147.68it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1702461/1975667 [08:51<01:28, 3078.58it/s]
 86%|████████████████████████████████████████████████████████████▎         | 1702776/1975667 [08:51<01:28, 3097.22it/s]
 86%|███████████████████████████████████

 87%|████████████████████████████████████████████████████████████▉         | 1719534/1975667 [08:58<01:39, 2585.01it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1719797/1975667 [08:58<01:40, 2539.71it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1720072/1975667 [08:58<01:38, 2597.40it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1720335/1975667 [08:58<01:38, 2601.15it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1720597/1975667 [08:58<01:38, 2596.93it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1720872/1975667 [08:58<01:36, 2639.01it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1721177/1975667 [08:58<01:32, 2748.20it/s]
 87%|████████████████████████████████████████████████████████████▉         | 1721511/1975667 [08:58<01:27, 2900.47it/s]
 87%|███████████████████████████████████

 88%|█████████████████████████████████████████████████████████████▋        | 1741431/1975667 [09:05<01:22, 2833.47it/s]
 88%|█████████████████████████████████████████████████████████████▋        | 1741732/1975667 [09:05<01:21, 2882.02it/s]
 88%|█████████████████████████████████████████████████████████████▋        | 1742040/1975667 [09:05<01:19, 2936.43it/s]
 88%|█████████████████████████████████████████████████████████████▋        | 1742379/1975667 [09:05<01:16, 3057.03it/s]
 88%|█████████████████████████████████████████████████████████████▋        | 1742699/1975667 [09:05<01:23, 2798.84it/s]
 88%|█████████████████████████████████████████████████████████████▊        | 1743038/1975667 [09:05<01:18, 2951.29it/s]
 88%|█████████████████████████████████████████████████████████████▊        | 1743341/1975667 [09:06<01:18, 2967.76it/s]
 88%|█████████████████████████████████████████████████████████████▊        | 1743810/1975667 [09:06<01:09, 3333.27it/s]
 88%|███████████████████████████████████

 89%|██████████████████████████████████████████████████████████████▍       | 1763425/1975667 [09:12<01:31, 2316.05it/s]
 89%|██████████████████████████████████████████████████████████████▍       | 1763680/1975667 [09:12<01:29, 2379.82it/s]
 89%|██████████████████████████████████████████████████████████████▍       | 1763950/1975667 [09:13<01:25, 2465.81it/s]
 89%|██████████████████████████████████████████████████████████████▌       | 1764287/1975667 [09:13<01:18, 2679.96it/s]
 89%|██████████████████████████████████████████████████████████████▌       | 1764632/1975667 [09:13<01:13, 2870.37it/s]
 89%|██████████████████████████████████████████████████████████████▌       | 1764951/1975667 [09:13<01:11, 2957.13it/s]
 89%|██████████████████████████████████████████████████████████████▌       | 1765295/1975667 [09:13<01:08, 3084.92it/s]
 89%|██████████████████████████████████████████████████████████████▌       | 1765611/1975667 [09:13<01:07, 3100.04it/s]
 89%|███████████████████████████████████

 90%|███████████████████████████████████████████████████████████████▏      | 1784157/1975667 [09:20<01:05, 2936.46it/s]
 90%|███████████████████████████████████████████████████████████████▏      | 1784462/1975667 [09:20<01:05, 2899.39it/s]
 90%|███████████████████████████████████████████████████████████████▏      | 1784760/1975667 [09:20<01:08, 2793.22it/s]
 90%|███████████████████████████████████████████████████████████████▏      | 1785080/1975667 [09:20<01:05, 2901.86it/s]
 90%|███████████████████████████████████████████████████████████████▎      | 1785376/1975667 [09:20<01:06, 2849.19it/s]
 90%|███████████████████████████████████████████████████████████████▎      | 1785722/1975667 [09:20<01:03, 3006.44it/s]
 90%|███████████████████████████████████████████████████████████████▎      | 1786033/1975667 [09:20<01:02, 3034.36it/s]
 90%|███████████████████████████████████████████████████████████████▎      | 1786341/1975667 [09:20<01:04, 2936.37it/s]
 90%|███████████████████████████████████

 91%|███████████████████████████████████████████████████████████████▉      | 1805701/1975667 [09:27<00:59, 2844.99it/s]
 91%|███████████████████████████████████████████████████████████████▉      | 1805988/1975667 [09:27<01:02, 2724.06it/s]
 91%|███████████████████████████████████████████████████████████████▉      | 1806279/1975667 [09:27<01:01, 2775.18it/s]
 91%|████████████████████████████████████████████████████████████████      | 1806559/1975667 [09:27<01:01, 2763.86it/s]
 91%|████████████████████████████████████████████████████████████████      | 1806850/1975667 [09:27<01:00, 2803.97it/s]
 91%|████████████████████████████████████████████████████████████████      | 1807132/1975667 [09:28<01:03, 2663.03it/s]
 91%|████████████████████████████████████████████████████████████████      | 1807406/1975667 [09:28<01:02, 2683.56it/s]
 91%|████████████████████████████████████████████████████████████████      | 1807676/1975667 [09:28<01:03, 2666.38it/s]
 92%|███████████████████████████████████

 92%|████████████████████████████████████████████████████████████████▋     | 1826741/1975667 [09:34<00:53, 2805.76it/s]
 92%|████████████████████████████████████████████████████████████████▋     | 1827024/1975667 [09:34<00:55, 2663.53it/s]
 92%|████████████████████████████████████████████████████████████████▋     | 1827331/1975667 [09:34<00:53, 2771.70it/s]
 93%|████████████████████████████████████████████████████████████████▊     | 1827663/1975667 [09:35<00:50, 2914.14it/s]
 93%|████████████████████████████████████████████████████████████████▊     | 1827981/1975667 [09:35<00:49, 2986.86it/s]
 93%|████████████████████████████████████████████████████████████████▊     | 1828286/1975667 [09:35<00:49, 3003.16it/s]
 93%|████████████████████████████████████████████████████████████████▊     | 1828647/1975667 [09:35<00:46, 3160.43it/s]
 93%|████████████████████████████████████████████████████████████████▊     | 1828974/1975667 [09:35<00:45, 3190.04it/s]
 93%|███████████████████████████████████

 94%|█████████████████████████████████████████████████████████████████▍    | 1848470/1975667 [09:41<00:40, 3149.34it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1848790/1975667 [09:41<00:40, 3120.13it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1849126/1975667 [09:42<00:39, 3181.47it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1849447/1975667 [09:42<00:40, 3108.52it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1849815/1975667 [09:42<00:38, 3258.11it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1850145/1975667 [09:42<00:39, 3205.90it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1850469/1975667 [09:42<00:43, 2909.67it/s]
 94%|█████████████████████████████████████████████████████████████████▌    | 1850768/1975667 [09:42<00:42, 2909.57it/s]
 94%|███████████████████████████████████

 95%|██████████████████████████████████████████████████████████████████▏   | 1869590/1975667 [09:49<00:36, 2871.81it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1869880/1975667 [09:49<00:37, 2856.60it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1870332/1975667 [09:49<00:32, 3209.29it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1870688/1975667 [09:50<00:31, 3304.58it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1871031/1975667 [09:50<00:31, 3280.98it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1871368/1975667 [09:50<00:33, 3133.61it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1871689/1975667 [09:50<00:33, 3080.82it/s]
 95%|██████████████████████████████████████████████████████████████████▎   | 1872003/1975667 [09:50<00:33, 3091.31it/s]
 95%|███████████████████████████████████

 96%|██████████████████████████████████████████████████████████████████▉   | 1890946/1975667 [09:56<00:32, 2612.61it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1891220/1975667 [09:56<00:31, 2643.79it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1891498/1975667 [09:57<00:31, 2681.16it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1891821/1975667 [09:57<00:29, 2823.20it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1892150/1975667 [09:57<00:28, 2946.60it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1892520/1975667 [09:57<00:26, 3136.18it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1892840/1975667 [09:57<00:27, 3018.41it/s]
 96%|███████████████████████████████████████████████████████████████████   | 1893153/1975667 [09:57<00:27, 3048.66it/s]
 96%|███████████████████████████████████

 97%|███████████████████████████████████████████████████████████████████▋  | 1910642/1975667 [10:04<00:26, 2497.56it/s]
 97%|███████████████████████████████████████████████████████████████████▋  | 1910895/1975667 [10:04<00:26, 2464.83it/s]
 97%|███████████████████████████████████████████████████████████████████▋  | 1911201/1975667 [10:04<00:24, 2615.78it/s]
 97%|███████████████████████████████████████████████████████████████████▋  | 1911512/1975667 [10:04<00:23, 2744.79it/s]
 97%|███████████████████████████████████████████████████████████████████▋  | 1911813/1975667 [10:04<00:22, 2805.35it/s]
 97%|███████████████████████████████████████████████████████████████████▋  | 1912097/1975667 [10:04<00:25, 2487.31it/s]
 97%|███████████████████████████████████████████████████████████████████▊  | 1912355/1975667 [10:04<00:28, 2231.39it/s]
 97%|███████████████████████████████████████████████████████████████████▊  | 1912618/1975667 [10:04<00:26, 2336.02it/s]
 97%|███████████████████████████████████

 98%|████████████████████████████████████████████████████████████████████▍ | 1930863/1975667 [10:11<00:14, 3179.37it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1931196/1975667 [10:11<00:14, 3120.76it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1931519/1975667 [10:11<00:14, 3127.34it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1931840/1975667 [10:11<00:14, 3037.19it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1932198/1975667 [10:11<00:13, 3179.66it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1932522/1975667 [10:12<00:13, 3111.93it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1932867/1975667 [10:12<00:13, 3203.81it/s]
 98%|████████████████████████████████████████████████████████████████████▍ | 1933192/1975667 [10:12<00:13, 3153.98it/s]
 98%|███████████████████████████████████

 99%|█████████████████████████████████████████████████████████████████████▏| 1952092/1975667 [10:18<00:08, 2754.60it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1952370/1975667 [10:18<00:09, 2575.40it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1952632/1975667 [10:18<00:09, 2541.30it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1952890/1975667 [10:19<00:09, 2452.31it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1953138/1975667 [10:19<00:10, 2162.02it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1953363/1975667 [10:19<00:10, 2123.92it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1953605/1975667 [10:19<00:10, 2203.24it/s]
 99%|█████████████████████████████████████████████████████████████████████▏| 1953861/1975667 [10:19<00:09, 2297.59it/s]
 99%|███████████████████████████████████

100%|█████████████████████████████████████████████████████████████████████▉| 1973340/1975667 [10:26<00:00, 2731.80it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1973626/1975667 [10:26<00:00, 2640.13it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1973900/1975667 [10:26<00:00, 2598.76it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1974177/1975667 [10:26<00:00, 2645.84it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1974476/1975667 [10:26<00:00, 2738.47it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1974779/1975667 [10:26<00:00, 2817.77it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1975082/1975667 [10:26<00:00, 2876.06it/s]
100%|█████████████████████████████████████████████████████████████████████▉| 1975408/1975667 [10:26<00:00, 2979.22it/s]
100%|███████████████████████████████████

In [7]:
# residual cleaning: remove empty elements from list
corpus = list(filter(None, corpus))
corpus[120000:122000]

[['here', 'the', 'liknk', 'from', 'before'],
 [''],
 ['you',
  'wrote',
  'i',
  'myself',
  'am',
  'christian',
  'but',
  'i',
  'will',
  'not',
  'allow',
  'myself',
  'the',
  'shortcut',
  'of',
  'rationalising',
  'that',
  'rape',
  'turned',
  'an',
  'otherwise',
  'straight',
  'lonnie',
  'frisbee',
  'into',
  'a',
  '',
  '',
  'gay',
  'sinner',
  '',
  ''],
 ['well',
  '',
  'i',
  'myself',
  'am',
  'christian',
  'but',
  'i',
  'will',
  'not',
  'allow',
  'myself',
  'lying',
  'gay',
  'acitivists',
  'to',
  'pretend',
  'that',
  'rape',
  'doe',
  "not'turned",
  'an',
  'otherwise',
  'straight',
  'lonnie',
  'frisbee',
  'into',
  'a',
  '',
  '',
  'gay',
  'sinner',
  '',
  ''],
 ['i',
  'think',
  'the',
  'only',
  'reason',
  'why',
  'you',
  'lying',
  'gay',
  'activist',
  'wo',
  "n't",
  'acknowledge',
  'this',
  'phenomenon',
  'is',
  'at',
  'it',
  's',
  'very',
  'best',
  'it',
  'cut',
  'into',
  'your',
  'argument',
  'that',
  'pe

### Train and store Word2Vec models

In [8]:
# 5 epochs
model = Word2Vec(corpus, min_count=5, size=100, workers=4, iter=5)
model.save('./models/5_epoch_word2vec_model')
print('5 epoch model trained and saved.')

# 15 epochs
model = Word2Vec(corpus, min_count=5, size=100, workers=4, iter=15)
model.save('./models/15_epoch_word2vec_model')
print('15 epoch model trained and saved.')

# 50 epochs
model = Word2Vec(corpus, min_count=5, size=100, workers=4, iter=50)
model.save('./models/50_epoch_word2vec_model')
print('50 epoch model trained and saved.')

2018-02-05 13:28:28,251 : INFO : collecting all words and their counts
2018-02-05 13:28:28,253 : INFO : PROGRESS: at sentence #0, processed 0 words, keeping 0 word types
2018-02-05 13:28:28,312 : INFO : PROGRESS: at sentence #10000, processed 137791 words, keeping 13073 word types
2018-02-05 13:28:28,363 : INFO : PROGRESS: at sentence #20000, processed 274707 words, keeping 19530 word types
2018-02-05 13:28:28,407 : INFO : PROGRESS: at sentence #30000, processed 404356 words, keeping 24367 word types
2018-02-05 13:28:28,456 : INFO : PROGRESS: at sentence #40000, processed 540595 words, keeping 29137 word types
2018-02-05 13:28:28,506 : INFO : PROGRESS: at sentence #50000, processed 674837 words, keeping 33406 word types
2018-02-05 13:28:28,553 : INFO : PROGRESS: at sentence #60000, processed 811450 words, keeping 37494 word types
2018-02-05 13:28:28,605 : INFO : PROGRESS: at sentence #70000, processed 943368 words, keeping 40965 word types
2018-02-05 13:28:28,658 : INFO : PROGRESS: at 

2018-02-05 13:28:32,008 : INFO : PROGRESS: at sentence #710000, processed 9582530 words, keeping 178767 word types
2018-02-05 13:28:32,073 : INFO : PROGRESS: at sentence #720000, processed 9720191 words, keeping 180568 word types
2018-02-05 13:28:32,124 : INFO : PROGRESS: at sentence #730000, processed 9852341 words, keeping 182234 word types
2018-02-05 13:28:32,171 : INFO : PROGRESS: at sentence #740000, processed 9988181 words, keeping 183921 word types
2018-02-05 13:28:32,215 : INFO : PROGRESS: at sentence #750000, processed 10121033 words, keeping 185446 word types
2018-02-05 13:28:32,263 : INFO : PROGRESS: at sentence #760000, processed 10255373 words, keeping 187046 word types
2018-02-05 13:28:32,311 : INFO : PROGRESS: at sentence #770000, processed 10392135 words, keeping 188796 word types
2018-02-05 13:28:32,368 : INFO : PROGRESS: at sentence #780000, processed 10530343 words, keeping 190403 word types
2018-02-05 13:28:32,421 : INFO : PROGRESS: at sentence #790000, processed 10

2018-02-05 13:28:35,615 : INFO : PROGRESS: at sentence #1410000, processed 18932348 words, keeping 345810 word types
2018-02-05 13:28:35,665 : INFO : PROGRESS: at sentence #1420000, processed 19066823 words, keeping 348269 word types
2018-02-05 13:28:35,734 : INFO : PROGRESS: at sentence #1430000, processed 19201567 words, keeping 350080 word types
2018-02-05 13:28:35,779 : INFO : PROGRESS: at sentence #1440000, processed 19330248 words, keeping 352105 word types
2018-02-05 13:28:35,825 : INFO : PROGRESS: at sentence #1450000, processed 19468809 words, keeping 354296 word types
2018-02-05 13:28:35,871 : INFO : PROGRESS: at sentence #1460000, processed 19602146 words, keeping 356065 word types
2018-02-05 13:28:35,919 : INFO : PROGRESS: at sentence #1470000, processed 19730119 words, keeping 358035 word types
2018-02-05 13:28:35,966 : INFO : PROGRESS: at sentence #1480000, processed 19862711 words, keeping 360149 word types
2018-02-05 13:28:36,013 : INFO : PROGRESS: at sentence #1490000,

2018-02-05 13:29:23,653 : INFO : EPOCH 2 - PROGRESS: at 86.43% examples, 605906 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:29:24,657 : INFO : EPOCH 2 - PROGRESS: at 89.86% examples, 601168 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:29:25,660 : INFO : EPOCH 2 - PROGRESS: at 93.10% examples, 595853 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:29:26,677 : INFO : EPOCH 2 - PROGRESS: at 96.72% examples, 592692 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:29:27,641 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:29:27,646 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:29:27,652 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:29:27,669 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:29:27,674 : INFO : EPOCH - 2 : training on 20928959 raw words (14909375 effective words) took 25.3s, 588769 effective words/s
2018-02-05 13:29:28,731 : INFO : EPOCH 3 - P

2018-02-05 13:30:25,906 : INFO : EPOCH 5 - PROGRESS: at 56.38% examples, 702340 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:30:26,908 : INFO : EPOCH 5 - PROGRESS: at 61.13% examples, 702514 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:30:27,927 : INFO : EPOCH 5 - PROGRESS: at 66.08% examples, 702470 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:30:28,930 : INFO : EPOCH 5 - PROGRESS: at 71.13% examples, 705391 words/s, in_qsize 8, out_qsize 1
2018-02-05 13:30:29,932 : INFO : EPOCH 5 - PROGRESS: at 76.00% examples, 706218 words/s, in_qsize 8, out_qsize 1
2018-02-05 13:30:30,945 : INFO : EPOCH 5 - PROGRESS: at 81.21% examples, 708957 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:30:31,959 : INFO : EPOCH 5 - PROGRESS: at 86.24% examples, 709863 words/s, in_qsize 5, out_qsize 2
2018-02-05 13:30:32,966 : INFO : EPOCH 5 - PROGRESS: at 91.17% examples, 710570 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:30:33,967 : INFO : EPOCH 5 - PROGRESS: at 96.12% examples, 711012 words/s, in_qsiz

5 epoch model trained and saved.


2018-02-05 13:30:35,826 : INFO : collecting all words and their counts
2018-02-05 13:30:35,829 : INFO : PROGRESS: at sentence #0, processed 0 words, keeping 0 word types
2018-02-05 13:30:35,883 : INFO : PROGRESS: at sentence #10000, processed 137791 words, keeping 13073 word types
2018-02-05 13:30:35,929 : INFO : PROGRESS: at sentence #20000, processed 274707 words, keeping 19530 word types
2018-02-05 13:30:35,972 : INFO : PROGRESS: at sentence #30000, processed 404356 words, keeping 24367 word types
2018-02-05 13:30:36,017 : INFO : PROGRESS: at sentence #40000, processed 540595 words, keeping 29137 word types
2018-02-05 13:30:36,062 : INFO : PROGRESS: at sentence #50000, processed 674837 words, keeping 33406 word types
2018-02-05 13:30:36,112 : INFO : PROGRESS: at sentence #60000, processed 811450 words, keeping 37494 word types
2018-02-05 13:30:36,156 : INFO : PROGRESS: at sentence #70000, processed 943368 words, keeping 40965 word types
2018-02-05 13:30:36,205 : INFO : PROGRESS: at 

2018-02-05 13:30:39,337 : INFO : PROGRESS: at sentence #710000, processed 9582530 words, keeping 178767 word types
2018-02-05 13:30:39,386 : INFO : PROGRESS: at sentence #720000, processed 9720191 words, keeping 180568 word types
2018-02-05 13:30:39,429 : INFO : PROGRESS: at sentence #730000, processed 9852341 words, keeping 182234 word types
2018-02-05 13:30:39,477 : INFO : PROGRESS: at sentence #740000, processed 9988181 words, keeping 183921 word types
2018-02-05 13:30:39,523 : INFO : PROGRESS: at sentence #750000, processed 10121033 words, keeping 185446 word types
2018-02-05 13:30:39,568 : INFO : PROGRESS: at sentence #760000, processed 10255373 words, keeping 187046 word types
2018-02-05 13:30:39,617 : INFO : PROGRESS: at sentence #770000, processed 10392135 words, keeping 188796 word types
2018-02-05 13:30:39,664 : INFO : PROGRESS: at sentence #780000, processed 10530343 words, keeping 190403 word types
2018-02-05 13:30:39,721 : INFO : PROGRESS: at sentence #790000, processed 10

2018-02-05 13:30:42,961 : INFO : PROGRESS: at sentence #1410000, processed 18932348 words, keeping 345810 word types
2018-02-05 13:30:43,014 : INFO : PROGRESS: at sentence #1420000, processed 19066823 words, keeping 348269 word types
2018-02-05 13:30:43,093 : INFO : PROGRESS: at sentence #1430000, processed 19201567 words, keeping 350080 word types
2018-02-05 13:30:43,142 : INFO : PROGRESS: at sentence #1440000, processed 19330248 words, keeping 352105 word types
2018-02-05 13:30:43,190 : INFO : PROGRESS: at sentence #1450000, processed 19468809 words, keeping 354296 word types
2018-02-05 13:30:43,240 : INFO : PROGRESS: at sentence #1460000, processed 19602146 words, keeping 356065 word types
2018-02-05 13:30:43,289 : INFO : PROGRESS: at sentence #1470000, processed 19730119 words, keeping 358035 word types
2018-02-05 13:30:43,338 : INFO : PROGRESS: at sentence #1480000, processed 19862711 words, keeping 360149 word types
2018-02-05 13:30:43,389 : INFO : PROGRESS: at sentence #1490000,

2018-02-05 13:31:27,567 : INFO : EPOCH - 2 : training on 20928959 raw words (14908470 effective words) took 20.0s, 746011 effective words/s
2018-02-05 13:31:28,588 : INFO : EPOCH 3 - PROGRESS: at 5.06% examples, 762775 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:31:29,590 : INFO : EPOCH 3 - PROGRESS: at 9.80% examples, 731220 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:31:30,593 : INFO : EPOCH 3 - PROGRESS: at 13.76% examples, 689762 words/s, in_qsize 8, out_qsize 1
2018-02-05 13:31:31,601 : INFO : EPOCH 3 - PROGRESS: at 18.37% examples, 687377 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:31:32,614 : INFO : EPOCH 3 - PROGRESS: at 22.70% examples, 677204 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:31:33,626 : INFO : EPOCH 3 - PROGRESS: at 27.28% examples, 678717 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:31:34,628 : INFO : EPOCH 3 - PROGRESS: at 31.54% examples, 673560 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:31:35,630 : INFO : EPOCH 3 - PROGRESS: at 35.53% examples

2018-02-05 13:32:31,649 : INFO : EPOCH 5 - PROGRESS: at 99.02% examples, 690962 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:32:31,822 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:32:31,833 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:32:31,846 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:32:31,860 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:32:31,863 : INFO : EPOCH - 5 : training on 20928959 raw words (14910979 effective words) took 21.6s, 691093 effective words/s
2018-02-05 13:32:32,895 : INFO : EPOCH 6 - PROGRESS: at 4.36% examples, 656017 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:32:33,895 : INFO : EPOCH 6 - PROGRESS: at 7.60% examples, 567854 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:32:34,898 : INFO : EPOCH 6 - PROGRESS: at 11.77% examples, 590432 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:32:35,905 : INFO : EPOCH 6 - PRO

2018-02-05 13:33:32,099 : INFO : EPOCH 8 - PROGRESS: at 79.58% examples, 740064 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:33:33,114 : INFO : EPOCH 8 - PROGRESS: at 84.63% examples, 739929 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:33:34,115 : INFO : EPOCH 8 - PROGRESS: at 89.91% examples, 741197 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:33:35,132 : INFO : EPOCH 8 - PROGRESS: at 94.85% examples, 739860 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:33:36,133 : INFO : EPOCH 8 - PROGRESS: at 99.75% examples, 738929 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:33:36,165 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:33:36,173 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:33:36,182 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:33:36,193 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:33:36,195 : INFO : EPOCH - 8 : training on 20928959 raw w

2018-02-05 13:34:31,214 : INFO : EPOCH 11 - PROGRESS: at 69.27% examples, 735891 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:34:32,227 : INFO : EPOCH 11 - PROGRESS: at 73.85% examples, 731376 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:34:33,240 : INFO : EPOCH 11 - PROGRESS: at 78.64% examples, 729132 words/s, in_qsize 8, out_qsize 1
2018-02-05 13:34:34,241 : INFO : EPOCH 11 - PROGRESS: at 83.49% examples, 728617 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:34:35,246 : INFO : EPOCH 11 - PROGRESS: at 88.48% examples, 728522 words/s, in_qsize 8, out_qsize 1
2018-02-05 13:34:36,278 : INFO : EPOCH 11 - PROGRESS: at 93.43% examples, 727196 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:34:37,295 : INFO : EPOCH 11 - PROGRESS: at 98.27% examples, 725644 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:34:37,723 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:34:37,731 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:34:37,

2018-02-05 13:35:31,575 : INFO : EPOCH 14 - PROGRESS: at 49.17% examples, 732947 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:35:32,575 : INFO : EPOCH 14 - PROGRESS: at 53.77% examples, 729983 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:33,599 : INFO : EPOCH 14 - PROGRESS: at 57.99% examples, 719646 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:34,604 : INFO : EPOCH 14 - PROGRESS: at 62.89% examples, 720072 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:35,607 : INFO : EPOCH 14 - PROGRESS: at 67.92% examples, 720052 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:36,632 : INFO : EPOCH 14 - PROGRESS: at 72.46% examples, 716080 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:37,638 : INFO : EPOCH 14 - PROGRESS: at 77.07% examples, 713384 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:38,645 : INFO : EPOCH 14 - PROGRESS: at 82.08% examples, 714299 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:35:39,648 : INFO : EPOCH 14 - PROGRESS: at 87.38% examples, 717748 words/s

15 epoch model trained and saved.


2018-02-05 13:36:04,027 : INFO : collecting all words and their counts
2018-02-05 13:36:04,031 : INFO : PROGRESS: at sentence #0, processed 0 words, keeping 0 word types
2018-02-05 13:36:04,084 : INFO : PROGRESS: at sentence #10000, processed 137791 words, keeping 13073 word types
2018-02-05 13:36:04,127 : INFO : PROGRESS: at sentence #20000, processed 274707 words, keeping 19530 word types
2018-02-05 13:36:04,175 : INFO : PROGRESS: at sentence #30000, processed 404356 words, keeping 24367 word types
2018-02-05 13:36:04,220 : INFO : PROGRESS: at sentence #40000, processed 540595 words, keeping 29137 word types
2018-02-05 13:36:04,266 : INFO : PROGRESS: at sentence #50000, processed 674837 words, keeping 33406 word types
2018-02-05 13:36:04,315 : INFO : PROGRESS: at sentence #60000, processed 811450 words, keeping 37494 word types
2018-02-05 13:36:04,361 : INFO : PROGRESS: at sentence #70000, processed 943368 words, keeping 40965 word types
2018-02-05 13:36:04,411 : INFO : PROGRESS: at 

2018-02-05 13:36:07,919 : INFO : PROGRESS: at sentence #710000, processed 9582530 words, keeping 178767 word types
2018-02-05 13:36:07,985 : INFO : PROGRESS: at sentence #720000, processed 9720191 words, keeping 180568 word types
2018-02-05 13:36:08,043 : INFO : PROGRESS: at sentence #730000, processed 9852341 words, keeping 182234 word types
2018-02-05 13:36:08,104 : INFO : PROGRESS: at sentence #740000, processed 9988181 words, keeping 183921 word types
2018-02-05 13:36:08,180 : INFO : PROGRESS: at sentence #750000, processed 10121033 words, keeping 185446 word types
2018-02-05 13:36:08,247 : INFO : PROGRESS: at sentence #760000, processed 10255373 words, keeping 187046 word types
2018-02-05 13:36:08,307 : INFO : PROGRESS: at sentence #770000, processed 10392135 words, keeping 188796 word types
2018-02-05 13:36:08,357 : INFO : PROGRESS: at sentence #780000, processed 10530343 words, keeping 190403 word types
2018-02-05 13:36:08,405 : INFO : PROGRESS: at sentence #790000, processed 10

2018-02-05 13:36:11,900 : INFO : PROGRESS: at sentence #1410000, processed 18932348 words, keeping 345810 word types
2018-02-05 13:36:11,948 : INFO : PROGRESS: at sentence #1420000, processed 19066823 words, keeping 348269 word types
2018-02-05 13:36:12,025 : INFO : PROGRESS: at sentence #1430000, processed 19201567 words, keeping 350080 word types
2018-02-05 13:36:12,081 : INFO : PROGRESS: at sentence #1440000, processed 19330248 words, keeping 352105 word types
2018-02-05 13:36:12,136 : INFO : PROGRESS: at sentence #1450000, processed 19468809 words, keeping 354296 word types
2018-02-05 13:36:12,193 : INFO : PROGRESS: at sentence #1460000, processed 19602146 words, keeping 356065 word types
2018-02-05 13:36:12,244 : INFO : PROGRESS: at sentence #1470000, processed 19730119 words, keeping 358035 word types
2018-02-05 13:36:12,298 : INFO : PROGRESS: at sentence #1480000, processed 19862711 words, keeping 360149 word types
2018-02-05 13:36:12,353 : INFO : PROGRESS: at sentence #1490000,

2018-02-05 13:36:59,880 : INFO : EPOCH 2 - PROGRESS: at 97.20% examples, 684975 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:37:00,468 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:37:00,470 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:37:00,495 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:37:00,505 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:37:00,511 : INFO : EPOCH - 2 : training on 20928959 raw words (14908690 effective words) took 21.8s, 684426 effective words/s
2018-02-05 13:37:01,546 : INFO : EPOCH 3 - PROGRESS: at 4.79% examples, 715617 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:37:02,559 : INFO : EPOCH 3 - PROGRESS: at 9.04% examples, 668363 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:37:03,567 : INFO : EPOCH 3 - PROGRESS: at 13.31% examples, 663540 words/s, in_qsize 5, out_qsize 2
2018-02-05 13:37:04,573 : INFO : EPOCH 3 - PRO

2018-02-05 13:38:01,263 : INFO : EPOCH 5 - PROGRESS: at 94.52% examples, 734551 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:38:02,270 : INFO : EPOCH 5 - PROGRESS: at 99.45% examples, 733989 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:38:02,367 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:38:02,369 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:38:02,381 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:38:02,406 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:38:02,407 : INFO : EPOCH - 5 : training on 20928959 raw words (14909992 effective words) took 20.3s, 733326 effective words/s
2018-02-05 13:38:03,438 : INFO : EPOCH 6 - PROGRESS: at 4.97% examples, 740602 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:38:04,448 : INFO : EPOCH 6 - PROGRESS: at 10.13% examples, 749249 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:38:05,468 : INFO : EPOCH 6 - PR

2018-02-05 13:39:02,096 : INFO : EPOCH 8 - PROGRESS: at 94.23% examples, 734842 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:39:03,100 : INFO : EPOCH 8 - PROGRESS: at 99.21% examples, 734722 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:39:03,233 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:39:03,236 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:39:03,256 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:39:03,266 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:39:03,269 : INFO : EPOCH - 8 : training on 20928959 raw words (14910128 effective words) took 20.3s, 734662 effective words/s
2018-02-05 13:39:04,293 : INFO : EPOCH 9 - PROGRESS: at 4.97% examples, 745597 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:39:05,306 : INFO : EPOCH 9 - PROGRESS: at 10.04% examples, 743298 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:39:06,312 : INFO : EPOCH 9 - PR

2018-02-05 13:40:02,115 : INFO : EPOCH 11 - PROGRESS: at 89.91% examples, 740482 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:40:03,119 : INFO : EPOCH 11 - PROGRESS: at 94.85% examples, 739624 words/s, in_qsize 5, out_qsize 2
2018-02-05 13:40:04,112 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:40:04,119 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:40:04,141 : INFO : EPOCH 11 - PROGRESS: at 99.96% examples, 739777 words/s, in_qsize 1, out_qsize 1
2018-02-05 13:40:04,144 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:40:04,148 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:40:04,150 : INFO : EPOCH - 11 : training on 20928959 raw words (14910417 effective words) took 20.2s, 739822 effective words/s
2018-02-05 13:40:05,175 : INFO : EPOCH 12 - PROGRESS: at 5.01% examples, 757384 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:40:06,176 : INFO : EPOCH 1

2018-02-05 13:41:01,758 : INFO : EPOCH 14 - PROGRESS: at 83.31% examples, 725171 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:41:02,774 : INFO : EPOCH 14 - PROGRESS: at 88.39% examples, 725593 words/s, in_qsize 8, out_qsize 2
2018-02-05 13:41:03,774 : INFO : EPOCH 14 - PROGRESS: at 93.00% examples, 723021 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:41:04,789 : INFO : EPOCH 14 - PROGRESS: at 98.01% examples, 723094 words/s, in_qsize 8, out_qsize 1
2018-02-05 13:41:05,161 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:41:05,165 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:41:05,170 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:41:05,176 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:41:05,184 : INFO : EPOCH - 14 : training on 20928959 raw words (14908597 effective words) took 20.6s, 723810 effective words/s
2018-02-05 13:41:06,207 : INFO : EPOCH 

2018-02-05 13:42:01,427 : INFO : EPOCH 17 - PROGRESS: at 79.68% examples, 737539 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:42:02,440 : INFO : EPOCH 17 - PROGRESS: at 84.79% examples, 738052 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:42:03,453 : INFO : EPOCH 17 - PROGRESS: at 89.96% examples, 738171 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:42:04,459 : INFO : EPOCH 17 - PROGRESS: at 95.05% examples, 738484 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:42:05,388 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:42:05,395 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:42:05,407 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:42:05,423 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:42:05,425 : INFO : EPOCH - 17 : training on 20928959 raw words (14910059 effective words) took 20.2s, 739739 effective words/s
2018-02-05 13:42:06,454 : INFO : EPOCH 

2018-02-05 13:43:01,230 : INFO : EPOCH 20 - PROGRESS: at 67.82% examples, 719558 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:43:02,235 : INFO : EPOCH 20 - PROGRESS: at 72.89% examples, 721280 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:43:03,242 : INFO : EPOCH 20 - PROGRESS: at 77.88% examples, 722122 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:43:04,254 : INFO : EPOCH 20 - PROGRESS: at 82.75% examples, 721066 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:43:05,260 : INFO : EPOCH 20 - PROGRESS: at 87.91% examples, 722873 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:43:06,271 : INFO : EPOCH 20 - PROGRESS: at 93.00% examples, 723770 words/s, in_qsize 7, out_qsize 1
2018-02-05 13:43:07,277 : INFO : EPOCH 20 - PROGRESS: at 98.16% examples, 725203 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:43:07,607 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:43:07,613 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:43:07,

2018-02-05 13:44:01,984 : INFO : EPOCH 23 - PROGRESS: at 69.56% examples, 737375 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:44:02,990 : INFO : EPOCH 23 - PROGRESS: at 74.70% examples, 738728 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:44:04,004 : INFO : EPOCH 23 - PROGRESS: at 79.76% examples, 738600 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:44:05,006 : INFO : EPOCH 23 - PROGRESS: at 84.89% examples, 739508 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:44:06,018 : INFO : EPOCH 23 - PROGRESS: at 90.15% examples, 740372 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:44:07,024 : INFO : EPOCH 23 - PROGRESS: at 95.19% examples, 740145 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:44:07,940 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:44:07,946 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:44:07,960 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:44:07,970 : INFO : worker thr

2018-02-05 13:45:02,351 : INFO : EPOCH 26 - PROGRESS: at 70.43% examples, 747463 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:45:03,356 : INFO : EPOCH 26 - PROGRESS: at 75.53% examples, 747735 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:45:04,364 : INFO : EPOCH 26 - PROGRESS: at 80.66% examples, 747391 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:45:05,369 : INFO : EPOCH 26 - PROGRESS: at 85.71% examples, 747332 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:45:06,372 : INFO : EPOCH 26 - PROGRESS: at 90.90% examples, 747748 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:45:07,381 : INFO : EPOCH 26 - PROGRESS: at 96.10% examples, 748148 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:45:08,144 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:45:08,160 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:45:08,167 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:45:08,177 : INFO : worker thr

2018-02-05 13:46:03,040 : INFO : EPOCH 29 - PROGRESS: at 71.13% examples, 757453 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:46:04,049 : INFO : EPOCH 29 - PROGRESS: at 76.59% examples, 759895 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:46:05,059 : INFO : EPOCH 29 - PROGRESS: at 82.32% examples, 764703 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:46:06,060 : INFO : EPOCH 29 - PROGRESS: at 88.07% examples, 768957 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:46:07,063 : INFO : EPOCH 29 - PROGRESS: at 93.47% examples, 770562 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:46:08,094 : INFO : EPOCH 29 - PROGRESS: at 98.26% examples, 765981 words/s, in_qsize 4, out_qsize 0
2018-02-05 13:46:08,466 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:46:08,479 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:46:08,487 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:46:08,499 : INFO : worker thr

2018-02-05 13:47:01,847 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:47:01,868 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:47:01,880 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:47:01,886 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:47:01,888 : INFO : EPOCH - 32 : training on 20928959 raw words (14907065 effective words) took 18.5s, 807928 effective words/s
2018-02-05 13:47:02,896 : INFO : EPOCH 33 - PROGRESS: at 5.73% examples, 859203 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:47:03,914 : INFO : EPOCH 33 - PROGRESS: at 11.54% examples, 862442 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:47:04,931 : INFO : EPOCH 33 - PROGRESS: at 17.41% examples, 863391 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:47:05,933 : INFO : EPOCH 33 - PROGRESS: at 23.47% examples, 872747 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:47:06,933 : INFO : EPOCH 3

2018-02-05 13:47:57,926 : INFO : EPOCH 36 - PROGRESS: at 22.84% examples, 848708 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:47:58,928 : INFO : EPOCH 36 - PROGRESS: at 28.39% examples, 847561 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:47:59,943 : INFO : EPOCH 36 - PROGRESS: at 33.65% examples, 834688 words/s, in_qsize 5, out_qsize 2
2018-02-05 13:48:00,946 : INFO : EPOCH 36 - PROGRESS: at 39.11% examples, 833680 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:48:01,962 : INFO : EPOCH 36 - PROGRESS: at 44.34% examples, 827518 words/s, in_qsize 4, out_qsize 0
2018-02-05 13:48:02,974 : INFO : EPOCH 36 - PROGRESS: at 49.77% examples, 825331 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:48:03,981 : INFO : EPOCH 36 - PROGRESS: at 55.22% examples, 824686 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:48:04,982 : INFO : EPOCH 36 - PROGRESS: at 60.73% examples, 823709 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:48:05,985 : INFO : EPOCH 36 - PROGRESS: at 66.23% examples, 820698 words/s

2018-02-05 13:48:57,542 : INFO : EPOCH 39 - PROGRESS: at 49.91% examples, 828129 words/s, in_qsize 4, out_qsize 0
2018-02-05 13:48:58,548 : INFO : EPOCH 39 - PROGRESS: at 55.32% examples, 826087 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:48:59,550 : INFO : EPOCH 39 - PROGRESS: at 60.83% examples, 825384 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:49:00,576 : INFO : EPOCH 39 - PROGRESS: at 66.68% examples, 825795 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:49:01,577 : INFO : EPOCH 39 - PROGRESS: at 72.18% examples, 824784 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:49:02,575 : INFO : EPOCH 39 - PROGRESS: at 77.94% examples, 826176 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:49:03,599 : INFO : EPOCH 39 - PROGRESS: at 83.58% examples, 825935 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:49:04,614 : INFO : EPOCH 39 - PROGRESS: at 89.04% examples, 823031 words/s, in_qsize 7, out_qsize 1
2018-02-05 13:49:05,616 : INFO : EPOCH 39 - PROGRESS: at 94.61% examples, 822679 words/s

2018-02-05 13:49:57,629 : INFO : EPOCH 42 - PROGRESS: at 76.78% examples, 815083 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:49:58,644 : INFO : EPOCH 42 - PROGRESS: at 82.37% examples, 814660 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:49:59,644 : INFO : EPOCH 42 - PROGRESS: at 87.91% examples, 814490 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:50:00,646 : INFO : EPOCH 42 - PROGRESS: at 93.23% examples, 812511 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:50:01,647 : INFO : EPOCH 42 - PROGRESS: at 98.83% examples, 812859 words/s, in_qsize 8, out_qsize 0
2018-02-05 13:50:01,853 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:50:01,869 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:50:01,879 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:50:01,885 : INFO : worker thread finished; awaiting finish of 0 more threads
2018-02-05 13:50:01,887 : INFO : EPOCH - 42 : training on 20928959

2018-02-05 13:50:57,180 : INFO : EPOCH 45 - PROGRESS: at 70.14% examples, 695178 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:50:58,181 : INFO : EPOCH 45 - PROGRESS: at 75.20% examples, 698360 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:50:59,195 : INFO : EPOCH 45 - PROGRESS: at 80.33% examples, 700686 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:51:00,196 : INFO : EPOCH 45 - PROGRESS: at 85.08% examples, 700987 words/s, in_qsize 5, out_qsize 2
2018-02-05 13:51:01,203 : INFO : EPOCH 45 - PROGRESS: at 90.16% examples, 702557 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:51:02,211 : INFO : EPOCH 45 - PROGRESS: at 95.05% examples, 703117 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:51:03,171 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:51:03,179 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:51:03,191 : INFO : worker thread finished; awaiting finish of 1 more threads
2018-02-05 13:51:03,207 : INFO : worker thr

2018-02-05 13:51:57,426 : INFO : EPOCH 48 - PROGRESS: at 66.53% examples, 760331 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:51:58,428 : INFO : EPOCH 48 - PROGRESS: at 71.77% examples, 761411 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:51:59,433 : INFO : EPOCH 48 - PROGRESS: at 77.03% examples, 762069 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:52:00,435 : INFO : EPOCH 48 - PROGRESS: at 82.37% examples, 763345 words/s, in_qsize 6, out_qsize 1
2018-02-05 13:52:01,438 : INFO : EPOCH 48 - PROGRESS: at 88.07% examples, 767412 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:52:02,448 : INFO : EPOCH 48 - PROGRESS: at 93.62% examples, 769853 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:52:03,453 : INFO : EPOCH 48 - PROGRESS: at 99.35% examples, 773359 words/s, in_qsize 7, out_qsize 0
2018-02-05 13:52:03,545 : INFO : worker thread finished; awaiting finish of 3 more threads
2018-02-05 13:52:03,548 : INFO : worker thread finished; awaiting finish of 2 more threads
2018-02-05 13:52:03,

50 epoch model trained and saved.


In [9]:
# test w2v model
model.wv.most_similar('asshole')

2018-02-05 13:52:44,905 : INFO : precomputing L2-norms of word weight vectors


[('idiot', 0.8594728708267212),
 ('arsehole', 0.7313122749328613),
 ('loser', 0.7033094167709351),
 ('douchebag', 0.7018705606460571),
 ('retard', 0.6967161297798157),
 ('jerk', 0.6913732290267944),
 ('as', 0.6844013929367065),
 ('imbecile', 0.6830329895019531),
 ('moron', 0.6682279109954834),
 ('fucking', 0.6651079654693604)]