In [29]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import re
import math
from collections import Counter
from tqdm import tqdm as tqdm_notebook
from nltk.corpus import stopwords
from nltk.stem import PorterStemmer 
from nltk.tokenize import word_tokenize
from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
import nltk
nltk.download('opinion_lexicon')
from nltk.corpus import opinion_lexicon
#from sklearn import datasets

[nltk_data] Downloading package opinion_lexicon to
[nltk_data]     C:\Users\Shawn\AppData\Roaming\nltk_data...
[nltk_data]   Package opinion_lexicon is already up-to-date!


In [2]:
D_intent = pd.read_json('MSDialog-Intent.json')

In [3]:
dialogs = []
labels = []
actors = []
for d in D_intent.loc['utterances']:
    dialogs.append([])
    labels.append([])
    actors.append([])
    for utter in d:
        dialogs[-1].append(utter['utterance'])
        labels[-1].append(utter['tags'])
        actors[-1].append(utter['actor_type'])

In [4]:
from sklearn.model_selection import train_test_split
dia_train, dia_val, labs_train, labs_val = train_test_split(dialogs, labels, test_size=0.1)
dia_train, dia_test, labs_train, labs_test = train_test_split(dia_train, labs_train, test_size=0.11)

In [7]:
def split(dia, labs):
    utter = []
    lab = []
    for i in range(len(dia)):
        utter += dia[i]
        lab += labs[i]
    return utter, lab

In [8]:
utter, lab = split(dialogs, labels)
utter_train, lab_train = split(dia_train, labs_train)
utter_val, lab_val = split(dia_val, labs_val)
utter_test, lab_test = split(dia_test, labs_test)

In [128]:
utter_without_sw = []
for u in tqdm(utter):
    text_tokens = word_tokenize(u)
    text_without_sw = ' '.join([word for word in text_tokens if not word in stopwords.words()])
    utter_without_sw.append(text_without_sw)

100%|██████████| 10020/10020 [49:03<00:00,  4.21it/s] 


In [9]:
utter_without_sw = pd.read_csv(r'utter_without_sw.csv')
utter_without_sw = utter_without_sw.fillna('')
utter_without_sw = utter_without_sw.squeeze().values.tolist()

In [10]:
df_utter_without_sw = pd.DataFrame(utter_without_sw)
df_utter_without_sw.to_csv(r'utter_without_sw.csv', index=False)

In [11]:
utter_without_sw_stem = []
ps = PorterStemmer() 
for u in tqdm(utter_without_sw):
    text_tokens = word_tokenize(u)
    text_without_sw_stem = ' '.join([ps.stem(w) for w in text_tokens])
    utter_without_sw_stem.append(text_without_sw_stem)

100%|███████████████████████████████████████████████████████████████████████████| 10020/10020 [00:16<00:00, 599.97it/s]


In [12]:
is_user = []
for a in actors:
    is_user += a
for i, u in enumerate(is_user):
    if u == 'User':
        is_user[i] = True
    else:
        is_user[i] = False

In [None]:
###

In [14]:
print('train size:', len(utter_train))
print('val size:', len(utter_val))
print('test size:', len(utter_test))

train size: 8097
val size: 962
test size: 961


In [13]:
for i in range(len(lab)):
    ls = lab[i].split()
    if 'GG' in ls and len(ls)>1:
        ls.remove('GG')
        lab[i] = ' '.join(ls)
    if 'JK' in ls and len(ls)>1:
        ls.remove('JK')
        lab[i] = ' '.join(ls)
    if 'O' in ls and len(ls)>1:
        ls.remove('O')
        lab[i] = ' '.join(ls)
    lab[i] = lab[i].strip()

In [15]:
import collections
lab_freq = dict(collections.Counter(lab))

In [16]:
sorted(lab_freq.items(), key = lambda kv:(kv[1], kv[0]), reverse=True)[:32]

[('PA', 2481),
 ('OQ', 1866),
 ('PF', 559),
 ('PA FD', 523),
 ('FD', 500),
 ('GG', 346),
 ('IR PA', 227),
 ('FD NF', 198),
 ('FD OQ', 169),
 ('IR', 165),
 ('RQ', 153),
 ('PA IR', 144),
 ('PF FD', 140),
 ('NF', 140),
 ('FQ FD', 137),
 ('CQ FD', 116),
 ('FQ', 101),
 ('PA PF', 98),
 ('FD RQ', 87),
 ('CQ IR', 81),
 ('JK', 75),
 ('FQ RQ', 71),
 ('FD PF', 67),
 ('CQ PA', 62),
 ('FQ IR', 58),
 ('FQ CQ', 55),
 ('IR FD', 54),
 ('CQ IR PA', 51),
 ('RQ OQ', 49),
 ('IR OQ', 48),
 ('NF OQ', 47),
 ('FQ FD NF', 44)]

In [17]:
label_list = ['O', 'CQ']
for l in sorted(lab_freq.items(), key = lambda kv:(kv[1], kv[0]), reverse=True)[:31]:
    label_list.append(l[0])

In [18]:
def preprocess(lab):
    new_lab = np.zeros([len(lab), len(label_list)])
    for i, l in enumerate(lab):
        for j, l_ in enumerate(label_list):
            if l_ in l:
                new_lab[i,j] = 1
    return new_lab

In [19]:
lab = preprocess(lab)#labels of all data
lab_train = preprocess(lab_train)#labels of train data
lab_val = preprocess(lab_val)#labels of val data
lab_test = preprocess(lab_test)#labels of test data

In [14]:
utter_train[0]

'how to get print bigger'

In [15]:
dia_train[0]

['how to get print bigger',
 'Hi Michael Take a look at this. https://support.microsoft.com/en-us/kb/192391 After increasing font size press ctrl+P to print.',
 'Hi   Assuming that you are using Internet Explorer and are referring to "print" on the screen (rather than on paper) then these keyboard shortcuts will adjust the zoom for the whole page:  CTRL + +        Zoom In  CTRL + -         Zoom Out  CTRL + 0        Set Zoom to 100%.  If you are using Internet Explorer you may click Page (on Command Bar) then Text size then select the text size you prefer.  The zoom controls above work with many other web browsers too.']

In [20]:
lab_train[0]

array([1., 0., 0., 1., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.,
       0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [21]:
label_list

['O',
 'CQ',
 'PA',
 'OQ',
 'PF',
 'PA FD',
 'FD',
 'GG',
 'IR PA',
 'FD NF',
 'FD OQ',
 'IR',
 'RQ',
 'PA IR',
 'PF FD',
 'NF',
 'FQ FD',
 'CQ FD',
 'FQ',
 'PA PF',
 'FD RQ',
 'CQ IR',
 'JK',
 'FQ RQ',
 'FD PF',
 'CQ PA',
 'FQ IR',
 'FQ CQ',
 'IR FD',
 'CQ IR PA',
 'RQ OQ',
 'IR OQ',
 'NF OQ']

In [20]:
def text_to_vector(text):
    word = re.compile(r'\w+')
    words = word.findall(text)
    return Counter(words)

In [21]:
def get_cosine(vec1, vec2):
    intersection = set(vec1.keys()) & set(vec2.keys())
    numerator = sum([vec1[x] * vec2[x] for x in intersection])

    sum1 = sum([vec1[x]**2 for x in vec1.keys()])
    sum2 = sum([vec2[x]**2 for x in vec2.keys()])
    denominator = math.sqrt(sum1) * math.sqrt(sum2)

    if not denominator:
        return 0.0
    else:
        return float(numerator) / denominator

In [37]:
rand_index = np.arange(len(dialogs))
np.random.shuffle(rand_index)

In [106]:
n = len(rand_index)
dia_train = np.array(dialogs)[rand_index[:int(0.8*n)]]
labs_train = np.array(labels)[rand_index[:int(0.8*n)]]
actors_train = np.array(actors)[rand_index[:int(0.8*n)]]
utter_train, lab_train = split(dia_train, labs_train)

dia_valid = np.array(dialogs)[rand_index[int(0.8*n):int(0.9*n)]]
labs_valid = np.array(labels)[rand_index[int(0.8*n):int(0.9*n)]]
actors_valid = np.array(actors)[rand_index[int(0.8*n):int(0.9*n)]]
utter_valid, lab_valid = split(dia_valid, labs_valid)

dia_test = np.array(dialogs)[rand_index[int(0.9*n):]]
labs_test = np.array(labels)[rand_index[int(0.9*n):]]
actors_test = np.array(actors)[rand_index[int(0.9*n):]]
utter_test, lab_test = split(dia_test, labs_test)

# Feaure function

In [22]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import re
import math
from collections import Counter
from tqdm import tqdm as tqdm
from nltk.corpus import stopwords
from nltk.stem import PorterStemmer 
from nltk.tokenize import word_tokenize
from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
import nltk
nltk.download('opinion_lexicon')
from nltk.corpus import opinion_lexicon
#from sklearn import datasets

[nltk_data] Downloading package opinion_lexicon to
[nltk_data]     C:\Users\Shawn\AppData\Roaming\nltk_data...
[nltk_data]   Package opinion_lexicon is already up-to-date!


In [89]:
def get_features(utter, dialogs, actors):
    df_utter_without_sw = pd.read_csv('utter_without_sw.csv')
    utter_without_sw = df_utter_without_sw['0'].tolist()
    utter_without_sw_stem = remove_stem(utter)
    
    # Initial Utterance Similarity
    InitSim = []
    for i, dialog in enumerate(dialogs):
        vec1 = text_to_vector(dialog[0])
        for u in dialog:
            vec2 = text_to_vector(u)
            InitSim.append(get_cosine(vec1, vec2))
    
    print('init sim')
    
    # Dialog Similarity
    DlgSim = []
    for i,dialog in enumerate(dialogs):
        vec1 = text_to_vector(''.join(dialog))
        for u in dialog:
            vec2 = text_to_vector(u)
            DlgSim.append(get_cosine(vec1, vec2))
            
    print('dlg sim')
            
    # Question Mark
    QuestMark = []
    for i in range(len(utter)):
        has_question_mark = '?' in utter[i]
        QuestMark.append(has_question_mark)
        
    print('quest mark')
        
    # Duplicate
    Dup = []
    for i in range(len(utter)):
        has_duplicate = 'same' in utter[i].lower() or 'similar' in utter[i].lower()
        Dup.append(has_duplicate)
        
    print('dup')    
    
    # 5W1H
    What = []
    Where = []
    When = []
    Why = []
    Who = []
    How = []
    for i in range(len(utter)):
        What.append('what' in utter[i].lower())
        Where.append('where' in utter[i].lower())
        When.append('when' in utter[i].lower())
        Why.append('why' in utter[i].lower())
        Who.append('who' in utter[i].lower())
        How.append('how' in utter[i].lower())
        
    print('5w1h')
    
    # Absolute Position
    AbsPos = []
    for i, dialog in enumerate(dialogs):
        count = 1
        for u in dialog:
            AbsPos.append(count)
            count += 1
    
    print('abs pos')
    
    # Normalized Position
    NormPos = []
    for i, dialog in enumerate(dialogs):
        count = 1
        for u in dialog:
            NormPos .append(count/len(dialog))
            count += 1
            
    print('norm pos')
    
    # Utterance Length
    Len = []
    for u in utter:
        if not isinstance(u, str):
            Len.append(0)
            continue
        u_without_punctuation = re.sub(r'[^\w\s]','',u)
        Len.append(len(u_without_punctuation))
        
    print('len')
        
    # Utterance Length Unique
    LenUni = []
    for u in utter:
        if not isinstance(u, str):
            LenUni.append(0)
            continue
        u_without_punctuation = re.sub(r'[^\w\s]','',u)
        LenUni.append(len(set(word_tokenize(u_without_punctuation.lower()))))
        
    print('len uni')
        
    # Utterance Length Stemmed Unique
    LenStem = []
    for u in utter_without_sw_stem:
        if not isinstance(u, str):
            LenStem.append(0)
            continue
        u_without_punctuation = re.sub(r'[^\w\s]','',u)
        LenStem.append(len(set(word_tokenize(u_without_punctuation.lower()))))
        
    print('len stem')
        
    # Is Starter
    Starter = is_user(actors)
    
    print('starter')
    
    # Thank
    Thank = []
    for i in range(len(utter)):
        has_thank = 'thank' in utter[i].lower()
        Thank.append(has_thank)
        
    print('thank')
        
    # Exclamation Mark
    ExMark = []
    for i in range(len(utter)):
        has_exclamation_mark = '!' in utter[i]
        ExMark.append(has_exclamation_mark)
        
    print('ex mark')
        
    # Feedback
    Feedback = []
    for i in range(len(utter)):
        has_feedback = 'did not' in utter[i].lower() or 'does not' in utter[i].lower()
        Feedback.append(has_feedback)
        
    print('feedback')
        
    # Sentiment Scores
    SenScr_Neu = []
    SenScr_Neg = []
    SenScr_Pos = []
    analyser = SentimentIntensityAnalyzer()
    for u in tqdm_notebook(utter):
        score = analyser.polarity_scores(u)
        SenScr_Neu.append(score['neu'])
        SenScr_Neg.append(score['neg'])
        SenScr_Pos.append(score['pos'])
        
    print('sen scr')
        
    #Opinion Lexicon
    Lex_Pos = []
    Lex_Neg = []
    for u in tqdm_notebook(utter):
        pos = 0
        neg = 0
        for word in u.split():
            if word.lower() in opinion_lexicon.positive():
                pos += 1
            if word.lower() in opinion_lexicon.negative():
                neg += 1
        Lex_Pos.append(pos)
        Lex_Neg.append(neg)
        
    print('opinion lexicon')
    
        
    data_all = {'utterance': utter, 'InitSim': InitSim, 'DlgSim': DlgSim, 'QuestMark': QuestMark, 
                'Dup': Dup, 'What': What, 'Where': Where, 'When': When, 'Why': Why, 'Who': Who, 'How': How, 
                'AbsPos': AbsPos, 'NormPos': NormPos, 'Len': Len, 'LenUni': LenUni, 'LenStem': LenStem,
                'Starter': Starter, 'Thank': Thank, 'ExMark': ExMark, 'Feedback': Feedback, 'SenScr_Neg': SenScr_Neg, 'SenScr_Neu': SenScr_Neu,
                'SenScr_Pos': SenScr_Pos, 'Lex_Pos': Lex_Pos, 'Lex_Neg': Lex_Neg}
    #df_all = pd.DataFrame(data_all)
    #return data_all
    #df_all.to_csv(r'all_features.csv', index=False)
    #df_all.head()
    return data_all

In [68]:
def remove_sw(utter):
    utter_without_sw = []
    for u in tqdm(utter):
        text_tokens = word_tokenize(u)
        text_without_sw = ' '.join([word for word in text_tokens if not word in stopwords.words()])
        utter_without_sw.append(text_without_sw)
    return utter_without_sw

def remove_stem(utter_without_sw):
    utter_without_sw_stem = []
    ps = PorterStemmer() 
    for i, u in tqdm(enumerate(utter_without_sw)):
        if not isinstance(u, str):
            utter_without_sw_stem.append("")
            continue
        text_tokens = word_tokenize(u)
        text_without_sw_stem = ' '.join([ps.stem(w) for w in text_tokens])
        utter_without_sw_stem.append(text_without_sw_stem)
    return utter_without_sw_stem

def is_user(actors):
    is_user = []
    for a in actors:
        is_user += a
    for i, u in enumerate(is_user):
        if u == 'User':
            is_user[i] = True
        else:
            is_user[i] = False
    return is_user

def text_to_vector(text):
    word = re.compile(r'\w+')
    words = word.findall(text)
    return Counter(words)

def get_cosine(vec1, vec2):
    intersection = set(vec1.keys()) & set(vec2.keys())
    numerator = sum([vec1[x] * vec2[x] for x in intersection])

    sum1 = sum([vec1[x]**2 for x in vec1.keys()])
    sum2 = sum([vec2[x]**2 for x in vec2.keys()])
    denominator = math.sqrt(sum1) * math.sqrt(sum2)

    if not denominator:
        return 0.0
    else:
        return float(numerator) / denominator

In [84]:
get_features(utter, dialogs, actors)












0it [00:00, ?it/s][A[A[A[A[A[A[A[A[A[A[A










55it [00:00, 549.92it/s][A[A[A[A[A[A[A[A[A[A[A










102it [00:00, 518.62it/s][A[A[A[A[A[A[A[A[A[A[A










146it [00:00, 477.24it/s][A[A[A[A[A[A[A[A[A[A[A










209it [00:00, 512.65it/s][A[A[A[A[A[A[A[A[A[A[A










265it [00:00, 523.09it/s][A[A[A[A[A[A[A[A[A[A[A










328it [00:00, 541.89it/s][A[A[A[A[A[A[A[A[A[A[A










403it [00:00, 589.28it/s][A[A[A[A[A[A[A[A[A[A[A










460it [00:00, 573.50it/s][A[A[A[A[A[A[A[A[A[A[A










533it [00:00, 611.06it/s][A[A[A[A[A[A[A[A[A[A[A










594it [00:01, 609.00it/s][A[A[A[A[A[A[A[A[A[A[A










661it [00:01, 623.12it/s][A[A[A[A[A[A[A[A[A[A[A










724it [00:01, 587.76it/s][A[A[A[A[A[A[A[A[A[A[A










791it [00:01, 602.06it/s][A[A[A[A[A[A[A[A[A[A[A










852it [00:01, 590.20it/s][A[A

init sim
dlg sim
quest mark
dup
5w1h
abs pos
norm pos
len
len uni













  0%|          | 0/10020 [00:00<?, ?it/s][A[A[A[A[A[A[A[A[A[A[A










  1%|          | 94/10020 [00:00<00:10, 932.75it/s][A[A[A[A[A[A[A[A[A[A[A

len stem
starter
thank
ex mark
feedback













  2%|▏         | 173/10020 [00:00<00:11, 883.81it/s][A[A[A[A[A[A[A[A[A[A[A










  3%|▎         | 267/10020 [00:00<00:10, 896.88it/s][A[A[A[A[A[A[A[A[A[A[A










  4%|▍         | 410/10020 [00:00<00:09, 1009.01it/s][A[A[A[A[A[A[A[A[A[A[A










  6%|▌         | 571/10020 [00:00<00:08, 1135.80it/s][A[A[A[A[A[A[A[A[A[A[A










  7%|▋         | 703/10020 [00:00<00:07, 1184.52it/s][A[A[A[A[A[A[A[A[A[A[A










  8%|▊         | 843/10020 [00:00<00:07, 1231.76it/s][A[A[A[A[A[A[A[A[A[A[A










 10%|█         | 1011/10020 [00:00<00:06, 1338.89it/s][A[A[A[A[A[A[A[A[A[A[A










 11%|█▏        | 1146/10020 [00:00<00:06, 1324.55it/s][A[A[A[A[A[A[A[A[A[A[A










 13%|█▎        | 1280/10020 [00:01<00:06, 1279.99it/s][A[A[A[A[A[A[A[A[A[A[A










 14%|█▍        | 1421/10020 [00:01<00:06, 1310.81it/s][A[A[A[A[A[A[A[A[A[A[A










 15%|█▌        | 

sen scr













  0%|          | 1/10020 [00:00<1:52:07,  1.49it/s][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 2/10020 [00:01<2:08:57,  1.29it/s][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 3/10020 [00:01<1:37:47,  1.71it/s][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 4/10020 [00:03<2:24:32,  1.15it/s][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 5/10020 [00:08<6:09:20,  2.21s/it][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 6/10020 [00:09<4:40:38,  1.68s/it][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 7/10020 [00:09<3:55:32,  1.41s/it][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 8/10020 [00:10<3:11:54,  1.15s/it][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 9/10020 [00:11<3:06:14,  1.12s/it][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 10/10020 [00:12<2:49:04,  1.01s/it][A[A[A[A[A[A[A[A[A[A[A










  0%|          | 11/10020 [00:12<2:04:

KeyboardInterrupt: 

In [83]:
feature_test = get_features(utter_test, dia_test, actors_test)

975it [00:02, 438.55it/s]


init sim
dlg sim
quest mark
dup
5w1h
abs pos
norm pos
len
len uni
len stem
starter
thank
ex mark
feedback


100%|██████████████████████████████████████████████████████████████████████████████| 975/975 [00:00<00:00, 1166.53it/s]


sen scr


100%|████████████████████████████████████████████████████████████████████████████████| 975/975 [20:27<00:00,  4.23s/it]


opinion lexicon


In [84]:
feature_test.columns

Index(['utterance', 'InitSim', 'DlgSim', 'QuestMark', 'Dup', 'What', 'Where',
       'When', 'Why', 'Who', 'How', 'AbsPos', 'NormPos', 'Len', 'LenUni',
       'LenStem', 'Starter', 'Thank', 'ExMark', 'Feedback', 'SenScr_Neg',
       'SenScr_Neu', 'SenScr_Pos', 'Lex_Pos', 'Lex_Neg'],
      dtype='object')

In [102]:
feature_valid = get_features(utter_valid, dia_valid, actors_valid)
feature_valid = pd.DataFrame(feature_valid)


0it [00:00, ?it/s]
50it [00:00, 491.30it/s]
130it [00:00, 554.78it/s]
201it [00:00, 585.33it/s]
279it [00:00, 631.59it/s]
345it [00:00, 638.49it/s]
424it [00:00, 676.17it/s]
488it [00:00, 653.28it/s]
551it [00:00, 629.94it/s]
624it [00:00, 655.67it/s]
689it [00:01, 637.20it/s]
765it [00:01, 661.47it/s]
853it [00:01, 713.45it/s]
926it [00:01, 655.13it/s]
965it [00:01, 680.59it/s]

init sim
dlg sim
quest mark
dup
5w1h
abs pos
norm pos
len
len uni
len stem
starter
thank
ex mark
feedback



  0%|                                                                                          | 0/965 [00:00<?, ?it/s]
 16%|████████████▎                                                                 | 152/965 [00:00<00:00, 1480.80it/s]
 35%|██████████████████████████▉                                                   | 333/965 [00:00<00:00, 1563.31it/s]
 54%|█████████████████████████████████████████▉                                    | 519/965 [00:00<00:00, 1638.67it/s]
 71%|███████████████████████████████████████████████████████▎                      | 685/965 [00:00<00:00, 1640.81it/s]
 93%|████████████████████████████████████████████████████████████████████████▊     | 901/965 [00:00<00:00, 1748.06it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 965/965 [00:00<00:00, 1688.54it/s]

sen scr



  0%|                                                                                          | 0/965 [00:00<?, ?it/s]
  0%|                                                                                  | 1/965 [00:00<03:50,  4.18it/s]
  0%|▏                                                                                 | 2/965 [00:00<03:58,  4.04it/s]
  0%|▎                                                                                 | 4/965 [00:01<05:03,  3.16it/s]
  1%|▍                                                                                 | 5/965 [00:02<10:13,  1.56it/s]
  1%|▌                                                                                 | 6/965 [00:04<15:28,  1.03it/s]
  1%|▌                                                                                 | 7/965 [00:07<25:50,  1.62s/it]
  1%|▋                                                                                 | 8/965 [00:08<23:08,  1.45s/it]
  1%|▊                                 

  7%|█████▉                                                                           | 70/965 [00:59<06:13,  2.39it/s]
  7%|█████▉                                                                           | 71/965 [00:59<05:41,  2.62it/s]
  7%|██████                                                                           | 72/965 [01:00<05:41,  2.62it/s]
  8%|██████▏                                                                          | 73/965 [01:00<05:07,  2.90it/s]
  8%|██████▏                                                                          | 74/965 [01:00<04:30,  3.29it/s]
  8%|██████▎                                                                          | 75/965 [01:01<03:58,  3.74it/s]
  8%|██████▍                                                                          | 76/965 [01:02<11:23,  1.30it/s]
  8%|██████▍                                                                          | 77/965 [01:03<08:32,  1.73it/s]
  8%|██████▌                            

 15%|███████████▊                                                                    | 142/965 [01:54<12:33,  1.09it/s]
 15%|███████████▊                                                                    | 143/965 [01:54<10:07,  1.35it/s]
 15%|███████████▉                                                                    | 144/965 [01:55<11:22,  1.20it/s]
 15%|████████████                                                                    | 145/965 [01:56<12:47,  1.07it/s]
 15%|████████████                                                                    | 146/965 [01:57<12:48,  1.07it/s]
 15%|████████████▏                                                                   | 147/965 [01:58<11:17,  1.21it/s]
 15%|████████████▎                                                                   | 148/965 [01:58<09:05,  1.50it/s]
 16%|████████████▍                                                                   | 150/965 [01:59<08:02,  1.69it/s]
 16%|████████████▌                      

 22%|█████████████████▋                                                              | 213/965 [03:05<10:51,  1.15it/s]
 22%|█████████████████▋                                                              | 214/965 [03:06<12:53,  1.03s/it]
 22%|█████████████████▊                                                              | 215/965 [03:07<13:58,  1.12s/it]
 22%|█████████████████▉                                                              | 216/965 [03:07<10:33,  1.18it/s]
 22%|█████████████████▉                                                              | 217/965 [03:09<11:37,  1.07it/s]
 23%|██████████████████                                                              | 218/965 [03:09<09:55,  1.25it/s]
 23%|██████████████████▏                                                             | 220/965 [03:10<09:30,  1.31it/s]
 23%|██████████████████▎                                                             | 221/965 [03:12<11:07,  1.12it/s]
 23%|██████████████████▍                

 29%|███████████████████████▌                                                        | 284/965 [04:11<11:46,  1.04s/it]
 30%|███████████████████████▋                                                        | 285/965 [04:12<09:25,  1.20it/s]
 30%|███████████████████████▋                                                        | 286/965 [04:12<07:59,  1.42it/s]
 30%|███████████████████████▊                                                        | 287/965 [04:13<08:03,  1.40it/s]
 30%|███████████████████████▉                                                        | 288/965 [04:14<09:23,  1.20it/s]
 30%|███████████████████████▉                                                        | 289/965 [04:16<15:06,  1.34s/it]
 30%|████████████████████████                                                        | 290/965 [04:17<12:58,  1.15s/it]
 30%|████████████████████████                                                        | 291/965 [04:17<10:11,  1.10it/s]
 30%|████████████████████████▏          

 37%|█████████████████████████████▍                                                  | 355/965 [05:30<10:47,  1.06s/it]
 37%|█████████████████████████████▌                                                  | 356/965 [05:30<08:16,  1.23it/s]
 37%|█████████████████████████████▌                                                  | 357/965 [05:31<07:08,  1.42it/s]
 37%|█████████████████████████████▋                                                  | 358/965 [05:32<07:19,  1.38it/s]
 37%|█████████████████████████████▊                                                  | 359/965 [05:32<06:12,  1.63it/s]
 37%|█████████████████████████████▊                                                  | 360/965 [05:33<06:17,  1.60it/s]
 37%|█████████████████████████████▉                                                  | 361/965 [05:33<06:23,  1.58it/s]
 38%|██████████████████████████████                                                  | 362/965 [05:34<05:37,  1.79it/s]
 38%|██████████████████████████████     

 44%|███████████████████████████████████▎                                            | 426/965 [06:35<15:28,  1.72s/it]
 44%|███████████████████████████████████▍                                            | 427/965 [06:37<15:16,  1.70s/it]
 44%|███████████████████████████████████▍                                            | 428/965 [06:39<15:33,  1.74s/it]
 44%|███████████████████████████████████▌                                            | 429/965 [06:39<12:54,  1.44s/it]
 45%|███████████████████████████████████▋                                            | 431/965 [06:41<10:55,  1.23s/it]
 45%|███████████████████████████████████▊                                            | 432/965 [06:43<13:26,  1.51s/it]
 45%|███████████████████████████████████▉                                            | 433/965 [06:45<14:19,  1.62s/it]
 45%|███████████████████████████████████▉                                            | 434/965 [06:46<13:07,  1.48s/it]
 45%|███████████████████████████████████

 52%|█████████████████████████████████████████▎                                      | 498/965 [07:58<12:02,  1.55s/it]
 52%|█████████████████████████████████████████▎                                      | 499/965 [07:59<10:33,  1.36s/it]
 52%|█████████████████████████████████████████▍                                      | 500/965 [07:59<08:23,  1.08s/it]
 52%|█████████████████████████████████████████▌                                      | 501/965 [08:00<07:18,  1.06it/s]
 52%|█████████████████████████████████████████▌                                      | 502/965 [08:01<08:30,  1.10s/it]
 52%|█████████████████████████████████████████▋                                      | 503/965 [08:02<07:29,  1.03it/s]
 52%|█████████████████████████████████████████▊                                      | 504/965 [08:03<08:39,  1.13s/it]
 52%|█████████████████████████████████████████▊                                      | 505/965 [08:05<09:26,  1.23s/it]
 52%|███████████████████████████████████

 59%|███████████████████████████████████████████████                                 | 568/965 [09:29<27:05,  4.09s/it]
 59%|███████████████████████████████████████████████▏                                | 569/965 [09:30<20:13,  3.07s/it]
 59%|███████████████████████████████████████████████▎                                | 570/965 [09:30<15:03,  2.29s/it]
 59%|███████████████████████████████████████████████▎                                | 571/965 [09:31<11:24,  1.74s/it]
 59%|███████████████████████████████████████████████▍                                | 572/965 [09:31<09:44,  1.49s/it]
 59%|███████████████████████████████████████████████▌                                | 573/965 [09:33<10:17,  1.57s/it]
 59%|███████████████████████████████████████████████▌                                | 574/965 [09:34<08:21,  1.28s/it]
 60%|███████████████████████████████████████████████▋                                | 575/965 [09:34<06:51,  1.06s/it]
 60%|███████████████████████████████████

 66%|████████████████████████████████████████████████████▊                           | 637/965 [10:34<03:28,  1.57it/s]
 66%|████████████████████████████████████████████████████▉                           | 638/965 [10:34<02:54,  1.87it/s]
 66%|████████████████████████████████████████████████████▉                           | 639/965 [10:37<05:28,  1.01s/it]
 66%|█████████████████████████████████████████████████████                           | 640/965 [10:37<04:43,  1.14it/s]
 66%|█████████████████████████████████████████████████████▏                          | 641/965 [10:40<07:38,  1.42s/it]
 67%|█████████████████████████████████████████████████████▏                          | 642/965 [10:42<08:15,  1.53s/it]
 67%|█████████████████████████████████████████████████████▎                          | 643/965 [10:42<06:41,  1.25s/it]
 67%|█████████████████████████████████████████████████████▍                          | 644/965 [10:43<06:05,  1.14s/it]
 67%|███████████████████████████████████

 73%|██████████████████████████████████████████████████████████▌                     | 706/965 [11:37<02:49,  1.52it/s]
 73%|██████████████████████████████████████████████████████████▌                     | 707/965 [11:38<03:05,  1.39it/s]
 73%|██████████████████████████████████████████████████████████▋                     | 708/965 [11:38<02:59,  1.43it/s]
 73%|██████████████████████████████████████████████████████████▊                     | 709/965 [11:39<02:46,  1.54it/s]
 74%|██████████████████████████████████████████████████████████▊                     | 710/965 [11:39<02:17,  1.86it/s]
 74%|██████████████████████████████████████████████████████████▉                     | 711/965 [11:41<03:26,  1.23it/s]
 74%|███████████████████████████████████████████████████████████                     | 712/965 [11:42<03:44,  1.13it/s]
 74%|███████████████████████████████████████████████████████████                     | 713/965 [11:43<04:44,  1.13s/it]
 74%|███████████████████████████████████

 81%|████████████████████████████████████████████████████████████████▍               | 777/965 [12:49<06:12,  1.98s/it]
 81%|████████████████████████████████████████████████████████████████▍               | 778/965 [12:49<04:30,  1.45s/it]
 81%|████████████████████████████████████████████████████████████████▌               | 779/965 [12:50<03:19,  1.07s/it]
 81%|████████████████████████████████████████████████████████████████▋               | 780/965 [12:50<02:29,  1.24it/s]
 81%|████████████████████████████████████████████████████████████████▋               | 781/965 [12:51<03:00,  1.02it/s]
 81%|████████████████████████████████████████████████████████████████▊               | 782/965 [12:52<03:10,  1.04s/it]
 81%|████████████████████████████████████████████████████████████████▉               | 783/965 [12:53<02:36,  1.16it/s]
 81%|████████████████████████████████████████████████████████████████▉               | 784/965 [12:53<02:27,  1.23it/s]
 81%|███████████████████████████████████

 88%|██████████████████████████████████████████████████████████████████████▌         | 851/965 [13:47<01:06,  1.71it/s]
 88%|██████████████████████████████████████████████████████████████████████▋         | 852/965 [13:48<01:17,  1.46it/s]
 88%|██████████████████████████████████████████████████████████████████████▋         | 853/965 [13:48<01:12,  1.55it/s]
 88%|██████████████████████████████████████████████████████████████████████▊         | 854/965 [13:52<02:51,  1.54s/it]
 89%|██████████████████████████████████████████████████████████████████████▉         | 855/965 [13:53<02:36,  1.42s/it]
 89%|██████████████████████████████████████████████████████████████████████▉         | 856/965 [13:53<02:00,  1.11s/it]
 89%|███████████████████████████████████████████████████████████████████████         | 857/965 [13:55<02:07,  1.18s/it]
 89%|███████████████████████████████████████████████████████████████████████▏        | 858/965 [13:55<01:44,  1.02it/s]
 89%|███████████████████████████████████

 96%|████████████████████████████████████████████████████████████████████████████▌   | 923/965 [15:12<00:25,  1.68it/s]
 96%|████████████████████████████████████████████████████████████████████████████▌   | 924/965 [15:13<00:35,  1.17it/s]
 96%|████████████████████████████████████████████████████████████████████████████▋   | 925/965 [15:14<00:31,  1.27it/s]
 96%|████████████████████████████████████████████████████████████████████████████▊   | 926/965 [15:19<01:25,  2.19s/it]
 96%|████████████████████████████████████████████████████████████████████████████▊   | 927/965 [15:20<01:04,  1.71s/it]
 96%|████████████████████████████████████████████████████████████████████████████▉   | 928/965 [15:23<01:17,  2.10s/it]
 96%|█████████████████████████████████████████████████████████████████████████████   | 929/965 [15:23<00:58,  1.64s/it]
 96%|█████████████████████████████████████████████████████████████████████████████   | 930/965 [15:25<00:52,  1.50s/it]
 96%|███████████████████████████████████

opinion lexicon


In [93]:
for k,v in feature_valid.items():
    if len(v) != 962:
        print(k)

InitSim
DlgSim
AbsPos
NormPos
Starter


In [None]:
NormPos = []
for i, dialog in enumerate(dia_valid):
    count = 1
    for u in dialog:
        NormPos .append(count/len(dialog))
        count += 1

In [97]:
len(feature_valid['AbsPos'])

965

In [107]:
feature_train = get_features(utter_train, dia_train, actors_train)


0it [00:00, ?it/s]
71it [00:00, 704.61it/s]
147it [00:00, 699.15it/s]
207it [00:00, 653.62it/s]
283it [00:00, 680.90it/s]
351it [00:00, 679.14it/s]
426it [00:00, 695.64it/s]
495it [00:00, 688.27it/s]
579it [00:00, 724.43it/s]
649it [00:00, 704.62it/s]
718it [00:01, 690.19it/s]
796it [00:01, 713.44it/s]
867it [00:01, 678.31it/s]
936it [00:01, 680.32it/s]
1012it [00:01, 700.99it/s]
1083it [00:01, 678.14it/s]
1156it [00:01, 691.41it/s]
1233it [00:01, 711.78it/s]
1305it [00:01, 669.10it/s]
1393it [00:01, 719.70it/s]
1480it [00:02, 755.53it/s]
1576it [00:02, 803.69it/s]
1664it [00:02, 823.46it/s]
1748it [00:02, 747.36it/s]
1830it [00:02, 766.12it/s]
1909it [00:02, 663.00it/s]
1989it [00:02, 695.74it/s]
2062it [00:02, 691.15it/s]
2137it [00:03, 706.35it/s]
2210it [00:03, 709.69it/s]
2283it [00:03, 679.13it/s]
2352it [00:03, 646.59it/s]
2418it [00:03, 619.90it/s]
2506it [00:03, 679.07it/s]
2579it [00:03, 692.14it/s]
2650it [00:03, 685.86it/s]
2733it [00:03, 718.42it/s]
2807it [00:03, 694.78i

init sim
dlg sim
quest mark
dup
5w1h
abs pos
norm pos
len
len uni
len stem
starter
thank
ex mark
feedback



  0%|                                                                                         | 0/8080 [00:00<?, ?it/s]
  2%|█▍                                                                           | 147/8080 [00:00<00:05, 1416.84it/s]
  4%|██▉                                                                          | 306/8080 [00:00<00:05, 1461.72it/s]
  6%|████▋                                                                        | 496/8080 [00:00<00:04, 1569.15it/s]
  9%|██████▌                                                                      | 694/8080 [00:00<00:04, 1670.22it/s]
 11%|████████▌                                                                    | 902/8080 [00:00<00:04, 1771.82it/s]
 13%|██████████▏                                                                 | 1086/8080 [00:00<00:03, 1788.10it/s]
 16%|████████████▍                                                               | 1319/8080 [00:00<00:03, 1918.76it/s]
 20%|███████████████▎                  

sen scr



  0%|                                                                                         | 0/8080 [00:00<?, ?it/s]
  0%|                                                                               | 1/8080 [00:00<1:18:09,  1.72it/s]
  0%|                                                                               | 2/8080 [00:01<1:31:04,  1.48it/s]
  0%|                                                                               | 3/8080 [00:01<1:23:50,  1.61it/s]
  0%|                                                                               | 4/8080 [00:02<1:09:16,  1.94it/s]
  0%|                                                                               | 5/8080 [00:02<1:09:22,  1.94it/s]
  0%|                                                                               | 6/8080 [00:03<1:00:40,  2.22it/s]
  0%|                                                                                 | 7/8080 [00:03<54:25,  2.47it/s]
  0%|                                  

  1%|▋                                                                             | 71/8080 [00:51<2:27:40,  1.11s/it]
  1%|▋                                                                             | 72/8080 [00:52<2:05:52,  1.06it/s]
  1%|▋                                                                             | 73/8080 [00:53<2:24:40,  1.08s/it]
  1%|▋                                                                             | 74/8080 [00:54<2:17:30,  1.03s/it]
  1%|▋                                                                             | 75/8080 [00:54<1:48:21,  1.23it/s]
  1%|▋                                                                             | 76/8080 [00:55<1:43:46,  1.29it/s]
  1%|▋                                                                             | 77/8080 [00:55<1:25:38,  1.56it/s]
  1%|▊                                                                             | 78/8080 [00:56<1:08:54,  1.94it/s]
  1%|▊                                  

  2%|█▍                                                                           | 145/8080 [01:54<2:18:11,  1.04s/it]
  2%|█▍                                                                           | 146/8080 [01:55<2:15:22,  1.02s/it]
  2%|█▍                                                                           | 147/8080 [02:02<6:11:23,  2.81s/it]
  2%|█▍                                                                           | 148/8080 [02:02<4:49:47,  2.19s/it]
  2%|█▍                                                                           | 149/8080 [02:04<4:12:27,  1.91s/it]
  2%|█▍                                                                           | 150/8080 [02:04<3:24:32,  1.55s/it]
  2%|█▍                                                                           | 151/8080 [02:05<2:37:26,  1.19s/it]
  2%|█▍                                                                           | 152/8080 [02:06<2:24:32,  1.09s/it]
  2%|█▍                                 

  3%|██                                                                           | 216/8080 [03:15<2:17:54,  1.05s/it]
  3%|██                                                                           | 217/8080 [03:15<1:43:51,  1.26it/s]
  3%|██                                                                           | 218/8080 [03:16<1:30:13,  1.45it/s]
  3%|██                                                                           | 219/8080 [03:16<1:26:37,  1.51it/s]
  3%|██                                                                           | 220/8080 [03:17<1:24:21,  1.55it/s]
  3%|██                                                                           | 221/8080 [03:17<1:06:17,  1.98it/s]
  3%|██                                                                           | 222/8080 [03:19<1:43:00,  1.27it/s]
  3%|██▏                                                                          | 223/8080 [03:19<1:44:45,  1.25it/s]
  3%|██▏                                

  4%|██▋                                                                          | 286/8080 [04:22<4:03:26,  1.87s/it]
  4%|██▋                                                                          | 287/8080 [04:24<3:48:12,  1.76s/it]
  4%|██▋                                                                          | 288/8080 [04:25<3:20:52,  1.55s/it]
  4%|██▊                                                                          | 289/8080 [04:25<2:48:16,  1.30s/it]
  4%|██▊                                                                          | 290/8080 [04:28<3:58:43,  1.84s/it]
  4%|██▊                                                                          | 291/8080 [04:30<4:01:25,  1.86s/it]
  4%|██▊                                                                          | 292/8080 [04:32<3:55:36,  1.82s/it]
  4%|██▊                                                                          | 293/8080 [04:33<3:06:12,  1.43s/it]
  4%|██▊                                

  4%|███▍                                                                         | 356/8080 [05:28<3:08:54,  1.47s/it]
  4%|███▍                                                                         | 357/8080 [05:28<2:35:15,  1.21s/it]
  4%|███▍                                                                         | 358/8080 [05:28<1:57:10,  1.10it/s]
  4%|███▍                                                                         | 359/8080 [05:29<1:46:24,  1.21it/s]
  4%|███▍                                                                         | 360/8080 [05:30<1:53:49,  1.13it/s]
  4%|███▍                                                                         | 361/8080 [05:31<2:11:07,  1.02s/it]
  4%|███▍                                                                         | 362/8080 [05:32<2:02:18,  1.05it/s]
  4%|███▍                                                                         | 363/8080 [05:33<1:43:18,  1.24it/s]
  5%|███▍                               

  5%|████                                                                         | 425/8080 [06:25<3:08:52,  1.48s/it]
  5%|████                                                                         | 426/8080 [06:27<3:20:18,  1.57s/it]
  5%|████                                                                         | 427/8080 [06:27<2:34:14,  1.21s/it]
  5%|████                                                                         | 428/8080 [06:28<2:10:12,  1.02s/it]
  5%|████                                                                         | 430/8080 [06:28<1:36:47,  1.32it/s]
  5%|████                                                                         | 431/8080 [06:29<1:29:42,  1.42it/s]
  5%|████                                                                         | 432/8080 [06:30<1:58:30,  1.08it/s]
  5%|████▏                                                                        | 433/8080 [06:31<2:04:46,  1.02it/s]
  5%|████▏                              

  6%|████▋                                                                        | 498/8080 [07:37<1:47:16,  1.18it/s]
  6%|████▊                                                                        | 499/8080 [07:39<2:07:41,  1.01s/it]
  6%|████▊                                                                        | 501/8080 [07:39<1:32:27,  1.37it/s]
  6%|████▊                                                                        | 502/8080 [07:41<2:17:09,  1.09s/it]
  6%|████▊                                                                        | 503/8080 [07:41<1:48:59,  1.16it/s]
  6%|████▊                                                                        | 504/8080 [07:43<2:36:56,  1.24s/it]
  6%|████▊                                                                        | 505/8080 [07:44<2:39:35,  1.26s/it]
  6%|████▊                                                                        | 506/8080 [07:46<2:35:37,  1.23s/it]
  6%|████▊                              

  7%|█████▍                                                                       | 571/8080 [08:37<1:29:10,  1.40it/s]
  7%|█████▍                                                                       | 572/8080 [08:38<1:28:10,  1.42it/s]
  7%|█████▍                                                                       | 573/8080 [08:38<1:18:25,  1.60it/s]
  7%|█████▍                                                                       | 574/8080 [08:39<1:48:16,  1.16it/s]
  7%|█████▍                                                                       | 575/8080 [08:41<2:18:07,  1.10s/it]
  7%|█████▍                                                                       | 576/8080 [08:42<2:05:18,  1.00s/it]
  7%|█████▍                                                                       | 577/8080 [08:43<2:00:58,  1.03it/s]
  7%|█████▌                                                                       | 578/8080 [08:45<2:31:24,  1.21s/it]
  7%|█████▌                             

  8%|██████▏                                                                      | 644/8080 [09:55<1:53:17,  1.09it/s]
  8%|██████▏                                                                      | 645/8080 [09:55<1:35:33,  1.30it/s]
  8%|██████▏                                                                      | 646/8080 [09:56<1:20:03,  1.55it/s]
  8%|██████▏                                                                      | 647/8080 [09:57<1:44:22,  1.19it/s]
  8%|██████▏                                                                      | 648/8080 [09:58<1:45:42,  1.17it/s]
  8%|██████▏                                                                      | 649/8080 [09:58<1:32:01,  1.35it/s]
  8%|██████▏                                                                      | 650/8080 [09:59<1:17:27,  1.60it/s]
  8%|██████▏                                                                      | 651/8080 [09:59<1:00:10,  2.06it/s]
  8%|██████▏                            

  9%|██████▊                                                                      | 715/8080 [11:04<2:08:54,  1.05s/it]
  9%|██████▊                                                                      | 716/8080 [11:05<2:18:12,  1.13s/it]
  9%|██████▊                                                                      | 717/8080 [11:05<1:46:45,  1.15it/s]
  9%|██████▊                                                                      | 718/8080 [11:06<1:49:49,  1.12it/s]
  9%|██████▊                                                                      | 719/8080 [11:07<1:29:52,  1.36it/s]
  9%|██████▊                                                                      | 720/8080 [11:08<1:49:52,  1.12it/s]
  9%|██████▊                                                                      | 721/8080 [11:09<1:53:27,  1.08it/s]
  9%|██████▉                                                                      | 722/8080 [11:11<2:21:40,  1.16s/it]
  9%|██████▉                            

 10%|███████▌                                                                     | 788/8080 [12:08<1:58:55,  1.02it/s]
 10%|███████▌                                                                     | 789/8080 [12:08<1:28:19,  1.38it/s]
 10%|███████▌                                                                     | 790/8080 [12:09<1:29:02,  1.36it/s]
 10%|███████▌                                                                     | 791/8080 [12:11<1:56:28,  1.04it/s]
 10%|███████▌                                                                     | 792/8080 [12:12<2:06:58,  1.05s/it]
 10%|███████▌                                                                     | 793/8080 [12:12<1:40:22,  1.21it/s]
 10%|███████▌                                                                     | 794/8080 [12:13<1:46:23,  1.14it/s]
 10%|███████▌                                                                     | 795/8080 [12:15<2:15:10,  1.11s/it]
 10%|███████▌                           

 11%|████████▏                                                                    | 862/8080 [13:18<3:19:52,  1.66s/it]
 11%|████████▏                                                                    | 863/8080 [13:18<2:29:49,  1.25s/it]
 11%|████████▏                                                                    | 864/8080 [13:19<2:05:56,  1.05s/it]
 11%|████████▏                                                                    | 865/8080 [13:20<2:04:59,  1.04s/it]
 11%|████████▎                                                                    | 866/8080 [13:24<4:23:50,  2.19s/it]
 11%|████████▎                                                                    | 867/8080 [13:26<3:49:40,  1.91s/it]
 11%|████████▎                                                                    | 868/8080 [13:27<3:12:26,  1.60s/it]
 11%|████████▎                                                                    | 869/8080 [13:27<2:43:49,  1.36s/it]
 11%|████████▎                          

 12%|████████▊                                                                    | 931/8080 [14:20<1:13:16,  1.63it/s]
 12%|████████▉                                                                    | 932/8080 [14:22<2:02:07,  1.03s/it]
 12%|████████▉                                                                    | 933/8080 [14:26<3:35:12,  1.81s/it]
 12%|████████▉                                                                    | 934/8080 [14:26<2:38:38,  1.33s/it]
 12%|████████▉                                                                    | 935/8080 [14:27<2:28:23,  1.25s/it]
 12%|████████▉                                                                    | 936/8080 [14:29<2:46:02,  1.39s/it]
 12%|████████▉                                                                    | 937/8080 [14:29<2:11:27,  1.10s/it]
 12%|████████▉                                                                    | 938/8080 [14:30<1:54:05,  1.04it/s]
 12%|████████▉                          

 12%|█████████▍                                                                  | 1003/8080 [15:30<1:40:49,  1.17it/s]
 12%|█████████▍                                                                  | 1004/8080 [15:31<1:24:56,  1.39it/s]
 12%|█████████▍                                                                  | 1005/8080 [15:31<1:26:07,  1.37it/s]
 12%|█████████▍                                                                  | 1007/8080 [15:32<1:04:42,  1.82it/s]
 12%|█████████▋                                                                    | 1008/8080 [15:32<50:36,  2.33it/s]
 12%|█████████▋                                                                    | 1009/8080 [15:32<53:14,  2.21it/s]
 12%|█████████▊                                                                    | 1010/8080 [15:33<54:38,  2.16it/s]
 13%|█████████▊                                                                    | 1011/8080 [15:33<51:02,  2.31it/s]
 13%|█████████▌                         

 13%|██████████                                                                  | 1073/8080 [16:35<1:10:03,  1.67it/s]
 13%|██████████                                                                  | 1074/8080 [16:36<1:13:51,  1.58it/s]
 13%|██████████                                                                  | 1075/8080 [16:37<1:28:11,  1.32it/s]
 13%|██████████▏                                                                 | 1077/8080 [16:40<1:52:26,  1.04it/s]
 13%|██████████▏                                                                 | 1078/8080 [16:42<2:11:13,  1.12s/it]
 13%|██████████▏                                                                 | 1079/8080 [16:43<2:35:27,  1.33s/it]
 13%|██████████▏                                                                 | 1080/8080 [16:44<2:06:42,  1.09s/it]
 13%|██████████▏                                                                 | 1081/8080 [16:47<3:06:54,  1.60s/it]
 13%|██████████▏                        

 14%|██████████▊                                                                 | 1144/8080 [17:47<2:58:18,  1.54s/it]
 14%|██████████▊                                                                 | 1145/8080 [17:48<2:31:30,  1.31s/it]
 14%|██████████▊                                                                 | 1146/8080 [17:48<2:02:59,  1.06s/it]
 14%|██████████▊                                                                 | 1147/8080 [17:49<1:47:16,  1.08it/s]
 14%|██████████▊                                                                 | 1148/8080 [17:49<1:34:55,  1.22it/s]
 14%|██████████▊                                                                 | 1149/8080 [17:50<1:20:28,  1.44it/s]
 14%|██████████▊                                                                 | 1150/8080 [17:50<1:15:17,  1.53it/s]
 14%|██████████▊                                                                 | 1151/8080 [17:52<1:37:52,  1.18it/s]
 14%|██████████▊                        

 15%|███████████▍                                                                | 1216/8080 [18:48<1:02:55,  1.82it/s]
 15%|███████████▋                                                                  | 1217/8080 [18:49<54:02,  2.12it/s]
 15%|███████████▍                                                                | 1218/8080 [18:49<1:01:40,  1.85it/s]
 15%|███████████▍                                                                | 1219/8080 [18:50<1:07:04,  1.70it/s]
 15%|███████████▍                                                                | 1220/8080 [18:53<2:14:49,  1.18s/it]
 15%|███████████▍                                                                | 1221/8080 [18:55<2:51:23,  1.50s/it]
 15%|███████████▍                                                                | 1222/8080 [18:56<2:47:27,  1.47s/it]
 15%|███████████▌                                                                | 1223/8080 [18:58<3:04:25,  1.61s/it]
 15%|███████████▌                       

 16%|████████████                                                                | 1288/8080 [20:05<1:23:34,  1.35it/s]
 16%|████████████                                                                | 1289/8080 [20:05<1:10:12,  1.61it/s]
 16%|████████████▏                                                               | 1291/8080 [20:06<1:05:57,  1.72it/s]
 16%|████████████▏                                                               | 1292/8080 [20:07<1:04:36,  1.75it/s]
 16%|████████████▍                                                                 | 1293/8080 [20:07<50:29,  2.24it/s]
 16%|████████████▏                                                               | 1294/8080 [20:08<1:03:11,  1.79it/s]
 16%|████████████▏                                                               | 1295/8080 [20:09<1:17:43,  1.45it/s]
 16%|████████████▏                                                               | 1296/8080 [20:09<1:00:43,  1.86it/s]
 16%|████████████▏                      

 17%|████████████▊                                                               | 1361/8080 [21:00<1:32:13,  1.21it/s]
 17%|████████████▊                                                               | 1362/8080 [21:01<1:34:26,  1.19it/s]
 17%|████████████▊                                                               | 1363/8080 [21:01<1:18:36,  1.42it/s]
 17%|████████████▊                                                               | 1364/8080 [21:03<2:07:48,  1.14s/it]
 17%|████████████▊                                                               | 1365/8080 [21:04<1:43:33,  1.08it/s]
 17%|████████████▊                                                               | 1366/8080 [21:05<1:40:07,  1.12it/s]
 17%|████████████▊                                                               | 1367/8080 [21:06<1:36:42,  1.16it/s]
 17%|████████████▊                                                               | 1368/8080 [21:06<1:31:22,  1.22it/s]
 17%|████████████▉                      

 18%|█████████████▍                                                              | 1432/8080 [21:58<1:35:35,  1.16it/s]
 18%|█████████████▍                                                              | 1433/8080 [21:59<1:47:54,  1.03it/s]
 18%|█████████████▍                                                              | 1434/8080 [22:02<2:56:20,  1.59s/it]
 18%|█████████████▍                                                              | 1435/8080 [22:03<2:44:14,  1.48s/it]
 18%|█████████████▌                                                              | 1436/8080 [22:05<2:59:30,  1.62s/it]
 18%|█████████████▌                                                              | 1437/8080 [22:07<2:58:28,  1.61s/it]
 18%|█████████████▌                                                              | 1438/8080 [22:08<2:55:01,  1.58s/it]
 18%|█████████████▌                                                              | 1439/8080 [22:10<3:08:02,  1.70s/it]
 18%|█████████████▌                     

 19%|██████████████▏                                                             | 1503/8080 [23:01<1:41:44,  1.08it/s]
 19%|██████████████▏                                                             | 1504/8080 [23:02<1:25:07,  1.29it/s]
 19%|██████████████▏                                                             | 1505/8080 [23:03<1:24:38,  1.29it/s]
 19%|██████████████▏                                                             | 1506/8080 [23:04<1:51:13,  1.02s/it]
 19%|██████████████▏                                                             | 1507/8080 [23:05<1:42:09,  1.07it/s]
 19%|██████████████▏                                                             | 1509/8080 [23:06<1:30:52,  1.21it/s]
 19%|██████████████▏                                                             | 1510/8080 [23:06<1:10:58,  1.54it/s]
 19%|██████████████▏                                                             | 1511/8080 [23:08<1:31:13,  1.20it/s]
 19%|██████████████▏                    

 20%|██████████████▊                                                             | 1577/8080 [23:55<3:24:07,  1.88s/it]
 20%|██████████████▊                                                             | 1578/8080 [23:56<2:51:46,  1.59s/it]
 20%|██████████████▊                                                             | 1579/8080 [23:57<2:35:10,  1.43s/it]
 20%|██████████████▊                                                             | 1581/8080 [23:58<1:52:05,  1.03s/it]
 20%|██████████████▉                                                             | 1582/8080 [23:58<1:35:57,  1.13it/s]
 20%|██████████████▉                                                             | 1583/8080 [23:59<1:25:22,  1.27it/s]
 20%|██████████████▉                                                             | 1584/8080 [23:59<1:14:41,  1.45it/s]
 20%|██████████████▉                                                             | 1585/8080 [24:00<1:09:26,  1.56it/s]
 20%|███████████████▎                   

 20%|███████████████▌                                                            | 1652/8080 [24:44<1:11:33,  1.50it/s]
 20%|███████████████▉                                                              | 1653/8080 [24:44<54:34,  1.96it/s]
 20%|███████████████▌                                                            | 1654/8080 [24:45<1:03:36,  1.68it/s]
 20%|███████████████▌                                                            | 1655/8080 [24:46<1:18:54,  1.36it/s]
 21%|███████████████▉                                                              | 1657/8080 [24:47<59:53,  1.79it/s]
 21%|███████████████▌                                                            | 1658/8080 [24:48<1:39:45,  1.07it/s]
 21%|███████████████▌                                                            | 1659/8080 [24:50<1:46:24,  1.01it/s]
 21%|███████████████▌                                                            | 1661/8080 [24:50<1:25:24,  1.25it/s]
 21%|███████████████▋                   

 21%|████████████████▏                                                           | 1723/8080 [25:55<1:01:57,  1.71it/s]
 21%|████████████████▏                                                           | 1724/8080 [25:59<2:31:46,  1.43s/it]
 21%|████████████████▏                                                           | 1726/8080 [26:00<2:12:24,  1.25s/it]
 21%|████████████████▏                                                           | 1727/8080 [26:03<2:49:31,  1.60s/it]
 21%|████████████████▎                                                           | 1728/8080 [26:03<2:19:54,  1.32s/it]
 21%|████████████████▎                                                           | 1729/8080 [26:04<1:49:02,  1.03s/it]
 21%|████████████████▎                                                           | 1730/8080 [26:05<1:51:58,  1.06s/it]
 21%|████████████████▎                                                           | 1731/8080 [26:05<1:26:13,  1.23it/s]
 21%|████████████████▎                  

 22%|████████████████▉                                                           | 1797/8080 [27:00<1:34:51,  1.10it/s]
 22%|████████████████▉                                                           | 1799/8080 [27:00<1:15:55,  1.38it/s]
 22%|████████████████▉                                                           | 1800/8080 [27:01<1:14:24,  1.41it/s]
 22%|████████████████▉                                                           | 1801/8080 [27:02<1:13:44,  1.42it/s]
 22%|████████████████▉                                                           | 1803/8080 [27:03<1:03:25,  1.65it/s]
 22%|████████████████▉                                                           | 1804/8080 [27:04<1:27:54,  1.19it/s]
 22%|████████████████▉                                                           | 1805/8080 [27:05<1:38:17,  1.06it/s]
 22%|████████████████▉                                                           | 1806/8080 [27:06<1:37:38,  1.07it/s]
 22%|████████████████▉                  

 23%|█████████████████▌                                                          | 1870/8080 [28:12<1:12:37,  1.43it/s]
 23%|█████████████████▌                                                          | 1871/8080 [28:13<1:08:47,  1.50it/s]
 23%|██████████████████                                                            | 1872/8080 [28:13<58:35,  1.77it/s]
 23%|██████████████████                                                            | 1873/8080 [28:13<47:29,  2.18it/s]
 23%|██████████████████                                                            | 1874/8080 [28:14<54:27,  1.90it/s]
 23%|█████████████████▋                                                          | 1875/8080 [28:15<1:26:06,  1.20it/s]
 23%|█████████████████▋                                                          | 1876/8080 [28:16<1:29:00,  1.16it/s]
 23%|█████████████████▋                                                          | 1877/8080 [28:17<1:30:22,  1.14it/s]
 23%|█████████████████▋                 

 24%|██████████████████▏                                                         | 1940/8080 [29:13<1:07:06,  1.52it/s]
 24%|██████████████████▎                                                         | 1941/8080 [29:14<1:11:31,  1.43it/s]
 24%|██████████████████▋                                                           | 1942/8080 [29:14<55:32,  1.84it/s]
 24%|██████████████████▎                                                         | 1943/8080 [29:15<1:01:36,  1.66it/s]
 24%|██████████████████▎                                                         | 1944/8080 [29:16<1:17:35,  1.32it/s]
 24%|██████████████████▊                                                           | 1945/8080 [29:16<59:02,  1.73it/s]
 24%|██████████████████▎                                                         | 1946/8080 [29:17<1:32:31,  1.10it/s]
 24%|██████████████████▎                                                         | 1947/8080 [29:19<2:04:47,  1.22s/it]
 24%|██████████████████▎                

 25%|██████████████████▉                                                         | 2008/8080 [30:24<1:24:08,  1.20it/s]
 25%|██████████████████▉                                                         | 2009/8080 [30:26<1:53:44,  1.12s/it]
 25%|██████████████████▉                                                         | 2010/8080 [30:27<1:38:18,  1.03it/s]
 25%|██████████████████▉                                                         | 2011/8080 [30:28<1:46:06,  1.05s/it]
 25%|██████████████████▉                                                         | 2012/8080 [30:29<1:50:52,  1.10s/it]
 25%|██████████████████▉                                                         | 2013/8080 [30:30<1:44:10,  1.03s/it]
 25%|██████████████████▉                                                         | 2014/8080 [30:31<1:29:15,  1.13it/s]
 25%|██████████████████▉                                                         | 2015/8080 [30:31<1:05:47,  1.54it/s]
 25%|███████████████████▍               

 26%|███████████████████▌                                                        | 2079/8080 [31:23<1:07:49,  1.47it/s]
 26%|███████████████████▌                                                        | 2080/8080 [31:23<1:06:01,  1.51it/s]
 26%|███████████████████▌                                                        | 2081/8080 [31:25<1:28:09,  1.13it/s]
 26%|███████████████████▌                                                        | 2082/8080 [31:25<1:18:32,  1.27it/s]
 26%|███████████████████▌                                                        | 2083/8080 [31:27<1:48:49,  1.09s/it]
 26%|███████████████████▌                                                        | 2084/8080 [31:29<2:00:14,  1.20s/it]
 26%|███████████████████▌                                                        | 2085/8080 [31:32<2:51:46,  1.72s/it]
 26%|███████████████████▌                                                        | 2086/8080 [31:32<2:17:41,  1.38s/it]
 26%|███████████████████▋               

 27%|████████████████████▏                                                       | 2151/8080 [32:31<2:44:16,  1.66s/it]
 27%|████████████████████▏                                                       | 2152/8080 [32:32<2:17:50,  1.40s/it]
 27%|████████████████████▎                                                       | 2153/8080 [32:33<2:10:36,  1.32s/it]
 27%|████████████████████▎                                                       | 2154/8080 [32:33<1:37:25,  1.01it/s]
 27%|████████████████████▎                                                       | 2155/8080 [32:33<1:19:18,  1.25it/s]
 27%|████████████████████▎                                                       | 2156/8080 [32:34<1:00:34,  1.63it/s]
 27%|████████████████████▎                                                       | 2157/8080 [32:34<1:07:33,  1.46it/s]
 27%|████████████████████▎                                                       | 2158/8080 [32:35<1:12:05,  1.37it/s]
 27%|████████████████████▎              

 28%|████████████████████▉                                                       | 2222/8080 [33:45<3:40:03,  2.25s/it]
 28%|████████████████████▉                                                       | 2223/8080 [33:45<2:47:36,  1.72s/it]
 28%|████████████████████▉                                                       | 2224/8080 [33:45<2:01:51,  1.25s/it]
 28%|████████████████████▉                                                       | 2226/8080 [33:46<1:32:38,  1.05it/s]
 28%|████████████████████▉                                                       | 2227/8080 [33:46<1:12:47,  1.34it/s]
 28%|█████████████████████▌                                                        | 2228/8080 [33:46<57:14,  1.70it/s]
 28%|████████████████████▉                                                       | 2229/8080 [33:47<1:05:49,  1.48it/s]
 28%|████████████████████▉                                                       | 2230/8080 [33:48<1:04:45,  1.51it/s]
 28%|█████████████████████▌             

 28%|█████████████████████▌                                                      | 2295/8080 [35:02<1:47:56,  1.12s/it]
 28%|█████████████████████▌                                                      | 2296/8080 [35:03<1:30:58,  1.06it/s]
 28%|█████████████████████▌                                                      | 2297/8080 [35:03<1:08:22,  1.41it/s]
 28%|██████████████████████▏                                                       | 2298/8080 [35:03<52:03,  1.85it/s]
 28%|██████████████████████▏                                                       | 2299/8080 [35:04<57:32,  1.67it/s]
 28%|██████████████████████▏                                                       | 2301/8080 [35:05<50:00,  1.93it/s]
 28%|█████████████████████▋                                                      | 2302/8080 [35:08<2:03:13,  1.28s/it]
 29%|█████████████████████▋                                                      | 2303/8080 [35:09<1:54:43,  1.19s/it]
 29%|█████████████████████▋             

 29%|██████████████████████▎                                                     | 2367/8080 [36:34<1:26:12,  1.10it/s]
 29%|██████████████████████▎                                                     | 2368/8080 [36:35<1:15:22,  1.26it/s]
 29%|██████████████████████▊                                                       | 2369/8080 [36:35<56:49,  1.68it/s]
 29%|██████████████████████▉                                                       | 2370/8080 [36:35<53:36,  1.78it/s]
 29%|██████████████████████▉                                                       | 2371/8080 [36:35<43:38,  2.18it/s]
 29%|██████████████████████▉                                                       | 2372/8080 [36:36<46:53,  2.03it/s]
 29%|██████████████████████▉                                                       | 2373/8080 [36:36<38:50,  2.45it/s]
 29%|██████████████████████▉                                                       | 2374/8080 [36:37<47:33,  2.00it/s]
 29%|██████████████████████▎            

 30%|██████████████████████▉                                                     | 2437/8080 [37:50<1:33:13,  1.01it/s]
 30%|██████████████████████▉                                                     | 2438/8080 [37:50<1:11:46,  1.31it/s]
 30%|███████████████████████▌                                                      | 2439/8080 [37:50<58:13,  1.61it/s]
 30%|███████████████████████▌                                                      | 2440/8080 [37:50<45:24,  2.07it/s]
 30%|███████████████████████▌                                                      | 2441/8080 [37:50<37:15,  2.52it/s]
 30%|███████████████████████▌                                                      | 2442/8080 [37:51<35:47,  2.63it/s]
 30%|███████████████████████▌                                                      | 2443/8080 [37:52<47:07,  1.99it/s]
 30%|███████████████████████▌                                                      | 2444/8080 [37:52<49:51,  1.88it/s]
 30%|███████████████████████▌           

 31%|████████████████████████▏                                                     | 2509/8080 [38:50<45:17,  2.05it/s]
 31%|███████████████████████▌                                                    | 2510/8080 [38:51<1:15:04,  1.24it/s]
 31%|███████████████████████▌                                                    | 2511/8080 [38:52<1:16:34,  1.21it/s]
 31%|███████████████████████▋                                                    | 2513/8080 [38:53<1:02:26,  1.49it/s]
 31%|███████████████████████▋                                                    | 2514/8080 [38:54<1:21:25,  1.14it/s]
 31%|███████████████████████▋                                                    | 2515/8080 [38:55<1:16:04,  1.22it/s]
 31%|███████████████████████▋                                                    | 2516/8080 [38:56<1:24:19,  1.10it/s]
 31%|███████████████████████▋                                                    | 2517/8080 [38:58<1:48:52,  1.17s/it]
 31%|███████████████████████▋           

 32%|████████████████████████▎                                                   | 2580/8080 [40:07<2:40:54,  1.76s/it]
 32%|████████████████████████▎                                                   | 2581/8080 [40:10<3:02:53,  2.00s/it]
 32%|████████████████████████▎                                                   | 2582/8080 [40:10<2:20:38,  1.53s/it]
 32%|████████████████████████▎                                                   | 2583/8080 [40:11<1:43:44,  1.13s/it]
 32%|████████████████████████▎                                                   | 2584/8080 [40:14<2:35:41,  1.70s/it]
 32%|████████████████████████▎                                                   | 2585/8080 [40:16<2:45:10,  1.80s/it]
 32%|████████████████████████▎                                                   | 2586/8080 [40:17<2:40:38,  1.75s/it]
 32%|████████████████████████▎                                                   | 2587/8080 [40:18<1:58:41,  1.30s/it]
 32%|████████████████████████▎          

 33%|████████████████████████▉                                                   | 2652/8080 [41:14<1:29:31,  1.01it/s]
 33%|████████████████████████▉                                                   | 2654/8080 [41:16<1:31:37,  1.01s/it]
 33%|████████████████████████▉                                                   | 2655/8080 [41:19<2:20:14,  1.55s/it]
 33%|████████████████████████▉                                                   | 2656/8080 [41:20<1:54:58,  1.27s/it]
 33%|████████████████████████▉                                                   | 2657/8080 [41:22<2:16:42,  1.51s/it]
 33%|█████████████████████████                                                   | 2658/8080 [41:22<1:53:23,  1.25s/it]
 33%|█████████████████████████                                                   | 2659/8080 [41:23<1:50:53,  1.23s/it]
 33%|█████████████████████████                                                   | 2660/8080 [41:25<1:54:55,  1.27s/it]
 33%|█████████████████████████          

 34%|█████████████████████████▋                                                  | 2726/8080 [42:27<1:34:46,  1.06s/it]
 34%|█████████████████████████▋                                                  | 2727/8080 [42:27<1:09:42,  1.28it/s]
 34%|█████████████████████████▋                                                  | 2728/8080 [42:28<1:25:59,  1.04it/s]
 34%|█████████████████████████▋                                                  | 2729/8080 [42:31<2:04:31,  1.40s/it]
 34%|█████████████████████████▋                                                  | 2730/8080 [42:32<1:50:46,  1.24s/it]
 34%|█████████████████████████▋                                                  | 2731/8080 [42:32<1:32:43,  1.04s/it]
 34%|█████████████████████████▋                                                  | 2732/8080 [42:32<1:08:36,  1.30it/s]
 34%|█████████████████████████▋                                                  | 2733/8080 [42:34<1:41:19,  1.14s/it]
 34%|█████████████████████████▋         

 35%|██████████████████████████▎                                                 | 2798/8080 [43:53<1:19:07,  1.11it/s]
 35%|██████████████████████████▎                                                 | 2799/8080 [43:53<1:12:28,  1.21it/s]
 35%|██████████████████████████▎                                                 | 2800/8080 [43:54<1:06:10,  1.33it/s]
 35%|██████████████████████████▎                                                 | 2801/8080 [43:55<1:08:19,  1.29it/s]
 35%|██████████████████████████▎                                                 | 2802/8080 [43:56<1:20:00,  1.10it/s]
 35%|██████████████████████████▎                                                 | 2803/8080 [43:57<1:16:17,  1.15it/s]
 35%|██████████████████████████▎                                                 | 2804/8080 [43:58<1:20:14,  1.10it/s]
 35%|██████████████████████████▍                                                 | 2805/8080 [43:59<1:14:18,  1.18it/s]
 35%|██████████████████████████▍        

 36%|██████████████████████████▉                                                 | 2869/8080 [44:55<1:00:40,  1.43it/s]
 36%|███████████████████████████▋                                                  | 2870/8080 [44:55<53:33,  1.62it/s]
 36%|███████████████████████████                                                 | 2871/8080 [44:56<1:00:01,  1.45it/s]
 36%|███████████████████████████                                                 | 2872/8080 [44:58<1:29:14,  1.03s/it]
 36%|███████████████████████████                                                 | 2874/8080 [44:59<1:12:46,  1.19it/s]
 36%|███████████████████████████                                                 | 2875/8080 [45:00<1:38:50,  1.14s/it]
 36%|███████████████████████████                                                 | 2876/8080 [45:01<1:18:46,  1.10it/s]
 36%|███████████████████████████                                                 | 2877/8080 [45:01<1:00:45,  1.43it/s]
 36%|███████████████████████████        

 36%|███████████████████████████▋                                                | 2942/8080 [46:02<3:32:13,  2.48s/it]
 36%|███████████████████████████▋                                                | 2943/8080 [46:02<2:45:39,  1.93s/it]
 36%|███████████████████████████▋                                                | 2944/8080 [46:03<2:00:17,  1.41s/it]
 36%|███████████████████████████▋                                                | 2945/8080 [46:04<2:11:35,  1.54s/it]
 36%|███████████████████████████▋                                                | 2946/8080 [46:05<1:48:04,  1.26s/it]
 36%|███████████████████████████▋                                                | 2947/8080 [46:05<1:24:18,  1.01it/s]
 36%|███████████████████████████▋                                                | 2948/8080 [46:06<1:02:43,  1.36it/s]
 36%|███████████████████████████▋                                                | 2949/8080 [46:06<1:05:47,  1.30it/s]
 37%|███████████████████████████▋       

 37%|████████████████████████████▎                                               | 3016/8080 [47:07<2:26:09,  1.73s/it]
 37%|████████████████████████████▍                                               | 3017/8080 [47:09<2:35:03,  1.84s/it]
 37%|████████████████████████████▍                                               | 3018/8080 [47:12<2:58:26,  2.12s/it]
 37%|████████████████████████████▍                                               | 3019/8080 [47:12<2:21:39,  1.68s/it]
 37%|████████████████████████████▍                                               | 3020/8080 [47:14<2:25:38,  1.73s/it]
 37%|████████████████████████████▍                                               | 3021/8080 [47:15<2:06:39,  1.50s/it]
 37%|████████████████████████████▍                                               | 3022/8080 [47:17<2:04:41,  1.48s/it]
 37%|████████████████████████████▍                                               | 3023/8080 [47:17<1:35:02,  1.13s/it]
 37%|████████████████████████████▍      

 38%|█████████████████████████████▊                                                | 3088/8080 [48:08<46:24,  1.79it/s]
 38%|█████████████████████████████▊                                                | 3089/8080 [48:08<38:16,  2.17it/s]
 38%|█████████████████████████████                                               | 3090/8080 [48:10<1:09:34,  1.20it/s]
 38%|█████████████████████████████▊                                                | 3092/8080 [48:11<57:26,  1.45it/s]
 38%|█████████████████████████████▊                                                | 3093/8080 [48:11<52:30,  1.58it/s]
 38%|█████████████████████████████▊                                                | 3094/8080 [48:12<54:50,  1.52it/s]
 38%|█████████████████████████████                                               | 3095/8080 [48:14<1:26:26,  1.04s/it]
 38%|█████████████████████████████                                               | 3096/8080 [48:15<1:14:18,  1.12it/s]
 38%|█████████████████████████████▉     

 39%|█████████████████████████████▋                                              | 3158/8080 [49:22<1:11:45,  1.14it/s]
 39%|█████████████████████████████▋                                              | 3159/8080 [49:24<1:29:12,  1.09s/it]
 39%|█████████████████████████████▋                                              | 3160/8080 [49:25<1:42:43,  1.25s/it]
 39%|█████████████████████████████▋                                              | 3161/8080 [49:27<1:50:21,  1.35s/it]
 39%|█████████████████████████████▋                                              | 3162/8080 [49:28<1:38:13,  1.20s/it]
 39%|█████████████████████████████▊                                              | 3163/8080 [49:30<2:14:26,  1.64s/it]
 39%|█████████████████████████████▊                                              | 3165/8080 [49:31<1:40:23,  1.23s/it]
 39%|█████████████████████████████▊                                              | 3166/8080 [49:31<1:18:37,  1.04it/s]
 39%|█████████████████████████████▊     

 40%|██████████████████████████████▎                                             | 3228/8080 [50:27<1:02:32,  1.29it/s]
 40%|██████████████████████████████▎                                             | 3229/8080 [50:28<1:25:14,  1.05s/it]
 40%|██████████████████████████████▍                                             | 3230/8080 [50:30<1:33:13,  1.15s/it]
 40%|██████████████████████████████▍                                             | 3231/8080 [50:31<1:34:46,  1.17s/it]
 40%|██████████████████████████████▍                                             | 3232/8080 [50:32<1:26:34,  1.07s/it]
 40%|██████████████████████████████▍                                             | 3233/8080 [50:32<1:05:00,  1.24it/s]
 40%|██████████████████████████████▍                                             | 3234/8080 [50:32<1:00:38,  1.33it/s]
 40%|██████████████████████████████▍                                             | 3235/8080 [50:34<1:11:40,  1.13it/s]
 40%|██████████████████████████████▍    

 41%|███████████████████████████████                                             | 3298/8080 [51:31<1:12:52,  1.09it/s]
 41%|███████████████████████████████                                             | 3299/8080 [51:32<1:04:48,  1.23it/s]
 41%|███████████████████████████████▊                                              | 3300/8080 [51:32<57:10,  1.39it/s]
 41%|███████████████████████████████▊                                              | 3301/8080 [51:32<43:41,  1.82it/s]
 41%|███████████████████████████████▉                                              | 3302/8080 [51:33<53:26,  1.49it/s]
 41%|███████████████████████████████▉                                              | 3303/8080 [51:34<55:15,  1.44it/s]
 41%|███████████████████████████████                                             | 3304/8080 [51:35<1:01:09,  1.30it/s]
 41%|███████████████████████████████                                             | 3305/8080 [51:36<1:07:02,  1.19it/s]
 41%|███████████████████████████████    

 42%|███████████████████████████████▋                                            | 3372/8080 [52:34<1:00:44,  1.29it/s]
 42%|████████████████████████████████▌                                             | 3373/8080 [52:34<48:45,  1.61it/s]
 42%|████████████████████████████████▌                                             | 3374/8080 [52:35<39:31,  1.98it/s]
 42%|████████████████████████████████▌                                             | 3376/8080 [52:35<33:34,  2.33it/s]
 42%|████████████████████████████████▌                                             | 3377/8080 [52:36<31:58,  2.45it/s]
 42%|████████████████████████████████▌                                             | 3378/8080 [52:36<40:14,  1.95it/s]
 42%|████████████████████████████████▌                                             | 3379/8080 [52:37<35:39,  2.20it/s]
 42%|████████████████████████████████▋                                             | 3380/8080 [52:37<32:13,  2.43it/s]
 42%|████████████████████████████████▋  

 43%|█████████████████████████████████▎                                            | 3447/8080 [53:23<46:08,  1.67it/s]
 43%|█████████████████████████████████▎                                            | 3448/8080 [53:25<59:59,  1.29it/s]
 43%|█████████████████████████████████▎                                            | 3449/8080 [53:25<48:20,  1.60it/s]
 43%|█████████████████████████████████▎                                            | 3450/8080 [53:25<38:50,  1.99it/s]
 43%|█████████████████████████████████▎                                            | 3451/8080 [53:26<42:10,  1.83it/s]
 43%|█████████████████████████████████▎                                            | 3452/8080 [53:26<45:35,  1.69it/s]
 43%|█████████████████████████████████▎                                            | 3453/8080 [53:27<42:39,  1.81it/s]
 43%|█████████████████████████████████▎                                            | 3454/8080 [53:28<48:37,  1.59it/s]
 43%|████████████████████████████████▍  

 44%|█████████████████████████████████▉                                            | 3520/8080 [54:21<54:32,  1.39it/s]
 44%|█████████████████████████████████                                           | 3521/8080 [54:22<1:05:43,  1.16it/s]
 44%|█████████████████████████████████▏                                          | 3522/8080 [54:23<1:04:42,  1.17it/s]
 44%|██████████████████████████████████                                            | 3523/8080 [54:23<52:11,  1.46it/s]
 44%|██████████████████████████████████                                            | 3524/8080 [54:23<41:09,  1.84it/s]
 44%|██████████████████████████████████                                            | 3525/8080 [54:24<32:41,  2.32it/s]
 44%|██████████████████████████████████                                            | 3526/8080 [54:24<35:52,  2.12it/s]
 44%|██████████████████████████████████                                            | 3527/8080 [54:25<43:21,  1.75it/s]
 44%|█████████████████████████████████▏ 

 44%|█████████████████████████████████▊                                          | 3591/8080 [55:36<1:12:31,  1.03it/s]
 44%|█████████████████████████████████▊                                          | 3592/8080 [55:37<1:10:55,  1.05it/s]
 44%|█████████████████████████████████▊                                          | 3593/8080 [55:38<1:17:31,  1.04s/it]
 44%|█████████████████████████████████▊                                          | 3594/8080 [55:39<1:11:57,  1.04it/s]
 44%|█████████████████████████████████▊                                          | 3595/8080 [55:40<1:08:37,  1.09it/s]
 45%|█████████████████████████████████▊                                          | 3596/8080 [55:41<1:09:57,  1.07it/s]
 45%|█████████████████████████████████▊                                          | 3597/8080 [55:42<1:04:52,  1.15it/s]
 45%|██████████████████████████████████▋                                           | 3598/8080 [55:42<56:17,  1.33it/s]
 45%|██████████████████████████████████▋

 45%|██████████████████████████████████▍                                         | 3661/8080 [56:42<1:09:32,  1.06it/s]
 45%|██████████████████████████████████▍                                         | 3662/8080 [56:42<1:02:04,  1.19it/s]
 45%|██████████████████████████████████▍                                         | 3663/8080 [56:43<1:02:01,  1.19it/s]
 45%|███████████████████████████████████▎                                          | 3664/8080 [56:43<49:08,  1.50it/s]
 45%|███████████████████████████████████▍                                          | 3665/8080 [56:44<47:56,  1.53it/s]
 45%|███████████████████████████████████▍                                          | 3667/8080 [56:45<41:34,  1.77it/s]
 45%|██████████████████████████████████▌                                         | 3668/8080 [56:47<1:11:24,  1.03it/s]
 45%|███████████████████████████████████▍                                          | 3669/8080 [56:47<53:04,  1.39it/s]
 45%|███████████████████████████████████

 46%|███████████████████████████████████                                         | 3731/8080 [57:49<1:41:45,  1.40s/it]
 46%|███████████████████████████████████                                         | 3732/8080 [57:51<1:44:15,  1.44s/it]
 46%|███████████████████████████████████                                         | 3733/8080 [57:51<1:18:11,  1.08s/it]
 46%|███████████████████████████████████                                         | 3734/8080 [57:51<1:00:43,  1.19it/s]
 46%|████████████████████████████████████                                          | 3735/8080 [57:52<58:24,  1.24it/s]
 46%|███████████████████████████████████▏                                        | 3736/8080 [57:53<1:11:01,  1.02it/s]
 46%|███████████████████████████████████▏                                        | 3737/8080 [57:57<2:10:17,  1.80s/it]
 46%|███████████████████████████████████▏                                        | 3738/8080 [57:59<2:07:24,  1.76s/it]
 46%|███████████████████████████████████

 47%|████████████████████████████████████▋                                         | 3803/8080 [58:54<56:35,  1.26it/s]
 47%|████████████████████████████████████▋                                         | 3804/8080 [58:55<59:01,  1.21it/s]
 47%|████████████████████████████████████▋                                         | 3805/8080 [58:56<53:53,  1.32it/s]
 47%|████████████████████████████████████▋                                         | 3806/8080 [58:57<56:53,  1.25it/s]
 47%|███████████████████████████████████▊                                        | 3807/8080 [58:58<1:16:02,  1.07s/it]
 47%|███████████████████████████████████▊                                        | 3808/8080 [58:59<1:05:36,  1.09it/s]
 47%|████████████████████████████████████▊                                         | 3809/8080 [58:59<49:11,  1.45it/s]
 47%|████████████████████████████████████▊                                         | 3810/8080 [59:00<59:44,  1.19it/s]
 47%|███████████████████████████████████

 48%|████████████████████████████████████▍                                       | 3875/8080 [59:59<1:04:01,  1.09it/s]
 48%|███████████████████████████████████▍                                      | 3876/8080 [1:00:02<1:56:17,  1.66s/it]
 48%|███████████████████████████████████▌                                      | 3877/8080 [1:00:03<1:46:18,  1.52s/it]
 48%|███████████████████████████████████▌                                      | 3878/8080 [1:00:03<1:18:55,  1.13s/it]
 48%|███████████████████████████████████▌                                      | 3879/8080 [1:00:04<1:15:59,  1.09s/it]
 48%|███████████████████████████████████▌                                      | 3880/8080 [1:00:06<1:20:47,  1.15s/it]
 48%|███████████████████████████████████▌                                      | 3881/8080 [1:00:06<1:12:32,  1.04s/it]
 48%|███████████████████████████████████▌                                      | 3882/8080 [1:00:07<1:03:21,  1.10it/s]
 48%|███████████████████████████████████

 49%|████████████████████████████████████▏                                     | 3945/8080 [1:01:04<1:04:06,  1.08it/s]
 49%|████████████████████████████████████▏                                     | 3946/8080 [1:01:06<1:27:44,  1.27s/it]
 49%|████████████████████████████████████▏                                     | 3947/8080 [1:01:07<1:08:16,  1.01it/s]
 49%|████████████████████████████████████▏                                     | 3948/8080 [1:01:07<1:00:18,  1.14it/s]
 49%|█████████████████████████████████████▏                                      | 3949/8080 [1:01:08<54:53,  1.25it/s]
 49%|█████████████████████████████████████▏                                      | 3950/8080 [1:01:09<49:52,  1.38it/s]
 49%|████████████████████████████████████▏                                     | 3951/8080 [1:01:10<1:01:34,  1.12it/s]
 49%|█████████████████████████████████████▏                                      | 3952/8080 [1:01:10<45:48,  1.50it/s]
 49%|███████████████████████████████████

 50%|█████████████████████████████████████▊                                      | 4017/8080 [1:01:56<54:00,  1.25it/s]
 50%|█████████████████████████████████████▊                                      | 4018/8080 [1:01:57<52:54,  1.28it/s]
 50%|█████████████████████████████████████▊                                      | 4019/8080 [1:01:58<46:00,  1.47it/s]
 50%|████████████████████████████████████▊                                     | 4020/8080 [1:01:59<1:00:30,  1.12it/s]
 50%|█████████████████████████████████████▊                                      | 4022/8080 [1:01:59<44:12,  1.53it/s]
 50%|█████████████████████████████████████▊                                      | 4023/8080 [1:02:00<57:39,  1.17it/s]
 50%|████████████████████████████████████▊                                     | 4024/8080 [1:02:03<1:35:58,  1.42s/it]
 50%|████████████████████████████████████▊                                     | 4025/8080 [1:02:05<1:38:35,  1.46s/it]
 50%|███████████████████████████████████

 51%|██████████████████████████████████████▍                                     | 4093/8080 [1:02:55<50:15,  1.32it/s]
 51%|██████████████████████████████████████▌                                     | 4094/8080 [1:02:56<57:31,  1.15it/s]
 51%|█████████████████████████████████████▌                                    | 4095/8080 [1:02:58<1:17:41,  1.17s/it]
 51%|█████████████████████████████████████▌                                    | 4096/8080 [1:02:58<1:02:20,  1.07it/s]
 51%|██████████████████████████████████████▌                                     | 4097/8080 [1:02:59<56:43,  1.17it/s]
 51%|██████████████████████████████████████▌                                     | 4098/8080 [1:02:59<49:38,  1.34it/s]
 51%|██████████████████████████████████████▌                                     | 4099/8080 [1:03:00<56:08,  1.18it/s]
 51%|██████████████████████████████████████▌                                     | 4100/8080 [1:03:01<51:05,  1.30it/s]
 51%|███████████████████████████████████

 52%|██████████████████████████████████████▏                                   | 4164/8080 [1:03:50<1:50:38,  1.70s/it]
 52%|██████████████████████████████████████▏                                   | 4165/8080 [1:03:50<1:26:03,  1.32s/it]
 52%|██████████████████████████████████████▏                                   | 4166/8080 [1:03:52<1:37:27,  1.49s/it]
 52%|██████████████████████████████████████▏                                   | 4167/8080 [1:03:53<1:31:28,  1.40s/it]
 52%|██████████████████████████████████████▏                                   | 4168/8080 [1:03:54<1:14:37,  1.14s/it]
 52%|██████████████████████████████████████▏                                   | 4169/8080 [1:03:55<1:15:14,  1.15s/it]
 52%|██████████████████████████████████████▏                                   | 4170/8080 [1:03:56<1:17:07,  1.18s/it]
 52%|██████████████████████████████████████▏                                   | 4171/8080 [1:03:57<1:08:21,  1.05s/it]
 52%|███████████████████████████████████

 52%|██████████████████████████████████████▊                                   | 4234/8080 [1:04:54<2:44:17,  2.56s/it]
 52%|██████████████████████████████████████▊                                   | 4235/8080 [1:04:55<2:13:18,  2.08s/it]
 52%|██████████████████████████████████████▊                                   | 4236/8080 [1:04:57<2:11:12,  2.05s/it]
 52%|██████████████████████████████████████▊                                   | 4237/8080 [1:04:57<1:40:00,  1.56s/it]
 52%|██████████████████████████████████████▊                                   | 4238/8080 [1:04:58<1:13:22,  1.15s/it]
 52%|███████████████████████████████████████▊                                    | 4239/8080 [1:04:58<56:54,  1.13it/s]
 52%|███████████████████████████████████████▉                                    | 4240/8080 [1:04:58<47:55,  1.34it/s]
 52%|███████████████████████████████████████▉                                    | 4241/8080 [1:04:59<43:11,  1.48it/s]
 52%|███████████████████████████████████

 53%|███████████████████████████████████████▍                                  | 4305/8080 [1:05:57<1:00:04,  1.05it/s]
 53%|███████████████████████████████████████▍                                  | 4306/8080 [1:05:59<1:08:43,  1.09s/it]
 53%|███████████████████████████████████████▍                                  | 4307/8080 [1:06:00<1:08:58,  1.10s/it]
 53%|███████████████████████████████████████▍                                  | 4308/8080 [1:06:01<1:04:12,  1.02s/it]
 53%|████████████████████████████████████████▌                                   | 4309/8080 [1:06:01<55:16,  1.14it/s]
 53%|████████████████████████████████████████▌                                   | 4310/8080 [1:06:02<41:54,  1.50it/s]
 53%|████████████████████████████████████████▌                                   | 4311/8080 [1:06:02<35:17,  1.78it/s]
 53%|███████████████████████████████████████▌                                  | 4313/8080 [1:06:06<1:06:48,  1.06s/it]
 53%|███████████████████████████████████

 54%|█████████████████████████████████████████▏                                  | 4379/8080 [1:07:12<45:30,  1.36it/s]
 54%|████████████████████████████████████████                                  | 4380/8080 [1:07:14<1:20:10,  1.30s/it]
 54%|████████████████████████████████████████                                  | 4381/8080 [1:07:15<1:09:41,  1.13s/it]
 54%|████████████████████████████████████████▏                                 | 4382/8080 [1:07:17<1:27:55,  1.43s/it]
 54%|████████████████████████████████████████▏                                 | 4383/8080 [1:07:18<1:28:52,  1.44s/it]
 54%|████████████████████████████████████████▏                                 | 4384/8080 [1:07:22<2:09:09,  2.10s/it]
 54%|████████████████████████████████████████▏                                 | 4385/8080 [1:07:24<2:11:24,  2.13s/it]
 54%|████████████████████████████████████████▏                                 | 4386/8080 [1:07:27<2:22:34,  2.32s/it]
 54%|███████████████████████████████████

 55%|█████████████████████████████████████████▊                                  | 4449/8080 [1:08:52<50:29,  1.20it/s]
 55%|█████████████████████████████████████████▊                                  | 4451/8080 [1:08:53<41:40,  1.45it/s]
 55%|█████████████████████████████████████████▉                                  | 4452/8080 [1:08:54<49:52,  1.21it/s]
 55%|█████████████████████████████████████████▉                                  | 4453/8080 [1:08:55<58:40,  1.03it/s]
 55%|█████████████████████████████████████████▉                                  | 4454/8080 [1:08:55<47:49,  1.26it/s]
 55%|████████████████████████████████████████▊                                 | 4455/8080 [1:08:58<1:17:52,  1.29s/it]
 55%|█████████████████████████████████████████▉                                  | 4456/8080 [1:08:58<59:58,  1.01it/s]
 55%|█████████████████████████████████████████▉                                  | 4457/8080 [1:08:59<49:40,  1.22it/s]
 55%|███████████████████████████████████

 56%|█████████████████████████████████████████▍                                | 4521/8080 [1:10:05<1:25:10,  1.44s/it]
 56%|█████████████████████████████████████████▍                                | 4522/8080 [1:10:06<1:14:49,  1.26s/it]
 56%|██████████████████████████████████████████▌                                 | 4523/8080 [1:10:06<55:28,  1.07it/s]
 56%|██████████████████████████████████████████▌                                 | 4524/8080 [1:10:07<49:59,  1.19it/s]
 56%|██████████████████████████████████████████▌                                 | 4525/8080 [1:10:07<41:17,  1.43it/s]
 56%|█████████████████████████████████████████▍                                | 4526/8080 [1:10:09<1:12:44,  1.23s/it]
 56%|█████████████████████████████████████████▍                                | 4527/8080 [1:10:10<1:09:40,  1.18s/it]
 56%|██████████████████████████████████████████▌                                 | 4528/8080 [1:10:11<55:46,  1.06it/s]
 56%|███████████████████████████████████

 57%|██████████████████████████████████████████                                | 4592/8080 [1:11:17<1:29:37,  1.54s/it]
 57%|██████████████████████████████████████████                                | 4593/8080 [1:11:18<1:26:35,  1.49s/it]
 57%|██████████████████████████████████████████                                | 4594/8080 [1:11:20<1:26:15,  1.48s/it]
 57%|██████████████████████████████████████████                                | 4595/8080 [1:11:22<1:35:35,  1.65s/it]
 57%|██████████████████████████████████████████                                | 4596/8080 [1:11:23<1:24:29,  1.46s/it]
 57%|██████████████████████████████████████████                                | 4597/8080 [1:11:24<1:17:31,  1.34s/it]
 57%|███████████████████████████████████████████▏                                | 4598/8080 [1:11:24<57:51,  1.00it/s]
 57%|██████████████████████████████████████████                                | 4599/8080 [1:11:26<1:08:07,  1.17s/it]
 57%|███████████████████████████████████

 58%|██████████████████████████████████████████▋                               | 4661/8080 [1:12:13<1:03:24,  1.11s/it]
 58%|███████████████████████████████████████████▊                                | 4662/8080 [1:12:13<48:19,  1.18it/s]
 58%|███████████████████████████████████████████▊                                | 4663/8080 [1:12:13<37:09,  1.53it/s]
 58%|███████████████████████████████████████████▊                                | 4664/8080 [1:12:14<29:37,  1.92it/s]
 58%|███████████████████████████████████████████▉                                | 4665/8080 [1:12:14<25:37,  2.22it/s]
 58%|██████████████████████████████████████████▋                               | 4666/8080 [1:12:16<1:00:04,  1.06s/it]
 58%|██████████████████████████████████████████▋                               | 4667/8080 [1:12:18<1:03:18,  1.11s/it]
 58%|███████████████████████████████████████████▉                                | 4668/8080 [1:12:18<58:07,  1.02s/it]
 58%|███████████████████████████████████

 59%|████████████████████████████████████████████▍                               | 4730/8080 [1:13:29<28:09,  1.98it/s]
 59%|████████████████████████████████████████████▍                               | 4731/8080 [1:13:30<32:39,  1.71it/s]
 59%|████████████████████████████████████████████▌                               | 4732/8080 [1:13:30<25:49,  2.16it/s]
 59%|████████████████████████████████████████████▌                               | 4733/8080 [1:13:30<23:45,  2.35it/s]
 59%|████████████████████████████████████████████▌                               | 4734/8080 [1:13:31<25:12,  2.21it/s]
 59%|████████████████████████████████████████████▌                               | 4735/8080 [1:13:32<35:53,  1.55it/s]
 59%|████████████████████████████████████████████▌                               | 4736/8080 [1:13:32<26:59,  2.06it/s]
 59%|████████████████████████████████████████████▌                               | 4737/8080 [1:13:32<25:46,  2.16it/s]
 59%|███████████████████████████████████

 59%|█████████████████████████████████████████████▏                              | 4802/8080 [1:14:25<52:47,  1.04it/s]
 59%|█████████████████████████████████████████████▏                              | 4803/8080 [1:14:25<42:40,  1.28it/s]
 59%|█████████████████████████████████████████████▏                              | 4804/8080 [1:14:25<35:11,  1.55it/s]
 59%|█████████████████████████████████████████████▏                              | 4805/8080 [1:14:26<38:57,  1.40it/s]
 59%|████████████████████████████████████████████                              | 4806/8080 [1:14:32<1:55:23,  2.11s/it]
 59%|████████████████████████████████████████████                              | 4807/8080 [1:14:33<1:48:58,  2.00s/it]
 60%|████████████████████████████████████████████                              | 4808/8080 [1:14:36<1:54:21,  2.10s/it]
 60%|████████████████████████████████████████████                              | 4809/8080 [1:14:38<1:52:43,  2.07s/it]
 60%|███████████████████████████████████

 60%|█████████████████████████████████████████████▊                              | 4873/8080 [1:15:47<21:43,  2.46it/s]
 60%|█████████████████████████████████████████████▊                              | 4874/8080 [1:15:48<36:12,  1.48it/s]
 60%|█████████████████████████████████████████████▊                              | 4875/8080 [1:15:50<53:29,  1.00s/it]
 60%|████████████████████████████████████████████▋                             | 4876/8080 [1:15:52<1:10:52,  1.33s/it]
 60%|████████████████████████████████████████████▋                             | 4877/8080 [1:15:53<1:03:44,  1.19s/it]
 60%|█████████████████████████████████████████████▉                              | 4878/8080 [1:15:53<50:26,  1.06it/s]
 60%|█████████████████████████████████████████████▉                              | 4879/8080 [1:15:54<49:24,  1.08it/s]
 60%|█████████████████████████████████████████████▉                              | 4880/8080 [1:15:55<38:23,  1.39it/s]
 60%|███████████████████████████████████

 61%|██████████████████████████████████████████████▌                             | 4944/8080 [1:16:54<24:06,  2.17it/s]
 61%|██████████████████████████████████████████████▌                             | 4945/8080 [1:16:54<21:58,  2.38it/s]
 61%|██████████████████████████████████████████████▌                             | 4946/8080 [1:16:54<18:39,  2.80it/s]
 61%|██████████████████████████████████████████████▌                             | 4947/8080 [1:16:55<17:24,  3.00it/s]
 61%|██████████████████████████████████████████████▌                             | 4949/8080 [1:16:56<22:55,  2.28it/s]
 61%|██████████████████████████████████████████████▌                             | 4950/8080 [1:16:57<26:24,  1.98it/s]
 61%|█████████████████████████████████████████████▎                            | 4951/8080 [1:17:01<1:27:52,  1.69s/it]
 61%|█████████████████████████████████████████████▎                            | 4952/8080 [1:17:02<1:10:27,  1.35s/it]
 61%|███████████████████████████████████

 62%|█████████████████████████████████████████████▉                            | 5018/8080 [1:17:55<1:01:59,  1.21s/it]
 62%|███████████████████████████████████████████████▏                            | 5019/8080 [1:17:56<59:34,  1.17s/it]
 62%|███████████████████████████████████████████████▏                            | 5020/8080 [1:17:57<48:24,  1.05it/s]
 62%|███████████████████████████████████████████████▏                            | 5021/8080 [1:17:57<42:19,  1.20it/s]
 62%|███████████████████████████████████████████████▏                            | 5022/8080 [1:17:57<32:06,  1.59it/s]
 62%|███████████████████████████████████████████████▏                            | 5023/8080 [1:17:58<30:24,  1.68it/s]
 62%|███████████████████████████████████████████████▎                            | 5024/8080 [1:17:59<35:33,  1.43it/s]
 62%|███████████████████████████████████████████████▎                            | 5025/8080 [1:17:59<27:35,  1.85it/s]
 62%|███████████████████████████████████

 63%|██████████████████████████████████████████████▌                           | 5089/8080 [1:19:01<1:01:14,  1.23s/it]
 63%|███████████████████████████████████████████████▉                            | 5090/8080 [1:19:02<49:36,  1.00it/s]
 63%|██████████████████████████████████████████████▋                           | 5091/8080 [1:19:03<1:01:34,  1.24s/it]
 63%|██████████████████████████████████████████████▋                           | 5092/8080 [1:19:05<1:00:37,  1.22s/it]
 63%|███████████████████████████████████████████████▉                            | 5093/8080 [1:19:05<49:38,  1.00it/s]
 63%|███████████████████████████████████████████████▉                            | 5094/8080 [1:19:06<45:32,  1.09it/s]
 63%|██████████████████████████████████████████████▋                           | 5095/8080 [1:19:13<2:22:33,  2.87s/it]
 63%|██████████████████████████████████████████████▋                           | 5096/8080 [1:19:15<2:05:32,  2.52s/it]
 63%|███████████████████████████████████

 64%|████████████████████████████████████████████████▌                           | 5161/8080 [1:20:22<34:26,  1.41it/s]
 64%|████████████████████████████████████████████████▌                           | 5162/8080 [1:20:23<27:41,  1.76it/s]
 64%|████████████████████████████████████████████████▌                           | 5163/8080 [1:20:23<21:18,  2.28it/s]
 64%|████████████████████████████████████████████████▌                           | 5164/8080 [1:20:24<29:12,  1.66it/s]
 64%|████████████████████████████████████████████████▌                           | 5165/8080 [1:20:25<40:36,  1.20it/s]
 64%|███████████████████████████████████████████████▎                          | 5166/8080 [1:20:28<1:09:12,  1.43s/it]
 64%|████████████████████████████████████████████████▌                           | 5167/8080 [1:20:28<56:40,  1.17s/it]
 64%|███████████████████████████████████████████████▎                          | 5168/8080 [1:20:31<1:09:12,  1.43s/it]
 64%|███████████████████████████████████

 65%|█████████████████████████████████████████████████▏                          | 5232/8080 [1:21:50<35:51,  1.32it/s]
 65%|███████████████████████████████████████████████▉                          | 5233/8080 [1:21:53<1:00:25,  1.27s/it]
 65%|███████████████████████████████████████████████▉                          | 5234/8080 [1:21:55<1:14:54,  1.58s/it]
 65%|███████████████████████████████████████████████▉                          | 5235/8080 [1:21:56<1:11:40,  1.51s/it]
 65%|███████████████████████████████████████████████▉                          | 5236/8080 [1:21:58<1:07:51,  1.43s/it]
 65%|███████████████████████████████████████████████▉                          | 5237/8080 [1:22:00<1:15:27,  1.59s/it]
 65%|███████████████████████████████████████████████▉                          | 5238/8080 [1:22:00<1:02:26,  1.32s/it]
 65%|█████████████████████████████████████████████████▎                          | 5239/8080 [1:22:01<48:54,  1.03s/it]
 65%|███████████████████████████████████

 66%|█████████████████████████████████████████████████▊                          | 5301/8080 [1:22:55<39:48,  1.16it/s]
 66%|████████████████████████████████████████████████▌                         | 5302/8080 [1:22:58<1:06:25,  1.43s/it]
 66%|█████████████████████████████████████████████████▉                          | 5303/8080 [1:22:59<51:32,  1.11s/it]
 66%|█████████████████████████████████████████████████▉                          | 5304/8080 [1:23:00<59:08,  1.28s/it]
 66%|████████████████████████████████████████████████▌                         | 5305/8080 [1:23:02<1:08:45,  1.49s/it]
 66%|█████████████████████████████████████████████████▉                          | 5306/8080 [1:23:03<58:17,  1.26s/it]
 66%|█████████████████████████████████████████████████▉                          | 5307/8080 [1:23:04<58:08,  1.26s/it]
 66%|████████████████████████████████████████████████▌                         | 5308/8080 [1:23:07<1:16:53,  1.66s/it]
 66%|███████████████████████████████████

 66%|██████████████████████████████████████████████████▌                         | 5371/8080 [1:24:12<41:29,  1.09it/s]
 66%|██████████████████████████████████████████████████▌                         | 5372/8080 [1:24:12<32:00,  1.41it/s]
 67%|██████████████████████████████████████████████████▌                         | 5374/8080 [1:24:14<32:53,  1.37it/s]
 67%|█████████████████████████████████████████████████▏                        | 5375/8080 [1:24:17<1:00:24,  1.34s/it]
 67%|██████████████████████████████████████████████████▌                         | 5376/8080 [1:24:18<58:11,  1.29s/it]
 67%|██████████████████████████████████████████████████▌                         | 5377/8080 [1:24:18<49:58,  1.11s/it]
 67%|██████████████████████████████████████████████████▌                         | 5378/8080 [1:24:20<51:40,  1.15s/it]
 67%|██████████████████████████████████████████████████▌                         | 5380/8080 [1:24:21<42:16,  1.06it/s]
 67%|███████████████████████████████████

 67%|███████████████████████████████████████████████████▏                        | 5444/8080 [1:25:27<28:59,  1.52it/s]
 67%|███████████████████████████████████████████████████▏                        | 5445/8080 [1:25:28<29:44,  1.48it/s]
 67%|███████████████████████████████████████████████████▏                        | 5446/8080 [1:25:29<33:32,  1.31it/s]
 67%|███████████████████████████████████████████████████▏                        | 5447/8080 [1:25:29<31:30,  1.39it/s]
 67%|███████████████████████████████████████████████████▏                        | 5448/8080 [1:25:30<28:46,  1.52it/s]
 67%|███████████████████████████████████████████████████▎                        | 5449/8080 [1:25:30<24:51,  1.76it/s]
 67%|███████████████████████████████████████████████████▎                        | 5450/8080 [1:25:31<32:53,  1.33it/s]
 67%|███████████████████████████████████████████████████▎                        | 5451/8080 [1:25:33<47:14,  1.08s/it]
 67%|███████████████████████████████████

 68%|███████████████████████████████████████████████████▉                        | 5517/8080 [1:26:39<39:44,  1.07it/s]
 68%|███████████████████████████████████████████████████▉                        | 5518/8080 [1:26:40<40:25,  1.06it/s]
 68%|███████████████████████████████████████████████████▉                        | 5519/8080 [1:26:42<46:26,  1.09s/it]
 68%|███████████████████████████████████████████████████▉                        | 5520/8080 [1:26:42<36:58,  1.15it/s]
 68%|███████████████████████████████████████████████████▉                        | 5521/8080 [1:26:43<39:32,  1.08it/s]
 68%|███████████████████████████████████████████████████▉                        | 5522/8080 [1:26:44<35:44,  1.19it/s]
 68%|██████████████████████████████████████████████████▌                       | 5523/8080 [1:26:48<1:14:40,  1.75s/it]
 68%|███████████████████████████████████████████████████▉                        | 5524/8080 [1:26:48<57:27,  1.35s/it]
 68%|███████████████████████████████████

 69%|████████████████████████████████████████████████████▌                       | 5589/8080 [1:27:46<23:09,  1.79it/s]
 69%|████████████████████████████████████████████████████▌                       | 5590/8080 [1:27:47<20:05,  2.07it/s]
 69%|████████████████████████████████████████████████████▌                       | 5591/8080 [1:27:47<15:34,  2.66it/s]
 69%|████████████████████████████████████████████████████▌                       | 5592/8080 [1:27:47<15:52,  2.61it/s]
 69%|████████████████████████████████████████████████████▌                       | 5593/8080 [1:27:48<20:49,  1.99it/s]
 69%|████████████████████████████████████████████████████▌                       | 5594/8080 [1:27:51<47:04,  1.14s/it]
 69%|████████████████████████████████████████████████████▋                       | 5595/8080 [1:27:51<36:23,  1.14it/s]
 69%|████████████████████████████████████████████████████▋                       | 5596/8080 [1:27:51<30:36,  1.35it/s]
 69%|███████████████████████████████████

 70%|█████████████████████████████████████████████████████▏                      | 5658/8080 [1:29:10<57:09,  1.42s/it]
 70%|█████████████████████████████████████████████████████▏                      | 5659/8080 [1:29:11<59:00,  1.46s/it]
 70%|█████████████████████████████████████████████████████▏                      | 5660/8080 [1:29:11<45:04,  1.12s/it]
 70%|█████████████████████████████████████████████████████▏                      | 5661/8080 [1:29:12<39:58,  1.01it/s]
 70%|█████████████████████████████████████████████████████▎                      | 5662/8080 [1:29:13<36:20,  1.11it/s]
 70%|█████████████████████████████████████████████████████▎                      | 5663/8080 [1:29:13<28:49,  1.40it/s]
 70%|█████████████████████████████████████████████████████▎                      | 5664/8080 [1:29:13<23:19,  1.73it/s]
 70%|█████████████████████████████████████████████████████▎                      | 5665/8080 [1:29:14<28:38,  1.41it/s]
 70%|███████████████████████████████████

 71%|█████████████████████████████████████████████████████▊                      | 5727/8080 [1:30:14<44:18,  1.13s/it]
 71%|█████████████████████████████████████████████████████▉                      | 5728/8080 [1:30:15<40:03,  1.02s/it]
 71%|████████████████████████████████████████████████████▍                     | 5729/8080 [1:30:21<1:34:21,  2.41s/it]
 71%|████████████████████████████████████████████████████▍                     | 5730/8080 [1:30:23<1:34:54,  2.42s/it]
 71%|████████████████████████████████████████████████████▍                     | 5731/8080 [1:30:27<1:46:31,  2.72s/it]
 71%|████████████████████████████████████████████████████▍                     | 5732/8080 [1:30:27<1:21:43,  2.09s/it]
 71%|████████████████████████████████████████████████████▌                     | 5733/8080 [1:30:28<1:09:23,  1.77s/it]
 71%|█████████████████████████████████████████████████████▉                      | 5734/8080 [1:30:29<53:20,  1.36s/it]
 71%|███████████████████████████████████

 72%|██████████████████████████████████████████████████████▌                     | 5797/8080 [1:31:51<47:46,  1.26s/it]
 72%|██████████████████████████████████████████████████████▌                     | 5798/8080 [1:31:53<50:01,  1.32s/it]
 72%|█████████████████████████████████████████████████████                     | 5799/8080 [1:31:57<1:22:53,  2.18s/it]
 72%|█████████████████████████████████████████████████████                     | 5800/8080 [1:32:08<2:58:35,  4.70s/it]
 72%|█████████████████████████████████████████████████████▏                    | 5801/8080 [1:32:08<2:06:10,  3.32s/it]
 72%|█████████████████████████████████████████████████████▏                    | 5803/8080 [1:32:08<1:29:22,  2.35s/it]
 72%|█████████████████████████████████████████████████████▏                    | 5804/8080 [1:32:10<1:27:17,  2.30s/it]
 72%|█████████████████████████████████████████████████████▏                    | 5805/8080 [1:32:11<1:11:25,  1.88s/it]
 72%|███████████████████████████████████

 73%|█████████████████████████████████████████████████████▋                    | 5867/8080 [1:33:36<1:07:31,  1.83s/it]
 73%|███████████████████████████████████████████████████████▏                    | 5868/8080 [1:33:36<50:28,  1.37s/it]
 73%|███████████████████████████████████████████████████████▏                    | 5869/8080 [1:33:37<42:24,  1.15s/it]
 73%|███████████████████████████████████████████████████████▏                    | 5870/8080 [1:33:37<36:58,  1.00s/it]
 73%|███████████████████████████████████████████████████████▏                    | 5872/8080 [1:33:38<26:32,  1.39it/s]
 73%|███████████████████████████████████████████████████████▏                    | 5873/8080 [1:33:40<41:40,  1.13s/it]
 73%|███████████████████████████████████████████████████████▎                    | 5874/8080 [1:33:41<43:44,  1.19s/it]
 73%|███████████████████████████████████████████████████████▎                    | 5875/8080 [1:33:42<39:10,  1.07s/it]
 73%|███████████████████████████████████

 74%|███████████████████████████████████████████████████████▉                    | 5941/8080 [1:34:41<28:39,  1.24it/s]
 74%|███████████████████████████████████████████████████████▉                    | 5942/8080 [1:34:42<26:13,  1.36it/s]
 74%|███████████████████████████████████████████████████████▉                    | 5943/8080 [1:34:45<50:23,  1.41s/it]
 74%|███████████████████████████████████████████████████████▉                    | 5944/8080 [1:34:45<38:55,  1.09s/it]
 74%|███████████████████████████████████████████████████████▉                    | 5945/8080 [1:34:45<33:16,  1.07it/s]
 74%|███████████████████████████████████████████████████████▉                    | 5946/8080 [1:34:47<40:38,  1.14s/it]
 74%|███████████████████████████████████████████████████████▉                    | 5947/8080 [1:34:48<35:49,  1.01s/it]
 74%|███████████████████████████████████████████████████████▉                    | 5948/8080 [1:34:49<38:16,  1.08s/it]
 74%|███████████████████████████████████

 74%|████████████████████████████████████████████████████████▌                   | 6010/8080 [1:35:45<25:24,  1.36it/s]
 74%|████████████████████████████████████████████████████████▌                   | 6011/8080 [1:35:47<33:47,  1.02it/s]
 74%|████████████████████████████████████████████████████████▌                   | 6012/8080 [1:35:47<32:03,  1.08it/s]
 74%|████████████████████████████████████████████████████████▌                   | 6013/8080 [1:35:48<24:37,  1.40it/s]
 74%|████████████████████████████████████████████████████████▌                   | 6014/8080 [1:35:50<38:25,  1.12s/it]
 74%|████████████████████████████████████████████████████████▌                   | 6016/8080 [1:35:50<30:08,  1.14it/s]
 74%|███████████████████████████████████████████████████████                   | 6017/8080 [1:35:55<1:12:23,  2.11s/it]
 74%|████████████████████████████████████████████████████████▌                   | 6018/8080 [1:35:55<51:54,  1.51s/it]
 74%|███████████████████████████████████

 75%|█████████████████████████████████████████████████████████▏                  | 6080/8080 [1:36:55<42:32,  1.28s/it]
 75%|█████████████████████████████████████████████████████████▏                  | 6081/8080 [1:36:55<32:03,  1.04it/s]
 75%|█████████████████████████████████████████████████████████▏                  | 6082/8080 [1:36:56<28:29,  1.17it/s]
 75%|█████████████████████████████████████████████████████████▏                  | 6083/8080 [1:36:56<22:03,  1.51it/s]
 75%|█████████████████████████████████████████████████████████▏                  | 6084/8080 [1:36:57<22:33,  1.47it/s]
 75%|█████████████████████████████████████████████████████████▏                  | 6085/8080 [1:36:58<26:08,  1.27it/s]
 75%|█████████████████████████████████████████████████████████▏                  | 6086/8080 [1:36:58<21:52,  1.52it/s]
 75%|█████████████████████████████████████████████████████████▎                  | 6087/8080 [1:36:59<23:38,  1.40it/s]
 75%|███████████████████████████████████

 76%|█████████████████████████████████████████████████████████▊                  | 6152/8080 [1:38:02<27:46,  1.16it/s]
 76%|█████████████████████████████████████████████████████████▊                  | 6153/8080 [1:38:03<24:28,  1.31it/s]
 76%|█████████████████████████████████████████████████████████▉                  | 6154/8080 [1:38:04<32:53,  1.02s/it]
 76%|█████████████████████████████████████████████████████████▉                  | 6155/8080 [1:38:06<43:29,  1.36s/it]
 76%|█████████████████████████████████████████████████████████▉                  | 6156/8080 [1:38:07<33:46,  1.05s/it]
 76%|█████████████████████████████████████████████████████████▉                  | 6158/8080 [1:38:07<25:06,  1.28it/s]
 76%|█████████████████████████████████████████████████████████▉                  | 6159/8080 [1:38:08<27:03,  1.18it/s]
 76%|█████████████████████████████████████████████████████████▉                  | 6161/8080 [1:38:09<25:02,  1.28it/s]
 76%|███████████████████████████████████

 77%|██████████████████████████████████████████████████████████▌                 | 6222/8080 [1:39:13<22:53,  1.35it/s]
 77%|██████████████████████████████████████████████████████████▌                 | 6223/8080 [1:39:13<21:39,  1.43it/s]
 77%|██████████████████████████████████████████████████████████▌                 | 6224/8080 [1:39:14<18:40,  1.66it/s]
 77%|██████████████████████████████████████████████████████████▌                 | 6225/8080 [1:39:14<14:22,  2.15it/s]
 77%|██████████████████████████████████████████████████████████▌                 | 6226/8080 [1:39:15<20:01,  1.54it/s]
 77%|██████████████████████████████████████████████████████████▌                 | 6227/8080 [1:39:16<28:47,  1.07it/s]
 77%|██████████████████████████████████████████████████████████▌                 | 6228/8080 [1:39:18<38:15,  1.24s/it]
 77%|██████████████████████████████████████████████████████████▌                 | 6229/8080 [1:39:19<33:44,  1.09s/it]
 77%|███████████████████████████████████

 78%|███████████████████████████████████████████████████████████▏                | 6294/8080 [1:40:10<24:37,  1.21it/s]
 78%|███████████████████████████████████████████████████████████▏                | 6295/8080 [1:40:11<20:44,  1.43it/s]
 78%|███████████████████████████████████████████████████████████▏                | 6296/8080 [1:40:12<24:43,  1.20it/s]
 78%|███████████████████████████████████████████████████████████▏                | 6297/8080 [1:40:13<27:10,  1.09it/s]
 78%|███████████████████████████████████████████████████████████▏                | 6298/8080 [1:40:14<27:32,  1.08it/s]
 78%|███████████████████████████████████████████████████████████▏                | 6299/8080 [1:40:15<25:12,  1.18it/s]
 78%|███████████████████████████████████████████████████████████▎                | 6300/8080 [1:40:16<28:27,  1.04it/s]
 78%|███████████████████████████████████████████████████████████▎                | 6301/8080 [1:40:17<30:20,  1.02s/it]
 78%|███████████████████████████████████

 79%|███████████████████████████████████████████████████████████▊                | 6364/8080 [1:41:05<38:03,  1.33s/it]
 79%|███████████████████████████████████████████████████████████▊                | 6365/8080 [1:41:06<30:07,  1.05s/it]
 79%|███████████████████████████████████████████████████████████▉                | 6366/8080 [1:41:06<26:51,  1.06it/s]
 79%|███████████████████████████████████████████████████████████▉                | 6367/8080 [1:41:06<19:54,  1.43it/s]
 79%|███████████████████████████████████████████████████████████▉                | 6369/8080 [1:41:07<16:42,  1.71it/s]
 79%|███████████████████████████████████████████████████████████▉                | 6370/8080 [1:41:09<28:46,  1.01s/it]
 79%|███████████████████████████████████████████████████████████▉                | 6371/8080 [1:41:10<27:18,  1.04it/s]
 79%|███████████████████████████████████████████████████████████▉                | 6372/8080 [1:41:12<34:36,  1.22s/it]
 79%|███████████████████████████████████

 80%|████████████████████████████████████████████████████████████▌               | 6439/8080 [1:42:05<17:04,  1.60it/s]
 80%|████████████████████████████████████████████████████████████▌               | 6440/8080 [1:42:06<15:23,  1.78it/s]
 80%|████████████████████████████████████████████████████████████▌               | 6441/8080 [1:42:06<16:29,  1.66it/s]
 80%|████████████████████████████████████████████████████████████▌               | 6442/8080 [1:42:07<13:59,  1.95it/s]
 80%|████████████████████████████████████████████████████████████▌               | 6443/8080 [1:42:08<17:14,  1.58it/s]
 80%|████████████████████████████████████████████████████████████▌               | 6444/8080 [1:42:08<14:29,  1.88it/s]
 80%|████████████████████████████████████████████████████████████▌               | 6445/8080 [1:42:09<17:46,  1.53it/s]
 80%|████████████████████████████████████████████████████████████▋               | 6446/8080 [1:42:09<16:17,  1.67it/s]
 80%|███████████████████████████████████

 81%|█████████████████████████████████████████████████████████████▏              | 6507/8080 [1:43:27<32:35,  1.24s/it]
 81%|█████████████████████████████████████████████████████████████▏              | 6508/8080 [1:43:29<39:36,  1.51s/it]
 81%|█████████████████████████████████████████████████████████████▏              | 6509/8080 [1:43:30<32:46,  1.25s/it]
 81%|█████████████████████████████████████████████████████████████▏              | 6510/8080 [1:43:31<36:18,  1.39s/it]
 81%|█████████████████████████████████████████████████████████████▏              | 6511/8080 [1:43:32<31:10,  1.19s/it]
 81%|█████████████████████████████████████████████████████████████▎              | 6512/8080 [1:43:33<32:54,  1.26s/it]
 81%|█████████████████████████████████████████████████████████████▎              | 6513/8080 [1:43:34<24:52,  1.05it/s]
 81%|█████████████████████████████████████████████████████████████▎              | 6514/8080 [1:43:35<26:00,  1.00it/s]
 81%|███████████████████████████████████

 81%|█████████████████████████████████████████████████████████████▊              | 6578/8080 [1:44:38<20:17,  1.23it/s]
 81%|█████████████████████████████████████████████████████████████▉              | 6579/8080 [1:44:39<18:46,  1.33it/s]
 81%|█████████████████████████████████████████████████████████████▉              | 6580/8080 [1:44:40<20:47,  1.20it/s]
 81%|█████████████████████████████████████████████████████████████▉              | 6581/8080 [1:44:41<17:26,  1.43it/s]
 81%|█████████████████████████████████████████████████████████████▉              | 6582/8080 [1:44:42<21:34,  1.16it/s]
 81%|█████████████████████████████████████████████████████████████▉              | 6583/8080 [1:44:43<21:52,  1.14it/s]
 81%|█████████████████████████████████████████████████████████████▉              | 6584/8080 [1:44:45<29:59,  1.20s/it]
 81%|█████████████████████████████████████████████████████████████▉              | 6585/8080 [1:44:46<27:33,  1.11s/it]
 82%|███████████████████████████████████

 82%|██████████████████████████████████████████████████████████████▌             | 6647/8080 [1:45:57<28:13,  1.18s/it]
 82%|██████████████████████████████████████████████████████████████▌             | 6648/8080 [1:45:58<23:28,  1.02it/s]
 82%|██████████████████████████████████████████████████████████████▌             | 6649/8080 [1:45:58<20:55,  1.14it/s]
 82%|██████████████████████████████████████████████████████████████▌             | 6650/8080 [1:45:59<16:50,  1.41it/s]
 82%|██████████████████████████████████████████████████████████████▌             | 6651/8080 [1:45:59<16:01,  1.49it/s]
 82%|██████████████████████████████████████████████████████████████▌             | 6652/8080 [1:46:00<15:25,  1.54it/s]
 82%|██████████████████████████████████████████████████████████████▌             | 6653/8080 [1:46:02<23:16,  1.02it/s]
 82%|██████████████████████████████████████████████████████████████▌             | 6654/8080 [1:46:04<34:50,  1.47s/it]
 82%|███████████████████████████████████

 83%|███████████████████████████████████████████████████████████████▏            | 6716/8080 [1:47:10<23:28,  1.03s/it]
 83%|███████████████████████████████████████████████████████████████▏            | 6717/8080 [1:47:10<21:41,  1.05it/s]
 83%|███████████████████████████████████████████████████████████████▏            | 6718/8080 [1:47:11<20:27,  1.11it/s]
 83%|███████████████████████████████████████████████████████████████▏            | 6719/8080 [1:47:14<35:16,  1.55s/it]
 83%|███████████████████████████████████████████████████████████████▏            | 6721/8080 [1:47:14<25:17,  1.12s/it]
 83%|███████████████████████████████████████████████████████████████▏            | 6722/8080 [1:47:15<19:17,  1.17it/s]
 83%|███████████████████████████████████████████████████████████████▏            | 6723/8080 [1:47:15<17:07,  1.32it/s]
 83%|███████████████████████████████████████████████████████████████▏            | 6724/8080 [1:47:17<24:10,  1.07s/it]
 83%|███████████████████████████████████

 84%|██████████████████████████████████████████████████████████████▏           | 6790/8080 [1:48:27<1:04:28,  3.00s/it]
 84%|███████████████████████████████████████████████████████████████▉            | 6791/8080 [1:48:29<59:45,  2.78s/it]
 84%|██████████████████████████████████████████████████████████████▏           | 6792/8080 [1:48:32<1:01:04,  2.84s/it]
 84%|███████████████████████████████████████████████████████████████▉            | 6793/8080 [1:48:33<49:12,  2.29s/it]
 84%|███████████████████████████████████████████████████████████████▉            | 6794/8080 [1:48:33<37:13,  1.74s/it]
 84%|███████████████████████████████████████████████████████████████▉            | 6795/8080 [1:48:34<30:22,  1.42s/it]
 84%|███████████████████████████████████████████████████████████████▉            | 6797/8080 [1:48:34<22:30,  1.05s/it]
 84%|███████████████████████████████████████████████████████████████▉            | 6798/8080 [1:48:35<21:04,  1.01it/s]
 84%|███████████████████████████████████

 85%|████████████████████████████████████████████████████████████████▌           | 6862/8080 [1:49:15<10:30,  1.93it/s]
 85%|████████████████████████████████████████████████████████████████▌           | 6863/8080 [1:49:16<15:08,  1.34it/s]
 85%|████████████████████████████████████████████████████████████████▌           | 6864/8080 [1:49:17<15:09,  1.34it/s]
 85%|████████████████████████████████████████████████████████████████▌           | 6865/8080 [1:49:22<43:56,  2.17s/it]
 85%|████████████████████████████████████████████████████████████████▌           | 6866/8080 [1:49:22<31:21,  1.55s/it]
 85%|████████████████████████████████████████████████████████████████▌           | 6868/8080 [1:49:25<31:16,  1.55s/it]
 85%|████████████████████████████████████████████████████████████████▌           | 6869/8080 [1:49:26<23:26,  1.16s/it]
 85%|████████████████████████████████████████████████████████████████▌           | 6870/8080 [1:49:26<20:14,  1.00s/it]
 85%|███████████████████████████████████

 86%|█████████████████████████████████████████████████████████████████▏          | 6935/8080 [1:50:24<15:05,  1.26it/s]
 86%|█████████████████████████████████████████████████████████████████▏          | 6936/8080 [1:50:24<12:04,  1.58it/s]
 86%|█████████████████████████████████████████████████████████████████▏          | 6937/8080 [1:50:24<09:41,  1.97it/s]
 86%|█████████████████████████████████████████████████████████████████▎          | 6939/8080 [1:50:25<09:27,  2.01it/s]
 86%|█████████████████████████████████████████████████████████████████▎          | 6940/8080 [1:50:26<08:45,  2.17it/s]
 86%|█████████████████████████████████████████████████████████████████▎          | 6941/8080 [1:50:26<07:55,  2.40it/s]
 86%|█████████████████████████████████████████████████████████████████▎          | 6942/8080 [1:50:27<09:43,  1.95it/s]
 86%|█████████████████████████████████████████████████████████████████▎          | 6943/8080 [1:50:27<10:32,  1.80it/s]
 86%|███████████████████████████████████

 87%|█████████████████████████████████████████████████████████████████▉          | 7006/8080 [1:51:33<23:40,  1.32s/it]
 87%|█████████████████████████████████████████████████████████████████▉          | 7007/8080 [1:51:35<28:19,  1.58s/it]
 87%|█████████████████████████████████████████████████████████████████▉          | 7008/8080 [1:51:37<29:48,  1.67s/it]
 87%|█████████████████████████████████████████████████████████████████▉          | 7009/8080 [1:51:37<24:55,  1.40s/it]
 87%|█████████████████████████████████████████████████████████████████▉          | 7010/8080 [1:51:38<21:07,  1.18s/it]
 87%|█████████████████████████████████████████████████████████████████▉          | 7011/8080 [1:51:39<21:07,  1.19s/it]
 87%|█████████████████████████████████████████████████████████████████▉          | 7013/8080 [1:51:40<15:45,  1.13it/s]
 87%|█████████████████████████████████████████████████████████████████▉          | 7015/8080 [1:51:40<11:32,  1.54it/s]
 87%|███████████████████████████████████

 88%|██████████████████████████████████████████████████████████████████▌         | 7078/8080 [1:52:50<14:47,  1.13it/s]
 88%|██████████████████████████████████████████████████████████████████▌         | 7079/8080 [1:52:51<13:55,  1.20it/s]
 88%|██████████████████████████████████████████████████████████████████▌         | 7080/8080 [1:52:51<11:28,  1.45it/s]
 88%|██████████████████████████████████████████████████████████████████▌         | 7081/8080 [1:52:51<09:32,  1.74it/s]
 88%|██████████████████████████████████████████████████████████████████▌         | 7082/8080 [1:52:52<09:47,  1.70it/s]
 88%|██████████████████████████████████████████████████████████████████▌         | 7083/8080 [1:52:52<09:01,  1.84it/s]
 88%|██████████████████████████████████████████████████████████████████▋         | 7084/8080 [1:52:53<07:59,  2.08it/s]
 88%|██████████████████████████████████████████████████████████████████▋         | 7085/8080 [1:52:53<08:12,  2.02it/s]
 88%|███████████████████████████████████

 88%|███████████████████████████████████████████████████████████████████▏        | 7146/8080 [1:53:40<08:26,  1.85it/s]
 88%|███████████████████████████████████████████████████████████████████▏        | 7147/8080 [1:53:41<07:46,  2.00it/s]
 88%|███████████████████████████████████████████████████████████████████▏        | 7148/8080 [1:53:41<05:56,  2.61it/s]
 88%|███████████████████████████████████████████████████████████████████▏        | 7149/8080 [1:53:43<13:53,  1.12it/s]
 89%|███████████████████████████████████████████████████████████████████▎        | 7151/8080 [1:53:43<10:27,  1.48it/s]
 89%|███████████████████████████████████████████████████████████████████▎        | 7152/8080 [1:53:45<13:23,  1.15it/s]
 89%|███████████████████████████████████████████████████████████████████▎        | 7153/8080 [1:53:45<10:52,  1.42it/s]
 89%|███████████████████████████████████████████████████████████████████▎        | 7154/8080 [1:53:48<20:24,  1.32s/it]
 89%|███████████████████████████████████

 89%|███████████████████████████████████████████████████████████████████▉        | 7218/8080 [1:54:54<09:38,  1.49it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7219/8080 [1:54:56<12:37,  1.14it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7220/8080 [1:54:56<09:40,  1.48it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7221/8080 [1:54:56<07:25,  1.93it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7222/8080 [1:54:56<07:15,  1.97it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7223/8080 [1:54:57<05:42,  2.50it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7224/8080 [1:54:58<08:51,  1.61it/s]
 89%|███████████████████████████████████████████████████████████████████▉        | 7225/8080 [1:55:01<20:36,  1.45s/it]
 89%|███████████████████████████████████

 90%|████████████████████████████████████████████████████████████████████▌       | 7292/8080 [1:55:59<12:49,  1.02it/s]
 90%|████████████████████████████████████████████████████████████████████▌       | 7293/8080 [1:56:00<10:50,  1.21it/s]
 90%|████████████████████████████████████████████████████████████████████▌       | 7295/8080 [1:56:00<07:58,  1.64it/s]
 90%|████████████████████████████████████████████████████████████████████▋       | 7296/8080 [1:56:01<10:34,  1.24it/s]
 90%|████████████████████████████████████████████████████████████████████▋       | 7297/8080 [1:56:02<11:59,  1.09it/s]
 90%|████████████████████████████████████████████████████████████████████▋       | 7298/8080 [1:56:03<10:18,  1.26it/s]
 90%|████████████████████████████████████████████████████████████████████▋       | 7299/8080 [1:56:03<08:19,  1.56it/s]
 90%|████████████████████████████████████████████████████████████████████▋       | 7300/8080 [1:56:04<09:35,  1.36it/s]
 90%|███████████████████████████████████

 91%|█████████████████████████████████████████████████████████████████████▎      | 7367/8080 [1:57:07<08:11,  1.45it/s]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7368/8080 [1:57:08<07:47,  1.52it/s]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7369/8080 [1:57:12<20:15,  1.71s/it]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7370/8080 [1:57:13<18:13,  1.54s/it]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7371/8080 [1:57:15<18:28,  1.56s/it]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7372/8080 [1:57:15<14:24,  1.22s/it]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7373/8080 [1:57:19<24:41,  2.10s/it]
 91%|█████████████████████████████████████████████████████████████████████▎      | 7374/8080 [1:57:20<21:15,  1.81s/it]
 91%|███████████████████████████████████

 92%|█████████████████████████████████████████████████████████████████████▉      | 7441/8080 [1:58:18<14:37,  1.37s/it]
 92%|█████████████████████████████████████████████████████████████████████▉      | 7442/8080 [1:58:18<10:36,  1.00it/s]
 92%|██████████████████████████████████████████████████████████████████████      | 7443/8080 [1:58:18<08:09,  1.30it/s]
 92%|██████████████████████████████████████████████████████████████████████      | 7444/8080 [1:58:19<06:37,  1.60it/s]
 92%|██████████████████████████████████████████████████████████████████████      | 7445/8080 [1:58:20<07:16,  1.45it/s]
 92%|██████████████████████████████████████████████████████████████████████      | 7446/8080 [1:58:21<09:07,  1.16it/s]
 92%|██████████████████████████████████████████████████████████████████████      | 7447/8080 [1:58:22<09:01,  1.17it/s]
 92%|██████████████████████████████████████████████████████████████████████      | 7448/8080 [1:58:22<07:45,  1.36it/s]
 92%|███████████████████████████████████

 93%|██████████████████████████████████████████████████████████████████████▋     | 7510/8080 [1:59:26<10:53,  1.15s/it]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7511/8080 [1:59:26<09:26,  1.01it/s]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7512/8080 [1:59:27<09:06,  1.04it/s]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7513/8080 [1:59:28<07:43,  1.22it/s]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7514/8080 [1:59:28<07:03,  1.33it/s]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7515/8080 [1:59:30<10:09,  1.08s/it]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7516/8080 [1:59:31<09:54,  1.05s/it]
 93%|██████████████████████████████████████████████████████████████████████▋     | 7517/8080 [1:59:31<07:13,  1.30it/s]
 93%|███████████████████████████████████

 94%|███████████████████████████████████████████████████████████████████████▎    | 7584/8080 [2:00:35<14:23,  1.74s/it]
 94%|███████████████████████████████████████████████████████████████████████▎    | 7585/8080 [2:00:35<11:45,  1.43s/it]
 94%|███████████████████████████████████████████████████████████████████████▎    | 7586/8080 [2:00:36<08:50,  1.07s/it]
 94%|███████████████████████████████████████████████████████████████████████▎    | 7587/8080 [2:00:37<08:37,  1.05s/it]
 94%|███████████████████████████████████████████████████████████████████████▎    | 7588/8080 [2:00:37<07:41,  1.07it/s]
 94%|███████████████████████████████████████████████████████████████████████▍    | 7589/8080 [2:00:38<07:04,  1.16it/s]
 94%|███████████████████████████████████████████████████████████████████████▍    | 7590/8080 [2:00:39<07:48,  1.05it/s]
 94%|███████████████████████████████████████████████████████████████████████▍    | 7591/8080 [2:00:40<06:58,  1.17it/s]
 94%|███████████████████████████████████

 95%|███████████████████████████████████████████████████████████████████████▉    | 7653/8080 [2:01:41<10:59,  1.55s/it]
 95%|███████████████████████████████████████████████████████████████████████▉    | 7654/8080 [2:01:43<10:44,  1.51s/it]
 95%|████████████████████████████████████████████████████████████████████████    | 7655/8080 [2:01:43<08:31,  1.20s/it]
 95%|████████████████████████████████████████████████████████████████████████    | 7656/8080 [2:01:44<07:59,  1.13s/it]
 95%|████████████████████████████████████████████████████████████████████████    | 7657/8080 [2:01:48<12:46,  1.81s/it]
 95%|████████████████████████████████████████████████████████████████████████    | 7658/8080 [2:01:48<09:18,  1.32s/it]
 95%|████████████████████████████████████████████████████████████████████████    | 7659/8080 [2:01:49<08:00,  1.14s/it]
 95%|████████████████████████████████████████████████████████████████████████    | 7660/8080 [2:01:49<06:10,  1.13it/s]
 95%|███████████████████████████████████

 96%|████████████████████████████████████████████████████████████████████████▋   | 7725/8080 [2:02:36<05:56,  1.00s/it]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7727/8080 [2:02:36<04:14,  1.39it/s]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7728/8080 [2:02:36<03:25,  1.72it/s]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7729/8080 [2:02:37<03:49,  1.53it/s]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7730/8080 [2:02:37<03:34,  1.63it/s]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7731/8080 [2:02:39<04:55,  1.18it/s]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7732/8080 [2:02:39<04:22,  1.33it/s]
 96%|████████████████████████████████████████████████████████████████████████▋   | 7733/8080 [2:02:41<06:53,  1.19s/it]
 96%|███████████████████████████████████

 96%|█████████████████████████████████████████████████████████████████████████▎  | 7795/8080 [2:03:38<03:18,  1.44it/s]
 96%|█████████████████████████████████████████████████████████████████████████▎  | 7796/8080 [2:03:38<02:41,  1.76it/s]
 96%|█████████████████████████████████████████████████████████████████████████▎  | 7797/8080 [2:03:39<02:04,  2.28it/s]
 97%|█████████████████████████████████████████████████████████████████████████▎  | 7798/8080 [2:03:39<02:07,  2.21it/s]
 97%|█████████████████████████████████████████████████████████████████████████▎  | 7799/8080 [2:03:39<02:02,  2.30it/s]
 97%|█████████████████████████████████████████████████████████████████████████▎  | 7800/8080 [2:03:40<01:46,  2.63it/s]
 97%|█████████████████████████████████████████████████████████████████████████▍  | 7801/8080 [2:03:40<01:25,  3.26it/s]
 97%|█████████████████████████████████████████████████████████████████████████▍  | 7803/8080 [2:03:40<01:26,  3.21it/s]
 97%|███████████████████████████████████

 97%|█████████████████████████████████████████████████████████████████████████▉  | 7866/8080 [2:04:26<03:40,  1.03s/it]
 97%|█████████████████████████████████████████████████████████████████████████▉  | 7867/8080 [2:04:26<02:58,  1.19it/s]
 97%|██████████████████████████████████████████████████████████████████████████  | 7868/8080 [2:04:27<03:14,  1.09it/s]
 97%|██████████████████████████████████████████████████████████████████████████  | 7869/8080 [2:04:29<04:05,  1.16s/it]
 97%|██████████████████████████████████████████████████████████████████████████  | 7870/8080 [2:04:32<05:40,  1.62s/it]
 97%|██████████████████████████████████████████████████████████████████████████  | 7871/8080 [2:04:33<04:38,  1.33s/it]
 97%|██████████████████████████████████████████████████████████████████████████  | 7872/8080 [2:04:38<08:25,  2.43s/it]
 97%|██████████████████████████████████████████████████████████████████████████  | 7873/8080 [2:04:38<06:45,  1.96s/it]
 97%|███████████████████████████████████

 98%|██████████████████████████████████████████████████████████████████████████▋ | 7939/8080 [2:06:05<03:03,  1.30s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7940/8080 [2:06:06<02:48,  1.21s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7941/8080 [2:06:07<02:59,  1.29s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7942/8080 [2:06:09<03:01,  1.31s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7943/8080 [2:06:12<04:24,  1.93s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7944/8080 [2:06:13<03:38,  1.61s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7945/8080 [2:06:14<03:21,  1.49s/it]
 98%|██████████████████████████████████████████████████████████████████████████▋ | 7946/8080 [2:06:14<02:31,  1.13s/it]
 98%|███████████████████████████████████

 99%|███████████████████████████████████████████████████████████████████████████▎| 8009/8080 [2:07:10<01:06,  1.07it/s]
 99%|███████████████████████████████████████████████████████████████████████████▎| 8010/8080 [2:07:11<00:48,  1.45it/s]
 99%|███████████████████████████████████████████████████████████████████████████▎| 8011/8080 [2:07:11<00:43,  1.57it/s]
 99%|███████████████████████████████████████████████████████████████████████████▎| 8013/8080 [2:07:11<00:32,  2.06it/s]
 99%|███████████████████████████████████████████████████████████████████████████▍| 8014/8080 [2:07:12<00:35,  1.88it/s]
 99%|███████████████████████████████████████████████████████████████████████████▍| 8015/8080 [2:07:12<00:28,  2.30it/s]
 99%|███████████████████████████████████████████████████████████████████████████▍| 8016/8080 [2:07:12<00:24,  2.60it/s]
 99%|███████████████████████████████████████████████████████████████████████████▍| 8018/8080 [2:07:14<00:27,  2.28it/s]
 99%|███████████████████████████████████

opinion lexicon


In [111]:
feature_train = pd.DataFrame(feature_train)

In [None]:
pd.DataFrame(lab, columns = label_list)

In [122]:
dia_train[0]

['Like the subject tells you, whenever I log into skype it keeps blocking my contacts. I have to unblock them atleast twice a day. Not every contact is getting blocked only my two best friends.  How can I fix this issue, since its starting to annoy me.  Thanks',
 "Hi Tammy,  Welcome to Skype Community!  What version of Skype are you using, is it the Skype for Windows 10 version or the classic Skype for Windows desktop version?  If you are using the Skype for Windows 10 version, please test if the issue will be similar when you're using the classic version. The classic Skype for Windows desktop version can be downloaded at this link: Click here.  I am looking forward to your response.  Regards,",
 "Hi again,  I have tried using classic skype for a little more than a day and the problem haven't appeared yet. Hopefully it's fixed at the moment.  I will reply if the problem starts to appear again.   Thanks for the help.",
 ' Hi, tonight 13 September, it happened again. Classic version, I t

In [121]:
utter_train[:10]

['Like the subject tells you, whenever I log into skype it keeps blocking my contacts. I have to unblock them atleast twice a day. Not every contact is getting blocked only my two best friends.  How can I fix this issue, since its starting to annoy me.  Thanks',
 "Hi Tammy,  Welcome to Skype Community!  What version of Skype are you using, is it the Skype for Windows 10 version or the classic Skype for Windows desktop version?  If you are using the Skype for Windows 10 version, please test if the issue will be similar when you're using the classic version. The classic Skype for Windows desktop version can be downloaded at this link: Click here.  I am looking forward to your response.  Regards,",
 "Hi again,  I have tried using classic skype for a little more than a day and the problem haven't appeared yet. Hopefully it's fixed at the moment.  I will reply if the problem starts to appear again.   Thanks for the help.",
 ' Hi, tonight 13 September, it happened again. Classic version, I t

In [123]:
feature_train.to_csv('data/x_train.csv', index=None)
pd.DataFrame(preprocess(lab_train), columns = label_list).to_csv('data/y_train.csv', index=None)
feature_valid.to_csv('data/x_val.csv', index=None)
pd.DataFrame(preprocess(lab_valid), columns = label_list).to_csv('data/y_val.csv', index=None)
feature_test.to_csv('data/x_test.csv', index=None)
pd.DataFrame(preprocess(lab_test), columns = label_list).to_csv('data/y_test.csv', index=None)

# Content features

In [171]:
# Initial Utterance Similarity
initial_utter_similarity = []
pos = []
count = 1

for i, dialog in enumerate(dialogs):
    vec1 = text_to_vector(dialog[0])
    count = 1
    for u in dialog:
        pos.append(count)
        count += 1
        vec2 = text_to_vector(u)
        initial_utter_similarity.append(get_cosine(vec1, vec2))
        
data_1 = {'utterance': utter, 'utterance_pos': pos, 'consine_similarity': initial_utter_similarity}
df_1 = pd.DataFrame(data_1)
df_1.to_csv(r'CONTENT_initial_utter_similarity.csv', index=False)
df_1.head()

Unnamed: 0,utterance,utterance_pos,consine_similarity
0,"hi joydeep sir getting error on event viewer ,...",1,1.0
1,Windows Content Delivery Manager would relate ...,2,0.069993
2,hi joydeep sir my issues resolved.thnks a lot.,3,0.147442
3,I had a couple of problems and contacted Micro...,1,1.0
4,Thank you for posting in Microsoft Community. ...,2,0.364363


In [172]:
# Dialog Similarity
dialog_similarity = []

for i,dialog in enumerate(dialogs):
    vec1 = text_to_vector(''.join(dialog))
    for u in dialog:
        vec2 = text_to_vector(u)
        dialog_similarity.append(get_cosine(vec1, vec2))
        
data_2 = {'utterance': utter, 'consine_similarity': dialog_similarity}
df_2 = pd.DataFrame(data_2)
df_2.to_csv(r'CONTENT_dialog_similarity.csv', index=False)
df_2.head()

Unnamed: 0,utterance,consine_similarity
0,"hi joydeep sir getting error on event viewer ,...",0.655034
1,Windows Content Delivery Manager would relate ...,0.750313
2,hi joydeep sir my issues resolved.thnks a lot.,0.313264
3,I had a couple of problems and contacted Micro...,0.555694
4,Thank you for posting in Microsoft Community. ...,0.946031


In [173]:
# Question Mark
question_mark = []

for i in range(len(utter)):
    has_question_mark = '?' in utter[i]
    question_mark.append(has_question_mark)

data_3 = {'utterance': utter, 'question_mark': question_mark}
df_3 = pd.DataFrame(data_3)
df_3.to_csv(r'CONTENT_question_mark.csv', index=False)
df_3.head()

Unnamed: 0,utterance,question_mark
0,"hi joydeep sir getting error on event viewer ,...",False
1,Windows Content Delivery Manager would relate ...,False
2,hi joydeep sir my issues resolved.thnks a lot.,False
3,I had a couple of problems and contacted Micro...,False
4,Thank you for posting in Microsoft Community. ...,False


In [174]:
# Duplicate
duplicate = []

for i in range(len(utter)):
    has_duplicate = 'same' in utter[i].lower() or 'similar' in utter[i].lower()
    duplicate.append(has_duplicate)
    
data_4 = {'utterance': utter, 'duplicate': duplicate}
df_4 = pd.DataFrame(data_4)
df_4.to_csv(r'CONTENT_duplicate.csv', index=False)
df_4.head()

Unnamed: 0,utterance,duplicate
0,"hi joydeep sir getting error on event viewer ,...",False
1,Windows Content Delivery Manager would relate ...,False
2,hi joydeep sir my issues resolved.thnks a lot.,False
3,I had a couple of problems and contacted Micro...,False
4,Thank you for posting in Microsoft Community. ...,False


In [175]:
# 5W1H
w_h = []

for i in range(len(utter)):
    one_hot = [0, 0, 0, 0, 0, 0]
    if 'what' in utter[i]:
        one_hot[0] = 1
    if 'where' in utter[i]:
        one_hot[1] = 1
    if 'when' in utter[i]:
        one_hot[2] = 1
    if 'why' in utter[i]:
        one_hot[3] = 1
    if 'who' in utter[i]:
        one_hot[4] = 1
    if 'how' in utter[i]:
        one_hot[5] = 1
    w_h.append(one_hot)
    
data_5 = {'utterance': utter, '5W1H': w_h}
df_5 = pd.DataFrame(data_5)
df_5.to_csv(r'CONTENT_5W_1H.csv', index=False)
df_5.head()

Unnamed: 0,utterance,5W1H
0,"hi joydeep sir getting error on event viewer ,...","[0, 0, 0, 0, 0, 0]"
1,Windows Content Delivery Manager would relate ...,"[0, 0, 0, 0, 0, 0]"
2,hi joydeep sir my issues resolved.thnks a lot.,"[0, 0, 0, 0, 0, 0]"
3,I had a couple of problems and contacted Micro...,"[0, 1, 1, 0, 1, 0]"
4,Thank you for posting in Microsoft Community. ...,"[0, 1, 0, 0, 0, 0]"


# Structual features

In [176]:
# Absolute Position
abs_pos = []
count = 1

for i, dialog in enumerate(dialogs):
    count = 1
    for u in dialog:
        abs_pos.append(count)
        count += 1
        
data_6 = {'utterance': utter, 'absolute_pos': abs_pos}
df_6 = pd.DataFrame(data_6)
df_6.to_csv(r'STRUC_absolute_position.csv', index=False)
df_6.head()

Unnamed: 0,utterance,absolute_pos
0,"hi joydeep sir getting error on event viewer ,...",1
1,Windows Content Delivery Manager would relate ...,2
2,hi joydeep sir my issues resolved.thnks a lot.,3
3,I had a couple of problems and contacted Micro...,1
4,Thank you for posting in Microsoft Community. ...,2


In [177]:
# Normalized Position
norm_pos = []
count = 1

for i, dialog in enumerate(dialogs):
    count = 1
    for u in dialog:
        norm_pos.append(count/len(dialog))
        count += 1
        
data_7 = {'utterance': utter, 'norm_pos': norm_pos}
df_7 = pd.DataFrame(data_7)
df_7.to_csv(r'STRUC_normalized_position.csv', index=False)
df_7.head()

Unnamed: 0,utterance,norm_pos
0,"hi joydeep sir getting error on event viewer ,...",0.333333
1,Windows Content Delivery Manager would relate ...,0.666667
2,hi joydeep sir my issues resolved.thnks a lot.,1.0
3,I had a couple of problems and contacted Micro...,0.2
4,Thank you for posting in Microsoft Community. ...,0.4


In [178]:
# Utterance Length
utter_len = []

for u in utter_without_sw:
    u_without_punctuation = re.sub(r'[^\w\s]','',u)
    utter_len.append(len(u_without_punctuation))

data_8 = {'utterance': utter, 'utter_len': utter_len}
df_8 = pd.DataFrame(data_8)
df_8.to_csv(r'STRUC_utterance_length.csv', index=False)
df_8.head()

Unnamed: 0,utterance,utter_len
0,"hi joydeep sir getting error on event viewer ,...",136
1,Windows Content Delivery Manager would relate ...,392
2,hi joydeep sir my issues resolved.thnks a lot.,40
3,I had a couple of problems and contacted Micro...,375
4,Thank you for posting in Microsoft Community. ...,1563


In [179]:
# Utterance Length Unique
utter_len_unique = []

for u in utter_without_sw:
    u_without_punctuation = re.sub(r'[^\w\s]','',u)
    utter_len_unique.append(len(set(word_tokenize(u_without_punctuation.lower()))))

data_9 = {'utterance': utter, 'utter_len_unique': utter_len_unique}
df_9 = pd.DataFrame(data_9)
df_9.to_csv(r'STRUC_utterance_length_unique.csv', index=False)
df_9.head()

Unnamed: 0,utterance,utter_len_unique
0,"hi joydeep sir getting error on event viewer ,...",23
1,Windows Content Delivery Manager would relate ...,41
2,hi joydeep sir my issues resolved.thnks a lot.,6
3,I had a couple of problems and contacted Micro...,43
4,Thank you for posting in Microsoft Community. ...,132


In [180]:
# Utterance Length Stemmed Unique
utter_len_stemmed_unique = []

for u in utter_without_sw_stem:
    u_without_punctuation = re.sub(r'[^\w\s]','',u)
    utter_len_stemmed_unique.append(len(set(word_tokenize(u_without_punctuation.lower()))))

data_10 = {'utterance': utter, 'utter_len_unique': utter_len_stemmed_unique}
df_10 = pd.DataFrame(data_10)
df_10.to_csv(r'STRUC_utterance_length_stemmed_unique.csv', index=False)
df_10.head()

Unnamed: 0,utterance,utter_len_unique
0,"hi joydeep sir getting error on event viewer ,...",23
1,Windows Content Delivery Manager would relate ...,41
2,hi joydeep sir my issues resolved.thnks a lot.,6
3,I had a couple of problems and contacted Micro...,41
4,Thank you for posting in Microsoft Community. ...,126


In [181]:
# Is Starter
data_11 = {'utterance': utter, 'is_starter': is_user}
df_11 = pd.DataFrame(data_11)
df_11.to_csv(r'STRUC_is_starter.csv', index=False)
df_11.head()

Unnamed: 0,utterance,is_starter
0,"hi joydeep sir getting error on event viewer ,...",True
1,Windows Content Delivery Manager would relate ...,False
2,hi joydeep sir my issues resolved.thnks a lot.,True
3,I had a couple of problems and contacted Micro...,True
4,Thank you for posting in Microsoft Community. ...,False


# Sentiment features

In [182]:
# Thank
thank = []

for i in range(len(utter)):
    has_thank = 'thank' in utter[i].lower()
    thank.append(has_thank)

data_12 = {'utterance': utter, 'contain_thank': thank}
df_12 = pd.DataFrame(data_12)
df_12.to_csv(r'SENTI_thank.csv', index=False)
df_12.head()

Unnamed: 0,utterance,contain_thank
0,"hi joydeep sir getting error on event viewer ,...",False
1,Windows Content Delivery Manager would relate ...,False
2,hi joydeep sir my issues resolved.thnks a lot.,False
3,I had a couple of problems and contacted Micro...,False
4,Thank you for posting in Microsoft Community. ...,True


In [183]:
# Exclamation Mark
exclamation_mark = []

for i in range(len(utter)):
    has_exclamation_mark = '!' in utter[i]
    exclamation_mark.append(has_exclamation_mark)

data_13 = {'utterance': utter, 'exclamation_mark': exclamation_mark}
df_13 = pd.DataFrame(data_13)
df_13.to_csv(r'SENTI_exclamation_mark.csv', index=False)
df_13.head()

Unnamed: 0,utterance,exclamation_mark
0,"hi joydeep sir getting error on event viewer ,...",False
1,Windows Content Delivery Manager would relate ...,False
2,hi joydeep sir my issues resolved.thnks a lot.,False
3,I had a couple of problems and contacted Micro...,False
4,Thank you for posting in Microsoft Community. ...,False


In [184]:
# Feedback
feedback = []

for i in range(len(utter)):
    has_feedback = 'did not' in utter[i].lower() or 'does not' in utter[i].lower()
    feedback.append(has_feedback)
    
data_14 = {'utterance': utter, 'feedback': feedback}
df_14 = pd.DataFrame(data_14)
df_14.to_csv(r'SENTI_feedback.csv', index=False)
df_14.head()

Unnamed: 0,utterance,feedback
0,"hi joydeep sir getting error on event viewer ,...",False
1,Windows Content Delivery Manager would relate ...,False
2,hi joydeep sir my issues resolved.thnks a lot.,False
3,I had a couple of problems and contacted Micro...,False
4,Thank you for posting in Microsoft Community. ...,False


In [9]:
# Sentiment Scores
neg = []
neu = []
pos = []
compound = []

analyser = SentimentIntensityAnalyzer()

for u in tqdm(utter):
    score = analyser.polarity_scores(u)
    neg.append(score['neg'])
    neu.append(score['neu'])
    pos.append(score['pos'])
    compound.append(score['compound'])
    
data_15 = {'utterance': utter, 'neg': neg, 'neu': neu, 'pos': pos, 'compound': compound}
df_15 = pd.DataFrame(data_15)
df_15.to_csv(r'SENTI_sentiment_scores.csv', index=False)
df_15.head()

 41%|████      | 4125/10020 [00:03<00:04, 1370.26it/s]


KeyboardInterrupt: 

In [None]:
# Opinion Lexicon