In [38]:
import pandas as pd
from tqdm import tqdm
import nltk
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize, RegexpTokenizer
import pickle

In [2]:
# Some utility functions
def load_pickle(path):
    with open(path, 'rb') as f:
        object_ = pickle.load(f)
    return object_

def save_pickle(path, file_name, object_):
    file_path = path + '/' + file_name + '.pkl'
    with open(file_path, 'wb') as f:
        pickle.dump(object_, f)
    print('The provided object has been saved to {} as {}'.format(path, file_name + '.pkl'))

## Data Wrangling and EDA

In [3]:
raw_data = pd.read_parquet('../input/df.parquet.gzip', engine='pyarrow')

In [4]:
raw_data.head(5)

Unnamed: 0,Date received,Product,Sub-product,Issue,Sub-issue,Consumer complaint narrative,Company public response,Company,State,ZIP code,Tags,Consumer consent provided?,Submitted via,Date sent to company,Company response to consumer,Timely response?,Consumer disputed?,Complaint ID
0,2019-06-13,"Credit reporting, credit repair services, or o...",Credit reporting,Incorrect information on your report,Information belongs to someone else,,,CAPITAL ONE FINANCIAL CORPORATION,PA,186XX,,Consent not provided,Web,2019-06-13,Closed with explanation,Yes,,3274605
1,2019-11-01,Vehicle loan or lease,Loan,Struggling to pay your loan,Denied request to lower payments,I contacted Ally on Friday XX/XX/XXXX after fa...,Company has responded to the consumer and the ...,ALLY FINANCIAL INC.,NJ,088XX,,Consent provided,Web,2019-11-01,Closed with explanation,Yes,,3425257
2,2019-04-01,"Credit reporting, credit repair services, or o...",Credit reporting,Incorrect information on your report,Account status incorrect,,Company has responded to the consumer and the ...,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",PA,19067,,Consent not provided,Web,2019-04-01,Closed with explanation,Yes,,3198225
3,2021-11-01,"Credit reporting, credit repair services, or o...",Credit reporting,Problem with a credit reporting company's inve...,Was not notified of investigation status or re...,,,"TRANSUNION INTERMEDIATE HOLDINGS, INC.",GA,31707,,,Web,2021-11-01,In progress,Yes,,4863965
4,2021-11-02,Debt collection,Medical debt,Took or threatened to take negative or legal a...,Threatened or suggested your credit would be d...,,,"Medical Data Systems, Inc.",VA,22033,,,Web,2021-11-02,In progress,Yes,,4866449


### Column of Interest

In [5]:
raw_data.loc[1, 'Consumer complaint narrative']

'I contacted Ally on Friday XX/XX/XXXX after falling behind on payments due to being out of work for a short period of time due to an illness. I chated with a representative after logging into my account regarding my opitions to ensure I protect my credit and bring my account current. \n\nShe advised me that before an extenstion could be done, I had to make a payment in the amount of {$270.00}. I reviewed my finances, as I am playing catch up on all my bills and made this payment on Monday XX/XX/XXXX. This rep advised me, once this payment posts to my account to contact Ally back for an extention or to have a payment deffered to the end of my loan. \n\nWith this in mind, I contacted Ally again today and chatted with XXXX. I explained all of the above and the information I was provided when I chatted with the rep last week. She asked several questions and advised me that a one or two month  extension/deffered payment could be done however partial payment is needed! WHAT? She advised me 

In [6]:
raw_data.loc[1, 'Product']

'Vehicle loan or lease'

Observations:
1) Some complaints (rows) do not contain complaint narrative. 
2) Some sensitive information is masked with XXX. 
3) Some complaint narrative simply states what the issue is with no obvious emotion; some contain strong emotion, mainly anger, towards the product or the customer service. There might be a potential project that digs into the sentiment of the customer complaint. For example, we can have a model to classify the sentiment (anger level) of the complaint to determine the urgency of the issue the customer raised. 

In [7]:
raw_data.shape

(2326246, 18)

In [8]:
complaints_data = raw_data[['Product', 'Consumer complaint narrative']].copy()  # Create a copy to avoid the original data being modified. But if the memory is an issue, please skip this step

In [9]:
# How many complaints do not have narrative? (missing values)
complaints_data.isna().sum()

Product                               0
Consumer complaint narrative    1516903
dtype: int64

In [10]:
# Drop those complaints with missing narratives
complaints_data.dropna(inplace=True)
complaints_data.shape

(809343, 2)

In [11]:
# Simplify the column names
complaints_data.rename({'Product': 'product', 'Consumer complaint narrative': 'complaint'}, 
                       axis=1, inplace=True)

In [12]:
complaints_data.head(1)

Unnamed: 0,product,complaint
1,Vehicle loan or lease,I contacted Ally on Friday XX/XX/XXXX after fa...


### How many products are we classifying?

In [13]:
complaints_data['product'].nunique()

18

In [14]:
complaints_data['product'].unique()

array(['Vehicle loan or lease',
       'Credit reporting, credit repair services, or other personal consumer reports',
       'Credit card or prepaid card',
       'Money transfer, virtual currency, or money service', 'Mortgage',
       'Payday loan, title loan, or personal loan', 'Debt collection',
       'Checking or savings account', 'Student loan', 'Consumer Loan',
       'Money transfers', 'Credit card', 'Bank account or service',
       'Credit reporting', 'Prepaid card', 'Payday loan',
       'Other financial service', 'Virtual currency'], dtype=object)

In [15]:
pd.concat([complaints_data['product'].value_counts() / complaints_data.shape[0] * 100, 
           complaints_data['product'].value_counts()], axis=1)

Unnamed: 0,product,product.1
"Credit reporting, credit repair services, or other personal consumer reports",39.101469,316465
Debt collection,19.445526,157381
Mortgage,10.435749,84461
Credit card or prepaid card,7.506582,60754
Checking or savings account,4.619673,37389
Credit reporting,3.902919,31588
Student loan,3.594768,29094
Credit card,2.327567,18838
"Money transfer, virtual currency, or money service",2.29606,18583
Vehicle loan or lease,1.857556,15034


We have 18 categories to classify, some of which are somehow similar, such as payday loans, student loans and customer loans. We can combine these similar categories into one category to reduce the dimension of the target of interest, plus remedy the unbalance issue hidden in this dataset. 

In [16]:
product_map = {'Vehicle loan or lease': 'vehicle_loan',
              'Credit reporting, credit repair services, or other personal consumer reports':'credit_report',
              'Credit card or prepaid card': 'card',
              'Money transfer, virtual currency, or money service': 'money_transfer',
              'virtual currency': 'money_transfer',
              'Mortgage': 'mortgage',
               'Payday loan, title loan, or personal loan': 'loan',
               'Debt collection': 'debt_collection',
               'Checking or savings account': 'savings_account',
               'Credit card': 'card',
               'Bank account or service': 'savings_account',
               'Credit reporting': 'credit_report',
               'Prepaid card': 'card',
               'Payday loan': 'loan',
               'Other financial service': 'others',
               'Virtual currency': 'money_transfer',
               'Student loan': 'loan',
               'Consumer Loan': 'loan',
               'Money transfers': 'money_transfer'
              }

complaints_data.replace({"product": product_map}, inplace=True)

In [17]:
complaints_data['product'].unique(), complaints_data['product'].nunique()

(array(['vehicle_loan', 'credit_report', 'card', 'money_transfer',
        'mortgage', 'loan', 'debt_collection', 'savings_account', 'others'],
       dtype=object),
 9)

In [18]:
pd.concat([complaints_data['product'].value_counts() / complaints_data.shape[0] * 100, 
           complaints_data['product'].value_counts()], axis=1)

Unnamed: 0,product,product.1
credit_report,43.004388,348053
debt_collection,19.445526,157381
mortgage,10.435749,84461
card,10.013307,81042
savings_account,6.458819,52274
loan,6.265576,50710
money_transfer,2.483002,20096
vehicle_loan,1.857556,15034
others,0.036079,292


In a classification problem, we want to pay close attention to the precision and recall scores when it comes to modeling with an unbalanced dataset. While correctly classifying the majority classes is our focus, we could conduct a cost analysis to investiagte, for example, the average cost of the complaint types labeled as "other" to have an idea of whether correctly predicting this class is important. If so, some tuning tasks are necessary.  

### Time to transform the data into the proper format

In [19]:
# converting to lower case
complaints_data['complaint'] = complaints_data['complaint'].apply(lambda x: x.lower())

Note: this process takes a long time, 15min-ish, so it is always a great practice to save the result for next time use. 

In [27]:
tokens_input_path = '../output/'
tokens_file_name = 'tokens.pkl'

tokens_ = load_pickle(tokens_input_path+tokens_file_name)

In [28]:
tokens_[0]

['i',
 'contacted',
 'ally',
 'on',
 'friday',
 'xx/xx/xxxx',
 'after',
 'falling',
 'behind',
 'on',
 'payments',
 'due',
 'to',
 'being',
 'out',
 'of',
 'work',
 'for',
 'a',
 'short',
 'period',
 'of',
 'time',
 'due',
 'to',
 'an',
 'illness',
 '.',
 'i',
 'chated',
 'with',
 'a',
 'representative',
 'after',
 'logging',
 'into',
 'my',
 'account',
 'regarding',
 'my',
 'opitions',
 'to',
 'ensure',
 'i',
 'protect',
 'my',
 'credit',
 'and',
 'bring',
 'my',
 'account',
 'current',
 '.',
 'she',
 'advised',
 'me',
 'that',
 'before',
 'an',
 'extenstion',
 'could',
 'be',
 'done',
 ',',
 'i',
 'had',
 'to',
 'make',
 'a',
 'payment',
 'in',
 'the',
 'amount',
 'of',
 '{',
 '$',
 '270.00',
 '}',
 '.',
 'i',
 'reviewed',
 'my',
 'finances',
 ',',
 'as',
 'i',
 'am',
 'playing',
 'catch',
 'up',
 'on',
 'all',
 'my',
 'bills',
 'and',
 'made',
 'this',
 'payment',
 'on',
 'monday',
 'xx/xx/xxxx',
 '.',
 'this',
 'rep',
 'advised',
 'me',
 ',',
 'once',
 'this',
 'payment',
 'posts',

In [30]:
# Remove stop words
sw = stopwords.words("english")

tokens = [[word for word in t if word not in sw] for t in tqdm(tokens_)]


  0%|                                                                                                              | 0/809343 [00:00<?, ?it/s][A
  0%|                                                                                                  | 203/809343 [00:00<06:39, 2025.95it/s][A
  0%|                                                                                                  | 406/809343 [00:00<06:54, 1951.23it/s][A
  0%|                                                                                                  | 604/809343 [00:00<07:03, 1908.34it/s][A
  0%|                                                                                                  | 838/809343 [00:00<06:30, 2071.98it/s][A
  0%|▏                                                                                                | 1050/809343 [00:00<06:27, 2088.11it/s][A
  0%|▏                                                                                                | 1276/809343 [00:00<

  2%|█▌                                                                                              | 13645/809343 [00:05<05:58, 2219.23it/s][A
  2%|█▋                                                                                              | 13885/809343 [00:05<05:50, 2269.46it/s][A
  2%|█▋                                                                                              | 14151/809343 [00:06<05:34, 2379.28it/s][A
  2%|█▋                                                                                              | 14412/809343 [00:06<05:25, 2444.11it/s][A
  2%|█▋                                                                                              | 14666/809343 [00:06<05:22, 2465.86it/s][A
  2%|█▊                                                                                              | 14952/809343 [00:06<05:08, 2576.89it/s][A
  2%|█▊                                                                                              | 15222/809343 [00:06<0

  4%|███▎                                                                                            | 28342/809343 [00:11<04:56, 2635.49it/s][A
  4%|███▍                                                                                            | 28607/809343 [00:11<04:57, 2627.90it/s][A
  4%|███▍                                                                                            | 28897/809343 [00:11<04:48, 2703.16it/s][A
  4%|███▍                                                                                            | 29185/809343 [00:12<04:43, 2751.32it/s][A
  4%|███▍                                                                                            | 29461/809343 [00:12<04:43, 2748.36it/s][A
  4%|███▌                                                                                            | 29737/809343 [00:12<04:48, 2701.45it/s][A
  4%|███▌                                                                                            | 30008/809343 [00:12<0

  5%|█████▏                                                                                          | 43589/809343 [00:17<05:34, 2291.46it/s][A
  5%|█████▏                                                                                          | 43820/809343 [00:17<05:38, 2261.10it/s][A
  5%|█████▏                                                                                          | 44047/809343 [00:17<05:43, 2226.00it/s][A
  5%|█████▎                                                                                          | 44292/809343 [00:18<05:38, 2263.39it/s][A
  6%|█████▎                                                                                          | 44589/809343 [00:18<05:09, 2467.03it/s][A
  6%|█████▎                                                                                          | 44886/809343 [00:18<04:52, 2609.14it/s][A
  6%|█████▎                                                                                          | 45149/809343 [00:18<0

  7%|██████▉                                                                                         | 58908/809343 [00:23<04:35, 2719.44it/s][A
  7%|███████                                                                                         | 59183/809343 [00:23<04:37, 2702.45it/s][A
  7%|███████                                                                                         | 59455/809343 [00:23<04:42, 2657.07it/s][A
  7%|███████                                                                                         | 59726/809343 [00:23<04:41, 2664.28it/s][A
  7%|███████                                                                                         | 60006/809343 [00:24<04:37, 2703.16it/s][A
  7%|███████▏                                                                                        | 60277/809343 [00:24<04:37, 2702.91it/s][A
  7%|███████▏                                                                                        | 60554/809343 [00:24<0

  9%|████████▊                                                                                       | 74365/809343 [00:29<05:26, 2248.09it/s][A
  9%|████████▊                                                                                       | 74600/809343 [00:29<05:22, 2276.04it/s][A
  9%|████████▉                                                                                       | 74842/809343 [00:29<05:17, 2315.56it/s][A
  9%|████████▉                                                                                       | 75075/809343 [00:29<05:20, 2289.18it/s][A
  9%|████████▉                                                                                       | 75355/809343 [00:29<05:02, 2428.55it/s][A
  9%|████████▉                                                                                       | 75650/809343 [00:30<04:44, 2581.21it/s][A
  9%|█████████                                                                                       | 75921/809343 [00:30<0

 11%|██████████▋                                                                                     | 89677/809343 [00:35<04:34, 2622.80it/s][A
 11%|██████████▋                                                                                     | 89956/809343 [00:35<04:29, 2667.87it/s][A
 11%|██████████▋                                                                                     | 90281/809343 [00:35<04:13, 2838.36it/s][A
 11%|██████████▋                                                                                     | 90575/809343 [00:35<04:10, 2867.87it/s][A
 11%|██████████▊                                                                                     | 90863/809343 [00:35<04:10, 2871.36it/s][A
 11%|██████████▊                                                                                     | 91151/809343 [00:35<04:21, 2750.72it/s][A
 11%|██████████▊                                                                                     | 91428/809343 [00:35<0

 13%|████████████▍                                                                                  | 105861/809343 [00:41<04:04, 2873.25it/s][A
 13%|████████████▍                                                                                  | 106199/809343 [00:41<03:52, 3021.90it/s][A
 13%|████████████▌                                                                                  | 106502/809343 [00:41<04:11, 2798.54it/s][A
 13%|████████████▌                                                                                  | 106786/809343 [00:41<04:23, 2663.48it/s][A
 13%|████████████▌                                                                                  | 107088/809343 [00:41<04:14, 2757.79it/s][A
 13%|████████████▌                                                                                  | 107367/809343 [00:41<04:19, 2706.90it/s][A
 13%|████████████▋                                                                                  | 107640/809343 [00:41<0

 15%|██████████████▎                                                                                | 121934/809343 [00:47<04:19, 2653.09it/s][A
 15%|██████████████▎                                                                                | 122212/809343 [00:47<04:15, 2687.17it/s][A
 15%|██████████████▍                                                                                | 122507/809343 [00:47<04:08, 2762.98it/s][A
 15%|██████████████▍                                                                                | 122785/809343 [00:47<04:13, 2706.87it/s][A
 15%|██████████████▍                                                                                | 123100/809343 [00:47<04:02, 2833.04it/s][A
 15%|██████████████▍                                                                                | 123407/809343 [00:47<03:56, 2902.26it/s][A
 15%|██████████████▌                                                                                | 123716/809343 [00:47<0

 17%|████████████████▎                                                                              | 138570/809343 [00:52<03:52, 2879.38it/s][A
 17%|████████████████▎                                                                              | 138883/809343 [00:52<03:47, 2950.38it/s][A
 17%|████████████████▎                                                                              | 139181/809343 [00:53<03:47, 2942.37it/s][A
 17%|████████████████▎                                                                              | 139476/809343 [00:53<03:53, 2867.80it/s][A
 17%|████████████████▍                                                                              | 139764/809343 [00:53<04:08, 2696.54it/s][A
 17%|████████████████▍                                                                              | 140036/809343 [00:53<04:09, 2681.22it/s][A
 17%|████████████████▍                                                                              | 140373/809343 [00:53<0

 19%|██████████████████▏                                                                            | 155240/809343 [00:58<03:34, 3054.88it/s][A
 19%|██████████████████▎                                                                            | 155546/809343 [00:58<03:34, 3047.11it/s][A
 19%|██████████████████▎                                                                            | 155878/809343 [00:58<03:29, 3123.81it/s][A
 19%|██████████████████▎                                                                            | 156191/809343 [00:59<03:39, 2982.02it/s][A
 19%|██████████████████▎                                                                            | 156516/809343 [00:59<03:33, 3057.21it/s][A
 19%|██████████████████▍                                                                            | 156823/809343 [00:59<03:43, 2915.91it/s][A
 19%|██████████████████▍                                                                            | 157117/809343 [00:59<0

 21%|████████████████████▏                                                                          | 171895/809343 [01:04<03:26, 3091.62it/s][A
 21%|████████████████████▏                                                                          | 172205/809343 [01:04<03:29, 3043.11it/s][A
 21%|████████████████████▏                                                                          | 172510/809343 [01:04<03:31, 3004.23it/s][A
 21%|████████████████████▎                                                                          | 172811/809343 [01:04<03:39, 2905.64it/s][A
 21%|████████████████████▎                                                                          | 173103/809343 [01:05<03:39, 2903.04it/s][A
 21%|████████████████████▎                                                                          | 173395/809343 [01:05<03:39, 2891.48it/s][A
 21%|████████████████████▍                                                                          | 173719/809343 [01:05<0

 23%|██████████████████████▏                                                                        | 189216/809343 [01:10<03:34, 2890.38it/s][A
 23%|██████████████████████▏                                                                        | 189507/809343 [01:10<03:41, 2803.14it/s][A
 23%|██████████████████████▎                                                                        | 189821/809343 [01:10<03:33, 2898.14it/s][A
 23%|██████████████████████▎                                                                        | 190113/809343 [01:10<03:34, 2888.17it/s][A
 24%|██████████████████████▎                                                                        | 190403/809343 [01:10<03:45, 2749.03it/s][A
 24%|██████████████████████▍                                                                        | 190680/809343 [01:10<03:45, 2748.17it/s][A
 24%|██████████████████████▍                                                                        | 190956/809343 [01:11<0

 25%|████████████████████████                                                                       | 205387/809343 [01:16<03:49, 2636.84it/s][A
 25%|████████████████████████▏                                                                      | 205652/809343 [01:16<03:50, 2616.40it/s][A
 25%|████████████████████████▏                                                                      | 205988/809343 [01:16<03:33, 2830.63it/s][A
 25%|████████████████████████▏                                                                      | 206278/809343 [01:16<03:31, 2849.90it/s][A
 26%|████████████████████████▏                                                                      | 206564/809343 [01:16<03:32, 2840.13it/s][A
 26%|████████████████████████▎                                                                      | 206852/809343 [01:16<03:31, 2849.53it/s][A
 26%|████████████████████████▎                                                                      | 207154/809343 [01:16<0

 27%|█████████████████████████▉                                                                     | 220925/809343 [01:22<03:36, 2723.38it/s][A
 27%|█████████████████████████▉                                                                     | 221199/809343 [01:22<03:35, 2724.63it/s][A
 27%|█████████████████████████▉                                                                     | 221472/809343 [01:22<03:44, 2619.42it/s][A
 27%|██████████████████████████                                                                     | 221779/809343 [01:22<03:33, 2748.54it/s][A
 27%|██████████████████████████                                                                     | 222066/809343 [01:22<03:30, 2783.54it/s][A
 27%|██████████████████████████                                                                     | 222346/809343 [01:22<03:37, 2703.66it/s][A
 28%|██████████████████████████▏                                                                    | 222618/809343 [01:22<0

 29%|███████████████████████████▊                                                                   | 237233/809343 [01:27<03:16, 2907.88it/s][A
 29%|███████████████████████████▉                                                                   | 237526/809343 [01:28<03:16, 2902.69it/s][A
 29%|███████████████████████████▉                                                                   | 237818/809343 [01:28<03:16, 2905.35it/s][A
 29%|███████████████████████████▉                                                                   | 238110/809343 [01:28<03:19, 2862.29it/s][A
 29%|███████████████████████████▉                                                                   | 238397/809343 [01:28<03:25, 2784.22it/s][A
 29%|████████████████████████████                                                                   | 238685/809343 [01:28<03:23, 2808.56it/s][A
 30%|████████████████████████████                                                                   | 238967/809343 [01:28<0

 31%|█████████████████████████████▋                                                                 | 253335/809343 [01:33<03:11, 2901.11it/s][A
 31%|█████████████████████████████▊                                                                 | 253627/809343 [01:33<03:18, 2803.25it/s][A
 31%|█████████████████████████████▊                                                                 | 253911/809343 [01:34<03:18, 2804.87it/s][A
 31%|█████████████████████████████▊                                                                 | 254193/809343 [01:34<03:25, 2697.18it/s][A
 31%|█████████████████████████████▊                                                                 | 254465/809343 [01:34<03:27, 2676.86it/s][A
 31%|█████████████████████████████▉                                                                 | 254734/809343 [01:34<03:28, 2654.99it/s][A
 32%|█████████████████████████████▉                                                                 | 255074/809343 [01:34<0

 33%|███████████████████████████████▌                                                               | 268682/809343 [01:39<03:19, 2704.29it/s][A
 33%|███████████████████████████████▌                                                               | 268954/809343 [01:39<03:32, 2543.17it/s][A
 33%|███████████████████████████████▌                                                               | 269211/809343 [01:39<03:45, 2395.66it/s][A
 33%|███████████████████████████████▋                                                               | 269454/809343 [01:40<03:56, 2279.06it/s][A
 33%|███████████████████████████████▋                                                               | 269685/809343 [01:40<04:01, 2230.21it/s][A
 33%|███████████████████████████████▋                                                               | 269910/809343 [01:40<04:02, 2221.20it/s][A
 33%|███████████████████████████████▋                                                               | 270134/809343 [01:40<0

 35%|█████████████████████████████████▏                                                             | 282216/809343 [01:45<03:26, 2547.83it/s][A
 35%|█████████████████████████████████▏                                                             | 282498/809343 [01:45<03:20, 2628.05it/s][A
 35%|█████████████████████████████████▏                                                             | 282762/809343 [01:45<03:23, 2587.07it/s][A
 35%|█████████████████████████████████▏                                                             | 283022/809343 [01:45<03:30, 2501.32it/s][A
 35%|█████████████████████████████████▎                                                             | 283273/809343 [01:46<03:33, 2465.71it/s][A
 35%|█████████████████████████████████▎                                                             | 283521/809343 [01:46<03:33, 2460.84it/s][A
 35%|█████████████████████████████████▎                                                             | 283768/809343 [01:46<0

 37%|██████████████████████████████████▉                                                            | 297566/809343 [01:51<03:14, 2626.86it/s][A
 37%|██████████████████████████████████▉                                                            | 297830/809343 [01:51<03:15, 2623.01it/s][A
 37%|██████████████████████████████████▉                                                            | 298093/809343 [01:51<03:17, 2593.22it/s][A
 37%|███████████████████████████████████                                                            | 298376/809343 [01:51<03:11, 2662.31it/s][A
 37%|███████████████████████████████████                                                            | 298643/809343 [01:51<03:20, 2546.90it/s][A
 37%|███████████████████████████████████                                                            | 298899/809343 [01:51<03:24, 2498.80it/s][A
 37%|███████████████████████████████████                                                            | 299182/809343 [01:52<0

 39%|████████████████████████████████████▋                                                          | 312833/809343 [01:57<03:02, 2720.29it/s][A
 39%|████████████████████████████████████▊                                                          | 313134/809343 [01:57<02:56, 2803.91it/s][A
 39%|████████████████████████████████████▊                                                          | 313430/809343 [01:57<02:54, 2848.85it/s][A
 39%|████████████████████████████████████▊                                                          | 313717/809343 [01:57<03:01, 2725.90it/s][A
 39%|████████████████████████████████████▊                                                          | 314005/809343 [01:57<02:59, 2760.60it/s][A
 39%|████████████████████████████████████▉                                                          | 314283/809343 [01:57<03:03, 2699.00it/s][A
 39%|████████████████████████████████████▉                                                          | 314555/809343 [01:57<0

 41%|██████████████████████████████████████▌                                                        | 328340/809343 [02:03<03:07, 2564.12it/s][A
 41%|██████████████████████████████████████▌                                                        | 328603/809343 [02:03<03:06, 2583.04it/s][A
 41%|██████████████████████████████████████▌                                                        | 328891/809343 [02:03<03:00, 2666.12it/s][A
 41%|██████████████████████████████████████▋                                                        | 329163/809343 [02:03<02:59, 2680.36it/s][A
 41%|██████████████████████████████████████▋                                                        | 329432/809343 [02:03<03:01, 2637.65it/s][A
 41%|██████████████████████████████████████▋                                                        | 329697/809343 [02:03<03:05, 2581.46it/s][A
 41%|██████████████████████████████████████▋                                                        | 329956/809343 [02:03<0

 42%|████████████████████████████████████████▎                                                      | 343604/809343 [02:08<03:03, 2542.60it/s][A
 42%|████████████████████████████████████████▎                                                      | 343898/809343 [02:09<02:55, 2657.74it/s][A
 43%|████████████████████████████████████████▍                                                      | 344166/809343 [02:09<02:56, 2637.59it/s][A
 43%|████████████████████████████████████████▍                                                      | 344443/809343 [02:09<02:53, 2673.48it/s][A
 43%|████████████████████████████████████████▍                                                      | 344713/809343 [02:09<02:53, 2680.56it/s][A
 43%|████████████████████████████████████████▍                                                      | 344982/809343 [02:09<03:00, 2568.26it/s][A
 43%|████████████████████████████████████████▌                                                      | 345243/809343 [02:09<0

 44%|██████████████████████████████████████████                                                     | 357843/809343 [02:14<02:56, 2561.48it/s][A
 44%|██████████████████████████████████████████                                                     | 358101/809343 [02:14<03:08, 2394.63it/s][A
 44%|██████████████████████████████████████████                                                     | 358371/809343 [02:15<03:02, 2475.25it/s][A
 44%|██████████████████████████████████████████                                                     | 358626/809343 [02:15<03:00, 2496.57it/s][A
 44%|██████████████████████████████████████████▏                                                    | 358886/809343 [02:15<02:58, 2525.58it/s][A
 44%|██████████████████████████████████████████▏                                                    | 359156/809343 [02:15<02:54, 2575.84it/s][A
 44%|██████████████████████████████████████████▏                                                    | 359415/809343 [02:15<0

 46%|███████████████████████████████████████████▋                                                   | 372377/809343 [02:20<02:47, 2612.70it/s][A
 46%|███████████████████████████████████████████▋                                                   | 372639/809343 [02:20<02:47, 2613.38it/s][A
 46%|███████████████████████████████████████████▊                                                   | 372902/809343 [02:20<02:46, 2615.84it/s][A
 46%|███████████████████████████████████████████▊                                                   | 373164/809343 [02:20<02:46, 2612.51it/s][A
 46%|███████████████████████████████████████████▊                                                   | 373440/809343 [02:21<02:44, 2654.73it/s][A
 46%|███████████████████████████████████████████▊                                                   | 373706/809343 [02:21<02:47, 2595.99it/s][A
 46%|███████████████████████████████████████████▉                                                   | 373982/809343 [02:21<0

 48%|█████████████████████████████████████████████▌                                                 | 387888/809343 [02:26<02:33, 2743.39it/s][A
 48%|█████████████████████████████████████████████▌                                                 | 388181/809343 [02:26<02:30, 2794.04it/s][A
 48%|█████████████████████████████████████████████▌                                                 | 388462/809343 [02:26<02:30, 2798.68it/s][A
 48%|█████████████████████████████████████████████▋                                                 | 388743/809343 [02:26<02:39, 2629.47it/s][A
 48%|█████████████████████████████████████████████▋                                                 | 389009/809343 [02:26<02:41, 2601.04it/s][A
 48%|█████████████████████████████████████████████▋                                                 | 389287/809343 [02:27<02:38, 2650.87it/s][A
 48%|█████████████████████████████████████████████▋                                                 | 389563/809343 [02:27<0

 50%|███████████████████████████████████████████████▍                                               | 403682/809343 [02:32<02:27, 2756.38it/s][A
 50%|███████████████████████████████████████████████▍                                               | 403959/809343 [02:32<02:29, 2720.02it/s][A
 50%|███████████████████████████████████████████████▍                                               | 404233/809343 [02:32<02:28, 2720.34it/s][A
 50%|███████████████████████████████████████████████▍                                               | 404517/809343 [02:32<02:27, 2742.81it/s][A
 50%|███████████████████████████████████████████████▌                                               | 404792/809343 [02:32<02:30, 2695.42it/s][A
 50%|███████████████████████████████████████████████▌                                               | 405064/809343 [02:32<02:29, 2699.57it/s][A
 50%|███████████████████████████████████████████████▌                                               | 405405/809343 [02:32<0

 52%|█████████████████████████████████████████████████▏                                             | 418742/809343 [04:42<02:32, 2561.39it/s][A
 52%|█████████████████████████████████████████████████▏                                             | 419024/809343 [04:42<02:28, 2626.34it/s][A
 52%|█████████████████████████████████████████████████▏                                             | 419288/809343 [04:42<02:32, 2556.63it/s][A
 52%|█████████████████████████████████████████████████▏                                             | 419545/809343 [04:42<02:36, 2496.24it/s][A
 52%|█████████████████████████████████████████████████▎                                             | 419810/809343 [04:42<02:33, 2539.69it/s][A
 52%|█████████████████████████████████████████████████▎                                             | 420099/809343 [04:42<02:27, 2631.28it/s][A
 52%|█████████████████████████████████████████████████▎                                             | 420390/809343 [04:42<0

 54%|███████████████████████████████████████████████████                                            | 434888/809343 [04:48<02:09, 2899.92it/s][A
 54%|███████████████████████████████████████████████████                                            | 435180/809343 [04:48<02:19, 2691.00it/s][A
 54%|███████████████████████████████████████████████████                                            | 435473/809343 [04:48<02:15, 2753.42it/s][A
 54%|███████████████████████████████████████████████████▏                                           | 435809/809343 [04:48<02:07, 2919.24it/s][A
 54%|███████████████████████████████████████████████████▏                                           | 436104/809343 [04:48<02:13, 2795.58it/s][A
 54%|███████████████████████████████████████████████████▏                                           | 436418/809343 [04:48<02:08, 2892.71it/s][A
 54%|███████████████████████████████████████████████████▎                                           | 436710/809343 [04:48<0

 56%|████████████████████████████████████████████████████▉                                          | 451325/809343 [04:54<02:17, 2603.46it/s][A
 56%|█████████████████████████████████████████████████████                                          | 451588/809343 [04:54<02:23, 2497.61it/s][A
 56%|█████████████████████████████████████████████████████                                          | 451840/809343 [04:54<02:25, 2459.03it/s][A
 56%|█████████████████████████████████████████████████████                                          | 452102/809343 [04:54<02:22, 2504.38it/s][A
 56%|█████████████████████████████████████████████████████                                          | 452418/809343 [04:54<02:12, 2685.80it/s][A
 56%|█████████████████████████████████████████████████████▏                                         | 452689/809343 [04:54<02:16, 2606.86it/s][A
 56%|█████████████████████████████████████████████████████▏                                         | 452992/809343 [04:54<0

 58%|██████████████████████████████████████████████████████▋                                        | 465476/809343 [05:00<02:26, 2353.21it/s][A
 58%|██████████████████████████████████████████████████████▋                                        | 465715/809343 [05:00<02:26, 2341.34it/s][A
 58%|██████████████████████████████████████████████████████▋                                        | 465959/809343 [05:00<02:25, 2367.95it/s][A
 58%|██████████████████████████████████████████████████████▋                                        | 466219/809343 [05:00<02:21, 2433.25it/s][A
 58%|██████████████████████████████████████████████████████▊                                        | 466476/809343 [05:00<02:18, 2472.68it/s][A
 58%|██████████████████████████████████████████████████████▊                                        | 466727/809343 [05:00<02:17, 2483.13it/s][A
 58%|██████████████████████████████████████████████████████▊                                        | 467006/809343 [05:00<0

 59%|████████████████████████████████████████████████████████▍                                      | 480667/809343 [05:06<02:06, 2602.23it/s][A
 59%|████████████████████████████████████████████████████████▍                                      | 480953/809343 [05:06<02:02, 2676.19it/s][A
 59%|████████████████████████████████████████████████████████▍                                      | 481246/809343 [05:06<01:59, 2744.12it/s][A
 59%|████████████████████████████████████████████████████████▌                                      | 481522/809343 [05:06<02:07, 2575.61it/s][A
 60%|████████████████████████████████████████████████████████▌                                      | 481797/809343 [05:06<02:04, 2623.37it/s][A
 60%|████████████████████████████████████████████████████████▌                                      | 482092/809343 [05:06<02:00, 2709.07it/s][A
 60%|████████████████████████████████████████████████████████▌                                      | 482369/809343 [05:06<0

 61%|██████████████████████████████████████████████████████████▎                                    | 496518/809343 [05:11<02:00, 2593.98it/s][A
 61%|██████████████████████████████████████████████████████████▎                                    | 496819/809343 [05:12<01:55, 2704.42it/s][A
 61%|██████████████████████████████████████████████████████████▎                                    | 497091/809343 [05:12<01:55, 2693.48it/s][A
 61%|██████████████████████████████████████████████████████████▍                                    | 497362/809343 [05:12<01:59, 2618.89it/s][A
 61%|██████████████████████████████████████████████████████████▍                                    | 497625/809343 [05:12<02:02, 2554.63it/s][A
 62%|██████████████████████████████████████████████████████████▍                                    | 497944/809343 [05:12<01:53, 2736.96it/s][A
 62%|██████████████████████████████████████████████████████████▍                                    | 498251/809343 [05:12<0

 63%|████████████████████████████████████████████████████████████▏                                  | 512749/809343 [05:17<01:48, 2742.82it/s][A
 63%|████████████████████████████████████████████████████████████▏                                  | 513025/809343 [05:17<01:53, 2612.87it/s][A
 63%|████████████████████████████████████████████████████████████▏                                  | 513288/809343 [05:18<01:55, 2573.20it/s][A
 63%|████████████████████████████████████████████████████████████▎                                  | 513583/809343 [05:18<01:50, 2670.73it/s][A
 63%|████████████████████████████████████████████████████████████▎                                  | 513862/809343 [05:18<01:49, 2704.47it/s][A
 64%|████████████████████████████████████████████████████████████▎                                  | 514164/809343 [05:18<01:45, 2796.33it/s][A
 64%|████████████████████████████████████████████████████████████▍                                  | 514445/809343 [05:18<0

 65%|█████████████████████████████████████████████████████████████▉                                 | 527751/809343 [05:23<01:55, 2437.92it/s][A
 65%|█████████████████████████████████████████████████████████████▉                                 | 527996/809343 [05:23<02:03, 2273.38it/s][A
 65%|██████████████████████████████████████████████████████████████                                 | 528272/809343 [05:24<01:56, 2407.14it/s][A
 65%|██████████████████████████████████████████████████████████████                                 | 528546/809343 [05:24<01:52, 2498.89it/s][A
 65%|██████████████████████████████████████████████████████████████                                 | 528799/809343 [05:24<01:52, 2483.03it/s][A
 65%|██████████████████████████████████████████████████████████████                                 | 529107/809343 [05:24<01:45, 2646.44it/s][A
 65%|██████████████████████████████████████████████████████████████▏                                | 529374/809343 [05:24<0

 67%|███████████████████████████████████████████████████████████████▋                               | 542676/809343 [05:29<01:54, 2326.38it/s][A
 67%|███████████████████████████████████████████████████████████████▋                               | 542911/809343 [05:29<01:55, 2300.07it/s][A
 67%|███████████████████████████████████████████████████████████████▊                               | 543143/809343 [05:30<01:57, 2258.67it/s][A
 67%|███████████████████████████████████████████████████████████████▊                               | 543375/809343 [05:30<01:56, 2275.83it/s][A
 67%|███████████████████████████████████████████████████████████████▊                               | 543604/809343 [05:30<02:02, 2161.26it/s][A
 67%|███████████████████████████████████████████████████████████████▊                               | 543822/809343 [05:30<02:05, 2114.58it/s][A
 67%|███████████████████████████████████████████████████████████████▊                               | 544144/809343 [05:30<0

 69%|█████████████████████████████████████████████████████████████████                              | 554559/809343 [05:35<02:00, 2105.70it/s][A
 69%|█████████████████████████████████████████████████████████████████                              | 554771/809343 [05:35<02:06, 2005.62it/s][A
 69%|█████████████████████████████████████████████████████████████████▏                             | 554973/809343 [05:36<02:14, 1887.49it/s][A
 69%|█████████████████████████████████████████████████████████████████▏                             | 555195/809343 [05:36<02:08, 1979.61it/s][A
 69%|█████████████████████████████████████████████████████████████████▏                             | 555416/809343 [05:36<02:04, 2044.11it/s][A
 69%|█████████████████████████████████████████████████████████████████▏                             | 555631/809343 [05:36<02:02, 2065.27it/s][A
 69%|█████████████████████████████████████████████████████████████████▏                             | 555839/809343 [05:36<0

 70%|██████████████████████████████████████████████████████████████████▌                            | 567468/809343 [05:41<01:43, 2331.94it/s][A
 70%|██████████████████████████████████████████████████████████████████▋                            | 567716/809343 [05:41<01:41, 2371.22it/s][A
 70%|██████████████████████████████████████████████████████████████████▋                            | 567962/809343 [05:41<01:40, 2396.89it/s][A
 70%|██████████████████████████████████████████████████████████████████▋                            | 568203/809343 [05:41<01:43, 2330.46it/s][A
 70%|██████████████████████████████████████████████████████████████████▋                            | 568438/809343 [05:42<01:44, 2301.09it/s][A
 70%|██████████████████████████████████████████████████████████████████▊                            | 568699/809343 [05:42<01:40, 2389.13it/s][A
 70%|██████████████████████████████████████████████████████████████████▊                            | 568939/809343 [05:42<0

 72%|████████████████████████████████████████████████████████████████████▎                          | 582370/809343 [05:47<01:18, 2892.92it/s][A
 72%|████████████████████████████████████████████████████████████████████▍                          | 582672/809343 [05:47<01:17, 2930.33it/s][A
 72%|████████████████████████████████████████████████████████████████████▍                          | 582967/809343 [05:47<01:17, 2935.74it/s][A
 72%|████████████████████████████████████████████████████████████████████▍                          | 583314/809343 [05:47<01:13, 3091.46it/s][A
 72%|████████████████████████████████████████████████████████████████████▌                          | 583624/809343 [05:47<01:13, 3066.36it/s][A
 72%|████████████████████████████████████████████████████████████████████▌                          | 583931/809343 [05:47<01:16, 2943.29it/s][A
 72%|████████████████████████████████████████████████████████████████████▌                          | 584227/809343 [05:48<0

 74%|██████████████████████████████████████████████████████████████████████▍                        | 600067/809343 [05:53<01:07, 3080.14it/s][A
 74%|██████████████████████████████████████████████████████████████████████▍                        | 600376/809343 [05:53<01:07, 3082.35it/s][A
 74%|██████████████████████████████████████████████████████████████████████▌                        | 600685/809343 [05:53<01:09, 2982.75it/s][A
 74%|██████████████████████████████████████████████████████████████████████▌                        | 600985/809343 [05:53<01:10, 2969.77it/s][A
 74%|██████████████████████████████████████████████████████████████████████▌                        | 601283/809343 [05:53<01:12, 2882.09it/s][A
 74%|██████████████████████████████████████████████████████████████████████▌                        | 601620/809343 [05:53<01:08, 3021.63it/s][A
 74%|██████████████████████████████████████████████████████████████████████▋                        | 601964/809343 [05:53<0

 76%|████████████████████████████████████████████████████████████████████████▍                      | 617547/809343 [05:59<01:01, 3140.67it/s][A
 76%|████████████████████████████████████████████████████████████████████████▌                      | 617862/809343 [05:59<01:01, 3100.13it/s][A
 76%|████████████████████████████████████████████████████████████████████████▌                      | 618183/809343 [05:59<01:01, 3120.73it/s][A
 76%|████████████████████████████████████████████████████████████████████████▌                      | 618496/809343 [05:59<01:06, 2867.09it/s][A
 76%|████████████████████████████████████████████████████████████████████████▋                      | 618823/809343 [05:59<01:03, 2978.60it/s][A
 76%|████████████████████████████████████████████████████████████████████████▋                      | 619125/809343 [05:59<01:05, 2890.58it/s][A
 77%|████████████████████████████████████████████████████████████████████████▋                      | 619417/809343 [05:59<0

 78%|██████████████████████████████████████████████████████████████████████████▌                    | 634951/809343 [06:04<01:00, 2901.98it/s][A
 78%|██████████████████████████████████████████████████████████████████████████▌                    | 635243/809343 [06:05<01:00, 2856.07it/s][A
 79%|██████████████████████████████████████████████████████████████████████████▌                    | 635530/809343 [06:05<01:02, 2803.17it/s][A
 79%|██████████████████████████████████████████████████████████████████████████▋                    | 635811/809343 [06:05<01:04, 2682.34it/s][A
 79%|██████████████████████████████████████████████████████████████████████████▋                    | 636109/809343 [06:05<01:02, 2764.72it/s][A
 79%|██████████████████████████████████████████████████████████████████████████▋                    | 636393/809343 [06:05<01:02, 2786.33it/s][A
 79%|██████████████████████████████████████████████████████████████████████████▋                    | 636676/809343 [06:05<0

 81%|████████████████████████████████████████████████████████████████████████████▍                  | 651672/809343 [06:10<00:54, 2895.01it/s][A
 81%|████████████████████████████████████████████████████████████████████████████▌                  | 651966/809343 [06:10<00:57, 2736.90it/s][A
 81%|████████████████████████████████████████████████████████████████████████████▌                  | 652263/809343 [06:11<00:56, 2800.30it/s][A
 81%|████████████████████████████████████████████████████████████████████████████▌                  | 652547/809343 [06:11<01:00, 2579.97it/s][A
 81%|████████████████████████████████████████████████████████████████████████████▋                  | 652815/809343 [06:11<01:00, 2600.59it/s][A
 81%|████████████████████████████████████████████████████████████████████████████▋                  | 653136/809343 [06:11<00:56, 2766.39it/s][A
 81%|████████████████████████████████████████████████████████████████████████████▋                  | 653453/809343 [06:11<0

 83%|██████████████████████████████████████████████████████████████████████████████▍                | 667767/809343 [06:16<00:50, 2801.40it/s][A
 83%|██████████████████████████████████████████████████████████████████████████████▍                | 668049/809343 [06:16<00:52, 2675.37it/s][A
 83%|██████████████████████████████████████████████████████████████████████████████▍                | 668319/809343 [06:17<00:55, 2538.21it/s][A
 83%|██████████████████████████████████████████████████████████████████████████████▍                | 668576/809343 [06:17<00:56, 2477.96it/s][A
 83%|██████████████████████████████████████████████████████████████████████████████▌                | 668856/809343 [06:17<00:54, 2566.90it/s][A
 83%|██████████████████████████████████████████████████████████████████████████████▌                | 669168/809343 [06:17<00:51, 2723.78it/s][A
 83%|██████████████████████████████████████████████████████████████████████████████▌                | 669443/809343 [06:17<0

 84%|████████████████████████████████████████████████████████████████████████████████▏              | 683380/809343 [06:22<00:50, 2500.89it/s][A
 84%|████████████████████████████████████████████████████████████████████████████████▏              | 683632/809343 [06:22<00:50, 2482.48it/s][A
 84%|████████████████████████████████████████████████████████████████████████████████▎              | 683882/809343 [06:23<00:50, 2478.33it/s][A
 85%|████████████████████████████████████████████████████████████████████████████████▎              | 684145/809343 [06:23<00:49, 2522.64it/s][A
 85%|████████████████████████████████████████████████████████████████████████████████▎              | 684398/809343 [06:23<00:49, 2505.22it/s][A
 85%|████████████████████████████████████████████████████████████████████████████████▎              | 684670/809343 [06:23<00:48, 2567.31it/s][A
 85%|████████████████████████████████████████████████████████████████████████████████▍              | 684933/809343 [06:23<0

 86%|█████████████████████████████████████████████████████████████████████████████████▊             | 697489/809343 [06:28<00:51, 2186.23it/s][A
 86%|█████████████████████████████████████████████████████████████████████████████████▉             | 697757/809343 [06:28<00:47, 2326.80it/s][A
 86%|█████████████████████████████████████████████████████████████████████████████████▉             | 697992/809343 [06:29<00:52, 2135.72it/s][A
 86%|█████████████████████████████████████████████████████████████████████████████████▉             | 698223/809343 [06:29<00:50, 2181.60it/s][A
 86%|█████████████████████████████████████████████████████████████████████████████████▉             | 698455/809343 [06:29<00:49, 2220.32it/s][A
 86%|██████████████████████████████████████████████████████████████████████████████████             | 698711/809343 [06:29<00:47, 2315.49it/s][A
 86%|██████████████████████████████████████████████████████████████████████████████████             | 698959/809343 [06:29<0

 88%|███████████████████████████████████████████████████████████████████████████████████▌           | 712417/809343 [06:34<00:41, 2362.32it/s][A
 88%|███████████████████████████████████████████████████████████████████████████████████▋           | 712656/809343 [06:34<00:40, 2367.33it/s][A
 88%|███████████████████████████████████████████████████████████████████████████████████▋           | 712932/809343 [06:35<00:38, 2480.44it/s][A
 88%|███████████████████████████████████████████████████████████████████████████████████▋           | 713182/809343 [06:35<00:40, 2352.45it/s][A
 88%|███████████████████████████████████████████████████████████████████████████████████▋           | 713420/809343 [06:35<00:40, 2339.69it/s][A
 88%|███████████████████████████████████████████████████████████████████████████████████▊           | 713706/809343 [06:35<00:38, 2487.15it/s][A
 88%|███████████████████████████████████████████████████████████████████████████████████▊           | 714002/809343 [06:35<0

 90%|█████████████████████████████████████████████████████████████████████████████████████▍         | 727743/809343 [06:40<00:31, 2561.19it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████▍         | 728019/809343 [06:40<00:31, 2618.18it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████▍         | 728282/809343 [06:40<00:31, 2606.21it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████▌         | 728544/809343 [06:41<00:33, 2445.83it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████▌         | 728796/809343 [06:41<00:32, 2457.39it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████▌         | 729059/809343 [06:41<00:32, 2505.72it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████▌         | 729361/809343 [06:41<0

 92%|███████████████████████████████████████████████████████████████████████████████████████▏       | 743014/809343 [06:46<00:24, 2692.83it/s][A
 92%|███████████████████████████████████████████████████████████████████████████████████████▏       | 743286/809343 [06:46<00:25, 2635.88it/s][A
 92%|███████████████████████████████████████████████████████████████████████████████████████▎       | 743573/809343 [06:46<00:24, 2701.26it/s][A
 92%|███████████████████████████████████████████████████████████████████████████████████████▎       | 743860/809343 [06:46<00:23, 2749.05it/s][A
 92%|███████████████████████████████████████████████████████████████████████████████████████▎       | 744137/809343 [06:47<00:24, 2614.93it/s][A
 92%|███████████████████████████████████████████████████████████████████████████████████████▍       | 744401/809343 [06:47<00:25, 2595.19it/s][A
 92%|███████████████████████████████████████████████████████████████████████████████████████▍       | 744662/809343 [06:47<0

 94%|█████████████████████████████████████████████████████████████████████████████████████████      | 758434/809343 [06:52<00:18, 2684.38it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████      | 758751/809343 [06:52<00:17, 2817.07it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████      | 759034/809343 [06:52<00:18, 2712.67it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████▏     | 759307/809343 [06:52<00:19, 2570.75it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████▏     | 759569/809343 [06:52<00:19, 2583.69it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████▏     | 759829/809343 [06:53<00:19, 2562.18it/s][A
 94%|█████████████████████████████████████████████████████████████████████████████████████████▏     | 760087/809343 [06:53<0

 96%|██████████████████████████████████████████████████████████████████████████████████████████▊    | 773545/809343 [06:58<00:13, 2714.49it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████▊    | 773819/809343 [06:58<00:13, 2717.74it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████▊    | 774093/809343 [06:58<00:12, 2721.40it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████▉    | 774367/809343 [06:58<00:12, 2719.06it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████▉    | 774640/809343 [06:58<00:12, 2699.19it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████▉    | 774911/809343 [06:58<00:12, 2657.05it/s][A
 96%|██████████████████████████████████████████████████████████████████████████████████████████▉    | 775178/809343 [06:59<0

 97%|████████████████████████████████████████████████████████████████████████████████████████████▌  | 788317/809343 [07:04<00:08, 2530.39it/s][A
 97%|████████████████████████████████████████████████████████████████████████████████████████████▌  | 788593/809343 [07:04<00:07, 2595.36it/s][A
 97%|████████████████████████████████████████████████████████████████████████████████████████████▌  | 788909/809343 [07:04<00:07, 2757.09it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████▋  | 789213/809343 [07:04<00:07, 2839.62it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████▋  | 789498/809343 [07:04<00:07, 2740.05it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████▋  | 789774/809343 [07:04<00:07, 2709.13it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████▋  | 790046/809343 [07:04<0

 99%|██████████████████████████████████████████████████████████████████████████████████████████████▎| 803373/809343 [07:10<00:02, 2619.66it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████▎| 803639/809343 [07:10<00:02, 2433.10it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████▎| 803887/809343 [07:10<00:02, 2382.46it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████▍| 804132/809343 [07:10<00:02, 2392.03it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████▍| 804374/809343 [07:10<00:02, 2392.80it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████▍| 804658/809343 [07:10<00:01, 2513.51it/s][A
 99%|██████████████████████████████████████████████████████████████████████████████████████████████▍| 804938/809343 [07:10<0

In [32]:
tokens_output_path = '../output'
tokens_file_name = 'tokens_sw'

save_pickle(tokens_output_path, tokens_file_name, tokens)

The provided object has been saved to ../output as tokens_sw.pkl


In [36]:
tokens[0]

['contacted',
 'ally',
 'friday',
 'xx/xx/xxxx',
 'falling',
 'behind',
 'payments',
 'due',
 'work',
 'short',
 'period',
 'time',
 'due',
 'illness',
 '.',
 'chated',
 'representative',
 'logging',
 'account',
 'regarding',
 'opitions',
 'ensure',
 'protect',
 'credit',
 'bring',
 'account',
 'current',
 '.',
 'advised',
 'extenstion',
 'could',
 'done',
 ',',
 'make',
 'payment',
 'amount',
 '{',
 '$',
 '270.00',
 '}',
 '.',
 'reviewed',
 'finances',
 ',',
 'playing',
 'catch',
 'bills',
 'made',
 'payment',
 'monday',
 'xx/xx/xxxx',
 '.',
 'rep',
 'advised',
 ',',
 'payment',
 'posts',
 'account',
 'contact',
 'ally',
 'back',
 'extention',
 'payment',
 'deffered',
 'end',
 'loan',
 '.',
 'mind',
 ',',
 'contacted',
 'ally',
 'today',
 'chatted',
 'xxxx',
 '.',
 'explained',
 'information',
 'provided',
 'chatted',
 'rep',
 'last',
 'week',
 '.',
 'asked',
 'several',
 'questions',
 'advised',
 'one',
 'two',
 'month',
 'extension/deffered',
 'payment',
 'could',
 'done',
 'however