In [1]:
import numpy as np
import matplotlib.pyplot as plt
import torch

from sentence_transformers import SentenceTransformer, InputExample, models, losses, util
from torch import nn
from torch.utils.data import DataLoader

from pathlib import Path

# Fix the random seed for reproducibility
# !! Important !! : do not change this
seed = 1234
np.random.seed(seed)


DATA_PATH = Path('data/original-dataset')
VOCAB_PATH = DATA_PATH.joinpath('imdb.vocab')
TRAIN_BOW_PATH = DATA_PATH.joinpath('train/labeledBow.feat')
TEST_BOW_PATH = DATA_PATH.joinpath('test/labeledBow.feat')
TRAIN_FILES = DATA_PATH.glob('train/[pn][oe][sg]/*.txt')
TEST_FILES = DATA_PATH.glob('test/[pn][oe][sg]/*.txt')
COLORMAP = 'seismic'


# data processing constants
MAX_DF = 0.4
MIN_DF = 2
PCA_COMPONENTS = 100

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
train_data = {
    'pos': [],
    'neg': []
}

for path, i in zip(TRAIN_FILES, range(25001)):
    with open(path, 'r', encoding='utf8') as file:
        rating = int(path.stem.split('_')[1])
        contents = file.read().strip()
        
        key = 'pos' if rating > 5 else 'neg'
        train_data[key].append((contents, rating))

print(f'parsed {sum(len(d) for d in train_data.values())} reviews')
print(f'positive: {len(train_data["pos"])}')
print(f'negative: {len(train_data["neg"])}')

# test_data = []

# for path, i in zip(TEST_FILES, range(25001)):
#     with open(path, 'r', encoding='utf8') as file:
#         rating = int(path.stem.split('_')[1])
#         contents = file.read().strip()
        
#         test_data.append((contents, rating))
        
# print(f'parsed {len(test_data)} test reviews')

parsed 25000 reviews
positive: 12500
negative: 12500


In [25]:
# generate train example tuples ([text, text], similarity)
# anchor is a review
# positive is review that should be similar to anchor
# negative is a review that should not be similar to anchor

def similarity(r1, r2):
    """
    Returns the similarity between two texts given thier rating
    """
    if r1 <= 5 and r2 <= 5:
        return 1.0
    elif r1 > 5 and r2 > 5:
        return 1.0
    else:
        return 0.0
    
# number of train examples
n = 100000
print(f'{n} train examples')

merged_data = train_data['pos'] + train_data['neg']

pair_idxs = np.random.randint(0, len(merged_data), (n, 2))
print(pair_idxs[0])

train_examples = [
    InputExample(
        texts=[merged_data[i1][0], merged_data[i2][0]],
        label=similarity(merged_data[i1][1], merged_data[i2][1])
    ) 
    for i1, i2 in pair_idxs
]

print(train_examples[0].texts[0])
print('-----')
print(train_examples[0].texts[1])
print('-----')
print(train_examples[0].label)

100000 train examples
[19627 10336]
I was looking forward to this ride, and was horribly disappointed.<br /><br />And I am very easily amused at roller coaster and amusement park rides.<br /><br />The roller coaster part was just okay - and that was all of about 30 seconds of a 90 second ride. <br /><br />It was visually dull and poorly executed. <br /><br />It was trying desperately to be like a mixture of the far superior Indiana Jones and Space Mountain rides and Disneyland, and failed in every aspect.<br /><br />It was not thrilling or exciting in the least.
-----
This is of of Sammo's great early comedy films. This isn't a parody of enter the dragon, the main character (Sammo) is obsessed with Bruce Lee and emulates him freakishly well for a man of his size. Nominal story about how his fighting keeps causing his loved ones trouble - then fighting. Oh, the fighting. Good, fast-paced scenes with high impact (the white guy who plays a boxer looks like he really gets hurt by one of Sa

In [4]:
# build custom sBert model
model = SentenceTransformer('all-MiniLM-L6-v2', device='cuda')
dense_model = models.Dense(in_features=384, out_features=100, activation_function=nn.ReLU())
model.add_module('dense', dense_model)

# define dataload and loss function used to train model
train_dataloader = DataLoader(train_examples, shuffle=True, batch_size=16)
train_loss = losses.CosineSimilarityLoss(model)

# # torch.cuda.empty_cache()
model.fit(train_objectives=[(train_dataloader, train_loss)], epochs=1, warmup_steps=100)

Epoch:   0%|                                                                                     | 0/1 [00:00<?, ?it/s]
Iteration:   0%|                                                                              | 0/6250 [00:00<?, ?it/s][A
Iteration:   0%|                                                                    | 1/6250 [00:01<2:55:52,  1.69s/it][A
Iteration:   0%|                                                                    | 3/6250 [00:02<1:31:18,  1.14it/s][A
Iteration:   0%|                                                                    | 4/6250 [00:03<1:32:23,  1.13it/s][A
Iteration:   0%|                                                                    | 5/6250 [00:04<1:32:57,  1.12it/s][A
Iteration:   0%|                                                                    | 6/6250 [00:05<1:33:25,  1.11it/s][A
Iteration:   0%|                                                                    | 7/6250 [00:06<1:33:39,  1.11it/s][A
Iteration:   0%|   

Iteration:   2%|█▍                                                                | 132/6250 [02:00<1:33:26,  1.09it/s][A
Iteration:   2%|█▍                                                                | 133/6250 [02:01<1:33:25,  1.09it/s][A
Iteration:   2%|█▍                                                                | 134/6250 [02:02<1:33:24,  1.09it/s][A
Iteration:   2%|█▍                                                                | 135/6250 [02:03<1:33:19,  1.09it/s][A
Iteration:   2%|█▍                                                                | 136/6250 [02:04<1:33:29,  1.09it/s][A
Iteration:   2%|█▍                                                                | 137/6250 [02:05<1:33:22,  1.09it/s][A
Iteration:   2%|█▍                                                                | 138/6250 [02:06<1:33:20,  1.09it/s][A
Iteration:   2%|█▍                                                                | 139/6250 [02:07<1:33:27,  1.09it/s][A
Iteration:   2%|

Iteration:   4%|██▊                                                               | 264/6250 [04:01<1:31:32,  1.09it/s][A
Iteration:   4%|██▊                                                               | 265/6250 [04:02<1:31:31,  1.09it/s][A
Iteration:   4%|██▊                                                               | 266/6250 [04:03<1:31:39,  1.09it/s][A
Iteration:   4%|██▊                                                               | 267/6250 [04:04<1:31:29,  1.09it/s][A
Iteration:   4%|██▊                                                               | 268/6250 [04:05<1:31:29,  1.09it/s][A
Iteration:   4%|██▊                                                               | 269/6250 [04:06<1:31:28,  1.09it/s][A
Iteration:   4%|██▊                                                               | 270/6250 [04:07<1:31:29,  1.09it/s][A
Iteration:   4%|██▊                                                               | 271/6250 [04:08<1:31:25,  1.09it/s][A
Iteration:   4%|

Iteration:   6%|████▏                                                             | 396/6250 [06:03<1:29:20,  1.09it/s][A
Iteration:   6%|████▏                                                             | 397/6250 [06:03<1:29:20,  1.09it/s][A
Iteration:   6%|████▏                                                             | 398/6250 [06:04<1:29:16,  1.09it/s][A
Iteration:   6%|████▏                                                             | 399/6250 [06:05<1:29:17,  1.09it/s][A
Iteration:   6%|████▏                                                             | 400/6250 [06:06<1:29:22,  1.09it/s][A
Iteration:   6%|████▏                                                             | 401/6250 [06:07<1:29:17,  1.09it/s][A
Iteration:   6%|████▏                                                             | 402/6250 [06:08<1:29:14,  1.09it/s][A
Iteration:   6%|████▎                                                             | 403/6250 [06:09<1:29:17,  1.09it/s][A
Iteration:   6%|

Iteration:   8%|█████▌                                                            | 528/6250 [08:04<1:27:28,  1.09it/s][A
Iteration:   8%|█████▌                                                            | 529/6250 [08:05<1:27:28,  1.09it/s][A
Iteration:   8%|█████▌                                                            | 530/6250 [08:05<1:27:24,  1.09it/s][A
Iteration:   8%|█████▌                                                            | 531/6250 [08:06<1:27:25,  1.09it/s][A
Iteration:   9%|█████▌                                                            | 532/6250 [08:07<1:27:25,  1.09it/s][A
Iteration:   9%|█████▋                                                            | 533/6250 [08:08<1:27:21,  1.09it/s][A
Iteration:   9%|█████▋                                                            | 534/6250 [08:09<1:27:25,  1.09it/s][A
Iteration:   9%|█████▋                                                            | 535/6250 [08:10<1:27:22,  1.09it/s][A
Iteration:   9%|

Iteration:  11%|██████▉                                                           | 660/6250 [10:05<1:25:39,  1.09it/s][A
Iteration:  11%|██████▉                                                           | 661/6250 [10:06<1:25:39,  1.09it/s][A
Iteration:  11%|██████▉                                                           | 662/6250 [10:07<1:25:41,  1.09it/s][A
Iteration:  11%|███████                                                           | 663/6250 [10:08<1:25:34,  1.09it/s][A
Iteration:  11%|███████                                                           | 664/6250 [10:08<1:25:32,  1.09it/s][A
Iteration:  11%|███████                                                           | 665/6250 [10:09<1:25:35,  1.09it/s][A
Iteration:  11%|███████                                                           | 666/6250 [10:10<1:25:37,  1.09it/s][A
Iteration:  11%|███████                                                           | 667/6250 [10:11<1:25:38,  1.09it/s][A
Iteration:  11%|

Iteration:  13%|████████▎                                                         | 792/6250 [12:06<1:23:17,  1.09it/s][A
Iteration:  13%|████████▎                                                         | 793/6250 [12:07<1:23:23,  1.09it/s][A
Iteration:  13%|████████▍                                                         | 794/6250 [12:08<1:23:24,  1.09it/s][A
Iteration:  13%|████████▍                                                         | 795/6250 [12:08<1:23:20,  1.09it/s][A
Iteration:  13%|████████▍                                                         | 796/6250 [12:09<1:23:20,  1.09it/s][A
Iteration:  13%|████████▍                                                         | 797/6250 [12:10<1:23:19,  1.09it/s][A
Iteration:  13%|████████▍                                                         | 798/6250 [12:11<1:23:14,  1.09it/s][A
Iteration:  13%|████████▍                                                         | 799/6250 [12:12<1:23:15,  1.09it/s][A
Iteration:  13%|

Iteration:  15%|█████████▊                                                        | 924/6250 [14:07<1:21:22,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 925/6250 [14:08<1:21:18,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 926/6250 [14:09<1:21:18,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 927/6250 [14:10<1:21:20,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 928/6250 [14:10<1:21:14,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 929/6250 [14:11<1:21:12,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 930/6250 [14:12<1:21:13,  1.09it/s][A
Iteration:  15%|█████████▊                                                        | 931/6250 [14:13<1:21:10,  1.09it/s][A
Iteration:  15%|

Iteration:  17%|██████████▉                                                      | 1056/6250 [16:08<1:19:27,  1.09it/s][A
Iteration:  17%|██████████▉                                                      | 1057/6250 [16:09<1:19:31,  1.09it/s][A
Iteration:  17%|███████████                                                      | 1058/6250 [16:10<1:19:27,  1.09it/s][A
Iteration:  17%|███████████                                                      | 1059/6250 [16:11<1:19:23,  1.09it/s][A
Iteration:  17%|███████████                                                      | 1060/6250 [16:12<1:19:24,  1.09it/s][A
Iteration:  17%|███████████                                                      | 1061/6250 [16:13<1:19:22,  1.09it/s][A
Iteration:  17%|███████████                                                      | 1062/6250 [16:14<1:19:21,  1.09it/s][A
Iteration:  17%|███████████                                                      | 1063/6250 [16:14<1:19:17,  1.09it/s][A
Iteration:  17%|

Iteration:  19%|████████████▎                                                    | 1188/6250 [18:09<1:17:37,  1.09it/s][A
Iteration:  19%|████████████▎                                                    | 1189/6250 [18:10<1:17:34,  1.09it/s][A
Iteration:  19%|████████████▍                                                    | 1190/6250 [18:11<1:17:28,  1.09it/s][A
Iteration:  19%|████████████▍                                                    | 1191/6250 [18:12<1:17:24,  1.09it/s][A
Iteration:  19%|████████████▍                                                    | 1192/6250 [18:13<1:17:24,  1.09it/s][A
Iteration:  19%|████████████▍                                                    | 1193/6250 [18:14<1:17:30,  1.09it/s][A
Iteration:  19%|████████████▍                                                    | 1194/6250 [18:15<1:17:26,  1.09it/s][A
Iteration:  19%|████████████▍                                                    | 1195/6250 [18:16<1:17:24,  1.09it/s][A
Iteration:  19%|

Iteration:  21%|█████████████▋                                                   | 1320/6250 [20:10<1:15:29,  1.09it/s][A
Iteration:  21%|█████████████▋                                                   | 1321/6250 [20:11<1:15:28,  1.09it/s][A
Iteration:  21%|█████████████▋                                                   | 1322/6250 [20:12<1:15:27,  1.09it/s][A
Iteration:  21%|█████████████▊                                                   | 1323/6250 [20:13<1:15:27,  1.09it/s][A
Iteration:  21%|█████████████▊                                                   | 1324/6250 [20:14<1:15:26,  1.09it/s][A
Iteration:  21%|█████████████▊                                                   | 1325/6250 [20:15<1:15:25,  1.09it/s][A
Iteration:  21%|█████████████▊                                                   | 1326/6250 [20:16<1:15:25,  1.09it/s][A
Iteration:  21%|█████████████▊                                                   | 1327/6250 [20:17<1:15:23,  1.09it/s][A
Iteration:  21%|

Iteration:  23%|███████████████                                                  | 1452/6250 [22:12<1:13:30,  1.09it/s][A
Iteration:  23%|███████████████                                                  | 1453/6250 [22:13<1:13:30,  1.09it/s][A
Iteration:  23%|███████████████                                                  | 1454/6250 [22:14<1:13:30,  1.09it/s][A
Iteration:  23%|███████████████▏                                                 | 1455/6250 [22:15<1:13:29,  1.09it/s][A
Iteration:  23%|███████████████▏                                                 | 1456/6250 [22:16<1:13:38,  1.09it/s][A
Iteration:  23%|███████████████▏                                                 | 1457/6250 [22:16<1:13:28,  1.09it/s][A
Iteration:  23%|███████████████▏                                                 | 1458/6250 [22:17<1:13:30,  1.09it/s][A
Iteration:  23%|███████████████▏                                                 | 1459/6250 [22:18<1:13:37,  1.08it/s][A
Iteration:  23%|

Iteration:  25%|████████████████▍                                                | 1584/6250 [24:13<1:11:35,  1.09it/s][A
Iteration:  25%|████████████████▍                                                | 1585/6250 [24:14<1:11:33,  1.09it/s][A
Iteration:  25%|████████████████▍                                                | 1586/6250 [24:15<1:11:33,  1.09it/s][A
Iteration:  25%|████████████████▌                                                | 1587/6250 [24:16<1:11:31,  1.09it/s][A
Iteration:  25%|████████████████▌                                                | 1588/6250 [24:17<1:11:30,  1.09it/s][A
Iteration:  25%|████████████████▌                                                | 1589/6250 [24:18<1:11:28,  1.09it/s][A
Iteration:  25%|████████████████▌                                                | 1590/6250 [24:19<1:11:27,  1.09it/s][A
Iteration:  25%|████████████████▌                                                | 1591/6250 [24:20<1:11:26,  1.09it/s][A
Iteration:  25%|

Iteration:  27%|█████████████████▊                                               | 1716/6250 [26:15<1:09:43,  1.08it/s][A
Iteration:  27%|█████████████████▊                                               | 1717/6250 [26:16<1:09:42,  1.08it/s][A
Iteration:  27%|█████████████████▊                                               | 1718/6250 [26:17<1:09:40,  1.08it/s][A
Iteration:  28%|█████████████████▉                                               | 1719/6250 [26:18<1:09:23,  1.09it/s][A
Iteration:  28%|█████████████████▉                                               | 1720/6250 [26:18<1:09:23,  1.09it/s][A
Iteration:  28%|█████████████████▉                                               | 1721/6250 [26:19<1:09:37,  1.08it/s][A
Iteration:  28%|█████████████████▉                                               | 1722/6250 [26:20<1:09:28,  1.09it/s][A
Iteration:  28%|█████████████████▉                                               | 1723/6250 [26:21<1:09:17,  1.09it/s][A
Iteration:  28%|

Iteration:  30%|███████████████████▏                                             | 1848/6250 [28:16<1:07:26,  1.09it/s][A
Iteration:  30%|███████████████████▏                                             | 1849/6250 [28:17<1:07:24,  1.09it/s][A
Iteration:  30%|███████████████████▏                                             | 1850/6250 [28:18<1:07:23,  1.09it/s][A
Iteration:  30%|███████████████████▎                                             | 1851/6250 [28:19<1:07:22,  1.09it/s][A
Iteration:  30%|███████████████████▎                                             | 1852/6250 [28:20<1:07:21,  1.09it/s][A
Iteration:  30%|███████████████████▎                                             | 1853/6250 [28:21<1:07:21,  1.09it/s][A
Iteration:  30%|███████████████████▎                                             | 1854/6250 [28:22<1:07:23,  1.09it/s][A
Iteration:  30%|███████████████████▎                                             | 1855/6250 [28:23<1:07:19,  1.09it/s][A
Iteration:  30%|

Iteration:  32%|████████████████████▌                                            | 1980/6250 [30:18<1:05:35,  1.08it/s][A
Iteration:  32%|████████████████████▌                                            | 1981/6250 [30:19<1:05:32,  1.09it/s][A
Iteration:  32%|████████████████████▌                                            | 1982/6250 [30:20<1:05:33,  1.09it/s][A
Iteration:  32%|████████████████████▌                                            | 1983/6250 [30:20<1:05:30,  1.09it/s][A
Iteration:  32%|████████████████████▋                                            | 1984/6250 [30:21<1:05:32,  1.08it/s][A
Iteration:  32%|████████████████████▋                                            | 1985/6250 [30:22<1:05:31,  1.08it/s][A
Iteration:  32%|████████████████████▋                                            | 1986/6250 [30:23<1:05:27,  1.09it/s][A
Iteration:  32%|████████████████████▋                                            | 1987/6250 [30:24<1:05:26,  1.09it/s][A
Iteration:  32%|

Iteration:  34%|█████████████████████▉                                           | 2112/6250 [32:19<1:03:28,  1.09it/s][A
Iteration:  34%|█████████████████████▉                                           | 2113/6250 [32:20<1:03:27,  1.09it/s][A
Iteration:  34%|█████████████████████▉                                           | 2114/6250 [32:21<1:03:28,  1.09it/s][A
Iteration:  34%|█████████████████████▉                                           | 2115/6250 [32:22<1:03:31,  1.09it/s][A
Iteration:  34%|██████████████████████                                           | 2116/6250 [32:23<1:03:26,  1.09it/s][A
Iteration:  34%|██████████████████████                                           | 2117/6250 [32:24<1:03:24,  1.09it/s][A
Iteration:  34%|██████████████████████                                           | 2118/6250 [32:25<1:03:25,  1.09it/s][A
Iteration:  34%|██████████████████████                                           | 2119/6250 [32:26<1:03:23,  1.09it/s][A
Iteration:  34%|

Iteration:  36%|███████████████████████▎                                         | 2244/6250 [34:20<1:01:22,  1.09it/s][A
Iteration:  36%|███████████████████████▎                                         | 2245/6250 [34:21<1:01:21,  1.09it/s][A
Iteration:  36%|███████████████████████▎                                         | 2246/6250 [34:22<1:01:21,  1.09it/s][A
Iteration:  36%|███████████████████████▎                                         | 2247/6250 [34:23<1:01:20,  1.09it/s][A
Iteration:  36%|███████████████████████▍                                         | 2248/6250 [34:24<1:01:21,  1.09it/s][A
Iteration:  36%|███████████████████████▍                                         | 2249/6250 [34:25<1:01:20,  1.09it/s][A
Iteration:  36%|███████████████████████▍                                         | 2250/6250 [34:26<1:01:17,  1.09it/s][A
Iteration:  36%|███████████████████████▍                                         | 2251/6250 [34:27<1:01:20,  1.09it/s][A
Iteration:  36%|

Iteration:  38%|█████████████████████████▍                                         | 2376/6250 [36:22<59:30,  1.09it/s][A
Iteration:  38%|█████████████████████████▍                                         | 2377/6250 [36:23<59:25,  1.09it/s][A
Iteration:  38%|█████████████████████████▍                                         | 2378/6250 [36:24<59:25,  1.09it/s][A
Iteration:  38%|█████████████████████████▌                                         | 2379/6250 [36:25<59:26,  1.09it/s][A
Iteration:  38%|█████████████████████████▌                                         | 2380/6250 [36:26<59:23,  1.09it/s][A
Iteration:  38%|█████████████████████████▌                                         | 2381/6250 [36:26<59:21,  1.09it/s][A
Iteration:  38%|█████████████████████████▌                                         | 2382/6250 [36:27<59:23,  1.09it/s][A
Iteration:  38%|█████████████████████████▌                                         | 2383/6250 [36:28<59:19,  1.09it/s][A
Iteration:  38%|

Iteration:  40%|██████████████████████████▉                                        | 2508/6250 [38:23<57:20,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2509/6250 [38:24<57:20,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2510/6250 [38:25<57:18,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2511/6250 [38:26<57:20,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2512/6250 [38:27<57:20,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2513/6250 [38:28<57:15,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2514/6250 [38:29<57:13,  1.09it/s][A
Iteration:  40%|██████████████████████████▉                                        | 2515/6250 [38:30<57:13,  1.09it/s][A
Iteration:  40%|

Iteration:  42%|████████████████████████████▎                                      | 2640/6250 [40:25<55:19,  1.09it/s][A
Iteration:  42%|████████████████████████████▎                                      | 2641/6250 [40:26<55:20,  1.09it/s][A
Iteration:  42%|████████████████████████████▎                                      | 2642/6250 [40:26<55:18,  1.09it/s][A
Iteration:  42%|████████████████████████████▎                                      | 2643/6250 [40:27<55:17,  1.09it/s][A
Iteration:  42%|████████████████████████████▎                                      | 2644/6250 [40:28<55:16,  1.09it/s][A
Iteration:  42%|████████████████████████████▎                                      | 2645/6250 [40:29<55:15,  1.09it/s][A
Iteration:  42%|████████████████████████████▎                                      | 2646/6250 [40:30<55:15,  1.09it/s][A
Iteration:  42%|████████████████████████████▍                                      | 2647/6250 [40:31<55:18,  1.09it/s][A
Iteration:  42%|

Iteration:  44%|█████████████████████████████▋                                     | 2772/6250 [42:26<53:22,  1.09it/s][A
Iteration:  44%|█████████████████████████████▋                                     | 2773/6250 [42:27<53:21,  1.09it/s][A
Iteration:  44%|█████████████████████████████▋                                     | 2774/6250 [42:28<53:20,  1.09it/s][A
Iteration:  44%|█████████████████████████████▋                                     | 2775/6250 [42:29<53:19,  1.09it/s][A
Iteration:  44%|█████████████████████████████▊                                     | 2776/6250 [42:30<53:19,  1.09it/s][A
Iteration:  44%|█████████████████████████████▊                                     | 2777/6250 [42:31<53:17,  1.09it/s][A
Iteration:  44%|█████████████████████████████▊                                     | 2778/6250 [42:32<53:17,  1.09it/s][A
Iteration:  44%|█████████████████████████████▊                                     | 2779/6250 [42:33<53:18,  1.09it/s][A
Iteration:  44%|

Iteration:  46%|███████████████████████████████▏                                   | 2904/6250 [44:28<51:20,  1.09it/s][A
Iteration:  46%|███████████████████████████████▏                                   | 2905/6250 [44:28<51:22,  1.09it/s][A
Iteration:  46%|███████████████████████████████▏                                   | 2906/6250 [44:29<51:22,  1.08it/s][A
Iteration:  47%|███████████████████████████████▏                                   | 2907/6250 [44:30<51:21,  1.08it/s][A
Iteration:  47%|███████████████████████████████▏                                   | 2908/6250 [44:31<51:19,  1.09it/s][A
Iteration:  47%|███████████████████████████████▏                                   | 2909/6250 [44:32<51:15,  1.09it/s][A
Iteration:  47%|███████████████████████████████▏                                   | 2910/6250 [44:33<51:17,  1.09it/s][A
Iteration:  47%|███████████████████████████████▏                                   | 2911/6250 [44:34<51:15,  1.09it/s][A
Iteration:  47%|

Iteration:  49%|████████████████████████████████▌                                  | 3036/6250 [46:29<49:14,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3037/6250 [46:30<49:13,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3038/6250 [46:31<49:13,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3039/6250 [46:32<49:12,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3040/6250 [46:33<49:11,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3041/6250 [46:34<49:10,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3042/6250 [46:35<49:09,  1.09it/s][A
Iteration:  49%|████████████████████████████████▌                                  | 3043/6250 [46:36<49:09,  1.09it/s][A
Iteration:  49%|

Iteration:  51%|█████████████████████████████████▉                                 | 3168/6250 [48:31<47:11,  1.09it/s][A
Iteration:  51%|█████████████████████████████████▉                                 | 3169/6250 [48:31<47:14,  1.09it/s][A
Iteration:  51%|█████████████████████████████████▉                                 | 3170/6250 [48:32<47:17,  1.09it/s][A
Iteration:  51%|█████████████████████████████████▉                                 | 3171/6250 [48:33<47:10,  1.09it/s][A
Iteration:  51%|██████████████████████████████████                                 | 3172/6250 [48:34<47:10,  1.09it/s][A
Iteration:  51%|██████████████████████████████████                                 | 3173/6250 [48:35<47:07,  1.09it/s][A
Iteration:  51%|██████████████████████████████████                                 | 3174/6250 [48:36<47:03,  1.09it/s][A
Iteration:  51%|██████████████████████████████████                                 | 3175/6250 [48:37<47:07,  1.09it/s][A
Iteration:  51%|

Iteration:  53%|███████████████████████████████████▍                               | 3300/6250 [50:32<45:14,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3301/6250 [50:33<45:13,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3302/6250 [50:34<45:12,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3303/6250 [50:35<45:11,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3304/6250 [50:35<45:09,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3305/6250 [50:36<45:08,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3306/6250 [50:37<45:07,  1.09it/s][A
Iteration:  53%|███████████████████████████████████▍                               | 3307/6250 [50:38<45:07,  1.09it/s][A
Iteration:  53%|

Iteration:  55%|████████████████████████████████████▊                              | 3432/6250 [52:33<43:13,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3433/6250 [52:34<43:10,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3434/6250 [52:35<43:07,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3435/6250 [52:36<43:07,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3436/6250 [52:37<43:07,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3437/6250 [52:38<43:03,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3438/6250 [52:39<43:06,  1.09it/s][A
Iteration:  55%|████████████████████████████████████▊                              | 3439/6250 [52:40<43:01,  1.09it/s][A
Iteration:  55%|

Iteration:  57%|██████████████████████████████████████▏                            | 3564/6250 [54:34<41:01,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▏                            | 3565/6250 [54:35<41:00,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▏                            | 3566/6250 [54:36<40:58,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▏                            | 3567/6250 [54:37<40:58,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▏                            | 3568/6250 [54:38<41:00,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▎                            | 3569/6250 [54:39<40:59,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▎                            | 3570/6250 [54:40<40:57,  1.09it/s][A
Iteration:  57%|██████████████████████████████████████▎                            | 3571/6250 [54:41<40:55,  1.09it/s][A
Iteration:  57%|

Iteration:  59%|███████████████████████████████████████▌                           | 3696/6250 [56:35<39:02,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3697/6250 [56:36<39:00,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3698/6250 [56:37<39:00,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3699/6250 [56:38<39:03,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3700/6250 [56:39<39:01,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3701/6250 [56:40<39:01,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3702/6250 [56:41<38:56,  1.09it/s][A
Iteration:  59%|███████████████████████████████████████▋                           | 3703/6250 [56:42<38:58,  1.09it/s][A
Iteration:  59%|

Iteration:  61%|█████████████████████████████████████████                          | 3828/6250 [58:37<37:03,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3829/6250 [58:38<37:01,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3830/6250 [58:39<37:01,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3831/6250 [58:40<36:58,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3832/6250 [58:41<37:01,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3833/6250 [58:41<36:58,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3834/6250 [58:42<37:00,  1.09it/s][A
Iteration:  61%|█████████████████████████████████████████                          | 3835/6250 [58:43<36:56,  1.09it/s][A
Iteration:  61%|

Iteration:  63%|█████████████████████████████████████████▏                       | 3960/6250 [1:00:38<34:59,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▏                       | 3961/6250 [1:00:39<34:58,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▏                       | 3962/6250 [1:00:40<34:58,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▏                       | 3963/6250 [1:00:41<34:58,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▏                       | 3964/6250 [1:00:42<34:59,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▏                       | 3965/6250 [1:00:43<34:58,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▏                       | 3966/6250 [1:00:44<34:57,  1.09it/s][A
Iteration:  63%|█████████████████████████████████████████▎                       | 3967/6250 [1:00:44<34:55,  1.09it/s][A
Iteration:  63%|

Iteration:  65%|██████████████████████████████████████████▌                      | 4092/6250 [1:02:39<32:57,  1.09it/s][A
Iteration:  65%|██████████████████████████████████████████▌                      | 4093/6250 [1:02:40<32:57,  1.09it/s][A
Iteration:  66%|██████████████████████████████████████████▌                      | 4094/6250 [1:02:41<32:57,  1.09it/s][A
Iteration:  66%|██████████████████████████████████████████▌                      | 4095/6250 [1:02:42<32:54,  1.09it/s][A
Iteration:  66%|██████████████████████████████████████████▌                      | 4096/6250 [1:02:43<32:55,  1.09it/s][A
Iteration:  66%|██████████████████████████████████████████▌                      | 4097/6250 [1:02:44<32:55,  1.09it/s][A
Iteration:  66%|██████████████████████████████████████████▌                      | 4098/6250 [1:02:45<32:52,  1.09it/s][A
Iteration:  66%|██████████████████████████████████████████▋                      | 4099/6250 [1:02:46<32:52,  1.09it/s][A
Iteration:  66%|

Iteration:  68%|███████████████████████████████████████████▉                     | 4224/6250 [1:04:41<31:02,  1.09it/s][A
Iteration:  68%|███████████████████████████████████████████▉                     | 4225/6250 [1:04:42<31:02,  1.09it/s][A
Iteration:  68%|███████████████████████████████████████████▉                     | 4226/6250 [1:04:43<31:01,  1.09it/s][A
Iteration:  68%|███████████████████████████████████████████▉                     | 4227/6250 [1:04:44<31:00,  1.09it/s][A
Iteration:  68%|███████████████████████████████████████████▉                     | 4228/6250 [1:04:44<30:59,  1.09it/s][A
Iteration:  68%|███████████████████████████████████████████▉                     | 4229/6250 [1:04:45<30:57,  1.09it/s][A
Iteration:  68%|███████████████████████████████████████████▉                     | 4230/6250 [1:04:46<30:57,  1.09it/s][A
Iteration:  68%|████████████████████████████████████████████                     | 4231/6250 [1:04:47<30:55,  1.09it/s][A
Iteration:  68%|

Iteration:  70%|█████████████████████████████████████████████▎                   | 4356/6250 [1:06:42<28:59,  1.09it/s][A
Iteration:  70%|█████████████████████████████████████████████▎                   | 4357/6250 [1:06:43<28:59,  1.09it/s][A
Iteration:  70%|█████████████████████████████████████████████▎                   | 4358/6250 [1:06:44<29:01,  1.09it/s][A
Iteration:  70%|█████████████████████████████████████████████▎                   | 4359/6250 [1:06:45<29:03,  1.08it/s][A
Iteration:  70%|█████████████████████████████████████████████▎                   | 4360/6250 [1:06:46<29:01,  1.09it/s][A
Iteration:  70%|█████████████████████████████████████████████▎                   | 4361/6250 [1:06:47<28:55,  1.09it/s][A
Iteration:  70%|█████████████████████████████████████████████▎                   | 4362/6250 [1:06:48<28:54,  1.09it/s][A
Iteration:  70%|█████████████████████████████████████████████▍                   | 4363/6250 [1:06:49<28:54,  1.09it/s][A
Iteration:  70%|

Iteration:  72%|██████████████████████████████████████████████▋                  | 4488/6250 [1:08:43<26:53,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4489/6250 [1:08:44<26:51,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4490/6250 [1:08:45<26:51,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4491/6250 [1:08:46<26:49,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4492/6250 [1:08:47<26:51,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4493/6250 [1:08:48<26:50,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4494/6250 [1:08:49<26:49,  1.09it/s][A
Iteration:  72%|██████████████████████████████████████████████▋                  | 4495/6250 [1:08:50<26:49,  1.09it/s][A
Iteration:  72%|

Iteration:  74%|████████████████████████████████████████████████                 | 4620/6250 [1:10:44<24:57,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4621/6250 [1:10:45<24:55,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4622/6250 [1:10:46<24:55,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4623/6250 [1:10:47<24:53,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4624/6250 [1:10:48<24:51,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4625/6250 [1:10:49<24:50,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4626/6250 [1:10:50<24:49,  1.09it/s][A
Iteration:  74%|████████████████████████████████████████████████                 | 4627/6250 [1:10:51<24:48,  1.09it/s][A
Iteration:  74%|

Iteration:  76%|█████████████████████████████████████████████████▍               | 4752/6250 [1:12:46<22:57,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4753/6250 [1:12:46<22:56,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4754/6250 [1:12:47<22:55,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4755/6250 [1:12:48<22:54,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4756/6250 [1:12:49<22:54,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4757/6250 [1:12:50<22:53,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4758/6250 [1:12:51<22:53,  1.09it/s][A
Iteration:  76%|█████████████████████████████████████████████████▍               | 4759/6250 [1:12:52<22:51,  1.09it/s][A
Iteration:  76%|

Iteration:  78%|██████████████████████████████████████████████████▊              | 4884/6250 [1:14:47<20:57,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4885/6250 [1:14:48<20:55,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4886/6250 [1:14:49<20:56,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4887/6250 [1:14:50<20:53,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4888/6250 [1:14:51<20:53,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4889/6250 [1:14:52<20:51,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4890/6250 [1:14:52<20:51,  1.09it/s][A
Iteration:  78%|██████████████████████████████████████████████████▊              | 4891/6250 [1:14:53<20:49,  1.09it/s][A
Iteration:  78%|

Iteration:  80%|████████████████████████████████████████████████████▏            | 5016/6250 [1:16:48<19:04,  1.08it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5017/6250 [1:16:49<18:53,  1.09it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5018/6250 [1:16:50<18:51,  1.09it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5019/6250 [1:16:51<18:50,  1.09it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5020/6250 [1:16:52<18:50,  1.09it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5021/6250 [1:16:53<18:47,  1.09it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5022/6250 [1:16:54<18:46,  1.09it/s][A
Iteration:  80%|████████████████████████████████████████████████████▏            | 5023/6250 [1:16:55<18:45,  1.09it/s][A
Iteration:  80%|

Iteration:  82%|█████████████████████████████████████████████████████▌           | 5148/6250 [1:18:49<16:52,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5149/6250 [1:18:50<16:50,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5150/6250 [1:18:51<16:50,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5151/6250 [1:18:52<16:49,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5152/6250 [1:18:53<16:48,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5153/6250 [1:18:54<16:47,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5154/6250 [1:18:55<16:45,  1.09it/s][A
Iteration:  82%|█████████████████████████████████████████████████████▌           | 5155/6250 [1:18:56<16:45,  1.09it/s][A
Iteration:  82%|

Iteration:  84%|██████████████████████████████████████████████████████▉          | 5280/6250 [1:20:51<14:51,  1.09it/s][A
Iteration:  84%|██████████████████████████████████████████████████████▉          | 5281/6250 [1:20:52<14:51,  1.09it/s][A
Iteration:  85%|██████████████████████████████████████████████████████▉          | 5282/6250 [1:20:53<14:49,  1.09it/s][A
Iteration:  85%|██████████████████████████████████████████████████████▉          | 5283/6250 [1:20:54<14:49,  1.09it/s][A
Iteration:  85%|██████████████████████████████████████████████████████▉          | 5284/6250 [1:20:54<14:48,  1.09it/s][A
Iteration:  85%|██████████████████████████████████████████████████████▉          | 5285/6250 [1:20:55<14:48,  1.09it/s][A
Iteration:  85%|██████████████████████████████████████████████████████▉          | 5286/6250 [1:20:56<14:46,  1.09it/s][A
Iteration:  85%|██████████████████████████████████████████████████████▉          | 5287/6250 [1:20:57<14:45,  1.09it/s][A
Iteration:  85%|

Iteration:  87%|████████████████████████████████████████████████████████▎        | 5412/6250 [1:22:52<12:46,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5413/6250 [1:22:53<12:45,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5414/6250 [1:22:54<12:45,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5415/6250 [1:22:55<12:44,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5416/6250 [1:22:55<12:43,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5417/6250 [1:22:56<12:42,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5418/6250 [1:22:57<12:41,  1.09it/s][A
Iteration:  87%|████████████████████████████████████████████████████████▎        | 5419/6250 [1:22:58<12:40,  1.09it/s][A
Iteration:  87%|

Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5544/6250 [1:24:53<10:45,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5545/6250 [1:24:53<10:44,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5546/6250 [1:24:54<10:44,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5547/6250 [1:24:55<10:43,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5548/6250 [1:24:56<10:42,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5549/6250 [1:24:57<10:40,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5550/6250 [1:24:58<10:40,  1.09it/s][A
Iteration:  89%|█████████████████████████████████████████████████████████▋       | 5551/6250 [1:24:59<10:39,  1.09it/s][A
Iteration:  89%|

Iteration:  91%|███████████████████████████████████████████████████████████      | 5676/6250 [1:26:53<08:46,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5677/6250 [1:26:54<08:44,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5678/6250 [1:26:55<08:43,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5679/6250 [1:26:56<08:42,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5680/6250 [1:26:57<08:40,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5681/6250 [1:26:58<08:40,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5682/6250 [1:26:59<08:39,  1.09it/s][A
Iteration:  91%|███████████████████████████████████████████████████████████      | 5683/6250 [1:27:00<08:38,  1.09it/s][A
Iteration:  91%|

Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5808/6250 [1:28:54<06:43,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5809/6250 [1:28:55<06:42,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5810/6250 [1:28:56<06:41,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5811/6250 [1:28:57<06:40,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5812/6250 [1:28:57<06:39,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5813/6250 [1:28:58<06:38,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5814/6250 [1:28:59<06:37,  1.10it/s][A
Iteration:  93%|████████████████████████████████████████████████████████████▍    | 5815/6250 [1:29:00<06:36,  1.10it/s][A
Iteration:  93%|

Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5940/6250 [1:30:55<04:44,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5941/6250 [1:30:56<04:43,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5942/6250 [1:30:57<04:42,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5943/6250 [1:30:58<04:42,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5944/6250 [1:30:59<04:41,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5945/6250 [1:30:59<04:40,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5946/6250 [1:31:00<04:39,  1.09it/s][A
Iteration:  95%|█████████████████████████████████████████████████████████████▊   | 5947/6250 [1:31:01<04:38,  1.09it/s][A
Iteration:  95%|

Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6072/6250 [1:32:56<02:44,  1.08it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6073/6250 [1:32:57<02:42,  1.09it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6074/6250 [1:32:58<02:41,  1.09it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6075/6250 [1:32:59<02:40,  1.09it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6076/6250 [1:33:00<02:39,  1.09it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6077/6250 [1:33:01<02:38,  1.09it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6078/6250 [1:33:02<02:37,  1.09it/s][A
Iteration:  97%|███████████████████████████████████████████████████████████████▏ | 6079/6250 [1:33:03<02:37,  1.09it/s][A
Iteration:  97%|

Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6204/6250 [1:34:57<00:42,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6205/6250 [1:34:58<00:41,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6206/6250 [1:34:59<00:40,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6207/6250 [1:35:00<00:39,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6208/6250 [1:35:01<00:38,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6209/6250 [1:35:02<00:37,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6210/6250 [1:35:03<00:36,  1.09it/s][A
Iteration:  99%|████████████████████████████████████████████████████████████████▌| 6211/6250 [1:35:04<00:35,  1.09it/s][A
Iteration:  99%|

In [27]:
model = SentenceTransformer('sBERT_IMBD_Embedding_Model')

data = merged_data
r1 = data[np.random.randint(0, len(data))]
r2 = data[np.random.randint(0, len(data))]

print(r1[0])
print(r1[1])
print('-----')
print(r2[0])
print(r2[1])
print()

encodings = model.encode([text for text, rating in data], normalize_embeddings=True, show_progress_bar=True)
print(util.cos_sim(encodings, encodings))

print(encodings[0])


basic_model = SentenceTransformer('all-MiniLM-L6-v2', device='cuda')
encodings = basic_model.encode([r1[0], r2[0]])
print(util.cos_sim(encodings, encodings))

Although not the best Anime I have ever seen but I enjoyed Lady Death.<br /><br />I have never read the comic book and just saw this at the video store and decided to give it a chance.<br /><br />The animation was OK, I got the sense of the 80's anime from it which is what set it off for me. Why everyone else hates that is beyond me.<br /><br />Character development was fine. I like how they brought the transition from Hope to Lady Death around. for you who don't like it, obviously wasn't paying attention. Lucifer tells you how it happens, and she used his words.<br /><br />Creamtor was a nice mentor/soldier for her. his dark bruiting style was perfect for this kind of movie.<br /><br />I think everyone here who has bashed this needs to take another look at it and reconsider. cause everything people have bashed this can be said about everyones favorite anime Vampire Hunter D
8
-----
I must admit, out of the EROS MOVIE COLLECTION, this has to be the one that I love the most as well as o

Batches: 100%|███████████████████████████████████████████████████████████████████████| 782/782 [03:43<00:00,  3.50it/s]


tensor([[1.0000, 0.9457, 0.9744,  ..., 0.0504, 0.0359, 0.0272],
        [0.9457, 1.0000, 0.9480,  ..., 0.0671, 0.0452, 0.0323],
        [0.9744, 0.9480, 1.0000,  ..., 0.0480, 0.0315, 0.0267],
        ...,
        [0.0504, 0.0671, 0.0480,  ..., 1.0000, 0.9716, 0.9681],
        [0.0359, 0.0452, 0.0315,  ..., 0.9716, 1.0000, 0.9835],
        [0.0272, 0.0323, 0.0267,  ..., 0.9681, 0.9835, 1.0000]])
[0.29171646 0.         0.         0.01768552 0.12590608 0.
 0.         0.0595879  0.         0.17915688 0.         0.00160482
 0.         0.01703718 0.         0.         0.         0.04743262
 0.03839002 0.         0.04364038 0.         0.         0.
 0.         0.3771691  0.         0.02885771 0.         0.
 0.         0.         0.         0.16622043 0.         0.
 0.         0.         0.         0.0919247  0.         0.
 0.         0.         0.         0.25631836 0.22993614 0.
 0.         0.         0.02403845 0.         0.         0.
 0.05380134 0.         0.         0.         0.32148594

In [63]:
model.save('sBERT_IMBD_Embedding_Model')

In [38]:
our_model = SentenceTransformer('sBERT_IMBD_Embedding_Model')
basic_model = SentenceTransformer('all-MiniLM-L6-v2', device='cuda')

model = basic_model

pos_data = np.array([text for text, rating in train_data['pos']])
neg_data = np.array([text for text, rating in train_data['neg']])

n = 100
pos_sample = pos_data[np.random.randint(0, len(pos_data), (n,2))]
neg_sample = neg_data[np.random.randint(0, len(neg_data), (n,2))]

avg = 0
for pair in pos_sample:
    embeddings = model.encode(pair, normalize_embeddings=True)
    cos_sim = np.dot(embeddings[0], embeddings[1])
    avg += cos_sim
print(f'Average of Cosine Similarity between positive reviews:\n{float(avg)/n}')

avg = 0
for pair in neg_sample:
    embeddings = model.encode(pair, normalize_embeddings=True)
    cos_sim = np.dot(embeddings[0], embeddings[1])
    avg += cos_sim
print(f'Average of Cosine Similarity between negative reviews:\n{float(avg)/n}')

avg = 0
for pair in zip(pos_sample[:,0], neg_sample[:,0]):
    embeddings = model.encode(pair, normalize_embeddings=True)
    cos_sim = np.dot(embeddings[0], embeddings[1])
    avg += cos_sim
print(f'Average of Cosine Similarity between different polarity reviews:\n{float(avg)/n}')



# pos_embeddings = our_model.encode(pos_sample, normalize_embeddings=True, show_progress_bar=True)
# neg_embeddings = our_model.encode(neg_sample, normalize_embeddings=True, show_progress_bar=True)

# print(pos_embeddings.shape)
# print('positive embedding similarity')
# pos_sim = util.cos_sim(pos_embeddings, pos_embeddings)
# print(pos_sim)
# print(pos_sim.shape)
# print()


Average of Cosine Similarity between positive reviews:
0.2943987012282014
Average of Cosine Similarity between negative reviews:
0.3267371230572462
Average of Cosine Similarity between different polarity reviews:
0.30120386272668837
