In [14]:
import torch
from torch import topk
from transformers import BertTokenizer, BertForMaskedLM
from datasets import load_dataset
import numpy as np
from numpy.random import randint
from torch.nn.functional import softmax

In [15]:
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForMaskedLM.from_pretrained('bert-base-uncased')
inputs = tokenizer("The capital of France is [MASK].", return_tensors="pt")
labels = tokenizer("The capital of France is Paris.", return_tensors="pt")["input_ids"]
outputs = model(**inputs, labels=labels)
loss = outputs.loss
logits = outputs.logits

Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertForMaskedLM: ['cls.seq_relationship.bias', 'cls.seq_relationship.weight']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [16]:
wikitext2 = load_dataset('wikitext', 'wikitext-2-v1')

Reusing dataset wikitext (/Users/luke/.cache/huggingface/datasets/wikitext/wikitext-2-v1/1.0.0/aa5e094000ec7afeb74c3be92c88313cd6f132d564c7effd961c10fd47c76f20)


In [17]:
cleaned = [x['text'].strip() for x in wikitext2['test']]
cleaned = [x for x in cleaned if(len(x) > 50)]

In [59]:
wiki_clean = [x for x in cleaned if len(tokenizer(x)['input_ids']) <= 512]

In [109]:
def get_random_sequences(data, num=10_000, max_seq_len=512):
    response = []
    
    # get num sentences corresponding to random indices and tokenize them
    lines = [data[i] for i in randint(len(data), size=num)]
    
    response = []
    
    while len(response) < num:
        line = data[randint(len(data))]
        text = line.split(' ')
        idx = randint(len(text))
        text[idx] = '[MASK]'
        masked = ' '.join(text)
        
        if len(tokenizer(masked)['input_ids']) > max_seq_len:
            continue
            
        response.append((line, masked))
    
    return response

In [None]:
def get_random_sequence_fixed():
    

In [108]:
def masked_prediction(text, masked, model):
    tokenized_text = tokenizer.tokenize(text)
    tokenized_masked = tokenizer.tokenize(masked)
    token_ids = tokenizer.convert_tokens_to_ids(tokenized_masked)
    mask_idx = token_ids.index(103)
    actual = tokenized_text[mask_idx]
    
    with torch.no_grad():
        predictions = model(torch.tensor([token_ids]))[0]

    probs = softmax(predictions[0, mask_idx], dim=-1)
    top_k_weights, top_k_indices = torch.topk(probs, 1)
    
    for i, pred_idx in enumerate(top_k_indices):
        predicted_token = tokenizer.convert_ids_to_tokens([pred_idx])[0]
        token_weight = top_k_weights[i]
        
    return {'predicted': predicted_token, 'actual': actual, 'mask_idx': mask_idx, 'num_tokens': len(token_ids)}

In [110]:
sequences = get_random_sequences(cleaned)

In [113]:
performance = []
for i,seq in enumerate(sequences):
    x = masked_prediction(seq[0], seq[1], model)
    print(f'{i+1}/{len(sequences)} ({int((i+1)*100/len(sequences))}%)\t {x}')
    performance.append(x)

1/10000 (0%)	 {'predicted': 'next', 'actual': 'following', 'mask_idx': 169}
2/10000 (0%)	 {'predicted': 'armor', 'actual': 'armor', 'mask_idx': 58}
3/10000 (0%)	 {'predicted': 'refers', 'actual': 'refers', 'mask_idx': 58}
4/10000 (0%)	 {'predicted': 'designs', 'actual': 'works', 'mask_idx': 53}
5/10000 (0%)	 {'predicted': 'those', 'actual': 'those', 'mask_idx': 110}
6/10000 (0%)	 {'predicted': '2', 'actual': '46', 'mask_idx': 150}
7/10000 (0%)	 {'predicted': 'which', 'actual': 'which', 'mask_idx': 27}
8/10000 (0%)	 {'predicted': 'game', 'actual': 'game', 'mask_idx': 77}
9/10000 (0%)	 {'predicted': 'is', 'actual': ',', 'mask_idx': 1}
10/10000 (0%)	 {'predicted': '2', 'actual': '3', 'mask_idx': 48}
11/10000 (0%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 54}
12/10000 (0%)	 {'predicted': 'furthermore', 'actual': 'long', 'mask_idx': 1}
13/10000 (0%)	 {'predicted': 'steel', 'actual': 'wood', 'mask_idx': 6}
14/10000 (0%)	 {'predicted': '.', 'actual': 'from', 'mask_idx': 15}
15/10000 

118/10000 (1%)	 {'predicted': 'the', 'actual': 'ars', 'mask_idx': 185}
119/10000 (1%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 28}
120/10000 (1%)	 {'predicted': ',', 'actual': '<', 'mask_idx': 13}
121/10000 (1%)	 {'predicted': 'large', 'actual': 'broad', 'mask_idx': 7}
122/10000 (1%)	 {'predicted': 'heard', 'actual': 'learned', 'mask_idx': 151}
123/10000 (1%)	 {'predicted': '1', 'actual': '1', 'mask_idx': 47}
124/10000 (1%)	 {'predicted': 'hire', 'actual': 'hire', 'mask_idx': 193}
125/10000 (1%)	 {'predicted': 'at', 'actual': 'at', 'mask_idx': 154}
126/10000 (1%)	 {'predicted': 'use', 'actual': 'favour', 'mask_idx': 6}
127/10000 (1%)	 {'predicted': 'way', 'actual': 'way', 'mask_idx': 138}
128/10000 (1%)	 {'predicted': '-', 'actual': '<', 'mask_idx': 53}
129/10000 (1%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 32}
130/10000 (1%)	 {'predicted': 'submarines', 'actual': '<', 'mask_idx': 144}
131/10000 (1%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 80}
132/10000 (1%)	 {'

232/10000 (2%)	 {'predicted': 'tons', 'actual': 't', 'mask_idx': 68}
233/10000 (2%)	 {'predicted': 'creek', 'actual': 'creek', 'mask_idx': 161}
234/10000 (2%)	 {'predicted': 'organization', 'actual': 'organization', 'mask_idx': 53}
235/10000 (2%)	 {'predicted': 'great', 'actual': 'remarkable', 'mask_idx': 125}
236/10000 (2%)	 {'predicted': 'loan', 'actual': 'loan', 'mask_idx': 18}
237/10000 (2%)	 {'predicted': 'may', 'actual': 'february', 'mask_idx': 138}
238/10000 (2%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 13}
239/10000 (2%)	 {'predicted': 'most', 'actual': 'several', 'mask_idx': 40}
240/10000 (2%)	 {'predicted': 'his', 'actual': "'", 'mask_idx': 168}
241/10000 (2%)	 {'predicted': 'also', 'actual': 'also', 'mask_idx': 38}
242/10000 (2%)	 {'predicted': '.', 'actual': '@', 'mask_idx': 106}
243/10000 (2%)	 {'predicted': 'would', 'actual': 'would', 'mask_idx': 92}
244/10000 (2%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 32}
245/10000 (2%)	 {'predicted': 'the', 'actual': 

346/10000 (3%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 11}
347/10000 (3%)	 {'predicted': 'had', 'actual': 'mysteriously', 'mask_idx': 287}
348/10000 (3%)	 {'predicted': 'large', 'actual': 'small', 'mask_idx': 90}
349/10000 (3%)	 {'predicted': 'he', 'actual': 'he', 'mask_idx': 81}
350/10000 (3%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 10}
351/10000 (3%)	 {'predicted': 'have', 'actual': 'have', 'mask_idx': 25}
352/10000 (3%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 56}
353/10000 (3%)	 {'predicted': 'making', 'actual': 'making', 'mask_idx': 22}
354/10000 (3%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 35}
355/10000 (3%)	 {'predicted': 'from', 'actual': 'to', 'mask_idx': 58}
356/10000 (3%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 88}
357/10000 (3%)	 {'predicted': 'property', 'actual': 'assets', 'mask_idx': 125}
358/10000 (3%)	 {'predicted': 'indeed', 'actual': 'however', 'mask_idx': 21}
359/10000 (3%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 14}
36

461/10000 (4%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 78}
462/10000 (4%)	 {'predicted': 'him', 'actual': '<', 'mask_idx': 71}
463/10000 (4%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 63}
464/10000 (4%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 17}
465/10000 (4%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 9}
466/10000 (4%)	 {'predicted': 'of', 'actual': 'rene', 'mask_idx': 48}
467/10000 (4%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 59}
468/10000 (4%)	 {'predicted': 'language', 'actual': '<', 'mask_idx': 39}
469/10000 (4%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 25}
470/10000 (4%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 79}
471/10000 (4%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 128}
472/10000 (4%)	 {'predicted': 'that', 'actual': 'that', 'mask_idx': 54}
473/10000 (4%)	 {'predicted': 'away', 'actual': 'away', 'mask_idx': 146}
474/10000 (4%)	 {'predicted': '"', 'actual': 'major', 'mask_idx': 4}
475/10000 (4%)	 {'predicted': 'hi

576/10000 (5%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 161}
577/10000 (5%)	 {'predicted': ',', 'actual': 'for', 'mask_idx': 30}
578/10000 (5%)	 {'predicted': 'cup', 'actual': 'cup', 'mask_idx': 155}
579/10000 (5%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 147}
580/10000 (5%)	 {'predicted': '50', 'actual': '800', 'mask_idx': 105}
581/10000 (5%)	 {'predicted': 'city', 'actual': 'area', 'mask_idx': 76}
582/10000 (5%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 81}
583/10000 (5%)	 {'predicted': '4th', 'actual': '19th', 'mask_idx': 324}
584/10000 (5%)	 {'predicted': '.', 'actual': 'to', 'mask_idx': 0}
585/10000 (5%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 27}
586/10000 (5%)	 {'predicted': 'late', 'actual': 'late', 'mask_idx': 36}
587/10000 (5%)	 {'predicted': 'management', 'actual': 'finance', 'mask_idx': 73}
588/10000 (5%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 11}
589/10000 (5%)	 {'predicted': 'armed', 'actual': 'auxiliary', 'mask_idx': 32}
590/10

691/10000 (6%)	 {'predicted': 'scholars', 'actual': 'historians', 'mask_idx': 117}
692/10000 (6%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 164}
693/10000 (6%)	 {'predicted': 'densely', 'actual': 'densely', 'mask_idx': 4}
694/10000 (6%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 85}
695/10000 (6%)	 {'predicted': ',', 'actual': 'and', 'mask_idx': 111}
696/10000 (6%)	 {'predicted': 'as', 'actual': 'class', 'mask_idx': 10}
697/10000 (6%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 67}
698/10000 (6%)	 {'predicted': 'jefferson', 'actual': 'ono', 'mask_idx': 139}
699/10000 (6%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 74}
700/10000 (7%)	 {'predicted': '.', 'actual': 'september', 'mask_idx': 5}
701/10000 (7%)	 {'predicted': 'he', 'actual': 'he', 'mask_idx': 33}
702/10000 (7%)	 {'predicted': 'from', 'actual': '—', 'mask_idx': 134}
703/10000 (7%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 203}
704/10000 (7%)	 {'predicted': 'collect', 'actual': 'gather', 'mask_idx

806/10000 (8%)	 {'predicted': ',', 'actual': '<', 'mask_idx': 181}
807/10000 (8%)	 {'predicted': '.', 'actual': '<', 'mask_idx': 5}
808/10000 (8%)	 {'predicted': 'typhoon', 'actual': 'striking', 'mask_idx': 106}
809/10000 (8%)	 {'predicted': 'wife', 'actual': 'fiancee', 'mask_idx': 19}
810/10000 (8%)	 {'predicted': 'large', 'actual': 'small', 'mask_idx': 104}
811/10000 (8%)	 {'predicted': 'deaths', 'actual': 'loss', 'mask_idx': 69}
812/10000 (8%)	 {'predicted': "'", 'actual': '’', 'mask_idx': 140}
813/10000 (8%)	 {'predicted': 'in', 'actual': 'the', 'mask_idx': 1}
814/10000 (8%)	 {'predicted': 'mi', 'actual': 'mi', 'mask_idx': 50}
815/10000 (8%)	 {'predicted': 'of', 'actual': 'near', 'mask_idx': 162}
816/10000 (8%)	 {'predicted': 'state', 'actual': 'treasury', 'mask_idx': 72}
817/10000 (8%)	 {'predicted': 'in', 'actual': 'released', 'mask_idx': 13}
818/10000 (8%)	 {'predicted': 'ware', 'actual': 'ware', 'mask_idx': 154}
819/10000 (8%)	 {'predicted': 'casualties', 'actual': 'sailors', '

920/10000 (9%)	 {'predicted': 'modest', 'actual': 'uneven', 'mask_idx': 41}
921/10000 (9%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 102}
922/10000 (9%)	 {'predicted': 'is', 'actual': 'or', 'mask_idx': 13}
923/10000 (9%)	 {'predicted': 'which', 'actual': 'which', 'mask_idx': 82}
924/10000 (9%)	 {'predicted': 'to', 'actual': 'in', 'mask_idx': 43}
925/10000 (9%)	 {'predicted': 'at', 'actual': 'at', 'mask_idx': 98}
926/10000 (9%)	 {'predicted': 'entire', 'actual': 'professional', 'mask_idx': 43}
927/10000 (9%)	 {'predicted': 'bought', 'actual': 'purchased', 'mask_idx': 210}
928/10000 (9%)	 {'predicted': 'it', 'actual': '<', 'mask_idx': 207}
929/10000 (9%)	 {'predicted': 'more', 'actual': 'direct', 'mask_idx': 187}
930/10000 (9%)	 {'predicted': 'material', 'actual': 'material', 'mask_idx': 10}
931/10000 (9%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 15}
932/10000 (9%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 37}
933/10000 (9%)	 {'predicted': 'losing', 'actual': 'losing'

1033/10000 (10%)	 {'predicted': 'is', 'actual': '<', 'mask_idx': 7}
1034/10000 (10%)	 {'predicted': 'own', 'actual': 'aircraft', 'mask_idx': 77}
1035/10000 (10%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 41}
1036/10000 (10%)	 {'predicted': 'level', 'actual': 'c', 'mask_idx': 18}
1037/10000 (10%)	 {'predicted': 'york', 'actual': '<', 'mask_idx': 9}
1038/10000 (10%)	 {'predicted': 'assigned', 'actual': 'attributed', 'mask_idx': 121}
1039/10000 (10%)	 {'predicted': 'city', 'actual': 'suburbs', 'mask_idx': 33}
1040/10000 (10%)	 {'predicted': 'the', 'actual': 'central', 'mask_idx': 11}
1041/10000 (10%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 59}
1042/10000 (10%)	 {'predicted': 'all', 'actual': 'track', 'mask_idx': 8}
1043/10000 (10%)	 {'predicted': 'times', 'actual': 'times', 'mask_idx': 36}
1044/10000 (10%)	 {'predicted': 'league', 'actual': 'league', 'mask_idx': 99}
1045/10000 (10%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 52}
1046/10000 (10%)	 {'predicted': '1837'

1145/10000 (11%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 146}
1146/10000 (11%)	 {'predicted': 'were', 'actual': 'were', 'mask_idx': 149}
1147/10000 (11%)	 {'predicted': 'point', 'actual': 'range', 'mask_idx': 56}
1148/10000 (11%)	 {'predicted': 'known', 'actual': 'known', 'mask_idx': 70}
1149/10000 (11%)	 {'predicted': 'may', 'actual': 'september', 'mask_idx': 6}
1150/10000 (11%)	 {'predicted': '.', 'actual': 'gallery', 'mask_idx': 16}
1151/10000 (11%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 21}
1152/10000 (11%)	 {'predicted': ',', 'actual': 'for', 'mask_idx': 141}
1153/10000 (11%)	 {'predicted': 'how', 'actual': 'how', 'mask_idx': 59}
1154/10000 (11%)	 {'predicted': 'out', 'actual': 'the', 'mask_idx': 112}
1155/10000 (11%)	 {'predicted': 'rome', 'actual': 'rome', 'mask_idx': 101}
1156/10000 (11%)	 {'predicted': '.', 'actual': '<', 'mask_idx': 32}
1157/10000 (11%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 58}
1158/10000 (11%)	 {'predicted': 'storms', 'actual': 

1257/10000 (12%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 115}
1258/10000 (12%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 20}
1259/10000 (12%)	 {'predicted': 'attack', 'actual': 'raid', 'mask_idx': 41}
1260/10000 (12%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 10}
1261/10000 (12%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 18}
1262/10000 (12%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 113}
1263/10000 (12%)	 {'predicted': 'on', 'actual': 'on', 'mask_idx': 74}
1264/10000 (12%)	 {'predicted': 'less', 'actual': 'resemble', 'mask_idx': 27}
1265/10000 (12%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 87}
1266/10000 (12%)	 {'predicted': '10', 'actual': '30', 'mask_idx': 114}
1267/10000 (12%)	 {'predicted': 'at', 'actual': 'in', 'mask_idx': 10}
1268/10000 (12%)	 {'predicted': 'two', 'actual': 'two', 'mask_idx': 110}
1269/10000 (12%)	 {'predicted': '.', 'actual': ',', 'mask_idx': 2}
1270/10000 (12%)	 {'predicted': 'to', 'actual': 'against', 'mask_idx': 50}
1271

1370/10000 (13%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 220}
1371/10000 (13%)	 {'predicted': 'could', 'actual': 'could', 'mask_idx': 42}
1372/10000 (13%)	 {'predicted': '.', 'actual': 'note', 'mask_idx': 0}
1373/10000 (13%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 112}
1374/10000 (13%)	 {'predicted': 'canal', 'actual': 'canal', 'mask_idx': 121}
1375/10000 (13%)	 {'predicted': 'the', 'actual': 'at', 'mask_idx': 97}
1376/10000 (13%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 118}
1377/10000 (13%)	 {'predicted': 'david', 'actual': 'ben', 'mask_idx': 188}
1378/10000 (13%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 19}
1379/10000 (13%)	 {'predicted': 'the', 'actual': 'his', 'mask_idx': 75}
1380/10000 (13%)	 {'predicted': 'time', 'actual': 'year', 'mask_idx': 3}
1381/10000 (13%)	 {'predicted': 'same', 'actual': 'iron', 'mask_idx': 44}
1382/10000 (13%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 8}
1383/10000 (13%)	 {'predicted': 'lines', 'actual': 'scen

1483/10000 (14%)	 {'predicted': '13', 'actual': '40', 'mask_idx': 240}
1484/10000 (14%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 33}
1485/10000 (14%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 7}
1486/10000 (14%)	 {'predicted': 'was', 'actual': 'was', 'mask_idx': 35}
1487/10000 (14%)	 {'predicted': 'clock', 'actual': 'clock', 'mask_idx': 120}
1488/10000 (14%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 122}
1489/10000 (14%)	 {'predicted': '-', 'actual': '–', 'mask_idx': 40}
1490/10000 (14%)	 {'predicted': 'modified', 'actual': 'modified', 'mask_idx': 7}
1491/10000 (14%)	 {'predicted': 'long', 'actual': 'long', 'mask_idx': 5}
1492/10000 (14%)	 {'predicted': 'dead', 'actual': 'in', 'mask_idx': 138}
1493/10000 (14%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 117}
1494/10000 (14%)	 {'predicted': 'scott', 'actual': 'henry', 'mask_idx': 6}
1495/10000 (14%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 193}
1496/10000 (14%)	 {'predicted': 'some', 'actual': 'some'

1595/10000 (15%)	 {'predicted': 'he', 'actual': 'he', 'mask_idx': 30}
1596/10000 (15%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 156}
1597/10000 (15%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 28}
1598/10000 (15%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 89}
1599/10000 (15%)	 {'predicted': 'left', 'actual': 'offshore', 'mask_idx': 220}
1600/10000 (16%)	 {'predicted': 'engines', 'actual': 'power', 'mask_idx': 34}
1601/10000 (16%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 111}
1602/10000 (16%)	 {'predicted': 'under', 'actual': 'under', 'mask_idx': 25}
1603/10000 (16%)	 {'predicted': 'for', 'actual': 'for', 'mask_idx': 135}
1604/10000 (16%)	 {'predicted': 'the', 'actual': 'manchester', 'mask_idx': 4}
1605/10000 (16%)	 {'predicted': 'the', 'actual': 'their', 'mask_idx': 136}
1606/10000 (16%)	 {'predicted': 'old', 'actual': 'un', 'mask_idx': 286}
1607/10000 (16%)	 {'predicted': ':', 'actual': '295', 'mask_idx': 7}
1608/10000 (16%)	 {'predicted': '"', 'actual': '"'

1707/10000 (17%)	 {'predicted': 'making', 'actual': 'making', 'mask_idx': 87}
1708/10000 (17%)	 {'predicted': 'from', 'actual': 'to', 'mask_idx': 170}
1709/10000 (17%)	 {'predicted': 'a', 'actual': 'the', 'mask_idx': 202}
1710/10000 (17%)	 {'predicted': 'game', 'actual': 'time', 'mask_idx': 31}
1711/10000 (17%)	 {'predicted': 'raw', 'actual': 'night', 'mask_idx': 2}
1712/10000 (17%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 81}
1713/10000 (17%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 23}
1714/10000 (17%)	 {'predicted': 'of', 'actual': 'about', 'mask_idx': 24}
1715/10000 (17%)	 {'predicted': '"', 'actual': 'road', 'mask_idx': 97}
1716/10000 (17%)	 {'predicted': 'war', 'actual': 'war', 'mask_idx': 10}
1717/10000 (17%)	 {'predicted': 'us', 'actual': 'un', 'mask_idx': 84}
1718/10000 (17%)	 {'predicted': 'itunes', 'actual': 'itunes', 'mask_idx': 148}
1719/10000 (17%)	 {'predicted': 'thought', 'actual': 'intended', 'mask_idx': 139}
1720/10000 (17%)	 {'predicted': 'christmas', 'ac

1819/10000 (18%)	 {'predicted': 'coach', 'actual': 'coach', 'mask_idx': 47}
1820/10000 (18%)	 {'predicted': 'with', 'actual': 'with', 'mask_idx': 135}
1821/10000 (18%)	 {'predicted': 'negative', 'actual': 'autobiographical', 'mask_idx': 5}
1822/10000 (18%)	 {'predicted': 'renamed', 'actual': 'amended', 'mask_idx': 14}
1823/10000 (18%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 181}
1824/10000 (18%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 78}
1825/10000 (18%)	 {'predicted': 'stated', 'actual': 'commented', 'mask_idx': 10}
1826/10000 (18%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 4}
1827/10000 (18%)	 {'predicted': 'and', 'actual': '.', 'mask_idx': 52}
1828/10000 (18%)	 {'predicted': 'candidates', 'actual': 'choices', 'mask_idx': 69}
1829/10000 (18%)	 {'predicted': 'was', 'actual': 'design', 'mask_idx': 15}
1830/10000 (18%)	 {'predicted': 'eastern', 'actual': 'west', 'mask_idx': 53}
1831/10000 (18%)	 {'predicted': 'where', 'actual': 'where', 'mask_idx': 10}
1832/1

1931/10000 (19%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 88}
1932/10000 (19%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 8}
1933/10000 (19%)	 {'predicted': 'in', 'actual': 'even', 'mask_idx': 42}
1934/10000 (19%)	 {'predicted': 'day', 'actual': 'day', 'mask_idx': 17}
1935/10000 (19%)	 {'predicted': 'the', 'actual': 'remembrance', 'mask_idx': 13}
1936/10000 (19%)	 {'predicted': 'continued', 'actual': 'continued', 'mask_idx': 55}
1937/10000 (19%)	 {'predicted': 'also', 'actual': 'also', 'mask_idx': 27}
1938/10000 (19%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 24}
1939/10000 (19%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 21}
1940/10000 (19%)	 {'predicted': 'williams', 'actual': '<', 'mask_idx': 126}
1941/10000 (19%)	 {'predicted': 'small', 'actual': 'large', 'mask_idx': 45}
1942/10000 (19%)	 {'predicted': 'time', 'actual': 'time', 'mask_idx': 122}
1943/10000 (19%)	 {'predicted': 'both', 'actual': 'called', 'mask_idx': 137}
1944/10000 (19%)	 {'predicted': 'to

2043/10000 (20%)	 {'predicted': 'owned', 'actual': 'administered', 'mask_idx': 148}
2044/10000 (20%)	 {'predicted': 'imperial', 'actual': 'imperial', 'mask_idx': 2}
2045/10000 (20%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 119}
2046/10000 (20%)	 {'predicted': 'tropical', 'actual': 'tropical', 'mask_idx': 122}
2047/10000 (20%)	 {'predicted': 'of', 'actual': 'early', 'mask_idx': 92}
2048/10000 (20%)	 {'predicted': 'portraits', 'actual': 'portraits', 'mask_idx': 159}
2049/10000 (20%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 58}
2050/10000 (20%)	 {'predicted': 'a', 'actual': 'is', 'mask_idx': 8}
2051/10000 (20%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 157}
2052/10000 (20%)	 {'predicted': 'joined', 'actual': 'joined', 'mask_idx': 6}
2053/10000 (20%)	 {'predicted': 'ss', 'actual': 'of', 'mask_idx': 176}
2054/10000 (20%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 9}
2055/10000 (20%)	 {'predicted': 'lead', 'actual': 'contribute', 'mask_idx': 94}
2056/10000 (2

2154/10000 (21%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 42}
2155/10000 (21%)	 {'predicted': 'through', 'actual': 'across', 'mask_idx': 68}
2156/10000 (21%)	 {'predicted': '##0', 'actual': '1000', 'mask_idx': 161}
2157/10000 (21%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 109}
2158/10000 (21%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 54}
2159/10000 (21%)	 {'predicted': 'from', 'actual': 'to', 'mask_idx': 128}
2160/10000 (21%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 32}
2161/10000 (21%)	 {'predicted': '%', 'actual': 'million', 'mask_idx': 5}
2162/10000 (21%)	 {'predicted': 'the', 'actual': 'coordinating', 'mask_idx': 20}
2163/10000 (21%)	 {'predicted': 'tournament', 'actual': 'tournament', 'mask_idx': 134}
2164/10000 (21%)	 {'predicted': 'of', 'actual': 'named', 'mask_idx': 69}
2165/10000 (21%)	 {'predicted': 'hong', 'actual': '<', 'mask_idx': 46}
2166/10000 (21%)	 {'predicted': 'covered', 'actual': 'monitored', 'mask_idx': 178}
2167/10000 (21%)	 {'predict

2266/10000 (22%)	 {'predicted': 'september', 'actual': 'october', 'mask_idx': 240}
2267/10000 (22%)	 {'predicted': '.', 'actual': 'club', 'mask_idx': 175}
2268/10000 (22%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 76}
2269/10000 (22%)	 {'predicted': 'period', 'actual': 'loop', 'mask_idx': 195}
2270/10000 (22%)	 {'predicted': 'company', 'actual': 'company', 'mask_idx': 156}
2271/10000 (22%)	 {'predicted': 'get', 'actual': 'get', 'mask_idx': 200}
2272/10000 (22%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 43}
2273/10000 (22%)	 {'predicted': 'and', 'actual': 'to', 'mask_idx': 86}
2274/10000 (22%)	 {'predicted': 'asked', 'actual': 'encouraged', 'mask_idx': 149}
2275/10000 (22%)	 {'predicted': 'using', 'actual': 'retaining', 'mask_idx': 54}
2276/10000 (22%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 141}
2277/10000 (22%)	 {'predicted': '.', 'actual': '<', 'mask_idx': 34}
2278/10000 (22%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 116}
2279/10000 (22%)	 {'predicted': 'hi

2380/10000 (23%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 45}
2381/10000 (23%)	 {'predicted': 'school', 'actual': 'school', 'mask_idx': 12}
2382/10000 (23%)	 {'predicted': 'team', 'actual': 'team', 'mask_idx': 35}
2383/10000 (23%)	 {'predicted': '2005', 'actual': '2005', 'mask_idx': 81}
2384/10000 (23%)	 {'predicted': 'in', 'actual': 'oil', 'mask_idx': 95}
2385/10000 (23%)	 {'predicted': 'signed', 'actual': 'signed', 'mask_idx': 6}
2386/10000 (23%)	 {'predicted': 'and', 'actual': 'having', 'mask_idx': 96}
2387/10000 (23%)	 {'predicted': '-', 'actual': 'line', 'mask_idx': 153}
2388/10000 (23%)	 {'predicted': ',', 'actual': '@', 'mask_idx': 26}
2389/10000 (23%)	 {'predicted': 'japanese', 'actual': 'japanese', 'mask_idx': 31}
2390/10000 (23%)	 {'predicted': '"', 'actual': '=', 'mask_idx': 3}
2391/10000 (23%)	 {'predicted': '"', 'actual': 'campaign', 'mask_idx': 8}
2392/10000 (23%)	 {'predicted': 'growth', 'actual': 'presence', 'mask_idx': 83}
2393/10000 (23%)	 {'predicted': 'in', 'a

2493/10000 (24%)	 {'predicted': 'squadron', 'actual': 'role', 'mask_idx': 22}
2494/10000 (24%)	 {'predicted': 'he', 'actual': 'smith', 'mask_idx': 19}
2495/10000 (24%)	 {'predicted': ',', 'actual': '<', 'mask_idx': 13}
2496/10000 (24%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 47}
2497/10000 (24%)	 {'predicted': '-', 'actual': '<', 'mask_idx': 8}
2498/10000 (24%)	 {'predicted': 'between', 'actual': 'between', 'mask_idx': 86}
2499/10000 (24%)	 {'predicted': 'general', 'actual': 'commander', 'mask_idx': 49}
2500/10000 (25%)	 {'predicted': 'charles', 'actual': 'hermann', 'mask_idx': 151}
2501/10000 (25%)	 {'predicted': 'he', 'actual': '<', 'mask_idx': 95}
2502/10000 (25%)	 {'predicted': 'known', 'actual': 'known', 'mask_idx': 103}
2503/10000 (25%)	 {'predicted': '31', 'actual': '18', 'mask_idx': 71}
2504/10000 (25%)	 {'predicted': 'whole', 'actual': 'real', 'mask_idx': 106}
2505/10000 (25%)	 {'predicted': 'gym', 'actual': 'gym', 'mask_idx': 57}
2506/10000 (25%)	 {'predicted': ',', 

2605/10000 (26%)	 {'predicted': "'", 'actual': "'", 'mask_idx': 60}
2606/10000 (26%)	 {'predicted': 'student', 'actual': 'third', 'mask_idx': 52}
2607/10000 (26%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 56}
2608/10000 (26%)	 {'predicted': 'modern', 'actual': 'armored', 'mask_idx': 34}
2609/10000 (26%)	 {'predicted': 'position', 'actual': '<', 'mask_idx': 146}
2610/10000 (26%)	 {'predicted': 'industrial', 'actual': 'industrial', 'mask_idx': 94}
2611/10000 (26%)	 {'predicted': 'on', 'actual': 'through', 'mask_idx': 116}
2612/10000 (26%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 13}
2613/10000 (26%)	 {'predicted': 'with', 'actual': 'with', 'mask_idx': 43}
2614/10000 (26%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 31}
2615/10000 (26%)	 {'predicted': 'received', 'actual': 'won', 'mask_idx': 70}
2616/10000 (26%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 58}
2617/10000 (26%)	 {'predicted': 'freedom', 'actual': '<', 'mask_idx': 50}
2618/10000 (26%)	 {'predicte

2716/10000 (27%)	 {'predicted': 'listed', 'actual': 'classified', 'mask_idx': 100}
2717/10000 (27%)	 {'predicted': 'number', 'actual': 'number', 'mask_idx': 190}
2718/10000 (27%)	 {'predicted': 'than', 'actual': 'than', 'mask_idx': 56}
2719/10000 (27%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 47}
2720/10000 (27%)	 {'predicted': 'gather', 'actual': 'receive', 'mask_idx': 93}
2721/10000 (27%)	 {'predicted': 'miles', 'actual': 'blocks', 'mask_idx': 11}
2722/10000 (27%)	 {'predicted': 'with', 'actual': 'with', 'mask_idx': 100}
2723/10000 (27%)	 {'predicted': 'side', 'actual': 'hemisphere', 'mask_idx': 82}
2724/10000 (27%)	 {'predicted': 'his', 'actual': "'", 'mask_idx': 4}
2725/10000 (27%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 75}
2726/10000 (27%)	 {'predicted': 'island', 'actual': 'island', 'mask_idx': 86}
2727/10000 (27%)	 {'predicted': 'intersection', 'actual': 'intersection', 'mask_idx': 65}
2728/10000 (27%)	 {'predicted': 'are', 'actual': 'was', 'mask_idx': 141}

2827/10000 (28%)	 {'predicted': 'by', 'actual': 'top', 'mask_idx': 148}
2828/10000 (28%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 103}
2829/10000 (28%)	 {'predicted': '5', 'actual': 'three', 'mask_idx': 44}
2830/10000 (28%)	 {'predicted': 'only', 'actual': 'last', 'mask_idx': 102}
2831/10000 (28%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 172}
2832/10000 (28%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 19}
2833/10000 (28%)	 {'predicted': 'the', 'actual': 'rear', 'mask_idx': 121}
2834/10000 (28%)	 {'predicted': 'replaced', 'actual': 'furnished', 'mask_idx': 25}
2835/10000 (28%)	 {'predicted': 'with', 'actual': 'with', 'mask_idx': 15}
2836/10000 (28%)	 {'predicted': '.', 'actual': 'austrian', 'mask_idx': 0}
2837/10000 (28%)	 {'predicted': 'crop', 'actual': 'agricultural', 'mask_idx': 172}
2838/10000 (28%)	 {'predicted': 'contents', 'actual': 'works', 'mask_idx': 72}
2839/10000 (28%)	 {'predicted': 'normal', 'actual': 'previous', 'mask_idx': 178}
2840/10000 (28%)	

2939/10000 (29%)	 {'predicted': 'is', 'actual': "'", 'mask_idx': 320}
2940/10000 (29%)	 {'predicted': 'then', 'actual': 'embraced', 'mask_idx': 56}
2941/10000 (29%)	 {'predicted': 'alberto', 'actual': 'however', 'mask_idx': 34}
2942/10000 (29%)	 {'predicted': ',', 'actual': '—', 'mask_idx': 36}
2943/10000 (29%)	 {'predicted': 'participation', 'actual': 'involvement', 'mask_idx': 74}
2944/10000 (29%)	 {'predicted': '.', 'actual': 'of', 'mask_idx': 30}
2945/10000 (29%)	 {'predicted': 'sides', 'actual': 'parties', 'mask_idx': 82}
2946/10000 (29%)	 {'predicted': 'hubbard', 'actual': '<', 'mask_idx': 71}
2947/10000 (29%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 74}
2948/10000 (29%)	 {'predicted': 'most', 'actual': 'most', 'mask_idx': 111}
2949/10000 (29%)	 {'predicted': 'c', 'actual': 'c', 'mask_idx': 58}
2950/10000 (29%)	 {'predicted': 'realistic', 'actual': 'bleak', 'mask_idx': 101}
2951/10000 (29%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 60}
2952/10000 (29%)	 {'predicted

3051/10000 (30%)	 {'predicted': 'its', 'actual': 'weak', 'mask_idx': 233}
3052/10000 (30%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 90}
3053/10000 (30%)	 {'predicted': 'life', 'actual': 'affairs', 'mask_idx': 43}
3054/10000 (30%)	 {'predicted': 'attention', 'actual': 'thought', 'mask_idx': 79}
3055/10000 (30%)	 {'predicted': 'days', 'actual': 'days', 'mask_idx': 39}
3056/10000 (30%)	 {'predicted': '/', 'actual': '/', 'mask_idx': 110}
3057/10000 (30%)	 {'predicted': 'childbirth', 'actual': '65', 'mask_idx': 17}
3058/10000 (30%)	 {'predicted': 'southeast', 'actual': 'southeast', 'mask_idx': 89}
3059/10000 (30%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 15}
3060/10000 (30%)	 {'predicted': 'entertainment', 'actual': 'entertainment', 'mask_idx': 144}
3061/10000 (30%)	 {'predicted': 'course', 'actual': 'track', 'mask_idx': 127}
3062/10000 (30%)	 {'predicted': 'being', 'actual': 'since', 'mask_idx': 145}
3063/10000 (30%)	 {'predicted': ',', 'actual': '@', 'mask_idx': 93}
3064

3163/10000 (31%)	 {'predicted': 'singing', 'actual': 'singing', 'mask_idx': 10}
3164/10000 (31%)	 {'predicted': 'came', 'actual': 'migrated', 'mask_idx': 72}
3165/10000 (31%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 147}
3166/10000 (31%)	 {'predicted': 'district', 'actual': 'district', 'mask_idx': 55}
3167/10000 (31%)	 {'predicted': 'which', 'actual': 'which', 'mask_idx': 83}
3168/10000 (31%)	 {'predicted': 'puzzles', 'actual': 'various', 'mask_idx': 150}
3169/10000 (31%)	 {'predicted': 'changed', 'actual': 'renumbered', 'mask_idx': 31}
3170/10000 (31%)	 {'predicted': 'telescope', 'actual': 'observatory', 'mask_idx': 47}
3171/10000 (31%)	 {'predicted': ',', 'actual': '.', 'mask_idx': 22}
3172/10000 (31%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 16}
3173/10000 (31%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 51}
3174/10000 (31%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 116}
3175/10000 (31%)	 {'predicted': 'had', 'actual': 'had', 'mask_idx': 223}
3176/10000 (31%)	 {

3274/10000 (32%)	 {'predicted': 'include', 'actual': 'around', 'mask_idx': 56}
3275/10000 (32%)	 {'predicted': 'april', 'actual': 'october', 'mask_idx': 62}
3276/10000 (32%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 34}
3277/10000 (32%)	 {'predicted': 'he', 'actual': 'amos', 'mask_idx': 94}
3278/10000 (32%)	 {'predicted': 'september', 'actual': 'july', 'mask_idx': 18}
3279/10000 (32%)	 {'predicted': '2', 'actual': '36', 'mask_idx': 60}
3280/10000 (32%)	 {'predicted': 'three', 'actual': 'three', 'mask_idx': 47}
3281/10000 (32%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 15}
3282/10000 (32%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 76}
3283/10000 (32%)	 {'predicted': '.', 'actual': 'chile', 'mask_idx': 16}
3284/10000 (32%)	 {'predicted': 'the', 'actual': 'reformed', 'mask_idx': 93}
3285/10000 (32%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 23}
3286/10000 (32%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 9}
3287/10000 (32%)	 {'predicted': 'he', 'actual': '

3386/10000 (33%)	 {'predicted': 'irish', 'actual': 'irish', 'mask_idx': 110}
3387/10000 (33%)	 {'predicted': 'dissipated', 'actual': 'weakened', 'mask_idx': 67}
3388/10000 (33%)	 {'predicted': 'new', 'actual': 'commonwealth', 'mask_idx': 126}
3389/10000 (33%)	 {'predicted': 'surrounded', 'actual': '<', 'mask_idx': 84}
3390/10000 (33%)	 {'predicted': 'and', 'actual': 'or', 'mask_idx': 15}
3391/10000 (33%)	 {'predicted': 'could', 'actual': 'can', 'mask_idx': 39}
3392/10000 (33%)	 {'predicted': '.', 'actual': 'gibraltar', 'mask_idx': 55}
3393/10000 (33%)	 {'predicted': 'two', 'actual': 'eight', 'mask_idx': 6}
3394/10000 (33%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 62}
3395/10000 (33%)	 {'predicted': '14', 'actual': '78', 'mask_idx': 91}
3396/10000 (33%)	 {'predicted': 'her', 'actual': 'his', 'mask_idx': 92}
3397/10000 (33%)	 {'predicted': 'hosted', 'actual': 'hosted', 'mask_idx': 70}
3398/10000 (33%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 3}
3399/10000 (33%)	 {'predict

3497/10000 (34%)	 {'predicted': 'from', 'actual': 'connecting', 'mask_idx': 59}
3498/10000 (34%)	 {'predicted': 'including', 'actual': 'pal', 'mask_idx': 132}
3499/10000 (34%)	 {'predicted': 'been', 'actual': 'been', 'mask_idx': 207}
3500/10000 (35%)	 {'predicted': ',', 'actual': 'maintains', 'mask_idx': 139}
3501/10000 (35%)	 {'predicted': 'on', 'actual': 'on', 'mask_idx': 55}
3502/10000 (35%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 42}
3503/10000 (35%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 17}
3504/10000 (35%)	 {'predicted': 'h', 'actual': 'h', 'mask_idx': 32}
3505/10000 (35%)	 {'predicted': 'the', 'actual': 'a', 'mask_idx': 92}
3506/10000 (35%)	 {'predicted': 'style', 'actual': 'mechanics', 'mask_idx': 148}
3507/10000 (35%)	 {'predicted': '-', 'actual': 'non', 'mask_idx': 107}
3508/10000 (35%)	 {'predicted': 'given', 'actual': 'despite', 'mask_idx': 19}
3509/10000 (35%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 101}
3510/10000 (35%)	 {'predicted': 'the',

3608/10000 (36%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 24}
3609/10000 (36%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 155}
3610/10000 (36%)	 {'predicted': 'from', 'actual': 'on', 'mask_idx': 5}
3611/10000 (36%)	 {'predicted': 'using', 'actual': 'ju', 'mask_idx': 72}
3612/10000 (36%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 3}
3613/10000 (36%)	 {'predicted': 'felix', 'actual': 'heinrich', 'mask_idx': 21}
3614/10000 (36%)	 {'predicted': 'that', 'actual': ',', 'mask_idx': 56}
3615/10000 (36%)	 {'predicted': '=', 'actual': '=', 'mask_idx': 15}
3616/10000 (36%)	 {'predicted': 'she', 'actual': 'she', 'mask_idx': 101}
3617/10000 (36%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 220}
3618/10000 (36%)	 {'predicted': 'other', 'actual': 'regimental', 'mask_idx': 105}
3619/10000 (36%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 178}
3620/10000 (36%)	 {'predicted': 'the', 'actual': 'earlier', 'mask_idx': 114}
3621/10000 (36%)	 {'predicted': 'succession', 'actual': '<

3719/10000 (37%)	 {'predicted': 'took', 'actual': 'controlled', 'mask_idx': 87}
3720/10000 (37%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 27}
3721/10000 (37%)	 {'predicted': 'in', 'actual': 'of', 'mask_idx': 38}
3722/10000 (37%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 25}
3723/10000 (37%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 388}
3724/10000 (37%)	 {'predicted': 'jewish', 'actual': 'jewish', 'mask_idx': 40}
3725/10000 (37%)	 {'predicted': '"', 'actual': 'he', 'mask_idx': 77}
3726/10000 (37%)	 {'predicted': 'had', 'actual': 'else', 'mask_idx': 99}
3727/10000 (37%)	 {'predicted': 'manila', 'actual': '<', 'mask_idx': 125}
3728/10000 (37%)	 {'predicted': 'knockout', 'actual': 'knockout', 'mask_idx': 43}
3729/10000 (37%)	 {'predicted': ',', 'actual': 'studio', 'mask_idx': 104}
3730/10000 (37%)	 {'predicted': 'now', 'actual': 'now', 'mask_idx': 77}
3731/10000 (37%)	 {'predicted': 'takes', 'actual': 'takes', 'mask_idx': 115}
3732/10000 (37%)	 {'predicted': 'the', '

3831/10000 (38%)	 {'predicted': 'defensive', 'actual': 'small', 'mask_idx': 164}
3832/10000 (38%)	 {'predicted': 'three', 'actual': 'three', 'mask_idx': 176}
3833/10000 (38%)	 {'predicted': 'their', 'actual': 'high', 'mask_idx': 97}
3834/10000 (38%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 75}
3835/10000 (38%)	 {'predicted': 'crater', 'actual': 'polar', 'mask_idx': 6}
3836/10000 (38%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 45}
3837/10000 (38%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 38}
3838/10000 (38%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 20}
3839/10000 (38%)	 {'predicted': 'spin', 'actual': 'list', 'mask_idx': 201}
3840/10000 (38%)	 {'predicted': 'marine', 'actual': 'marine', 'mask_idx': 57}
3841/10000 (38%)	 {'predicted': 'manila', 'actual': 'manila', 'mask_idx': 17}
3842/10000 (38%)	 {'predicted': 'without', 'actual': 'without', 'mask_idx': 6}
3843/10000 (38%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 44}
3844/10000 (38%)	 {'predict

3943/10000 (39%)	 {'predicted': 'trial', 'actual': 'group', 'mask_idx': 28}
3944/10000 (39%)	 {'predicted': 'also', 'actual': 'still', 'mask_idx': 44}
3945/10000 (39%)	 {'predicted': 'at', 'actual': 'below', 'mask_idx': 99}
3946/10000 (39%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 31}
3947/10000 (39%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 92}
3948/10000 (39%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 52}
3949/10000 (39%)	 {'predicted': 'peace', 'actual': 'peace', 'mask_idx': 78}
3950/10000 (39%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 5}
3951/10000 (39%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 55}
3952/10000 (39%)	 {'predicted': 'team', 'actual': 'team', 'mask_idx': 25}
3953/10000 (39%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 238}
3954/10000 (39%)	 {'predicted': 'france', 'actual': 'austria', 'mask_idx': 68}
3955/10000 (39%)	 {'predicted': 'or', 'actual': 'or', 'mask_idx': 45}
3956/10000 (39%)	 {'predicted': 'the', 'actual': 'massive', '

4055/10000 (40%)	 {'predicted': 'the', 'actual': 'government', 'mask_idx': 29}
4056/10000 (40%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 39}
4057/10000 (40%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 108}
4058/10000 (40%)	 {'predicted': 'had', 'actual': 'had', 'mask_idx': 54}
4059/10000 (40%)	 {'predicted': 'clues', 'actual': 'puzzles', 'mask_idx': 99}
4060/10000 (40%)	 {'predicted': ',', 'actual': '.', 'mask_idx': 120}
4061/10000 (40%)	 {'predicted': 'plans', 'actual': 'improvements', 'mask_idx': 120}
4062/10000 (40%)	 {'predicted': 'river', 'actual': 'river', 'mask_idx': 20}
4063/10000 (40%)	 {'predicted': '8', 'actual': '25', 'mask_idx': 24}
4064/10000 (40%)	 {'predicted': 'between', 'actual': 'between', 'mask_idx': 23}
4065/10000 (40%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 72}
4066/10000 (40%)	 {'predicted': '.', 'actual': 'the', 'mask_idx': 0}
4067/10000 (40%)	 {'predicted': 'firearms', 'actual': 'hunting', 'mask_idx': 41}
4068/10000 (40%)	 {'predic

4166/10000 (41%)	 {'predicted': 'mixed', 'actual': 'provisional', 'mask_idx': 15}
4167/10000 (41%)	 {'predicted': 'second', 'actual': '2013', 'mask_idx': 2}
4168/10000 (41%)	 {'predicted': 'apart', 'actual': 'apart', 'mask_idx': 18}
4169/10000 (41%)	 {'predicted': 'commemorate', 'actual': 'celebrate', 'mask_idx': 39}
4170/10000 (41%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 19}
4171/10000 (41%)	 {'predicted': 'status', 'actual': '<', 'mask_idx': 115}
4172/10000 (41%)	 {'predicted': 'could', 'actual': 'to', 'mask_idx': 84}
4173/10000 (41%)	 {'predicted': 'continue', 'actual': 'res', 'mask_idx': 13}
4174/10000 (41%)	 {'predicted': 'to', 'actual': 'throughout', 'mask_idx': 49}
4175/10000 (41%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 124}
4176/10000 (41%)	 {'predicted': 'from', 'actual': 'of', 'mask_idx': 13}
4177/10000 (41%)	 {'predicted': 'border', 'actual': 'border', 'mask_idx': 206}
4178/10000 (41%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 188}
4179/10000 (41%)	 

4277/10000 (42%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 89}
4278/10000 (42%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 360}
4279/10000 (42%)	 {'predicted': 'had', 'actual': 'had', 'mask_idx': 197}
4280/10000 (42%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 98}
4281/10000 (42%)	 {'predicted': 'involved', 'actual': 'involved', 'mask_idx': 73}
4282/10000 (42%)	 {'predicted': 'criminal', 'actual': 'police', 'mask_idx': 95}
4283/10000 (42%)	 {'predicted': '0', 'actual': '6', 'mask_idx': 132}
4284/10000 (42%)	 {'predicted': 'under', 'actual': 'under', 'mask_idx': 20}
4285/10000 (42%)	 {'predicted': 'flowers', 'actual': 'flowers', 'mask_idx': 59}
4286/10000 (42%)	 {'predicted': '"', 'actual': 'presentation', 'mask_idx': 11}
4287/10000 (42%)	 {'predicted': 'be', 'actual': 'be', 'mask_idx': 39}
4288/10000 (42%)	 {'predicted': 'actual', 'actual': 'easily', 'mask_idx': 113}
4289/10000 (42%)	 {'predicted': '2', 'actual': '3', 'mask_idx': 15}
4290/10000 (42%)	 {'predicted':

4389/10000 (43%)	 {'predicted': 'british', 'actual': 'treaty', 'mask_idx': 55}
4390/10000 (43%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 271}
4391/10000 (43%)	 {'predicted': 'in', 'actual': 'during', 'mask_idx': 63}
4392/10000 (43%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 4}
4393/10000 (43%)	 {'predicted': '##ness', 'actual': 'language', 'mask_idx': 29}
4394/10000 (43%)	 {'predicted': 'considered', 'actual': 'intended', 'mask_idx': 67}
4395/10000 (43%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 102}
4396/10000 (43%)	 {'predicted': 'ink', 'actual': 'pencil', 'mask_idx': 10}
4397/10000 (43%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 232}
4398/10000 (43%)	 {'predicted': 'known', 'actual': 'known', 'mask_idx': 53}
4399/10000 (43%)	 {'predicted': 'which', 'actual': 'which', 'mask_idx': 17}
4400/10000 (44%)	 {'predicted': '.', 'actual': 'around', 'mask_idx': 0}
4401/10000 (44%)	 {'predicted': 'that', 'actual': 'often', 'mask_idx': 118}
4402/10000 (44%)	 {'predicted'

4501/10000 (45%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 111}
4502/10000 (45%)	 {'predicted': 'started', 'actual': 'began', 'mask_idx': 9}
4503/10000 (45%)	 {'predicted': 'soundtrack', 'actual': 'music', 'mask_idx': 27}
4504/10000 (45%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 96}
4505/10000 (45%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 176}
4506/10000 (45%)	 {'predicted': 'battalion', 'actual': 'battalion', 'mask_idx': 214}
4507/10000 (45%)	 {'predicted': 'mall', 'actual': ',', 'mask_idx': 19}
4508/10000 (45%)	 {'predicted': 'triple', 'actual': 'triple', 'mask_idx': 106}
4509/10000 (45%)	 {'predicted': '.', 'actual': '@', 'mask_idx': 17}
4510/10000 (45%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 57}
4511/10000 (45%)	 {'predicted': 'caused', 'actual': 'caused', 'mask_idx': 57}
4512/10000 (45%)	 {'predicted': 'team', 'actual': 'then', 'mask_idx': 29}
4513/10000 (45%)	 {'predicted': '<', 'actual': '<', 'mask_idx': 110}
4514/10000 (45%)	 {'predicted': '.', 'actual

4613/10000 (46%)	 {'predicted': 'year', 'actual': 'generation', 'mask_idx': 69}
4614/10000 (46%)	 {'predicted': 'manhattan', 'actual': '<', 'mask_idx': 69}
4615/10000 (46%)	 {'predicted': 'network', 'actual': 'system', 'mask_idx': 62}
4616/10000 (46%)	 {'predicted': 'that', 'actual': 'that', 'mask_idx': 82}
4617/10000 (46%)	 {'predicted': 'box', 'actual': 'turret', 'mask_idx': 83}
4618/10000 (46%)	 {'predicted': 'an', 'actual': 'an', 'mask_idx': 56}
4619/10000 (46%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 240}
4620/10000 (46%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 136}
4621/10000 (46%)	 {'predicted': 'build', 'actual': 'run', 'mask_idx': 73}
4622/10000 (46%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 77}
4623/10000 (46%)	 {'predicted': 'levels', 'actual': 'level', 'mask_idx': 2}
4624/10000 (46%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 76}
4625/10000 (46%)	 {'predicted': 'small', 'actual': 'filter', 'mask_idx': 63}
4626/10000 (46%)	 {'predicted': 'ch

4725/10000 (47%)	 {'predicted': 'park', 'actual': 'park', 'mask_idx': 34}
4726/10000 (47%)	 {'predicted': 'says', 'actual': 'mentions', 'mask_idx': 43}
4727/10000 (47%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 26}
4728/10000 (47%)	 {'predicted': 'us', 'actual': 'us', 'mask_idx': 36}
4729/10000 (47%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 40}
4730/10000 (47%)	 {'predicted': 'nintendo', 'actual': 'nintendo', 'mask_idx': 132}
4731/10000 (47%)	 {'predicted': 'settled', 'actual': 'insisted', 'mask_idx': 213}
4732/10000 (47%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 15}
4733/10000 (47%)	 {'predicted': 'average', 'actual': 'annual', 'mask_idx': 86}
4734/10000 (47%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 23}
4735/10000 (47%)	 {'predicted': ',', 'actual': 'eddie', 'mask_idx': 19}
4736/10000 (47%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 137}
4737/10000 (47%)	 {'predicted': '#', 'actual': 'a', 'mask_idx': 11}
4738/10000 (47%)	 {'predicted': ')', 'actual'

4837/10000 (48%)	 {'predicted': 'in', 'actual': 'of', 'mask_idx': 133}
4838/10000 (48%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 71}
4839/10000 (48%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 10}
4840/10000 (48%)	 {'predicted': 'go', 'actual': 'portage', 'mask_idx': 1}
4841/10000 (48%)	 {'predicted': 'community', 'actual': '<', 'mask_idx': 6}
4842/10000 (48%)	 {'predicted': 'off', 'actual': 'near', 'mask_idx': 16}
4843/10000 (48%)	 {'predicted': 'eliminated', 'actual': 'real', 'mask_idx': 3}
4844/10000 (48%)	 {'predicted': '.', 'actual': 'according', 'mask_idx': 0}
4845/10000 (48%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 182}
4846/10000 (48%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 20}
4847/10000 (48%)	 {'predicted': 'attended', 'actual': 'attended', 'mask_idx': 107}
4848/10000 (48%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 110}
4849/10000 (48%)	 {'predicted': 'had', 'actual': 'numbered', 'mask_idx': 39}
4850/10000 (48%)	 {'predicted': '10', 'actual

4949/10000 (49%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 118}
4950/10000 (49%)	 {'predicted': 'at', 'actual': 'at', 'mask_idx': 14}
4951/10000 (49%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 26}
4952/10000 (49%)	 {'predicted': 'making', 'actual': 'finding', 'mask_idx': 197}
4953/10000 (49%)	 {'predicted': ':', 'actual': 'award', 'mask_idx': 10}
4954/10000 (49%)	 {'predicted': 'center', 'actual': 'command', 'mask_idx': 77}
4955/10000 (49%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 9}
4956/10000 (49%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 10}
4957/10000 (49%)	 {'predicted': 'humans', 'actual': '<', 'mask_idx': 116}
4958/10000 (49%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 41}
4959/10000 (49%)	 {'predicted': 'and', 'actual': '.', 'mask_idx': 110}
4960/10000 (49%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 178}
4961/10000 (49%)	 {'predicted': 'is', 'actual': 'presents', 'mask_idx': 19}
4962/10000 (49%)	 {'predicted': 'missouri', 'actual':

5061/10000 (50%)	 {'predicted': 'haiti', 'actual': '<', 'mask_idx': 243}
5062/10000 (50%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 174}
5063/10000 (50%)	 {'predicted': 'battle', 'actual': 'imperial', 'mask_idx': 181}
5064/10000 (50%)	 {'predicted': 'was', 'actual': 'are', 'mask_idx': 56}
5065/10000 (50%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 97}
5066/10000 (50%)	 {'predicted': 'and', 'actual': 'but', 'mask_idx': 87}
5067/10000 (50%)	 {'predicted': 'coach', 'actual': 'coach', 'mask_idx': 90}
5068/10000 (50%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 84}
5069/10000 (50%)	 {'predicted': 'an', 'actual': 'an', 'mask_idx': 16}
5070/10000 (50%)	 {'predicted': 'result', 'actual': 'result', 'mask_idx': 254}
5071/10000 (50%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 36}
5072/10000 (50%)	 {'predicted': 'in', 'actual': 'above', 'mask_idx': 51}
5073/10000 (50%)	 {'predicted': 'continued', 'actual': 'continued', 'mask_idx': 166}
5074/10000 (50%)	 {'predicted': 'when', 

5174/10000 (51%)	 {'predicted': 'nominated', 'actual': 'recognized', 'mask_idx': 211}
5175/10000 (51%)	 {'predicted': 'augustus', 'actual': '<', 'mask_idx': 68}
5176/10000 (51%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 20}
5177/10000 (51%)	 {'predicted': 'for', 'actual': 'for', 'mask_idx': 9}
5178/10000 (51%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 32}
5179/10000 (51%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 55}
5180/10000 (51%)	 {'predicted': 'be', 'actual': 'be', 'mask_idx': 13}
5181/10000 (51%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 79}
5182/10000 (51%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 8}
5183/10000 (51%)	 {'predicted': 'three', 'actual': 'seven', 'mask_idx': 35}
5184/10000 (51%)	 {'predicted': 'rifle', 'actual': 'mortar', 'mask_idx': 134}
5185/10000 (51%)	 {'predicted': 'theatre', 'actual': 'theatre', 'mask_idx': 69}
5186/10000 (51%)	 {'predicted': '<', 'actual': '<', 'mask_idx': 160}
5187/10000 (51%)	 {'predicted': '.', 'actual':

5285/10000 (52%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 50}
5286/10000 (52%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 3}
5287/10000 (52%)	 {'predicted': 'to', 'actual': 'staged', 'mask_idx': 124}
5288/10000 (52%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 37}
5289/10000 (52%)	 {'predicted': 'from', 'actual': 'the', 'mask_idx': 78}
5290/10000 (52%)	 {'predicted': '##ness', 'actual': 'poverty', 'mask_idx': 37}
5291/10000 (52%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 15}
5292/10000 (52%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 72}
5293/10000 (52%)	 {'predicted': 'stated', 'actual': 'stated', 'mask_idx': 96}
5294/10000 (52%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 73}
5295/10000 (52%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 84}
5296/10000 (52%)	 {'predicted': 'on', 'actual': 'on', 'mask_idx': 9}
5297/10000 (52%)	 {'predicted': 'it', 'actual': '<', 'mask_idx': 1}
5298/10000 (52%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 5

5398/10000 (53%)	 {'predicted': '-', 'actual': 'hour', 'mask_idx': 146}
5399/10000 (53%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 103}
5400/10000 (54%)	 {'predicted': 'was', 'actual': 'was', 'mask_idx': 78}
5401/10000 (54%)	 {'predicted': 'wall', 'actual': 'bird', 'mask_idx': 102}
5402/10000 (54%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 64}
5403/10000 (54%)	 {'predicted': 'bonus', 'actual': 'bonus', 'mask_idx': 123}
5404/10000 (54%)	 {'predicted': '-', 'actual': "'", 'mask_idx': 1}
5405/10000 (54%)	 {'predicted': 'in', 'actual': 'for', 'mask_idx': 73}
5406/10000 (54%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 76}
5407/10000 (54%)	 {'predicted': 'use', 'actual': 'portray', 'mask_idx': 39}
5408/10000 (54%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 237}
5409/10000 (54%)	 {'predicted': 'light', 'actual': '<', 'mask_idx': 14}
5410/10000 (54%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 32}
5411/10000 (54%)	 {'predicted': 'c', 'actual': 'c', 'mask_idx'

5510/10000 (55%)	 {'predicted': "'", 'actual': '’', 'mask_idx': 85}
5511/10000 (55%)	 {'predicted': 'in', 'actual': '<', 'mask_idx': 61}
5512/10000 (55%)	 {'predicted': 'becomes', 'actual': 'move', 'mask_idx': 188}
5513/10000 (55%)	 {'predicted': 'japan', 'actual': 'japan', 'mask_idx': 20}
5514/10000 (55%)	 {'predicted': 'ships', 'actual': 'battles', 'mask_idx': 51}
5515/10000 (55%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 9}
5516/10000 (55%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 30}
5517/10000 (55%)	 {'predicted': '1', 'actual': '2', 'mask_idx': 74}
5518/10000 (55%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 18}
5519/10000 (55%)	 {'predicted': 'replacing', 'actual': 'for', 'mask_idx': 56}
5520/10000 (55%)	 {'predicted': '1', 'actual': '20', 'mask_idx': 197}
5521/10000 (55%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 3}
5522/10000 (55%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 251}
5523/10000 (55%)	 {'predicted': ']', 'actual': 'but', 'mask_idx': 19

5623/10000 (56%)	 {'predicted': 'philippine', 'actual': 'life', 'mask_idx': 52}
5624/10000 (56%)	 {'predicted': 'light', 'actual': 'american', 'mask_idx': 79}
5625/10000 (56%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 16}
5626/10000 (56%)	 {'predicted': 'census', 'actual': 'census', 'mask_idx': 4}
5627/10000 (56%)	 {'predicted': '@', 'actual': '[', 'mask_idx': 94}
5628/10000 (56%)	 {'predicted': '.', 'actual': 'concluded', 'mask_idx': 175}
5629/10000 (56%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 144}
5630/10000 (56%)	 {'predicted': ']', 'actual': ']', 'mask_idx': 75}
5631/10000 (56%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 119}
5632/10000 (56%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 38}
5633/10000 (56%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 99}
5634/10000 (56%)	 {'predicted': 'seneca', 'actual': 'pal', 'mask_idx': 106}
5635/10000 (56%)	 {'predicted': 'time', 'actual': 'period', 'mask_idx': 92}
5636/10000 (56%)	 {'predicted': '.', 'actual': 'bec

5735/10000 (57%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 95}
5736/10000 (57%)	 {'predicted': 'north', 'actual': '2005', 'mask_idx': 43}
5737/10000 (57%)	 {'predicted': 'descendants', 'actual': 'ancestors', 'mask_idx': 73}
5738/10000 (57%)	 {'predicted': 'very', 'actual': '<', 'mask_idx': 308}
5739/10000 (57%)	 {'predicted': 'soldier', 'actual': 'member', 'mask_idx': 147}
5740/10000 (57%)	 {'predicted': 'they', 'actual': 'it', 'mask_idx': 23}
5741/10000 (57%)	 {'predicted': 'again', 'actual': 'again', 'mask_idx': 31}
5742/10000 (57%)	 {'predicted': 'contained', 'actual': 'featured', 'mask_idx': 262}
5743/10000 (57%)	 {'predicted': 'were', 'actual': 'had', 'mask_idx': 45}
5744/10000 (57%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 186}
5745/10000 (57%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 41}
5746/10000 (57%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 40}
5747/10000 (57%)	 {'predicted': 'koreans', 'actual': 'koreans', 'mask_idx': 45}
5748/10000 (57%)	 {'predi

5847/10000 (58%)	 {'predicted': 'makes', 'actual': 'makes', 'mask_idx': 40}
5848/10000 (58%)	 {'predicted': 'bell', 'actual': '<', 'mask_idx': 158}
5849/10000 (58%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 217}
5850/10000 (58%)	 {'predicted': 'between', 'actual': 'within', 'mask_idx': 35}
5851/10000 (58%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 88}
5852/10000 (58%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 31}
5853/10000 (58%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 23}
5854/10000 (58%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 92}
5855/10000 (58%)	 {'predicted': 'york', 'actual': 'york', 'mask_idx': 22}
5856/10000 (58%)	 {'predicted': 'composed', 'actual': 'composed', 'mask_idx': 4}
5857/10000 (58%)	 {'predicted': 'him', 'actual': 'him', 'mask_idx': 48}
5858/10000 (58%)	 {'predicted': 'is', 'actual': 'occurs', 'mask_idx': 2}
5859/10000 (58%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 37}
5860/10000 (58%)	 {'predicted': 'centre', 'actua

5959/10000 (59%)	 {'predicted': 'lacks', 'actual': 'contains', 'mask_idx': 32}
5960/10000 (59%)	 {'predicted': 'commit', 'actual': 'commit', 'mask_idx': 159}
5961/10000 (59%)	 {'predicted': 'the', 'actual': 'typhoon', 'mask_idx': 24}
5962/10000 (59%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 78}
5963/10000 (59%)	 {'predicted': '2', 'actual': '<', 'mask_idx': 5}
5964/10000 (59%)	 {'predicted': 'some', 'actual': 'some', 'mask_idx': 89}
5965/10000 (59%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 49}
5966/10000 (59%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 125}
5967/10000 (59%)	 {'predicted': 'all', 'actual': 'all', 'mask_idx': 98}
5968/10000 (59%)	 {'predicted': 'vocals', 'actual': '<', 'mask_idx': 1}
5969/10000 (59%)	 {'predicted': ',', 'actual': 'and', 'mask_idx': 31}
5970/10000 (59%)	 {'predicted': 'sacrifice', 'actual': '<', 'mask_idx': 90}
5971/10000 (59%)	 {'predicted': 'peak', 'actual': 'peak', 'mask_idx': 221}
5972/10000 (59%)	 {'predicted': '$', 'actual': '$',

6071/10000 (60%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 13}
6072/10000 (60%)	 {'predicted': 'us', 'actual': 'ro', 'mask_idx': 102}
6073/10000 (60%)	 {'predicted': '##ers', 'actual': 'people', 'mask_idx': 17}
6074/10000 (60%)	 {'predicted': 'made', 'actual': 'made', 'mask_idx': 47}
6075/10000 (60%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 67}
6076/10000 (60%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 34}
6077/10000 (60%)	 {'predicted': '"', 'actual': 'also', 'mask_idx': 2}
6078/10000 (60%)	 {'predicted': 'history', 'actual': 'history', 'mask_idx': 18}
6079/10000 (60%)	 {'predicted': 'original', 'actual': 'original', 'mask_idx': 48}
6080/10000 (60%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 8}
6081/10000 (60%)	 {'predicted': '1980s', 'actual': '1980s', 'mask_idx': 147}
6082/10000 (60%)	 {'predicted': '.', 'actual': ';', 'mask_idx': 140}
6083/10000 (60%)	 {'predicted': 'been', 'actual': 'been', 'mask_idx': 7}
6084/10000 (60%)	 {'predicted': 'and', 'actual': '.'

6183/10000 (61%)	 {'predicted': 'torres', 'actual': 'torres', 'mask_idx': 218}
6184/10000 (61%)	 {'predicted': 'wwe', 'actual': 'wwe', 'mask_idx': 51}
6185/10000 (61%)	 {'predicted': 'more', 'actual': 'taken', 'mask_idx': 116}
6186/10000 (61%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 100}
6187/10000 (61%)	 {'predicted': 'only', 'actual': 'rapidly', 'mask_idx': 95}
6188/10000 (61%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 90}
6189/10000 (61%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 7}
6190/10000 (61%)	 {'predicted': 'it', 'actual': 'manila', 'mask_idx': 20}
6191/10000 (61%)	 {'predicted': '4', 'actual': '4', 'mask_idx': 76}
6192/10000 (61%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 11}
6193/10000 (61%)	 {'predicted': 'lions', 'actual': 'lions', 'mask_idx': 31}
6194/10000 (61%)	 {'predicted': 'vocals', 'actual': '<', 'mask_idx': 1}
6195/10000 (61%)	 {'predicted': ',', 'actual': '<', 'mask_idx': 110}
6196/10000 (61%)	 {'predicted': 'species', 'actual': 'seed'

6295/10000 (62%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 60}
6296/10000 (62%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 62}
6297/10000 (62%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 32}
6298/10000 (62%)	 {'predicted': 'similar', 'actual': 'converted', 'mask_idx': 9}
6299/10000 (62%)	 {'predicted': 'are', 'actual': 'are', 'mask_idx': 74}
6300/10000 (63%)	 {'predicted': 'second', 'actual': 'second', 'mask_idx': 212}
6301/10000 (63%)	 {'predicted': 'him', 'actual': '<', 'mask_idx': 37}
6302/10000 (63%)	 {'predicted': 'joined', 'actual': 'joined', 'mask_idx': 1}
6303/10000 (63%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 36}
6304/10000 (63%)	 {'predicted': 'replaced', 'actual': 'joined', 'mask_idx': 63}
6305/10000 (63%)	 {'predicted': 'settlement', 'actual': 'settlement', 'mask_idx': 86}
6306/10000 (63%)	 {'predicted': 'and', 'actual': 'for', 'mask_idx': 38}
6307/10000 (63%)	 {'predicted': 'he', 'actual': '<', 'mask_idx': 7}
6308/10000 (63%)	 {'predicted': 'cr

6406/10000 (64%)	 {'predicted': '140', 'actual': '225', 'mask_idx': 248}
6407/10000 (64%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 17}
6408/10000 (64%)	 {'predicted': '6', 'actual': '1', 'mask_idx': 161}
6409/10000 (64%)	 {'predicted': 'senate', 'actual': 'senate', 'mask_idx': 29}
6410/10000 (64%)	 {'predicted': '.', 'actual': '<', 'mask_idx': 52}
6411/10000 (64%)	 {'predicted': 'i', 'actual': 'ii', 'mask_idx': 26}
6412/10000 (64%)	 {'predicted': ',', 'actual': 'h', 'mask_idx': 10}
6413/10000 (64%)	 {'predicted': 'league', 'actual': 'league', 'mask_idx': 154}
6414/10000 (64%)	 {'predicted': 'thomas', 'actual': 'a', 'mask_idx': 62}
6415/10000 (64%)	 {'predicted': '1998', 'actual': '2001', 'mask_idx': 71}
6416/10000 (64%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 144}
6417/10000 (64%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 25}
6418/10000 (64%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 79}
6419/10000 (64%)	 {'predicted': 'unit', 'actual': 'unit', 'mask_idx': 

6518/10000 (65%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 72}
6519/10000 (65%)	 {'predicted': 'century', 'actual': 'century', 'mask_idx': 45}
6520/10000 (65%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 67}
6521/10000 (65%)	 {'predicted': 'death', 'actual': 'deaths', 'mask_idx': 49}
6522/10000 (65%)	 {'predicted': 'company', 'actual': 'company', 'mask_idx': 122}
6523/10000 (65%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 63}
6524/10000 (65%)	 {'predicted': 'age', 'actual': 'age', 'mask_idx': 23}
6525/10000 (65%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 16}
6526/10000 (65%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 14}
6527/10000 (65%)	 {'predicted': 'storm', 'actual': 'hurricane', 'mask_idx': 237}
6528/10000 (65%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 58}
6529/10000 (65%)	 {'predicted': 'three', 'actual': 'three', 'mask_idx': 28}
6530/10000 (65%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 3}
6531/10000 (65%)	 {'predicted': 'of', 'actual'

6630/10000 (66%)	 {'predicted': 'especially', 'actual': 'especially', 'mask_idx': 57}
6631/10000 (66%)	 {'predicted': '5th', 'actual': '14th', 'mask_idx': 22}
6632/10000 (66%)	 {'predicted': 'variety', 'actual': 'mix', 'mask_idx': 153}
6633/10000 (66%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 375}
6634/10000 (66%)	 {'predicted': 'that', 'actual': 'that', 'mask_idx': 126}
6635/10000 (66%)	 {'predicted': 'be', 'actual': 'lead', 'mask_idx': 38}
6636/10000 (66%)	 {'predicted': 'for', 'actual': '.', 'mask_idx': 47}
6637/10000 (66%)	 {'predicted': 'human', 'actual': 'human', 'mask_idx': 43}
6638/10000 (66%)	 {'predicted': 'center', 'actual': 'celebration', 'mask_idx': 19}
6639/10000 (66%)	 {'predicted': 'naval', 'actual': 'fleet', 'mask_idx': 2}
6640/10000 (66%)	 {'predicted': '<', 'actual': '<', 'mask_idx': 236}
6641/10000 (66%)	 {'predicted': 'below', 'actual': '<', 'mask_idx': 32}
6642/10000 (66%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 74}
6643/10000 (66%)	 {'predicted':

6741/10000 (67%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 183}
6742/10000 (67%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 54}
6743/10000 (67%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 135}
6744/10000 (67%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 32}
6745/10000 (67%)	 {'predicted': 'one', 'actual': 'another', 'mask_idx': 68}
6746/10000 (67%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 6}
6747/10000 (67%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 122}
6748/10000 (67%)	 {'predicted': 'until', 'actual': 'until', 'mask_idx': 240}
6749/10000 (67%)	 {'predicted': 'than', 'actual': 'slowly', 'mask_idx': 119}
6750/10000 (67%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 23}
6751/10000 (67%)	 {'predicted': 'longer', 'actual': 'longer', 'mask_idx': 72}
6752/10000 (67%)	 {'predicted': 'walter', 'actual': 'ford', 'mask_idx': 48}
6753/10000 (67%)	 {'predicted': '.', 'actual': 'united', 'mask_idx': 22}
6754/10000 (67%)	 {'predicted': 'also', 'actual': 'not'

6852/10000 (68%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 39}
6853/10000 (68%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 44}
6854/10000 (68%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 76}
6855/10000 (68%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 91}
6856/10000 (68%)	 {'predicted': '-', 'actual': 'el', 'mask_idx': 20}
6857/10000 (68%)	 {'predicted': 'waiting', 'actual': 'looking', 'mask_idx': 132}
6858/10000 (68%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 75}
6859/10000 (68%)	 {'predicted': 'time', 'actual': 'averaging', 'mask_idx': 67}
6860/10000 (68%)	 {'predicted': 'singer', 'actual': 'singer', 'mask_idx': 59}
6861/10000 (68%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 180}
6862/10000 (68%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 115}
6863/10000 (68%)	 {'predicted': 'however', 'actual': 'initially', 'mask_idx': 48}
6864/10000 (68%)	 {'predicted': '/', 'actual': '/', 'mask_idx': 119}
6865/10000 (68%)	 {'predicted': 'forces', 'actual': 'uni

6963/10000 (69%)	 {'predicted': 'at', 'actual': 'at', 'mask_idx': 59}
6964/10000 (69%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 165}
6965/10000 (69%)	 {'predicted': 'image', 'actual': 'image', 'mask_idx': 105}
6966/10000 (69%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 165}
6967/10000 (69%)	 {'predicted': 'be', 'actual': 'be', 'mask_idx': 20}
6968/10000 (69%)	 {'predicted': '.', 'actual': 'island', 'mask_idx': 28}
6969/10000 (69%)	 {'predicted': 'it', 'actual': '<', 'mask_idx': 132}
6970/10000 (69%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 45}
6971/10000 (69%)	 {'predicted': 'told', 'actual': 'told', 'mask_idx': 5}
6972/10000 (69%)	 {'predicted': 'projects', 'actual': 'efforts', 'mask_idx': 126}
6973/10000 (69%)	 {'predicted': 'by', 'actual': 'tommy', 'mask_idx': 106}
6974/10000 (69%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 136}
6975/10000 (69%)	 {'predicted': 'in', 'actual': '1', 'mask_idx': 1}
6976/10000 (69%)	 {'predicted': 'when', 'actual': '<', 'mask_idx':

7075/10000 (70%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 124}
7076/10000 (70%)	 {'predicted': 'north', 'actual': 'west', 'mask_idx': 17}
7077/10000 (70%)	 {'predicted': 'must', 'actual': '@', 'mask_idx': 37}
7078/10000 (70%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 9}
7079/10000 (70%)	 {'predicted': '"', 'actual': '"', 'mask_idx': 185}
7080/10000 (70%)	 {'predicted': 'negotiations', 'actual': 'negotiations', 'mask_idx': 14}
7081/10000 (70%)	 {'predicted': 'international', 'actual': 'middle', 'mask_idx': 139}
7082/10000 (70%)	 {'predicted': 'typhoon', 'actual': 'typhoon', 'mask_idx': 63}
7083/10000 (70%)	 {'predicted': 'duo', 'actual': 'band', 'mask_idx': 29}
7084/10000 (70%)	 {'predicted': '"', 'actual': 'design', 'mask_idx': 6}
7085/10000 (70%)	 {'predicted': '-', 'actual': 'four', 'mask_idx': 144}
7086/10000 (70%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 21}
7087/10000 (70%)	 {'predicted': 'not', 'actual': 'only', 'mask_idx': 34}
7088/10000 (70%)	 {'predicted

7187/10000 (71%)	 {'predicted': 'minister', 'actual': 'minister', 'mask_idx': 35}
7188/10000 (71%)	 {'predicted': 'early', 'actual': 'early', 'mask_idx': 64}
7189/10000 (71%)	 {'predicted': 'enemy', 'actual': 'estimated', 'mask_idx': 75}
7190/10000 (71%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 23}
7191/10000 (71%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 72}
7192/10000 (71%)	 {'predicted': '20th', 'actual': '19th', 'mask_idx': 22}
7193/10000 (71%)	 {'predicted': '.', 'actual': 'and', 'mask_idx': 155}
7194/10000 (71%)	 {'predicted': 'morality', 'actual': 'history', 'mask_idx': 50}
7195/10000 (71%)	 {'predicted': 'commissions', 'actual': 'competitions', 'mask_idx': 142}
7196/10000 (71%)	 {'predicted': 'small', 'actual': 'large', 'mask_idx': 57}
7197/10000 (71%)	 {'predicted': 'with', 'actual': 'with', 'mask_idx': 55}
7198/10000 (71%)	 {'predicted': 'tried', 'actual': 'worked', 'mask_idx': 94}
7199/10000 (71%)	 {'predicted': 'country', 'actual': 'emirates', 'mask_idx': 82

7299/10000 (72%)	 {'predicted': '1920s', 'actual': '1920s', 'mask_idx': 77}
7300/10000 (73%)	 {'predicted': 'other', 'actual': '<', 'mask_idx': 140}
7301/10000 (73%)	 {'predicted': 'death', 'actual': 'death', 'mask_idx': 63}
7302/10000 (73%)	 {'predicted': 'of', 'actual': 'in', 'mask_idx': 4}
7303/10000 (73%)	 {'predicted': 'the', 'actual': 'lieutenant', 'mask_idx': 3}
7304/10000 (73%)	 {'predicted': 'an', 'actual': 'an', 'mask_idx': 108}
7305/10000 (73%)	 {'predicted': 'won', 'actual': 'won', 'mask_idx': 79}
7306/10000 (73%)	 {'predicted': 'replaced', 'actual': 'sank', 'mask_idx': 178}
7307/10000 (73%)	 {'predicted': 'got', 'actual': 'became', 'mask_idx': 105}
7308/10000 (73%)	 {'predicted': 'for', 'actual': 'with', 'mask_idx': 35}
7309/10000 (73%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 123}
7310/10000 (73%)	 {'predicted': 'located', 'actual': 'located', 'mask_idx': 51}
7311/10000 (73%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 40}
7312/10000 (73%)	 {'predicted': 'in', 

7410/10000 (74%)	 {'predicted': '/', 'actual': '18', 'mask_idx': 65}
7411/10000 (74%)	 {'predicted': '=', 'actual': '=', 'mask_idx': 2}
7412/10000 (74%)	 {'predicted': ',', 'actual': 'in', 'mask_idx': 27}
7413/10000 (74%)	 {'predicted': 'or', 'actual': 'boat', 'mask_idx': 34}
7414/10000 (74%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 40}
7415/10000 (74%)	 {'predicted': 'night', 'actual': 'night', 'mask_idx': 111}
7416/10000 (74%)	 {'predicted': 'families', 'actual': 'families', 'mask_idx': 111}
7417/10000 (74%)	 {'predicted': 'he', 'actual': 'he', 'mask_idx': 138}
7418/10000 (74%)	 {'predicted': 'ordered', 'actual': 'ordered', 'mask_idx': 157}
7419/10000 (74%)	 {'predicted': ',', 'actual': 'and', 'mask_idx': 246}
7420/10000 (74%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 64}
7421/10000 (74%)	 {'predicted': 'professionally', 'actual': 'professionally', 'mask_idx': 88}
7422/10000 (74%)	 {'predicted': 'time', 'actual': '1805', 'mask_idx': 76}
7423/10000 (74%)	 {'predicted'

7522/10000 (75%)	 {'predicted': '.', 'actual': 'because', 'mask_idx': 89}
7523/10000 (75%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 21}
7524/10000 (75%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 55}
7525/10000 (75%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 21}
7526/10000 (75%)	 {'predicted': ':', 'actual': '+', 'mask_idx': 30}
7527/10000 (75%)	 {'predicted': 'when', 'actual': 'when', 'mask_idx': 128}
7528/10000 (75%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 76}
7529/10000 (75%)	 {'predicted': 'his', 'actual': 'political', 'mask_idx': 13}
7530/10000 (75%)	 {'predicted': 'these', 'actual': 'ancient', 'mask_idx': 122}
7531/10000 (75%)	 {'predicted': '"', 'actual': '=', 'mask_idx': 0}
7532/10000 (75%)	 {'predicted': 'most', 'actual': 'most', 'mask_idx': 83}
7533/10000 (75%)	 {'predicted': '.', 'actual': ',', 'mask_idx': 56}
7534/10000 (75%)	 {'predicted': 'left', 'actual': 'remaining', 'mask_idx': 50}
7535/10000 (75%)	 {'predicted': 'on', 'actual': 'through',

7633/10000 (76%)	 {'predicted': 'us', 'actual': 'manhattan', 'mask_idx': 86}
7634/10000 (76%)	 {'predicted': 'and', 'actual': ',', 'mask_idx': 12}
7635/10000 (76%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 7}
7636/10000 (76%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 174}
7637/10000 (76%)	 {'predicted': '10', 'actual': '10', 'mask_idx': 75}
7638/10000 (76%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 194}
7639/10000 (76%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 123}
7640/10000 (76%)	 {'predicted': '<', 'actual': '<', 'mask_idx': 86}
7641/10000 (76%)	 {'predicted': 'elements', 'actual': 'most', 'mask_idx': 208}
7642/10000 (76%)	 {'predicted': '-', 'actual': 'mediterranean', 'mask_idx': 0}
7643/10000 (76%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 8}
7644/10000 (76%)	 {'predicted': 'always', 'actual': 'not', 'mask_idx': 82}
7645/10000 (76%)	 {'predicted': 'a', 'actual': 'some', 'mask_idx': 27}
7646/10000 (76%)	 {'predicted': 'areas', 'actual': 'ar

7746/10000 (77%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 35}
7747/10000 (77%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 52}
7748/10000 (77%)	 {'predicted': 'tanks', 'actual': 'av', 'mask_idx': 73}
7749/10000 (77%)	 {'predicted': '1870s', 'actual': '1870s', 'mask_idx': 25}
7750/10000 (77%)	 {'predicted': 'dong', 'actual': 'chang', 'mask_idx': 40}
7751/10000 (77%)	 {'predicted': ')', 'actual': '2013', 'mask_idx': 24}
7752/10000 (77%)	 {'predicted': 'formation', 'actual': 'transfer', 'mask_idx': 23}
7753/10000 (77%)	 {'predicted': 'however', 'actual': 'initially', 'mask_idx': 72}
7754/10000 (77%)	 {'predicted': '<', 'actual': '<', 'mask_idx': 169}
7755/10000 (77%)	 {'predicted': 'season', 'actual': 'season', 'mask_idx': 26}
7756/10000 (77%)	 {'predicted': 'on', 'actual': 'on', 'mask_idx': 66}
7757/10000 (77%)	 {'predicted': 'gun', 'actual': 'gun', 'mask_idx': 94}
7758/10000 (77%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 94}
7759/10000 (77%)	 {'predicted': 'was', 'a

7857/10000 (78%)	 {'predicted': 'artillery', 'actual': 'explosive', 'mask_idx': 49}
7858/10000 (78%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 15}
7859/10000 (78%)	 {'predicted': '.', 'actual': 'new', 'mask_idx': 0}
7860/10000 (78%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 199}
7861/10000 (78%)	 {'predicted': 'guy', 'actual': 'brother', 'mask_idx': 74}
7862/10000 (78%)	 {'predicted': 'tropical', 'actual': 'tropical', 'mask_idx': 7}
7863/10000 (78%)	 {'predicted': '.', 'actual': 'the', 'mask_idx': 0}
7864/10000 (78%)	 {'predicted': 'details', 'actual': 'ships', 'mask_idx': 43}
7865/10000 (78%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 47}
7866/10000 (78%)	 {'predicted': 'with', 'actual': 'with', 'mask_idx': 14}
7867/10000 (78%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 63}
7868/10000 (78%)	 {'predicted': '30', 'actual': '40', 'mask_idx': 91}
7869/10000 (78%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 148}
7870/10000 (78%)	 {'predicted': 'original',

7969/10000 (79%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 115}
7970/10000 (79%)	 {'predicted': 'shoes', 'actual': '<', 'mask_idx': 24}
7971/10000 (79%)	 {'predicted': 'population', 'actual': 'population', 'mask_idx': 7}
7972/10000 (79%)	 {'predicted': 'cedar', 'actual': 'buffalo', 'mask_idx': 65}
7973/10000 (79%)	 {'predicted': 'resulted', 'actual': 'resulted', 'mask_idx': 86}
7974/10000 (79%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 3}
7975/10000 (79%)	 {'predicted': '"', 'actual': '<', 'mask_idx': 16}
7976/10000 (79%)	 {'predicted': 'has', 'actual': "'", 'mask_idx': 137}
7977/10000 (79%)	 {'predicted': 'for', 'actual': 'for', 'mask_idx': 291}
7978/10000 (79%)	 {'predicted': ',', 'actual': 'along', 'mask_idx': 129}
7979/10000 (79%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 19}
7980/10000 (79%)	 {'predicted': 'who', 'actual': 'who', 'mask_idx': 27}
7981/10000 (79%)	 {'predicted': 'after', 'actual': 'of', 'mask_idx': 49}
7982/10000 (79%)	 {'predicted': 'the', 'act

8081/10000 (80%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 71}
8082/10000 (80%)	 {'predicted': 'eldest', 'actual': 'only', 'mask_idx': 45}
8083/10000 (80%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 59}
8084/10000 (80%)	 {'predicted': 'opened', 'actual': 'dedicated', 'mask_idx': 7}
8085/10000 (80%)	 {'predicted': '31', 'actual': '18', 'mask_idx': 32}
8086/10000 (80%)	 {'predicted': 'similar', 'actual': 'sympathetic', 'mask_idx': 223}
8087/10000 (80%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 113}
8088/10000 (80%)	 {'predicted': 'without', 'actual': 'without', 'mask_idx': 8}
8089/10000 (80%)	 {'predicted': 'sculptures', 'actual': 'heads', 'mask_idx': 87}
8090/10000 (80%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 92}
8091/10000 (80%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 18}
8092/10000 (80%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 124}
8093/10000 (80%)	 {'predicted': '.', 'actual': '<', 'mask_idx': 117}
8094/10000 (80%)	 {'predicted': '-', '

8193/10000 (81%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 41}
8194/10000 (81%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 27}
8195/10000 (81%)	 {'predicted': 'in', 'actual': 'and', 'mask_idx': 95}
8196/10000 (81%)	 {'predicted': 'stations', 'actual': 'posts', 'mask_idx': 20}
8197/10000 (81%)	 {'predicted': 'were', 'actual': 'were', 'mask_idx': 33}
8198/10000 (81%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 8}
8199/10000 (81%)	 {'predicted': 'contract', 'actual': 'contract', 'mask_idx': 25}
8200/10000 (82%)	 {'predicted': 'ready', 'actual': 'preparing', 'mask_idx': 65}
8201/10000 (82%)	 {'predicted': 'to', 'actual': 'may', 'mask_idx': 28}
8202/10000 (82%)	 {'predicted': 'a', 'actual': 'distant', 'mask_idx': 34}
8203/10000 (82%)	 {'predicted': 'present', 'actual': 'hand', 'mask_idx': 16}
8204/10000 (82%)	 {'predicted': 'government', 'actual': 'embassy', 'mask_idx': 179}
8205/10000 (82%)	 {'predicted': 'museum', 'actual': 'musee', 'mask_idx': 22}
8206/10000 (82%)	 {'pr

8304/10000 (83%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 81}
8305/10000 (83%)	 {'predicted': 'at', 'actual': 'at', 'mask_idx': 75}
8306/10000 (83%)	 {'predicted': '"', 'actual': 'the', 'mask_idx': 0}
8307/10000 (83%)	 {'predicted': '.', 'actual': 'the', 'mask_idx': 0}
8308/10000 (83%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 24}
8309/10000 (83%)	 {'predicted': '26', 'actual': '4', 'mask_idx': 219}
8310/10000 (83%)	 {'predicted': '(', 'actual': '(', 'mask_idx': 89}
8311/10000 (83%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 59}
8312/10000 (83%)	 {'predicted': ',', 'actual': '.', 'mask_idx': 241}
8313/10000 (83%)	 {'predicted': 'culture', 'actual': 'contributions', 'mask_idx': 23}
8314/10000 (83%)	 {'predicted': 'organization', 'actual': 'organization', 'mask_idx': 44}
8315/10000 (83%)	 {'predicted': 'he', 'actual': 'he', 'mask_idx': 75}
8316/10000 (83%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 82}
8317/10000 (83%)	 {'predicted': ',', 'actual': '–', 'mask

8416/10000 (84%)	 {'predicted': '>', 'actual': 'of', 'mask_idx': 86}
8417/10000 (84%)	 {'predicted': 'her', 'actual': 'them', 'mask_idx': 26}
8418/10000 (84%)	 {'predicted': 'viewer', 'actual': 'audience', 'mask_idx': 354}
8419/10000 (84%)	 {'predicted': 'was', 'actual': 'first', 'mask_idx': 5}
8420/10000 (84%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 94}
8421/10000 (84%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 101}
8422/10000 (84%)	 {'predicted': 'republic', 'actual': 'republic', 'mask_idx': 50}
8423/10000 (84%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 25}
8424/10000 (84%)	 {'predicted': ']', 'actual': ']', 'mask_idx': 179}
8425/10000 (84%)	 {'predicted': 'coach', 'actual': 'player', 'mask_idx': 136}
8426/10000 (84%)	 {'predicted': '-', 'actual': '@', 'mask_idx': 3}
8427/10000 (84%)	 {'predicted': 'as', 'actual': 'as', 'mask_idx': 11}
8428/10000 (84%)	 {'predicted': '%', 'actual': '%', 'mask_idx': 135}
8429/10000 (84%)	 {'predicted': 'the', 'actual': 'the', 

8527/10000 (85%)	 {'predicted': 'patterns', 'actual': 'trends', 'mask_idx': 46}
8528/10000 (85%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 161}
8529/10000 (85%)	 {'predicted': 'found', 'actual': 'app', 'mask_idx': 10}
8530/10000 (85%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 78}
8531/10000 (85%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 82}
8532/10000 (85%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 192}
8533/10000 (85%)	 {'predicted': '000', 'actual': '000', 'mask_idx': 131}
8534/10000 (85%)	 {'predicted': 'years', 'actual': 'decades', 'mask_idx': 154}
8535/10000 (85%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 1}
8536/10000 (85%)	 {'predicted': 'anderson', 'actual': '<', 'mask_idx': 17}
8537/10000 (85%)	 {'predicted': 'successful', 'actual': 'torpedo', 'mask_idx': 196}
8538/10000 (85%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 27}
8539/10000 (85%)	 {'predicted': 'riding', 'actual': 'driving', 'mask_idx': 5}
8540/10000 (85%)	 {'predicted': 'g

8640/10000 (86%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 63}
8641/10000 (86%)	 {'predicted': 'leeds', 'actual': 'carlisle', 'mask_idx': 10}
8642/10000 (86%)	 {'predicted': 'the', 'actual': 'an', 'mask_idx': 103}
8643/10000 (86%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 162}
8644/10000 (86%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 15}
8645/10000 (86%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 42}
8646/10000 (86%)	 {'predicted': 'role', 'actual': 'disadvantage', 'mask_idx': 25}
8647/10000 (86%)	 {'predicted': '-', 'actual': 'contender', 'mask_idx': 12}
8648/10000 (86%)	 {'predicted': 'many', 'actual': 'significant', 'mask_idx': 68}
8649/10000 (86%)	 {'predicted': 'beginning', 'actual': 'cover', 'mask_idx': 53}
8650/10000 (86%)	 {'predicted': '.', 'actual': 'according', 'mask_idx': 0}
8651/10000 (86%)	 {'predicted': 'the', 'actual': 'planet', 'mask_idx': 18}
8652/10000 (86%)	 {'predicted': 'significant', 'actual': 'successful', 'mask_idx': 11}
8653/10000 (

8751/10000 (87%)	 {'predicted': 'strength', 'actual': 'efficiency', 'mask_idx': 132}
8752/10000 (87%)	 {'predicted': 'part', 'actual': 'portion', 'mask_idx': 26}
8753/10000 (87%)	 {'predicted': '.', 'actual': 'u', 'mask_idx': 3}
8754/10000 (87%)	 {'predicted': 'god', 'actual': 'temple', 'mask_idx': 159}
8755/10000 (87%)	 {'predicted': 'continuously', 'actual': 'substantially', 'mask_idx': 41}
8756/10000 (87%)	 {'predicted': 'the', 'actual': 'proposed', 'mask_idx': 63}
8757/10000 (87%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 43}
8758/10000 (87%)	 {'predicted': ',', 'actual': '<', 'mask_idx': 75}
8759/10000 (87%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 183}
8760/10000 (87%)	 {'predicted': 'plate', 'actual': '<', 'mask_idx': 68}
8761/10000 (87%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 123}
8762/10000 (87%)	 {'predicted': 'since', 'actual': 'since', 'mask_idx': 26}
8763/10000 (87%)	 {'predicted': 'rather', 'actual': 'rather', 'mask_idx': 56}
8764/10000 (87%)	 {'p

8863/10000 (88%)	 {'predicted': 'poems', 'actual': '<', 'mask_idx': 20}
8864/10000 (88%)	 {'predicted': 'colours', 'actual': 'beauty', 'mask_idx': 118}
8865/10000 (88%)	 {'predicted': 'napoleon', 'actual': '@', 'mask_idx': 14}
8866/10000 (88%)	 {'predicted': 'freedom', 'actual': 'right', 'mask_idx': 78}
8867/10000 (88%)	 {'predicted': 'for', 'actual': 'for', 'mask_idx': 82}
8868/10000 (88%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 50}
8869/10000 (88%)	 {'predicted': 'appearance', 'actual': 'impacts', 'mask_idx': 64}
8870/10000 (88%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 1}
8871/10000 (88%)	 {'predicted': 'projected', 'actual': 'face', 'mask_idx': 59}
8872/10000 (88%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 66}
8873/10000 (88%)	 {'predicted': 'river', 'actual': 'river', 'mask_idx': 77}
8874/10000 (88%)	 {'predicted': '.', 'actual': ',', 'mask_idx': 48}
8875/10000 (88%)	 {'predicted': 'they', 'actual': 'they', 'mask_idx': 30}
8876/10000 (88%)	 {'predicted': 'at'

8974/10000 (89%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 85}
8975/10000 (89%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 28}
8976/10000 (89%)	 {'predicted': 'was', 'actual': 'was', 'mask_idx': 127}
8977/10000 (89%)	 {'predicted': 'he', 'actual': '<', 'mask_idx': 8}
8978/10000 (89%)	 {'predicted': 'cut', 'actual': 'torn', 'mask_idx': 214}
8979/10000 (89%)	 {'predicted': 'reducing', 'actual': 'reducing', 'mask_idx': 87}
8980/10000 (89%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 134}
8981/10000 (89%)	 {'predicted': '-', 'actual': '<', 'mask_idx': 231}
8982/10000 (89%)	 {'predicted': 'according', 'actual': 'due', 'mask_idx': 16}
8983/10000 (89%)	 {'predicted': ':', 'actual': ',', 'mask_idx': 3}
8984/10000 (89%)	 {'predicted': '.', 'actual': 'at', 'mask_idx': 33}
8985/10000 (89%)	 {'predicted': 'ii', 'actual': 'ii', 'mask_idx': 123}
8986/10000 (89%)	 {'predicted': '40', 'actual': '40', 'mask_idx': 112}
8987/10000 (89%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 54}

9087/10000 (90%)	 {'predicted': 'aged', 'actual': 'for', 'mask_idx': 91}
9088/10000 (90%)	 {'predicted': '#', 'actual': '<', 'mask_idx': 11}
9089/10000 (90%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 45}
9090/10000 (90%)	 {'predicted': 'largest', 'actual': 'first', 'mask_idx': 78}
9091/10000 (90%)	 {'predicted': 'the', 'actual': 'over', 'mask_idx': 6}
9092/10000 (90%)	 {'predicted': 'was', 'actual': 'was', 'mask_idx': 43}
9093/10000 (90%)	 {'predicted': ')', 'actual': ')', 'mask_idx': 22}
9094/10000 (90%)	 {'predicted': 'may', 'actual': 'first', 'mask_idx': 47}
9095/10000 (90%)	 {'predicted': 'buildings', 'actual': 'churches', 'mask_idx': 74}
9096/10000 (90%)	 {'predicted': 'designated', 'actual': 'designated', 'mask_idx': 63}
9097/10000 (90%)	 {'predicted': 'us', 'actual': 't', 'mask_idx': 76}
9098/10000 (90%)	 {'predicted': 'name', 'actual': 'position', 'mask_idx': 4}
9099/10000 (90%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 10}
9100/10000 (91%)	 {'predicted': 'soldiers'

9198/10000 (91%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 148}
9199/10000 (91%)	 {'predicted': 'were', 'actual': 'in', 'mask_idx': 5}
9200/10000 (92%)	 {'predicted': 'it', 'actual': 'it', 'mask_idx': 17}
9201/10000 (92%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 98}
9202/10000 (92%)	 {'predicted': 'ordered', 'actual': 'ordered', 'mask_idx': 185}
9203/10000 (92%)	 {'predicted': 'development', 'actual': 'development', 'mask_idx': 67}
9204/10000 (92%)	 {'predicted': 'opposed', 'actual': 'hostile', 'mask_idx': 102}
9205/10000 (92%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 235}
9206/10000 (92%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 72}
9207/10000 (92%)	 {'predicted': 'museums', 'actual': 'museums', 'mask_idx': 16}
9208/10000 (92%)	 {'predicted': '"', 'actual': '<', 'mask_idx': 127}
9209/10000 (92%)	 {'predicted': 'called', 'actual': 'nicknamed', 'mask_idx': 11}
9210/10000 (92%)	 {'predicted': '2007', 'actual': 'match', 'mask_idx': 145}
9211/10000 (92%)	 {'predi

9310/10000 (93%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 144}
9311/10000 (93%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 5}
9312/10000 (93%)	 {'predicted': 'george', 'actual': 'demon', 'mask_idx': 9}
9313/10000 (93%)	 {'predicted': 'by', 'actual': 'by', 'mask_idx': 24}
9314/10000 (93%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 16}
9315/10000 (93%)	 {'predicted': '>', 'actual': 'and', 'mask_idx': 44}
9316/10000 (93%)	 {'predicted': 'the', 'actual': 'little', 'mask_idx': 65}
9317/10000 (93%)	 {'predicted': 'war', 'actual': 'war', 'mask_idx': 66}
9318/10000 (93%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 62}
9319/10000 (93%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 263}
9320/10000 (93%)	 {'predicted': 'health', 'actual': 'office', 'mask_idx': 140}
9321/10000 (93%)	 {'predicted': 'john', 'actual': '<', 'mask_idx': 54}
9322/10000 (93%)	 {'predicted': 'year', 'actual': 'year', 'mask_idx': 75}
9323/10000 (93%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 

9421/10000 (94%)	 {'predicted': 'to', 'actual': 'to', 'mask_idx': 51}
9422/10000 (94%)	 {'predicted': '"', 'actual': '<', 'mask_idx': 101}
9423/10000 (94%)	 {'predicted': 'name', 'actual': 'debut', 'mask_idx': 157}
9424/10000 (94%)	 {'predicted': '"', 'actual': 'power', 'mask_idx': 5}
9425/10000 (94%)	 {'predicted': 'sent', 'actual': 'flown', 'mask_idx': 164}
9426/10000 (94%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 89}
9427/10000 (94%)	 {'predicted': 'for', 'actual': ',', 'mask_idx': 42}
9428/10000 (94%)	 {'predicted': 'before', 'actual': 'before', 'mask_idx': 82}
9429/10000 (94%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 124}
9430/10000 (94%)	 {'predicted': 'he', 'actual': '<', 'mask_idx': 57}
9431/10000 (94%)	 {'predicted': 'billboard', 'actual': 'allmusic', 'mask_idx': 143}
9432/10000 (94%)	 {'predicted': 'countries', 'actual': 'territories', 'mask_idx': 181}
9433/10000 (94%)	 {'predicted': 'ventral', 'actual': 'ventral', 'mask_idx': 82}
9434/10000 (94%)	 {'predicted

9534/10000 (95%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 46}
9535/10000 (95%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 41}
9536/10000 (95%)	 {'predicted': 'in', 'actual': 'in', 'mask_idx': 36}
9537/10000 (95%)	 {'predicted': 'other', 'actual': '<', 'mask_idx': 108}
9538/10000 (95%)	 {'predicted': 'in', 'actual': 'against', 'mask_idx': 80}
9539/10000 (95%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 52}
9540/10000 (95%)	 {'predicted': 'was', 'actual': 'had', 'mask_idx': 124}
9541/10000 (95%)	 {'predicted': 'his', 'actual': 'his', 'mask_idx': 201}
9542/10000 (95%)	 {'predicted': 'room', 'actual': 'room', 'mask_idx': 72}
9543/10000 (95%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 15}
9544/10000 (95%)	 {'predicted': '.', 'actual': 'column', 'mask_idx': 1}
9545/10000 (95%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 32}
9546/10000 (95%)	 {'predicted': 'there', 'actual': 'there', 'mask_idx': 99}
9547/10000 (95%)	 {'predicted': ',', 'actual': 'and', 'mask_idx': 

9647/10000 (96%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 112}
9648/10000 (96%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 126}
9649/10000 (96%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 48}
9650/10000 (96%)	 {'predicted': 'the', 'actual': 'grave', 'mask_idx': 140}
9651/10000 (96%)	 {'predicted': 'tower', 'actual': '.', 'mask_idx': 207}
9652/10000 (96%)	 {'predicted': 'imperial', 'actual': 'imperial', 'mask_idx': 12}
9653/10000 (96%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 99}
9654/10000 (96%)	 {'predicted': 'many', 'actual': 'us', 'mask_idx': 26}
9655/10000 (96%)	 {'predicted': '.', 'actual': '<', 'mask_idx': 24}
9656/10000 (96%)	 {'predicted': 'takes', 'actual': 'takes', 'mask_idx': 2}
9657/10000 (96%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 5}
9658/10000 (96%)	 {'predicted': '##s', 'actual': '<', 'mask_idx': 193}
9659/10000 (96%)	 {'predicted': ',', 'actual': ',', 'mask_idx': 85}
9660/10000 (96%)	 {'predicted': 'sharp', 'actual': 'clear', 'mask_idx':

9760/10000 (97%)	 {'predicted': 'hungarian', 'actual': 'the', 'mask_idx': 11}
9761/10000 (97%)	 {'predicted': 'the', 'actual': 'the', 'mask_idx': 258}
9762/10000 (97%)	 {'predicted': '.', 'actual': 'the', 'mask_idx': 0}
9763/10000 (97%)	 {'predicted': 'london', 'actual': 'london', 'mask_idx': 188}
9764/10000 (97%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 38}
9765/10000 (97%)	 {'predicted': '"', 'actual': '=', 'mask_idx': 2}
9766/10000 (97%)	 {'predicted': 'pacific', 'actual': 'territory', 'mask_idx': 92}
9767/10000 (97%)	 {'predicted': 'been', 'actual': 'been', 'mask_idx': 23}
9768/10000 (97%)	 {'predicted': ',', 'actual': 'by', 'mask_idx': 41}
9769/10000 (97%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 44}
9770/10000 (97%)	 {'predicted': '5', 'actual': '3', 'mask_idx': 85}
9771/10000 (97%)	 {'predicted': 'announced', 'actual': 'said', 'mask_idx': 5}
9772/10000 (97%)	 {'predicted': 'since', 'actual': 'since', 'mask_idx': 193}
9773/10000 (97%)	 {'predicted': 'to', 'actua

9869/10000 (98%)	 {'predicted': 'dean', 'actual': 'dean', 'mask_idx': 74}
9870/10000 (98%)	 {'predicted': ',', 'actual': 'complex', 'mask_idx': 3}
9871/10000 (98%)	 {'predicted': 'left', 'actual': 'stopped', 'mask_idx': 145}
9872/10000 (98%)	 {'predicted': 'number', 'actual': 'number', 'mask_idx': 94}
9873/10000 (98%)	 {'predicted': ':', 'actual': 'contained', 'mask_idx': 6}
9874/10000 (98%)	 {'predicted': 'military', 'actual': 'military', 'mask_idx': 145}
9875/10000 (98%)	 {'predicted': '3', 'actual': '1', 'mask_idx': 92}
9876/10000 (98%)	 {'predicted': '-', 'actual': 'sm', 'mask_idx': 0}
9877/10000 (98%)	 {'predicted': 'important', 'actual': 'integral', 'mask_idx': 124}
9878/10000 (98%)	 {'predicted': 'way', 'actual': 'story', 'mask_idx': 41}
9879/10000 (98%)	 {'predicted': '.', 'actual': ',', 'mask_idx': 4}
9880/10000 (98%)	 {'predicted': 'operation', 'actual': 'operation', 'mask_idx': 52}
9881/10000 (98%)	 {'predicted': 'a', 'actual': 'a', 'mask_idx': 220}
9882/10000 (98%)	 {'predi

9980/10000 (99%)	 {'predicted': 'emperor', 'actual': '<', 'mask_idx': 104}
9981/10000 (99%)	 {'predicted': '.', 'actual': '.', 'mask_idx': 17}
9982/10000 (99%)	 {'predicted': '.', 'actual': 'view', 'mask_idx': 0}
9983/10000 (99%)	 {'predicted': 'of', 'actual': 'of', 'mask_idx': 3}
9984/10000 (99%)	 {'predicted': 'is', 'actual': 'is', 'mask_idx': 87}
9985/10000 (99%)	 {'predicted': 'guard', 'actual': 'army', 'mask_idx': 29}
9986/10000 (99%)	 {'predicted': 'population', 'actual': 'population', 'mask_idx': 8}
9987/10000 (99%)	 {'predicted': 'the', 'actual': '<', 'mask_idx': 91}
9988/10000 (99%)	 {'predicted': 'close', 'actual': 'close', 'mask_idx': 13}
9989/10000 (99%)	 {'predicted': 'in', 'actual': 'for', 'mask_idx': 14}
9990/10000 (99%)	 {'predicted': 'keep', 'actual': 'keep', 'mask_idx': 161}
9991/10000 (99%)	 {'predicted': 'and', 'actual': 'and', 'mask_idx': 25}
9992/10000 (99%)	 {'predicted': 'his', 'actual': 'various', 'mask_idx': 90}
9993/10000 (99%)	 {'predicted': 'few', 'actual':

In [114]:
sum(1 if p['predicted'] == p['actual'] else 0 for p in performance)

4996

In [115]:
len(performance)

10000

In [126]:
lengths = [len(tokenizer(x[0])['input_ids']) for x in sequences]

In [129]:
combined = [{**p, 'length': l} for p, l in zip(performance, lengths)]

In [132]:
import json
with open('export_10k_bert_masked.json', 'w') as f:
    json.dump(combined, f)

In [140]:
sum(1 if x > 100 else 0 for x in wiki_lengths)

0

In [144]:
wiki_lengths = [len(tokenizer(x)['input_ids']) for x in cleaned]

In [None]:
wiki_lengths

In [154]:
for x in range(1, 11):
    x *= 50
    num = len([w for w in wiki_lengths if w >= x])
    print(f'{num} articles with length >= {x}')

1714 articles with length >= 50
1339 articles with length >= 100
870 articles with length >= 150
514 articles with length >= 200
264 articles with length >= 250
137 articles with length >= 300
70 articles with length >= 350
30 articles with length >= 400
16 articles with length >= 450
3 articles with length >= 500


In [151]:
[1,2,1,2,3].index(2)

1

In [13]:
def get_random_window(data, num=10000, seq_len = 100):
    MASK_ID = 103
    
    response = []
    
    tokenized = [tokenizer(x)['input_ids'] for x in data]
    tokenized = [x for x in tokenized if len(x) >= seq_len]
    
    while len(response) < num:
        # pick a random line
        line = tokenized[randint(len(tokenized))]
        
        # get random start position
        start = randint(len(line) - seq_len)
        end = start + seq_len
        
        # mask a random token in window
        window = line[start:end]
        window[randint(seq_len)] = MASK_ID
        
        response.append((line, window))
        
    return response

In [18]:
get_random_window(cleaned)

Token indices sequence length is longer than the specified maximum sequence length for this model (528 > 512). Running this sequence through the model will result in indexing errors


ValueError: low >= high

In [22]:
randint(10)

7