In [None]:
import numpy as np
import pandas as pd #To convert txt to dataframe so that other things will be easier
from tqdm import tqdm #For progress checking while running the code
from sklearn.metrics import precision_score, recall_score, f1_score, accuracy_score  #For metrices calculation
import warnings
warnings.filterwarnings("ignore")

In [None]:
train= open("/content/drive/MyDrive/NLP_ass2/NLP2/train.txt",'r')
test=open("/content/drive/MyDrive/NLP_ass2/NLP2/test.txt",'r')

Change train txt file to a dataframe

In [None]:
id= None
text = None
df_train=pd.DataFrame(columns=['sent_id','text','word', 'normalized_word', 'POS_tag', 'head_word_index','dependency_relation' ])
for line in train:
  if line.strip():
    if line.startswith("# sent_id"):
        id = line.split("=")[-1].strip()
    elif line.startswith("# text"):
         text = line.split("=")[-1].strip()
    else:
      parts = line.split()
      row = {
                'sent_id': id,
                'text': text,
                'word': parts[1],
                'normalized_word': parts[2],
                'POS_tag': parts[3],
                'head_word_index': parts[4],
                'dependency_relation': parts[5]
            }
      df_train = df_train.append(row, ignore_index=True)

In [None]:
df_train

Unnamed: 0,sent_id,text,word,normalized_word,POS_tag,head_word_index,dependency_relation
0,GUM_academic_art-1,Aesthetic Appreciation and Spanish Art:,Aesthetic,aesthetic,JJ,2,amod
1,GUM_academic_art-1,Aesthetic Appreciation and Spanish Art:,Appreciation,appreciation,NN,0,root
2,GUM_academic_art-1,Aesthetic Appreciation and Spanish Art:,and,and,CC,5,cc
3,GUM_academic_art-1,Aesthetic Appreciation and Spanish Art:,Spanish,Spanish,JJ,5,amod
4,GUM_academic_art-1,Aesthetic Appreciation and Spanish Art:,Art,art,NN,2,conj
...,...,...,...,...,...,...,...
36707,GUM_conversation_gossip-26,That doesn't matter or?,matter,matter,VB,0,root
36708,GUM_conversation_gossip-26,That doesn't matter or?,or,or,CC,4,conj
36709,GUM_conversation_gossip-26,That doesn't matter or?,?,?,.,4,punct
36710,GUM_conversation_gossip-27,Mmm.,Mmm,mmm,UH,0,root


Change test txt file to a dataframe

In [None]:
id= None
text = None
df_test=pd.DataFrame(columns=['sent_id','text','word', 'normalized_word', 'POS_tag', 'head_word_index','dependency_relation' ])
for line in test:
  if line.strip():
    if line.startswith("# sent_id"):
        id = line.split("=")[-1].strip()
    elif line.startswith("# text"):
         text = line.split("=")[-1].strip()
    else:
      parts = line.split()
      row = {
                'sent_id': id,
                'text': text,
                'word': parts[1],
                'normalized_word': parts[2],
                'POS_tag': parts[3],
                'head_word_index': parts[4],
                'dependency_relation': parts[5]
            }
      df_test = df_test.append(row, ignore_index=True)

In [None]:
df_test.shape

(2184, 7)

Creating a dictionary to store frequency of each word

In [None]:
word_freq= df_train['word'].value_counts()

print(len(word_freq))
# (word_freq[','])

6782


Calculating how much tokens in train data are also present in test data

In [None]:
test_token= df_test['word'].tolist()
yes=0
no=0
for item in test_token:
  if item in word_freq:
      yes +=1
  else :
    no +=1
print(f"present: {yes}, absent : {no}")

present: 1724, absent : 460


Unique POS tags and their count in the training dataset

In [None]:
tags_set=df_train['POS_tag'].unique()
print(tags_set)
print(len(tags_set))

['JJ' 'NN' 'CC' ':' 'NNS' 'IN' 'HYPH' 'NNP' ',' 'WRB' 'VBP' 'VB' '.' 'WDT'
 'PRP' 'DT' 'VBZ' 'VBG' 'RB' 'MD' 'PRP$' 'VBN' 'FW' 'SYM' 'VBD' 'TO' 'RP'
 '-LRB-' '-RRB-' '_' 'POS' 'CD' 'EX' 'LS' 'JJR' 'RBR' 'WP$' 'JJS' 'PDT'
 '``' "''" 'WP' 'NNPS' 'UH' 'RBS' 'GW' '$']
47


Frequency of each tag

In [None]:
tag_freq=df_train['POS_tag'].value_counts()
print(tag_freq.sum())
print(len(tag_freq))

36712
47


In [None]:
tag_freq['DT']

2971

Frequency of each tag to appear in start of sentence

In [None]:
df_train['start_of_sentence'] = df_train['sent_id'] != df_train['sent_id'].shift()
tag_start_freq= df_train[df_train['start_of_sentence']]['POS_tag'].value_counts()

Assigning 0 frequncy to those tags which doesnt appear at the start of sentence, so that tag_start_freq will store frequency of all 47 tags to come at the start of sentence.

In [None]:
all_tags = df_train['POS_tag'].unique()
tag_start_freq = tag_start_freq.reindex(all_tags, fill_value=0)

In [None]:
tag_start_freq

JJ        77
NN        61
CC       104
:          0
NNS       22
IN       282
HYPH       0
NNP      188
,          0
WRB       19
VBP       14
VB        23
.          0
WDT        6
PRP      283
DT       197
VBZ       13
VBG       16
RB       166
MD         3
PRP$      54
VBN       13
FW         6
SYM        0
VBD        5
TO         7
RP         0
-LRB-      1
-RRB-      0
_         85
POS        0
CD        38
EX         9
LS        15
JJR        2
RBR        6
WP$        0
JJS        3
PDT        4
``         5
''         0
WP        15
NNPS       2
UH       254
RBS        2
GW         0
$          0
Name: POS_tag, dtype: int64

Calculating count of each tag-tag pair in a dataset

In [None]:
tag_pair_counts = {}
count = 0

for sent_id, group in df_train.groupby('sent_id'):
    tag_pairs = list(zip(group['POS_tag'], group['POS_tag'].shift(-1)))
    # Remove the last tag pair as it is a pair of tag of last element of sentence and None
    tag_pairs.pop()

    # print(f"sentence id: {sent_id}, tag pair: {tag_pairs}")
    for tag_pair in tag_pairs:
        if tag_pair not in tag_pair_counts:
            tag_pair_counts[tag_pair] = 1
        else:
            tag_pair_counts[tag_pair] += 1
    count += 1

# No. of sentencec processed
print(count)

2000


In [None]:
tag_pair_counts['DT','NN']

1326

Calculating the count of each word-tag pair in a dataset

In [None]:
df_train['word_tag_pair'] = list(zip(df_train['word'], df_train['POS_tag']))
tag_word_pair_counts= df_train['word_tag_pair'].value_counts()

In [None]:
tag_word_pair_counts

(,, ,)               2207
(., .)               1615
(the, DT)            1560
(of, IN)             1024
(and, CC)             804
                     ... 
(Continuity, NNP)       1
(1918, CD)              1
(Movement, NNP)         1
(Cornell, NNP)          1
(Mmm, UH)               1
Name: word_tag_pair, Length: 7376, dtype: int64

len of tag_word_par_counts is more than no. of unique words in the dataset, as there are some words which have different tags in different context of sentences

In [None]:
len(tag_word_pair_counts)

7376

In [None]:
def tag_start_prob(t):
  if t in tag_start_freq:
      return tag_start_freq[t]/ 2000
  else:
      return 0

This function will give transition probability from tag1(t1) to tag2(t2)

P(t2 | t1) = Count( t1 , t2) / Count (t1)

In [None]:
def transition_prob(t1, t2):
  if (t1,t2) in tag_pair_counts:
      return tag_pair_counts[(t1,t2)]/ tag_freq[t1]
  else:
      return 0

This function will give emission probability from tag(t) to word(w)

P(w |t ) = Count( t, w) / Count (t)

In [None]:
def emission_prob(w,t):
  if (w,t) in tag_word_pair_counts:
      return tag_word_pair_counts[(w,t)]/ tag_freq[t]
  else :
      return 0

In [None]:
tag_start_prob('JJ')

0.0385

In [None]:
# transition_prob('DT','NN')
transition_prob('DT','CC')

0.0010097610232245036

In [None]:
emission_prob('the','DT')
# emission_prob('and','CC')

0.5250757320767419

Creating transition matrix of tags

transition_matrix[i,j] will show the probability of transition from tag i to tag j

In [None]:
T=len(tags_set)
transition_matrix=np.zeros((T,T))
for i in range(T):
  for j in range(T):
      transition_matrix[i,j]= transition_prob(tags_set[i], tags_set[j])

In [None]:
transition_matrix.shape

(47, 47)

In [None]:
transition_matrix[np.where(tags_set== 'DT')[0][0]][np.where(tags_set == 'NN')[0][0]]

0.4463143722652306

In [None]:
def viterbi_train(sentence, tags_set):
    T=len(tags_set)
    W= len(sentence)
    epsilon = 1

    # Initialize the dynamic programming table to scores and tags found at each step
    scores= np.zeros((T,W), dtype= float)
    backptr = np.zeros((T,W), dtype=int)

    # Initialization Step for w==0 i,e. 1st word of sentence
    for t in range(T):
          scores[t,0]= (tag_start_prob(tags_set[t])* emission_prob(sentence[0], tags_set[t]))
          backptr[t, 0] = 0

    # Iteration Step
    for w in range (1,W):
      for t in range(T):
        prob= scores[:, w-1] * transition_matrix[:, t] * emission_prob(sentence[w], tags_set[t])

        backptr[t, w] = np.argmax(prob)
        scores[t, w] = np.max(prob)

     # Identifying final best path probability
    best_path_prob = np.max(scores[:, -1])

    # Path backtracking
    best_path = np.zeros(len(sentence), dtype=int)
    best_path[-1] = np.argmax(scores[:, -1])
    for w in range(len(sentence)-2, -1, -1):
        best_path[w] = backptr[best_path[w+1], w+1]

    POS_tag_seq = [tags_set[index] for index in best_path]
    return POS_tag_seq

In [None]:
# Initialize lists to store train output
output_train = {
    'sent_id': [],
    'token_no': [],
    'word': [],
    'predicted_tag': []
}
POS_tags_train_pred=[]
POS_tags_train_true=[]
# Iterate over each sentence in the DataFrame
for sent_id, group in tqdm(df_train.groupby('sent_id')):
    sentence = group['word'].tolist()
    true_tag = group['POS_tag'].tolist()
    pred_tag = viterbi_train(sentence, tags_set)
    POS_tags_train_pred.extend(pred_tag)
    POS_tags_train_true.extend(true_tag)
    print(f"Sentence ID: {sent_id}, Words: {sentence}, POS Tag true : {true_tag}, POS Tag predicted: {pred_tag}")

    # Store the train output for each word in the sentence
    for i, (word, true_tag, pred_tag) in enumerate(zip(sentence, true_tag, pred_tag), start=1):
        output_train['sent_id'].append(sent_id)
        output_train['token_no'].append(i)
        output_train['word'].append(word)
        output_train['predicted_tag'].append(pred_tag)

  0%|          | 5/2000 [00:00<00:51, 38.46it/s]

Sentence ID: GUM_academic_art-1, Words: ['Aesthetic', 'Appreciation', 'and', 'Spanish', 'Art', ':'], POS Tag true : ['JJ', 'NN', 'CC', 'JJ', 'NN', ':'], POS Tag predicted: ['JJ', 'NN', 'CC', 'NNP', 'NNP', ':']
Sentence ID: GUM_academic_art-10, Words: ['The', 'viewing', 'experience', 'of', 'art', 'is', 'a', 'complex', 'one', ',', 'involving', 'issues', 'of', 'perception', ',', 'attention', ',', 'memory', ',', 'decision', '-', 'making', ',', 'affect', ',', 'and', 'emotion', '.'], POS Tag true : ['DT', 'NN', 'NN', 'IN', 'NN', 'VBZ', 'DT', 'JJ', 'NN', ',', 'VBG', 'NNS', 'IN', 'NN', ',', 'NN', ',', 'NN', ',', 'NN', 'HYPH', 'VBG', ',', 'NN', ',', 'CC', 'NN', '.'], POS Tag predicted: ['DT', 'NN', 'NN', 'IN', 'NN', 'VBZ', 'DT', 'JJ', 'NN', ',', 'VBG', 'NNS', 'IN', 'NN', ',', 'NN', ',', 'NN', ',', 'NN', 'HYPH', 'VBG', ',', 'VBP', ',', 'CC', 'NN', '.']
Sentence ID: GUM_academic_art-11, Words: ['Thus', ',', 'the', 'time', 'it', 'takes', 'and', 'the', 'ways', 'of', 'visually', 'exploring', 'an', '

  1%|          | 13/2000 [00:00<00:54, 36.76it/s]

Sentence ID: GUM_academic_art-17, Words: ['We', 'will', 'discuss', 'the', 'potential', 'implications', 'of', 'these', 'techniques', 'and', 'our', 'understanding', 'of', 'visual', 'behaviours', 'on', 'museum', 'and', 'gallery', 'practice', '.'], POS Tag true : ['PRP', 'MD', 'VB', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'NNS', 'CC', 'PRP$', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'NN', 'CC', 'NN', 'NN', '.'], POS Tag predicted: ['PRP', 'MD', 'VB', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'NNS', 'CC', 'PRP$', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'NN', 'CC', 'NN', 'NN', '.']
Sentence ID: GUM_academic_art-18, Words: ['The', 'project', 'brings', 'together', 'established', 'research', 'strengths', 'in', 'Spanish', 'art', 'history', ',', 'experimental', 'psychology', ',', 'digital', 'humanities', ',', 'and', 'museum', 'studies', 'to', 'explore', ',', 'using', 'eye', '-', 'tracking', 'techniques', ',', 'aesthetic', 'reactions', 'to', 'digital', 'representations', 'of', 'the', 'individual', 'Zurbarán', 'artworks', 'as', 'well', 

  1%|          | 17/2000 [00:00<01:02, 31.93it/s]

Sentence ID: GUM_academic_art-23, Words: ['Previous', 'eye', 'tracking', 'research', 'has', 'highlighted', 'the', 'potential', 'to', 'transform', 'the', 'ways', 'we', 'understand', 'visual', 'processing', 'in', 'the', 'arts', '(', 'see', 'for', 'example', 'Brieber', '2014', ';', 'Binderman', 'et', 'al.', ',', '2005', ')', 'and', 'at', 'the', 'same', 'time', 'offers', 'a', 'direct', 'way', 'of', 'studying', 'several', 'important', 'factors', 'of', 'a', 'museum', 'visit', '(', 'Filippini', 'Fantoni', 'et', 'al.', ',', '2013', ';', 'Heidenreich', '&', 'Turano', '2011', ';', 'Milekic', '2010', ')', '.'], POS Tag true : ['JJ', 'NN', 'NN', 'NN', 'VBZ', 'VBN', 'DT', 'NN', 'TO', 'VB', 'DT', 'NNS', 'PRP', 'VBP', 'JJ', 'NN', 'IN', 'DT', 'NNS', '-LRB-', 'VB', 'IN', 'NN', 'NNP', 'CD', ':', 'NNP', 'FW', 'FW', ',', 'CD', '-RRB-', 'CC', 'IN', 'DT', 'JJ', 'NN', 'VBZ', 'DT', 'JJ', 'NN', 'IN', 'VBG', 'JJ', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'NN', '-LRB-', 'NNP', 'NNP', 'FW', 'FW', ',', 'CD', ':', 'NNP', 'CC

  2%|▏         | 30/2000 [00:00<00:52, 37.87it/s]

Sentence ID: GUM_academic_art-28, Words: ['This', 'pilot', 'project', 'primarily', 'investigated', 'how', 'participants', 'visually', 'explore', 'artworks', 'and', 'provides', 'new', 'insights', 'into', 'the', 'potential', 'eye', '-', 'tracking', 'has', 'to', 'transform', 'the', 'ways', 'we', 'understand', 'visual', 'processing', 'in', 'arts', 'and', 'culture', 'and', 'at', 'the', 'same', 'time', 'offer', 'a', 'direct', 'way', 'of', 'studying', 'several', 'important', 'factors', 'of', 'a', 'museum', 'visit', ',', 'namely', 'to', 'assess', 'the', 'effects', 'of', 'label', 'characteristics', 'on', 'visitor', 'visual', 'behaviour', '.'], POS Tag true : ['DT', 'NN', 'NN', 'RB', 'VBD', 'WRB', 'NNS', 'RB', 'VBP', 'NNS', 'CC', 'VBZ', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'NN', 'HYPH', 'NN', 'VBZ', 'TO', 'VB', 'DT', 'NNS', 'PRP', 'VBP', 'JJ', 'NN', 'IN', 'NNS', 'CC', 'NN', 'CC', 'IN', 'DT', 'JJ', 'NN', 'VB', 'DT', 'JJ', 'NN', 'IN', 'VBG', 'JJ', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'NN', ',', 'RB', 'TO', 'V

  2%|▏         | 39/2000 [00:01<00:56, 34.88it/s]

Sentence ID: GUM_academic_census-13, Words: ['Because', 'assembling', 'such', 'a', 'full', 'census', 'is', 'difficult', ',', 'past', 'studies', 'have', 'tended', 'to', 'avoid', 'this', 'task', 'and', 'have', 'instead', 'used', 'samples', 'of', 'researchers', '[', '8', '–', '11', ']', ',', 'usually', 'specific', 'to', 'a', 'particular', 'field', '[', '12', '–', '16', ']', ',', 'and', 'often', 'focused', 'on', 'the', 'scientific', 'elite', '[', '17', ',', '18', ']', '.'], POS Tag true : ['IN', 'VBG', 'PDT', 'DT', 'JJ', 'NN', 'VBZ', 'JJ', ',', 'JJ', 'NNS', 'VBP', 'VBN', 'TO', 'VB', 'DT', 'NN', 'CC', 'VBP', 'RB', 'VBN', 'NNS', 'IN', 'NNS', '-LRB-', 'CD', 'SYM', 'CD', '-RRB-', ',', 'RB', 'JJ', 'IN', 'DT', 'JJ', 'NN', '-LRB-', 'CD', 'SYM', 'CD', '-RRB-', ',', 'CC', 'RB', 'VBN', 'IN', 'DT', 'JJ', 'NN', '-LRB-', 'CD', ',', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'VBG', 'PDT', 'DT', 'JJ', 'NN', 'VBZ', 'JJ', ',', 'JJ', 'NNS', 'VBP', 'VBN', 'TO', 'VB', 'DT', 'NN', 'CC', 'VBP', 'RB', 'VBN',

  2%|▏         | 47/2000 [00:01<00:53, 36.39it/s]

Sentence ID: GUM_academic_census-21, Words: ['First', ',', 'surveys', 'are', 'subject', 'to', 'variable', 'response', 'rates', 'and', 'the', 'misinterpretation', 'of', 'questions', 'or', 'sample', 'frames', ',', 'which', 'can', 'inject', 'bias', 'into', 'fine', '-', 'grained', 'analyses', '[', '21', ',', '22', ']', '.'], POS Tag true : ['RB', ',', 'NNS', 'VBP', 'JJ', 'IN', 'JJ', 'NN', 'NNS', 'CC', 'DT', 'NN', 'IN', 'NNS', 'CC', 'NN', 'NNS', ',', 'WDT', 'MD', 'VB', 'NN', 'IN', 'JJ', 'HYPH', 'JJ', 'NNS', '-LRB-', 'CD', ',', 'CD', '-RRB-', '.'], POS Tag predicted: ['RB', ',', 'NNS', 'VBP', 'NN', 'IN', 'JJ', 'NN', 'NNS', 'CC', 'DT', 'NN', 'IN', 'NNS', 'CC', 'NN', 'NNS', ',', 'WDT', 'MD', 'VB', 'NN', 'IN', 'JJ', 'HYPH', 'JJ', 'NNS', '-LRB-', 'CD', ',', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_census-22, Words: ['Second', ',', 'aggregate', 'information', 'provides', 'only', 'a', 'high', '-', 'level', 'view', 'of', 'a', 'field', ',', 'which', 'can', 'make', 'it', 'difficult', 'to', 'inve

  3%|▎         | 57/2000 [00:01<00:52, 36.77it/s]

Sentence ID: GUM_academic_census-29, Words: ['Finally', ',', 'applied', 'to', 'many', 'academic', 'fields', 'in', 'parallel', ',', 'the', 'system', 'can', 'elucidate', 'scientists’', 'scientists', '’', 'movement', 'between', 'different', 'disciplines', 'and', 'relate', 'those', 'labor', 'flows', 'to', 'scientific', 'advances', '.'], POS Tag true : ['RB', ',', 'VBN', 'IN', 'JJ', 'JJ', 'NNS', 'IN', 'NN', ',', 'DT', 'NN', 'MD', 'VB', '_', 'NNS', 'POS', 'NN', 'IN', 'JJ', 'NNS', 'CC', 'VB', 'DT', 'NN', 'NNS', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['RB', ',', 'VBN', 'IN', 'JJ', 'JJ', 'NNS', 'IN', 'JJ', ',', 'DT', 'NN', 'MD', 'VB', '_', 'NNS', 'POS', 'NN', 'IN', 'JJ', 'NNS', 'CC', 'VB', 'DT', 'NN', 'NNS', 'IN', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_census-3, Words: ['Past', 'studies', 'establish', 'that', 'each', 'of', 'these', 'efforts', 'is', 'strongly', 'and', 'positively', 'influenced', 'through', 'various', 'forms', 'of', 'faculty', 'diversity', ',', 'including', 'ethnic', ',

  3%|▎         | 66/2000 [00:01<00:58, 33.08it/s]

Sentence ID: GUM_academic_census-6, Words: ['Despite', 'these', 'positive', 'effects', ',', 'however', ',', 'quantifying', 'the', 'impact', 'of', 'diversity', 'in', 'science', 'remains', 'exceedingly', 'difficult', ',', 'due', 'in', 'large', 'part', 'to', 'a', 'lack', 'of', 'comprehensive', 'data', 'about', 'the', 'scientific', 'workforce', '.'], POS Tag true : ['IN', 'DT', 'JJ', 'NNS', ',', 'RB', ',', 'VBG', 'DT', 'NN', 'IN', 'NN', 'IN', 'NN', 'VBZ', 'RB', 'JJ', ',', 'JJ', 'IN', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['IN', 'DT', 'JJ', 'NNS', ',', 'RB', ',', 'VBG', 'DT', 'NN', 'IN', 'NN', 'IN', 'NN', 'VBZ', 'RB', 'JJ', ',', 'JJ', 'IN', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_census-7, Words: ['Measuring', 'the', 'composition', 'and', 'dynamics', 'of', 'a', 'scientific', 'workforce', ',', 'particularly', 'in', 'a', 'rapidly', 'expanding', 'field', 'like', 'computer

  4%|▍         | 75/2000 [00:02<00:51, 37.06it/s]

Sentence ID: GUM_academic_economics-15, Words: ['The', 'path', 'to', 'a', 'prosperous', 'society', 'is', 'not', 'an', 'easy', 'one', '.'], POS Tag true : ['DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'VBZ', 'RB', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'VBZ', 'RB', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_economics-16, Words: ['It', 'is', 'society', 'that', 'establishes', ',', 'through', 'political', 'processes', ',', 'the', 'type', 'of', 'economic', 'institutions', 'that', 'are', 'adopted', '.'], POS Tag true : ['PRP', 'VBZ', 'NN', 'WDT', 'VBZ', ',', 'IN', 'JJ', 'NNS', ',', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'WDT', 'VBP', 'VBN', '.'], POS Tag predicted: ['PRP', 'VBZ', 'NN', 'WDT', 'VBZ', ',', 'IN', 'JJ', 'NNS', ',', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'WDT', 'VBP', 'VBN', '.']
Sentence ID: GUM_academic_economics-17, Words: ['If', 'there', 'are', 'disagreements', 'about', 'the', 'policies', 'to', 'be', 'implemented', ',', 'then', 'the', 'group', 'that', 'w

  4%|▍         | 83/2000 [00:02<00:57, 33.30it/s]

Sentence ID: GUM_academic_economics-23, Words: ['In', 'governments', 'with', 'extractive', 'policies', ',', 'the', 'group', 'in', 'power', 'usually', 'extracts', 'resources', 'from', 'the', 'rest', 'of', 'the', 'population', 'for', 'its', 'own', 'enrichment', 'and', 'well', '-', 'being', '.'], POS Tag true : ['IN', 'NNS', 'IN', 'JJ', 'NNS', ',', 'DT', 'NN', 'IN', 'NN', 'RB', 'VBZ', 'NNS', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'JJ', 'NN', 'CC', 'RB', ':', 'NN', '.'], POS Tag predicted: ['IN', 'NNS', 'IN', 'JJ', 'NNS', ',', 'DT', 'NN', 'IN', 'NN', 'RB', 'VBZ', 'NNS', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'JJ', 'NN', 'CC', 'RB', 'HYPH', 'NN', '.']
Sentence ID: GUM_academic_economics-24, Words: ['Another', 'feature', 'of', 'this', 'type', 'of', 'government', 'is', 'that', 'powerful', 'interest', 'groups', 'oppose', 'increased', 'pluralism', 'because', 'it', 'typically', 'results', 'in', 'the', 'loss', 'of', 'their', 'privileges', '.'], POS Tag true : ['DT', 'NN', 'I

  5%|▍         | 93/2000 [00:02<00:53, 35.39it/s]

Sentence ID: GUM_academic_economics-3, Words: ['Throughout', 'the', 'second', 'half', 'of', 'the', '20th', 'century', ',', 'we', 'have', 'witnessed', 'the', 'return', 'of', 'institutions', 'to', 'economic', 'analysis', '.'], POS Tag true : ['IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', 'PRP', 'VBP', 'VBN', 'DT', 'NN', 'IN', 'NNS', 'IN', 'JJ', 'NN', '.'], POS Tag predicted: ['IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', 'PRP', 'VBP', 'VBN', 'DT', 'NN', 'IN', 'NNS', 'IN', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_economics-30, Words: ['What', 'if', 'it', 'is', 'the', 'state', 'itself', 'that', 'exhibits', 'predatory', 'behavior', '?'], POS Tag true : ['WP', 'IN', 'PRP', 'VBZ', 'DT', 'NN', 'PRP', 'WDT', 'VBZ', 'JJ', 'NN', '.'], POS Tag predicted: ['WP', 'IN', 'PRP', 'VBZ', 'DT', 'NN', 'PRP', 'WDT', 'VBZ', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_economics-31, Words: ['All', 'these', 'questions', 'have', 'a', 'place', 'in', 'this', 'case', 'analysis', '.'], POS Tag true : 

  5%|▍         | 97/2000 [00:02<00:53, 35.84it/s]

Sentence ID: GUM_academic_economics-37, Words: ['Most', 'of', 'Argentina’s', 'Argentina', '’s', 'governments', 'have', 'been', 'of', 'the', 'predatory', 'type', '.'], POS Tag true : ['JJS', 'IN', '_', 'NNP', 'POS', 'NNS', 'VBP', 'VBN', 'IN', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['JJS', 'IN', '_', 'NNP', 'POS', 'NNS', 'VBP', 'VBN', 'IN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_economics-38, Words: ['The', 'country’s', 'country', '’s', 'unequal', 'economic', 'growth', 'originated', 'in', 'the', 'colonial', 'era', 'and', 'reflects', 'how', 'the', 'Spanish', 'metropolis', 'influenced', 'the', 'establishment', 'of', 'extractive', 'institutions', '[', '7', ']', '.'], POS Tag true : ['DT', '_', 'NN', 'POS', 'JJ', 'JJ', 'NN', 'VBD', 'IN', 'DT', 'JJ', 'NN', 'CC', 'VBZ', 'WRB', 'DT', 'JJ', 'NN', 'VBD', 'DT', 'NN', 'IN', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['DT', '_', 'NN', 'POS', 'JJ', 'JJ', 'NN', 'VBD', 'IN', 'DT', 'JJ', 'NN', 'CC', 'VBZ', 'WRB', 'DT', '

  5%|▌         | 107/2000 [00:03<00:52, 36.25it/s]

Sentence ID: GUM_academic_economics-7, Words: ['For', 'its', 'part', ',', 'North', 'defined', 'the', 'institutions', 'as', 'the', '“', 'rules', 'of', 'the', 'game', '”', ':', 'they', 'determine', 'the', 'structure', 'of', 'the', 'economy', ',', 'establish', 'incentives', 'for', 'economic', 'behavior', ',', 'and', 'affect', 'social', 'interaction', '[', '12', ']', '.'], POS Tag true : ['IN', 'PRP$', 'NN', ',', 'NNP', 'VBD', 'DT', 'NNS', 'IN', 'DT', '``', 'NNS', 'IN', 'DT', 'NN', "''", ':', 'PRP', 'VBP', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'VBP', 'NNS', 'IN', 'JJ', 'NN', ',', 'CC', 'VBP', 'JJ', 'NN', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'PRP$', 'NN', ',', 'NNP', 'VBD', 'DT', 'NNS', 'IN', 'DT', '``', 'NNS', 'IN', 'DT', 'NN', "''", ':', 'PRP', 'VBP', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'VBP', 'NNS', 'IN', 'JJ', 'NN', ',', 'CC', 'VB', 'JJ', 'NN', '-LRB-', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_economics-8, Words: ['Thus', ',', 'institutions', 'also', 'determine', 'th

  6%|▌         | 111/2000 [00:03<01:08, 27.67it/s]

Sentence ID: GUM_academic_enjambment-13, Words: ['In', 'Spanish', 'poetry', ',', 'the', 'syntactic', 'configurations', 'under', 'which', 'enjambment', 'takes', 'place', 'have', 'been', 'described', 'extensively', ',', 'and', 'detailed', 'studies', 'on', 'the', 'use', 'of', 'enjambment', 'by', 'individual', 'authors', 'exist', '(', 'see', 'Martínez', 'Cantón', ',', '2011', 'for', 'an', 'overview', ')', 'including', ',', 'among', 'others', 'Quilis', '(', '1964', ')', ',', 'Domínguez', 'Caparrós', ',', '(', '2000', ')', ',', 'Paraíso', ',', '(', '2000', ')', ',', 'Spang', '(', '1983', ')', 'for', 'a', 'description', 'of', 'enjambment', ',', 'and', 'Alarcos', '(', '1966', ')', ',', 'Senabre', '(', '1982', ')', ',', 'Luján', '(', '2006', ')', ',', 'Martínez', 'Fernández', '(', '2010', ')', 'for', 'case', '-', 'studies', 'on', 'a', 'single', 'author', '.'], POS Tag true : ['IN', 'JJ', 'NN', ',', 'DT', 'JJ', 'NNS', 'IN', 'WDT', 'NN', 'VBZ', 'NN', 'VBP', 'VBN', 'VBN', 'RB', ',', 'CC', 'JJ', 'N

  6%|▌         | 124/2000 [00:03<00:48, 38.53it/s]

Sentence ID: GUM_academic_enjambment-20, Words: ['Finally', ',', 'our', 'study', 'complements', 'Navarro’s', 'Navarro', '’s', '(', '2016', ')', 'automatic', 'metrical', 'analyses', 'of', 'Spanish', 'Golden', 'Age', 'sonnets', ',', 'by', 'covering', 'a', 'wider', 'period', 'and', 'focusing', 'on', 'enjambment', '.'], POS Tag true : ['RB', ',', 'PRP$', 'NN', 'VBZ', '_', 'NNP', 'POS', '-LRB-', 'CD', '-RRB-', 'JJ', 'JJ', 'NNS', 'IN', 'NNP', 'NNP', 'NNP', 'NNS', ',', 'IN', 'VBG', 'DT', 'JJR', 'NN', 'CC', 'VBG', 'IN', 'NN', '.'], POS Tag predicted: ['RB', ',', 'PRP$', 'NN', 'VBZ', '_', 'NNP', 'POS', '-LRB-', 'CD', '-RRB-', 'JJ', 'JJ', 'NNS', 'IN', 'NNP', 'NNP', 'NNP', 'NNS', ',', 'IN', 'VBG', 'DT', 'JJR', 'NN', 'CC', 'VBG', 'IN', 'NN', '.']
Sentence ID: GUM_academic_enjambment-21, Words: ['The', 'abstract', 'is', 'structured', 'thus', ':'], POS Tag true : ['DT', 'NN', 'VBZ', 'VBN', 'RB', ':'], POS Tag predicted: ['DT', 'NN', 'VBZ', 'VBN', 'RB', ':']
Sentence ID: GUM_academic_enjambment-22, W

  7%|▋         | 133/2000 [00:03<00:49, 37.84it/s]

Sentence ID: GUM_academic_enjambment-30, Words: ['Quilis', '(', '1964', ')', 'performed', 'poetry', 'reading', 'experiments', ',', 'proposing', 'that', 'the', 'following', 'strongly', 'connected', 'elements', 'give', 'rise', 'to', 'enjambment', ',', 'should', 'a', 'poetic', '-', 'form', 'pause', 'break', 'them', 'up', ':'], POS Tag true : ['NNP', '-LRB-', 'CD', '-RRB-', 'VBD', 'NN', 'NN', 'NNS', ',', 'VBG', 'IN', 'DT', 'VBG', 'RB', 'VBN', 'NNS', 'VBP', 'NN', 'IN', 'NN', ',', 'MD', 'DT', 'JJ', 'HYPH', 'NN', 'NN', 'VB', 'PRP', 'RP', ':'], POS Tag predicted: ['NNP', '-LRB-', 'CD', '-RRB-', 'VBD', 'NN', 'VBG', 'NNS', ',', 'VBG', 'IN', 'DT', 'VBG', 'RB', 'VBN', 'NNS', 'VBP', 'NN', 'IN', 'NN', ',', 'MD', 'DT', 'JJ', 'HYPH', 'NN', 'NN', 'VB', 'PRP', 'RP', ':']
Sentence ID: GUM_academic_enjambment-31, Words: ['Lexical', 'enjambment', ':', 'Breaking', 'up', 'a', 'word', '.'], POS Tag true : ['JJ', 'NN', ':', 'VBG', 'RP', 'DT', 'NN', '.'], POS Tag predicted: ['JJ', 'NN', ':', 'VBG', 'RP', 'DT', 

  7%|▋         | 147/2000 [00:04<00:37, 49.07it/s]

Sentence ID: GUM_academic_enjambment-38, Words: ['Besides', 'the', 'enjambment', 'types', 'above', ',', 'Spang', '(', '1983', ')', 'noted', 'that', 'if', 'a', 'subject', 'or', 'direct', 'object', 'and', 'their', 'related', 'verbs', 'occur', 'in', 'two', 'different', 'lines', 'of', 'poetry', ',', 'this', 'can', 'also', 'feel', 'unusual', 'for', 'a', 'reader', ',', 'even', 'if', 'the', 'effect', 'is', 'less', 'pronounced', 'than', 'in', 'the', 'environments', 'identified', 'by', 'Quilis', '.'], POS Tag true : ['IN', 'DT', 'NN', 'NNS', 'RB', ',', 'NNP', '-LRB-', 'CD', '-RRB-', 'VBD', 'IN', 'IN', 'DT', 'NN', 'CC', 'JJ', 'NN', 'CC', 'PRP$', 'JJ', 'NNS', 'VBP', 'IN', 'CD', 'JJ', 'NNS', 'IN', 'NN', ',', 'DT', 'MD', 'RB', 'VB', 'JJ', 'IN', 'DT', 'NN', ',', 'RB', 'IN', 'DT', 'NN', 'VBZ', 'RBR', 'VBN', 'IN', 'IN', 'DT', 'NNS', 'VBN', 'IN', 'NNP', '.'], POS Tag predicted: ['IN', 'DT', 'NN', 'NNS', 'RB', ',', 'NNP', '-LRB-', 'CD', '-RRB-', 'VBD', 'DT', 'IN', 'DT', 'NN', 'CC', 'JJ', 'NN', 'CC', 'PR

  8%|▊         | 153/2000 [00:04<00:52, 35.26it/s]

Sentence ID: GUM_academic_epistemic-16, Words: ['A', 'yet', 'more', 'egregious', 'example', 'of', 'such', 'pollution', 'involved', 'collaborative', 'efforts', 'by', 'pharmaceutical', 'companies', 'and', 'the', 'publishing', 'giant', 'Elsevier', 'to', 'produce', 'publications', 'mimicking', 'peer', '-', 'reviewed', 'journals', 'in', 'the', 'interest', 'of', 'promoting', 'the', 'companies’', 'companies', '’', 'commercial', 'products', '[', '23', ']', '.'], POS Tag true : ['DT', 'RB', 'RBR', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'VBN', 'JJ', 'NNS', 'IN', 'JJ', 'NNS', 'CC', 'DT', 'NN', 'NN', 'NNP', 'TO', 'VB', 'NNS', 'VBG', 'NN', 'HYPH', 'VBN', 'NNS', 'IN', 'DT', 'NN', 'IN', 'VBG', 'DT', '_', 'NNS', 'POS', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['DT', 'RB', 'RBR', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'VBN', 'JJ', 'NNS', 'IN', 'JJ', 'NNS', 'CC', 'DT', 'NN', 'NN', 'NNP', 'TO', 'VB', 'NNS', 'VBG', 'NN', 'HYPH', 'VBN', 'NNS', 'IN', 'DT', 'NN', 'IN', 'VBG', 'DT', '_', 'NNS', 'POS', 'JJ'

  8%|▊         | 158/2000 [00:04<01:01, 30.15it/s]

Sentence ID: GUM_academic_epistemic-20, Words: ['More', 'recently', ',', 'institutions', 'of', 'academic', 'expertise', 'have', 'been', 'subject', 'to', 'a', 'large', 'and', 'growing', 'outbreak', 'of', 'so', '-', 'called', 'predatory', 'journals', '—', 'journals', 'that', 'will', 'publish', 'almost', 'anything', 'for', 'a', 'fee', '.'], POS Tag true : ['RBR', 'RB', ',', 'NNS', 'IN', 'JJ', 'NN', 'VBP', 'VBN', 'JJ', 'IN', 'DT', 'JJ', 'CC', 'VBG', 'NN', 'IN', 'RB', 'HYPH', 'VBN', 'JJ', 'NNS', ':', 'NNS', 'WDT', 'MD', 'VB', 'RB', 'NN', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['RBR', 'RB', ',', 'NNS', 'IN', 'JJ', 'NN', 'VBP', 'VBN', 'NN', 'IN', 'DT', 'JJ', 'CC', 'VBG', 'NN', 'IN', 'RB', 'HYPH', 'VBN', 'JJ', 'NNS', ':', 'NNS', 'WDT', 'MD', 'VB', 'RB', 'NN', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_academic_epistemic-21, Words: ['Once', 'again', ',', 'this', 'phenomenon', 'has', 'the', 'effect', 'of', 'making', 'peer', '-', 'reviewed', 'journals', 'appear', 'less', 'legitimate', '.'], POS 

  8%|▊         | 162/2000 [00:04<01:08, 26.66it/s]

Sentence ID: GUM_academic_epistemic-24, Words: ['Yet', 'some', 'Frontiers', 'journals', 'appear', 'to', 'have', 'engaged', 'in', 'bad', 'behavior', ',', 'whether', 'for', 'profit', 'or', 'for', 'some', 'other', 'motive', '.'], POS Tag true : ['CC', 'DT', 'NNP', 'NNS', 'VBP', 'TO', 'VB', 'VBN', 'IN', 'JJ', 'NN', ',', 'CC', 'IN', 'NN', 'CC', 'IN', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['CC', 'DT', 'NNPS', 'NNS', 'VBP', 'TO', 'VB', 'VBN', 'IN', 'JJ', 'NN', ',', 'CC', 'IN', 'NN', 'CC', 'IN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_epistemic-25, Words: ['Frontiers', 'in', 'Public', 'Health', 'controversially', 'published', 'articles', 'linking', 'vaccines', 'and', 'autism', '[', '24', ']', 'and', 'questioning', 'the', 'link', 'between', 'HIV', 'and', 'AIDS', '[', '25', ']', '.'], POS Tag true : ['NNPS', 'IN', 'NNP', 'NNP', 'RB', 'VBD', 'NNS', 'VBG', 'NNS', 'CC', 'NN', '-LRB-', 'CD', '-RRB-', 'CC', 'VBG', 'DT', 'NN', 'IN', 'NNP', 'CC', 'NNP', '-LRB-', 'CD', '-RRB-', '.'], POS T

  8%|▊         | 166/2000 [00:05<01:19, 23.07it/s]

Sentence ID: GUM_academic_epistemic-28, Words: ['If', 'academics', 'with', 'expertise', 'in', 'relevant', 'fields', 'have', 'difficulty', 'assessing', 'whether', 'particular', 'journals', 'or', 'particular', 'publishers', 'are', 'legitimate', ',', 'one', 'cannot', 'can', 'not', 'reasonably', 'expect', 'ordinary', 'people', 'to', 'make', 'such', 'judgments', '.'], POS Tag true : ['IN', 'NNS', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'VBP', 'NN', 'VBG', 'IN', 'JJ', 'NNS', 'CC', 'JJ', 'NNS', 'VBP', 'JJ', ',', 'PRP', '_', 'MD', 'RB', 'RB', 'VB', 'JJ', 'NNS', 'TO', 'VB', 'JJ', 'NNS', '.'], POS Tag predicted: ['IN', 'NNS', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'VBP', 'NN', 'VBG', 'IN', 'JJ', 'NNS', 'CC', 'JJ', 'NNS', 'VBP', 'JJ', ',', 'PRP', '_', 'MD', 'RB', 'RB', 'VB', 'JJ', 'NNS', 'TO', 'VB', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_epistemic-29, Words: ['If', 'their', 'confidence', 'in', 'scientific', 'findings', 'is', 'lowered', 'across', 'the', 'board', 'as', 'the', 'result', 'of', 'such', 'epistemic

  9%|▊         | 172/2000 [00:05<01:37, 18.77it/s]

Sentence ID: GUM_academic_epistemic-30, Words: ['Since', 'conflicts', 'of', 'interest', 'are', 'a', 'reason', 'to', 'discount', 'expertise', ',', 'it', 'is', 'incumbent', 'on', 'me', 'to', 'note', 'that', 'I', 'have', 'published', 'in', 'Frontiers', 'journals', 'on', 'several', 'occasions', '.'], POS Tag true : ['IN', 'NNS', 'IN', 'NN', 'VBP', 'DT', 'NN', 'TO', 'VB', 'NN', ',', 'PRP', 'VBZ', 'JJ', 'IN', 'PRP', 'TO', 'VB', 'IN', 'PRP', 'VBP', 'VBN', 'IN', 'NNP', 'NNS', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['IN', 'NNS', 'IN', 'NN', 'VBP', 'DT', 'NN', 'TO', 'VB', 'NN', ',', 'PRP', 'VBZ', 'JJ', 'IN', 'PRP', 'TO', 'VB', 'IN', 'PRP', 'VBP', 'VBN', 'IN', 'NNP', 'NNS', 'IN', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_epistemic-31, Words: ['Epistemic', 'pollution', 'may', 'stem', 'not', 'only', 'from', 'counterfeit', 'institutions', 'of', 'knowledge', 'production', 'but', 'also', 'from', 'bad', 'behavior', 'by', 'legitimate', 'institutions', '.', '9'], POS Tag true : ['JJ', 'NN', 'MD', 

  9%|▉         | 175/2000 [00:05<01:35, 19.16it/s]

Sentence ID: GUM_academic_epistemic-35, Words: ['They', 'have', 'other', 'functions', ',', 'and', 'these', 'functions', 'may', 'come', 'into', 'conflict', ',', 'creating', 'pressures', 'to', 'inflate', 'credentials', '.'], POS Tag true : ['PRP', 'VBP', 'JJ', 'NNS', ',', 'CC', 'DT', 'NNS', 'MD', 'VB', 'IN', 'NN', ',', 'VBG', 'NNS', 'TO', 'VB', 'NNS', '.'], POS Tag predicted: ['PRP', 'VBP', 'JJ', 'NNS', ',', 'CC', 'DT', 'NNS', 'MD', 'VB', 'IN', 'NN', ',', 'VBG', 'NNS', 'TO', 'VB', 'NNS', '.']
Sentence ID: GUM_academic_epistemic-36, Words: ['For', 'example', ',', 'universities', 'have', 'a', 'financial', 'incentive', 'to', 'inflate', 'the', 'expertise', 'of', 'their', 'academic', 'staff', ',', 'thereby', 'increasing', 'their', 'rankings', ',', 'bringing', 'in', 'grant', 'money', ',', 'and', 'attracting', 'students', '.'], POS Tag true : ['IN', 'NN', ',', 'NNS', 'VBP', 'DT', 'JJ', 'NN', 'TO', 'VB', 'DT', 'NN', 'IN', 'PRP$', 'JJ', 'NN', ',', 'RB', 'VBG', 'PRP$', 'NNS', ',', 'VBG', 'RP', 'NN

  9%|▉         | 178/2000 [00:05<01:37, 18.68it/s]

Sentence ID: GUM_academic_epistemic-4, Words: ['In', 'fact', ',', 'many', ',', 'if', 'not', 'all', ',', 'the', 'markers', 'of', 'expertise', 'identified', 'by', 'philosophers', 'enjoy', 'widespread', 'recognition', '.'], POS Tag true : ['IN', 'NN', ',', 'JJ', ',', 'IN', 'RB', 'PDT', ',', 'DT', 'NNS', 'IN', 'NN', 'VBN', 'IN', 'NNS', 'VBP', 'JJ', 'NN', '.'], POS Tag predicted: ['IN', 'NN', ',', 'JJ', ',', 'IN', 'RB', 'RB', ',', 'DT', 'NNS', 'IN', 'NN', 'VBN', 'IN', 'NNS', 'VBP', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_epistemic-5, Words: ['The', 'fact', 'that', 'these', 'criteria', 'are', 'widely', 'known', ',', 'however', ',', 'offers', 'an', 'opportunity', 'to', 'those', 'who', 'would', 'use', 'them', 'for', 'deception', ',', 'witting', 'or', 'unwitting', '.'], POS Tag true : ['DT', 'NN', 'IN', 'DT', 'NNS', 'VBP', 'RB', 'VBN', ',', 'RB', ',', 'VBZ', 'DT', 'NN', 'IN', 'DT', 'WP', 'MD', 'VB', 'PRP', 'IN', 'NN', ',', 'JJ', 'CC', 'JJ', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'DT', '

  9%|▉         | 181/2000 [00:06<01:48, 16.81it/s]

Sentence ID: GUM_academic_epistemic-7, Words: ['We', 'live', 'in', 'an', 'epistemic', 'environment', 'that', 'is', 'heavily', 'and', 'deliberately', 'polluted', 'by', 'agents', 'who', 'use', 'mimicry', 'and', 'other', 'methods', 'as', 'a', 'means', 'of', 'inflating', 'their', 'pretense', 'to', 'expertise', '.'], POS Tag true : ['PRP', 'VBP', 'IN', 'DT', 'JJ', 'NN', 'WDT', 'VBZ', 'RB', 'CC', 'RB', 'VBN', 'IN', 'NNS', 'WP', 'VBP', 'NN', 'CC', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'IN', 'VBG', 'PRP$', 'NN', 'IN', 'NN', '.'], POS Tag predicted: ['PRP', 'VBP', 'IN', 'DT', 'JJ', 'NN', 'WDT', 'VBZ', 'RB', 'CC', 'RB', 'VBN', 'IN', 'NNS', 'WP', 'NN', 'NN', 'CC', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'IN', 'VBG', 'PRP$', 'NN', 'IN', 'NN', '.']
Sentence ID: GUM_academic_epistemic-8, Words: ['This', 'fact', ',', 'together', 'with', 'the', 'fact', 'that', 'such', 'deception', 'is', 'widely', 'known', 'to', 'occur', ',', 'reduces', 'ordinary', 'people’s', 'people', '’s', 'trust', 'in', 'expert', 'authority', 'and

  9%|▉         | 187/2000 [00:06<01:47, 16.89it/s]

Sentence ID: GUM_academic_epistemic-9, Words: ['For', 'instance', ',', 'those', 'with', 'an', 'interest', 'in', 'deceiving', 'the', 'general', 'public', 'may', 'set', 'up', 'parallel', 'institutions', 'that', 'ostensibly', 'guarantee', 'expertise', ',', 'taking', 'advantage', 'of', 'the', 'ways', 'in', 'which', 'these', 'parallel', 'institutions', 'mimic', 'legitimate', 'institutions', 'to', 'ensure', 'that', 'people', 'are', 'taken', 'in', '.'], POS Tag true : ['IN', 'NN', ',', 'DT', 'IN', 'DT', 'NN', 'IN', 'VBG', 'DT', 'JJ', 'NN', 'MD', 'VB', 'RP', 'JJ', 'NNS', 'WDT', 'RB', 'VBP', 'NN', ',', 'VBG', 'NN', 'IN', 'DT', 'NNS', 'IN', 'WDT', 'DT', 'JJ', 'NNS', 'VBP', 'JJ', 'NNS', 'TO', 'VB', 'IN', 'NNS', 'VBP', 'VBN', 'RP', '.'], POS Tag predicted: ['IN', 'NN', ',', 'DT', 'IN', 'DT', 'NN', 'IN', 'VBG', 'DT', 'JJ', 'NN', 'MD', 'VB', 'RP', 'JJ', 'NNS', 'WDT', 'RB', 'VB', 'NN', ',', 'VBG', 'NN', 'IN', 'DT', 'NNS', 'IN', 'WDT', 'DT', 'JJ', 'NNS', 'VBP', 'JJ', 'NNS', 'TO', 'VB', 'DT', 'NNS', 'V

 10%|▉         | 193/2000 [00:06<01:28, 20.36it/s]

Sentence ID: GUM_academic_games-14, Words: ['The', 'games', 'involve', 'challenges', 'and', 'rules', 'involving', 'the', 'exercise', 'of', 'cognitive', 'functions', ',', 'especially', 'the', 'working', 'memory', ',', 'attention', 'and', 'capacity', 'of', 'solving', 'problems', '.'], POS Tag true : ['DT', 'NNS', 'VBP', 'NNS', 'CC', 'NNS', 'VBG', 'DT', 'NN', 'IN', 'JJ', 'NNS', ',', 'RB', 'DT', 'NN', 'NN', ',', 'NN', 'CC', 'NN', 'IN', 'VBG', 'NNS', '.'], POS Tag predicted: ['DT', 'NNS', 'VBP', 'NNS', 'CC', 'NNS', 'VBG', 'DT', 'NN', 'IN', 'JJ', 'NNS', ',', 'RB', 'DT', 'NN', 'NN', ',', 'NN', 'CC', 'NN', 'IN', 'VBG', 'NNS', '.']
Sentence ID: GUM_academic_games-15, Words: ['The', 'study', 'combines', 'qualitative', 'and', 'quantitative', 'approaches', '.'], POS Tag true : ['DT', 'NN', 'VBZ', 'JJ', 'CC', 'JJ', 'NNS', '.'], POS Tag predicted: ['DT', 'NN', 'VBZ', 'JJ', 'CC', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_games-16, Words: ['It', 'collects', 'the', 'data', 'based', 'on', 'the', 'obse

 10%|▉         | 196/2000 [00:06<01:22, 21.88it/s]

Sentence ID: GUM_academic_games-19, Words: ['The', 'sample', 'consisted', 'of', '71', 'students', 'of', 'the', 'Application', 'School', 'of', 'Basic', 'Education', ',', 'Federal', 'University', 'of', 'Santa', 'Catarina', ',', 'aged', '7', 'and', '9', 'years', 'old', '(', 'M', '=', '7.64', '±', '1.12', ')', ',', 'which', 'were', 'divided', 'into', 'two', 'groups', ':', 'participant', 'and', 'control', '.'], POS Tag true : ['DT', 'NN', 'VBD', 'IN', 'CD', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'NNP', 'NNP', ',', 'NNP', 'NNP', 'IN', 'NNP', 'NNP', ',', 'JJ', 'CD', 'CC', 'CD', 'NNS', 'JJ', '-LRB-', 'NN', 'SYM', 'CD', 'CC', 'CD', '-RRB-', ',', 'WDT', 'VBD', 'VBN', 'IN', 'CD', 'NNS', ':', 'NN', 'CC', 'NN', '.'], POS Tag predicted: ['DT', 'NN', 'VBD', 'IN', 'CD', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'NNP', 'NNP', ',', 'NNP', 'NNP', 'IN', 'NNP', 'NNP', ',', 'JJ', 'CD', 'CC', 'CD', 'NNS', 'JJ', '-LRB-', 'NN', 'SYM', 'CD', 'CC', 'CD', '-RRB-', ',', 'WDT', 'VBD', 'VBN', 'IN', 'CD', 'NNS', ':', 'N

 10%|▉         | 199/2000 [00:06<01:31, 19.76it/s]

Sentence ID: GUM_academic_games-23, Words: ['Students', 'have', 'their', 'scores', 'measured', 'by', 'four', 'variables', ':', 'time', ',', 'speed', ',', 'stability', 'and', 'accuracy', '.'], POS Tag true : ['NNS', 'VBP', 'PRP$', 'NNS', 'VBN', 'IN', 'CD', 'NNS', ':', 'NN', ',', 'NN', ',', 'NN', 'CC', 'NN', '.'], POS Tag predicted: ['NNS', 'VBP', 'PRP$', 'NNS', 'VBN', 'IN', 'CD', 'NNS', ':', 'NN', ',', 'NN', ',', 'NN', 'CC', 'NN', '.']
Sentence ID: GUM_academic_games-24, Words: ['A', 'statistical', 'analysis', 'was', 'performed', 'based', 'on', 'the', 'application', 'of', 'the', 'paired', 't', '-', 'test', 'on', 'the', 'difference', 'of', 'the', 'overall', 'score', 'obtained', 'in', 'the', 'test', 'before', 'and', 'after', 'the', 'intervention', 'in', 'the', 'two', 'groups', '.'], POS Tag true : ['DT', 'JJ', 'NN', 'VBD', 'VBN', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'VBN', 'NN', 'HYPH', 'NN', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'VBN', 'IN', 'DT', 'NN', 'IN', 'CC', 'IN', 'DT', 'NN', 

 10%|█         | 204/2000 [00:07<01:55, 15.61it/s]

Sentence ID: GUM_academic_games-25, Words: ['The', 'difference', 'in', 'the', 'results', 'obtained', 'from', 'the', 'application', 'of', 'D2', 'Test', 'of', 'attention', 'before', 'and', 'after', 'was', 'statistically', 'significant', '(', 'p', '<', '0.05', ')', ',', 'the', 'participant', 'group', 'had', 'mean', 'and', 'standard', 'deviation', '60.23', '(', '64.75', ')', 'respectively', ',', 'while', 'the', 'control', 'group', 'was', '20.00', '(', '42.65', ')', '.'], POS Tag true : ['DT', 'NN', 'IN', 'DT', 'NNS', 'VBN', 'IN', 'DT', 'NN', 'IN', 'NN', 'NN', 'IN', 'NN', 'IN', 'CC', 'IN', 'VBD', 'RB', 'JJ', '-LRB-', 'NN', 'SYM', 'CD', '-RRB-', ',', 'DT', 'NN', 'NN', 'VBD', 'NN', 'CC', 'JJ', 'NN', 'CD', '-LRB-', 'CD', '-RRB-', 'RB', ',', 'IN', 'DT', 'NN', 'NN', 'VBD', 'CD', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'DT', 'NNS', 'VBN', 'IN', 'DT', 'NN', 'IN', 'NN', 'NN', 'IN', 'NN', 'IN', 'CC', 'IN', 'VBD', 'RB', 'JJ', '-LRB-', 'NN', 'SYM', 'CD', '-RRB-', ',', 'DT',

 10%|█         | 208/2000 [00:07<01:31, 19.69it/s]

Sentence ID: GUM_academic_games-29, Words: ['From', 'this', ',', 'we', 'conclude', 'that', 'an', 'intervention', 'based', 'on', 'cognitive', 'digital', 'games', 'offers', 'contributions', 'to', 'the', 'learning', 'process', 'and', 'improvement', 'of', 'sustained', 'attention', '.'], POS Tag true : ['IN', 'DT', ',', 'PRP', 'VBP', 'IN', 'DT', 'NN', 'VBN', 'IN', 'JJ', 'JJ', 'NNS', 'VBZ', 'NNS', 'IN', 'DT', 'NN', 'NN', 'CC', 'NN', 'IN', 'JJ', 'NN', '.'], POS Tag predicted: ['IN', 'DT', ',', 'PRP', 'VBP', 'IN', 'DT', 'NN', 'VBN', 'IN', 'JJ', 'JJ', 'NNS', 'VBZ', 'NNS', 'IN', 'DT', 'NN', 'NN', 'CC', 'NN', 'IN', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_games-3, Words: ['Daniela', 'Karine', 'Ramos', 'dadaniela@gmail.com', 'Universidade', 'Federal', 'de', 'Santa', 'Catarin'], POS Tag true : ['NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP'], POS Tag predicted: ['NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP']
Sentence ID: GUM_academic_games-4, Words: ['Bruna', 'Anast

 11%|█         | 214/2000 [00:08<02:16, 13.09it/s]

Sentence ID: GUM_academic_games-8, Words: ['Other', 'studies', 'specifically', 'investigate', 'the', 'use', 'of', 'digital', 'games', 'in', 'the', 'school', 'context', 'and', 'suggest', 'potential', 'for', 'digital', 'game', 'use', 'to', 'improve', 'of', "student's", 'student', "'s", 'attention', 'span', 'at', 'preschool', 'age', '(', 'Rueda', ',', 'Checa', ',', '&', 'Cómbita', ',', '2012', ')', ',', 'to', 'improve', 'overall', 'intelligence', 'capacity', 'of', 'elementary', 'school', 'children', '(', 'Miller', '&', 'Robertson', ',', '2010', ')', ',', 'and', 'to', 'better', 'performance', 'of', 'working', 'memory', 'ability', '(', 'Klingberg', 'et', 'al.', ',', '2005', ';', 'Thorell', ',', 'Lindqvist', ',', 'Nutley', ',', 'Bohlin', ',', '&', 'Klingberg', ',', '2009', ')', '.'], POS Tag true : ['JJ', 'NNS', 'RB', 'VBP', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'NN', 'CC', 'VBP', 'NN', 'IN', 'JJ', 'NN', 'NN', 'TO', 'VB', 'IN', '_', 'NN', 'POS', 'NN', 'NN', 'IN', 'NN', 'NN', '-LRB

 11%|█         | 218/2000 [00:08<02:00, 14.76it/s]

Sentence ID: GUM_academic_huh-11, Words: ['In', 'fact', 'the', 'variation', 'in', 'form', 'in', 'unrelated', 'languages', 'across', 'the', 'globe', 'is', 'about', 'the', 'same', 'as', 'the', 'variation', 'we', 'find', 'in', 'the', 'way', 'any', 'regular', 'word', '(', 'e.g.', ',', 'dog', ')', 'is', 'pronounced', 'across', 'dialects', 'of', 'English', '.'], POS Tag true : ['IN', 'NN', 'DT', 'NN', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'VBZ', 'RB', 'DT', 'JJ', 'IN', 'DT', 'NN', 'PRP', 'VBP', 'IN', 'DT', 'NN', 'DT', 'JJ', 'NN', '-LRB-', 'FW', ',', 'NN', '-RRB-', 'VBZ', 'VBN', 'IN', 'NNS', 'IN', 'NNP', '.'], POS Tag predicted: ['IN', 'NN', 'DT', 'NN', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'VBZ', 'IN', 'DT', 'JJ', 'IN', 'DT', 'NN', 'PRP', 'VBP', 'IN', 'DT', 'NN', 'DT', 'JJ', 'NN', '-LRB-', 'FW', ',', 'NN', '-RRB-', 'VBZ', 'VBN', 'IN', 'NNS', 'IN', 'NNP', '.']
Sentence ID: GUM_academic_huh-12, Words: ['In', 'support', 'of', 'the', 'second', 'claim', ',', 'we', 'show', 't

 11%|█▏        | 225/2000 [00:08<01:24, 20.93it/s]

Sentence ID: GUM_academic_huh-16, Words: ['Finally', ',', 'we', 'address', 'the', 'question', 'of', 'why', 'all', 'languages', 'should', 'have', 'such', 'a', 'word', 'and', 'why', 'its', 'form', 'should', 'be', 'so', 'similar', 'across', 'languages', '.'], POS Tag true : ['RB', ',', 'PRP', 'VBP', 'DT', 'NN', 'IN', 'WRB', 'DT', 'NNS', 'MD', 'VB', 'PDT', 'DT', 'NN', 'CC', 'WRB', 'PRP$', 'NN', 'MD', 'VB', 'RB', 'JJ', 'IN', 'NNS', '.'], POS Tag predicted: ['RB', ',', 'PRP', 'VBP', 'DT', 'NN', 'IN', 'WRB', 'DT', 'NNS', 'MD', 'VB', 'PDT', 'DT', 'NN', 'CC', 'WRB', 'PRP$', 'NN', 'MD', 'VB', 'RB', 'JJ', 'IN', 'NNS', '.']
Sentence ID: GUM_academic_huh-17, Words: ['We', 'observe', 'that', 'this', 'item', 'fulfils', 'a', 'crucial', 'need', 'shared', 'by', 'all', 'languages', '–', 'the', 'efficient', 'signalling', 'of', 'problems', 'of', 'hearing', 'and', 'understanding', '–', 'and', 'we', 'propose', 'that', 'its', 'form', 'is', 'constrained', 'by', 'selective', 'pressures', 'in', 'a', 'conversatio

 12%|█▏        | 232/2000 [00:08<01:07, 26.35it/s]

Sentence ID: GUM_academic_huh-22, Words: ['The', 'technical', 'term', 'for', 'this', 'type', 'of', 'sequence', 'is', '“', 'open', 'other', '-', 'initiated', 'repair', '”', ':'], POS Tag true : ['DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'NN', 'VBZ', '``', 'JJ', 'JJ', 'HYPH', 'VBN', 'NN', "''", ':'], POS Tag predicted: ['DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'NN', 'VBZ', '``', 'JJ', 'JJ', 'HYPH', 'VBN', 'NN', "''", ':']
Sentence ID: GUM_academic_huh-23, Words: ['repair', 'is', 'initiated', 'not', 'by', 'the', 'speaker', 'of', 'the', 'first', 'turn', 'but', 'by', 'the', 'other', 'participant', '(', '“', 'other', '-', 'initiated', '”', ')', ',', 'and', 'the', 'repair', 'initiator', 'signals', 'that', 'there', 'is', 'a', 'problem', ',', 'but', 'it', 'leaves', 'open', 'what', 'the', 'problem', 'is', '(', '“', 'open', '”', ')', '[', '11', ']', '.'], POS Tag true : ['NN', 'VBZ', 'VBN', 'RB', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'CC', 'IN', 'DT', 'JJ', 'NN', '-LRB-', '``', 'JJ', 'HYPH',

 12%|█▏        | 235/2000 [00:09<01:15, 23.46it/s]

Sentence ID: GUM_academic_huh-29, Words: ['Essentially', ',', 'this', 'method', 'gives', 'us', 'a', 'natural', 'control', 'over', 'conversational', 'data', ',', 'making', 'possible', 'systematic', 'comparison', 'across', 'languages', '[', '12', ']', ',', '[', '13', ']', '.'], POS Tag true : ['RB', ',', 'DT', 'NN', 'VBZ', 'PRP', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NNS', ',', 'VBG', 'JJ', 'JJ', 'NN', 'IN', 'NNS', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['RB', ',', 'DT', 'NN', 'VBZ', 'PRP', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NNS', ',', 'VBG', 'JJ', 'JJ', 'NN', 'IN', 'NNS', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_huh-3, Words: ['Thus', ',', 'the', 'sound', 'of', 'the', 'word', 'dog', 'in', 'English', 'is', 'connected', 'to', 'the', 'concept', '‘', 'dog', '’', 'by', 'historical', 'accident', 'and', 'not', 'by', 'any', 'natural', 'connection', ';', 'roughly', 'the', 'same', 'concept', 'is', 'just', 'as', 'well', 'denote

 12%|█▏        | 242/2000 [00:09<01:06, 26.33it/s]

Sentence ID: GUM_academic_huh-33, Words: ['By', 'compiling', 'data', 'from', 'published', 'literature', 'we', 'found', 'that', 'in', 'thirty', '-', 'one', 'languages', 'around', 'the', 'world', ',', 'the', 'interjection', 'for', 'other', '-', 'initiated', 'repair', 'appears', 'to', 'be', 'strongly', 'similar', '(', 'Figure', '1', ')', '.'], POS Tag true : ['IN', 'VBG', 'NNS', 'IN', 'VBN', 'NN', 'PRP', 'VBD', 'IN', 'IN', 'CD', 'HYPH', 'CD', 'NNS', 'IN', 'DT', 'NN', ',', 'DT', 'NN', 'IN', 'JJ', 'HYPH', 'VBN', 'NN', 'VBZ', 'TO', 'VB', 'RB', 'JJ', '-LRB-', 'NNP', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'VBG', 'NNS', 'IN', 'VBN', 'NN', 'PRP', 'VBD', 'DT', 'IN', 'CD', 'SYM', 'CD', 'NNS', 'IN', 'DT', 'NN', ',', 'DT', 'NN', 'IN', 'JJ', 'HYPH', 'VBN', 'NN', 'VBZ', 'TO', 'VB', 'RB', 'JJ', '-LRB-', 'NNP', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_huh-34, Words: ['However', ',', 'written', 'sources', 'are', 'rarely', 'explicit', 'about', 'the', 'precise', 'form', ',', 'meaning', ',', 'a

 12%|█▏        | 245/2000 [00:09<01:20, 21.87it/s]


Sentence ID: GUM_academic_huh-38, Words: ['In', 'some', 'languages', 'the', 'interjection', ',', 'or', 'an', 'item', 'similar', 'to', 'it', ',', 'was', 'also', 'found', 'in', 'other', 'sequential', 'environments', ',', 'for', 'instance', 'to', 'mark', 'surprise', 'or', 'to', 'pursue', 'a', 'response', '.'], POS Tag true : ['IN', 'DT', 'NNS', 'DT', 'NN', ',', 'CC', 'DT', 'NN', 'JJ', 'IN', 'PRP', ',', 'VBD', 'RB', 'VBN', 'IN', 'JJ', 'JJ', 'NNS', ',', 'IN', 'NN', 'TO', 'VB', 'NN', 'CC', 'TO', 'VB', 'DT', 'NN', '.'], POS Tag predicted: ['IN', 'DT', 'NNS', 'DT', 'NN', ',', 'CC', 'DT', 'NN', 'JJ', 'IN', 'PRP', ',', 'VBD', 'RB', 'VBN', 'IN', 'JJ', 'JJ', 'NNS', ',', 'IN', 'NN', 'TO', 'VB', 'NN', 'CC', 'TO', 'VB', 'DT', 'NN', '.']
Sentence ID: GUM_academic_huh-39, Words: ['Such', 'alternative', '(', 'and', 'probably', 'derived', ')', 'uses', 'provide', 'insight', 'in', 'possible', 'paths', 'of', 'semantic', 'change', ',', 'but', 'we', 'exclude', 'them', 'here', 'to', 'make', 'sure', 'we', 'are

 13%|█▎        | 251/2000 [00:09<01:22, 21.21it/s]

Sentence ID: GUM_academic_huh-6, Words: ['It', 'follows', 'from', 'these', 'two', 'basic', 'principles', '–', 'the', '‘', 'arbitrariness', 'of', 'the', 'sign', '’', ',', 'and', 'the', '‘', 'selectiveness', 'of', 'particular', 'sound', 'systems', '’', '–', 'that', 'the', 'words', 'that', 'exist', 'in', 'the', "world's", 'world', "'s", 'languages', 'should', 'sound', 'quite', 'different', 'from', 'each', 'other', ',', 'and', 'that', 'the', 'likelihood', 'that', 'there', 'are', 'universal', 'words', 'is', 'extremely', 'small', '.'], POS Tag true : ['PRP', 'VBZ', 'IN', 'DT', 'CD', 'JJ', 'NNS', ':', 'DT', '``', 'NN', 'IN', 'DT', 'NN', "''", ',', 'CC', 'DT', '``', 'NN', 'IN', 'JJ', 'NN', 'NNS', "''", ':', 'IN', 'DT', 'NNS', 'WDT', 'VBP', 'IN', 'DT', '_', 'NN', 'POS', 'NNS', 'MD', 'VB', 'RB', 'JJ', 'IN', 'DT', 'JJ', ',', 'CC', 'IN', 'DT', 'NN', 'IN', 'EX', 'VBP', 'JJ', 'NNS', 'VBZ', 'RB', 'JJ', '.'], POS Tag predicted: ['PRP', 'VBZ', 'IN', 'DT', 'CD', 'JJ', 'NNS', ':', 'DT', '``', 'NN', 'IN',

 13%|█▎        | 258/2000 [00:09<01:09, 25.10it/s]

Sentence ID: GUM_academic_implicature-12, Words: ['Future', 'studies', 'should', 'also', 'include', 'a', 'larger', 'age', 'range', 'of', 'children', 'to', 'document', 'the', 'age', 'at', 'which', 'adult', '-', 'like', 'performance', 'emerges', '.'], POS Tag true : ['JJ', 'NNS', 'MD', 'RB', 'VB', 'DT', 'JJR', 'NN', 'NN', 'IN', 'NNS', 'TO', 'VB', 'DT', 'NN', 'IN', 'WDT', 'NN', 'HYPH', 'JJ', 'NN', 'VBZ', '.'], POS Tag predicted: ['JJ', 'NNS', 'MD', 'RB', 'VB', 'DT', 'JJR', 'NN', 'NN', 'IN', 'NNS', 'TO', 'VB', 'DT', 'NN', 'IN', 'WDT', 'NN', 'HYPH', 'JJ', 'NN', 'VBZ', '.']
Sentence ID: GUM_academic_implicature-13, Words: ['Related', 'cross-cultural', 'studies', 'have', 'resulted', 'in', 'insufficient', 'statistical', 'power', ',', 'but', 'interesting', 'trends', '(', 'e.g.', ',', 'Nedwick', ',', '2014', ')', '.'], POS Tag true : ['JJ', 'JJ', 'NNS', 'VBP', 'VBN', 'IN', 'JJ', 'JJ', 'NN', ',', 'CC', 'JJ', 'NNS', '-LRB-', 'FW', ',', 'NNP', ',', 'CD', '-RRB-', '.'], POS Tag predicted: ['JJ', 'JJ

 13%|█▎        | 264/2000 [00:10<01:09, 24.90it/s]

Sentence ID: GUM_academic_implicature-17, Words: ['The', 'current', 'study', 'is', 'too', 'small', 'to', 'make', 'strong', 'conclusions', 'with', 'regard', 'to', 'cultural', 'differences', 'and', 'experimental', 'methods', ';'], POS Tag true : ['DT', 'JJ', 'NN', 'VBZ', 'RB', 'JJ', 'TO', 'VB', 'JJ', 'NNS', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'CC', 'JJ', 'NNS', ':'], POS Tag predicted: ['DT', 'JJ', 'NN', 'VBZ', 'RB', 'JJ', 'TO', 'VB', 'JJ', 'NNS', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'CC', 'JJ', 'NNS', ':']
Sentence ID: GUM_academic_implicature-18, Words: ['however', ',', 'in', 'the', 'study', 'by', 'Hein', 'and', 'colleagues', 'it', 'was', 'found', 'that', 'children', 'responded', 'more', 'or', 'less', 'frequently', 'based', 'on', 'factors', 'such', 'as', 'stimuli', 'type', '.'], POS Tag true : ['RB', ',', 'IN', 'DT', 'NN', 'IN', 'NNP', 'CC', 'NNS', 'PRP', 'VBD', 'VBN', 'IN', 'NNS', 'VBD', 'RBR', 'CC', 'RBR', 'RB', 'VBN', 'IN', 'NNS', 'JJ', 'IN', 'NNS', 'NN', '.'], POS Tag predicted: ['RB', ',', '

 14%|█▎        | 272/2000 [00:10<00:56, 30.69it/s]

Sentence ID: GUM_academic_implicature-21, Words: ['It', 'is', 'possible', 'that', 'these', 'two', 'children', 'understood', 'the', 'task', 'and', 'really', 'did', 'believe', 'that', 'the', 'puppet', 'did', 'not', 'produce', 'any', 'poor', 'descriptions', ',', 'and', 'in', 'this', 'regard', ',', 'are', 'not', 'yet', 'adult', '-', 'like', 'in', 'their', 'SI', 'interpretations', '.'], POS Tag true : ['PRP', 'VBZ', 'JJ', 'IN', 'DT', 'CD', 'NNS', 'VBD', 'DT', 'NN', 'CC', 'RB', 'VBD', 'VB', 'IN', 'DT', 'NN', 'VBD', 'RB', 'VB', 'DT', 'JJ', 'NNS', ',', 'CC', 'IN', 'DT', 'NN', ',', 'VBP', 'RB', 'RB', 'NN', 'HYPH', 'JJ', 'IN', 'PRP$', 'NN', 'NNS', '.'], POS Tag predicted: ['PRP', 'VBZ', 'JJ', 'IN', 'DT', 'CD', 'NNS', 'VBD', 'DT', 'NN', 'CC', 'RB', 'VBD', 'VB', 'IN', 'DT', 'NN', 'VBD', 'RB', 'VB', 'DT', 'JJ', 'NNS', ',', 'CC', 'IN', 'DT', 'NN', ',', 'VBP', 'RB', 'RB', 'NN', 'HYPH', 'RP', 'IN', 'PRP$', 'NN', 'NNS', '.']
Sentence ID: GUM_academic_implicature-22, Words: ['This', 'is', 'unlikely', 'a

 14%|█▍        | 276/2000 [00:10<00:55, 30.92it/s]

Sentence ID: GUM_academic_implicature-29, Words: ['The', 'cardinal', 'numbers', 'included', 'in', 'this', 'study', 'were', 'only', 'one', 'through', 'five', 'in', 'order', 'to', 'avoid', 'additional', 'item', 'variability', ',', 'but', 'larger', 'numbers', 'should', 'be', 'included', 'in', 'future', 'research', '.'], POS Tag true : ['DT', 'JJ', 'NNS', 'VBN', 'IN', 'DT', 'NN', 'VBD', 'RB', 'CD', 'IN', 'CD', 'IN', 'NN', 'TO', 'VB', 'JJ', 'NN', 'NN', ',', 'CC', 'JJR', 'NNS', 'MD', 'VB', 'VBN', 'IN', 'JJ', 'NN', '.'], POS Tag predicted: ['DT', 'JJ', 'NNS', 'VBN', 'IN', 'DT', 'NN', 'VBD', 'RB', 'CD', 'IN', 'CD', 'IN', 'NN', 'TO', 'VB', 'JJ', 'NN', 'NN', ',', 'CC', 'JJR', 'NNS', 'MD', 'VB', 'VBN', 'IN', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_implicature-3, Words: ['We', 'expected', 'that', 'the', 'use', 'of', 'a', 'training', 'session', 'and', 'then', 'the', 'format', 'of', 'the', 'question', 'would', 'guide', 'participants', 'towards', 'evaluating', 'pragmatic', 'felicity', 'over', 'pro

 14%|█▍        | 287/2000 [00:10<00:48, 35.08it/s]

Sentence ID: GUM_academic_implicature-5, Words: ['On', 'the', 'surface', ',', 'it', 'does', 'seem', 'as', 'if', 'there', 'is', 'variability', 'and', 'perhaps', 'a', 'larger', 'sample', 'size', 'or', 'more', 'items', 'could', 'lead', 'to', 'a', 'significant', 'finding', '(', 'see', 'limitations', 'below', ')', ',', 'but', 'at', 'least', 'for', 'this', 'study', ',', 'the', 'only', 'significant', 'finding', 'was', 'the', 'difference', 'between', 'cardinal', 'numbers', 'and', 'some', '.'], POS Tag true : ['IN', 'DT', 'NN', ',', 'PRP', 'VBZ', 'VB', 'IN', 'IN', 'EX', 'VBZ', 'NN', 'CC', 'RB', 'DT', 'JJR', 'NN', 'NN', 'CC', 'JJR', 'NNS', 'MD', 'VB', 'IN', 'DT', 'JJ', 'NN', '-LRB-', 'VB', 'NNS', 'RB', '-RRB-', ',', 'CC', 'IN', 'JJS', 'IN', 'DT', 'NN', ',', 'DT', 'JJ', 'JJ', 'NN', 'VBD', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'CC', 'DT', '.'], POS Tag predicted: ['IN', 'DT', 'NN', ',', 'PRP', 'VBZ', 'VBP', 'RB', 'IN', 'EX', 'VBZ', 'NN', 'CC', 'RB', 'DT', 'JJR', 'NN', 'NN', 'CC', 'JJR', 'NNS', 'MD', 'VB'

 15%|█▍        | 299/2000 [00:11<00:38, 44.41it/s]

Sentence ID: GUM_academic_lighting-16, Words: ['As', 'of', '2016', ',', 'the', 'demand', 'for', 'electricity', 'in', 'the', 'residential', 'is', 'leading', 'among', 'the', 'different', 'sectors', '.'], POS Tag true : ['IN', 'IN', 'CD', ',', 'DT', 'NN', 'IN', 'NN', 'IN', 'DT', 'JJ', 'VBZ', 'VBG', 'IN', 'DT', 'JJ', 'NNS', '.'], POS Tag predicted: ['RB', 'IN', 'CD', ',', 'DT', 'NN', 'IN', 'NN', 'IN', 'DT', 'JJ', 'VBZ', 'VBG', 'IN', 'DT', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_lighting-17, Words: ['It', 'is', 'often', 'grouped', 'depending', 'on', 'its', 'uses', 'that', 'are', 'distributed', 'for', 'heating', 'and', 'cooling', ',', 'lighting', ',', 'operating', 'appliances', 'etc', '[', '1', ']'], POS Tag true : ['PRP', 'VBZ', 'RB', 'VBN', 'VBG', 'IN', 'PRP$', 'NNS', 'WDT', 'VBP', 'VBN', 'IN', 'VBG', 'CC', 'VBG', ',', 'VBG', ',', 'VBG', 'NNS', 'FW', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['PRP', 'VBZ', 'RB', 'VBN', 'VBG', 'IN', 'PRP$', 'NNS', 'WDT', 'VBP', 'VBN', 'IN', 'VBG', 'CC

 16%|█▌        | 310/2000 [00:11<00:36, 46.36it/s]

Sentence ID: GUM_academic_lighting-26, Words: ['There', 'are', 'three', 'general', 'types', 'of', 'lighting', 'that', 'are', 'widely', 'used', 'in', 'the', 'household', 'nowadays', ':', 'the', '(', 'light', '-', 'emitting', 'diode', ')', 'LED', 'bulb', ',', '(', 'compact', 'fluorescent', 'light', ')', 'CFL', 'bulb', 'and', 'the', 'incandescent', 'bulb', '.'], POS Tag true : ['EX', 'VBP', 'CD', 'JJ', 'NNS', 'IN', 'NN', 'WDT', 'VBP', 'RB', 'VBN', 'IN', 'DT', 'NN', 'RB', ':', 'DT', '-LRB-', 'NN', 'HYPH', 'VBG', 'NN', '-RRB-', 'NN', 'NN', ',', '-LRB-', 'JJ', 'JJ', 'NN', '-RRB-', 'NN', 'NN', 'CC', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['EX', 'VBP', 'CD', 'JJ', 'NNS', 'IN', 'NN', 'WDT', 'VBP', 'RB', 'VBN', 'IN', 'DT', 'NN', 'RB', ':', 'DT', '-LRB-', 'NN', 'HYPH', 'VBG', 'NN', '-RRB-', 'NN', 'NN', ',', '-LRB-', 'JJ', 'JJ', 'NN', '-RRB-', 'NN', 'NN', 'CC', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_lighting-27, Words: ['But', 'each', 'of', 'them', 'has', 'their', 'perks', 'and', 'pe

 16%|█▌        | 320/2000 [00:11<00:37, 45.25it/s]

Sentence ID: GUM_academic_lighting-38, Words: ['In', 'response', 'to', 'the', 'aforementioned', 'situation', 'where', 'the', 'three', 'types', 'of', 'lights', 'are', 'compared', 'by', 'their', 'efficiency', 'and', 'effectiveness', 'as', 'light', 'sources', ',', 'the', 'proponents', 'conducted', 'this', 'study', '.'], POS Tag true : ['IN', 'NN', 'IN', 'DT', 'JJ', 'NN', 'WRB', 'DT', 'CD', 'NNS', 'IN', 'NNS', 'VBP', 'VBN', 'IN', 'PRP$', 'NN', 'CC', 'NN', 'IN', 'JJ', 'NNS', ',', 'DT', 'NNS', 'VBD', 'DT', 'NN', '.'], POS Tag predicted: ['IN', 'NN', 'IN', 'DT', 'JJ', 'NN', 'WRB', 'DT', 'CD', 'NNS', 'IN', 'NNS', 'VBP', 'VBN', 'IN', 'PRP$', 'NN', 'CC', 'NN', 'IN', 'JJ', 'NNS', ',', 'DT', 'NNS', 'VBD', 'DT', 'NN', '.']
Sentence ID: GUM_academic_lighting-39, Words: ['Since', 'the', 'CFLs', 'are', 'the', 'most', 'commonly', 'used', 'light', 'bulbs', 'in', 'the', 'residential', 'and', 'has', 'a', 'great', 'compatibility', 'to', 'LED', 'in', 'terms', 'of', 'design', 'and', 'materials', ',', 'the', 

 17%|█▋        | 332/2000 [00:11<00:35, 46.94it/s]

Sentence ID: GUM_academic_mutation-12, Words: ['In', 'the', 'state', 'of', 'the', 'art', ',', 'we', 'have', 'found', 'mutation', 'operators', ',', 'both', 'general', 'purpose', 'and', 'specific', 'to', 'different', 'technologies', ',', 'languages', 'and', 'paradigms', '[', '2', '–', '9', ']', '.'], POS Tag true : ['IN', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'PRP', 'VBP', 'VBN', 'NN', 'NNS', ',', 'CC', 'JJ', 'NN', 'CC', 'JJ', 'IN', 'JJ', 'NNS', ',', 'NNS', 'CC', 'NNS', '-LRB-', 'CD', 'SYM', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'PRP', 'VBP', 'VBN', 'NN', 'NNS', ',', 'CC', 'JJ', 'NN', 'CC', 'JJ', 'IN', 'JJ', 'NNS', ',', 'NNS', 'CC', 'NNS', '-LRB-', 'CD', 'SYM', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_mutation-13, Words: ['However', ',', 'these', 'operators', 'are', 'not', 'adequate', 'when', 'trying', 'to', 'test', 'software', 'features', 'associated', 'with', 'specific', 'domains', '.'], POS Tag true : ['RB', ',', 'DT', 'NNS', 'VBP', 'RB', 

 17%|█▋        | 342/2000 [00:12<00:35, 46.36it/s]

Sentence ID: GUM_academic_mutation-22, Words: ['Later', ',', 'we', 'capture', 'information', 'about', 'the', 'methods', 'of', 'the', 'SUT', 'to', 'be', 'mutated', ',', 'together', 'with', 'the', 'information', 'of', 'the', 'mutation', 'operators', 'that', 'were', 'already', 'defined', '.'], POS Tag true : ['RBR', ',', 'PRP', 'VBP', 'NN', 'IN', 'DT', 'NNS', 'IN', 'DT', 'NN', 'TO', 'VB', 'VBN', ',', 'RB', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'NNS', 'WDT', 'VBD', 'RB', 'VBN', '.'], POS Tag predicted: ['RBR', ',', 'PRP', 'VBP', 'NN', 'IN', 'DT', 'NNS', 'IN', 'DT', 'NN', 'TO', 'VB', 'VBN', ',', 'RB', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'NNS', 'WDT', 'VBD', 'RB', 'VBN', '.']
Sentence ID: GUM_academic_mutation-23, Words: ['From', 'these', 'data', ',', 'we', 'generate', 'the', 'mutation', 'operator', ',', 'in', 'the', 'form', 'of', 'on', 'aspect', ',', 'which', 'will', 'then', 'be', 'possible', 'to', 'interweave', 'with', 'the', 'SUT', 'which', 'generates', 'a', 'mutant', 'of', 'the', 'SUT', '.

 18%|█▊        | 354/2000 [00:12<00:33, 48.50it/s]

Sentence ID: GUM_academic_mutation-33, Words: ['A', 'Geofence', 'is', 'determined', 'by', 'a', 'geographical', 'location', 'expressed', 'in', 'terms', 'of', 'latitude', ',', 'longitude', ',', 'and', 'a', 'radius', 'around', 'that', 'location', '.'], POS Tag true : ['DT', 'NN', 'VBZ', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'VBN', 'IN', 'NNS', 'IN', 'NN', ',', 'NN', ',', 'CC', 'DT', 'NN', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['DT', 'NN', 'VBZ', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'VBN', 'IN', 'NNS', 'IN', 'NN', ',', 'NN', ',', 'CC', 'DT', 'NN', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_academic_mutation-34, Words: ['By', 'creating', 'a', 'Geofence', 'with', 'an', 'erroneous', 'location', 'from', 'its', 'central', 'location', ',', 'the', 'device', 'will', 'receive', 'incorrect', 'location', 'notifications', '.'], POS Tag true : ['IN', 'VBG', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'PRP$', 'JJ', 'NN', ',', 'DT', 'NN', 'MD', 'VB', 'JJ', 'NN', 'NNS', '.'], POS Tag predicted: ['IN', 'VBG', 'DT', 'NN

 19%|█▊        | 371/2000 [00:12<00:29, 55.96it/s]


Sentence ID: GUM_academic_mutation-47, Words: ['However', ',', 'these', 'are', 'not', 'adequate', 'to', 'cover', 'errors', 'in', 'particular', 'domains', '.'], POS Tag true : ['RB', ',', 'DT', 'VBP', 'RB', 'JJ', 'TO', 'VB', 'NNS', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['RB', ',', 'DT', 'VBP', 'RB', 'JJ', 'TO', 'VB', 'NNS', 'IN', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_mutation-48, Words: ['We', 'have', 'defined', 'new', 'operators', 'specific', 'to', 'the', 'GIS', 'domain', 'and', 'a', 'way', 'to', 'apply', 'them', 'to', 'a', 'SUT', '.'], POS Tag true : ['PRP', 'VBP', 'VBN', 'JJ', 'NNS', 'JJ', 'IN', 'DT', 'NN', 'NN', 'CC', 'DT', 'NN', 'TO', 'VB', 'PRP', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['PRP', 'VBP', 'VBN', 'JJ', 'NNS', 'JJ', 'IN', 'DT', 'NN', 'NN', 'CC', 'DT', 'NN', 'TO', 'VB', 'PRP', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_academic_mutation-49, Words: ['In', 'addition', ',', 'we', 'have', 'tested', 'the', 'operators', 'defined', 'in', 'two', 'GIS', 'applications'

 19%|█▉        | 377/2000 [00:12<00:36, 44.23it/s]

Sentence ID: GUM_academic_replication-1, Words: ['Replication', 'in', 'Second', 'Language', 'Research', ':'], POS Tag true : ['NN', 'IN', 'JJ', 'NN', 'NN', ':'], POS Tag predicted: ['NN', 'IN', 'NNP', 'NNP', 'NNP', ':']
Sentence ID: GUM_academic_replication-10, Words: ['In', 'some', 'fields', ',', 'a', 'flourishing', 'metascience', ',', 'that', 'is', ',', 'the', 'scientific', 'study', 'of', 'science', '(', 'see', 'Munafò', 'et', 'al.', ',', '2017', ')', ',', 'has', 'included', 'syntheses', 'assessing', 'the', 'quantity', 'and', 'nature', 'of', 'replication', 'efforts', ',', 'for', 'example', ',', 'in', 'education', '(', 'Makel', '&', 'Plucker', ',', '2014', 'and', 'in', 'psychology', '(', 'Makel', 'et', 'al.', ',', '2012', ')', '.'], POS Tag true : ['IN', 'DT', 'NNS', ',', 'DT', 'JJ', 'NN', ',', 'DT', 'VBZ', ',', 'DT', 'JJ', 'NN', 'IN', 'NN', '-LRB-', 'VB', 'NNP', 'FW', 'FW', ',', 'CD', '-RRB-', ',', 'VBZ', 'VBN', 'NNS', 'VBG', 'DT', 'NN', 'CC', 'NN', 'IN', 'NN', 'NNS', ',', 'IN', 'NN'

 19%|█▉        | 382/2000 [00:12<00:44, 36.35it/s]

Sentence ID: GUM_academic_replication-14, Words: ['Indeed', ',', 'some', 'commentators', 'have', 'called', 'replication', 'the', '“', 'gold', 'standard', '”', 'of', 'research', 'evidence', '(', 'Jasny', ',', 'Chin', ',', 'Chong', ',', '&', 'Vignieri', ',', '2011', ',', 'p.', '1225', ')', 'and', 'a', '“', 'linchpin', 'of', 'the', 'scientific', 'process', '”', '(', 'Let’s', 'Let', '’s', 'replicate', ',', '2006', ',', 'p.', '330', ')', '.'], POS Tag true : ['RB', ',', 'DT', 'NNS', 'VBP', 'VBN', 'NN', 'DT', '``', 'NN', 'NN', "''", 'IN', 'NN', 'NN', '-LRB-', 'NNP', ',', 'NNP', ',', 'NNP', ',', 'CC', 'NNP', ',', 'CD', ',', 'NN', 'CD', '-RRB-', 'CC', 'DT', '``', 'NN', 'IN', 'DT', 'JJ', 'NN', "''", '-LRB-', '_', 'VB', 'PRP', 'VB', ',', 'CD', ',', 'NN', 'CD', '-RRB-', '.'], POS Tag predicted: ['RB', ',', 'DT', 'NNS', 'VBP', 'VBN', 'NN', 'DT', '``', 'NN', 'NN', "''", 'IN', 'NN', 'NN', '-LRB-', 'NNP', ',', 'NNP', ',', 'NNP', ',', 'CC', 'NNP', ',', 'CD', ',', 'NN', 'CD', '-RRB-', 'CC', 'DT', '``',

 20%|█▉        | 391/2000 [00:13<00:49, 32.21it/s]

Sentence ID: GUM_academic_replication-2, Words: ['Narrative', 'and', 'Systematic', 'Reviews', 'and', 'Recommendations', 'for', 'the', 'Field'], POS Tag true : ['JJ', 'CC', 'JJ', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'NN'], POS Tag predicted: ['JJ', 'CC', 'JJ', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'NN']
Sentence ID: GUM_academic_replication-20, Words: ['The', 'narrative', 'review', 'is', 'organized', 'around', 'four', 'broad', 'themes', ':', '(a)', 'the', 'quantity', 'of', 'replication', 'research', ',', '(b)', 'the', 'nature', 'of', 'replication', 'research', ',', '(c)', 'the', 'relationship', 'between', 'initial', 'and', 'replication', 'studies', ',', 'and', '(d)', 'the', 'interpretation', 'and', 'extent', 'of', 'reproducibility', 'of', 'the', 'findings', 'of', 'initial', 'studies', '.'], POS Tag true : ['DT', 'JJ', 'NN', 'VBZ', 'VBN', 'IN', 'CD', 'JJ', 'NNS', ':', 'LS', 'DT', 'NN', 'IN', 'NN', 'NN', ',', 'LS', 'DT', 'NN', 'IN', 'NN', 'NN', ',', 'LS', 'DT', 'NN', 'IN', 'JJ', 'CC', 'NN', 'NNS', '

 20%|█▉        | 395/2000 [00:13<00:50, 31.49it/s]

Sentence ID: GUM_academic_replication-4, Words: ['When', 'using', 'the', 'same', 'materials', 'and', 'procedures', 'as', 'a', 'previous', 'study', ',', 'replication', 'studies', 'serve', 'to', 'test', 'the', 'reliability', 'of', 'the', 'previous', 'study’s', 'study', '’s', 'findings', '.'], POS Tag true : ['WRB', 'VBG', 'DT', 'JJ', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'JJ', 'NN', ',', 'NN', 'NNS', 'VBP', 'TO', 'VB', 'DT', 'NN', 'IN', 'DT', 'JJ', '_', 'NN', 'POS', 'NNS', '.'], POS Tag predicted: ['WRB', 'VBG', 'DT', 'JJ', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'JJ', 'NN', ',', 'NN', 'NNS', 'VBP', 'TO', 'VB', 'DT', 'NN', 'IN', 'DT', 'JJ', '_', 'NN', 'POS', 'NNS', '.']
Sentence ID: GUM_academic_replication-5, Words: ['When', 'altering', 'specific', 'methodological', 'or', 'participant', 'characteristics', 'of', 'a', 'previous', 'study', ',', 'they', 'serve', 'to', 'test', 'generalizability', 'of', 'the', 'earlier', 'findings', 'under', 'different', 'conditions', '.'], POS Tag true : ['WRB', 'VBG', 'J

 20%|█▉        | 399/2000 [00:13<00:55, 28.91it/s]

Sentence ID: GUM_academic_replication-9, Words: ['The', 'Open', 'Science', 'Framework', '(', 'https://osf.io', ')', ',', 'also', 'established', 'in', '2011', ',', 'provides', 'a', 'web', 'infrastructure', 'to', 'facilitate', 'collaboration', 'and', 'has', 'been', 'used', 'for', 'large', 'replication', 'efforts', 'in', 'psychology', '(', 'e.g.', ',', 'Open', 'Science', 'Collaboration', ',', '2015', ')', ',', 'which', 'continue', 'to', 'make', 'waves', 'in', 'academia', '(', 'Laws', ',', '2016', ';', 'Lindsay', ',', '2015', ';', 'Martin', '&', 'Clarke', ',', '2017', ')', 'and', 'the', 'general', 'media', '(', 'Baker', ',', '2015', ';', 'Devlin', ',', '2016', ')', '.'], POS Tag true : ['DT', 'NNP', 'NNP', 'NNP', '-LRB-', 'NNP', '-RRB-', ',', 'RB', 'VBN', 'IN', 'CD', ',', 'VBZ', 'DT', 'NN', 'NN', 'TO', 'VB', 'NN', 'CC', 'VBZ', 'VBN', 'VBN', 'IN', 'JJ', 'NN', 'NNS', 'IN', 'NN', '-LRB-', 'FW', ',', 'NNP', 'NNP', 'NNP', ',', 'CD', '-RRB-', ',', 'WDT', 'VBP', 'TO', 'VB', 'NNS', 'IN', 'NN', '-L

 20%|██        | 403/2000 [00:14<01:30, 17.69it/s]

Sentence ID: GUM_academic_salinity-13, Words: ['Over', 'the', 'past', 'decades', ',', 'the', 'correction', 'for', 'sea', 'surface', 'roughness', 'effects', 'were', 'studied', 'based', 'on', 'the', 'in', '-', 'situ', 'and', 'airborne', 'measurements', ';', 'for', 'example', ',', 'the', 'experiments', 'made', 'from', 'a', 'tower', '[', '12', ']', ',', 'wind', 'and', 'salinity', 'experiments', '(', 'WISE', ')', '[', '13', ',', '14', ']', ',', 'airborne', 'Passive', '-', 'Active', 'L', '-', 'band', 'Sensor', '(', 'PALS', ')', 'campaign', '[', '15', ']', 'and', 'Combined', 'Airborne', 'Radio', 'instruments', 'for', 'Ocean', 'and', 'Land', 'Studies', '(', 'CAROLS', ')', 'campaigns', '[', '16', ',', '17', ']', '.'], POS Tag true : ['IN', 'DT', 'JJ', 'NNS', ',', 'DT', 'NN', 'IN', 'NN', 'NN', 'NN', 'NNS', 'VBD', 'VBN', 'VBN', 'IN', 'DT', 'FW', 'HYPH', 'FW', 'CC', 'JJ', 'NNS', ':', 'IN', 'NN', ',', 'DT', 'NNS', 'VBN', 'IN', 'DT', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'NN', 'CC', 'NN', 'NNS', '-LRB-

 20%|██        | 406/2000 [00:14<02:07, 12.46it/s]

Sentence ID: GUM_academic_salinity-16, Words: ['As', 'the', 'foam', 'effect', 'is', 'significant', 'at', 'high', 'wind', 'speed', 'conditions', '(', 'above', 'a', 'threshold', 'of', '12', 'm', '/', 's', ')', 'due', 'to', 'strong', 'wave', 'breaking', ',', 'it', 'has', 'been', 'corrected', 'by', 'numerous', 'models', ';', 'for', 'example', ',', 'the', 'semi-empirical', 'models', '[', '27', ',', '28', ']', 'and', 'radiative', 'transfer', 'equation', '(', 'RTE', ')', 'based', 'models', '[', '29', ',', '30', ']', ',', 'which', 'were', 'developed', 'to', 'estimate', 'the', 'foam', 'covered', 'sea', 'surface', 'emissivity', '.'], POS Tag true : ['IN', 'DT', 'NN', 'NN', 'VBZ', 'JJ', 'IN', 'JJ', 'NN', 'NN', 'NNS', '-LRB-', 'IN', 'DT', 'NN', 'IN', 'CD', 'NNS', 'SYM', 'NN', '-RRB-', 'JJ', 'IN', 'JJ', 'NN', 'NN', ',', 'PRP', 'VBZ', 'VBN', 'VBN', 'IN', 'JJ', 'NNS', ':', 'IN', 'NN', ',', 'DT', 'JJ', 'NNS', '-LRB-', 'CD', ',', 'CD', '-RRB-', 'CC', 'JJ', 'NN', 'NN', '-LRB-', 'NNP', '-RRB-', 'VBN', 'N

 20%|██        | 408/2000 [00:14<02:28, 10.74it/s]

Sentence ID: GUM_academic_salinity-19, Words: ['However', ',', 'whether', 'this', 'modification', 'can', 'be', 'applied', 'to', 'L', '-', 'band', 'is', 'still', 'unclear', ',', 'and', 'the', 'choice', 'of', 'cutoff', 'wavenumber', 'is', 'arbitrary', 'and', 'needs', 'to', 'be', 'clarified', 'in', 'the', 'L', '-', 'band', '.'], POS Tag true : ['RB', ',', 'IN', 'DT', 'NN', 'MD', 'VB', 'VBN', 'IN', 'NNP', 'HYPH', 'NN', 'VBZ', 'RB', 'JJ', ',', 'CC', 'DT', 'NN', 'IN', 'NN', 'NN', 'VBZ', 'JJ', 'CC', 'VBZ', 'TO', 'VB', 'VBN', 'IN', 'DT', 'NNP', ':', 'NN', '.'], POS Tag predicted: ['RB', ',', 'IN', 'DT', 'NN', 'MD', 'VB', 'VBN', 'IN', 'NNP', 'HYPH', 'NN', 'VBZ', 'RB', 'JJ', ',', 'CC', 'DT', 'NN', 'IN', 'NN', 'NN', 'VBZ', 'JJ', 'CC', 'VBZ', 'TO', 'VB', 'VBN', 'IN', 'DT', 'NNP', 'HYPH', 'NN', '.']
Sentence ID: GUM_academic_salinity-2, Words: ['Salinity', 'is', 'one', 'of', 'the', 'most', 'important', 'marine', 'parameters', ',', 'which', 'controls', 'many', 'processes', 'such', 'as', 'physical', 

 20%|██        | 410/2000 [00:15<02:45,  9.60it/s]

Sentence ID: GUM_academic_salinity-20, Words: ['Moreover', ',', 'the', 'sea', 'surface', 'reflection', 'of', 'downwelling', 'atmospheric', 'emission', 'is', 'another', 'contribution', 'to', 'satellite', '-', 'observed', 'brightness', 'temperature', '[', '31', ']', ',', 'thus', 'the', 'determination', 'of', 'the', 'cutoff', 'wavenumber', 'is', 'required', 'not', 'only', 'for', 'sea', 'surface', 'emission', 'but', 'also', 'for', 'reflection', '.'], POS Tag true : ['RB', ',', 'DT', 'NN', 'NN', 'NN', 'IN', 'VBG', 'JJ', 'NN', 'VBZ', 'DT', 'NN', 'IN', 'NN', 'HYPH', 'VBN', 'NN', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'RB', 'DT', 'NN', 'IN', 'DT', 'NN', 'NN', 'VBZ', 'VBN', 'RB', 'RB', 'IN', 'NN', 'NN', 'NN', 'CC', 'RB', 'IN', 'NN', '.'], POS Tag predicted: ['RB', ',', 'DT', 'NN', 'NN', 'NN', 'IN', 'VBG', 'JJ', 'NN', 'VBZ', 'DT', 'NN', 'IN', 'NN', 'HYPH', 'VBN', 'NN', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'RB', 'DT', 'NN', 'IN', 'DT', 'NN', 'NN', 'VBZ', 'VBN', 'RB', 'RB', 'IN', 'NN', 'NN', 'NN', 'CC',

 21%|██        | 412/2000 [00:15<02:54,  9.11it/s]

Sentence ID: GUM_academic_salinity-22, Words: ['The', 'wind', '-', 'roughened', 'sea', 'surface', 'is', 'associated', 'with', 'the', 'increased', 'brightness', 'temperature', '(', 'due', 'to', 'sea', 'surface', 'roughness', 'effect', ')', ',', 'which', 'induces', 'regional', 'biases', 'when', 'applied', 'to', 'different', 'areas', '[', '32', ']', '.'], POS Tag true : ['DT', 'NN', 'HYPH', 'VBN', 'NN', 'NN', 'VBZ', 'VBN', 'IN', 'DT', 'VBN', 'NN', 'NN', '-LRB-', 'JJ', 'IN', 'NN', 'NN', 'NN', 'NN', '-RRB-', ',', 'WDT', 'VBZ', 'JJ', 'NNS', 'WRB', 'VBN', 'IN', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['DT', 'NN', 'HYPH', 'VBN', 'NN', 'NN', 'VBZ', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'NN', '-LRB-', 'JJ', 'IN', 'NN', 'NN', 'NN', 'NN', '-RRB-', ',', 'WDT', 'VBZ', 'JJ', 'NNS', 'WRB', 'VBN', 'IN', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_salinity-23, Words: ['Furthermore', ',', 'the', 'satellite', 'measurements', 'of', 'SSS', 'are', 'hampered', 'by', 'the

 21%|██        | 414/2000 [00:15<02:59,  8.85it/s]

Sentence ID: GUM_academic_salinity-24, Words: ['Thus', ',', 'the', 'compatibility', 'of', 'these', 'models', 'in', 'coastal', 'area', 'of', 'China', 'needs', 'to', 'be', 'assessed', 'and', 'tested', 'in', 'order', 'to', 'achieve', 'higher', 'accuracies', 'of', 'SSS', 'from', 'the', 'space', '-', 'borne', 'observations', '.'], POS Tag true : ['RB', ',', 'DT', 'NN', 'IN', 'DT', 'NNS', 'IN', 'JJ', 'NN', 'IN', 'NNP', 'VBZ', 'TO', 'VB', 'VBN', 'CC', 'VBN', 'IN', 'NN', 'TO', 'VB', 'JJR', 'NNS', 'IN', 'NN', 'IN', 'DT', 'NN', 'HYPH', 'JJ', 'NNS', '.'], POS Tag predicted: ['RB', ',', 'DT', 'NN', 'IN', 'DT', 'NNS', 'IN', 'JJ', 'NN', 'IN', 'NNP', 'VBZ', 'TO', 'VB', 'VBN', 'CC', 'VBN', 'IN', 'NN', 'TO', 'VB', 'JJR', 'NNS', 'IN', 'NN', 'IN', 'DT', 'NN', 'HYPH', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_salinity-3, Words: ['Although', 'drifters', 'and', 'buoys', ',', 'together', 'with', 'cruises', ',', 'have', 'accumulated', 'large', 'amount', 'in', '-', 'situ', 'water', 'salinity', 'data', 'in', 

 21%|██        | 417/2000 [00:16<04:01,  6.56it/s]

Sentence ID: GUM_academic_salinity-4, Words: ['In', 'the', 'past', 'decade', ',', 'with', 'the', 'successful', 'launch', 'of', 'the', 'soil', 'moisture', 'and', 'ocean', 'salinity', '(', 'SMOS', ')', 'satellite', 'by', 'the', 'European', 'Space', 'Agency', '(', 'ESA', ')', '[', '3', ']', ',', 'the', 'Aquarius', '/', 'SAC-D', 'satellite', '[', '4', ']', ',', 'and', 'the', 'soil', 'moisture', 'active', 'passive', '(', 'SMAP', ')', 'satellite', '[', '5', ',', '6', ']', 'by', 'the', 'National', 'Aeronautics', 'and', 'Space', 'Administration', '(', 'NASA', ')', ',', 'global', 'sea', 'surface', 'salinity', '(', 'SSS', ')', 'observations', 'from', 'space', 'have', 'become', 'possible', 'and', 'a', 'significant', 'improvement', 'has', 'been', 'made', 'to', 'understand', 'the', 'ocean', 'dynamics', 'and', 'climate', 'change', '.'], POS Tag true : ['IN', 'DT', 'JJ', 'NN', ',', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'NN', 'CC', 'NN', 'NN', '-LRB-', 'NNP', '-RRB-', 'NN', 'IN', 'DT', 'NNP', 'NNP

 21%|██        | 419/2000 [00:16<04:28,  5.89it/s]

Sentence ID: GUM_academic_salinity-6, Words: ['At', 'the', 'end', 'of', '1990', ',', 'two', 'airborne', 'microwave', 'interferometers', ',', 'the', 'electronically', 'scanned', 'thinned', 'array', 'radiometer', '(', 'ESTAR', ')', 'and', 'the', 'scanning', 'low', '-', 'frequency', 'microwave', 'radiometer', '(', 'SLFMR', ')', ',', 'successfully', 'produced', 'SSS', 'maps', 'in', 'coastal', 'areas', 'in', 'agreement', 'with', 'in', '-', 'situ', 'measurements', 'with', 'an', 'accuracy', 'of', 'about', '1', 'psu', '.'], POS Tag true : ['IN', 'DT', 'NN', 'IN', 'CD', ',', 'CD', 'JJ', 'NN', 'NNS', ',', 'DT', 'RB', 'VBN', 'VBN', 'NN', 'NN', '-LRB-', 'NNP', '-RRB-', 'CC', 'DT', 'VBG', 'JJ', 'HYPH', 'NN', 'NN', 'NN', '-LRB-', 'NNP', '-RRB-', ',', 'RB', 'VBD', 'NN', 'NNS', 'IN', 'JJ', 'NNS', 'IN', 'NN', 'IN', 'FW', 'HYPH', 'FW', 'NNS', 'IN', 'DT', 'NN', 'IN', 'RB', 'CD', 'NN', '.'], POS Tag predicted: ['IN', 'DT', 'NN', 'IN', 'CD', ',', 'CD', 'JJ', 'NN', 'NNS', ',', 'DT', 'RB', 'VBN', 'VBN', 'NN'

 21%|██        | 421/2000 [00:16<03:58,  6.63it/s]

Sentence ID: GUM_academic_salinity-8, Words: ['However', ',', 'the', 'sensitivity', 'of', 'satellite', 'measured', 'brightness', 'temperature', 'to', 'SSS', 'is', 'quite', 'low', '.'], POS Tag true : ['RB', ',', 'DT', 'NN', 'IN', 'NN', 'VBN', 'NN', 'NN', 'IN', 'NN', 'VBZ', 'RB', 'JJ', '.'], POS Tag predicted: ['RB', ',', 'DT', 'NN', 'IN', 'NN', 'VBN', 'NN', 'NN', 'IN', 'NN', 'VBZ', 'RB', 'JJ', '.']
Sentence ID: GUM_academic_salinity-9, Words: ['For', 'example', ',', 'the', 'sensitivity', 'of', 'vertically', 'polarized', 'brightness', 'temperature', 'to', 'SSS', 'variation', 'is', '0.4', 'to', '0.8', 'K/psu', 'for', 'different', 'observing', 'angles', 'and', 'sea', 'surface', 'temperatures', '(', 'SST', ')', ',', 'and', 'it', 'is', 'only', '0.2', 'to', '0.6', 'K/psu', 'for', 'the', 'horizontal', 'polarization', 'brightness', 'temperature', '[', '10', ']', '.'], POS Tag true : ['IN', 'NN', ',', 'DT', 'NN', 'IN', 'RB', 'VBN', 'NN', 'NN', 'IN', 'NN', 'NN', 'VBZ', 'CD', 'IN', 'CD', 'NN', 'I

 21%|██▏       | 425/2000 [00:17<02:47,  9.42it/s]

Sentence ID: GUM_academic_theropod-10, Words: ['Furthermore', ',', 'limb', 'retraction', 'can', 'be', 'markedly', 'modulated', 'with', 'speed', '[', '5', ']', ',', 'suggesting', 'caution', 'when', 'using', 'simple', 'morphological', 'parameters', 'to', 'estimate', 'functional', 'relationships', '.'], POS Tag true : ['RB', ',', 'NN', 'NN', 'MD', 'VB', 'RB', 'VBN', 'IN', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'VBG', 'NN', 'WRB', 'VBG', 'JJ', 'JJ', 'NNS', 'TO', 'VB', 'JJ', 'NNS', '.'], POS Tag predicted: ['RB', ',', 'NN', 'NN', 'MD', 'VB', 'RB', 'VBN', 'IN', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'VBG', 'NN', 'WRB', 'VBG', 'JJ', 'JJ', 'NNS', 'TO', 'VB', 'JJ', 'NNS', '.']
Sentence ID: GUM_academic_theropod-11, Words: ['Differences', 'in', 'limb', 'orientation', 'can', 'produce', 'substantial', 'differences', 'in', 'loading', 'regimes', 'on', 'limb', 'bones', '.'], POS Tag true : ['NNS', 'IN', 'NN', 'NN', 'MD', 'VB', 'JJ', 'NNS', 'IN', 'NN', 'NNS', 'IN', 'NN', 'NNS', '.'], POS Tag predicted: ['NNS'

 21%|██▏       | 427/2000 [00:17<03:37,  7.25it/s]

Sentence ID: GUM_academic_theropod-13, Words: ['Because', 'bone', 'adapts', 'to', 'its', 'loading', 'environment', '[', '19', ']', ',', '[', '20', ']', ',', '[', '21', ']', ',', 'geometric', 'information', 'from', 'limb', 'bones', ',', 'such', 'as', 'lengths', 'and', 'cross-sectional', 'geometry', ',', 'are', 'expected', 'to', 'reflect', 'differences', 'in', 'loading', 'regimes', 'and', 'consequently', 'in', 'behavior', 'and', 'locomotor', 'patterns', '[', '22', ']', ',', '[', '23', ']', '.'], POS Tag true : ['IN', 'NN', 'VBZ', 'IN', 'PRP$', 'NN', 'NN', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', ',', 'JJ', 'NN', 'IN', 'NN', 'NNS', ',', 'JJ', 'IN', 'NNS', 'CC', 'JJ', 'NN', ',', 'VBP', 'VBN', 'TO', 'VB', 'NNS', 'IN', 'NN', 'NNS', 'CC', 'RB', 'IN', 'NN', 'CC', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'NN', 'VBZ', 'IN', 'PRP$', 'NN', 'NN', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', ','

 22%|██▏       | 430/2000 [00:18<03:23,  7.72it/s]

Sentence ID: GUM_academic_theropod-16, Words: ['Experimental', 'manipulations', 'of', 'femoral', 'orientation', 'in', 'chickens', 'suggest', 'that', 'torsional', 'loads', 'increase', 'as', 'the', 'femur', 'becomes', 'more', 'horizontal', '[', '7', ']', 'supporting', 'the', 'idea', 'that', 'postural', 'differences', 'could', 'be', 'reflected', 'in', 'differences', 'in', 'limb', 'cross-sectional', 'geometry', '.'], POS Tag true : ['JJ', 'NNS', 'IN', 'JJ', 'NN', 'IN', 'NNS', 'VBP', 'IN', 'JJ', 'NNS', 'VBP', 'IN', 'DT', 'NN', 'VBZ', 'RBR', 'NN', '-LRB-', 'CD', '-RRB-', 'VBG', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'MD', 'VB', 'VBN', 'IN', 'NNS', 'IN', 'NN', 'JJ', 'NN', '.'], POS Tag predicted: ['JJ', 'NNS', 'IN', 'JJ', 'NN', 'IN', 'NNS', 'VBP', 'DT', 'JJ', 'NNS', 'VBP', 'IN', 'DT', 'NN', 'VBZ', 'RBR', 'JJ', '-LRB-', 'CD', '-RRB-', 'VBG', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'MD', 'VB', 'VBN', 'IN', 'NNS', 'IN', 'NN', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_theropod-17, Words: ['To', 'test', 'if', 'th

 22%|██▏       | 433/2000 [00:18<03:32,  7.36it/s]

Sentence ID: GUM_academic_theropod-19, Words: ['Maybe', 'this', 'is', 'not', 'surprising', 'considering', 'that', 'a', 'recent', 'study', 'analyzing', 'the', 'relationship', 'between', 'posture', 'and', 'femur', 'cross-sectional', 'properties', 'failed', 'to', 'find', 'differences', 'between', 'birds', 'and', 'non-avian', 'theropods', '[', '24', ']', ',', 'suggesting', 'that', 'simple', 'morphological', 'correlates', 'of', 'limb', 'posture', 'should', 'be', 'used', 'with', 'caution', '.'], POS Tag true : ['RB', 'DT', 'VBZ', 'RB', 'JJ', 'VBG', 'IN', 'DT', 'JJ', 'NN', 'VBG', 'DT', 'NN', 'IN', 'NN', 'CC', 'NN', 'JJ', 'NNS', 'VBD', 'TO', 'VB', 'NNS', 'IN', 'NNS', 'CC', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', ',', 'VBG', 'IN', 'JJ', 'JJ', 'NNS', 'IN', 'NN', 'NN', 'MD', 'VB', 'VBN', 'IN', 'NN', '.'], POS Tag predicted: ['RB', 'DT', 'VBZ', 'RB', 'JJ', 'VBG', 'IN', 'DT', 'JJ', 'NN', 'VBG', 'DT', 'NN', 'IN', 'NN', 'CC', 'NN', 'JJ', 'NNS', 'VBD', 'TO', 'VB', 'NNS', 'IN', 'NNS', 'CC', 'JJ', 'NNS', '

 22%|██▏       | 435/2000 [00:18<03:47,  6.88it/s]

Sentence ID: GUM_academic_theropod-20, Words: ['Interestingly', ',', 'femur', 'length', 'tended', 'to', 'be', 'greater', 'in', 'the', 'experimental', 'group', 'than', 'in', 'both', 'the', 'control', '-', 'weight', 'and', 'the', 'control', 'group', '(', 'by', '4', 'and', '7', '%', ',', 'respectively', ')', ',', 'although', 'not', 'signifcant', '.'], POS Tag true : ['RB', ',', 'NN', 'NN', 'VBD', 'TO', 'VB', 'JJR', 'IN', 'DT', 'JJ', 'NN', 'IN', 'IN', 'CC', 'DT', 'NN', 'HYPH', 'NN', 'CC', 'DT', 'NN', 'NN', '-LRB-', 'IN', 'CD', 'CC', 'CD', 'NN', ',', 'RB', '-RRB-', ',', 'IN', 'RB', 'JJ', '.'], POS Tag predicted: ['RB', ',', 'NN', 'NN', 'VBD', 'TO', 'VB', 'JJR', 'IN', 'DT', 'JJ', 'NN', 'IN', 'IN', 'CC', 'DT', 'NN', 'HYPH', 'NN', 'CC', 'DT', 'NN', 'NN', '-LRB-', 'IN', 'CD', 'CC', 'CD', 'NN', ',', 'RB', '-RRB-', ',', 'IN', 'RB', 'JJ', '.']
Sentence ID: GUM_academic_theropod-21, Words: ['Longer', 'limbs', 'are', 'expected', 'to', 'experience', 'larger', 'bending', 'and', 'torsional', 'moments',

 22%|██▏       | 437/2000 [00:18<03:30,  7.41it/s]

Sentence ID: GUM_academic_theropod-22, Words: ['If', 'this', 'were', 'the', 'case', ',', 'it', 'would', 'support', 'the', 'idea', 'that', 'non-avian', 'theropods', 'have', 'relatively', 'thinner', 'femora', 'than', 'extant', 'birds', 'because', 'of', 'postural', 'differences', '[', '6', ']', '.'], POS Tag true : ['IN', 'DT', 'VBD', 'DT', 'NN', ',', 'PRP', 'MD', 'VB', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'VBP', 'RB', 'JJR', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'IN', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'DT', 'VBD', 'DT', 'NN', ',', 'PRP', 'MD', 'VB', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'VBP', 'RB', 'JJR', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'IN', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_theropod-23, Words: ['The', 'present', 'study', 'was', 'inspired', 'by', 'Carrano', '&', 'Biewener', '[', '7', ']', 'but', 'our', 'results', 'differed', 'markedly', 'from', 'theirs', '.'], POS Tag true : ['DT', 'JJ', 'NN', 'VBD', 'VBN', 'IN', 'NNP', 'CC', 'NNP', '-LRB

 22%|██▏       | 438/2000 [00:19<04:04,  6.39it/s]

Sentence ID: GUM_academic_theropod-24, Words: ['We', 'suggest', 'that', 'the', 'different', 'outcomes', 'are', 'due', 'to', 'the', 'distinct', 'rearing', 'and', 'exercising', 'conditions', 'used', 'in', 'each', 'study', ',', 'in', 'addition', 'to', 'the', 'different', 'artificial', 'tails', 'used', '.'], POS Tag true : ['PRP', 'VBP', 'IN', 'DT', 'JJ', 'NNS', 'VBP', 'JJ', 'IN', 'DT', 'JJ', 'NN', 'CC', 'NN', 'NNS', 'VBN', 'IN', 'DT', 'NN', ',', 'IN', 'NN', 'IN', 'DT', 'JJ', 'JJ', 'NNS', 'VBD', '.'], POS Tag predicted: ['PRP', 'VBP', 'IN', 'DT', 'JJ', 'NNS', 'VBP', 'JJ', 'IN', 'DT', 'JJ', 'NN', 'CC', 'NN', 'NNS', 'VBN', 'IN', 'DT', 'NN', ',', 'IN', 'NN', 'IN', 'DT', 'JJ', 'JJ', 'NNS', 'VBN', '.']
Sentence ID: GUM_academic_theropod-25, Words: ['First', ',', 'our', 'experimental', 'subjects', 'lived', 'in', 'a', 'large', 'enclosure', 'under', 'conditions', 'that', 'allowed', 'them', 'to', 'exercise', 'all', 'day', 'long', '.'], POS Tag true : ['RB', ',', 'PRP$', 'JJ', 'NNS', 'VBN', 'IN', 'D

 22%|██▏       | 441/2000 [00:19<03:24,  7.61it/s]

Sentence ID: GUM_academic_theropod-26, Words: ['In', 'Carrano', '&', "Biewener's", 'Biewener', "'s", 'study', ',', 'experimental', 'chickens', 'were', 'housed', 'individually', 'in', 'smaller', 'cages', 'and', 'were', 'only', 'allowed', 'to', 'exercise', '20', 'minutes', 'per', 'day', ',', '3', 'days', 'per', 'week', ',', 'from', 'the', '6th', 'to', 'the', '12th', 'week', '.'], POS Tag true : ['IN', 'NNP', 'CC', '_', 'NNP', 'POS', 'NN', ',', 'JJ', 'NNS', 'VBD', 'VBN', 'RB', 'IN', 'JJR', 'NNS', 'CC', 'VBD', 'RB', 'VBN', 'TO', 'VB', 'CD', 'NNS', 'IN', 'NN', ',', 'CD', 'NNS', 'IN', 'NN', ',', 'IN', 'DT', 'JJ', 'IN', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['IN', 'NNP', 'CC', '_', 'NNP', 'POS', 'NN', ',', 'JJ', 'NNS', 'VBD', 'VBN', 'RB', 'IN', 'JJR', 'NNS', 'CC', 'VBD', 'RB', 'VBN', 'TO', 'VB', 'CD', 'NNS', 'IN', 'NN', ',', 'CD', 'NNS', 'IN', 'NN', ',', 'IN', 'DT', 'JJ', 'IN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_theropod-27, Words: ['Second', ',', 'in', 'their', 'study', ',

 22%|██▏       | 444/2000 [00:19<03:05,  8.38it/s]

Sentence ID: GUM_academic_theropod-28, Words: ['During', 'avian', 'evolution', ',', 'the', 'loss', 'of', 'the', 'CFL', 'and', 'reorganization', 'of', 'the', 'pelvic', 'musculature', '[', '5', ']', ',', '[', '13', ']', 'could', 'have', 'made', 'birds', 'unable', 'to', 'properly', 'carry', 'a', 'postacetabular', 'mass', 'equivalent', 'to', 'that', 'carried', 'by', 'non-avian', 'theropods', '[', '5', ']', ',', '[', '6', ']', '.'], POS Tag true : ['IN', 'JJ', 'NN', ',', 'DT', 'NN', 'IN', 'DT', 'NN', 'CC', 'NN', 'IN', 'DT', 'JJ', 'NN', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', 'MD', 'VB', 'VBN', 'NNS', 'JJ', 'TO', 'RB', 'VB', 'DT', 'JJ', 'NN', 'JJ', 'IN', 'DT', 'VBN', 'IN', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'JJ', 'NN', ',', 'DT', 'NN', 'IN', 'DT', 'NN', 'CC', 'NN', 'IN', 'DT', 'JJ', 'NN', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', 'MD', 'VB', 'VBN', 'NNS', 'JJ', 'TO', 'RB', 'VB', 'DT', 'JJ', 'NN', 'NN', 'IN

 22%|██▏       | 446/2000 [00:20<02:42,  9.58it/s]

Sentence ID: GUM_academic_theropod-30, Words: ['In', 'addition', ',', 'we', 'reduced', 'the', 'total', 'tail', 'mass', 'to', '15', '%', 'body', 'mass', 'from', 'the', '20', '%', 'body', 'mass', 'used', 'by', 'Carrano', 'and', 'Biewener', '.'], POS Tag true : ['IN', 'NN', ',', 'PRP', 'VBD', 'DT', 'JJ', 'NN', 'NN', 'IN', 'CD', 'NN', 'NN', 'NN', 'IN', 'DT', 'CD', 'NN', 'NN', 'NN', 'VBN', 'IN', 'NNP', 'CC', 'NNP', '.'], POS Tag predicted: ['IN', 'NN', ',', 'PRP', 'VBD', 'DT', 'JJ', 'NN', 'NN', 'IN', 'CD', 'NN', 'NN', 'NN', 'IN', 'DT', 'CD', 'NN', 'NN', 'NN', 'VBN', 'IN', 'NNP', 'CC', 'NNP', '.']
Sentence ID: GUM_academic_theropod-31, Words: ['Thus', ',', 'our', 'study', 'seems', 'to', 'have', 'generated', 'a', 'more', 'gradual', 'and', 'less', 'pronounced', 'change', 'in', 'the', 'moment', 'of', 'inertia', 'produced', 'by', 'the', 'artificial', 'tail', ',', 'allowing', 'experimental', 'subjects', 'to', 'adjust', 'to', 'the', 'posterior', 'mass', 'by', 'adopting', 'a', 'more', 'vertical', '

 22%|██▎       | 450/2000 [00:20<02:19, 11.15it/s]

Sentence ID: GUM_academic_theropod-33, Words: ['This', 'suggests', 'that', 'their', 'results', 'could', 'be', 'partially', 'explained', 'as', 'a', 'response', 'to', 'the', 'increased', 'loading', 'rather', 'than', 'to', 'the', 'displacement', 'of', 'the', 'CoM', '.'], POS Tag true : ['DT', 'VBZ', 'IN', 'PRP$', 'NNS', 'MD', 'VB', 'RB', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'VBN', 'NN', 'RB', 'IN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['DT', 'VBZ', 'IN', 'PRP$', 'NNS', 'MD', 'VB', 'RB', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'RB', 'IN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_academic_theropod-34, Words: ['Due', 'to', 'the', 'phylogenetic', 'relatedness', ',', 'extant', 'birds', 'have', 'been', 'used', 'to', 'inform', 'functional', 'aspects', 'of', 'non-avian', 'dinosaur', 'locomotion', '.'], POS Tag true : ['JJ', 'IN', 'DT', 'JJ', 'NN', ',', 'JJ', 'NNS', 'VBP', 'VBN', 'VBN', 'TO', 'VB', 'JJ', 'NNS', 'IN', 'JJ', 'NN', 'NN', '.'], POS Tag

 23%|██▎       | 452/2000 [00:20<03:14,  7.94it/s]

Sentence ID: GUM_academic_theropod-36, Words: ['It', 'has', 'even', 'been', 'proposed', 'that', ',', 'due', 'to', 'functional', 'convergence', ',', 'mammals', 'might', 'be', 'a', 'better', 'system', 'to', 'study', 'bipedal', 'dinosaur', 'locomotion', '[', '7', ']', ',', '[', '23', ']', ',', 'but', 'the', 'results', 'reported', 'here', 'show', 'that', 'important', 'aspects', 'of', 'non-avian', 'theropod', 'locomotion', 'can', 'be', 'experimentally', 'recreated', 'in', 'modern', 'birds', '.'], POS Tag true : ['PRP', 'VBZ', 'RB', 'VBN', 'VBN', 'IN', ',', 'JJ', 'IN', 'JJ', 'NN', ',', 'NNS', 'MD', 'VB', 'DT', 'JJR', 'NN', 'TO', 'VB', 'JJ', 'NN', 'NN', '-LRB-', 'CD', '-RRB-', ',', '-LRB-', 'CD', '-RRB-', ',', 'CC', 'DT', 'NNS', 'VBD', 'RB', 'VB', 'IN', 'JJ', 'NNS', 'IN', 'JJ', 'NN', 'NN', 'MD', 'VB', 'RB', 'VBN', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['PRP', 'VBZ', 'RB', 'VBN', 'VBN', 'IN', ',', 'JJ', 'IN', 'JJ', 'NN', ',', 'NNS', 'MD', 'VB', 'DT', 'JJR', 'NN', 'TO', 'VB', 'JJ', 'NN', 

 23%|██▎       | 454/2000 [00:20<03:11,  8.08it/s]

Sentence ID: GUM_academic_theropod-38, Words: ['Nonetheless', ',', 'this', 'does', 'not', 'mean', 'that', 'tail', 'reduction', 'had', 'no', 'effect', 'on', 'CoM', 'displacement', ',', 'but', 'that', 'it', 'was', 'not', 'the', 'most', 'important', 'factor', '.'], POS Tag true : ['RB', ',', 'DT', 'VBZ', 'RB', 'VB', 'IN', 'NN', 'NN', 'VBD', 'DT', 'NN', 'IN', 'NN', 'NN', ',', 'CC', 'IN', 'PRP', 'VBD', 'RB', 'DT', 'RBS', 'JJ', 'NN', '.'], POS Tag predicted: ['RB', ',', 'DT', 'VBZ', 'RB', 'VBP', 'DT', 'NN', 'NN', 'VBD', 'DT', 'NN', 'IN', 'NN', 'NN', ',', 'CC', 'IN', 'PRP', 'VBD', 'RB', 'DT', 'RBS', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_theropod-39, Words: ['Ideally', 'we', 'would', 'have', 'increased', 'tail', 'mass', 'and', 'reduced', 'pectoral', 'limb', 'mass', 'but', ',', 'unfortunately', ',', 'this', 'is', 'not', 'experimentally', 'feasible', '.'], POS Tag true : ['RB', 'PRP', 'MD', 'VB', 'VBN', 'NN', 'NN', 'CC', 'VBD', 'JJ', 'NN', 'NN', 'CC', ',', 'RB', ',', 'DT', 'VBZ', 'RB', 'RB'

 23%|██▎       | 457/2000 [00:21<02:43,  9.45it/s]

Sentence ID: GUM_academic_theropod-4, Words: ['These', 'results', 'indicate', 'a', 'shift', 'from', 'the', 'standard', 'bird', ',', 'knee', '-', 'driven', 'bipedal', 'locomotion', 'to', 'a', 'more', 'hip', '-', 'driven', 'locomotion', ',', 'typical', 'of', 'crocodilians', '(', 'the', 'only', 'other', 'extant', 'archosaur', 'group', ')', ',', 'mammals', ',', 'and', 'hypothetically', ',', 'bipedal', 'non-avian', 'dinosaurs', '.'], POS Tag true : ['DT', 'NNS', 'VBP', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', 'NN', 'HYPH', 'VBN', 'JJ', 'NN', 'IN', 'DT', 'RBR', 'NN', 'HYPH', 'JJ', 'NN', ',', 'JJ', 'IN', 'NNS', '-LRB-', 'DT', 'JJ', 'JJ', 'JJ', 'NN', 'NN', '-RRB-', ',', 'NNS', ',', 'CC', 'RB', ',', 'JJ', 'JJ', 'NNS', '.'], POS Tag predicted: ['DT', 'NNS', 'VBP', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', 'NN', 'HYPH', 'VBN', 'JJ', 'NN', 'IN', 'DT', 'JJR', 'NN', 'HYPH', 'VBN', 'NN', ',', 'JJ', 'IN', 'NNS', '-LRB-', 'DT', 'JJ', 'JJ', 'JJ', 'NN', 'NN', '-RRB-', ',', 'NNS', ',', 'CC', 'RB', ',', 'JJ

 23%|██▎       | 460/2000 [00:21<02:30, 10.23it/s]

Sentence ID: GUM_academic_theropod-5, Words: ['These', 'postural', 'and', 'kinematics', 'changes', 'cannot', 'can', 'not', 'be', 'attributed', 'to', 'an', 'increased', 'weight', 'as', 'subjects', 'of', 'the', 'control', '-', 'weight', 'group', 'did', 'not', 'show', 'the', 'same', 'changes', 'as', 'the', 'experimental', 'group', '.'], POS Tag true : ['DT', 'JJ', 'CC', 'NN', 'NNS', '_', 'MD', 'RB', 'VB', 'VBN', 'IN', 'DT', 'VBN', 'NN', 'IN', 'NNS', 'IN', 'DT', 'NN', 'HYPH', 'NN', 'NN', 'VBD', 'RB', 'VB', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['DT', 'JJ', 'CC', 'NN', 'VBZ', '_', 'MD', 'RB', 'VB', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'NNS', 'IN', 'DT', 'NN', 'HYPH', 'NN', 'NN', 'VBD', 'RB', 'VB', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_theropod-6, Words: ['In', 'fact', ',', 'the', 'control', '-', 'weight', 'subjects', 'showed', 'a', 'more', 'horizontally', 'oriented', 'femur', 'during', 'walking', 'with', 'respect', 'to', 'the

 23%|██▎       | 462/2000 [00:21<02:19, 10.99it/s]

Sentence ID: GUM_academic_theropod-8, Words: ['It', 'has', 'been', 'proposed', 'that', 'the', 'relative', 'mass', 'of', 'the', 'CFL', 'can', 'be', 'used', 'as', 'a', 'proxy', 'to', 'estimate', 'the', 'relative', 'importance', 'of', 'femoral', 'retraction', 'during', 'locomotion', 'in', 'extinct', 'bipedal', 'dinosaurs', '[', '8', ']', '.'], POS Tag true : ['PRP', 'VBZ', 'VBN', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'MD', 'VB', 'VBN', 'IN', 'DT', 'NN', 'TO', 'VB', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'IN', 'NN', 'IN', 'JJ', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['PRP', 'VBZ', 'VBN', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'MD', 'VB', 'VBN', 'IN', 'DT', 'NN', 'TO', 'VB', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'IN', 'NN', 'IN', 'JJ', 'JJ', 'NNS', '-LRB-', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_theropod-9, Words: ['Our', 'data', 'show', 'that', 'for', 'a', 'given', 'CFL', 'mass', ',', 'femoral', 'retraction', 'can', 'be', 'greatly', 'affected',

 23%|██▎       | 467/2000 [00:22<02:08, 11.97it/s]

Sentence ID: GUM_academic_thrones-10, Words: ['The', 'study', 'of', 'how', 'people', ',', 'as', 'fans', ',', 'access', 'and', 'manage', 'information', 'within', 'a', 'transmedia', 'system', 'provides', 'valuable', 'insight', 'that', 'contributes', 'not', 'only', 'to', 'practitioners', 'and', 'scholars', 'of', 'the', 'media', 'industry', ',', 'but', 'to', 'the', 'wider', 'context', 'of', 'cultural', 'studies', ',', 'by', 'offering', 'findings', 'on', 'this', 'new', 'model', 'of', 'the', 'fan', 'as', 'consumer', 'and', 'information', '-', 'user', '.'], POS Tag true : ['DT', 'NN', 'IN', 'WRB', 'NNS', ',', 'IN', 'NNS', ',', 'VBP', 'CC', 'VBP', 'NN', 'IN', 'DT', 'NN', 'NN', 'VBZ', 'JJ', 'NN', 'WDT', 'VBZ', 'RB', 'RB', 'IN', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'NN', 'NN', ',', 'CC', 'IN', 'DT', 'JJR', 'NN', 'IN', 'JJ', 'NNS', ',', 'IN', 'VBG', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'NN', 'CC', 'NN', 'HYPH', 'NN', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'WRB', 'NNS', ',', 'IN'

 23%|██▎       | 469/2000 [00:22<02:24, 10.60it/s]

Sentence ID: GUM_academic_thrones-14, Words: ['One', 'of', 'the', 'most', 'dramatic', 'plot', 'developments', 'in', 'the', 'source', 'material', '(', 'Martin', ',', '2000', ')', 'was', 'adapted', 'to', 'the', 'screen', 'in', 'the', 'penultimate', 'episode', 'of', 'the', 'third', 'season', ',', '“', 'The', 'Rains', 'of', 'Castamere', '”', '(', 'Benioff', '&', 'Weiss', ',', '2013', ')', '.'], POS Tag true : ['CD', 'IN', 'DT', 'RBS', 'JJ', 'NN', 'NNS', 'IN', 'DT', 'NN', 'NN', '-LRB-', 'NNP', ',', 'CD', '-RRB-', 'VBD', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', '``', 'DT', 'NNPS', 'IN', 'NNP', "''", '-LRB-', 'NNP', 'CC', 'NNP', ',', 'CD', '-RRB-', '.'], POS Tag predicted: ['CD', 'IN', 'DT', 'RBS', 'JJ', 'NN', 'NNS', 'IN', 'DT', 'NN', 'NN', '-LRB-', 'NNP', ',', 'CD', '-RRB-', 'VBD', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', '``', 'DT', 'NNPS', 'IN', 'NNP', "''", '-LRB-', 'NNP', 'CC', 'NNP', ',', 'CD', '-RRB-', '.']
Sente

 24%|██▎       | 473/2000 [00:22<02:24, 10.59it/s]

Sentence ID: GUM_academic_thrones-17, Words: ['one', 'for', 'viewers', 'familiar', 'with', 'the', 'books', '(', 'i.e.', ',', '“', 'Experts', '”', ')', 'and', 'one', 'for', 'viewers', 'unfamiliar', 'with', 'the', 'books', 'and', 'averse', 'to', '“', 'spoilers', '”', '(', 'i.e.', ',', '“', 'Newbies', '”', ')', '.'], POS Tag true : ['CD', 'IN', 'NNS', 'JJ', 'IN', 'DT', 'NNS', '-LRB-', 'FW', ',', '``', 'NNS', "''", '-RRB-', 'CC', 'CD', 'IN', 'NNS', 'JJ', 'IN', 'DT', 'NNS', 'CC', 'JJ', 'IN', '``', 'NNS', "''", '-LRB-', 'FW', ',', '``', 'NNS', "''", '-RRB-', '.'], POS Tag predicted: ['NN', 'IN', 'NNS', 'JJ', 'IN', 'DT', 'NNS', '-LRB-', 'FW', ',', '``', 'NNS', "''", '-RRB-', 'CC', 'NN', 'IN', 'NNS', 'JJ', 'IN', 'DT', 'NNS', 'CC', 'JJ', 'IN', '``', 'NNS', "''", '-LRB-', 'FW', ',', '``', 'NNS', "''", '-RRB-', '.']
Sentence ID: GUM_academic_thrones-18, Words: ['What', 'results', 'are', 'two', 'completely', 'separate', 'reviews', 'of', '“', 'The', 'Rains', 'of', 'Castamere', '”', 'which', 'in', '

 24%|██▍       | 478/2000 [00:22<01:40, 15.18it/s]

Sentence ID: GUM_academic_thrones-2, Words: ['A', 'Comparative', 'Discourse', 'Analysis', 'of', 'Fan', 'Responses', 'to', 'Game', 'of', 'Thrones'], POS Tag true : ['DT', 'JJ', 'NN', 'NN', 'IN', 'NN', 'NNS', 'IN', 'NNP', 'IN', 'NNPS'], POS Tag predicted: ['DT', 'JJ', 'NN', 'NN', 'IN', 'NN', 'NNS', 'IN', 'NNP', 'IN', 'NNPS']
Sentence ID: GUM_academic_thrones-20, Words: ['As', 'a', 'pilot', 'project', ',', 'the', 'current', 'work', 'takes', 'the', 'content', 'of', 'both', 'comment', 'threads', '—', 'a', 'corpus', 'of', 'approximately', '5,600', 'comments', '—', 'and', 'analyzes', 'each', 'thread', 'separately', 'using', 'a', 'qualitative', 'coding', 'method', 'aligned', 'with', 'constructivist', 'grounded', 'theory', '(', 'Charmaz', ',', '2006', ')', '.'], POS Tag true : ['IN', 'DT', 'NN', 'NN', ',', 'DT', 'JJ', 'NN', 'VBZ', 'DT', 'NN', 'IN', 'DT', 'NN', 'NNS', ':', 'DT', 'NN', 'IN', 'RB', 'CD', 'NNS', ':', 'CC', 'VBZ', 'DT', 'NN', 'RB', 'VBG', 'DT', 'JJ', 'NN', 'NN', 'VBN', 'IN', 'JJ', '

 24%|██▍       | 482/2000 [00:23<01:17, 19.55it/s]

Sentence ID: GUM_academic_thrones-24, Words: ['A', 'comparison', 'of', 'categories', 'and', 'sub-categories', 'between', 'both', 'groups', 'provides', 'preliminary', 'findings', 'to', 'support', 'an', 'emergent', 'model', ',', 'or', 'models', ',', 'of', 'the', '“', 'transmedia', 'fan', '”', '.'], POS Tag true : ['DT', 'NN', 'IN', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'NNS', 'VBZ', 'JJ', 'NNS', 'TO', 'VB', 'DT', 'JJ', 'NN', ',', 'CC', 'NNS', ',', 'IN', 'DT', '``', 'NN', 'NN', "''", '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'NNS', 'CC', 'NNS', 'IN', 'DT', 'NNS', 'VBZ', 'JJ', 'NNS', 'TO', 'VB', 'DT', 'JJ', 'NN', ',', 'CC', 'NNS', ',', 'IN', 'DT', '``', 'NN', 'NN', "''", '.']
Sentence ID: GUM_academic_thrones-25, Words: ['Conclusion'], POS Tag true : ['NN'], POS Tag predicted: ['NN']
Sentence ID: GUM_academic_thrones-26, Words: ['The', 'present', 'research', 'represents', 'a', 'first', 'step', 'in', 'exploring', 'the', 'impact', 'of', 'transmedia', 'systems', ',', 'as', 'exemplified', 'by', 'G

 24%|██▍       | 485/2000 [00:23<01:26, 17.47it/s]

Sentence ID: GUM_academic_thrones-29, Words: ['The', 'current', 'study', 'will', 'contribute', 'to', 'the', 'development', 'of', 'further', 'qualitative', 'and', 'quantitative', 'research', 'that', 'will', 'more', 'clearly', 'define', 'the', 'information', 'behaviors', 'of', 'the', 'transmedia', 'fan', '.'], POS Tag true : ['DT', 'JJ', 'NN', 'MD', 'VB', 'IN', 'DT', 'NN', 'IN', 'JJR', 'JJ', 'CC', 'JJ', 'NN', 'WDT', 'MD', 'RBR', 'RB', 'VB', 'DT', 'NN', 'NNS', 'IN', 'DT', 'NN', 'NN', '.'], POS Tag predicted: ['DT', 'JJ', 'NN', 'MD', 'VB', 'IN', 'DT', 'NN', 'IN', 'RBR', 'JJ', 'CC', 'JJ', 'NN', 'WDT', 'MD', 'RBR', 'RB', 'VB', 'DT', 'NN', 'NNS', 'IN', 'DT', 'NN', 'NN', '.']
Sentence ID: GUM_academic_thrones-3, Words: ['It', 'is', 'no', 'exaggeration', 'to', 'say', 'that', 'HBO’s', 'HBO', '’s', 'Game', 'of', 'Thrones', 'is', 'more', 'than', 'just', 'a', 'television', 'series', 'or', 'a', 'successful', 'brand', ':'], POS Tag true : ['PRP', 'VBZ', 'DT', 'NN', 'TO', 'VB', 'IN', '_', 'NNP', 'POS'

 24%|██▍       | 490/2000 [00:23<01:32, 16.29it/s]

Sentence ID: GUM_academic_thrones-5, Words: ['Now', 'spanning', 'six', 'seasons', 'and', '60', 'episodes', ',', 'with', 'an', 'average', 'global', 'viewership', '(', 'from', 'its', 'most', 'recent', 'season', ')', 'of', '25.1', 'million', 'viewers', 'per', 'episode', '(', 'Shepherd', ',', '2016', ')', ',', 'it', 'has', 'spawned', 'five', 'video', 'games', ',', 'a', 'graphic', 'novel', 'adaptation', ',', 'several', 'companion', 'books', ',', 'two', 'rap', 'albums', ',', 'a', '28', '-', 'city', 'orchestral', 'tour', ',', 'a', 'wide', 'variety', 'of', 'tabletop', 'games', ',', 'toys', ',', 'merchandise', 'and', 'mobile', 'apps', ',', 'and', 'countless', 'podcasts', ',', 'fanfics', 'and', 'other', 'fan', '-', 'based', 'creations', '.'], POS Tag true : ['RB', 'VBG', 'CD', 'NNS', 'CC', 'CD', 'NNS', ',', 'IN', 'DT', 'JJ', 'JJ', 'NN', '-LRB-', 'IN', 'PRP$', 'RBS', 'JJ', 'NN', '-RRB-', 'IN', 'CD', 'CD', 'NNS', 'IN', 'NN', '-LRB-', 'NNP', ',', 'CD', '-RRB-', ',', 'PRP', 'VBZ', 'VBN', 'CD', 'NN',

 25%|██▍       | 495/2000 [00:23<01:19, 19.01it/s]

Sentence ID: GUM_academic_thrones-9, Words: ['Transmedia', 'systems', ',', 'like', 'that', 'exemplified', 'by', 'Game', 'of', 'Thrones', ',', 'are', 'becoming', 'increasingly', 'prevalent', '(', 'e.g.', ',', 'Star', 'Wars', ',', 'Harry', 'Potter', ',', 'The', 'Walking', 'Dead', ',', 'the', 'Marvel', 'Cinematic', 'Universe', ',', 'etc', ')', ';', 'these', 'systems', 'demonstrate', ',', 'in', 'microcosm', ',', 'the', 'global', 'challenge', 'of', 'managing', 'the', 'fire', '-', 'hose', 'flow', 'of', 'information', 'in', 'contemporary', 'postdigital', 'society', '.'], POS Tag true : ['NN', 'NNS', ',', 'IN', 'DT', 'VBN', 'IN', 'NNP', 'IN', 'NNPS', ',', 'VBP', 'VBG', 'RB', 'JJ', '-LRB-', 'FW', ',', 'NNP', 'NNPS', ',', 'NNP', 'NNP', ',', 'DT', 'NNP', 'NNP', ',', 'DT', 'NNP', 'NNP', 'NNP', ',', 'FW', '-RRB-', ':', 'DT', 'NNS', 'VBP', ',', 'IN', 'NN', ',', 'DT', 'JJ', 'NN', 'IN', 'VBG', 'DT', 'NN', 'HYPH', 'NN', 'NN', 'IN', 'NN', 'IN', 'JJ', 'JJ', 'NN', '.'], POS Tag predicted: ['NN', 'NNS', ',

 25%|██▌       | 503/2000 [00:24<00:58, 25.79it/s]

Sentence ID: GUM_bio_bernoulli-15, Words: ['Upon', 'both', 'of', 'them', 'entering', 'and', 'tying', 'for', 'first', 'place', 'in', 'a', 'scientific', 'contest', 'at', 'the', 'University', 'of', 'Paris', ',', 'Johann', ',', 'unable', 'to', 'bear', 'the', '"', 'shame', '"', 'of', 'being', 'compared', "Daniel's", 'Daniel', "'s", 'equal', ',', 'banned', 'Daniel', 'from', 'his', 'house', '.'], POS Tag true : ['IN', 'DT', 'IN', 'PRP', 'VBG', 'CC', 'VBG', 'IN', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NNP', 'IN', 'NNP', ',', 'NNP', ',', 'JJ', 'TO', 'VB', 'DT', '``', 'NN', "''", 'IN', 'VBG', 'VBN', '_', 'NNP', 'POS', 'NN', ',', 'VBD', 'NNP', 'IN', 'PRP$', 'NN', '.'], POS Tag predicted: ['IN', 'DT', 'IN', 'PRP', 'VBG', 'CC', 'VBG', 'IN', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NNP', 'IN', 'NNP', ',', 'NNP', ',', 'JJ', 'TO', 'VB', 'DT', '``', 'NN', "''", 'IN', 'VBG', 'VBN', '_', 'NNP', 'POS', 'NN', ',', 'VBD', 'NNP', 'IN', 'PRP$', 'NN', '.']
Sentence ID: GUM_bio_bernoulli-16, W

 25%|██▌       | 509/2000 [00:24<00:59, 25.11it/s]

Sentence ID: GUM_bio_bernoulli-21, Words: ['His', 'father', 'then', 'asked', 'him', 'to', 'study', 'in', 'medicine', ',', 'and', 'Daniel', 'agreed', 'under', 'the', 'condition', 'that', 'his', 'father', 'would', 'teach', 'him', 'mathematics', 'privately', ',', 'which', 'they', 'continued', 'for', 'some', 'time', '.'], POS Tag true : ['PRP$', 'NN', 'RB', 'VBD', 'PRP', 'TO', 'VB', 'IN', 'NN', ',', 'CC', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'NN', 'MD', 'VB', 'PRP', 'NN', 'RB', ',', 'WDT', 'PRP', 'VBD', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['PRP$', 'NN', 'RB', 'VBD', 'PRP', 'TO', 'VB', 'IN', 'NN', ',', 'CC', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'NN', 'MD', 'VB', 'PRP', 'NN', 'RB', ',', 'WDT', 'PRP', 'VBD', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_bio_bernoulli-22, Words: ['Daniel', 'studied', 'medicine', 'at', 'Basel', ',', 'Heidelberg', ',', 'and', 'Strasbourg', ',', 'and', 'earned', 'a', 'PhD', 'in', 'anatomy', 'and', 'botany', 'in', '1721', '.'], POS Tag true : ['

 26%|██▌       | 514/2000 [00:24<00:52, 28.57it/s]

Sentence ID: GUM_bio_bernoulli-28, Words: ['His', 'earliest', 'mathematical', 'work', 'was', 'the', 'Exercitationes', '(', 'Mathematical', 'Exercises', ')', ',', 'published', 'in', '1724', 'with', 'the', 'help', 'of', 'Goldbach', '.'], POS Tag true : ['PRP$', 'JJS', 'JJ', 'NN', 'VBD', 'DT', 'NNP', '-LRB-', 'NNP', 'NNP', '-RRB-', ',', 'VBN', 'IN', 'CD', 'IN', 'DT', 'NN', 'IN', 'NNP', '.'], POS Tag predicted: ['PRP$', 'JJS', 'JJ', 'NN', 'VBD', 'DT', 'NNP', '-LRB-', 'NNP', 'NNP', '-RRB-', ',', 'VBN', 'IN', 'CD', 'IN', 'DT', 'NN', 'IN', 'NNP', '.']
Sentence ID: GUM_bio_bernoulli-29, Words: ['Two', 'years', 'later', 'he', 'pointed', 'out', 'for', 'the', 'first', 'time', 'the', 'frequent', 'desirability', 'of', 'resolving', 'a', 'compound', 'motion', 'into', 'motions', 'of', 'translation', 'and', 'motion', 'of', 'rotation', '.'], POS Tag true : ['CD', 'NNS', 'RBR', 'PRP', 'VBD', 'RP', 'IN', 'DT', 'JJ', 'NN', 'DT', 'JJ', 'NN', 'IN', 'VBG', 'DT', 'JJ', 'NN', 'IN', 'NNS', 'IN', 'NN', 'CC', 'NN'

 26%|██▌       | 521/2000 [00:24<00:56, 26.33it/s]

Sentence ID: GUM_bio_bernoulli-32, Words: ['This', 'was', 'followed', 'by', 'a', 'memoir', 'on', 'the', 'theory', 'of', 'the', 'tides', ',', 'to', 'which', ',', 'conjointly', 'with', 'the', 'memoirs', 'by', 'Euler', 'and', 'Colin', 'Maclaurin', ',', 'a', 'prize', 'was', 'awarded', 'by', 'the', 'French', 'Academy', ':', 'these', 'three', 'memoirs', 'contain', 'all', 'that', 'was', 'done', 'on', 'this', 'subject', 'between', 'the', 'publication', 'of', 'Isaac', "Newton's", 'Newton', "'s", 'Philosophiae', 'Naturalis', 'Principia', 'Mathematica', 'and', 'the', 'investigations', 'of', 'Pierre', '-', 'Simon', 'Laplace', '.'], POS Tag true : ['DT', 'VBD', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NNS', ',', 'IN', 'WDT', ',', 'RB', 'IN', 'DT', 'NNS', 'IN', 'NNP', 'CC', 'NNP', 'NNP', ',', 'DT', 'NN', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', ':', 'DT', 'CD', 'NNS', 'VBP', 'DT', 'WDT', 'VBD', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'NNP', '_', 'NNP', 'POS', 'NNP', 'NNP', 'NN

 26%|██▋       | 527/2000 [00:25<01:01, 23.92it/s]

Sentence ID: GUM_bio_bernoulli-37, Words: ['Soon', 'physicians', 'all', 'over', 'Europe', 'were', 'measuring', "patients'", 'patients', "'", 'blood', 'pressure', 'by', 'sticking', 'point', '-', 'ended', 'glass', 'tubes', 'directly', 'into', 'their', 'arteries', '.'], POS Tag true : ['RB', 'NNS', 'RB', 'IN', 'NNP', 'VBD', 'VBG', '_', 'NNS', 'POS', 'NN', 'NN', 'IN', 'VBG', 'NN', 'HYPH', 'JJ', 'NN', 'NNS', 'RB', 'IN', 'PRP$', 'NNS', '.'], POS Tag predicted: ['RB', 'NNS', 'RB', 'IN', 'NNP', 'VBD', 'VBG', '_', 'NNS', 'POS', 'NN', 'NN', 'IN', 'VBG', 'NN', 'HYPH', 'JJ', 'NN', 'NNS', 'RB', 'IN', 'PRP$', 'NNS', '.']
Sentence ID: GUM_bio_bernoulli-38, Words: ['It', 'was', 'not', 'until', 'about', '170', 'years', 'later', ',', 'in', '1896', 'that', 'an', 'Italian', 'doctor', 'discovered', 'a', 'less', 'painful', 'method', 'which', 'is', 'still', 'in', 'use', 'today', '.'], POS Tag true : ['PRP', 'VBD', 'RB', 'IN', 'RB', 'CD', 'NNS', 'RBR', ',', 'IN', 'CD', 'IN', 'DT', 'JJ', 'NN', 'VBD', 'DT', 'RB

 27%|██▋       | 537/2000 [00:25<00:43, 33.45it/s]

Sentence ID: GUM_bio_bernoulli-42, Words: ['Daniel', 'realised', 'that', 'in', 'a', 'similar', 'way', ',', 'a', 'moving', 'fluid', 'exchanges', 'its', 'kinetic', 'energy', 'for', 'pressure', '.'], POS Tag true : ['NNP', 'VBD', 'IN', 'IN', 'DT', 'JJ', 'NN', ',', 'DT', 'JJ', 'NN', 'VBZ', 'PRP$', 'JJ', 'NN', 'IN', 'NN', '.'], POS Tag predicted: ['NNP', 'VBD', 'DT', 'IN', 'DT', 'JJ', 'NN', ',', 'DT', 'JJ', 'NN', 'VBZ', 'PRP$', 'JJ', 'NN', 'IN', 'NN', '.']
Sentence ID: GUM_bio_bernoulli-43, Words: ['Mathematically', 'this', 'law', 'is', 'now', 'written', ':', '½', 'ρ', 'u', '2', '+', 'P', '=', 'constant', 'where', 'P', 'is', 'pressure', ',', 'ρ', 'is', 'the', 'density', 'of', 'the', 'fluid', 'and', 'u', 'is', 'its', 'velocity', '.'], POS Tag true : ['RB', 'DT', 'NN', 'VBZ', 'RB', 'VBN', ':', 'CD', 'NN', 'NN', 'CD', 'SYM', 'NN', 'SYM', 'NN', 'WRB', 'NN', 'VBZ', 'NN', ',', 'NN', 'VBZ', 'DT', 'NN', 'IN', 'DT', 'NN', 'CC', 'NN', 'VBZ', 'PRP$', 'NN', '.'], POS Tag predicted: ['RB', 'DT', 'NN', '

 27%|██▋       | 541/2000 [00:25<00:45, 32.32it/s]

Sentence ID: GUM_bio_bernoulli-9, Words: ['The', 'Bernoulli', 'family', 'came', 'originally', 'from', 'Antwerp', ',', 'at', 'that', 'time', 'in', 'the', 'Spanish', 'Netherlands', ',', 'but', 'emigrated', 'to', 'escape', 'the', 'Spanish', 'persecution', 'of', 'the', 'Huguenots', '.'], POS Tag true : ['DT', 'NNP', 'NN', 'VBD', 'RB', 'IN', 'NNP', ',', 'IN', 'DT', 'NN', 'IN', 'DT', 'NNP', 'NNPS', ',', 'CC', 'VBD', 'TO', 'VB', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NNPS', '.'], POS Tag predicted: ['DT', 'NNP', 'NN', 'VBD', 'RB', 'IN', 'NNP', ',', 'IN', 'DT', 'NN', 'IN', 'DT', 'NNP', 'NNPS', ',', 'CC', 'VBD', 'TO', 'VB', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NNPS', '.']
Sentence ID: GUM_bio_chao-1, Words: ['Early', 'life'], POS Tag true : ['JJ', 'NN'], POS Tag predicted: ['JJ', 'NN']
Sentence ID: GUM_bio_chao-10, Words: ['He', 'returned', 'to', 'China', 'in', '1920', ',', 'marrying', 'the', 'physician', 'Yang', 'Buwei', 'there', 'that', 'year', '.'], POS Tag true : ['PRP', 'VBD', 'IN', 'NNP', 'IN', 'CD', '

 27%|██▋       | 549/2000 [00:25<00:46, 31.17it/s]

Sentence ID: GUM_bio_chao-16, Words: ['During', 'this', 'period', 'of', 'time', ',', 'he', 'collaborated', 'with', 'Luo', 'Changpei', 'and', 'Li', 'Fang', '-', 'Kuei', ',', 'the', 'other', 'two', 'leading', 'Chinese', 'linguists', 'of', 'his', 'generation', ',', 'to', 'edit', 'and', 'render', 'into', 'Chinese', 'Bernhard', "Karlgren's", 'Karlgren', "'s", 'monumental', 'Etudes', 'sur', 'la', 'Phonologie', 'Chinoise', '(', 'published', 'in', '1940', ')', '.'], POS Tag true : ['IN', 'DT', 'NN', 'IN', 'NN', ',', 'PRP', 'VBD', 'IN', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', 'HYPH', 'NNP', ',', 'DT', 'JJ', 'CD', 'VBG', 'JJ', 'NNS', 'IN', 'PRP$', 'NN', ',', 'TO', 'VB', 'CC', 'VB', 'IN', 'JJ', 'NNP', '_', 'NNP', 'POS', 'JJ', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', '-LRB-', 'VBN', 'IN', 'CD', '-RRB-', '.'], POS Tag predicted: ['IN', 'DT', 'NN', 'IN', 'NN', ',', 'PRP', 'VBD', 'IN', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', 'HYPH', 'NNP', ',', 'DT', 'JJ', 'CD', 'VBG', 'JJ', 'NNS', 'IN', 'PRP$', 'NN', ',', 'TO', 'VB',

 28%|██▊       | 558/2000 [00:26<00:47, 30.51it/s]

Sentence ID: GUM_bio_chao-21, Words: ['From', '1947', 'to', '1960', ',', 'he', 'taught', 'at', 'the', 'University', 'of', 'California', 'at', 'Berkeley', ',', 'where', 'in', '1952', ',', 'he', 'became', 'Agassiz', 'Professor', 'of', 'Oriental', 'Languages', '.'], POS Tag true : ['IN', 'CD', 'IN', 'CD', ',', 'PRP', 'VBD', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'IN', 'NNP', ',', 'WRB', 'IN', 'CD', ',', 'PRP', 'VBD', 'NNP', 'NNP', 'IN', 'NNP', 'NNPS', '.'], POS Tag predicted: ['IN', 'CD', 'IN', 'CD', ',', 'PRP', 'VBD', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'IN', 'NNP', ',', 'WRB', 'IN', 'CD', ',', 'PRP', 'VBD', 'NNP', 'NNP', 'IN', 'NNP', 'NNPS', '.']
Sentence ID: GUM_bio_chao-22, Words: ['Both', 'Chao', 'and', 'Yang', 'were', 'known', 'for', 'their', 'good', 'senses', 'of', 'humor', ',', 'he', 'was', 'known', 'particularly', 'for', 'his', 'love', 'of', 'subtle', 'jokes', 'and', 'language', 'puns', ':', 'they', 'published', 'a', 'family', 'history', 'entitled', ',', 'Life', 'with', 'Chaos', ':', 'the',

 28%|██▊       | 562/2000 [00:26<00:46, 30.62it/s]

Sentence ID: GUM_bio_chao-28, Words: ['His', 'third', 'daughter', 'Lensey', ',', 'born', 'in', '1929', ',', 'is', 'a', "children's", 'children', "'s", 'book', 'author', 'and', 'mathematician', '.'], POS Tag true : ['PRP$', 'JJ', 'NN', 'NNP', ',', 'VBN', 'IN', 'CD', ',', 'VBZ', 'DT', '_', 'NNS', 'POS', 'NN', 'NN', 'CC', 'NN', '.'], POS Tag predicted: ['PRP$', 'JJ', 'NN', 'NNP', ',', 'VBN', 'IN', 'CD', ',', 'VBZ', 'DT', '_', 'NNS', 'POS', 'NN', 'NN', 'CC', 'NN', '.']
Sentence ID: GUM_bio_chao-3, Words: ['He', 'then', 'became', 'interested', 'in', 'philosophy', ',', 'and', 'earned', 'a', 'Ph.D.', 'in', 'philosophy', 'from', 'Harvard', 'University', 'in', '1918', 'with', 'a', 'dissertation', 'entitled', '"', 'Continuity', ':', 'Study', 'in', 'Methodology', '"', '.'], POS Tag true : ['PRP', 'RB', 'VBD', 'JJ', 'IN', 'NN', ',', 'CC', 'VBD', 'DT', 'NN', 'IN', 'NN', 'IN', 'NNP', 'NNP', 'IN', 'CD', 'IN', 'DT', 'NN', 'VBN', '``', 'NNP', ':', 'NNP', 'IN', 'NNP', "''", '.'], POS Tag predicted: ['PR

 28%|██▊       | 570/2000 [00:26<00:48, 29.37it/s]

Sentence ID: GUM_bio_chao-8, Words: ['Chao', 'possessed', 'a', 'natural', 'gift', 'for', 'hearing', 'fine', 'distinctions', 'in', 'pronunciation', 'that', 'was', 'said', 'to', 'be', '"', 'legendary', 'for', 'its', 'acuity', '"', ',', 'enabling', 'him', 'to', 'record', 'the', 'sounds', 'of', 'various', 'dialects', 'with', 'a', 'high', 'degree', 'of', 'accuracy', '.'], POS Tag true : ['NNP', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'VBG', 'JJ', 'NNS', 'IN', 'NN', 'WDT', 'VBD', 'VBN', 'TO', 'VB', '``', 'JJ', 'IN', 'PRP$', 'NN', "''", ',', 'VBG', 'PRP', 'TO', 'VB', 'DT', 'NNS', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'IN', 'NN', '.'], POS Tag predicted: ['NNP', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'VBG', 'JJ', 'NNS', 'IN', 'NN', 'WDT', 'VBD', 'VBN', 'TO', 'VB', '``', 'JJ', 'IN', 'PRP$', 'NN', "''", ',', 'VBG', 'PRP', 'TO', 'VB', 'DT', 'NNS', 'IN', 'JJ', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'IN', 'NN', '.']
Sentence ID: GUM_bio_chao-9, Words: ['Career', 'development', 'and', 'later', 'life'], POS Tag true : [

 29%|██▊       | 574/2000 [00:26<00:45, 31.28it/s]

Sentence ID: GUM_bio_enfant-14, Words: ['While', 'there', ',', 'the', 'Marquis', 'de', 'Lafayette', 'commissioned', "L'Enfant", 'to', 'paint', 'a', 'portrait', 'of', 'Washington', '.'], POS Tag true : ['IN', 'RB', ',', 'DT', 'NNP', 'NNP', 'NNP', 'VBD', 'NNP', 'TO', 'VB', 'DT', 'NN', 'IN', 'NNP', '.'], POS Tag predicted: ['IN', 'RB', ',', 'DT', 'NNP', 'NNP', 'NNP', 'VBD', 'NNP', 'TO', 'VB', 'DT', 'NN', 'IN', 'NNP', '.']
Sentence ID: GUM_bio_enfant-15, Words: ['He', 'was', 'wounded', 'at', 'the', 'Siege', 'of', 'Savannah', 'on', 'October', '9', ',', '1779', '.'], POS Tag true : ['PRP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'IN', 'NNP', 'CD', ',', 'CD', '.'], POS Tag predicted: ['PRP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'IN', 'NNP', 'CD', ',', 'CD', '.']
Sentence ID: GUM_bio_enfant-16, Words: ['He', 'recovered', 'and', 'became', 'a', 'prisoner', 'of', 'war', 'at', 'surrender', 'of', 'Charleston', ',', 'South', 'Carolina', 'on', 'May', '12', ',', '1780', '.'], POS Tag tr

 29%|██▉       | 583/2000 [00:26<00:45, 31.05it/s]

Sentence ID: GUM_bio_enfant-2, Words: ['Pierre', 'Charles', "L'Enfant", '(', 'French', ':', '[', 'pjɛʁ', 'ʃɑʁl', 'lɑ̃fɑ̃', ']', ';', 'August', '2', ',', '1754', '–', 'June', '14', ',', '1825', ')', ',', 'self', '-', 'identified', 'as', 'Peter', 'Charles', "L'Enfant", 'while', 'living', 'in', 'the', 'United', 'States', ',', 'was', 'a', 'French', '-', 'born', 'American', 'military', 'engineer', 'who', 'designed', 'the', 'basic', 'plan', 'for', 'Washington', ',', 'D.C.', '(', 'capital', 'city', 'of', 'the', 'U.S.', ')', 'known', 'today', 'as', 'the', "L'Enfant", 'Plan', '(', '1791', ')', '.'], POS Tag true : ['NNP', 'NNP', 'NNP', '-LRB-', 'NNP', ':', '-LRB-', 'NNP', 'NNP', 'NNP', '-RRB-', ':', 'NNP', 'CD', ',', 'CD', 'SYM', 'NNP', 'CD', ',', 'CD', '-RRB-', ',', 'NN', 'HYPH', 'VBN', 'IN', 'NNP', 'NNP', 'NNP', 'IN', 'VBG', 'IN', 'DT', 'NNP', 'NNPS', ',', 'VBD', 'DT', 'JJ', 'HYPH', 'VBN', 'JJ', 'JJ', 'NN', 'WP', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'NNP', ',', 'NNP', '-LRB-', 'NN', 'NN', 'IN', 'DT

 29%|██▉       | 587/2000 [00:27<00:48, 29.37it/s]

Sentence ID: GUM_bio_enfant-26, Words: ['He', 'also', 'designed', 'furniture', 'and', 'houses', 'for', 'the', 'wealthy', 'as', 'well', 'as', 'coins', 'and', 'medals', ',', 'including', 'the', 'insignia', 'of', 'the', 'Society', 'of', 'the', 'Cincinnati', '.'], POS Tag true : ['PRP', 'RB', 'VBD', 'NN', 'CC', 'NNS', 'IN', 'DT', 'JJ', 'RB', 'RB', 'IN', 'NNS', 'CC', 'NNS', ',', 'VBG', 'DT', 'NN', 'IN', 'DT', 'NNP', 'IN', 'DT', 'NNP', '.'], POS Tag predicted: ['PRP', 'RB', 'VBN', 'NN', 'CC', 'NNS', 'IN', 'DT', 'JJ', 'IN', 'RB', 'IN', 'NNS', 'CC', 'NNS', ',', 'VBG', 'DT', 'NN', 'IN', 'DT', 'NNP', 'IN', 'DT', 'NNP', '.']
Sentence ID: GUM_bio_enfant-27, Words: ['He', 'was', 'also', 'a', 'friend', 'of', 'Alexander', 'Hamilton', ',', 'and', 'some', 'of', 'their', 'correspondances', 'from', '1790', 'to', '1801', 'now', 'reside', 'in', 'the', 'National', 'Archives', '.'], POS Tag true : ['PRP', 'VBD', 'RB', 'DT', 'NN', 'IN', 'NNP', 'NNP', ',', 'CC', 'DT', 'IN', 'PRP$', 'NNS', 'IN', 'CD', 'IN', 'CD

 30%|██▉       | 595/2000 [00:27<00:48, 29.05it/s]

Sentence ID: GUM_bio_enfant-4, Words: ["L'Enfant", 'was', 'born', 'in', 'Paris', ',', 'France', 'on', 'August', '2', ',', '1754', ',', 'the', 'third', 'child', 'and', 'second', 'son', 'of', 'Pierre', "L'Enfant", '(', '1704', '–', '1787', ')', ',', 'a', 'painter', 'with', 'a', 'good', 'reputation', 'in', 'the', 'service', 'of', 'King', 'Louis', 'XV', 'of', 'France', ',', '(', '1710', '-', '1774', ',', 'reigned', '1715', '-', '1774', ')', ',', 'and', 'Marie', "L'Enfant", ',', 'the', 'daughter', 'of', 'a', 'minor', 'official', 'at', 'court', '.'], POS Tag true : ['NNP', 'VBD', 'VBN', 'IN', 'NNP', ',', 'NNP', 'IN', 'NNP', 'CD', ',', 'CD', ',', 'DT', 'JJ', 'NN', 'CC', 'JJ', 'NN', 'IN', 'NNP', 'NNP', '-LRB-', 'CD', 'SYM', 'CD', '-RRB-', ',', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'NNP', 'NNP', 'CD', 'IN', 'NNP', ',', '-LRB-', 'CD', 'SYM', 'CD', ',', 'VBD', 'CD', 'SYM', 'CD', '-RRB-', ',', 'CC', 'NNP', 'NNP', ',', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'NN', '.'], POS 

 30%|███       | 603/2000 [00:27<00:45, 30.48it/s]

Sentence ID: GUM_bio_fillmore-11, Words: ['Following', 'his', 'discharge', ',', 'he', 'taught', 'English', 'at', 'a', 'Buddhist', "girls'", 'girls', "'", 'school', 'while', 'also', 'taking', 'classes', 'at', 'Kyoto', 'University', '.'], POS Tag true : ['VBG', 'PRP$', 'NN', ',', 'PRP', 'VBD', 'NNP', 'IN', 'DT', 'JJ', '_', 'NNS', 'POS', 'NN', 'IN', 'RB', 'VBG', 'NNS', 'IN', 'NNP', 'NNP', '.'], POS Tag predicted: ['VBG', 'PRP$', 'NN', ',', 'PRP', 'VBD', 'NNP', 'IN', 'DT', 'JJ', '_', 'NNS', 'POS', 'NN', 'IN', 'RB', 'VBG', 'NNS', 'IN', 'NNP', 'NNP', '.']
Sentence ID: GUM_bio_fillmore-12, Words: ['He', 'returned', 'to', 'the', 'US', ',', 'receiving', 'his', 'doctorate', 'at', 'the', 'University', 'of', 'Michigan', 'and', 'then', 'teaching', 'at', 'The', 'Ohio', 'State', 'University', 'in', 'Columbus', '.'], POS Tag true : ['PRP', 'VBD', 'IN', 'DT', 'NNP', ',', 'VBG', 'PRP$', 'NN', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'CC', 'RB', 'VBG', 'IN', 'DT', 'NNP', 'NNP', 'NNP', 'IN', 'NNP', '.'], POS Tag p

 30%|███       | 607/2000 [00:27<00:51, 26.86it/s]


Sentence ID: GUM_bio_fillmore-19, Words: ['In', '1968', ',', 'he', 'published', 'his', 'theory', 'of', 'Case', 'Grammar', '(', 'Fillmore', '1968', ')', ',', 'which', 'highlighted', 'the', 'fact', 'that', 'syntactic', 'structure', 'can', 'be', 'predicted', 'by', 'semantic', 'participants', '.'], POS Tag true : ['IN', 'CD', ',', 'PRP', 'VBD', 'PRP$', 'NN', 'IN', 'NNP', 'NNP', '-LRB-', 'NNP', 'CD', '-RRB-', ',', 'WDT', 'VBD', 'DT', 'NN', 'IN', 'JJ', 'NN', 'MD', 'VB', 'VBN', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['IN', 'CD', ',', 'PRP', 'VBD', 'PRP$', 'NN', 'IN', 'NNP', 'NNP', '-LRB-', 'NNP', 'CD', '-RRB-', ',', 'WDT', 'VBD', 'DT', 'NN', 'IN', 'JJ', 'NN', 'MD', 'VB', 'VBN', 'IN', 'JJ', 'NNS', '.']


 31%|███       | 614/2000 [00:28<00:53, 25.94it/s]

Sentence ID: GUM_bio_fillmore-2, Words: ['Charles', 'J.', 'Fillmore', '(', 'August', '9', ',', '1929', '–', 'February', '13', ',', '2014', ')', 'was', 'an', 'American', 'linguist', 'and', 'Professor', 'of', 'Linguistics', 'at', 'the', 'University', 'of', 'California', ',', 'Berkeley', '.'], POS Tag true : ['NNP', 'NNP', 'NNP', '-LRB-', 'NNP', 'CD', ',', 'CD', 'SYM', 'NNP', 'CD', ',', 'CD', '-RRB-', 'VBD', 'DT', 'JJ', 'NN', 'CC', 'NN', 'IN', 'NN', 'IN', 'DT', 'NNP', 'IN', 'NNP', ',', 'NNP', '.'], POS Tag predicted: ['NNP', 'NNP', 'NNP', '-LRB-', 'NNP', 'CD', ',', 'CD', 'SYM', 'NNP', 'CD', ',', 'CD', '-RRB-', 'VBD', 'DT', 'JJ', 'NN', 'CC', 'NNP', 'IN', 'NNP', 'IN', 'DT', 'NNP', 'IN', 'NNP', ',', 'NNP', '.']
Sentence ID: GUM_bio_fillmore-20, Words: ['An', 'action', 'can', 'have', 'an', 'agent', ',', 'a', 'patient', ',', 'purposes', ',', 'locations', ',', 'and', 'so', 'on', '.'], POS Tag true : ['DT', 'NN', 'MD', 'VB', 'DT', 'NN', ',', 'DT', 'NN', ',', 'NNS', ',', 'NNS', ',', 'CC', 'RB', '

 31%|███       | 621/2000 [00:28<00:49, 28.01it/s]

Sentence ID: GUM_bio_fillmore-26, Words: ['Around', 'the', 'same', 'time', ',', "Fillmore's", 'Fillmore', "'s", 'Santa', 'Cruz', 'Lectures', 'on', 'Deixis', ',', 'delivered', 'in', '1971', 'and', 'published', 'in', '1975', ',', 'contributed', 'to', 'establishing', 'the', 'field', 'of', 'linguistic', 'pragmatics', ',', 'which', 'studies', 'the', 'relationship', 'between', 'linguistic', 'form', 'and', 'the', 'context', 'of', 'utterance', '.', '[', '7', ']', '[', '8', ']'], POS Tag true : ['IN', 'DT', 'JJ', 'NN', ',', '_', 'NNP', 'POS', 'NNP', 'NNP', 'NNP', 'IN', 'NNP', ',', 'VBN', 'IN', 'CD', 'CC', 'VBN', 'IN', 'CD', ',', 'VBD', 'IN', 'VBG', 'DT', 'NN', 'IN', 'JJ', 'NN', ',', 'WDT', 'VBZ', 'DT', 'NN', 'IN', 'JJ', 'NN', 'CC', 'DT', 'NN', 'IN', 'NN', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'DT', 'JJ', 'NN', ',', '_', 'NNP', 'POS', 'NNP', 'NNP', 'NNP', 'IN', 'NNP', ',', 'VBN', 'IN', 'CD', 'CC', 'VBN', 'IN', 'CD', ',', 'VBN', 'IN', 'VBG', 'DT', 'NN', '

 31%|███▏      | 629/2000 [00:28<00:44, 30.95it/s]

Sentence ID: GUM_bio_fillmore-33, Words: ['Over', 'time', ',', 'construction', 'grammar', 'developed', 'into', 'a', 'research', 'area', 'of', 'its', 'own', ',', 'and', 'a', 'number', 'of', 'variants', 'have', 'been', 'proposed', 'over', 'the', 'years', 'by', 'different', 'researchers', '.'], POS Tag true : ['IN', 'NN', ',', 'NN', 'NN', 'VBD', 'IN', 'DT', 'NN', 'NN', 'IN', 'PRP$', 'JJ', ',', 'CC', 'DT', 'NN', 'IN', 'NNS', 'VBP', 'VBN', 'VBN', 'IN', 'DT', 'NNS', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['IN', 'NN', ',', 'NN', 'NN', 'VBN', 'IN', 'DT', 'NN', 'NN', 'IN', 'PRP$', 'JJ', ',', 'CC', 'DT', 'NN', 'IN', 'NNS', 'VBP', 'VBN', 'VBN', 'IN', 'DT', 'NNS', 'IN', 'JJ', 'NNS', '.']
Sentence ID: GUM_bio_fillmore-34, Words: ['Fillmore', 'is', 'now', 'widely', 'recognized', 'as', 'one', 'of', 'the', 'founders', 'of', 'cognitive', 'linguistics', '.'], POS Tag true : ['NNP', 'VBZ', 'RB', 'RB', 'VBN', 'IN', 'CD', 'IN', 'DT', 'NNS', 'IN', 'JJ', 'NN', '.'], POS Tag predicted: ['NNP', 'VBZ', 'RB

 32%|███▏      | 637/2000 [00:28<00:41, 33.24it/s]

Sentence ID: GUM_bio_fillmore-4, Words: ['Fillmore', 'spent', 'ten', 'years', 'at', 'The', 'Ohio', 'State', 'University', 'and', 'a', 'year', 'as', 'a', 'Fellow', 'at', 'the', 'Center', 'for', 'Advanced', 'Study', 'in', 'the', 'Behavioral', 'Sciences', 'at', 'Stanford', 'University', 'before', 'joining', "Berkeley's", 'Berkeley', "'s", 'Department', 'of', 'Linguistics', 'in', '1971', '.', '[', '1', ']'], POS Tag true : ['NNP', 'VBD', 'CD', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'NNP', 'CC', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'NNP', 'IN', 'DT', 'NNP', 'NNPS', 'IN', 'NNP', 'NNP', 'IN', 'VBG', '_', 'NNP', 'POS', 'NNP', 'IN', 'NNP', 'IN', 'CD', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'VBD', 'CD', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'NNP', 'CC', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NNP', 'IN', 'NNP', 'NNP', 'IN', 'DT', 'NNP', 'NNPS', 'IN', 'NNP', 'NNP', 'IN', 'VBG', '_', 'NNP', 'POS', 'NNP', 'IN', 'NNP', 'IN', 'CD', '.', '-LRB-', 'CD', '-RRB-']
Sente

 32%|███▎      | 650/2000 [00:29<00:33, 40.11it/s]

Sentence ID: GUM_bio_galois-10, Words: ["Galois'", 'Galois', "'", 'fatal', 'duel', 'took', 'place', 'on', '30', 'May', '.', '[', '17', ']'], POS Tag true : ['_', 'NNP', 'POS', 'JJ', 'NN', 'VBD', 'NN', 'IN', 'CD', 'NNP', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['_', 'NNP', 'POS', 'JJ', 'NN', 'VBD', 'NN', 'IN', 'CD', 'NNP', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_galois-11, Words: ['The', 'true', 'motives', 'behind', 'the', 'duel', 'are', 'obscure', '.'], POS Tag true : ['DT', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'VBP', 'JJ', '.'], POS Tag predicted: ['DT', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'VBP', 'JJ', '.']
Sentence ID: GUM_bio_galois-12, Words: ['There', 'has', 'been', 'much', 'speculation', 'as', 'to', 'the', 'reasons', 'behind', 'it', '.'], POS Tag true : ['EX', 'VBZ', 'VBN', 'JJ', 'NN', 'IN', 'IN', 'DT', 'NNS', 'IN', 'PRP', '.'], POS Tag predicted: ['EX', 'VBZ', 'VBN', 'JJ', 'NN', 'IN', 'IN', 'DT', 'NNS', 'IN', 'PRP', '.']
Sentence ID: GUM_bio_galois-13, Words: ['What', 'i

 33%|███▎      | 655/2000 [00:29<00:42, 31.51it/s]

Sentence ID: GUM_bio_galois-18, Words: ["Galois'", 'Galois', "'", 'cousin', ',', 'Gabriel', 'Demante', ',', 'when', 'asked', 'if', 'he', 'knew', 'the', 'cause', 'of', 'the', 'duel', ',', 'mentioned', 'that', 'Galois', '"', 'found', 'himself', 'in', 'the', 'presence', 'of', 'a', 'supposed', 'uncle', 'and', 'a', 'supposed', 'fiancé', ',', 'each', 'of', 'whom', 'provoked', 'the', 'duel', '.', '"'], POS Tag true : ['_', 'NNP', 'POS', 'NN', ',', 'NNP', 'NNP', ',', 'WRB', 'VBN', 'IN', 'PRP', 'VBD', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'VBD', 'IN', 'NNP', '``', 'VBD', 'PRP', 'IN', 'DT', 'NN', 'IN', 'DT', 'VBN', 'NN', 'CC', 'DT', 'VBN', 'NN', ',', 'DT', 'IN', 'WP', 'VBD', 'DT', 'NN', '.', "''"], POS Tag predicted: ['_', 'NNP', 'POS', 'NN', ',', 'NNP', 'NNP', ',', 'WRB', 'VBN', 'IN', 'PRP', 'VBD', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'VBD', 'IN', 'NNP', "''", 'VBD', 'PRP', 'IN', 'DT', 'NN', 'IN', 'DT', 'VBN', 'NN', 'CC', 'DT', 'VBN', 'NN', ',', 'DT', 'IN', 'WP', 'VBD', 'DT', 'NN', '.', "''"]
Senten

 33%|███▎      | 659/2000 [00:29<00:42, 31.71it/s]

Sentence ID: GUM_bio_galois-22, Words: ['However', ',', 'Dumas', 'is', 'alone', 'in', 'this', 'assertion', ',', 'and', 'if', 'he', 'were', 'correct', 'it', 'is', 'unclear', 'why', "d'Herbinville", 'would', 'have', 'been', 'involved', '.'], POS Tag true : ['RB', ',', 'NNP', 'VBZ', 'JJ', 'IN', 'DT', 'NN', ',', 'CC', 'IN', 'PRP', 'VBD', 'JJ', 'PRP', 'VBZ', 'JJ', 'WRB', 'NNP', 'MD', 'VB', 'VBN', 'VBN', '.'], POS Tag predicted: ['RB', ',', 'NNP', 'VBZ', 'RB', 'IN', 'DT', 'NN', ',', 'CC', 'IN', 'PRP', 'VBD', 'JJ', 'PRP', 'VBZ', 'JJ', 'WRB', 'NNP', 'MD', 'VB', 'VBN', 'VBN', '.']
Sentence ID: GUM_bio_galois-23, Words: ['It', 'has', 'been', 'speculated', 'that', 'he', 'might', 'have', 'been', 'du', "Motel's", 'Motel', "'s", '"', 'supposed', 'fiancé', '"', 'at', 'the', 'time', '(', 'she', 'ultimately', 'married', 'someone', 'else', ')', ',', 'but', 'no', 'clear', 'evidence', 'has', 'been', 'found', 'supporting', 'this', 'conjecture', '.'], POS Tag true : ['PRP', 'VBZ', 'VBN', 'VBN', 'IN', 'PRP',

 33%|███▎      | 668/2000 [00:29<00:39, 33.44it/s]

Sentence ID: GUM_bio_galois-29, Words: ['In', 'these', 'final', 'papers', ',', 'he', 'outlined', 'the', 'rough', 'edges', 'of', 'some', 'work', 'he', 'had', 'been', 'doing', 'in', 'analysis', 'and', 'annotated', 'a', 'copy', 'of', 'the', 'manuscript', 'submitted', 'to', 'the', 'Academy', 'and', 'other', 'papers', '.'], POS Tag true : ['IN', 'DT', 'JJ', 'NNS', ',', 'PRP', 'VBD', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'PRP', 'VBD', 'VBN', 'VBG', 'IN', 'NN', 'CC', 'VBD', 'DT', 'NN', 'IN', 'DT', 'NN', 'VBN', 'IN', 'DT', 'NNP', 'CC', 'JJ', 'NNS', '.'], POS Tag predicted: ['IN', 'DT', 'JJ', 'NNS', ',', 'PRP', 'VBD', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'NN', 'PRP', 'VBD', 'VBN', 'VBG', 'IN', 'NN', 'CC', 'VBD', 'DT', 'NN', 'IN', 'DT', 'NN', 'VBN', 'IN', 'DT', 'NNP', 'CC', 'JJ', 'NNS', '.']
Sentence ID: GUM_bio_galois-3, Words: ['Galois', 'returned', 'to', 'mathematics', 'after', 'his', 'expulsion', 'from', 'the', 'École', 'Normale', ',', 'although', 'he', 'continued', 'to', 'spend', 'time', 'in', 'po

 34%|███▍      | 680/2000 [00:29<00:31, 41.71it/s]

Sentence ID: GUM_bio_galois-4, Words: ['After', 'his', 'expulsion', 'became', 'official', 'in', 'January', '1831', ',', 'he', 'attempted', 'to', 'start', 'a', 'private', 'class', 'in', 'advanced', 'algebra', 'which', 'attracted', 'some', 'interest', ',', 'but', 'this', 'waned', ',', 'as', 'it', 'seemed', 'that', 'his', 'political', 'activism', 'had', 'priority', '.', '[', '4', ']', '[', '7', ']'], POS Tag true : ['IN', 'PRP$', 'NN', 'VBD', 'JJ', 'IN', 'NNP', 'CD', ',', 'PRP', 'VBD', 'TO', 'VB', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'WDT', 'VBD', 'DT', 'NN', ',', 'CC', 'DT', 'VBD', ',', 'IN', 'PRP', 'VBD', 'IN', 'PRP$', 'JJ', 'NN', 'VBD', 'NN', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'PRP$', 'NN', 'VBD', 'NN', 'IN', 'NNP', 'CD', ',', 'PRP', 'VBD', 'TO', 'VB', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'WDT', 'VBD', 'DT', 'NN', ',', 'CC', 'DT', 'VBD', ',', 'IN', 'PRP', 'VBD', 'IN', 'PRP$', 'JJ', 'NN', 'VBD', 'NN', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD',

 34%|███▍      | 689/2000 [00:30<00:38, 33.90it/s]

Sentence ID: GUM_bio_galois-8, Words: ['It', 'is', 'unsurprising', ',', 'in', 'the', 'light', 'of', 'his', 'character', 'and', 'situation', 'at', 'the', 'time', ',', 'that', 'Galois', 'reacted', 'violently', 'to', 'the', 'rejection', 'letter', ',', 'and', 'decided', 'to', 'abandon', 'publishing', 'his', 'papers', 'through', 'the', 'Academy', 'and', 'instead', 'publish', 'them', 'privately', 'through', 'his', 'friend', 'Auguste', 'Chevalier', '.'], POS Tag true : ['PRP', 'VBZ', 'JJ', ',', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'NN', 'CC', 'NN', 'IN', 'DT', 'NN', ',', 'IN', 'NNP', 'VBD', 'RB', 'IN', 'DT', 'NN', 'NN', ',', 'CC', 'VBD', 'TO', 'VB', 'VBG', 'PRP$', 'NNS', 'IN', 'DT', 'NNP', 'CC', 'RB', 'VB', 'PRP', 'RB', 'IN', 'PRP$', 'NN', 'NNP', 'NNP', '.'], POS Tag predicted: ['PRP', 'VBZ', 'JJ', ',', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'NN', 'CC', 'NN', 'IN', 'DT', 'NN', ',', 'IN', 'NNP', 'VBD', 'RB', 'IN', 'DT', 'NN', 'NN', ',', 'CC', 'VBD', 'TO', 'VB', 'VBG', 'PRP$', 'NNS', 'IN', 'DT', 'NNP', 'CC

 35%|███▌      | 701/2000 [00:30<00:29, 44.08it/s]

Sentence ID: GUM_bio_goode-17, Words: ['They', 'have', 'two', 'daughters', ',', 'Matilda', 'Eve', 'Goode', '[', '3', ']', '(', 'b.', 'March', '2009', ')', 'and', 'Teddie', 'Eleanor', 'Rose', 'Goode', '(', 'b.', 'September', '2013', ')', ',', 'and', 'a', 'son', ',', 'Ralph', 'Goode', '(', 'b.', 'August', '2015', ')', '.'], POS Tag true : ['PRP', 'VBP', 'CD', 'NNS', ',', 'NNP', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', '-LRB-', 'VBN', 'NNP', 'CD', '-RRB-', 'CC', 'NNP', 'NNP', 'NNP', 'NNP', '-LRB-', 'VBN', 'NNP', 'CD', '-RRB-', ',', 'CC', 'DT', 'NN', ',', 'NNP', 'NNP', '-LRB-', 'VBN', 'NNP', 'CD', '-RRB-', '.'], POS Tag predicted: ['PRP', 'VBP', 'CD', 'NNS', ',', 'NNP', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', '-LRB-', 'VBN', 'NNP', 'CD', '-RRB-', 'CC', 'NNP', 'NNP', 'NNP', 'NNP', '-LRB-', 'VBN', 'NNP', 'CD', '-RRB-', ',', 'CC', 'DT', 'NN', ',', 'NNP', 'NNP', '-LRB-', 'VBN', 'NNP', 'CD', '-RRB-', '.']
Sentence ID: GUM_bio_goode-18, Words: ['Career'], POS Tag true : ['NN'], POS Tag predicted: ['N

 35%|███▌      | 706/2000 [00:30<00:30, 43.12it/s]


Sentence ID: GUM_bio_goode-4, Words: ['His', 'breakthrough', 'role', 'was', 'in', 'the', 'romantic', 'comedy', ',', 'Chasing', 'Liberty', '(', '2004', ')', ',', 'for', 'which', 'he', 'received', 'a', 'nomination', 'at', 'Teen', 'Choice', 'Awards', 'for', 'Choice', 'Breakout', 'Movie', 'Star', '-', 'Male', '.'], POS Tag true : ['PRP$', 'NN', 'NN', 'VBD', 'IN', 'DT', 'JJ', 'NN', ',', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'IN', 'WDT', 'PRP', 'VBD', 'DT', 'NN', 'IN', 'NNP', 'NNP', 'NNPS', 'IN', 'NNP', 'NNP', 'NNP', 'NNP', ':', 'JJ', '.'], POS Tag predicted: ['PRP$', 'NN', 'NN', 'VBD', 'IN', 'DT', 'JJ', 'NN', ',', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'IN', 'WDT', 'PRP', 'VBD', 'DT', 'NN', 'IN', 'NNP', 'NNP', 'NNPS', 'IN', 'NNP', 'NNP', 'NNP', 'NNP', 'HYPH', 'JJ', '.']
Sentence ID: GUM_bio_goode-5, Words: ['He', 'then', 'appeared', 'in', 'a', 'string', 'of', 'supporting', 'roles', 'in', 'films', 'like', 'Woody', "Allen's", 'Allen', "'s", 'Match', 'Point', '(', '2005', ')', ',', '

 36%|███▌      | 716/2000 [00:30<00:33, 38.49it/s]

Sentence ID: GUM_bio_goode-8, Words: ['Other', 'notable', 'film', 'roles', 'include', 'The', 'Lookout', '(', '2007', ')', ',', 'A', 'Single', 'Man', '(', '2009', ')', ',', 'Cemetery', 'Junction', '(', '2010', ')', ',', 'Stoker', '(', '2013', ')', ',', 'Belle', '(', '2013', ')', ',', 'The', 'Imitation', 'Game', '(', '2014', ')', 'and', 'Self/less', '(', '2015', ')', '.'], POS Tag true : ['JJ', 'JJ', 'NN', 'NNS', 'VBP', 'DT', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'DT', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'DT', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', 'CC', 'NNP', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['JJ', 'JJ', 'NN', 'NNS', 'VBP', 'DT', 'NN', '-LRB-', 'CD', '-RRB-', ',', 'NNP', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'DT', 'NNP', 'NNP', '-LRB-',

 36%|███▋      | 726/2000 [00:31<00:35, 36.27it/s]

Sentence ID: GUM_bio_gordon-18, Words: ['He', 'was', 'not', 'the', 'only', 'Scottish', 'soldier', 'in', 'the', "Tsar's", 'Tsar', "'s", 'service', ';', 'his', 'fellow', '-', 'Scots', 'Paul', 'Menzies', 'and', 'Alexander', 'Livingston', 'also', 'found', 'themselves', 'in', 'Russia', 'fleeing', 'religious', 'intolerance', 'or', 'seeking', 'adventure', '.'], POS Tag true : ['PRP', 'VBD', 'RB', 'DT', 'JJ', 'JJ', 'NN', 'IN', 'DT', '_', 'NN', 'POS', 'NN', ':', 'PRP$', 'JJ', 'HYPH', 'NNPS', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', 'RB', 'VBD', 'PRP', 'IN', 'NNP', 'VBG', 'JJ', 'NN', 'CC', 'VBG', 'NN', '.'], POS Tag predicted: ['PRP', 'VBD', 'RB', 'DT', 'JJ', 'JJ', 'NN', 'IN', 'DT', '_', 'NNP', 'POS', 'NN', ':', 'PRP$', 'JJ', 'HYPH', 'NNPS', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', 'RB', 'VBD', 'PRP', 'IN', 'NNP', 'VBG', 'JJ', 'NN', 'CC', 'VBG', 'NN', '.']
Sentence ID: GUM_bio_gordon-19, Words: ['Gordon', 'visited', 'England', 'and', 'Scotland', 'in', '1686', '.'], POS Tag true : ['NNP', 'VBD', 'NNP', 'CC', '

 37%|███▋      | 735/2000 [00:31<00:34, 37.13it/s]

Sentence ID: GUM_bio_gordon-25, Words: ['One', 'of', "Gordon's", 'Gordon', "'s", 'greatest', 'achievements', 'was', 'securing', 'permission', 'from', 'the', 'Tsars', 'to', 'establish', 'the', 'first', 'Roman', 'Catholic', 'church', 'and', 'school', 'in', 'Muscovy', ',', 'of', 'which', 'he', 'remained', 'the', 'main', 'benefactor', ',', 'and', 'headed', 'the', 'Catholic', 'community', 'in', 'Russia', 'until', 'his', 'death', '.'], POS Tag true : ['CD', 'IN', '_', 'NNP', 'POS', 'JJS', 'NNS', 'VBD', 'VBG', 'NN', 'IN', 'DT', 'NNPS', 'TO', 'VB', 'DT', 'JJ', 'JJ', 'NNP', 'NN', 'CC', 'NN', 'IN', 'NNP', ',', 'IN', 'WDT', 'PRP', 'VBD', 'DT', 'JJ', 'NN', ',', 'CC', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'NNP', 'IN', 'PRP$', 'NN', '.'], POS Tag predicted: ['CD', 'IN', '_', 'NNP', 'POS', 'JJS', 'NNS', 'VBD', 'VBG', 'NN', 'IN', 'DT', 'NNPS', 'TO', 'VB', 'DT', 'JJ', 'JJ', 'JJ', 'NN', 'CC', 'NN', 'IN', 'NNP', ',', 'IN', 'WDT', 'PRP', 'VBD', 'DT', 'JJ', 'NN', ',', 'CC', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'NNP', '

 37%|███▋      | 745/2000 [00:31<00:32, 38.12it/s]

Sentence ID: GUM_bio_gordon-32, Words: ['An', 'incomplete', 'and', 'faulty', 'German', 'translation', ',', 'edited', 'by', 'Dr', 'Moritz', 'Posselt', '(', 'Tagebuch', 'des', 'Generals', 'Patrick', 'Gordon', ')', 'was', 'published', ',', 'the', 'first', 'volume', 'was', 'published', 'at', 'Moscow', 'in', '1849', ',', 'the', 'second', 'was', 'published', 'at', 'St', 'Petersburg', 'in', '1851', ',', 'and', 'the', 'third', 'was', 'published', 'at', 'St', 'Petersburg', 'in', '1853', ';', 'and', 'Passages', 'from', 'the', 'Diary', 'of', 'General', 'Patrick', 'Gordon', 'of', 'Auchleuchries', '(', '1635', '–', '1699', ')', ',', 'was', 'printed', ',', 'under', 'the', 'editorship', 'of', 'Joseph', 'Robertson', ',', 'for', 'the', 'Spalding', 'Club', ',', 'at', 'Aberdeen', ',', 'Scotland', ',', '1859', '.'], POS Tag true : ['DT', 'JJ', 'CC', 'JJ', 'JJ', 'NN', ',', 'VBN', 'IN', 'NNP', 'NNP', 'NNP', '-LRB-', 'FW', 'FW', 'FW', 'NNP', 'NNP', '-RRB-', 'VBD', 'VBN', ',', 'DT', 'JJ', 'NN', 'VBD', 'VBN', 

 38%|███▊      | 755/2000 [00:31<00:32, 38.34it/s]

Sentence ID: GUM_bio_gordon-9, Words: ['After', 'an', 'education', 'at', 'the', 'parish', 'schools', 'of', 'Cruden', 'and', 'Ellon', ',', 'at', 'age', 'of', 'fifteen', 'he', 'entered', 'the', 'Jesuit', 'college', 'at', 'Braunsberg', ',', 'East', 'Prussia', ',', 'then', 'part', 'of', 'Poland', ';', 'however', ',', 'his', 'character', 'did', 'not', 'tolerate', 'well', 'the', 'strict', 'and', 'sombre', 'way', 'of', 'life', 'at', 'the', 'school', ',', 'and', 'he', 'soon', 'decided', 'to', 'return', 'home', '.'], POS Tag true : ['IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'NNS', 'IN', 'NNP', 'CC', 'NNP', ',', 'IN', 'NN', 'IN', 'CD', 'PRP', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'NNP', ',', 'NNP', 'NNP', ',', 'RB', 'NN', 'IN', 'NNP', ':', 'RB', ',', 'PRP$', 'NN', 'VBD', 'RB', 'VB', 'RB', 'DT', 'JJ', 'CC', 'JJ', 'NN', 'IN', 'NN', 'IN', 'DT', 'NN', ',', 'CC', 'PRP', 'RB', 'VBD', 'TO', 'VB', 'RB', '.'], POS Tag predicted: ['IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'NNS', 'IN', 'NNP', 'CC', 'NNP', ',', 'IN', 'NN', 'I

 38%|███▊      | 768/2000 [00:32<00:24, 50.01it/s]

Sentence ID: GUM_bio_hadid-2, Words: ['Dame', 'Zaha', 'Mohammad', 'Hadid', 'DBE', 'RA', '(', 'Arabic', ':', 'زها', 'حديد', 'Zahā', 'Ḥadīd', ';', '31', 'October', '1950', '–', '31', 'March', '2016', ')', 'was', 'an', 'Iraqi', '-', 'British', 'architect', '.'], POS Tag true : ['NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', '-LRB-', 'NNP', ':', 'FW', 'FW', 'NNP', 'NNP', ':', 'CD', 'NNP', 'CD', 'SYM', 'CD', 'NNP', 'CD', '-RRB-', 'VBD', 'DT', 'JJ', 'HYPH', 'JJ', 'NN', '.'], POS Tag predicted: ['NNP', 'NNP', 'NNP', 'NNP', 'NNP', 'NNP', '-LRB-', 'NNP', ':', 'FW', 'FW', 'NNP', 'NNP', ':', 'CD', 'NNP', 'CD', 'SYM', 'CD', 'NNP', 'CD', '-RRB-', 'VBD', 'DT', 'JJ', 'HYPH', 'JJ', 'NN', '.']
Sentence ID: GUM_bio_hadid-20, Words: ['Zenghelis', 'described', 'her', 'as', 'the', 'most', 'outstanding', 'pupil', 'he', 'ever', 'taught', '.'], POS Tag true : ['NNP', 'VBD', 'PRP', 'IN', 'DT', 'RBS', 'JJ', 'NN', 'PRP', 'RB', 'VBD', '.'], POS Tag predicted: ['NNP', 'VBD', 'PRP', 'IN', 'DT', 'RBS', 'JJ', 'NN', 'PRP',

 39%|███▉      | 780/2000 [00:32<00:25, 48.10it/s]


Sentence ID: GUM_bio_hadid-5, Words: ['In', '2012', ',', 'she', 'was', 'made', 'a', 'Dame', 'by', 'Elizabeth', 'II', 'for', 'services', 'to', 'architecture', ',', 'and', 'in', '2015', 'she', 'became', 'the', 'first', 'and', 'only', 'woman', 'to', 'be', 'awarded', 'the', 'Royal', 'Gold', 'Medal', 'from', 'the', 'Royal', 'Institute', 'of', 'British', 'Architects', '.'], POS Tag true : ['IN', 'CD', ',', 'PRP', 'VBD', 'VBN', 'DT', 'NNP', 'IN', 'NNP', 'CD', 'IN', 'NNS', 'IN', 'NN', ',', 'CC', 'IN', 'CD', 'PRP', 'VBD', 'DT', 'JJ', 'CC', 'JJ', 'NN', 'TO', 'VB', 'VBN', 'DT', 'NNP', 'NNP', 'NNP', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'NNP', 'NNPS', '.'], POS Tag predicted: ['IN', 'CD', ',', 'PRP', 'VBD', 'VBN', 'DT', 'NNP', 'IN', 'NNP', 'CD', 'IN', 'NNS', 'IN', 'NN', ',', 'CC', 'IN', 'CD', 'PRP', 'VBD', 'DT', 'JJ', 'CC', 'JJ', 'NN', 'TO', 'VB', 'VBN', 'DT', 'NNP', 'NNP', 'NNP', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'NNP', 'NNPS', '.']
Sentence ID: GUM_bio_hadid-6, Words: ['She', 'was', 'described', 'by', 

 39%|███▉      | 785/2000 [00:32<00:26, 45.31it/s]

Sentence ID: GUM_bio_higuchi-12, Words: ['Her', 'mentor', 'did', 'not', 'return', 'her', 'passionate', ',', 'if', 'discreet', ',', 'love', 'for', 'him', ',', 'and', 'instead', 'treated', 'her', 'as', 'a', 'younger', 'sister', '.'], POS Tag true : ['PRP$', 'NN', 'VBD', 'RB', 'VB', 'PRP$', 'JJ', ',', 'IN', 'JJ', ',', 'NN', 'IN', 'PRP', ',', 'CC', 'RB', 'VBD', 'PRP', 'IN', 'DT', 'JJR', 'NN', '.'], POS Tag predicted: ['PRP$', 'NN', 'VBD', 'RB', 'VB', 'PRP$', 'JJ', ',', 'IN', 'JJ', ',', 'NN', 'IN', 'PRP', ',', 'CC', 'RB', 'VBD', 'PRP', 'IN', 'DT', 'JJR', 'NN', '.']
Sentence ID: GUM_bio_higuchi-13, Words: ['This', 'failed', 'relationship', 'would', 'become', 'a', 'recurrent', 'theme', 'in', "Higuchi's", 'Higuchi', "'s", 'fiction', '.'], POS Tag true : ['DT', 'JJ', 'NN', 'MD', 'VB', 'DT', 'JJ', 'NN', 'IN', '_', 'NNP', 'POS', 'NN', '.'], POS Tag predicted: ['DT', 'JJ', 'NN', 'MD', 'VB', 'DT', 'JJ', 'NN', 'IN', '_', 'NNP', 'POS', 'NN', '.']
Sentence ID: GUM_bio_higuchi-14, Words: ['Eventually',

 40%|███▉      | 794/2000 [00:32<00:33, 36.54it/s]

Sentence ID: GUM_bio_higuchi-2, Words: ['Ichiyō', 'Higuchi', '(', '樋口', '一葉', 'Higuchi', 'Ichiyō', ',', 'May', '2', ',', '1872', '–', 'November', '23', ',', '1896', ')', 'was', 'a', 'pen', 'name', 'of', 'Japanese', 'author', 'Natsu', 'Higuchi', '(', '樋口', '奈津', 'Higuchi', 'Natsu', ')', ',', 'also', 'known', 'as', 'Natsuko', 'Higuchi', '(', '樋口', '夏子', 'Higuchi', 'Natsuko', ')', '.'], POS Tag true : ['NNP', 'NNP', '-LRB-', 'FW', 'FW', 'NNP', 'NNP', ',', 'NNP', 'CD', ',', 'CD', 'SYM', 'NNP', 'CD', ',', 'CD', '-RRB-', 'VBD', 'DT', 'NN', 'NN', 'IN', 'JJ', 'NN', 'NNP', 'NNP', '-LRB-', 'FW', 'FW', 'NNP', 'NNP', '-RRB-', ',', 'RB', 'VBN', 'IN', 'NNP', 'NNP', '-LRB-', 'FW', 'FW', 'NNP', 'NNP', '-RRB-', '.'], POS Tag predicted: ['NNP', 'NNP', '-LRB-', 'FW', 'FW', 'NNP', 'NNP', ',', 'NNP', 'CD', ',', 'CD', 'SYM', 'NNP', 'CD', ',', 'CD', '-RRB-', 'VBD', 'DT', 'NN', 'NN', 'IN', 'JJ', 'NN', 'NNP', 'NNP', '-LRB-', 'FW', 'FW', 'NNP', 'NNP', '-RRB-', ',', 'RB', 'VBN', 'IN', 'NNP', 'NNP', '-LRB-', 'FW'

 40%|███▉      | 798/2000 [00:32<00:35, 34.10it/s]

Sentence ID: GUM_bio_higuchi-26, Words: ['In', '1893', ',', 'Higuchi', ',', 'her', 'mother', 'and', 'her', 'sister', 'abandoned', 'their', 'middle', 'class', 'house', 'and', ',', 'with', 'a', 'grim', 'determination', 'to', 'survive', ',', 'moved', 'to', 'a', 'poor', 'neighborhood', 'where', 'they', 'opened', 'a', 'stationery', 'store', 'that', 'before', 'long', 'failed', '.'], POS Tag true : ['IN', 'CD', ',', 'NNP', ',', 'PRP$', 'NN', 'CC', 'PRP$', 'NN', 'VBD', 'PRP$', 'JJ', 'NN', 'NN', 'CC', ',', 'IN', 'DT', 'JJ', 'NN', 'TO', 'VB', ',', 'VBD', 'IN', 'DT', 'JJ', 'NN', 'WRB', 'PRP', 'VBD', 'DT', 'NN', 'NN', 'WDT', 'IN', 'JJ', 'VBD', '.'], POS Tag predicted: ['IN', 'CD', ',', 'NNP', ',', 'PRP$', 'NN', 'CC', 'PRP$', 'NN', 'VBD', 'PRP$', 'JJ', 'NN', 'NN', 'CC', ',', 'IN', 'DT', 'JJ', 'NN', 'TO', 'VB', ',', 'VBD', 'IN', 'DT', 'JJ', 'NN', 'WRB', 'PRP', 'VBD', 'DT', 'NN', 'NN', 'IN', 'RB', 'RB', 'VBN', '.']
Sentence ID: GUM_bio_higuchi-27, Words: ['Their', 'new', 'dwelling', 'was', 'a', 'five

 40%|████      | 810/2000 [00:33<00:35, 33.61it/s]

Sentence ID: GUM_bio_higuchi-30, Words: ['His', 'distinctiveness', 'lay', 'in', 'great', 'part', 'in', 'his', 'acceptance', 'of', 'low', '-', 'life', 'characters', 'as', 'worthwhile', 'literary', 'subjects', '.'], POS Tag true : ['PRP$', 'NN', 'VBD', 'IN', 'JJ', 'NN', 'IN', 'PRP$', 'NN', 'IN', 'JJ', 'HYPH', 'JJ', 'NNS', 'IN', 'JJ', 'JJ', 'NNS', '.'], POS Tag predicted: ['PRP$', 'NN', 'VBD', 'IN', 'JJ', 'NN', 'IN', 'PRP$', 'NN', 'IN', 'JJ', 'HYPH', 'NN', 'NNS', 'IN', 'JJ', 'JJ', 'NNS', '.']
Sentence ID: GUM_bio_higuchi-31, Words: ['What', 'Higuchi', 'added', 'was', 'a', 'special', 'awareness', 'of', 'suffering', 'and', 'sensitivity', '.'], POS Tag true : ['WP', 'NNP', 'VBD', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'NN', 'CC', 'NN', '.'], POS Tag predicted: ['WP', 'NNP', 'VBD', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'NN', 'CC', 'NN', '.']
Sentence ID: GUM_bio_higuchi-32, Words: ['To', 'this', 'period', 'belong', '"', 'Ōtsugomori', '"', '(', '"', 'On', 'the', 'Last', 'Day', 'of', 'the', 'Year', '"', ')', 

 41%|████      | 823/2000 [00:33<00:24, 47.39it/s]

Sentence ID: GUM_bio_higuchi-4, Words: ['She', 'wrote', 'relatively', 'little', 'as', 'a', 'result', 'of', 'living', 'a', 'brief', 'life', '—', 'she', 'died', 'at', '24', '—', 'but', 'her', 'stories', 'had', 'a', 'large', 'impact', 'on', 'Japanese', 'literature', 'and', 'she', 'is', 'still', 'appreciated', 'by', 'the', 'Japanese', 'public', 'today', '.'], POS Tag true : ['PRP', 'VBD', 'RB', 'JJ', 'IN', 'DT', 'NN', 'IN', 'VBG', 'DT', 'JJ', 'NN', ':', 'PRP', 'VBD', 'IN', 'CD', ':', 'CC', 'PRP$', 'NNS', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'CC', 'PRP', 'VBZ', 'RB', 'VBN', 'IN', 'DT', 'JJ', 'NN', 'NN', '.'], POS Tag predicted: ['PRP', 'VBD', 'RB', 'JJ', 'IN', 'DT', 'NN', 'IN', 'VBG', 'DT', 'JJ', 'NN', ':', 'PRP', 'VBD', 'IN', 'CD', ':', 'CC', 'PRP$', 'NNS', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'JJ', 'NN', 'CC', 'PRP', 'VBZ', 'RB', 'VBN', 'IN', 'DT', 'JJ', 'JJ', 'NN', '.']
Sentence ID: GUM_bio_higuchi-40, Words: ['Her', 'best', '-', 'known', 'stories', 'have', 'been', 'made', 'into', 'movie

 42%|████▏     | 834/2000 [00:33<00:19, 60.12it/s]

Sentence ID: GUM_bio_holt-19, Words: ['All', '-', 'Star', '(', '2015', ')'], POS Tag true : ['DT', 'HYPH', 'NNP', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'HYPH', 'NNP', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-2, Words: ['Holt', 'with', 'the', 'Boston', 'Red', 'Sox'], POS Tag true : ['NNP', 'IN', 'DT', 'NNP', 'NNP', 'NNPS'], POS Tag predicted: ['NNP', 'IN', 'DT', 'NNP', 'NNP', 'NNPS']
Sentence ID: GUM_bio_holt-20, Words: ['Hit', 'for', 'the', 'cycle', 'on', 'June', '16', ',', '2015'], POS Tag true : ['VB', 'IN', 'DT', 'NN', 'IN', 'NNP', 'CD', ',', 'CD'], POS Tag predicted: ['VB', 'IN', 'DT', 'NN', 'IN', 'NNP', 'CD', ',', 'CD']
Sentence ID: GUM_bio_holt-21, Words: ['World', 'Series', 'champion', '(', '2013', ')'], POS Tag true : ['NNP', 'NNP', 'NN', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'NNP', 'NN', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-22, Words: ['Brock', 'Holt'], POS Tag true : ['NNP', 'NNP'], POS Tag predicted: ['NNP', 'NNP']
Sentence I

 42%|████▏     | 847/2000 [00:34<00:23, 48.30it/s]

Sentence ID: GUM_bio_holt-29, Words: ['In', '2003', ',', 'his', 'freshman', 'year', ',', 'he', 'made', 'the', 'District', '8', '-', '4A', 'All', '-', 'District', 'baseball', 'team', 'despite', 'batting', 'just', '.227', ',', 'and', 'shared', 'the', "league's", 'league', "'s", 'Newcomer', 'of', 'the', 'Year', 'award', '.', '[', '1', ']'], POS Tag true : ['IN', 'CD', ',', 'PRP$', 'NN', 'NN', ',', 'PRP', 'VBD', 'DT', 'NNP', 'CD', 'HYPH', 'NNP', 'NNP', 'HYPH', 'NNP', 'NN', 'NN', 'IN', 'VBG', 'RB', 'CD', ',', 'CC', 'VBD', 'DT', '_', 'NN', 'POS', 'NNP', 'IN', 'DT', 'NNP', 'NN', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'CD', ',', 'PRP$', 'NN', 'NN', ',', 'PRP', 'VBD', 'DT', 'NNP', 'CD', 'HYPH', 'NNP', 'NNP', 'HYPH', 'NNP', 'NN', 'NN', 'IN', 'VBG', 'RB', 'CD', ',', 'CC', 'VBD', 'DT', '_', 'NN', 'POS', 'NNP', 'IN', 'DT', 'NN', 'NN', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-3, Words: ['Boston', 'Red', 'Sox', '–', 'No.', '12'], POS Tag true : ['NNP', 'NNP', 'NNPS', ':

 43%|████▎     | 853/2000 [00:34<00:24, 46.33it/s]

Sentence ID: GUM_bio_holt-37, Words: ['Holt', 'was', 'drafted', 'by', 'the', 'Pittsburgh', 'Pirates', 'with', 'the', "club's", 'club', "'s", 'ninth', 'round', 'selection', 'in', 'the', '2009', 'Major', 'League', 'Baseball', 'Draft', ',', 'one', 'pick', 'before', 'his', 'Rice', 'teammate', 'Ryan', 'Berry', '.', '[', '7', ']'], POS Tag true : ['NNP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'DT', '_', 'NN', 'POS', 'JJ', 'NN', 'NN', 'IN', 'DT', 'CD', 'NNP', 'NNP', 'NNP', 'NNP', ',', 'CD', 'NN', 'IN', 'PRP$', 'NNP', 'NN', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'DT', '_', 'NN', 'VBZ', 'JJ', 'JJ', 'NN', 'IN', 'DT', 'CD', 'NNP', 'NNP', 'NNP', 'NNP', ',', 'PRP', 'VBP', 'IN', 'PRP$', 'NNP', 'NN', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-38, Words: ['Professional', 'career'], POS Tag true : ['JJ', 'NN'], POS Tag predicted: ['JJ', 'NN']
Sentence ID: GUM_bio_holt-39, Words: ['Minor', 'lea

 43%|████▎     | 863/2000 [00:34<00:27, 40.62it/s]

Sentence ID: GUM_bio_holt-45, Words: ['He', 'was', 'promoted', 'to', 'the', 'Pittsburgh', 'Pirates', 'from', 'the', 'minors', 'as', 'the', 'major', 'league', 'rosters', 'expanded', 'on', 'September', '1', '.'], POS Tag true : ['PRP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'DT', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'NNS', 'VBD', 'IN', 'NNP', 'CD', '.'], POS Tag predicted: ['PRP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'DT', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'NNS', 'VBD', 'IN', 'NNP', 'CD', '.']
Sentence ID: GUM_bio_holt-46, Words: ['Pittsburgh', 'Pirates', '(', '2012', ')'], POS Tag true : ['NNP', 'NNP', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'NNP', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-47, Words: ['Holt', 'made', 'his', 'Major', 'League', 'debut', 'on', 'September', '1', ',', '2012', '.'], POS Tag true : ['NNP', 'VBD', 'PRP$', 'NNP', 'NNP', 'NN', 'IN', 'NNP', 'CD', ',', 'CD', '.'], POS Tag predicted: ['NNP', 'VBD', 'PRP$', 'NNP', 'NNP', 'NN', 'IN', 'NNP', 

 44%|████▍     | 875/2000 [00:34<00:24, 45.75it/s]

Sentence ID: GUM_bio_holt-54, Words: ['On', 'December', '26', ',', '2012', 'he', 'was', 'traded', 'to', 'the', 'Boston', 'Red', 'Sox', '(', 'along', 'with', 'Joel', 'Hanrahan', ')', 'for', 'Jerry', 'Sands', ',', 'Stolmy', 'Pimentel', ',', 'Mark', 'Melancon', ',', 'and', 'Iván', 'DeJesús', ',', 'Jr.', '.', '[', '12', ']'], POS Tag true : ['IN', 'NNP', 'CD', ',', 'CD', 'PRP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', 'NNPS', '-LRB-', 'RB', 'IN', 'NNP', 'NNP', '-RRB-', 'IN', 'NNP', 'NNP', ',', 'NNP', 'NNP', ',', 'NNP', 'NNP', ',', 'CC', 'NNP', 'NNP', ',', 'NNP', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'NNP', 'CD', ',', 'CD', 'PRP', 'VBD', 'VBN', 'IN', 'DT', 'NNP', 'NNP', 'NNPS', '-LRB-', 'RB', 'IN', 'NNP', 'NNP', '-RRB-', 'IN', 'NNP', 'NNP', ',', 'NNP', 'NNP', ',', 'NNP', 'NNP', ',', 'CC', 'NNP', 'NNP', ',', 'NNP', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-55, Words: ['Holt', 'started', 'the', '2013', 'season', 'with', 'the', 'Triple', '-', 'A', 'Pawtucket', 'Re

 44%|████▍     | 880/2000 [00:34<00:28, 38.78it/s]

Sentence ID: GUM_bio_holt-64, Words: ['On', 'July', '9', ',', '2014', ',', 'against', 'the', 'Chicago', 'White', 'Sox', ',', 'Holt', 'drove', 'in', 'Daniel', 'Nava', 'in', 'the', 'bottom', 'of', 'the', '9th', 'inning', 'for', 'the', 'first', 'walk', '-', 'off', 'hit', 'of', 'his', 'career', '.', '[', '13', ']'], POS Tag true : ['IN', 'NNP', 'CD', ',', 'CD', ',', 'IN', 'DT', 'NNP', 'NNP', 'NNP', ',', 'NNP', 'VBD', 'RP', 'NNP', 'NNP', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'HYPH', 'RP', 'NN', 'IN', 'PRP$', 'NN', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'NNP', 'CD', ',', 'CD', ',', 'IN', 'DT', 'NNP', 'NNP', 'NNPS', ',', 'NNP', 'VBD', 'IN', 'NNP', 'NNP', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'HYPH', 'RP', 'NN', 'IN', 'PRP$', 'NN', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_holt-65, Words: ['On', 'June', '1', ',', '2015', ',', 'while', 'starting', 'at', 'first', 'base', 'for', 'the', 'first', 'time', 'in', 'his', '

 44%|████▍     | 889/2000 [00:35<00:24, 45.83it/s]

Sentence ID: GUM_bio_jerome-13, Words: ['He', 'was', 'of', 'Illyrian', 'ancestry', ',', '[', '10', ']', 'although', 'his', 'ability', 'to', 'speak', 'the', 'Illyrian', 'languages', 'causes', 'controversy', '.'], POS Tag true : ['PRP', 'VBD', 'IN', 'JJ', 'NN', ',', '-LRB-', 'CD', '-RRB-', 'IN', 'PRP$', 'NN', 'TO', 'VB', 'DT', 'JJ', 'NNS', 'VBZ', 'NN', '.'], POS Tag predicted: ['PRP', 'VBD', 'IN', 'JJ', 'NN', ',', '-LRB-', 'CD', '-RRB-', 'IN', 'PRP$', 'NN', 'TO', 'VB', 'DT', 'JJ', 'NNS', 'VBZ', 'NN', '.']
Sentence ID: GUM_bio_jerome-14, Words: ['He', 'was', 'not', 'baptized', 'until', 'about', '360', '-', '366', ',', 'when', 'he', 'had', 'gone', 'to', 'Rome', 'with', 'his', 'friend', 'Bonosus', 'of', 'Sardica', '(', 'who', 'may', 'or', 'may', 'not', 'have', 'been', 'the', 'same', 'Bonosus', 'whom', 'Jerome', 'identifies', 'as', 'his', 'friend', 'who', 'went', 'to', 'live', 'as', 'a', 'hermit', 'on', 'an', 'island', 'in', 'the', 'Adriatic', ')', 'to', 'pursue', 'rhetorical', 'and', 'philo

 45%|████▍     | 894/2000 [00:35<00:25, 42.84it/s]

Sentence ID: GUM_bio_jerome-19, Words: ['This', 'experience', 'would', 'remind', 'him', 'of', 'the', 'terrors', 'of', 'hell', ':'], POS Tag true : ['DT', 'NN', 'MD', 'VB', 'PRP', 'IN', 'DT', 'NNS', 'IN', 'NN', ':'], POS Tag predicted: ['DT', 'NN', 'MD', 'VB', 'PRP', 'IN', 'DT', 'NNS', 'IN', 'NN', ':']
Sentence ID: GUM_bio_jerome-2, Words: ['Jerome', '(', '/', 'dʒəˈroʊm', '/', ';', 'Latin', ':', 'Eusebius', 'Sophronius', 'Hieronymus', ';', 'Greek', ':', 'Εὐσέβιος', 'Σωφρόνιος', 'Ἱερώνυμος', ';', 'c.', '347', '–', '30', 'September', '420', ')', 'was', 'a', 'Latin', 'Catholic', 'priest', ',', 'confessor', ',', 'theologian', ',', 'and', 'historian', ',', 'commonly', 'known', 'as', 'Saint', 'Jerome', '.'], POS Tag true : ['NNP', '-LRB-', 'SYM', 'NNP', 'SYM', ':', 'NNP', ':', 'NNP', 'NNP', 'NNP', ':', 'NNP', ':', 'NNP', 'NNP', 'NNP', ':', 'FW', 'CD', 'SYM', 'CD', 'NNP', 'CD', '-RRB-', 'VBD', 'DT', 'JJ', 'JJ', 'NN', ',', 'NN', ',', 'NN', ',', 'CC', 'NN', ',', 'RB', 'VBN', 'IN', 'NNP', 'NNP', 

 45%|████▌     | 904/2000 [00:35<00:28, 37.80it/s]

Sentence ID: GUM_bio_jerome-23, Words: ['St.', 'Jerome', 'in', 'His', 'Study', '(', '1480', ')', ',', 'by', 'Domenico', 'Ghirlandaio'], POS Tag true : ['NNP', 'NNP', 'IN', 'PRP$', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'IN', 'NNP', 'NNP'], POS Tag predicted: ['NNP', 'NNP', 'IN', 'PRP$', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'IN', 'NNP', 'NNP']
Sentence ID: GUM_bio_jerome-24, Words: ['Jerome', 'used', 'a', 'quote', 'from', 'Virgil', '—', '"', 'On', 'all', 'sides', 'round', 'horror', 'spread', 'wide', ';', 'the', 'very', 'silence', 'breathed', 'a', 'terror', 'on', 'my', 'soul', '"', '[', '17', ']', '—', 'to', 'describe', 'the', 'horror', 'of', 'hell', '.'], POS Tag true : ['NNP', 'VBD', 'DT', 'NN', 'IN', 'NNP', ':', '``', 'IN', 'DT', 'NNS', 'RB', 'NN', 'VBD', 'RB', ':', 'DT', 'JJ', 'NN', 'VBD', 'DT', 'NN', 'IN', 'PRP$', 'NN', "''", '-LRB-', 'CD', '-RRB-', ':', 'TO', 'VB', 'DT', 'NN', 'IN', 'NN', '.'], POS Tag predicted: ['NNP', 'VBD', 'DT', 'NN', 'IN', 'NNP', ':', '``', 'IN', 'DT', 'NNS', 'JJ

 45%|████▌     | 909/2000 [00:35<00:32, 33.65it/s]

Sentence ID: GUM_bio_jerome-3, Words: ['He', 'was', 'born', 'at', 'Stridon', ',', 'a', 'village', 'near', 'Emona', 'on', 'the', 'border', 'of', 'Dalmatia', 'and', 'Pannonia', '.', '[', '3', ']', '[', '4', ']', '[', '5', ']'], POS Tag true : ['PRP', 'VBD', 'VBN', 'IN', 'NNP', ',', 'DT', 'NN', 'IN', 'NNP', 'IN', 'DT', 'NN', 'IN', 'NNP', 'CC', 'NNP', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['PRP', 'VBD', 'VBN', 'IN', 'NNP', ',', 'DT', 'NN', 'IN', 'NNP', 'IN', 'DT', 'NN', 'IN', 'NNP', 'CC', 'NNP', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_jerome-30, Words: ['Next', 'came', 'a', 'stay', 'of', 'at', 'least', 'several', 'months', ',', 'or', 'possibly', 'years', ',', 'with', 'Rufinus', 'at', 'Aquileia', ',', 'where', 'he', 'made', 'many', 'Christian', 'friends', '.'], POS Tag true : ['RB', 'VBD', 'DT', 'NN', 'IN', 'IN', 'JJS', 'JJ', 'NNS', ',', 'CC', 'RB', 'NNS', ',', 'IN', 'NNP', '

 46%|████▌     | 913/2000 [00:35<00:36, 29.81it/s]

Sentence ID: GUM_bio_jerome-35, Words: ['St.', 'Jerome', 'in', 'the', 'Desert', ',', 'by', 'Giovanni', 'Bellini', '(', '1505', ')'], POS Tag true : ['NNP', 'NNP', 'IN', 'DT', 'NNP', ',', 'IN', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'NNP', 'IN', 'DT', 'NNP', ',', 'IN', 'NNP', 'NNP', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_jerome-36, Words: ['Seized', 'with', 'a', 'desire', 'for', 'a', 'life', 'of', 'ascetic', 'penance', ',', 'Jerome', 'went', 'for', 'a', 'time', 'to', 'the', 'desert', 'of', 'Chalcis', ',', 'to', 'the', 'southeast', 'of', 'Antioch', ',', 'known', 'as', 'the', '"', 'Syrian', 'Thebaid', '"', ',', 'from', 'the', 'number', 'of', 'eremites', 'inhabiting', 'it', '.'], POS Tag true : ['VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NN', ',', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'NNP', ',', 'IN', 'DT', 'NN', 'IN', 'NNP', ',', 'VBN', 'IN', 'DT', '``', 'NNP', 'NNP', "''", ',', 'IN', 'DT', 'NN', 'IN', 'NNS', 'VBG', 'PRP', '

 46%|████▌     | 921/2000 [00:36<00:36, 29.61it/s]

Sentence ID: GUM_bio_jerome-4, Words: ['He', 'is', 'best', 'known', 'for', 'his', 'translation', 'of', 'most', 'of', 'the', 'Bible', 'into', 'Latin', '(', 'the', 'translation', 'that', 'became', 'known', 'as', 'the', 'Vulgate', ')', ',', 'and', 'his', 'commentaries', 'on', 'the', 'Gospels', '.'], POS Tag true : ['PRP', 'VBZ', 'RBS', 'VBN', 'IN', 'PRP$', 'NN', 'IN', 'JJS', 'IN', 'DT', 'NNP', 'IN', 'NNP', '-LRB-', 'DT', 'NN', 'WDT', 'VBD', 'VBN', 'IN', 'DT', 'NNP', '-RRB-', ',', 'CC', 'PRP$', 'NNS', 'IN', 'DT', 'NNPS', '.'], POS Tag predicted: ['PRP', 'VBZ', 'RBS', 'VBN', 'IN', 'PRP$', 'NN', 'IN', 'JJS', 'IN', 'DT', 'NNP', 'IN', 'NNP', '-LRB-', 'DT', 'NN', 'WDT', 'VBD', 'VBN', 'IN', 'DT', 'NNP', '-RRB-', ',', 'CC', 'PRP$', 'NNS', 'IN', 'DT', 'NNPS', '.']
Sentence ID: GUM_bio_jerome-40, Words: ['Jerome', 'translated', 'parts', 'of', 'this', 'Hebrew', 'Gospel', 'into', 'Greek', '.', '[', '20', ']'], POS Tag true : ['NNP', 'VBD', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'IN', 'NNP', '.', '-LRB-', '

 46%|████▋     | 929/2000 [00:36<00:32, 32.87it/s]

Sentence ID: GUM_bio_jerome-9, Words: ['Jerome', 'is', 'recognised', 'as', 'a', 'saint', 'and', 'Doctor', 'of', 'the', 'Church', 'by', 'the', 'Catholic', 'Church', ',', 'the', 'Eastern', 'Orthodox', 'Church', ',', 'the', 'Lutheran', 'Church', ',', 'and', 'the', 'Anglican', 'Communion', '.', '[', '8', ']'], POS Tag true : ['NNP', 'VBZ', 'VBN', 'IN', 'DT', 'NN', 'CC', 'NNP', 'IN', 'DT', 'NNP', 'IN', 'DT', 'NNP', 'NNP', ',', 'DT', 'NNP', 'NNP', 'NNP', ',', 'DT', 'NNP', 'NNP', ',', 'CC', 'DT', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'VBZ', 'VBN', 'IN', 'DT', 'NN', 'CC', 'NNP', 'IN', 'DT', 'NNP', 'IN', 'DT', 'NNP', 'NNP', ',', 'DT', 'NNP', 'NNP', 'NNP', ',', 'DT', 'NNP', 'NNP', ',', 'CC', 'DT', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_marbles-1, Words: ['Jenna', 'Marbles'], POS Tag true : ['NNP', 'NNP'], POS Tag predicted: ['NNP', 'NNP']
Sentence ID: GUM_bio_marbles-10, Words: ['Career'], POS Tag true : ['NN'], POS Tag predicted: ['NN']


 47%|████▋     | 933/2000 [00:36<00:32, 32.39it/s]

Sentence ID: GUM_bio_marbles-18, Words: ['Her', 'video', '"', 'How', 'To', 'Avoid', 'Talking', 'To', 'People', 'You', "Don't", 'Do', "n't", 'Want', 'To', 'Talk', 'To', '"', 'was', 'featured', 'in', 'articles', 'by', 'The', 'New', 'York', 'Times', 'and', 'ABC', 'News', 'in', 'August', '2011', '.'], POS Tag true : ['PRP$', 'NN', '``', 'WRB', 'TO', 'NNP', 'NNP', 'IN', 'NNPS', 'PRP', '_', 'NNP', 'RB', 'NNP', 'TO', 'NNP', 'IN', '``', 'VBD', 'VBN', 'IN', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', 'IN', 'NNP', 'CD', '.'], POS Tag predicted: ['PRP$', 'NN', "''", 'WRB', 'TO', 'NNP', 'NNP', 'IN', 'NNS', 'PRP', '_', 'VBP', 'RB', 'NNP', 'IN', 'NNP', 'IN', '``', 'VBD', 'VBN', 'IN', 'NNS', 'IN', 'DT', 'NNP', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', 'IN', 'NNP', 'CD', '.']
Sentence ID: GUM_bio_marbles-19, Words: ['In', 'the', 'video', ',', 'she', 'stated', ',', '"', "I'm", 'I', "'m", 'sick', 'and', 'tired', 'of', 'guys', 'thinking', 'that', 'just', 'because', 'I', 'showed', 'up', 'at', 'a',

 47%|████▋     | 942/2000 [00:36<00:38, 27.29it/s]

Sentence ID: GUM_bio_marbles-2, Words: ['Jenna', 'Nicole', 'Mourey', '(', 'born', 'September', '15', ',', '1986', '[', '1', ']', '[', '2', ']', ')', ',', 'better', 'known', 'by', 'her', 'pseudonym', 'Jenna', 'Marbles', ',', 'is', 'an', 'American', 'YouTube', 'personality', ',', 'vlogger', ',', 'comedian', 'and', 'actress', '.'], POS Tag true : ['NNP', 'NNP', 'NNP', '-LRB-', 'VBN', 'NNP', 'CD', ',', 'CD', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-RRB-', ',', 'RBR', 'VBN', 'IN', 'PRP$', 'NN', 'NNP', 'NNP', ',', 'VBZ', 'DT', 'JJ', 'NNP', 'NN', ',', 'NN', ',', 'NN', 'CC', 'NN', '.'], POS Tag predicted: ['NNP', 'NNP', 'NNP', '-LRB-', 'VBN', 'NNP', 'CD', ',', 'CD', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-RRB-', ',', 'RBR', 'VBN', 'IN', 'PRP$', 'NN', 'NNP', 'NNP', ',', 'VBZ', 'DT', 'NNP', 'NNP', 'NN', ',', 'NN', ',', 'NN', 'CC', 'NN', '.']
Sentence ID: GUM_bio_marbles-20, Words: ['The', 'pseudonym', '"', 'Jenna', 'Marbles', '"', 'comes', 'from', 'her', "mother's", 'mother', 

 48%|████▊     | 951/2000 [00:37<00:34, 30.78it/s]

Sentence ID: GUM_bio_marbles-27, Words: ['On', 'January', '30', ',', '2014', ',', 'she', 'appeared', 'in', 'season', 'four', 'of', 'Ridiculousness', '.'], POS Tag true : ['IN', 'NNP', 'CD', ',', 'CD', ',', 'PRP', 'VBD', 'IN', 'NN', 'CD', 'IN', 'NNP', '.'], POS Tag predicted: ['IN', 'NNP', 'CD', ',', 'CD', ',', 'PRP', 'VBD', 'IN', 'NN', 'CD', 'IN', 'NNP', '.']
Sentence ID: GUM_bio_marbles-28, Words: ['Marbles', 'appeared', 'as', 'herself', 'in', 'Smosh', ':', 'The', 'Movie', '.', '[', '18', ']'], POS Tag true : ['NNP', 'VBD', 'IN', 'PRP', 'IN', 'NNP', ':', 'DT', 'NN', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'VBD', 'IN', 'PRP', 'IN', 'NNP', ':', 'DT', 'NN', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_marbles-29, Words: ['In', '2015', ',', 'Marbles', 'unveiled', 'a', 'wax', 'figure', 'of', 'herself', 'at', 'Madame', 'Tussauds', 'New', 'York', '.'], POS Tag true : ['IN', 'CD', ',', 'NNP', 'VBD', 'DT', 'NN', 'NN', 'IN', 'PRP', 'IN', 'NNP', 'NNP', 'NNP', 'NNP', '.'], P

 48%|████▊     | 956/2000 [00:37<00:29, 35.04it/s]

Sentence ID: GUM_bio_marbles-35, Words: ['Other', 'ventures'], POS Tag true : ['JJ', 'NNS'], POS Tag predicted: ['JJ', 'NNS']
Sentence ID: GUM_bio_marbles-36, Words: ['Marbles', 'released', 'a', 'brand', 'of', 'dog', 'toys', 'called', 'Kermie', 'Worm', '&', 'Mr.', 'Marbles', '.'], POS Tag true : ['NNP', 'VBD', 'DT', 'NN', 'IN', 'NN', 'NNS', 'VBN', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', '.'], POS Tag predicted: ['NNP', 'VBD', 'DT', 'NN', 'IN', 'NN', 'NNS', 'VBN', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', '.']
Sentence ID: GUM_bio_marbles-37, Words: ['The', "toys'", 'toys', "'", 'appearances', 'are', 'based', 'upon', 'her', 'real', 'dogs', '.', '[', '7', ']'], POS Tag true : ['DT', '_', 'NNS', 'POS', 'NNS', 'VBP', 'VBN', 'IN', 'PRP$', 'JJ', 'NNS', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['DT', '_', 'NNS', 'POS', 'NNS', 'VBP', 'VBN', 'IN', 'PRP$', 'JJ', 'NNS', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_marbles-38, Words: ['She', 'has', 'also', 'created', 'items', 'with', 'some', 'of', 

 48%|████▊     | 968/2000 [00:37<00:25, 40.66it/s]

Sentence ID: GUM_bio_marbles-43, Words: ['Marbles', 'has', 'been', 'in', 'a', 'relationship', 'with', 'fellow', 'YouTuber', 'Julien', 'Solomita', 'since', '2013', ',', 'and', 'the', 'two', 'live', 'together', 'in', 'California', 'with', 'their', 'four', 'dogs', ',', 'Marbles', ',', 'Kermit', ',', 'Peach', 'and', 'Bunny', ',', 'who', 'regularly', 'appear', 'in', 'her', 'videos', '.', '[', '26', ']'], POS Tag true : ['NNP', 'VBZ', 'VBN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NNP', 'NNP', 'NNP', 'IN', 'CD', ',', 'CC', 'DT', 'CD', 'VBP', 'RB', 'IN', 'NNP', 'IN', 'PRP$', 'CD', 'NNS', ',', 'NNP', ',', 'NNP', ',', 'NNP', 'CC', 'NNP', ',', 'WP', 'RB', 'VBP', 'IN', 'PRP$', 'NNS', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'VBZ', 'VBN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NNP', 'NNP', 'NNP', 'IN', 'CD', ',', 'CC', 'DT', 'CD', 'VBP', 'RB', 'IN', 'NNP', 'IN', 'PRP$', 'CD', 'NNS', ',', 'NNP', ',', 'NNP', ',', 'NNP', 'CC', 'NNP', ',', 'WP', 'RB', 'VB', 'IN', 'PRP$', 'NNS', '.', '-LRB-', 'CD', '-RR

 49%|████▉     | 977/2000 [00:37<00:28, 36.38it/s]

Sentence ID: GUM_bio_moreau-13, Words: ['She', 'won', 'the', 'Cannes', 'Film', 'Festival', 'Award', 'for', 'Best', 'Actress', 'for', 'Seven', 'Days', '...', 'Seven', 'Nights', '(', '1960', ')', ',', 'won', 'the', 'BAFTA', 'Award', 'for', 'Best', 'Foreign', 'Actress', 'for', 'Viva', 'Maria', '!', '(', '1965', ')', ',', 'and', 'won', 'the', 'César', 'Award', 'for', 'Best', 'Actress', 'for', 'The', 'Old', 'Lady', 'Who', 'Walked', 'in', 'the', 'Sea', '(', '1992', ')', '.'], POS Tag true : ['PRP', 'VBD', 'DT', 'NNP', 'NNP', 'NNP', 'NNP', 'IN', 'JJS', 'NN', 'IN', 'NNP', 'NNPS', ':', 'NNP', 'NNPS', '-LRB-', 'CD', '-RRB-', ',', 'VBD', 'DT', 'NNP', 'NNP', 'IN', 'JJS', 'JJ', 'NN', 'IN', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-', ',', 'CC', 'VBD', 'DT', 'NNP', 'NNP', 'IN', 'JJS', 'NN', 'IN', 'DT', 'NNP', 'NNP', 'WP', 'VBD', 'IN', 'DT', 'NNP', '-LRB-', 'CD', '-RRB-', '.'], POS Tag predicted: ['PRP', 'VBD', 'DT', 'NNP', 'NNP', 'NNP', 'NNP', 'IN', 'JJS', 'NN', 'IN', 'NNP', 'NNPS', ':', 'NNP', 'NNPS'

 49%|████▉     | 985/2000 [00:38<00:28, 36.09it/s]

Sentence ID: GUM_bio_moreau-21, Words: ["Moreau's", 'Moreau', "'s", 'father', 'was', 'French', ';', 'her', 'mother', 'was', 'English', ',', 'a', 'native', 'of', 'Oldham', ',', 'Lancashire', ',', 'England', '[', '3', ']', 'and', 'of', 'part', 'Irish', 'descent', '.', '[', '2', ']', '[', '4', ']', '[', '5', ']'], POS Tag true : ['_', 'NNP', 'POS', 'NN', 'VBD', 'JJ', ':', 'PRP$', 'NN', 'VBD', 'JJ', ',', 'DT', 'NN', 'IN', 'NNP', ',', 'NNP', ',', 'NNP', '-LRB-', 'CD', '-RRB-', 'CC', 'IN', 'NN', 'JJ', 'NN', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['_', 'NNP', 'POS', 'NN', 'VBD', 'NNP', ':', 'PRP$', 'NN', 'VBD', 'NNP', ',', 'DT', 'NN', 'IN', 'NNP', ',', 'NNP', ',', 'NNP', '-LRB-', 'CD', '-RRB-', 'CC', 'IN', 'NN', 'JJ', 'NN', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_moreau-22, Words: ["Moreau's", 'Moreau', "'s", 'father', 'was', 'Catholic', 'and', 'her', 'mother', ',', 'originally'

 50%|████▉     | 991/2000 [00:38<00:23, 42.06it/s]

Sentence ID: GUM_bio_moreau-29, Words: ['Her', 'parents', 'separated', 'permanently', 'while', 'Moreau', 'was', 'at', 'the', 'conservatory', 'and', 'her', 'mother', ',', '"', 'after', '24', 'difficult', 'years', 'in', 'France', ',', 'returned', 'to', 'England', 'with', "Jeanne's", 'Jeanne', "'s", '[', '6', ']', 'sister', ',', 'Michelle', '.', '"', '[', '6', ']'], POS Tag true : ['PRP$', 'NNS', 'VBD', 'RB', 'IN', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'CC', 'PRP$', 'NN', ',', '``', 'IN', 'CD', 'JJ', 'NNS', 'IN', 'NNP', ',', 'VBD', 'IN', 'NNP', 'IN', '_', 'NNP', 'POS', '-LRB-', 'CD', '-RRB-', 'NN', ',', 'NNP', '.', "''", '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['PRP$', 'NNS', 'VBD', 'RB', 'IN', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'CC', 'PRP$', 'NN', ',', '``', 'IN', 'CD', 'JJ', 'NNS', 'IN', 'NNP', ',', 'VBD', 'IN', 'NNP', 'IN', '_', 'NNP', 'POS', '-LRB-', 'CD', '-RRB-', 'NN', ',', 'NNP', '.', "''", '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_moreau-3, Words: ['Moreau', 'in', '1958'], POS Tag t

 50%|█████     | 1000/2000 [00:38<00:30, 32.53it/s]

Sentence ID: GUM_bio_moreau-35, Words: ['Elevator', 'to', 'the', 'Gallows', '(', '1958', ')', 'with', 'first', '-', 'time', 'director', 'Louis', 'Malle', 'was', 'followed', 'by', "Malle's", 'Malle', "'s", 'The', 'Lovers', '(', 'Les', 'Amants', ',', '1959', ')', '.', '[', '7', ']'], POS Tag true : ['NNP', 'IN', 'DT', 'NNP', '-LRB-', 'CD', '-RRB-', 'IN', 'JJ', 'HYPH', 'NN', 'NN', 'NNP', 'NNP', 'VBD', 'VBN', 'IN', '_', 'NNP', 'POS', 'DT', 'NNP', '-LRB-', 'NNP', 'NNP', ',', 'CD', '-RRB-', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'IN', 'DT', 'NNP', '-LRB-', 'CD', '-RRB-', 'IN', 'JJ', 'HYPH', 'NN', 'NN', 'NNP', 'NNP', 'VBD', 'VBN', 'IN', '_', 'NNP', 'POS', 'DT', 'NNP', '-LRB-', 'NNP', 'NNP', ',', 'CD', '-RRB-', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_moreau-36, Words: ['Moreau', 'went', 'on', 'to', 'work', 'with', 'many', 'of', 'the', 'best', 'known', 'New', 'Wave', 'and', 'avant', '-', 'garde', 'directors', '.', '[', '2', ']'], POS Tag true : ['NNP', 'VBD', 'RP', '

 51%|█████     | 1015/2000 [00:38<00:20, 48.79it/s]

Sentence ID: GUM_bio_moreau-43, Words: ['In', 'addition', 'to', 'acting', ',', 'Moreau', 'worked', 'behind', 'the', 'camera', 'as', 'a', 'writer', ',', 'director', 'and', 'producer', '.', '[', '2', ']'], POS Tag true : ['IN', 'NN', 'IN', 'NN', ',', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'NN', 'CC', 'NN', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'NN', 'IN', 'NN', ',', 'NNP', 'VBD', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'NN', 'CC', 'NN', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_moreau-44, Words: ['Her', 'accomplishments', 'were', 'the', 'subject', 'of', 'the', 'film', 'Calling', 'the', 'Shots', '(', '1988', ')', 'by', 'Janis', 'Cole', 'and', 'Holly', 'Dale', '.', '[', 'citation', 'needed', ']'], POS Tag true : ['PRP$', 'NNS', 'VBD', 'DT', 'NN', 'IN', 'DT', 'NN', 'NNP', 'DT', 'NNP', '-LRB-', 'CD', '-RRB-', 'IN', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', '.', '-LRB-', 'NN', 'VBN', '-RRB-'], POS Tag predicted: ['PRP$', 'NNS', 'VBD', 'DT', 'NN', 'IN', 'DT',

 51%|█████▏    | 1027/2000 [00:38<00:21, 46.13it/s]

Sentence ID: GUM_bio_nida-17, Words: ['Nida', 'retired', 'in', 'the', 'early', '1980s', ',', 'although', 'he', 'continued', 'to', 'give', 'lectures', 'in', 'universities', 'all', 'around', 'the', 'world', ',', 'and', 'lived', 'in', 'Alpine', ',', 'Arizona', ',', 'USA', ';', 'Madrid', ',', 'Spain', 'and', 'Brussels', ',', 'Belgium', '.'], POS Tag true : ['NNP', 'VBD', 'IN', 'DT', 'JJ', 'NNS', ',', 'IN', 'PRP', 'VBD', 'TO', 'VB', 'NNS', 'IN', 'NNS', 'RB', 'IN', 'DT', 'NN', ',', 'CC', 'VBD', 'IN', 'NNP', ',', 'NNP', ',', 'NNP', ':', 'NNP', ',', 'NNP', 'CC', 'NNP', ',', 'NNP', '.'], POS Tag predicted: ['NNP', 'VBD', 'IN', 'DT', 'JJ', 'NNS', ',', 'IN', 'PRP', 'VBD', 'TO', 'VB', 'NNS', 'IN', 'NNS', 'RB', 'IN', 'DT', 'NN', ',', 'CC', 'VBD', 'IN', 'NNP', ',', 'NNP', ',', 'NNP', ':', 'NNP', ',', 'NNP', 'CC', 'NNP', ',', 'NNP', '.']
Sentence ID: GUM_bio_nida-18, Words: ['He', 'died', 'in', 'Madrid', 'on', 'August', '25', ',', '2011', 'aged', '96', '.'], POS Tag true : ['PRP', 'VBD', 'IN', 'NNP',

 52%|█████▏    | 1032/2000 [00:39<00:27, 35.50it/s]

Sentence ID: GUM_bio_nida-26, Words: ['Nida', 'also', 'developed', 'the', 'componential', 'analysis', 'technique', ',', 'which', 'split', 'words', 'into', 'their', 'components', 'to', 'help', 'determine', 'equivalence', 'in', 'translation', '(', 'e.g.', '"', 'bachelor', '"', '=', 'male', '+', 'unmarried', ')', '.'], POS Tag true : ['NNP', 'RB', 'VBD', 'DT', 'JJ', 'NN', 'NN', ',', 'WDT', 'VBD', 'NNS', 'IN', 'PRP$', 'NNS', 'TO', 'VB', 'VB', 'NN', 'IN', 'NN', '-LRB-', 'FW', '``', 'NN', "''", 'SYM', 'NN', 'SYM', 'JJ', '-RRB-', '.'], POS Tag predicted: ['NNP', 'RB', 'VBN', 'DT', 'JJ', 'NN', 'NN', ',', 'WDT', 'VBD', 'NNS', 'IN', 'PRP$', 'NNS', 'TO', 'VB', 'VB', 'NN', 'IN', 'NN', '-LRB-', 'FW', '``', 'NN', "''", 'SYM', 'NN', 'SYM', 'JJ', '-RRB-', '.']
Sentence ID: GUM_bio_nida-27, Words: ['This', 'is', ',', 'perhaps', ',', 'not', 'the', 'best', 'example', 'of', 'the', 'technique', ',', 'though', 'it', 'is', 'the', 'most', 'well', '-', 'known', '.'], POS Tag true : ['DT', 'VBZ', ',', 'RB', ','

 52%|█████▏    | 1043/2000 [00:39<00:24, 39.60it/s]


Sentence ID: GUM_bio_nida-33, Words: ['1.', 'The', 'nature', 'of', 'the', 'message', ':', 'in', 'some', 'messages', 'the', 'content', 'is', 'of', 'primary', 'consideration', ',', 'and', 'in', 'others', 'the', 'form', 'must', 'be', 'given', 'a', 'higher', 'priority', '.'], POS Tag true : ['LS', 'DT', 'NN', 'IN', 'DT', 'NN', ':', 'IN', 'DT', 'NNS', 'DT', 'NN', 'VBZ', 'IN', 'JJ', 'NN', ',', 'CC', 'IN', 'NNS', 'DT', 'NN', 'MD', 'VB', 'VBN', 'DT', 'JJR', 'NN', '.'], POS Tag predicted: ['LS', 'DT', 'NN', 'IN', 'DT', 'NN', ':', 'IN', 'DT', 'NNS', 'DT', 'NN', 'VBZ', 'IN', 'JJ', 'NN', ',', 'CC', 'IN', 'NNS', 'DT', 'NN', 'MD', 'VB', 'VBN', 'DT', 'JJR', 'NN', '.']
Sentence ID: GUM_bio_nida-34, Words: ['2.', 'The', 'purpose', 'of', 'the', 'author', 'and', 'of', 'the', 'translator', ':', 'to', 'give', 'information', 'on', 'both', 'form', 'and', 'content', ';', 'to', 'aim', 'at', 'full', 'intelligibility', 'of', 'the', 'reader', 'so', 'he', '/', 'she', 'may', 'understand', 'the', 'full', 'implicati

 52%|█████▏    | 1048/2000 [00:39<00:23, 40.25it/s]

Sentence ID: GUM_bio_nida-4, Words: ['Nida', 'was', 'born', 'in', 'Oklahoma', 'City', ',', 'Oklahoma', 'on', 'November', '11', ',', '1914', '.'], POS Tag true : ['NNP', 'VBD', 'VBN', 'IN', 'NNP', 'NNP', ',', 'NNP', 'IN', 'NNP', 'CD', ',', 'CD', '.'], POS Tag predicted: ['NNP', 'VBD', 'VBN', 'IN', 'NNP', 'NNP', ',', 'NNP', 'IN', 'NNP', 'CD', ',', 'CD', '.']
Sentence ID: GUM_bio_nida-40, Words: ['Such', 'translations', 'then', 'would', 'be', 'concerned', 'with', 'such', 'correspondences', 'as', 'poetry', 'to', 'poetry', ',', 'sentence', 'to', 'sentence', ',', 'and', 'concept', 'to', 'concept', '.'], POS Tag true : ['JJ', 'NNS', 'RB', 'MD', 'VB', 'VBN', 'IN', 'JJ', 'NNS', 'IN', 'NN', 'IN', 'NN', ',', 'NN', 'IN', 'NN', ',', 'CC', 'NN', 'IN', 'NN', '.'], POS Tag predicted: ['JJ', 'NNS', 'RB', 'MD', 'VB', 'VBN', 'IN', 'JJ', 'NNS', 'IN', 'NN', 'IN', 'NN', ',', 'NN', 'IN', 'NN', ',', 'CC', 'NN', 'IN', 'NN', '.']
Sentence ID: GUM_bio_nida-41, Words: ['Such', 'a', 'formal', 'orientation', 'that'

 53%|█████▎    | 1059/2000 [00:39<00:22, 42.11it/s]

Sentence ID: GUM_bio_padalecki-10, Words: ['In', '1998', ',', 'Padalecki', 'and', 'his', 'partner', 'Chris', 'Cardenas', 'won', 'the', 'National', 'Forensic', 'League', 'national', 'championship', 'in', 'Duo', 'Interpretation', '.', '[', '4', ']'], POS Tag true : ['IN', 'CD', ',', 'NNP', 'CC', 'PRP$', 'NN', 'NNP', 'NNP', 'VBD', 'DT', 'NNP', 'NNP', 'NNP', 'JJ', 'NN', 'IN', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'CD', ',', 'NNP', 'CC', 'PRP$', 'NN', 'NNP', 'NNP', 'VBD', 'DT', 'NNP', 'NNP', 'NNP', 'JJ', 'NN', 'IN', 'NNP', 'NNP', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_padalecki-11, Words: ['Although', 'he', 'had', 'originally', 'planned', 'to', 'attend', 'the', 'University', 'of', 'Texas', 'after', 'graduating', 'from', 'high', 'school', 'in', '2000', ',', 'Jared', 'decided', 'to', 'move', 'Los', 'Angeles', ',', 'California', 'instead', 'to', 'pursue', 'an', 'acting', 'career', '.', '[', '1', ']'], POS Tag true : ['IN', 'PRP', 'VBD', 'RB', 'VBN', '

 53%|█████▎    | 1069/2000 [00:40<00:24, 38.34it/s]

Sentence ID: GUM_bio_padalecki-17, Words: ['Padalecki', 'had', 'an', 'uncredited', 'role', 'as', 'a', 'high', 'school', 'bully', 'in', "2003's", '2003', "'s", 'comedy', 'Cheaper', 'by', 'the', 'Dozen', ',', 'which', 'he', 'played', 'after', 'being', 'asked', 'by', 'fellow', 'actor', 'and', 'friend', 'Tom', 'Welling', ',', 'who', 'played', 'Charlie', 'Baker', ',', 'and', 'the', 'director', 'of', 'the', 'movie', ',', 'who', 'wanted', 'someone', 'larger', 'than', 'Charlie', 'to', 'pick', 'on', 'him', '.'], POS Tag true : ['NNP', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'NN', 'IN', '_', 'CD', 'POS', 'NN', 'NNP', 'IN', 'DT', 'NNP', ',', 'WDT', 'PRP', 'VBD', 'IN', 'VBG', 'VBN', 'IN', 'JJ', 'NN', 'CC', 'NN', 'NNP', 'NNP', ',', 'WP', 'VBD', 'NNP', 'NNP', ',', 'CC', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'WP', 'VBD', 'NN', 'JJR', 'IN', 'NNP', 'TO', 'VB', 'IN', 'PRP', '.'], POS Tag predicted: ['NNP', 'VBD', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'NN', 'IN', '_', 'CD', 'POS', 'NN', 'NNP', 

 54%|█████▎    | 1074/2000 [00:40<00:24, 38.43it/s]

Sentence ID: GUM_bio_padalecki-25, Words: ['The', 'show', 'is', 'currently', 'in', 'its', 'fourteenth', 'season', 'on', 'the', 'CW', '.'], POS Tag true : ['DT', 'NN', 'VBZ', 'RB', 'IN', 'PRP$', 'JJ', 'NN', 'IN', 'DT', 'NNP', '.'], POS Tag predicted: ['DT', 'NN', 'VBZ', 'RB', 'IN', 'PRP$', 'JJ', 'NN', 'IN', 'DT', 'NNP', '.']
Sentence ID: GUM_bio_padalecki-26, Words: ['It', 'owns', 'the', 'title', 'of', 'the', 'longest', '-', 'running', 'North', 'American', 'sci', '-', 'fi', 'series', 'in', 'history', '.', '[', '10', ']'], POS Tag true : ['PRP', 'VBZ', 'DT', 'NN', 'IN', 'DT', 'RBS', 'HYPH', 'VBG', 'NNP', 'JJ', 'NN', 'HYPH', 'NN', 'NN', 'IN', 'NN', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['PRP', 'VBZ', 'DT', 'NN', 'IN', 'DT', 'RBS', 'HYPH', 'VBG', 'NNP', 'NNP', 'NN', 'HYPH', 'NN', 'NN', 'IN', 'NN', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_padalecki-27, Words: ['In', '2007', ',', 'Jared', 'served', 'as', 'the', 'host', 'of', "MTV's", 'MTV', "'s", 'horror', 'reality', 'ser

 54%|█████▍    | 1085/2000 [00:40<00:21, 42.09it/s]

Sentence ID: GUM_bio_padalecki-33, Words: ['Padalecki', 'proposed', 'to', 'her', 'in', 'front', 'of', 'their', 'favorite', 'painting', ',', '"', 'Joan', 'of', 'Arc', '"', ',', 'by', 'French', 'realist', 'Jules', 'Bastien', '-', 'Lepage', 'at', 'New', "York's", 'York', "'s", 'Metropolitan', 'Museum', 'of', 'Art', 'in', 'October', '2009', '.', '[', '13', ']', '[', '14', ']', '[', '15', ']', '[', '16', ']'], POS Tag true : ['NNP', 'VBD', 'IN', 'PRP', 'IN', 'NN', 'IN', 'PRP$', 'JJ', 'NN', ',', '``', 'NNP', 'IN', 'NNP', "''", ',', 'IN', 'JJ', 'NN', 'NNP', 'NNP', 'HYPH', 'NNP', 'IN', 'NNP', '_', 'NNP', 'POS', 'NNP', 'NNP', 'IN', 'NNP', 'IN', 'NNP', 'CD', '.', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['NNP', 'VBD', 'IN', 'PRP', 'IN', 'NN', 'IN', 'PRP$', 'JJ', 'NN', ',', '``', 'NNP', 'IN', 'NNP', "''", ',', 'IN', 'JJ', 'NN', 'NNP', 'NNP', 'HYPH', 'NNP', 'IN', 'NNP', '_', 'NNP', 'POS', 'NNP', 'NNP', 'IN', 'NNP', 'IN', 'N

 55%|█████▍    | 1095/2000 [00:40<00:22, 40.96it/s]

Sentence ID: GUM_bio_padalecki-43, Words: ['His', 'first', 'campaign', 'raised', 'funds', 'for', 'To', 'Write', 'Love', 'On', 'Her', 'Arms', ',', 'which', 'supports', 'people', 'struggling', 'with', 'depression', ',', 'addiction', ',', 'self', '-', 'injury', ',', 'and', 'suicide', '.'], POS Tag true : ['PRP$', 'JJ', 'NN', 'VBD', 'NNS', 'IN', 'TO', 'NNP', 'NNP', 'IN', 'PRP$', 'NNPS', ',', 'WDT', 'VBZ', 'NNS', 'VBG', 'IN', 'NN', ',', 'NN', ',', 'NN', 'HYPH', 'NN', ',', 'CC', 'NN', '.'], POS Tag predicted: ['PRP$', 'JJ', 'NN', 'VBD', 'NNS', 'IN', 'IN', 'NNP', 'NNP', 'IN', 'PRP$', 'NNPS', ',', 'WDT', 'VBZ', 'NNS', 'VBG', 'IN', 'NN', ',', 'NN', ',', 'NN', 'HYPH', 'NN', ',', 'CC', 'NN', '.']
Sentence ID: GUM_bio_padalecki-44, Words: ['The', 'cause', 'is', 'particularly', 'close', 'to', 'Padalecki', ',', 'who', 'has', 'been', 'candid', 'about', 'his', 'own', 'struggles', 'with', 'depression', '.', '[', '20', ']'], POS Tag true : ['DT', 'NN', 'VBZ', 'RB', 'RB', 'IN', 'NNP', ',', 'WP', 'VBZ', '

 55%|█████▌    | 1107/2000 [00:41<00:23, 38.47it/s]

Sentence ID: GUM_bio_theodorus-10, Words: ['He', 'was', 'welcomed', 'by', 'Pachomius', 'upon', 'his', 'arrival', ',', 'and', 'quickly', 'integrated', 'into', 'the', 'community', 'at', 'Tabennese', 'around', '328', '.'], POS Tag true : ['PRP', 'VBD', 'VBN', 'IN', 'NNP', 'IN', 'PRP$', 'NN', ',', 'CC', 'RB', 'VBD', 'IN', 'DT', 'NN', 'IN', 'NNP', 'IN', 'CD', '.'], POS Tag predicted: ['PRP', 'VBD', 'VBN', 'IN', 'NNP', 'IN', 'PRP$', 'NN', ',', 'CC', 'RB', 'VBD', 'IN', 'DT', 'NN', 'IN', 'NNP', 'IN', 'CD', '.']
Sentence ID: GUM_bio_theodorus-11, Words: ['Quickly', 'becoming', 'a', 'favorite', 'of', 'Pachomius', ',', 'Theodorus', 'lived', 'an', 'enviably', 'ascetic', 'life', 'in', 'the', 'monastery', ',', 'and', 'took', 'on', 'the', 'title', 'of', 'the', '"', 'brothers’', 'brothers', '’', 'comforter', '"', '.'], POS Tag true : ['RB', 'VBG', 'DT', 'NN', 'IN', 'NNP', ',', 'NNP', 'VBD', 'DT', 'RB', 'JJ', 'NN', 'IN', 'DT', 'NN', ',', 'CC', 'VBD', 'RP', 'DT', 'NN', 'IN', 'DT', '``', '_', 'NNS', 'POS

 56%|█████▌    | 1112/2000 [00:41<00:25, 35.34it/s]

Sentence ID: GUM_bio_theodorus-16, Words: ['Despite', 'his', 'clear', 'potential', 'and', 'popularity', ',', 'Pachomius', 'refused', 'to', 'grant', 'Theodorus', 'any', 'kind', 'of', 'authority', ';', 'though', 'the', 'old', "man's", 'man', "'s", 'failing', 'health', 'soon', 'changed', 'things', 'forever', '.'], POS Tag true : ['IN', 'PRP$', 'JJ', 'NN', 'CC', 'NN', ',', 'NNP', 'VBD', 'TO', 'VB', 'NNP', 'DT', 'NN', 'IN', 'NN', ':', 'IN', 'DT', 'JJ', '_', 'NN', 'POS', 'VBG', 'NN', 'RB', 'VBD', 'NNS', 'RB', '.'], POS Tag predicted: ['IN', 'PRP$', 'JJ', 'NN', 'CC', 'NN', ',', 'NNP', 'VBD', 'TO', 'VB', 'NNP', 'DT', 'NN', 'IN', 'NN', ':', 'IN', 'DT', 'JJ', '_', 'NN', 'VBZ', 'VBG', 'NN', 'RB', 'VBD', 'NNS', 'RB', '.']
Sentence ID: GUM_bio_theodorus-17, Words: ['After', 'Theodorus', 'had', 'been', 'assisting', 'Pachomius', 'at', 'Tabennese', 'for', 'several', 'years', 'following', 'his', 'demotion', ',', 'Pachomius', 'became', 'very', 'ill', 'and', 'seemed', 'to', 'be', 'on', 'the', 'verge', 'o

 56%|█████▌    | 1121/2000 [00:41<00:25, 35.11it/s]

Sentence ID: GUM_bio_theodorus-24, Words: ['The', 'death', 'of', 'Petronios', 'later', 'that', 'year', 'would', 'leave', 'Apa', 'Horsiesios', 'in', 'charge', ',', 'and', 'the', 'popular', 'Theodorus', 'would', 'retreat', 'to', 'the', 'distant', 'monastery', 'of', 'Phnoum', '.'], POS Tag true : ['DT', 'NN', 'IN', 'NNP', 'RBR', 'DT', 'NN', 'MD', 'VB', 'NNP', 'NNP', 'IN', 'NN', ',', 'CC', 'DT', 'JJ', 'NNP', 'MD', 'VB', 'IN', 'DT', 'JJ', 'NN', 'IN', 'NNP', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'NNP', 'RBR', 'IN', 'NN', 'MD', 'VB', 'NNP', 'NNP', 'IN', 'NN', ',', 'CC', 'DT', 'JJ', 'NNP', 'MD', 'VB', 'IN', 'DT', 'JJ', 'NN', 'IN', 'NNP', '.']
Sentence ID: GUM_bio_theodorus-25, Words: ['Although', 'it', 'seems', 'Theodorus', 'practiced', 'complete', 'submission', 'to', 'the', 'new', 'leader', 'of', 'the', 'Koinonia', ',', 'problems', 'soon', 'arose', 'in', 'several', 'Pachomian', 'monasteries', 'that', 'viewed', 'Horsiesios', 'as', 'a', 'weak', 'leader', '.'], POS Tag true : ['IN', 'PRP',

 57%|█████▋    | 1131/2000 [00:41<00:23, 37.02it/s]

Sentence ID: GUM_bio_theodorus-30, Words: ['Yet', 'in', 'spite', 'of', 'this', 'somewhat', 'unstable', 'shifting', ',', 'the', 'Koinonia', 'was', 'ruled', 'peacefully', 'for', 'nearly', 'two', 'decades', ',', 'at', 'which', 'point', 'Theodorus', 'predicted', 'he', 'would', 'soon', 'die', '.'], POS Tag true : ['CC', 'IN', 'NN', 'IN', 'DT', 'RB', 'JJ', 'NN', ',', 'DT', 'NNP', 'VBD', 'VBN', 'RB', 'IN', 'RB', 'CD', 'NNS', ',', 'IN', 'WDT', 'NN', 'NNP', 'VBD', 'PRP', 'MD', 'RB', 'VB', '.'], POS Tag predicted: ['CC', 'IN', 'NN', 'IN', 'DT', 'RB', 'JJ', 'NN', ',', 'DT', 'NNP', 'VBD', 'VBN', 'RB', 'IN', 'RB', 'CD', 'NNS', ',', 'IN', 'WDT', 'NN', 'NNP', 'VBD', 'PRP', 'MD', 'RB', 'VB', '.']
Sentence ID: GUM_bio_theodorus-31, Words: ['Within', 'a', 'few', 'months', 'his', 'prediction', 'came', 'true', ',', 'and', 'Apa', 'Horsiesios', 'once', 'more', 'took', 'his', 'place', 'as', 'the', 'head', 'of', 'the', 'communities', 'in', 'both', 'title', 'and', 'authority', '.', '[', '1', ']'], POS Tag true

 59%|█████▊    | 1174/2000 [00:42<00:08, 96.07it/s]

Sentence ID: GUM_conversation_atoms-107, Words: ['Five', 'swollen', 'balloons', '.'], POS Tag true : ['CD', 'JJ', 'NNS', '.'], POS Tag predicted: ['CD', 'JJ', 'NNS', '.']
Sentence ID: GUM_conversation_atoms-108, Words: ['In', '.'], POS Tag true : ['IN', '.'], POS Tag predicted: ['IN', '.']
Sentence ID: GUM_conversation_atoms-109, Words: ['In', '.'], POS Tag true : ['IN', '.'], POS Tag predicted: ['IN', '.']
Sentence ID: GUM_conversation_atoms-11, Words: ['This', 'water', 'in', 'this', 'glass', ',', 'and', 'the', 'steam', 'rising', 'from', 'this', 'pot', ',', 'just', 'yell', 'it', 'out', ',', 'we', 'are', 'informal', 'here', ',', 'yes', '.'], POS Tag true : ['DT', 'NN', 'IN', 'DT', 'NN', ',', 'CC', 'DT', 'NN', 'VBG', 'IN', 'DT', 'NN', ',', 'RB', 'VB', 'PRP', 'RP', ',', 'PRP', 'VBP', 'JJ', 'RB', ',', 'UH', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'DT', 'NN', ',', 'CC', 'DT', 'NN', 'NN', 'IN', 'DT', 'NN', ',', 'RB', 'VB', 'PRP', 'RP', ',', 'PRP', 'VBP', 'JJ', 'RB', ',', 'UH', '.']
Sent

 59%|█████▉    | 1185/2000 [00:42<00:09, 85.95it/s]

Sentence ID: GUM_conversation_atoms-138, Words: ['Very', 'good', '.'], POS Tag true : ['RB', 'JJ', '.'], POS Tag predicted: ['RB', 'JJ', '.']
Sentence ID: GUM_conversation_atoms-139, Words: ['Oh', 'my', 'gosh', ',', 'eight', 'balloons', 'into', 'this', 'little', 'container', 'here', ',', 'I', 'bet', "you're", 'you', "'re", 'wondering', 'r-', 'how', 'that', 'happened', '.'], POS Tag true : ['UH', 'PRP$', 'UH', ',', 'CD', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'RB', ',', 'PRP', 'VBP', '_', 'PRP', 'VBP', 'VBG', 'UH', 'WRB', 'DT', 'VBD', '.'], POS Tag predicted: ['UH', 'PRP$', 'UH', ',', 'CD', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'RB', ',', 'PRP', 'VBP', '_', 'PRP', 'VBP', 'VBG', 'UH', 'WRB', 'DT', 'VBD', '.']
Sentence ID: GUM_conversation_atoms-14, Words: ['This', 'ice', 'here', 'of', 'course', 'is', 'water', ',', 'I', 'told', 'you', 'there', 'was', 'water', 'in', 'this', 'glass', ',', 'and', 'you', 'have', 'all', 'seen', 'water', 'boil', 'at', 'home', ',', 'so', 'you', 'are', 'familiar', 'with', 'stea

 60%|██████    | 1208/2000 [00:42<00:08, 95.77it/s]

Sentence ID: GUM_conversation_atoms-18, Words: ['The', 'temperature', 'of', 'this', 'w-', 'water', 'here', ',', 'is', 'sixty', '-', 'four', 'degrees', ',', 'the', 'temperature', 'of', 'this', 'steam', ',', 'is', ',', 'I', 'know', "it's", 'it', "'s", 'hotter', 'than', 'that', '.'], POS Tag true : ['DT', 'NN', 'IN', 'DT', 'UH', 'NN', 'RB', ',', 'VBZ', 'CD', 'HYPH', 'CD', 'NNS', ',', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'VBZ', ',', 'PRP', 'VBP', '_', 'PRP', 'VBZ', 'JJR', 'IN', 'DT', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'DT', 'UH', 'NN', 'RB', ',', 'VBZ', 'CD', 'SYM', 'CD', 'NNS', ',', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'VBZ', ',', 'PRP', 'VBP', '_', 'PRP', 'VBZ', 'JJR', 'IN', 'DT', '.']
Sentence ID: GUM_conversation_atoms-19, Words: ['Yeah', ',', "it's", 'it', "'s", 'about', 'a', 'hundred', 'and', 'eleven', 'degrees', '.'], POS Tag true : ['UH', ',', '_', 'PRP', 'VBZ', 'RB', 'DT', 'CD', 'CC', 'CD', 'NNS', '.'], POS Tag predicted: ['UH', ',', '_', 'PRP', 'VBZ', 'IN', 'DT', 'CD', 'CC',

 61%|██████▏   | 1229/2000 [00:42<00:09, 84.45it/s]

Sentence ID: GUM_conversation_atoms-4, Words: ['By', 'now', "I'm", 'I', "'m", 'sure', "you're", 'you', "'re", 'wondering', 'about', 'the', 'different', 'things', 'that', 'I', 'have', 'on', 'the', 'table', 'here', ',', 'but', 'first', ',', 'I', 'would', 'like', 'to', 'talk', 'to', 'you', 'about', 'these', 'three', 'items', '.'], POS Tag true : ['IN', 'RB', '_', 'PRP', 'VBP', 'JJ', '_', 'PRP', 'VBP', 'VBG', 'IN', 'DT', 'JJ', 'NNS', 'WDT', 'PRP', 'VBP', 'IN', 'DT', 'NN', 'RB', ',', 'CC', 'RB', ',', 'PRP', 'MD', 'VB', 'TO', 'VB', 'IN', 'PRP', 'IN', 'DT', 'CD', 'NNS', '.'], POS Tag predicted: ['IN', 'RB', '_', 'PRP', 'VBP', 'JJ', '_', 'PRP', 'VBP', 'VBG', 'IN', 'DT', 'JJ', 'NNS', 'WDT', 'PRP', 'VBP', 'IN', 'DT', 'NN', 'RB', ',', 'CC', 'RB', ',', 'PRP', 'MD', 'VB', 'TO', 'VB', 'IN', 'PRP', 'IN', 'DT', 'CD', 'NNS', '.']
Sentence ID: GUM_conversation_atoms-40, Words: ['Anything', 'wet', 'like', 'soda', 'or', 'milk', '.'], POS Tag true : ['NN', 'JJ', 'IN', 'NN', 'CC', 'NN', '.'], POS Tag predic

 63%|██████▎   | 1252/2000 [00:42<00:07, 94.59it/s]


Sentence ID: GUM_conversation_atoms-58, Words: ['Correct', '?'], POS Tag true : ['JJ', '.'], POS Tag predicted: ['JJ', '.']
Sentence ID: GUM_conversation_atoms-59, Words: ['Alright', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_atoms-6, Words: ['Now', ',', 'I', 'would', 'like', 'to', 'ask', 'you', ',', 'how', 'these', 'three', 'things', '.'], POS Tag true : ['RB', ',', 'PRP', 'MD', 'VB', 'TO', 'VB', 'PRP', ',', 'WRB', 'DT', 'CD', 'NNS', '.'], POS Tag predicted: ['RB', ',', 'PRP', 'MD', 'VB', 'TO', 'VB', 'PRP', ',', 'WRB', 'DT', 'CD', 'NNS', '.']
Sentence ID: GUM_conversation_atoms-60, Words: ['Well', 'folks', ',', 'now', "I'm", 'I', "'m", 'going', 'to', 'show', 'you', 'something', 'else', 'that', 'happens', 'when', 'you', 'change', 'the', 'temperature', ',', 'and', "that's", 'that', "'s", 'where', 'these', 'balloons', 'come', 'in', '.'], POS Tag true : ['UH', 'NNS', ',', 'RB', '_', 'PRP', 'VBP', 'VBG', 'TO', 'VB', 'PRP', 'NN', 'RB', 'W

 64%|██████▍   | 1282/2000 [00:43<00:06, 115.84it/s]

Sentence ID: GUM_conversation_atoms-8, Words: ['How', 'are', 'they', 'all', 'alike', '.'], POS Tag true : ['WRB', 'VBP', 'PRP', 'RB', 'JJ', '.'], POS Tag predicted: ['WRB', 'VBP', 'PRP', 'DT', 'JJ', '.']
Sentence ID: GUM_conversation_atoms-80, Words: ['Ah', ',', "they're", 'they', "'re", 'not', 'fitting', 'in', 'so', 'easily', '.'], POS Tag true : ['UH', ',', '_', 'PRP', 'VBP', 'RB', 'VBG', 'RP', 'RB', 'RB', '.'], POS Tag predicted: ['UH', ',', '_', 'PRP', 'VBP', 'RB', 'VBG', 'IN', 'RB', 'RB', '.']
Sentence ID: GUM_conversation_atoms-81, Words: ['Oh', 'no', '.'], POS Tag true : ['UH', 'UH', '.'], POS Tag predicted: ['UH', 'UH', '.']
Sentence ID: GUM_conversation_atoms-82, Words: ['So', 'hopefully', 'I', 'can', 'fit', 'all', 'balloons', 'into', 'this', 'little', 'container', 'here', '.'], POS Tag true : ['RB', 'RB', 'PRP', 'MD', 'VB', 'DT', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'RB', '.'], POS Tag predicted: ['RB', 'RB', 'PRP', 'MD', 'VB', 'DT', 'NNS', 'IN', 'DT', 'JJ', 'NN', 'RB', '.']
Senten

 65%|██████▌   | 1305/2000 [00:43<00:07, 96.47it/s] 

Sentence ID: GUM_conversation_blacksmithing-105, Words: ['But', "we're", 'we', "'re", 'talking', 'just', 'the', 'regular', ',', 'light', 'horses', 'you', 'know', '.'], POS Tag true : ['CC', '_', 'PRP', 'VBP', 'VBG', 'RB', 'DT', 'JJ', ',', 'JJ', 'NNS', 'PRP', 'VBP', '.'], POS Tag predicted: ['CC', '_', 'PRP', 'VBP', 'VBG', 'RB', 'DT', 'JJ', ',', 'JJ', 'NNS', 'PRP', 'VBP', '.']
Sentence ID: GUM_conversation_blacksmithing-11, Words: ['I', "don't", 'do', "n't", 'know', 'how', 'to', 'say', 'it', '.'], POS Tag true : ['PRP', '_', 'VBP', 'RB', 'VB', 'WRB', 'TO', 'VB', 'PRP', '.'], POS Tag predicted: ['PRP', '_', 'VBP', 'RB', 'VB', 'WRB', 'TO', 'VB', 'PRP', '.']
Sentence ID: GUM_conversation_blacksmithing-12, Words: ['But', 'you', 'know', ',', 'they', 'do', 'it', 'for', 'a', 'living', '.'], POS Tag true : ['CC', 'PRP', 'VBP', ',', 'PRP', 'VBP', 'PRP', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['CC', 'PRP', 'VBP', ',', 'PRP', 'VBP', 'PRP', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_b

 66%|██████▌   | 1315/2000 [00:43<00:08, 77.01it/s]

Sentence ID: GUM_conversation_blacksmithing-29, Words: ['And', 'you', 'can', 'only', 'take', '—', 'if', 'you', 'want', 'to', ',', 'you', 'can', 'only', 'take', 'it', 'for', 'eight', 'weeks', '.'], POS Tag true : ['CC', 'PRP', 'MD', 'RB', 'VB', ':', 'IN', 'PRP', 'VBP', 'TO', ',', 'PRP', 'MD', 'RB', 'VB', 'PRP', 'IN', 'CD', 'NNS', '.'], POS Tag predicted: ['CC', 'PRP', 'MD', 'RB', 'VB', ':', 'IN', 'PRP', 'VBP', 'TO', ',', 'PRP', 'MD', 'RB', 'VB', 'PRP', 'IN', 'CD', 'NNS', '.']
Sentence ID: GUM_conversation_blacksmithing-3, Words: ['Well', ',', "we're", 'we', "'re", 'gonna', 'gon', 'na', 'have', 'to', 'find', 'somewhere', ',', 'to', 'get', ',', 'something'], POS Tag true : ['UH', ',', '_', 'PRP', 'VBP', '_', 'VBG', 'TO', 'VB', 'TO', 'VB', 'RB', ',', 'TO', 'VB', ',', 'NN'], POS Tag predicted: ['UH', ',', '_', 'PRP', 'VBP', '_', 'VBG', 'TO', 'VB', 'TO', 'VB', 'RB', ',', 'TO', 'VB', ',', 'NN']
Sentence ID: GUM_conversation_blacksmithing-30, Words: ['And', ',', 'if', 'you', 'wanna', 'wan', 'n

 67%|██████▋   | 1333/2000 [00:43<00:10, 65.59it/s]

Sentence ID: GUM_conversation_blacksmithing-43, Words: ['Th-', "there's", 'there', "'s", 'a', 'white', 'line', ',', 'that', 'you', 'go', 'by', ',', 'and', 'a', 'horse', 'has', 'this', 'little', 'white', 'line', ',', 'and', 'you', 'clean', 'it', 'out', 'with', 'the', '—', 'with', 'the', 'hoof', 'knife', '.'], POS Tag true : ['UH', '_', 'EX', 'VBZ', 'DT', 'JJ', 'NN', ',', 'WDT', 'PRP', 'VBP', 'IN', ',', 'CC', 'DT', 'NN', 'VBZ', 'DT', 'JJ', 'JJ', 'NN', ',', 'CC', 'PRP', 'VBP', 'PRP', 'RP', 'IN', 'DT', ':', 'IN', 'DT', 'NN', 'NN', '.'], POS Tag predicted: ['UH', '_', 'EX', 'VBZ', 'DT', 'JJ', 'NN', ',', 'WDT', 'PRP', 'VBP', 'IN', ',', 'CC', 'DT', 'NN', 'VBZ', 'DT', 'JJ', 'JJ', 'NN', ',', 'CC', 'PRP', 'VBP', 'PRP', 'RP', 'IN', 'DT', ':', 'IN', 'DT', 'NN', 'NN', '.']
Sentence ID: GUM_conversation_blacksmithing-44, Words: ['You', 'know', '?'], POS Tag true : ['PRP', 'VBP', '.'], POS Tag predicted: ['PRP', 'VBP', '.']
Sentence ID: GUM_conversation_blacksmithing-45, Words: ['And', 'then', 'there

 67%|██████▋   | 1348/2000 [00:44<00:10, 60.05it/s]

Sentence ID: GUM_conversation_blacksmithing-58, Words: ['You', 'know', 'then', ',', 'they', 'have', 'to', ',', 'like', ',', 'keep', 'em', ',', 'away', 'from', 'anything', ',', 'you', 'know', ',', 'get', 'em', 'really', 'in', 'the', 'soft', 'ground', ',', 'and', ',', 'no', 'hard', 'pebbles', ',', 'or', 'hard', 'clods', 'of', 'dirt', 'or', 'anything', '?'], POS Tag true : ['PRP', 'VBP', 'RB', ',', 'PRP', 'VBP', 'TO', ',', 'UH', ',', 'VB', 'PRP', ',', 'RB', 'IN', 'NN', ',', 'PRP', 'VBP', ',', 'VB', 'PRP', 'RB', 'IN', 'DT', 'JJ', 'NN', ',', 'CC', ',', 'DT', 'JJ', 'NNS', ',', 'CC', 'JJ', 'NNS', 'IN', 'NN', 'CC', 'NN', '.'], POS Tag predicted: ['PRP', 'VBP', 'RB', ',', 'PRP', 'VBP', 'TO', ',', 'UH', ',', 'VB', 'PRP', ',', 'RB', 'IN', 'NN', ',', 'PRP', 'VBP', ',', 'VB', 'PRP', 'RB', 'IN', 'DT', 'JJ', 'NN', ',', 'CC', ',', 'DT', 'JJ', 'NNS', ',', 'CC', 'JJ', 'NNS', 'IN', 'NN', 'CC', 'NN', '.']
Sentence ID: GUM_conversation_blacksmithing-59, Words: ['So', ',', 'I', "don't", 'do', "n't", 'know',

 68%|██████▊   | 1362/2000 [00:44<00:11, 57.01it/s]

Sentence ID: GUM_conversation_blacksmithing-7, Words: ["We're", 'We', "'re", 'not', 'gonna', 'gon', 'na', 'do', 'the', 'feet', 'today', ',', "I'm", 'I', "'m", 'gonna', 'gon', 'na', 'wait', 'till', 'like', ',', 'early', 'in', 'the', 'morning', ',', 'to', 'do', 'those', ',', 'cause', 'y-', 'I', 'mean', 'you', 'get', 'so', 'tired', '.'], POS Tag true : ['_', 'PRP', 'VBP', 'RB', '_', 'VBG', 'TO', 'VB', 'DT', 'NNS', 'NN', ',', '_', 'PRP', 'VBP', '_', 'VBG', 'TO', 'VB', 'IN', 'UH', ',', 'JJ', 'IN', 'DT', 'NN', ',', 'TO', 'VB', 'DT', ',', 'IN', 'UH', 'PRP', 'VBP', 'PRP', 'VBP', 'RB', 'JJ', '.'], POS Tag predicted: ['_', 'PRP', 'VBP', 'RB', '_', 'VBG', 'TO', 'VB', 'DT', 'NNS', 'NN', ',', '_', 'PRP', 'VBP', '_', 'VBG', 'TO', 'VB', 'IN', 'UH', ',', 'JJ', 'IN', 'DT', 'NN', ',', 'TO', 'VB', 'DT', ',', 'IN', 'UH', 'PRP', 'VBP', 'PRP', 'VBP', 'RB', 'JJ', '.']
Sentence ID: GUM_conversation_blacksmithing-70, Words: ['And', "you'd", 'you', "'d", 'stick', 'it', 'into', 'the', ',', 'into', 'the', ',', 'y

 69%|██████▉   | 1378/2000 [00:44<00:09, 65.89it/s]

Sentence ID: GUM_conversation_blacksmithing-83, Words: ['And', 'the', 'm-', '—', 'the', 'reason', 'they', 'were', 'showing', 'us', 'this', 'at', 'college', ',', 'was', 'just', ',', 'to', 'get', 'us', ',', 'to', 'know', 'if', 'our', 'trimmer', ',', 'and', 'shoer', 'was', 'doing', 'it', 'right', ',', 'and', '—', 'plus', 'the', 'knowledge', 'of', 'knowing', 'the', 'bones', 'and', 'ligaments', '.'], POS Tag true : ['CC', 'DT', 'UH', ':', 'DT', 'NN', 'PRP', 'VBD', 'VBG', 'PRP', 'DT', 'IN', 'NN', ',', 'VBD', 'RB', ',', 'TO', 'VB', 'PRP', ',', 'TO', 'VB', 'IN', 'PRP$', 'NN', ',', 'CC', 'NN', 'VBD', 'VBG', 'PRP', 'RB', ',', 'CC', ':', 'CC', 'DT', 'NN', 'IN', 'VBG', 'DT', 'NNS', 'CC', 'NNS', '.'], POS Tag predicted: ['CC', 'DT', 'UH', ':', 'DT', 'NN', 'PRP', 'VBD', 'VBG', 'PRP', 'DT', 'IN', 'NN', ',', 'VBD', 'RB', ',', 'TO', 'VB', 'PRP', ',', 'TO', 'VB', 'IN', 'PRP$', 'NN', ',', 'CC', 'NN', 'VBD', 'VBG', 'PRP', 'RB', ',', 'CC', ':', 'CC', 'DT', 'NN', 'IN', 'VBG', 'DT', 'NNS', 'CC', 'NNS', '.']


 70%|███████   | 1409/2000 [00:44<00:05, 104.01it/s]

Sentence ID: GUM_conversation_blacksmithing-99, Words: ['This', 'is', ',', 'you', 'know', '.'], POS Tag true : ['DT', 'VBZ', ',', 'PRP', 'VBP', '.'], POS Tag predicted: ['DT', 'VBZ', ',', 'PRP', 'VBP', '.']
Sentence ID: GUM_conversation_christmas-1, Words: ["That's", 'That', "'s", 'to', 'Judy', '.'], POS Tag true : ['_', 'DT', 'VBZ', 'IN', 'NNP', '.'], POS Tag predicted: ['_', 'DT', 'VBZ', 'IN', 'NNP', '.']
Sentence ID: GUM_conversation_christmas-10, Words: ['Mhm', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-100, Words: ['If', 'he', "doesn't", 'does', "n't", '—'], POS Tag true : ['IN', 'PRP', '_', 'VBZ', 'RB', ':'], POS Tag predicted: ['IN', 'PRP', '_', 'VBZ', 'RB', ':']
Sentence ID: GUM_conversation_christmas-101, Words: ["I'll", 'I', "'ll", '—'], POS Tag true : ['_', 'PRP', 'MD', ':'], POS Tag predicted: ['_', 'PRP', 'MD', ':']
Sentence ID: GUM_conversation_christmas-102, Words: ['I', 'will', '.'], POS Tag true : ['PRP', 'M

 72%|███████▏  | 1443/2000 [00:45<00:04, 128.81it/s]

Sentence ID: GUM_conversation_christmas-129, Words: ['Oh', "that's", 'that', "'s", '—'], POS Tag true : ['UH', '_', 'DT', 'VBZ', ':'], POS Tag predicted: ['UH', '_', 'WDT', 'VBZ', ':']
Sentence ID: GUM_conversation_christmas-13, Words: ['Oh', 'no', ',', 'I', "don't", 'do', "n't", 'have', 'this', 'one', '.'], POS Tag true : ['UH', 'UH', ',', 'PRP', '_', 'VBP', 'RB', 'VB', 'DT', 'NN', '.'], POS Tag predicted: ['UH', 'UH', ',', 'PRP', '_', 'VBP', 'RB', 'VB', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_christmas-130, Words: ['Well', 'thanks', 'for', 'this', '.'], POS Tag true : ['UH', 'NNS', 'IN', 'DT', '.'], POS Tag predicted: ['UH', 'NNS', 'IN', 'DT', '.']
Sentence ID: GUM_conversation_christmas-131, Words: ['This', 'is', '—'], POS Tag true : ['DT', 'VBZ', ':'], POS Tag predicted: ['DT', 'VBZ', ':']
Sentence ID: GUM_conversation_christmas-132, Words: ['Oh', ',', 'you', 'needed', 'that', ',', 'huh', '?'], POS Tag true : ['UH', ',', 'PRP', 'VBD', 'DT', ',', 'UH', '.'], POS Tag predicted

 74%|███████▍  | 1476/2000 [00:45<00:03, 145.38it/s]

Sentence ID: GUM_conversation_christmas-162, Words: ['Well', 'Dad', 'always', 'picks', '.'], POS Tag true : ['UH', 'NN', 'RB', 'VBZ', '.'], POS Tag predicted: ['UH', 'NN', 'RB', 'VBZ', '.']
Sentence ID: GUM_conversation_christmas-163, Words: ['I', 'get', 'a', 'little', 'picky', 'on', 'my', 'shirts', '.'], POS Tag true : ['PRP', 'VBP', 'DT', 'RB', 'JJ', 'IN', 'PRP$', 'NNS', '.'], POS Tag predicted: ['PRP', 'VBP', 'DT', 'JJ', 'JJ', 'IN', 'PRP$', 'NNS', '.']
Sentence ID: GUM_conversation_christmas-164, Words: ['Yeah', ',', 'I', 'know', '.'], POS Tag true : ['UH', ',', 'PRP', 'VBP', '.'], POS Tag predicted: ['UH', ',', 'PRP', 'VBP', '.']
Sentence ID: GUM_conversation_christmas-165, Words: ['People', 'decide', 'to', '—'], POS Tag true : ['NNS', 'VBP', 'TO', ':'], POS Tag predicted: ['NNS', 'VBP', 'TO', ':']
Sentence ID: GUM_conversation_christmas-166, Words: ['If', "it's", 'it', "'s", 'too', 'small', ',', 'Mom', 'can', 'take', 'it', '.'], POS Tag true : ['IN', '_', 'PRP', 'VBZ', 'RB', 'JJ',

 75%|███████▌  | 1507/2000 [00:45<00:03, 142.03it/s]

Sentence ID: GUM_conversation_christmas-193, Words: ['Got', 'a', 'good', 'photo', '.'], POS Tag true : ['VBD', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['VBD', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_christmas-194, Words: ['Alright', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-195, Words: ['Okay', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-196, Words: ['Are', 'all', 'the', 'rest', 'of', 'these', 'from', 'Diana', '?'], POS Tag true : ['VBP', 'PDT', 'DT', 'NN', 'IN', 'DT', 'IN', 'NNP', '.'], POS Tag predicted: ['VBP', 'PDT', 'DT', 'NN', 'IN', 'DT', 'IN', 'NNP', '.']
Sentence ID: GUM_conversation_christmas-197, Words: ['Uh', ',', 'to', 'Diana', ',', 'and', 'from', '—', 'from', 'Diana', '.'], POS Tag true : ['UH', ',', 'IN', 'NNP', ',', 'CC', 'IN', ':', 'IN', 'NNP', '.'], POS Tag predicted: ['UH', ',', 'IN', 'NNP', ',', 'CC', 'IN', ':', 'IN', 'NNP', '.']

 77%|███████▋  | 1540/2000 [00:45<00:03, 145.62it/s]

Sentence ID: GUM_conversation_christmas-26, Words: ['Oh', 'I', 'got', 'lot', 'of', 'these', 'presents', ',', 'you', 'know', ',', 'just', 'along', 'the', 'way', '.'], POS Tag true : ['UH', 'PRP', 'VBD', 'NN', 'IN', 'DT', 'NNS', ',', 'PRP', 'VBP', ',', 'RB', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['UH', 'PRP', 'VBD', 'NN', 'IN', 'DT', 'NNS', ',', 'PRP', 'VBP', ',', 'RB', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_christmas-27, Words: ['Yeah', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-28, Words: ["That's", 'That', "'s", '—', 'on', 'the', 'way', '.'], POS Tag true : ['_', 'DT', 'VBZ', ':', 'IN', 'DT', 'NN', '.'], POS Tag predicted: ['_', 'DT', 'VBZ', ':', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_christmas-29, Words: ['Cause', 'I', "don't", 'do', "n't", 'wait', 'till', 'Christmas', 'to', 'buy', 'everything', '.'], POS Tag true : ['IN', 'PRP', '_', 'VBP', 'RB', 'VB', 'IN', 'NNP', 'TO', 'VB', 'NN', '.'], 

 79%|███████▊  | 1573/2000 [00:46<00:02, 145.88it/s]

Sentence ID: GUM_conversation_christmas-57, Words: ['That', 'red', 'one', '.'], POS Tag true : ['DT', 'JJ', 'NN', '.'], POS Tag predicted: ['DT', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_christmas-58, Words: ['Oh', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-59, Words: ['Yeah', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-6, Words: ['To', 'a', 'museum', '.'], POS Tag true : ['IN', 'DT', 'NN', '.'], POS Tag predicted: ['IN', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_christmas-60, Words: ['Oh', 'Dad', ',', 'from', 'Judy', '.'], POS Tag true : ['UH', 'NN', ',', 'IN', 'NNP', '.'], POS Tag predicted: ['UH', 'NN', ',', 'IN', 'NNP', '.']
Sentence ID: GUM_conversation_christmas-61, Words: ['Oh', 'wow', '.'], POS Tag true : ['UH', 'UH', '.'], POS Tag predicted: ['UH', 'UH', '.']
Sentence ID: GUM_conversation_christmas-62, Words: ['Oh', ',', 'alright', '.'], POS Tag

 80%|████████  | 1606/2000 [00:46<00:03, 125.53it/s]

Sentence ID: GUM_conversation_christmas-87, Words: ["You'd", 'You', "'d", 'better', 'wear', 'it', 'too', '.'], POS Tag true : ['_', 'PRP', 'VBD', 'RBR', 'VB', 'PRP', 'RB', '.'], POS Tag predicted: ['_', 'PRP', 'MD', 'RBR', 'VB', 'PRP', 'RB', '.']
Sentence ID: GUM_conversation_christmas-88, Words: ['Uh-oh', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-89, Words: ["You'd", 'You', "'d", 'better', 'wear', 'it', '.'], POS Tag true : ['_', 'PRP', 'VBD', 'RBR', 'VB', 'PRP', '.'], POS Tag predicted: ['_', 'PRP', 'MD', 'RBR', 'VB', 'PRP', '.']
Sentence ID: GUM_conversation_christmas-9, Words: ['Back', 'here', 'it', 'tells', 'you', '.'], POS Tag true : ['RB', 'RB', 'PRP', 'VBZ', 'PRP', '.'], POS Tag predicted: ['RB', 'RB', 'PRP', 'VBZ', 'PRP', '.']
Sentence ID: GUM_conversation_christmas-90, Words: ['Gosh', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_christmas-91, Words: ['Hmm', '?'], P

 81%|████████  | 1620/2000 [00:46<00:03, 114.81it/s]

Sentence ID: GUM_conversation_court-11, Words: ['You', 'are', '?'], POS Tag true : ['PRP', 'VBP', '.'], POS Tag predicted: ['PRP', 'VBP', '.']
Sentence ID: GUM_conversation_court-12, Words: ['Nice', 'pen', '.'], POS Tag true : ['JJ', 'NN', '.'], POS Tag predicted: ['JJ', 'NN', '.']
Sentence ID: GUM_conversation_court-13, Words: ['Alright', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_court-14, Words: ['Okay', ',', "let's", 'let', "'s", 'see', ',', "who's", 'who', "'s", 'here', 'now', '.'], POS Tag true : ['UH', ',', '_', 'VB', 'PRP', 'VB', ',', '_', 'WP', 'VBZ', 'RB', 'RB', '.'], POS Tag predicted: ['UH', ',', '_', 'VB', 'PRP', 'VBP', ',', '_', 'WP', 'VBZ', 'RB', 'RB', '.']
Sentence ID: GUM_conversation_court-15, Words: ['Mr.', 'Roberts', '?'], POS Tag true : ['NNP', 'NNP', '.'], POS Tag predicted: ['NNP', 'NNP', '.']
Sentence ID: GUM_conversation_court-16, Words: ['Right', 'here', '.'], POS Tag true : ['RB', 'RB', '.'], POS Tag predict

 82%|████████▏ | 1633/2000 [00:46<00:04, 85.97it/s] 

Sentence ID: GUM_conversation_court-26, Words: ['Um', ',', 'the', 'job', 'was', 'out', 'at', 'UCSB', ',', 'I', 'went', 'and', 'estimated', 'the', 'job', 'for', 'myself', ',', 'to', 'see', 'if', 'I', 'could', 'take', 'the', 'job', ',', 'for', 'what', 'he', 'wanted', 'to', 'pay', 'for', 'it', ',', 'and', 'I', 'let', 'him', 'know', 'that', 'I', 'could', 'not', '.'], POS Tag true : ['UH', ',', 'DT', 'NN', 'VBD', 'RB', 'IN', 'NNP', ',', 'PRP', 'VBD', 'CC', 'VBD', 'DT', 'NN', 'IN', 'PRP', ',', 'TO', 'VB', 'IN', 'PRP', 'MD', 'VB', 'DT', 'NN', ',', 'IN', 'WP', 'PRP', 'VBD', 'TO', 'VB', 'IN', 'PRP', ',', 'CC', 'PRP', 'VBD', 'PRP', 'VB', 'IN', 'PRP', 'MD', 'RB', '.'], POS Tag predicted: ['UH', ',', 'DT', 'NN', 'VBD', 'RP', 'IN', 'NNP', ',', 'PRP', 'VBD', 'CC', 'VBD', 'DT', 'NN', 'IN', 'PRP', ',', 'TO', 'VB', 'IN', 'PRP', 'MD', 'VB', 'DT', 'NN', ',', 'IN', 'WP', 'PRP', 'VBD', 'TO', 'VB', 'IN', 'PRP', ',', 'CC', 'PRP', 'VB', 'PRP', 'VBP', 'IN', 'PRP', 'MD', 'RB', '.']
Sentence ID: GUM_conversation

 82%|████████▏ | 1644/2000 [00:46<00:04, 81.73it/s]

Sentence ID: GUM_conversation_court-40, Words: ['Uh', ',', 'I', 'went', 'to', 'receive', 'my', 'check', ',', 'of', 'which', ',', 'we', 'had', 'agreed', 'that', 'he', 'would', 'deduct', 'the', 'amount', 'of', 'the', 'hourly', 'wage', ',', 'that', 'he', 'was', '—'], POS Tag true : ['UH', ',', 'PRP', 'VBD', 'TO', 'VB', 'PRP$', 'NN', ',', 'IN', 'WDT', ',', 'PRP', 'VBD', 'VBN', 'IN', 'PRP', 'MD', 'VB', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', 'WDT', 'PRP', 'VBD', ':'], POS Tag predicted: ['UH', ',', 'PRP', 'VBD', 'TO', 'VB', 'PRP$', 'NN', ',', 'IN', 'WDT', ',', 'PRP', 'VBD', 'VBN', 'IN', 'PRP', 'MD', 'VB', 'DT', 'NN', 'IN', 'DT', 'JJ', 'NN', ',', 'WDT', 'PRP', 'VBD', ':']
Sentence ID: GUM_conversation_court-41, Words: ['Was', 'this', 'agreement', 'in', 'writing', ',', 'or', 'verbal', '?'], POS Tag true : ['VBD', 'DT', 'NN', 'IN', 'NN', ',', 'CC', 'JJ', '.'], POS Tag predicted: ['VBD', 'DT', 'NN', 'IN', 'VBG', ',', 'CC', 'JJ', '.']
Sentence ID: GUM_conversation_court-42, Words: ['Completely'

 83%|████████▎ | 1664/2000 [00:47<00:04, 68.37it/s]

Sentence ID: GUM_conversation_court-48, Words: ['So', 'I', 'said', "that's", 'that', "'s", 'not', 'as', 'per', 'our', 'agreement', ',', 'he', 'said', 'yes', 'it', 'is', ',', 'he', 'handed', 'me', 'my', 'check', ',', 'rolled', 'up', 'his', 'window', ',', 'and', 'drove', 'off', '.'], POS Tag true : ['UH', 'PRP', 'VBD', '_', 'DT', 'VBZ', 'RB', 'IN', 'IN', 'PRP$', 'NN', ',', 'PRP', 'VBD', 'UH', 'PRP', 'VBZ', ',', 'PRP', 'VBD', 'PRP', 'PRP$', 'NN', ',', 'VBD', 'RP', 'PRP$', 'NN', ',', 'CC', 'VBD', 'RB', '.'], POS Tag predicted: ['UH', 'PRP', 'VBD', '_', 'WDT', 'VBZ', 'RB', 'RB', 'IN', 'PRP$', 'NN', ',', 'PRP', 'VBD', 'UH', 'PRP', 'VBZ', ',', 'PRP', 'VBD', 'PRP', 'PRP$', 'NN', ',', 'VBD', 'RP', 'PRP$', 'NN', ',', 'CC', 'VBD', 'RP', '.']
Sentence ID: GUM_conversation_court-49, Words: ['And', "he's", 'he', "'s", 'there', 'to', 'state', ',', "he's", 'he', "'s", '—', 'he', 'saw', 'that', ',', 'and', 'was', 'witness', 'to', 'that', '.'], POS Tag true : ['CC', '_', 'PRP', 'VBZ', 'RB', 'TO', 'NN', 

 84%|████████▎ | 1674/2000 [00:47<00:04, 72.58it/s]


Sentence ID: GUM_conversation_court-63, Words: ['Yes', 'sir', '.'], POS Tag true : ['UH', 'NN', '.'], POS Tag predicted: ['UH', 'NN', '.']
Sentence ID: GUM_conversation_court-64, Words: ["You're", 'You', "'re", 'uh', '—'], POS Tag true : ['_', 'PRP', 'VBP', 'UH', ':'], POS Tag predicted: ['_', 'PRP', 'VBP', 'UH', ':']
Sentence ID: GUM_conversation_court-65, Words: ["I'm", 'I', "'m", 'his', 'nephew', '.'], POS Tag true : ['_', 'PRP', 'VBP', 'PRP$', 'NN', '.'], POS Tag predicted: ['_', 'PRP', 'VBP', 'PRP$', 'NN', '.']
Sentence ID: GUM_conversation_court-66, Words: ["You're", 'You', "'re", 'his', 'nephew', '.'], POS Tag true : ['_', 'PRP', 'VBP', 'PRP$', 'NN', '.'], POS Tag predicted: ['_', 'PRP', 'VBP', 'PRP$', 'NN', '.']
Sentence ID: GUM_conversation_court-67, Words: ['And', "you're", 'you', "'re", 'Nick', 'Ro-', "Roberts'", 'Roberts', "'", 'nephew', 'too', 'then', '.'], POS Tag true : ['CC', '_', 'PRP', 'VBP', 'NNP', 'UH', '_', 'NNP', 'POS', 'NN', 'RB', 'RB', '.'], POS Tag predicted: 

 85%|████████▍ | 1691/2000 [00:47<00:04, 65.93it/s]

Sentence ID: GUM_conversation_court-78, Words: ["That's", 'That', "'s", 'the', 'reason', 'why', 'I', 'had', 'him', 'fill', 'out', 'that', 'portion', 'of', ',', 'or', 'he', 'wanted', 'to', 'write', 'those', 'checks', ',', 'was', 'so', 'I', 'would', 'save', 'that', 'money', ',', 'so', 'I', 'would', 'do', 'that', 'job', '.'], POS Tag true : ['_', 'DT', 'VBZ', 'DT', 'NN', 'WRB', 'PRP', 'VBD', 'PRP', 'VB', 'RP', 'DT', 'NN', 'IN', ',', 'CC', 'PRP', 'VBD', 'TO', 'VB', 'DT', 'NNS', ',', 'VBD', 'IN', 'PRP', 'MD', 'VB', 'DT', 'NN', ',', 'IN', 'PRP', 'MD', 'VB', 'DT', 'NN', '.'], POS Tag predicted: ['_', 'DT', 'VBZ', 'DT', 'NN', 'WRB', 'PRP', 'VBD', 'PRP', 'VB', 'RP', 'DT', 'NN', 'IN', ',', 'CC', 'PRP', 'VBD', 'TO', 'VB', 'DT', 'NNS', ',', 'VBD', 'RB', 'PRP', 'MD', 'VB', 'DT', 'NN', ',', 'RB', 'PRP', 'MD', 'VB', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_court-79, Words: ['Okay', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_court-8, Words: ['S

 85%|████████▍ | 1699/2000 [00:47<00:05, 50.73it/s]

Sentence ID: GUM_conversation_court-88, Words: ['Most', 'of', 'the', ',', 'uh', ',', 'contractors', 'here', 'in', 'town', ',', 'that', 'are', 'independents', 'like', 'Mitchell', ',', "don't", 'do', "n't", 'know', 'how', 'to', 'do', 'prevailing', 'wage', 'statements', '.'], POS Tag true : ['JJS', 'IN', 'DT', ',', 'UH', ',', 'NNS', 'RB', 'IN', 'NN', ',', 'WDT', 'VBP', 'NNS', 'IN', 'NNP', ',', '_', 'VBP', 'RB', 'VB', 'WRB', 'TO', 'VB', 'VBG', 'NN', 'NNS', '.'], POS Tag predicted: ['JJS', 'IN', 'DT', ',', 'UH', ',', 'NNS', 'RB', 'IN', 'NN', ',', 'WDT', 'VBP', 'NNS', 'IN', 'NNP', ',', '_', 'VBP', 'RB', 'VB', 'WRB', 'TO', 'VB', 'VBG', 'NN', 'NNS', '.']
Sentence ID: GUM_conversation_court-89, Words: ['The', 'college', 'is', 'a', 'state', '-', 'funded', 'uh', 'uh', 'remodel', ',', 'and', 'on', 'state', '-', 'funded', 'remodels', ',', "we're", 'we', "'re", 'required', 'to', 'pay', 'prevailing', 'wages', '.'], POS Tag true : ['DT', 'NN', 'VBZ', 'DT', 'NN', 'HYPH', 'VBN', 'UH', 'UH', 'NN', ',', '

 86%|████████▌ | 1715/2000 [00:48<00:04, 59.83it/s]

Sentence ID: GUM_conversation_court-94, Words: ['And', 'what', 'else', 'would', 'it', 'include', '?'], POS Tag true : ['CC', 'WP', 'RB', 'MD', 'PRP', 'VB', '.'], POS Tag predicted: ['CC', 'WP', 'RB', 'MD', 'PRP', 'VBP', '.']
Sentence ID: GUM_conversation_court-95, Words: ['Um', '—'], POS Tag true : ['UH', ':'], POS Tag predicted: ['UH', ':']
Sentence ID: GUM_conversation_court-96, Words: ['Sorta', 'like', ',', 'um', '—'], POS Tag true : ['RB', 'UH', ',', 'UH', ':'], POS Tag predicted: ['RB', 'UH', ',', 'UH', ':']
Sentence ID: GUM_conversation_court-97, Words: ["That's", 'That', "'s", 'anything', 'above', 'that', '.'], POS Tag true : ['_', 'DT', 'VBZ', 'NN', 'IN', 'DT', '.'], POS Tag predicted: ['_', 'DT', 'VBZ', 'NN', 'IN', 'DT', '.']
Sentence ID: GUM_conversation_court-98, Words: ['Well', 'you', 'have', '—', 'you', 'have', '—', 'you', 'have', 'that', '—', 'I', 'have', 'a', 'breakdown', 'here', ',', 'of', 'what', 'we', 'paid', "Mitchell's", 'Mitchell', "'s", 'men', ',', 'if', "you'd", 

 86%|████████▌ | 1722/2000 [00:48<00:05, 54.89it/s]

Sentence ID: GUM_conversation_erasmus-19, Words: ['And', 'he', 'wrote', 'to', 'Luther', '.'], POS Tag true : ['CC', 'PRP', 'VBD', 'IN', 'NNP', '.'], POS Tag predicted: ['CC', 'PRP', 'VBD', 'IN', 'NNP', '.']
Sentence ID: GUM_conversation_erasmus-2, Words: ['And', 'um', ',', 'when', 'you', 'come', 'then', ',', 'to', ',', 'uh', ',', 'however', 'this', 'debate', '.'], POS Tag true : ['CC', 'UH', ',', 'WRB', 'PRP', 'VBP', 'RB', ',', 'IN', ',', 'UH', ',', 'RB', 'DT', 'NN', '.'], POS Tag predicted: ['CC', 'UH', ',', 'WRB', 'PRP', 'VBP', 'RB', ',', 'TO', ',', 'UH', ',', 'RB', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_erasmus-20, Words: ['Perhaps', 'an', 'Erasmus', 'who', 'writes', 'against', 'you', ',', 'will', 'do', 'more', 'for', 'the', 'Gospel', ',', 'than', 'certain', 'dunderheads', 'who', 'support', 'you', '.'], POS Tag true : ['RB', 'DT', 'NNP', 'WP', 'VBZ', 'IN', 'PRP', ',', 'MD', 'VB', 'RBR', 'IN', 'DT', 'NNP', ',', 'IN', 'JJ', 'NNS', 'WP', 'VBP', 'PRP', '.'], POS Tag predicted: [

 86%|████████▋ | 1729/2000 [00:48<00:05, 51.33it/s]

Sentence ID: GUM_conversation_erasmus-28, Words: ['I', "don't", 'do', "n't", 'think', 'that', 'he', 'would', 'acknowledge', 'original', 'sin', '.'], POS Tag true : ['PRP', '_', 'VBP', 'RB', 'VB', 'IN', 'PRP', 'MD', 'VB', 'JJ', 'NN', '.'], POS Tag predicted: ['PRP', '_', 'VBP', 'RB', 'VB', 'IN', 'PRP', 'MD', 'VB', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_erasmus-29, Words: ['Is', 'based', 'uh', ',', 'alright', ',', 'what', 'is', 'it', ',', "it's", 'it', "'s", 'based', ',', 'as', 'it', 'is', ',', 'on', 'the', 'concept', ',', 'that', 'human', 'nature', 'is', 'totally', 'depraved', ',', 'and', 'of', 'itself', 'not', 'capable', 'of', 'any', 'good', 'will', '.'], POS Tag true : ['VBZ', 'VBN', 'UH', ',', 'UH', ',', 'WP', 'VBZ', 'PRP', ',', '_', 'PRP', 'VBZ', 'VBN', ',', 'IN', 'PRP', 'VBZ', ',', 'IN', 'DT', 'NN', ',', 'IN', 'JJ', 'NN', 'VBZ', 'RB', 'JJ', ',', 'CC', 'IN', 'PRP', 'RB', 'JJ', 'IN', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['VBZ', 'VBN', 'UH', ',', 'UH', ',', 'WP', 'VBZ', 

 87%|████████▋ | 1745/2000 [00:48<00:04, 58.03it/s]

Sentence ID: GUM_conversation_erasmus-33, Words: ['For', 'how', 'can', 'a', 'person', ',', 'be', 'responsible', 'for', 'his', 'deeds', ',', 'if', 'he', 'possesses', 'no', 'free', 'will', '?'], POS Tag true : ['IN', 'WRB', 'MD', 'DT', 'NN', ',', 'VB', 'JJ', 'IN', 'PRP$', 'NNS', ',', 'IN', 'PRP', 'VBZ', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['IN', 'WRB', 'MD', 'DT', 'NN', ',', 'VB', 'JJ', 'IN', 'PRP$', 'NNS', ',', 'IN', 'PRP', 'VBZ', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_erasmus-34, Words: ['This', 'is', 'what', 'Erasmus', 'asked', '.'], POS Tag true : ['DT', 'VBZ', 'WP', 'NNP', 'VBD', '.'], POS Tag predicted: ['DT', 'VBZ', 'WP', 'NNP', 'VBD', '.']
Sentence ID: GUM_conversation_erasmus-35, Words: ['How', 'can', 'he', 'decide', 'between', 'good', 'and', 'evil', '?'], POS Tag true : ['WRB', 'MD', 'PRP', 'VB', 'IN', 'NN', 'CC', 'JJ', '.'], POS Tag predicted: ['WRB', 'MD', 'PRP', 'VBP', 'IN', 'JJ', 'CC', 'JJ', '.']
Sentence ID: GUM_conversation_erasmus-36, Words: ['So', '

 88%|████████▊ | 1758/2000 [00:49<00:04, 50.07it/s]

Sentence ID: GUM_conversation_erasmus-49, Words: ['This', 'concept', ',', 'that', 'man', 'is', 'divinely', 'elected', 'to', 'salvation', ',', 'or', 'to', 'damnation', ',', 'is', 'the', 'center', 'of', 'the', 'predestination', 'dogma', ',', 'that', 'later', ',', 'the', 'Geneva', 'reformer', 'Calvin', ',', 'made', 'the', 'center', 'of', 'his', 'teaching', ',', 'and', 'that', 'subsequently', ',', 'under', 'other', 'historical', 'preconditions', 'and', 'circumstances', ',', 'could', 'be', 'linked', 'closely', 'with', 'a', 'prosperous', 'middle', 'class', ',', 'in', 'the', 'Netherlands', ',', 'and', 'in', 'England', '.'], POS Tag true : ['DT', 'NN', ',', 'IN', 'NN', 'VBZ', 'RB', 'VBN', 'IN', 'NN', ',', 'CC', 'IN', 'NN', ',', 'VBZ', 'DT', 'NN', 'IN', 'DT', 'NN', 'NN', ',', 'IN', 'RBR', ',', 'DT', 'NNP', 'NN', 'NNP', ',', 'VBD', 'DT', 'NN', 'IN', 'PRP$', 'NN', ',', 'CC', 'IN', 'RB', ',', 'IN', 'JJ', 'JJ', 'NNS', 'CC', 'NNS', ',', 'MD', 'VB', 'VBN', 'RB', 'IN', 'DT', 'JJ', 'JJ', 'NN', ',', 'IN

 88%|████████▊ | 1770/2000 [00:49<00:04, 52.50it/s]

Sentence ID: GUM_conversation_erasmus-6, Words: ['This', 'is', 'in', 'the', 'Luther', 'book', 'some', 'of', 'you', 'are', 'reading', ',', 'and', 'um', ',', 'if', 'you', ',', 'this', 'evening', 'when', 'you', 'go', 'home', ',', 'if', 'you', 'wanna', 'wan', 'na', 'meditate', 'it', 'on', 'more', ',', 'on', '–', 'on', 'it', 'more', ',', "it's", 'it', "'s", 'on', 'page', 'three', 'eleven', '.'], POS Tag true : ['DT', 'VBZ', 'IN', 'DT', 'NNP', 'NN', 'DT', 'IN', 'PRP', 'VBP', 'VBG', ',', 'CC', 'UH', ',', 'IN', 'PRP', ',', 'DT', 'NN', 'WRB', 'PRP', 'VBP', 'RB', ',', 'IN', 'PRP', '_', 'VBP', 'TO', 'VB', 'PRP', 'IN', 'RBR', ',', 'IN', ':', 'IN', 'PRP', 'RBR', ',', '_', 'PRP', 'VBZ', 'IN', 'NN', 'CD', 'CD', '.'], POS Tag predicted: ['DT', 'VBZ', 'IN', 'DT', 'NNP', 'NN', 'NN', 'IN', 'PRP', 'VBP', 'VBG', ',', 'CC', 'UH', ',', 'IN', 'PRP', ',', 'DT', 'NN', 'WRB', 'PRP', 'VBP', 'RB', ',', 'IN', 'PRP', '_', 'VBP', 'TO', 'VB', 'PRP', 'IN', 'RBR', ',', 'IN', ':', 'IN', 'PRP', 'RBR', ',', '_', 'PRP', 'VB

 89%|████████▉ | 1776/2000 [00:49<00:05, 44.37it/s]

Sentence ID: GUM_conversation_erasmus-69, Words: ['Which', 'seem', 'to', 'teach', ',', 'that', 'man', 'is', 'responsible', 'for', 'his', 'deeds', ',', 'and', 'that', 'he', 'may', 'act', ',', 'and', 'has', 'a', 'free', 'will', 'to', 'respond', 'to', 'the', 'invitation', 'of', 'God', '.'], POS Tag true : ['WDT', 'VBP', 'TO', 'VB', ',', 'IN', 'NN', 'VBZ', 'JJ', 'IN', 'PRP$', 'NNS', ',', 'CC', 'IN', 'PRP', 'MD', 'VB', ',', 'CC', 'VBZ', 'DT', 'JJ', 'NN', 'TO', 'VB', 'IN', 'DT', 'NN', 'IN', 'NNP', '.'], POS Tag predicted: ['WDT', 'VBP', 'TO', 'VB', ',', 'DT', 'NN', 'VBZ', 'JJ', 'IN', 'PRP$', 'NNS', ',', 'CC', 'IN', 'PRP', 'MD', 'VB', ',', 'CC', 'VBZ', 'DT', 'JJ', 'NN', 'TO', 'VB', 'IN', 'DT', 'NN', 'IN', 'NNP', '.']
Sentence ID: GUM_conversation_erasmus-7, Words: ["It's", 'It', "'s", 'on', 'page', 'three', 'eleven', '.'], POS Tag true : ['_', 'PRP', 'VBZ', 'IN', 'NN', 'CD', 'CD', '.'], POS Tag predicted: ['_', 'PRP', 'VBZ', 'IN', 'NN', 'CD', 'CD', '.']
Sentence ID: GUM_conversation_erasmus-7

 89%|████████▉ | 1789/2000 [00:49<00:04, 44.89it/s]

Sentence ID: GUM_conversation_erasmus-8, Words: ['But', ',', 'let', 'me', 'just', 'read', 'you', 'the', '–', ',', 'cause', 'this', 'gives', 'us', 'the', 'setting', 'very', 'nicely', ',', 'and', 'then', 'we', 'can', 'uh', ',', 'Erasmus', 'entitled', 'his', 'anti-Luther', 'pamphlet', ',', 'Diatribe', 'Concerning', 'Free', 'Will', '.'], POS Tag true : ['CC', ',', 'VB', 'PRP', 'RB', 'VB', 'PRP', 'DT', ':', ',', 'IN', 'DT', 'VBZ', 'PRP', 'DT', 'NN', 'RB', 'RB', ',', 'CC', 'RB', 'PRP', 'MD', 'UH', ',', 'NNP', 'VBD', 'PRP$', 'JJ', 'NN', ',', 'NNP', 'NNP', 'NNP', 'NNP', '.'], POS Tag predicted: ['CC', ',', 'VB', 'PRP', 'RB', 'VB', 'PRP', 'DT', ':', ',', 'IN', 'DT', 'VBZ', 'PRP', 'DT', 'NN', 'RB', 'RB', ',', 'CC', 'RB', 'PRP', 'MD', 'UH', ',', 'NNP', 'VBD', 'PRP$', 'JJ', 'NN', ',', 'NNP', 'NNP', 'NNP', 'NNP', '.']
Sentence ID: GUM_conversation_erasmus-80, Words: ['We', 'have', 'clear', 'passages', 'of', 'Scripture', ',', 'which', 'seem', 'to', 'indicate', 'that', 'man', 'has', 'a', 'free', 'wil

 90%|█████████ | 1810/2000 [00:49<00:02, 69.17it/s]

Sentence ID: GUM_conversation_family-105, Words: ['So', 'what', 'about', 'you', ',', 'Sherry', ',', 'are', 'you', 'gonna', 'gon', 'na', 'put', 'lemon', 'in', 'your', 'hot', 'tea', '?'], POS Tag true : ['UH', 'WP', 'IN', 'PRP', ',', 'NNP', ',', 'VBP', 'PRP', '_', 'VBG', 'TO', 'VB', 'NN', 'IN', 'PRP$', 'JJ', 'NN', '.'], POS Tag predicted: ['UH', 'WP', 'IN', 'PRP', ',', 'NNP', ',', 'VBP', 'PRP', '_', 'VBG', 'TO', 'VB', 'NN', 'IN', 'PRP$', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_family-106, Words: ['I', "don't", 'do', "n't", 'put', 'lemon', 'in', 'my', 'hot', 'tea', ','], POS Tag true : ['PRP', '_', 'VBP', 'RB', 'VB', 'NN', 'IN', 'PRP$', 'JJ', 'NN', ','], POS Tag predicted: ['PRP', '_', 'VBP', 'RB', 'VB', 'NN', 'IN', 'PRP$', 'JJ', 'NN', ',']
Sentence ID: GUM_conversation_family-107, Words: ['You', 'ever', 'do', '?'], POS Tag true : ['PRP', 'RB', 'VBP', '.'], POS Tag predicted: ['PRP', 'RB', 'VB', '.']
Sentence ID: GUM_conversation_family-108, Words: ['I', 'only', 'do', 'when', 'I', 

 92%|█████████▏| 1835/2000 [00:50<00:01, 91.19it/s]

Sentence ID: GUM_conversation_family-128, Words: ['That', 'helped', 'a', 'lot', ',', "didn't", 'did', "n't", 'it', '.'], POS Tag true : ['DT', 'VBD', 'DT', 'NN', ',', '_', 'VBD', 'RB', 'PRP', '.'], POS Tag predicted: ['DT', 'VBD', 'DT', 'NN', ',', '_', 'VBD', 'RB', 'PRP', '.']
Sentence ID: GUM_conversation_family-129, Words: ['Oh', ',', 'Martha', 'Jean', ',', 'yeah', '.'], POS Tag true : ['UH', ',', 'NNP', 'NNP', ',', 'UH', '.'], POS Tag predicted: ['UH', ',', 'NNP', 'NNP', ',', 'UH', '.']
Sentence ID: GUM_conversation_family-13, Words: ['She', 'could', '–'], POS Tag true : ['PRP', 'MD', ':'], POS Tag predicted: ['PRP', 'MD', ':']
Sentence ID: GUM_conversation_family-130, Words: ['And', 'what', '?'], POS Tag true : ['CC', 'WP', '.'], POS Tag predicted: ['CC', 'WP', '.']
Sentence ID: GUM_conversation_family-131, Words: ['Well', ',', 'Carolyn', 'was', '–'], POS Tag true : ['UH', ',', 'NNP', 'VBD', ':'], POS Tag predicted: ['UH', ',', 'NNP', 'VBD', ':']
Sentence ID: GUM_conversation_famil

 93%|█████████▎| 1860/2000 [00:50<00:01, 106.30it/s]

Sentence ID: GUM_conversation_family-147, Words: ['Hunh', '?'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_family-148, Words: ['You', 'know', 'boys', 'are', 'slow', '?'], POS Tag true : ['PRP', 'VBP', 'NNS', 'VBP', 'JJ', '.'], POS Tag predicted: ['PRP', 'VBP', 'NNS', 'VBP', 'JJ', '.']
Sentence ID: GUM_conversation_family-149, Words: ['Yeah', 'I', 'know', '.'], POS Tag true : ['UH', 'PRP', 'VBP', '.'], POS Tag predicted: ['UH', 'PRP', 'VBP', '.']
Sentence ID: GUM_conversation_family-15, Words: ['M-mm', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_family-150, Words: ['That', 'said', 'that', ',', "that's", 'that', "'s", 'not', 'potty', 'training', ',', "that's", 'that', "'s", 'mother', 'training', '.'], POS Tag true : ['DT', 'VBN', 'DT', ',', '_', 'DT', 'VBZ', 'RB', 'NN', 'NN', ',', '_', 'DT', 'VBZ', 'NN', 'NN', '.'], POS Tag predicted: ['DT', 'VBN', 'IN', ',', '_', 'WDT', 'VBZ', 'RB', 'NN', 'N

 94%|█████████▎| 1871/2000 [00:50<00:01, 102.41it/s]

Sentence ID: GUM_conversation_family-170, Words: ['I', '–', 'for', 'some', 'reason', '–'], POS Tag true : ['PRP', ':', 'IN', 'DT', 'NN', ':'], POS Tag predicted: ['PRP', ':', 'IN', 'DT', 'NN', ':']
Sentence ID: GUM_conversation_family-171, Words: ['She', 'said', 'thanks', 'a', 'lot', ',', 'you', 'know', ',', 'because', 'she', 'was', 'so', 'worried', 'about', 'Jonathan', '.'], POS Tag true : ['PRP', 'VBD', 'NNS', 'DT', 'NN', ',', 'PRP', 'VBP', ',', 'IN', 'PRP', 'VBD', 'RB', 'JJ', 'IN', 'NNP', '.'], POS Tag predicted: ['PRP', 'VBD', 'NNS', 'DT', 'NN', ',', 'PRP', 'VBP', ',', 'IN', 'PRP', 'VBD', 'RB', 'JJ', 'IN', 'NNP', '.']
Sentence ID: GUM_conversation_family-172, Words: ['Oh', 'sh-', 'like', 'oh', ',', "he's", 'he', "'s", 'gonna', 'gon', 'na', 'go', 'back', 'again', 'in', 'other', 'words', '.'], POS Tag true : ['UH', 'UH', 'UH', 'UH', ',', '_', 'PRP', 'VBZ', '_', 'VBG', 'TO', 'VB', 'RB', 'RB', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['UH', 'UH', 'UH', 'UH', ',', '_', 'PRP', 'VBZ', 

 95%|█████████▍| 1895/2000 [00:50<00:01, 99.30it/s]

Sentence ID: GUM_conversation_family-184, Words: ['So', 'then', 'I', 'said', ',', '"', 'but', 'look', 'at', 'Barb', ',', "she's", 'she', "'s", 'healthy', 'now', '"', ',', 'and', 'Carolyn', 'looked', 'at', 'her', ',', 'and', 'sort', 'of', 'looked', 'away', ',', 'and', 'I', 'thought', ',', 'oh', 'boy', '.'], POS Tag true : ['UH', 'RB', 'PRP', 'VBD', ',', '``', 'CC', 'VB', 'IN', 'NNP', ',', '_', 'PRP', 'VBZ', 'JJ', 'RB', "''", ',', 'CC', 'NNP', 'VBD', 'IN', 'PRP', ',', 'CC', 'NN', 'IN', 'VBD', 'RB', ',', 'CC', 'PRP', 'VBD', ',', 'UH', 'UH', '.'], POS Tag predicted: ['RB', 'RB', 'PRP', 'VBD', ',', '``', 'CC', 'VB', 'IN', 'NNP', ',', '_', 'PRP', 'VBZ', 'JJ', 'RB', "''", ',', 'CC', 'NNP', 'VBD', 'IN', 'PRP', ',', 'CC', 'NN', 'IN', 'VBD', 'RB', ',', 'CC', 'PRP', 'VBD', ',', 'UH', 'UH', '.']
Sentence ID: GUM_conversation_family-185, Words: ['Rude', '.'], POS Tag true : ['JJ', '.'], POS Tag predicted: ['JJ', '.']
Sentence ID: GUM_conversation_family-186, Words: ['Way', 'to', 'go', 'Carolyn', '.

 96%|█████████▌| 1921/2000 [00:51<00:00, 94.48it/s] 

Sentence ID: GUM_conversation_family-4, Words: ['Have', 'they', 'been', 'married', 'a', 'long', 'time', '?'], POS Tag true : ['VBP', 'PRP', 'VBN', 'JJ', 'DT', 'JJ', 'NN', '.'], POS Tag predicted: ['VBP', 'PRP', 'VBN', 'VBN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_family-40, Words: ['And', 'stuff', '.'], POS Tag true : ['CC', 'NN', '.'], POS Tag predicted: ['CC', 'NN', '.']
Sentence ID: GUM_conversation_family-41, Words: ['I', "don't", 'do', "n't", 'know', 'what', "he's", 'he', "'s", 'doing', 'today', '.'], POS Tag true : ['PRP', '_', 'VBP', 'RB', 'VB', 'WP', '_', 'PRP', 'VBZ', 'VBG', 'NN', '.'], POS Tag predicted: ['PRP', '_', 'VBP', 'RB', 'VB', 'WP', '_', 'PRP', 'VBZ', 'VBG', 'NN', '.']
Sentence ID: GUM_conversation_family-42, Words: ['He', 'was', 'supposed', 'to', 'start', 'baling', 'hay', ',', 'but', 'I', 'think', "they're", 'they', "'re", 'gonna', 'gon', 'na', 'let', 'it', 'sit', 'another', 'day', ',', 'cause', 'he', "didn't", 'did', "n't", 'take', 'his', 'lunch', '.'

 97%|█████████▋| 1932/2000 [00:51<00:00, 95.09it/s]

Sentence ID: GUM_conversation_family-55, Words: ['I', 'see', '.'], POS Tag true : ['PRP', 'VBP', '.'], POS Tag predicted: ['PRP', 'VBP', '.']
Sentence ID: GUM_conversation_family-56, Words: ['Yeah', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_family-57, Words: ['Okay', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_family-58, Words: ['If', 'he', "didn't", 'did', "n't", 'take', 'his', 'lunch', 'every', 'day', ',', 'would', 'she', 'feed', 'him', 'every', 'day', '?'], POS Tag true : ['IN', 'PRP', '_', 'VBD', 'RB', 'VB', 'PRP$', 'NN', 'DT', 'NN', ',', 'MD', 'PRP', 'VB', 'PRP', 'DT', 'NN', '.'], POS Tag predicted: ['IN', 'PRP', '_', 'VBD', 'RB', 'VB', 'PRP$', 'NN', 'DT', 'NN', ',', 'MD', 'PRP', 'VB', 'PRP', 'DT', 'NN', '.']
Sentence ID: GUM_conversation_family-59, Words: ['Yeah', ',', 'she', 'does', '.'], POS Tag true : ['UH', ',', 'PRP', 'VBZ', '.'], POS Tag predicted: ['UH', ',', 'PRP', 'VBZ

 98%|█████████▊| 1952/2000 [00:51<00:00, 87.97it/s]

Sentence ID: GUM_conversation_family-70, Words: ['Cause', "that's", 'that', "'s", 'what', 'she', 'does', 'with', 'other', 'people', '.'], POS Tag true : ['IN', '_', 'DT', 'VBZ', 'WP', 'PRP', 'VBZ', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['IN', '_', 'WDT', 'VBZ', 'WP', 'PRP', 'VBZ', 'IN', 'JJ', 'NNS', '.']
Sentence ID: GUM_conversation_family-71, Words: ['Mm', '.'], POS Tag true : ['UH', '.'], POS Tag predicted: ['UH', '.']
Sentence ID: GUM_conversation_family-72, Words: ['But', 'all', 'winter', 'she', 'fixes', 'him', 'lunch', '.'], POS Tag true : ['CC', 'DT', 'NN', 'PRP', 'VBZ', 'PRP', 'NN', '.'], POS Tag predicted: ['CC', 'DT', 'NN', 'PRP', 'VBZ', 'PRP', 'NN', '.']
Sentence ID: GUM_conversation_family-73, Words: ['Oh', ',', 'cause', "they're", 'they', "'re", 'always', 'close', 'enough', 'to', '–'], POS Tag true : ['UH', ',', 'IN', '_', 'PRP', 'VBP', 'RB', 'RB', 'RB', 'TO', ':'], POS Tag predicted: ['UH', ',', 'IN', '_', 'PRP', 'VBP', 'RB', 'RB', 'RB', 'TO', ':']
Sentence ID: GUM_

 99%|█████████▉| 1975/2000 [00:51<00:00, 97.21it/s]

Sentence ID: GUM_conversation_family-88, Words: ['I', "don't", 'do', "n't", 'even', 'like', 'ice', 'tea', '.'], POS Tag true : ['PRP', '_', 'VBP', 'RB', 'RB', 'VB', 'NN', 'NN', '.'], POS Tag predicted: ['PRP', '_', 'VBP', 'RB', 'RB', 'JJ', 'NN', 'NN', '.']
Sentence ID: GUM_conversation_family-89, Words: ['Do', 'you', 'like', 'hot', 'tea', '?'], POS Tag true : ['VBP', 'PRP', 'VB', 'JJ', 'NN', '.'], POS Tag predicted: ['VB', 'PRP', 'VBP', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_family-9, Words: ['As', 'long', 'as', 'she', "didn't", 'did', "n't", 'get', 'up', '.'], POS Tag true : ['RB', 'RB', 'IN', 'PRP', '_', 'VBD', 'RB', 'VB', 'RB', '.'], POS Tag predicted: ['IN', 'JJ', 'IN', 'PRP', '_', 'VBD', 'RB', 'VB', 'RP', '.']
Sentence ID: GUM_conversation_family-90, Words: ['Yeah', ',', 'I', 'love', 'hot', 'tea', '.'], POS Tag true : ['UH', ',', 'PRP', 'VBP', 'JJ', 'NN', '.'], POS Tag predicted: ['UH', ',', 'PRP', 'VBP', 'JJ', 'NN', '.']
Sentence ID: GUM_conversation_family-91, Words: ['B

100%|██████████| 2000/2000 [00:51<00:00, 38.56it/s]

Sentence ID: GUM_conversation_gossip-2, Words: ['You', 'should', 'have', 'heard', 'him', ',', 'the', 'night', 'we', 'took', 'him', 'to', 'the', 'emergency', 'room', '.'], POS Tag true : ['PRP', 'MD', 'VB', 'VBN', 'PRP', ',', 'DT', 'NN', 'PRP', 'VBD', 'PRP', 'IN', 'DT', 'NN', 'NN', '.'], POS Tag predicted: ['PRP', 'MD', 'VB', 'VBN', 'PRP', ',', 'DT', 'NN', 'PRP', 'VBD', 'PRP', 'IN', 'DT', 'NN', 'NN', '.']
Sentence ID: GUM_conversation_gossip-20, Words: ["That's", 'That', "'s", 'dangerou-', '–', 'I', 'mean', 's-', '–'], POS Tag true : ['_', 'DT', 'VBZ', 'JJ', ':', 'PRP', 'VBP', 'UH', ':'], POS Tag predicted: ['_', 'DT', 'VBZ', 'JJ', ':', 'PRP', 'VBP', 'UH', ':']
Sentence ID: GUM_conversation_gossip-21, Words: ['Cause', 'he', 'could', 'have', ',', 'brain', 'damage', '.'], POS Tag true : ['IN', 'PRP', 'MD', 'VB', ',', 'NN', 'NN', '.'], POS Tag predicted: ['IN', 'PRP', 'MD', 'VB', ',', 'NN', 'NN', '.']
Sentence ID: GUM_conversation_gossip-22, Words: ['The', 'doctor', 'said', '–', 'the', 'do




In [None]:
print(len(POS_tags_train_true))
print(len(POS_tags_train_pred))

36712
36712


In [None]:
df_output_train = pd.DataFrame(output_train)
tsv_file_path = 'viterbi_predictions_train.tsv'

# Write the DataFrame to the TSV file
df_output_train.to_csv(tsv_file_path, sep='\t', index=False)
print("TSV file has been created successfully.")

TSV file has been created successfully.


In [None]:
for true_tag, predicted_tag in zip(POS_tags_train_true, POS_tags_train_pred):
    print(f"True Tag: {true_tag},  Predicted Tag: {predicted_tag}")

[1;30;43mStreaming output truncated to the last 5000 lines.[0m
True Tag: UH,  Predicted Tag: UH
True Tag: .,  Predicted Tag: .
True Tag: PRP,  Predicted Tag: PRP
True Tag: VBP,  Predicted Tag: VBP
True Tag: _,  Predicted Tag: _
True Tag: PRP,  Predicted Tag: PRP
True Tag: MD,  Predicted Tag: MD
True Tag: VB,  Predicted Tag: VB
True Tag: TO,  Predicted Tag: TO
True Tag: VB,  Predicted Tag: VB
True Tag: IN,  Predicted Tag: IN
True Tag: DT,  Predicted Tag: DT
True Tag: NN,  Predicted Tag: NN
True Tag: .,  Predicted Tag: .
True Tag: RB,  Predicted Tag: RB
True Tag: .,  Predicted Tag: .
True Tag: VBD,  Predicted Tag: VBD
True Tag: DT,  Predicted Tag: DT
True Tag: JJ,  Predicted Tag: JJ
True Tag: NN,  Predicted Tag: NN
True Tag: .,  Predicted Tag: .
True Tag: UH,  Predicted Tag: UH
True Tag: .,  Predicted Tag: .
True Tag: UH,  Predicted Tag: UH
True Tag: .,  Predicted Tag: .
True Tag: VBP,  Predicted Tag: VBP
True Tag: PDT,  Predicted Tag: PDT
True Tag: DT,  Predicted Tag: DT
True Tag: NN,

In [None]:
# Calculate precision, recall, F-score, and accuracy
precision_train = precision_score(POS_tags_train_true, POS_tags_train_pred, average='micro')
recall_train = recall_score(POS_tags_train_true, POS_tags_train_pred, average='micro')
f1_score_train = f1_score(POS_tags_train_true, POS_tags_train_pred, average='micro')
accuracy_train = accuracy_score(POS_tags_train_true, POS_tags_train_pred)

# Print the results
print("Precision Score:", precision_train)
print("Recall Score:", recall_train)
print("F-score Score:", f1_score_train)
print("Accuracy Score:", accuracy_train)

Precision Score: 0.9807964698191327
Recall Score: 0.9807964698191327
F-score Score: 0.9807964698191327
Accuracy Score: 0.9807964698191327


# Test

Function to calculate emission probabilities from tag(t) to word(w) using Add-1-Smoothing

P(W | t) = (Count(t, w) +  1) / (Count(t) + |V|)

where |V| is the size of the vocabulary

In [None]:
def emission_prob_Add1_smoothing(w,t):
  if (w,t) in tag_word_pair_counts:
      return (tag_word_pair_counts[(w,t)] + 1 )/( tag_freq[t]+ len(word_freq))
  else :
      return 1/(tag_freq[t]+ len(word_freq))

Viterbi for test with Add-1-smoothing for emission probabilities

In [None]:
def viterbi_test(sentence, tags_set):
    T=len(tags_set)
    W= len(sentence)
    epsilon = 1

    # Initialize the dynamic programming table to scores and tags found at each step
    scores= np.zeros((T,W), dtype= float)
    backptr = np.zeros((T,W), dtype=int)

    # Initialization Step for w==0 i,e. 1st word of sentence
    for t in range(T):
          scores[t,0]= (tag_start_prob(tags_set[t])* emission_prob_Add1_smoothing(sentence[0], tags_set[t]))
          backptr[t, 0] = 0

    # Iteration Step
    for w in range (1,W):
      for t in range(T):
        prob= scores[:, w-1] * transition_matrix[:, t] * emission_prob_Add1_smoothing(sentence[w], tags_set[t])

        backptr[t, w] = np.argmax(prob)
        scores[t, w] = np.max(prob)

    best_path_prob = np.max(scores[:, -1])

    # Path backtracking
    best_path = np.zeros(len(sentence), dtype=int)
    best_path[-1] = np.argmax(scores[:, -1])
    for w in range(len(sentence)-2, -1, -1):
        best_path[w] = backptr[best_path[w+1], w+1]

    POS_tag_seq = [tags_set[index] for index in best_path]
    return POS_tag_seq

In [None]:
# Initialize lists to store output of test
output_test = {
    'sent_id': [],
    'token_no': [],
    'word': [],
    'predicted_tag': []
}

POS_tags_test_pred=[]
POS_tags_test_true=[]
for sent_id, group in tqdm(df_test.groupby('sent_id')):
  sentence = group['word'].tolist()
  true_tag = group['POS_tag'].to_list()
  pred_tag = viterbi_test(sentence, tags_set)
  POS_tags_test_pred.extend(pred_tag)
  POS_tags_test_true.extend(true_tag)
  print(f"Sentence ID: {sent_id}, Words: {sentence}, POS Tag true : {true_tag}, POS Tag predicted: {pred_tag}")

  # Store the test output for each word in the sentence
  for i, (word, true_tag, pred_tag) in enumerate(zip(sentence, true_tag, pred_tag), start=1):
      output_test['sent_id'].append(sent_id)
      output_test['token_no'].append(i)
      output_test['word'].append(word)
      output_test['predicted_tag'].append(pred_tag)

  3%|▎         | 3/100 [00:00<00:04, 22.60it/s]

Sentence ID: GUM_academic_discrimination-1, Words: ['The', 'prevalence', 'of', 'discrimination', 'across', 'racial', 'groups', 'in', 'contemporary', 'America', ':'], POS Tag true : ['DT', 'NN', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'JJ', 'NNP', ':'], POS Tag predicted: ['DT', 'NN', 'IN', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'JJ', 'NNS', ':']
Sentence ID: GUM_academic_discrimination-10, Words: ['What', 'also', 'should', 'not', 'be', 'lost', 'in', 'discussion', 'of', 'discrimination', 'is', 'the', 'growing', 'push', 'to', 'implement', 'social', 'policy', 'aimed', 'at', 'reducing', 'the', 'occurrence', 'of', 'discriminatory', 'practices', '.'], POS Tag true : ['WP', 'RB', 'MD', 'RB', 'VB', 'VBN', 'IN', 'NN', 'IN', 'NN', 'VBZ', 'DT', 'VBG', 'NN', 'TO', 'VB', 'JJ', 'NN', 'VBN', 'IN', 'VBG', 'DT', 'NN', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['_', 'PRP', 'MD', 'RB', 'VB', 'VBN', 'IN', 'NN', 'IN', 'DT', 'VBZ', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'NN', 'IN', 'VBG', 'DT', 'NN', 'IN', 'DT', 

 10%|█         | 10/100 [00:00<00:03, 23.53it/s]

Sentence ID: GUM_academic_discrimination-14, Words: ['At', 'least', 'one', 'prior', 'study', 'by', 'Kessler', 'and', 'colleagues', '[', '15', ']', ',', 'however', ',', 'using', 'measures', 'of', 'perceived', 'discrimination', 'in', 'a', 'large', 'American', 'sample', ',', 'reported', 'that', 'approximately', '33', '%', 'of', 'respondents', 'reported', 'some', 'form', 'of', 'discrimination', '(', 'see', 'also', ',', 'Gibbons', 'et', 'al.', '[', '4', ']', ')', '.'], POS Tag true : ['IN', 'JJS', 'CD', 'JJ', 'NN', 'IN', 'NNP', 'CC', 'NNS', '-LRB-', 'CD', '-RRB-', ',', 'RB', ',', 'VBG', 'NNS', 'IN', 'VBN', 'NN', 'IN', 'DT', 'JJ', 'JJ', 'NN', ',', 'VBD', 'IN', 'RB', 'CD', 'NN', 'IN', 'NNS', 'VBD', 'DT', 'NN', 'IN', 'NN', '-LRB-', 'VB', 'RB', ',', 'NNP', 'FW', 'FW', '-LRB-', 'CD', '-RRB-', '-RRB-', '.'], POS Tag predicted: ['IN', 'DT', 'NN', 'IN', 'NN', 'IN', 'NN', 'CC', 'NNP', '-LRB-', 'CD', '-RRB-', ',', 'RB', ',', 'VBG', 'NN', 'IN', 'DT', 'NN', 'IN', 'DT', 'JJ', 'JJ', 'NN', ',', 'CC', 'IN'

 28%|██▊       | 28/100 [00:00<00:01, 54.16it/s]

Sentence ID: GUM_academic_discrimination-21, Words: ['For', 'the', 'present', 'analysis', ',', 'these', 'responses', 'were', 'recoded', 'into', 'nine', 'mutually', 'exclusive', 'categories', 'capturing', 'the', 'following', 'options', ':'], POS Tag true : ['IN', 'DT', 'JJ', 'NN', ',', 'DT', 'NNS', 'VBD', 'VBN', 'IN', 'CD', 'RB', 'JJ', 'NNS', 'VBG', 'DT', 'VBG', 'NNS', ':'], POS Tag predicted: ['IN', 'DT', 'JJ', 'NN', ',', 'DT', 'NNS', 'VBD', 'VBN', 'IN', 'DT', 'NN', 'IN', 'NNS', 'IN', 'DT', 'JJ', 'NNS', ':']
Sentence ID: GUM_academic_discrimination-22, Words: ['race', '/', 'ancestry', '/', 'skin', 'color', ';'], POS Tag true : ['NN', 'SYM', 'NN', 'SYM', 'NN', 'NN', ':'], POS Tag predicted: ['CD', 'SYM', 'CD', 'SYM', 'CD', '-RRB-', ':']
Sentence ID: GUM_academic_discrimination-23, Words: ['gender', ';'], POS Tag true : ['NN', ':'], POS Tag predicted: ['UH', ':']
Sentence ID: GUM_academic_discrimination-24, Words: ['age', ';'], POS Tag true : ['NN', ':'], POS Tag predicted: ['UH', ':']
S

 39%|███▉      | 39/100 [00:00<00:01, 44.07it/s]

Sentence ID: GUM_academic_discrimination-37, Words: ['Respondents', 'were', 'asked', 'to', 'indicate', 'their', 'race', 'from', 'among', 'the', 'following', 'categories', ':', 'White', ';', 'Black', 'or', 'African', 'American', ';', 'Hispanic', ';', 'American', 'Indian', 'or', 'Native', 'American', ';', 'and', 'Asian', 'or', 'Pacific', 'Islander', '.'], POS Tag true : ['NNS', 'VBD', 'VBN', 'TO', 'VB', 'PRP$', 'NN', 'IN', 'IN', 'DT', 'VBG', 'NNS', ':', 'NNP', ':', 'NNP', 'CC', 'NNP', 'NNP', ':', 'NNP', ':', 'NNP', 'NNP', 'CC', 'NNP', 'NNP', ':', 'CC', 'NNP', 'CC', 'NNP', 'NNP', '.'], POS Tag predicted: ['PRP', 'VBD', 'VBN', 'TO', 'VB', 'PRP$', 'NN', 'IN', 'IN', 'DT', 'JJ', 'NNS', ':', 'NNP', 'NNP', ',', 'CC', 'NNP', 'NNP', ':', 'UH', ':', 'NNP', ',', 'CC', 'NNP', 'NNP', ':', 'CC', 'NNP', 'CC', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_discrimination-38, Words: ['Respondents', 'were', 'provided', 'the', 'opportunity', 'to', 'select', 'more', 'than', 'one', 'race', ',', 'and', 'those', '

 44%|████▍     | 44/100 [00:01<00:01, 39.94it/s]

Sentence ID: GUM_academic_discrimination-45, Words: ['Our', 'exploratory', 'study', 'included', 'three', 'basic', 'steps', '.'], POS Tag true : ['PRP$', 'JJ', 'NN', 'VBD', 'CD', 'JJ', 'NNS', '.'], POS Tag predicted: ['PRP$', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', '.']
Sentence ID: GUM_academic_discrimination-46, Words: ['First', ',', 'summary', 'statistics', 'of', 'the', 'study', 'variables', 'and', 'racial', 'categories', 'were', 'produced', '.'], POS Tag true : ['RB', ',', 'NN', 'NNS', 'IN', 'DT', 'NN', 'NNS', 'CC', 'JJ', 'NNS', 'VBD', 'VBN', '.'], POS Tag predicted: ['RB', ',', 'DT', 'NN', 'IN', 'DT', 'NN', ',', 'CC', 'JJ', 'NNS', 'VBD', 'VBN', '.']
Sentence ID: GUM_academic_discrimination-47, Words: ['Second', ',', 'we', 'examined', 'the', 'relative', 'proportions', 'of', 'the', 'two', 'discrimination', 'experience', 'measures', 'across', 'each', 'racial', 'category', '.'], POS Tag true : ['RB', ',', 'PRP', 'VBD', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'CD', 'NN', 'NN', 'NNS', 'IN', 'DT', 'JJ

 49%|████▉     | 49/100 [00:01<00:01, 31.90it/s]

Sentence ID: GUM_academic_discrimination-51, Words: ['The', 'p', '-', 'value', 'associated', 'with', 'the', 'design', '-', 'based', 'F', 'is', 'thus', 'more', 'accurate', '(', 'than', 'the', 'associated', 'with', 'the', 'χ2', 'statistic', ')', 'given', 'the', 'adjustments', 'and', 'calculations', 'take', 'into', 'account', 'the', 'weighted', 'nature', 'of', 'the', 'data', '.'], POS Tag true : ['DT', 'NN', 'HYPH', 'NN', 'VBN', 'IN', 'DT', 'NN', 'HYPH', 'VBN', 'NN', 'VBZ', 'RB', 'RBR', 'JJ', '-LRB-', 'IN', 'DT', 'VBN', 'IN', 'DT', 'SYM', 'NN', '-RRB-', 'VBN', 'DT', 'NNS', 'CC', 'NNS', 'VBP', 'IN', 'NN', 'DT', 'VBN', 'NN', 'IN', 'DT', 'NNS', '.'], POS Tag predicted: ['DT', 'NN', 'HYPH', 'NN', 'VBN', 'IN', 'DT', 'NN', 'HYPH', 'VBN', 'NN', 'VBZ', 'RB', 'RBR', 'JJ', 'NN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NNP', 'CD', '-RRB-', ',', 'DT', 'NN', 'CC', 'RB', 'VB', 'IN', 'VBG', 'DT', 'JJ', 'NN', 'IN', 'DT', 'NNS', '.']
Sentence ID: GUM_academic_discrimination-52, Words: ['This', 'final', 'step', 'al

 58%|█████▊    | 58/100 [00:01<00:01, 31.91it/s]

Sentence ID: GUM_academic_discrimination-9, Words: ['In', 'many', 'respects', ',', 'researchers', 'already', 'possess', 'a', 'wealth', 'of', 'knowledge', 'concerning', 'the', 'origins', 'and', 'consequences', 'of', 'discrimination', 'and', 'bias', '.', '[', '11', ']'], POS Tag true : ['IN', 'JJ', 'NNS', ',', 'NNS', 'RB', 'VBP', 'DT', 'NN', 'IN', 'NN', 'VBG', 'DT', 'NNS', 'CC', 'NNS', 'IN', 'NN', 'CC', 'NN', '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['IN', 'JJ', 'NN', ',', 'CC', 'RB', 'VB', 'DT', 'NN', 'IN', 'NN', 'IN', 'DT', 'NN', 'CC', 'NNS', 'IN', 'NN', 'CC', 'NN', '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_academic_eegimaa-1, Words: ['2.', 'GUJJOLAAY', 'EEGIMAA', ',', 'ITS', 'SPEAKERS', 'AND', 'THEIR', 'NEIGHBOURS'], POS Tag true : ['LS', 'NNP', 'NNP', ',', 'PRP$', 'NNS', 'CC', 'PRP$', 'NNS'], POS Tag predicted: ['IN', 'DT', 'NN', ',', 'IN', 'DT', 'NN', 'IN', 'DT']
Sentence ID: GUM_academic_eegimaa-10, Words: ['Eegimaa', 'is', 'mainly', 'spoken', 'in', 'Mof-Ávvi', ',', 'a'

 66%|██████▌   | 66/100 [00:01<00:01, 30.39it/s]

Sentence ID: GUM_academic_eegimaa-15, Words: ['The', 'Eegimaa', 'spoken', 'in', 'Mof-Ávvi', 'is', 'known', 'by', 'several', 'names', 'given', 'by', 'speakers', 'of', 'neighbouring', 'languages', '.'], POS Tag true : ['DT', 'NNP', 'VBN', 'IN', 'NNP', 'VBZ', 'VBN', 'IN', 'JJ', 'NNS', 'VBN', 'IN', 'NNS', 'IN', 'VBG', 'NNS', '.'], POS Tag predicted: ['DT', 'JJ', 'NN', 'IN', 'DT', 'VBZ', 'VBN', 'IN', 'JJ', 'NNS', 'VBN', 'IN', 'NN', 'IN', 'DT', 'NNS', '.']
Sentence ID: GUM_academic_eegimaa-16, Words: ['For', 'example', ',', 'the', 'name', 'Kusiilay', '1', '‘', 'the', 'language', 'of', 'Essil', '’', ',', 'is', 'the', 'name', 'given', 'by', 'speakers', 'of', 'Kujireray', 'to', 'the', 'Eegimaa', 'language', ',', 'because', 'Essil', ',', 'of', 'which', 'Bajjat', 'was', 'a', 'district', ',', 'is', 'the', 'village', 'which', 'has', 'a', 'border', 'with', 'their', 'village', '.'], POS Tag true : ['IN', 'NN', ',', 'DT', 'NN', 'NNP', 'CD', '``', 'DT', 'NN', 'IN', 'NNP', "''", ',', 'VBZ', 'DT', 'NN', 

 78%|███████▊  | 78/100 [00:02<00:00, 33.33it/s]

Sentence ID: GUM_academic_eegimaa-26, Words: ['Language', 'names', 'are', 'written', 'following', 'the', 'recommendation', 'for', 'the', 'transcription', 'of', 'national', 'languages', 'of', 'Senegal', ',', 'Decree', '2005-981', '.'], POS Tag true : ['NN', 'NNS', 'VBP', 'VBN', 'VBG', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'NNP', ',', 'NNP', 'CD', '.'], POS Tag predicted: ['_', 'PRP', 'VBP', 'VBN', 'IN', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'JJ', 'NNS', 'IN', 'NNP', ',', 'CD', '-RRB-', '.']
Sentence ID: GUM_academic_eegimaa-27, Words: ['Names', 'of', 'the', 'villages', 'of', 'Mof-Ávvi', 'are', 'written', 'using', 'the', 'Eegimaa', 'orthography', 'and', 'following', 'the', 'pronunciation', 'of', 'village', 'names', 'by', 'native', 'speakers', '.'], POS Tag true : ['NNS', 'IN', 'DT', 'NNS', 'IN', 'NNP', 'VBP', 'VBN', 'VBG', 'DT', 'NNP', 'NN', 'CC', 'VBG', 'DT', 'NN', 'IN', 'NN', 'NNS', 'IN', 'JJ', 'NNS', '.'], POS Tag predicted: ['RB', 'IN', 'DT', 'NN', 'IN', 'PRP', 'VBP', 

 86%|████████▌ | 86/100 [00:02<00:00, 31.01it/s]

Sentence ID: GUM_academic_eegimaa-32, Words: ['Nowadays', 'most', 'Eegimaa', 'speakers', 'from', 'Mof-Ávvi', 'live', 'outside', 'their', 'homeland', ',', 'generally', 'in', 'urban', 'areas', 'like', 'Ziguinchor', 'and', 'Dakar', '.'], POS Tag true : ['RB', 'JJS', 'NNP', 'NNS', 'IN', 'NNP', 'VBP', 'IN', 'PRP$', 'NN', ',', 'RB', 'IN', 'JJ', 'NNS', 'IN', 'NNP', 'CC', 'NNP', '.'], POS Tag predicted: ['PRP', 'VBD', 'DT', 'NN', 'IN', 'DT', 'NN', 'IN', 'PRP$', 'NN', ',', 'RB', 'IN', 'DT', 'NNS', 'IN', 'NN', 'CC', 'NN', '.']
Sentence ID: GUM_academic_eegimaa-33, Words: ['Speakers', 'of', 'Eegimaa', 'use', 'the', 'term', 'Gújjolaay', '(', 'meaning', 'Jóola', ')', 'to', 'refer', 'to', 'their', 'language', 'when', 'they', 'speak', 'to', 'each', 'other', ',', 'but', 'use', 'Eegimaa', 'to', 'distinguish', 'their', 'Jóola', 'variety', 'from', 'that', 'of', 'other', 'Jóola', 'peoples', '.'], POS Tag true : ['NNS', 'IN', 'NNP', 'VBP', 'DT', 'NN', 'NNP', '-LRB-', 'VBG', 'NNP', '-RRB-', 'TO', 'VB', 'IN'

 95%|█████████▌| 95/100 [00:02<00:00, 32.56it/s]

Sentence ID: GUM_academic_eegimaa-7, Words: ['Speakers', 'of', 'these', 'languages', 'are', 'found', 'in', 'the', 'Gambia', ',', 'in', 'the', 'former', 'Casamance', 'region', 'of', 'Southern', 'Senegal', 'and', 'in', 'Guinea', 'Bissau', '.'], POS Tag true : ['NNS', 'IN', 'DT', 'NNS', 'VBP', 'VBN', 'IN', 'DT', 'NNP', ',', 'IN', 'DT', 'JJ', 'NNP', 'NN', 'IN', 'NNP', 'NNP', 'CC', 'IN', 'NNP', 'NNP', '.'], POS Tag predicted: ['RB', 'IN', 'DT', 'NNS', 'VBP', 'VBN', 'IN', 'DT', 'NN', ',', 'IN', 'DT', 'JJ', 'NN', 'NN', 'IN', 'DT', 'NN', 'CC', 'IN', 'DT', 'NN', '.']
Sentence ID: GUM_academic_eegimaa-8, Words: ['The', 'map', 'in', 'Figure', '1', ',', 'taken', 'from', 'Ethnologue', ',', 'presents', 'the', 'languages', 'of', 'Senegal', '.'], POS Tag true : ['DT', 'NN', 'IN', 'NNP', 'CD', ',', 'VBN', 'IN', 'NNP', ',', 'VBZ', 'DT', 'NNS', 'IN', 'NNP', '.'], POS Tag predicted: ['DT', 'NN', 'IN', 'NNP', 'CD', ',', 'VBN', 'IN', 'NNP', ',', 'IN', 'DT', 'NNS', 'IN', 'NN', '.']
Sentence ID: GUM_academic_

100%|██████████| 100/100 [00:02<00:00, 33.82it/s]

Sentence ID: GUM_bio_dvorak-5, Words: ["Dvořák's", 'Dvořák', "'s", 'own', 'style', 'has', 'been', 'described', 'as', '"', 'the', 'fullest', 'recreation', 'of', 'a', 'national', 'idiom', 'with', 'that', 'of', 'the', 'symphonic', 'tradition', ',', 'absorbing', 'folk', 'influences', 'and', 'finding', 'effective', 'ways', 'of', 'using', 'them', '"', '.', '[', '1', ']'], POS Tag true : ['_', 'NNP', 'POS', 'JJ', 'NN', 'VBZ', 'VBN', 'VBN', 'IN', '``', 'DT', 'JJS', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'IN', 'DT', 'JJ', 'NN', ',', 'VBG', 'NN', 'NNS', 'CC', 'VBG', 'JJ', 'NNS', 'IN', 'VBG', 'PRP', "''", '.', '-LRB-', 'CD', '-RRB-'], POS Tag predicted: ['_', 'PRP', 'VBZ', 'JJ', 'NN', 'VBZ', 'VBN', 'VBN', 'IN', '``', 'DT', 'JJ', 'NN', 'IN', 'DT', 'JJ', 'NN', 'IN', 'DT', 'IN', 'DT', 'JJ', 'NN', ',', 'CD', '-RRB-', ',', 'CC', 'DT', 'JJ', 'NNS', 'IN', 'DT', 'NN', "''", '.', '-LRB-', 'CD', '-RRB-']
Sentence ID: GUM_bio_dvorak-6, Words: ['Antonín', 'Dvořák'], POS Tag true : ['NNP', 'NNP'], POS Tag 




In [None]:
for true_tag, predicted_tag in zip(POS_tags_test_true, POS_tags_test_pred):
    print(f"True Tag: {true_tag},  Predicted Tag: {predicted_tag}")

True Tag: DT,  Predicted Tag: DT
True Tag: NN,  Predicted Tag: NN
True Tag: IN,  Predicted Tag: IN
True Tag: NN,  Predicted Tag: NN
True Tag: IN,  Predicted Tag: IN
True Tag: JJ,  Predicted Tag: JJ
True Tag: NNS,  Predicted Tag: NNS
True Tag: IN,  Predicted Tag: IN
True Tag: JJ,  Predicted Tag: JJ
True Tag: NNP,  Predicted Tag: NNS
True Tag: :,  Predicted Tag: :
True Tag: WP,  Predicted Tag: _
True Tag: RB,  Predicted Tag: PRP
True Tag: MD,  Predicted Tag: MD
True Tag: RB,  Predicted Tag: RB
True Tag: VB,  Predicted Tag: VB
True Tag: VBN,  Predicted Tag: VBN
True Tag: IN,  Predicted Tag: IN
True Tag: NN,  Predicted Tag: NN
True Tag: IN,  Predicted Tag: IN
True Tag: NN,  Predicted Tag: DT
True Tag: VBZ,  Predicted Tag: VBZ
True Tag: DT,  Predicted Tag: DT
True Tag: VBG,  Predicted Tag: JJ
True Tag: NN,  Predicted Tag: NN
True Tag: TO,  Predicted Tag: IN
True Tag: VB,  Predicted Tag: DT
True Tag: JJ,  Predicted Tag: JJ
True Tag: NN,  Predicted Tag: NN
True Tag: VBN,  Predicted Tag: NN
Tr

In [None]:
# Calculate precision, recall, F-score, and accuracy
precision_test = precision_score(POS_tags_test_true, POS_tags_test_pred, average='micro')
recall_test = recall_score(POS_tags_test_true, POS_tags_test_pred, average='micro')
f1_score_test = f1_score(POS_tags_test_true, POS_tags_test_pred, average='micro')
accuracy_test = accuracy_score(POS_tags_test_true, POS_tags_test_pred)

# Print the results
print("Precision Score:", precision_test)
print("Recall Score:", recall_test)
print("F-score Score:", f1_score_test)
print("Accuracy Score:", accuracy_test)

Precision Score: 0.7106227106227107
Recall Score: 0.7106227106227107
F-score Score: 0.7106227106227107
Accuracy Score: 0.7106227106227107


In [None]:
df_output_test = pd.DataFrame(output_test)
tsv_file_path = 'viterbi_predictions_test.tsv'

# Write the DataFrame to the TSV file
df_output_test.to_csv(tsv_file_path, sep='\t', index=False)
print("TSV file has been created successfully.")

TSV file has been created successfully.
