In [1]:
import torch
import mlflow
import pandas as pd
import numpy as np
import argparse
from transformers import (
    AutoModelForTokenClassification,
    AutoTokenizer,
    TrainingArguments,
    Trainer,
    DataCollatorForTokenClassification,
)

from datasets import load_dataset, Dataset
import json


In [2]:
import sys
sys.path.append("..")
from utils import *

In [3]:
!ls 

 100wikis_ds		     examples.txt	    model_PER
'Analisis de frases.ipynb'   idxs.txt		    model_PER.tar.gz
 conll_conll		     labels.txt		    preds.txt
 conll.tar.gz		     model_95wikis	    test
 coverages.ipynb	     model_95wikis.tar.gz   test.ipynb
 coverage.txt		     model_ORGMISC	    trained_model
 distribuciones.ipynb	     model_ORGMISC.tar.gz


In [4]:
examples,  idxs =  [], []
true_labels, preds = [], []
with open('examples.txt', 'r') as fp:
    for line in fp: examples.append(line[:-1])

with open('idxs.txt', 'r') as fp:
    for line in fp: idxs.append(int(line[:-1]))

#with open('labels.txt', 'r') as fp:
#    for line in fp: true_labels.append(line[:-1])

#with open('preds.txt', 'r') as fp:
#    for line in fp: preds.append(line[:-1])

In [5]:
device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"device: {device}")

checkpoint = "dccuchile/bert-base-spanish-wwm-cased"
tokenizer = AutoTokenizer.from_pretrained(checkpoint, num_labels=len(LABEL_LIST))

device: cpu


In [6]:
%%capture
wikiner_model = AutoModelForTokenClassification.from_pretrained(
    './trained_model/', num_labels=len(LABEL_LIST)
)
conll_model = AutoModelForTokenClassification.from_pretrained(
    'conll_conll/trained_model/', num_labels=len(LABEL_LIST)
)
PER_model = AutoModelForTokenClassification.from_pretrained(
    'model_PER/model-100-50-PER/trained_model/', num_labels=len(LABEL_LIST),
)
ORGMISC_model = AutoModelForTokenClassification.from_pretrained(
    'model_ORGMISC/model-100-50-ORGMISC/trained_model/', num_labels=len(LABEL_LIST),
)
b_95wikis_model = AutoModelForTokenClassification.from_pretrained(
    'model_95wikis/trained_model/', num_labels=len(LABEL_LIST),
)

In [7]:
data_collator = DataCollatorForTokenClassification(tokenizer=tokenizer)

training_args = TrainingArguments(
    output_dir = 'test',
    evaluation_strategy="epoch",
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
)


def create_trainer(model) -> Trainer:
    return Trainer(
        model=model,
        args=training_args,
        data_collator=data_collator,
        tokenizer=tokenizer,
    )

In [8]:
wikiner_trainer = create_trainer(wikiner_model)
conll_trainer = create_trainer(conll_model)
PER_trainer = create_trainer(PER_model)
ORGMISC_trainer = create_trainer(ORGMISC_model)
b_95wikis_trainer = create_trainer(b_95wikis_model)

De aca arranca lo interesante

In [9]:
def tokenize_and_align_labels(examples):
    """
    Funcion para tokenizar las sentencias, ademas de alinear palabras con los
    labels. Usada junto al map de los Dataset, retorna otro Dataset, que
    ahora contiene labels, token_ids y attention_mask.
    """
    tokenized_inputs = tokenizer(
        examples["tokens"],
        is_split_into_words=True,
        truncation=True,
        return_token_type_ids=False,
    )

    labels, w_ids = [], []
    for i, label in enumerate(examples["ner_tags"]):
        word_ids = tokenized_inputs.word_ids(
            batch_index=i
        )  # Map tokens to their respective word.
        previous_word_idx = None
        label_ids = []
        for word_idx in word_ids:  # Set the special tokens to -100.
            if word_idx is None:
                label_ids.append(IGNORE_INDEX)
            elif (
                word_idx != previous_word_idx
            ):  # Only label the first token of a given word.
                label_ids.append(label[word_idx])
            else:
                ##label_ids.append(IGNORE_INDEX)
                label_ids.append(label[word_idx])
            previous_word_idx = word_idx
        labels.append(label_ids)
        w_ids.append(word_ids)

    tokenized_inputs["labels"] = labels
    tokenized_inputs["word_ids"] = w_ids
    return tokenized_inputs

In [10]:
valid_ds = load_dataset("conll2002","es",split='validation')
valid_ds

Reusing dataset conll2002 (/home/naza/.cache/huggingface/datasets/conll2002/es/1.0.0/a3a8a8612caf57271f5b35c5ae1dd25f99ddb9efb9c1667abaa70ede33e863e5)


Dataset({
    features: ['id', 'tokens', 'pos_tags', 'ner_tags'],
    num_rows: 1916
})

In [11]:
valid_ds = valid_ds.filter(lambda ex: ex["ner_tags"] != [0] * len(ex["ner_tags"]))
valid_ds

Loading cached processed dataset at /home/naza/.cache/huggingface/datasets/conll2002/es/1.0.0/a3a8a8612caf57271f5b35c5ae1dd25f99ddb9efb9c1667abaa70ede33e863e5/cache-1c80317fa3b1799d.arrow


Dataset({
    features: ['id', 'tokens', 'pos_tags', 'ner_tags'],
    num_rows: 1409
})

In [16]:
tokenized_valid_ds = valid_ds.map(
        tokenize_and_align_labels,
        batched=True,
        remove_columns=["id", "pos_tags", "ner_tags", "tokens"],
    )
tokenized_valid_ds

Loading cached processed dataset at /home/naza/.cache/huggingface/datasets/conll2002/es/1.0.0/a3a8a8612caf57271f5b35c5ae1dd25f99ddb9efb9c1667abaa70ede33e863e5/cache-bd9c66b3ad3c2d6d.arrow


Dataset({
    features: ['input_ids', 'attention_mask', 'labels'],
    num_rows: 1409
})

In [17]:
true_labels = valid_ds.to_pandas().ner_tags

In [18]:
def output(phrase: str, trainer=wikiner_trainer):
    tokenized_input = tokenizer([phrase], return_token_type_ids=False)
    ds = Dataset.from_dict(tokenized_input)
    pred = trainer.predict(ds)
    predicted = pred.predictions.argmax(-1)[0]

    prev_idx = None
    labs = []
    for i, token in enumerate(tokenizer.convert_ids_to_tokens(tokenized_input['input_ids'][0])):
        word_idx = tokenized_input.word_ids(batch_index=0)[i]
        #print(word_idx, prev_idx, predicted[i])
        if word_idx == None: pass # no agrego el [CLS] ni [SEP].
        elif word_idx == prev_idx: pass # no tengo que agregar nada, sigue siendo la misma palabra.
        else: labs.append(TOKEN_MAP[predicted[i]]) #
        prev_idx = word_idx


    return labs
    #return (labs, [*map(TOKEN_MAP.get, valid_ds[j]['ner_tags'])])

In [19]:
def output_with_phrase(phrase: str, trainer=wikiner_trainer):
    tokenized_input = tokenizer([phrase], return_token_type_ids=False)
    ds = Dataset.from_dict(tokenized_input)
    pred = trainer.predict(ds)
    predicted = pred.predictions.argmax(-1)[0]

    prev_idx = None
    labs = []
    res = ""
    for i, token in enumerate(tokenizer.convert_ids_to_tokens(tokenized_input['input_ids'][0])):
        word_idx = tokenized_input.word_ids(batch_index=0)[i]
        #print(word_idx, prev_idx, predicted[i])
        if word_idx == None: pass # no agrego el [CLS] ni [SEP].
        elif word_idx == prev_idx: pass # no tengo que agregar nada, sigue siendo la misma palabra.
        else: res += (f'{token} - {TOKEN_MAP[predicted[i]]}\n') #labs.append(TOKEN_MAP[predicted[i]]) #
        prev_idx = word_idx

    return res

ex[idx[27]]:
También intervendrán en el acto varios miembros del grupo Voz , entre ellos el director de La Voz de Galicia , Ernesto Sánchez Pombo , tras lo que se ofrecerá un obsequio a toda la plantilla y cuerpo técnico del Deportivo.

In [20]:
true_classes = [[*map(TOKEN_MAP.get, list(l))] for l in true_labels]

In [21]:
def check_conll(k : int, trainer=wikiner_trainer):
    """
    Esta funcion la uso para comparar con las cosas que mida conll, 
    para saber si es o no complicado de predecir
    """
    print(f'{examples[k]}')
    print(
        f"MODEL:{output(examples[k], trainer)}\nCONLL:{output(examples[k], trainer=conll_trainer)}\nTrue:{true_classes[k]}")

predictions = wikiner_trainer.predict(tokenized_valid_ds.select([idxs[54]]))
preds = predictions.predictions.argmax(-1)
labels = predictions.label_ids
flat_labels, flat_preds = correct_pad(labels, preds)

preds, labels, examples[idxs[54]]

flat_labels, flat_preds

print(output(examples[67]), true_classes[67])

In [31]:
print(output_with_phrase(examples[idxs[37]], b_95wikis_trainer))

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Castell - B-PER
ha - O
vuelto - O
a - O
confirmar - O
lo - O
que - O
ya - O
demostró - O
en - O
esta - O
misma - O
plaza - O
en - O
su - O
debut - O
a - O
principio - O
de - O
temporada - O
, - O
como - O
ya - O
había - O
evidencia - O
en - O
oportunidades - O
tan - O
claras - O
que - O
tuvo - O
igualmente - O
en - O
Las - B-LOC
Fall - I-LOC
de - I-LOC
Valencia - I-LOC
y - O
La - B-LOC
Magdalena - I-LOC
de - I-LOC
Castell - I-LOC
. - O



In [24]:
frase = 'La selección Estadounidense de baloncesto se colgó la medalla de oro en los juegos de Sydney 2000, con un plantel de jugadores NBA.'
#'La selección Estadounidense de baloncesto se colgó la medalla de oro en los juegos de Sydney 2000, con un plantel repleto de jugadores NBA.'
print(f'{frase}')
print(
    f"MODEL:{output(frase, b_95wikis_trainer)}\nCONLL:{output(frase, trainer=conll_trainer)}")

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


La selección Estadounidense de baloncesto se colgó la medalla de oro en los juegos de Sydney 2000, con un plantel de jugadores NBA.


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O']
CONLL:['O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O']


In [22]:
check_conll(idxs[37], b_95wikis_trainer)

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Castella ha vuelto a confirmar lo que ya demostró en esta misma plaza en su debut a principio de temporada , como ya había evidenciado en oportunidades tan claras que tuvo igualmente en Las Fallas de Valencia y La Magdalena de Castellón .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O']
CONLL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'B-LOC', 'O']
True:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O']


In [43]:
check_conll(idxs[37], ORGMISC_trainer)

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Castella ha vuelto a confirmar lo que ya demostró en esta misma plaza en su debut a principio de temporada , como ya había evidenciado en oportunidades tan claras que tuvo igualmente en Las Fallas de Valencia y La Magdalena de Castellón .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'B-LOC', 'O']
CONLL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'B-LOC', 'O']
True:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O']


In [44]:
check_conll(idxs[37], PER_trainer)

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Castella ha vuelto a confirmar lo que ya demostró en esta misma plaza en su debut a principio de temporada , como ya había evidenciado en oportunidades tan claras que tuvo igualmente en Las Fallas de Valencia y La Magdalena de Castellón .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O']
CONLL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'B-LOC', 'O']
True:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O']


In [20]:
check_conll(idxs[1]), idxs[1]

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


R/P de UCE sobre la próxima campaña de tomate en Extremadura .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
CONLL:['O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
True:['O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


(None, 78)

In [34]:
for i in idxs[:5]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-LOC', 'O']
['B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
['O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'B-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'I-PER', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'I-PER', 'O']
['B-LOC', 'O']
['B-LOC', 'O']


In [35]:
for i in idxs[6:10]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'B-LOC', 'O', 'B-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'B-LOC', 'O', 'B-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'I-ORG', 'I-MISC', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [36]:
for i in idxs[11:15]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****


['B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O']
['B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O']


  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'B-PER', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'B-PER', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'B-MISC', 'O']
['O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'B-MISC', 'O']
['B-ORG', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O']
['B-ORG', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O']


In [37]:
for i in idxs[16:20]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'I-ORG', 'I-MISC', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'B-LOC', 'B-LOC', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O']


In [38]:
for i in idxs[21:25]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O']
['B-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
['O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-LOC', 'O']
['B-LOC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O']


In [39]:
check_conll(idxs[22])

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Los contratos futuros del crudo Brent bajaron hoy , martes , en el mercado de Londres .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
CONLL:['O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
True:['O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


In [40]:
check_conll(idxs[26])

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Uno detrás de otro y muy despacio . ¡ Qué emoción ! . ¡ Qué bonito ver a Castaño por la Puerta Grande con las dos orejas ! .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O']
CONLL:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O']
True:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O']


In [41]:
for i in idxs[26:30]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'I-ORG', 'I-MISC', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'B-PER', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'B-PER', 'O', 'O', 'O', 'O', 'O']


In [42]:
for i in idxs[31:35]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'B-PER', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'B-PER', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [43]:
for i in idxs[36:40]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'I-LOC', 'O']
['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['B-PER', 'I-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['B-PER', 'I-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [44]:
check_conll(idxs[37])

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Castella ha vuelto a confirmar lo que ya demostró en esta misma plaza en su debut a principio de temporada , como ya había evidenciado en oportunidades tan claras que tuvo igualmente en Las Fallas de Valencia y La Magdalena de Castellón .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'I-LOC', 'O']
CONLL:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'B-LOC', 'I-LOC', 'O', 'B-LOC', 'O']
True:['B-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O', 'B-MISC', 'I-MISC', 'O', 'B-LOC', 'O']


In [45]:
check_conll(idxs[42])

Los contratos futuros del crudo Brent bajaron hoy , martes , en el mercado de Londres .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
CONLL:['O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
True:['O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


In [46]:
for i in idxs[41:45]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
['O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'B-ORG', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'B-ORG', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


In [47]:
check_conll(idxs[46])

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


Uno detrás de otro y muy despacio . ¡ Qué emoción ! . ¡ Qué bonito ver a Castaño por la Puerta Grande con las dos orejas ! .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O']
CONLL:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O']
True:['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O']


In [48]:
for i in idxs[46:50]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-PER', 'O', 'O', 'B-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['B-LOC', 'O']
['B-LOC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-LOC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'O', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O', 'B-ORG', 'O', 'O']


In [49]:
for i in idxs[51:55]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'B-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'O', 'B-PER', 'I-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'I-ORG', 'I-ORG', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O']
['O', 'O', 'O', 'B-LOC', 'O']


In [50]:
for i in idxs[56:60]:
    print(f'{output(examples[i])}\n{true_classes[i]}')

***** Running Prediction *****
  Num examples = 1
  Batch size = 4
***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'B-MISC', 'I-MISC', 'O', 'O']
['O', 'B-ORG', 'O', 'O', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O']
['O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O']


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


['O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'I-LOC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'O', 'O', 'B-PER', 'I-PER', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'I-MISC', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']
['O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'B-MISC', 'O']
['O', 'B-ORG', 'I-ORG', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'B-MISC', 'O', 'B-MISC', 'O']


In [51]:
check_conll(idxs[56])

***** Running Prediction *****
  Num examples = 1
  Batch size = 4


( UCE TOMATE ) .


***** Running Prediction *****
  Num examples = 1
  Batch size = 4


MODEL:['O', 'B-MISC', 'I-MISC', 'O', 'O']
CONLL:['O', 'B-MISC', 'I-MISC', 'O', 'O']
True:['O', 'B-ORG', 'O', 'O', 'O']
