## Step 1: Pre-Preprocessing

In [1]:
%load_ext autoreload
%autoreload 2

# import preprocessing code
from src.preprocess import PreProcessor, df_to_train_set

Using TensorFlow backend.


In [2]:
# save paths to the available datasets
from typing import NamedTuple, List

class Dataset(NamedTuple):
    """
    Interface for accessing data folders.
    """
    title: str
    preprocessed_folder: str
    raw_folders: List[str]

SAMPLE_DATA = Dataset(
    title = "sample_data",
    preprocessed_folder = "../data/preprocessed/sample_data/",
    raw_folders = ["docs/Track1-de-indentification/PHI/"]
)

GOLD_1 = Dataset(
    title = "gold_1",
    preprocessed_folder = "../data/preprocessed/gold_1/",
    raw_folders = ["../data/raw/training-PHI-Gold-Set1/"]
)

GOLD_FULL = Dataset(
    title = "gold_full",
    preprocessed_folder = "../data/preprocessed/gold_full/",
    raw_folders = ["../data/raw/training-PHI-Gold-Set1/","../data/raw/training-PHI-Gold-Set2/"]
)

GOLD_TEST = Dataset(
    title = "gold_test",
    preprocessed_folder = "../data/preprocessed/gold_test/",
    raw_folders = ["../data/raw/testing-PHI-Gold-fixed/"]
)

DATASETS = [SAMPLE_DATA,GOLD_1,GOLD_FULL, GOLD_TEST]

## Step 2: Preprocessing

In [3]:
# pick dataset and define loading boolean
train_data = DATASETS[2]
test_data = DATASETS[3]
isLoading = True

In [4]:
# attach data to PreProcessor object.
pp = PreProcessor(train_data.title)
if isLoading:
    X_train,y_train,df_train = pp.get_data(train_data.preprocessed_folder,isLoading = isLoading)
else:
    X_train,y_train,df_train = pp.get_data(train_data.raw_folders,isLoading = isLoading)
print("max length: ",pp.max_len)

Loading preprocessed data...


100% |########################################################################|
100% |########################################################################|

Shape of X:  (33807, 1567)
Shape of y:  (33807, 1567)
Preprocessing complete.
max length:  1567





In [5]:
# data exploration
df_train.head()

Unnamed: 0.1,Unnamed: 0,docid,sentence,sentence_ids,labels,labels_ids,characters,padded_sentence,padded_labels
0,0,220-01,"['Record', 'date', ':', '2067', '-', '05', '-'...","[22072, 11668, 11342, 21682, 18197, 17387, 181...","['O', 'O', 'O', 'B-DATE', 'I-DATE', 'I-DATE', ...","[1, 1, 1, 24, 29, 29, 29, 29, 1, 1, 9, 1, 1, 1...","[(3, 9), (10, 14), (14, 15), (16, 20), (20, 21...","[22072, 11668, 11342, 21682, 18197, 17387, 181...","[1, 1, 1, 24, 29, 29, 29, 29, 1, 1, 9, 1, 1, 1..."
1,1,220-01,"['They', 'called', 'us', 'and', 'we', 'increas...","[23425, 2419, 12178, 4409, 7276, 9808, 13603, ...","['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', ...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...","[(149, 153), (154, 160), (161, 163), (164, 167...","[23425, 2419, 12178, 4409, 7276, 9808, 13603, ...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ..."
2,2,220-01,"['Saw', 'Dr', 'Oakley', '4', '/', '5', '/', '6...","[103, 116, 15705, 1202, 14933, 14168, 14933, 1...","['O', 'O', 'B-DOCTOR', 'B-DATE', 'I-DATE', 'I-...","[1, 1, 40, 24, 29, 29, 29, 29, 1, 1, 1, 1, 1, ...","[(283, 286), (287, 289), (290, 296), (297, 298...","[103, 116, 15705, 1202, 14933, 14168, 14933, 1...","[1, 1, 40, 24, 29, 29, 29, 29, 1, 1, 1, 1, 1, ..."
3,3,220-01,"['To', 'f', '/', 'u', '7', '/', '67', '.']","[2978, 14825, 14933, 10366, 12669, 14933, 1170...","['O', 'O', 'O', 'O', 'B-DATE', 'I-DATE', 'I-DA...","[1, 1, 1, 1, 24, 29, 29, 1]","[(356, 358), (359, 360), (360, 361), (361, 362...","[2978, 14825, 14933, 10366, 12669, 14933, 1170...","[1, 1, 1, 1, 24, 29, 29, 1, 0, 0, 0, 0, 0, 0, ..."
4,4,220-01,"['No', 'CP', ""'"", 's', 'since', 'last', 'admit...","[9369, 1490, 24731, 9005, 4248, 9006, 12984, 9...","['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O']","[1, 1, 1, 1, 1, 1, 1, 1]","[(370, 372), (373, 375), (375, 376), (376, 377...","[9369, 1490, 24731, 9005, 4248, 9006, 12984, 9...","[1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, ..."


In [6]:
# load test set
if isLoading:
    X_test,y_test,df_test = pp.create_test_set(test_data.preprocessed_folder,isLoading,test_data.title)
else:
    X_test,y_test,df_test = pp.create_test_set(test_data.raw_folders,isLoading,test_data.title)


Loading preprocessed test data...


100% |########################################################################|
100% |########################################################################|


Shape of X:  (22541, 1536)
Shape of y:  (22541, 1536)


In [7]:
# test data exploration
df_test.head()

Unnamed: 0.1,Unnamed: 0,docid,sentence,sentence_ids,labels,labels_ids,characters,padded_sentence,padded_labels
0,0,110-01,"['Record', 'date', ':', '2069', '-', '04', '-'...","[22072, 11668, 11342, 15765, 18197, 20339, 181...","['O', 'O', 'O', 'B-DATE', 'I-DATE', 'I-DATE', ...","[1, 1, 1, 24, 29, 29, 29, 29, 1, 1, 39, 1, 1, ...","[(3, 9), (10, 14), (14, 15), (16, 20), (20, 21...","[22072, 11668, 11342, 15765, 18197, 20339, 181...","[1, 1, 1, 24, 29, 29, 29, 29, 1, 1, 39, 1, 1, ..."
1,1,110-01,"['I', 'have', 'not', 'seen', 'him', 'since', '...","[24352, 20423, 3924, 16660, 19811, 4248, 21478...","['O', 'O', 'O', 'O', 'O', 'O', 'B-DATE', 'O']","[1, 1, 1, 1, 1, 1, 24, 1]","[(63, 64), (65, 69), (70, 73), (74, 78), (79, ...","[24352, 20423, 3924, 16660, 19811, 4248, 21478...","[1, 1, 1, 1, 1, 1, 24, 1, 0, 0, 0, 0, 0, 0, 0,..."
2,2,110-01,"['About', 'three', 'weeks', 'ago', 'he', 'stop...","[22618, 6769, 18281, 7295, 8351, 4469, 2719, 1...","['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', ...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...","[(100, 105), (106, 111), (112, 117), (118, 121...","[22618, 6769, 18281, 7295, 8351, 4469, 2719, 1...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ..."
3,3,110-01,"['He', 'does', 'feel', 'that', 'his', 'shoulde...","[8666, 1016, 19353, 15977, 2719, 24608, 6085, ...","['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', ...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1]","[(191, 193), (194, 198), (199, 203), (204, 208...","[8666, 1016, 19353, 15977, 2719, 24608, 6085, ...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, ..."
4,4,110-01,"['It', 'is', 'unclear', 'what', 'he', 'is', 'a...","[5727, 4076, 4185, 13537, 8351, 4076, 7222, 95...","['O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', 'O', ...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ...","[(249, 251), (252, 254), (255, 262), (263, 267...","[5727, 4076, 4185, 13537, 8351, 4076, 7222, 95...","[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, ..."


In [8]:
# import model stuff
from src.models.baseline import BaselineModel
from src.models.bilstm import BiLSTM
from src.models.bilstm_crf import BiLSTM_CRF
from pipeline.visualization import sample_output
from pipeline.train import train_CRF, train_vanilla
from random import randint
from sklearn.utils import shuffle
import tensorflow as tf
import numpy as np
import os
import matplotlib.pyplot as plt
from src.converter import get_label_positions, bio_to_i2d2
import xml.etree.ElementTree as ET
from typing import NamedTuple, List

In [9]:
# build model
model = BaselineModel(pp.vocab_size,pp.tag_size,pp.max_len)
checkpoint_dir = 'models/checkpoints/' + train_data.title + '/' + model.title + '/' 
if not os.path.exists(checkpoint_dir):
    os.makedirs(checkpoint_dir)
checkpoint = tf.train.Checkpoint(model=model)
manager = tf.train.CheckpointManager(checkpoint, checkpoint_dir, max_to_keep=3)

In [None]:
# train model
train_vanilla(model,X_train,y_train,batch_size = 64, epochs=10,sample_interval=10,manager=manager,pp=pp)

In [34]:
from pipeline.test import predict_document
from src.converter import get_label_positions
from xml.etree.ElementTree import Element, SubElement, Comment, tostring
from xml.dom import minidom

def my_test_to_i2d2(model,test_df,pp,checkpoint = None,manager= None):
    """
    Predicts the PHI for all the documents in a DataFrame. Writes them to evaluation_data in i2b2 format.
    """
    cwd = os.getcwd()
    print(cwd)

    if checkpoint is not None and manager is not None:
        print("Loading checkpoint...")
        checkpoint.restore(manager.latest_checkpoint)

    unique_docids = test_df["docid"].unique()
    for docid in unique_docids:
        print("Doc ID: ",docid)
        tree = ET.parse("../data/raw/testing-PHI-Gold-fixed/" + docid + ".xml") # must pass entire path
        root = tree.getroot()
        note = root.find('TEXT').text
        predictions, doc_df = predict_document(model,docid,test_df)
        doc_labels = get_label_positions(predictions,pp.idx2tag)
        xml_doc = my_bio_to_i2d2(doc_df,doc_labels,note)
        ET.ElementTree(xml_doc).write("evaluation_data/" + model.title + "/"+ docid+".xml")
        
def my_bio_to_i2d2(df,doc_labels,note):
    """
    Params: 
    df: DataFrame with SINGLE document
    labels: Indices of labels: (row,[cols])
    note: Raw note

    Returns:
    Predicted document in i2b2 format. Used for testing.
    """
    # Add tag elements to i2d2_tags list
#     print(doc_labels)
    i2d2_tags = []
    characters = df["characters"]
    tokens = df["sentence"]
    for i,(row,cols,tag) in enumerate(doc_labels):
        row_chars = eval(characters.iloc[row])
        row_tokens = eval(tokens.iloc[row])
        # print(row_chars)
        col_start = cols[0]
        col_end = cols[-1]
        if (col_start >= len(row_chars) and len(cols) == 1) or col_end >= len(row_chars): # edge case with last token
            print(row_chars)
            print(cols)
            print(tag)
            col_start -= 1
            col_end -= 1
        start = row_chars[col_start][0]
        end = row_chars[col_end][1]
        phi_array = row_tokens[cols[0]:cols[-1]+1] 
        phi_text = " ".join(phi_array)
        note_phi = note[start:end]
        if not phi_text == note_phi:
            pass
            # print("WARNING: mismatch between raw note and database. raw: "+note_phi + " DB: "+phi_text)
        # print("Start =",start, "End =",end,"Text =",note_phi, "Type =",tag)

        # i2b2 formatting
        xml_tag = Element(tag, 
        {
            'id':"P"+str(i),
            "start":str(start),
            "end":str(end),
            "text":note_phi,
            "TYPE":tag,
            "comment":""
        })
        i2d2_tags.append(xml_tag)
    # Create full XML document
    root = Element('deIdi2b2')
    text_child = SubElement(root,'TEXT')
    text_child.text = note
    tags_child = SubElement(root,"TAGS")
    for tag in i2d2_tags:
        SubElement(tags_child,tag.tag,attrib=tag.attrib)
    return root  

In [35]:
# test model
sample_output(model,X_train,y_train, pp = pp)

from pipeline.test import test_to_i2d2
# pipeline_test.test_vanilla(model, X_test, y_test)

my_test_to_i2d2(model,df_test, pp, checkpoint, manager)

Sentence #:  22643


100% |########################################################################|
 21% |###############                                                         |

Word            Pred : (True)
There          :O     (O)
is             :O     (O)
no             :O     (O)
hepatosplenomegaly:O     (O)
.              :O     (O)
C:\Users\abdul\Desktop\de-identification
Loading checkpoint...
Doc ID:  110-01


100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)


100% |########################################################################|
 29% |#####################                                                   |

Doc ID:  110-02


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  110-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (17, 1536)
Shape of y:  (17, 1536)
Doc ID:  110-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (41, 1536)
Shape of y:  (41, 1536)


100% |########################################################################|
 45% |#################################                                       |

Doc ID:  111-01


100% |########################################################################|
  2% |##                                                                      |

Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  111-02


100% |########################################################################|
100% |########################################################################|
 16% |############                                                            |

Shape of X:  (34, 1536)
Shape of y:  (34, 1536)
Doc ID:  111-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)


100% |########################################################################|
 15% |##########                                                              |

Doc ID:  111-04


100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)


100% |########################################################################|
  2% |##                                                                      |

Doc ID:  112-01


100% |########################################################################|


Shape of X:  (34, 1536)
Shape of y:  (34, 1536)
Doc ID:  112-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)


100% |########################################################################|
 53% |######################################                                  |

Doc ID:  112-03


100% |########################################################################|
 14% |##########                                                              |

Shape of X:  (26, 1536)
Shape of y:  (26, 1536)
Doc ID:  112-04


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (14, 1536)
Shape of y:  (14, 1536)
Doc ID:  112-05


100% |########################################################################|
100% |########################################################################|
 15% |###########                                                             |

Shape of X:  (25, 1536)
Shape of y:  (25, 1536)
Doc ID:  113-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (26, 1536)
Shape of y:  (26, 1536)


 45% |################################                                        |

Doc ID:  113-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (80, 1536)
Shape of y:  (80, 1536)


 67% |################################################                        |

Doc ID:  113-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (53, 1536)
Shape of y:  (53, 1536)
Doc ID: 

  3% |##                                                                      |

 113-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (57, 1536)
Shape of y:  (57, 1536)
Doc ID:  113-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (22, 1536)
Shape of y:  (22, 1536)
Doc ID:  114-01


100% |########################################################################|
100% |########################################################################|
  5% |###                                                                     |

Shape of X:  (58, 1536)
Shape of y:  (58, 1536)
Doc ID:  114-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (20, 1536)
Shape of y:  (20, 1536)


100% |########################################################################|
  7% |#####                                                                   |

Doc ID:  114-03


100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)


 77% |########################################################                |

Doc ID:  114-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)


100% |########################################################################|
 90% |#################################################################       |

Doc ID:  115-01


100% |########################################################################|


Shape of X:  (22, 1536)
Shape of y:  (22, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  115-02
Shape of X:  (17, 1536)
Shape of y:  (17, 1536)



100% |########################################################################|
 77% |########################################################                |

Doc ID:  115-03


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (18, 1536)
Shape of y:  (18, 1536)
Doc ID:  115-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (82, 1536)
Shape of y:  (82, 1536)


100% |########################################################################|
 32% |#######################                                                 |

Doc ID:  116-01


100% |########################################################################|
 18% |#############                                                           |

Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID:  116-02


100% |########################################################################|
100% |########################################################################|
  4% |###                                                                     |

Shape of X:  (22, 1536)
Shape of y:  (22, 1536)
Doc ID:  116-03


100% |########################################################################|
100% |########################################################################|
 16% |############                                                            |

Shape of X:  (23, 1536)
Shape of y:  (23, 1536)
Doc ID:  116-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)


100% |########################################################################|
  7% |#####                                                                   |

Doc ID:  116-05


100% |########################################################################|
 10% |#######                                                                 |

Shape of X:  (39, 1536)
Shape of y:  (39, 1536)
Doc ID:  117-01


100% |########################################################################|
100% |########################################################################|
  6% |####                                                                    |

Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID:  117-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (47, 1536)
Shape of y:  (47, 1536)
Doc ID:  118-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (28, 1536)
Shape of y:  (28, 1536)
[(4593, 4597), (4598, 4601), (4601, 4602), (4603, 4610), (4611, 4616), (4617, 4624), (4625, 4629), (4630, 4636), (4637, 4641), (4642, 4650), (4651, 4662), (4663, 4669), (4670, 4673), (4674, 4688), (4689, 4696), (4697, 4708), (4709, 4715), (4716, 4726), (4727, 4731), (4732, 4736), (4738, 4772), (4773, 4781), (4782, 4786), (4786, 4787), (4788, 4790), (4791, 4796)]
[26]
CITY


 84% |############################################################            |

Doc ID:  118-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (26, 1536)
Shape of y:  (26, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  118-03
Shape of X:  (11, 1536)
Shape of y:  (11, 1536)



100% |########################################################################|
 33% |########################                                                |

Doc ID:  118-04


100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (30, 1536)
Shape of y:  (30, 1536)
[(2747, 2754), (2755, 2758), (2759, 2763), (2764, 2768), (2769, 2771), (2772, 2779), (2780, 2784), (2784, 2785), (2786, 2792), (2793, 2801), (2802, 2806), (2807, 2815), (2816, 2824), (2831, 2838), (2839, 2845), (2845, 2846), (2847, 2849), (2850, 2853), (2854, 2861)]
[19]
CITY
Doc ID:  118-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (119, 1536)
Shape of y:  (119, 1536)


100% |########################################################################|
  2% |#                                                                       |

Doc ID:  119-01


100% |########################################################################|
  2% |##                                                                      |

Shape of X:  (37, 1536)
Shape of y:  (37, 1536)
Doc ID:  119-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID: 

100% |########################################################################|
 59% |##########################################                              |

 119-03


100% |########################################################################|


Shape of X:  (22, 1536)
Shape of y:  (22, 1536)
Doc ID:  119-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (17, 1536)
Shape of y:  (17, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  119-05
Shape of X:  (18, 1536)
Shape of y:  (18, 1536)



 76% |#######################################################                 |

Doc ID:  130-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (56, 1536)
Shape of y:  (56, 1536)


 25% |##################                                                      |

Doc ID:  130-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (63, 1536)
Shape of y:  (63, 1536)


 50% |####################################                                    |

Doc ID:  130-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (88, 1536)
Shape of y:  (88, 1536)


 95% |####################################################################    |

Doc ID:  130-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (43, 1536)
Shape of y:  (43, 1536)


100% |########################################################################|
 51% |#####################################                                   |

Doc ID:  130-05


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  131-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (117, 1536)
Shape of y:  (117, 1536)


 34% |########################                                                |

Doc ID:  131-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (141, 1536)
Shape of y:  (141, 1536)


 57% |#########################################                               |

Doc ID:  131-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (66, 1536)
Shape of y:  (66, 1536)


100% |########################################################################|
  5% |###                                                                     |

Doc ID:  131-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (37, 1536)
Shape of y:  (37, 1536)
Doc ID:  131-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (76, 1536)
Shape of y:  (76, 1536)
Doc ID:  132-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)


 59% |##########################################                              |

Doc ID:  132-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (62, 1536)
Shape of y:  (62, 1536)


100% |########################################################################|
  9% |######                                                                  |

Doc ID:  132-03


100% |########################################################################|


Shape of X:  (21, 1536)
Shape of y:  (21, 1536)


100% |########################################################################|
 25% |##################                                                      |

Doc ID:  132-04


100% |########################################################################|


Shape of X:  (28, 1536)
Shape of y:  (28, 1536)


 93% |###################################################################     |

Doc ID:  132-05


100% |########################################################################|
100% |########################################################################|
  4% |###                                                                     |

Shape of X:  (47, 1536)
Shape of y:  (47, 1536)
Doc ID:  134-01


100% |########################################################################|
100% |########################################################################|
  2% |##                                                                      |

Shape of X:  (23, 1536)
Shape of y:  (23, 1536)
Doc ID:  134-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)


 76% |######################################################                  |

Doc ID:  134-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (50, 1536)
Shape of y:  (50, 1536)


 73% |####################################################                    |

[(4698, 4699)]
[1]
CITY
Doc ID:  134-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (60, 1536)
Shape of y:  (60, 1536)


 64% |##############################################                          |

Doc ID:  134-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (62, 1536)
Shape of y:  (62, 1536)


 71% |###################################################                     |

Doc ID:  135-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (59, 1536)
Shape of y:  (59, 1536)
Doc ID:  135-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (27, 1536)
Shape of y:  (27, 1536)


 82% |###########################################################             |

Doc ID:  135-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (51, 1536)
Shape of y:  (51, 1536)


 54% |#######################################                                 |

[(9500, 9503), (9503, 9504), (9505, 9511), (9512, 9516), (9516, 9517), (9518, 9525), (9526, 9531), (9532, 9534), (9535, 9541), (9545, 9546), (9546, 9547), (9548, 9553), (9553, 9554), (9555, 9560), (9560, 9561), (9562, 9566), (9567, 9572), (9573, 9575), (9576, 9579), (9580, 9588), (9588, 9589), (9590, 9596), (9606, 9611), (9612, 9617), (9617, 9618), (9619, 9621), (9623, 9628), (9629, 9634)]
[28]
CITY
Doc ID:  135-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (75, 1536)
Shape of y:  (75, 1536)


100% |########################################################################|
 22% |################                                                        |

Doc ID:  136-01


100% |########################################################################|
  5% |###                                                                     |

Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
[(1322, 1324), (1324, 1325), (1325, 1330), (1330, 1331), (1331, 1340)]
[5]
CITY
Doc ID:  136-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (39, 1536)
Shape of y:  (39, 1536)
Doc ID:  136-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (26, 1536)
Shape of y:  (26, 1536)


100% |########################################################################|
  8% |#####                                                                   |

Doc ID:  136-04


100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)
Doc ID:  136-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (50, 1536)
Shape of y:  (50, 1536)


 75% |######################################################                  |

Doc ID:  137-01


100% |########################################################################|
100% |########################################################################|
  5% |####                                                                    |

Shape of X:  (58, 1536)
Shape of y:  (58, 1536)
Doc ID:  137-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (67, 1536)
Shape of y:  (67, 1536)


100% |########################################################################|
 36% |##########################                                              |

Doc ID:  137-03


100% |########################################################################|


Shape of X:  (30, 1536)
Shape of y:  (30, 1536)


100% |########################################################################|
 18% |#############                                                           |

Doc ID:  137-04


100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)


 95% |####################################################################    |

Doc ID:  138-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (44, 1536)
Shape of y:  (44, 1536)
Doc ID:  138-02

 82% |###########################################################             |




100% |########################################################################|
100% |########################################################################|


Shape of X:  (50, 1536)
Shape of y:  (50, 1536)


 61% |############################################                            |

Doc ID:  138-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (67, 1536)
Shape of y:  (67, 1536)


 55% |########################################                                |

Doc ID:  138-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (68, 1536)
Shape of y:  (68, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  138-05
Shape of X:  (15, 1536)
Shape of y:  (15, 1536)



 72% |####################################################                    |

Doc ID:  139-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)
Doc ID: 

100% |########################################################################|
 48% |##################################                                      |

 139-02


100% |########################################################################|


Shape of X:  (25, 1536)
Shape of y:  (25, 1536)


 65% |##############################################                          |

Doc ID:  139-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (63, 1536)
Shape of y:  (63, 1536)


100% |########################################################################|
  7% |#####                                                                   |

Doc ID:  139-04


100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (38, 1536)
Shape of y:  (38, 1536)
Doc ID:  139-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (52, 1536)
Shape of y:  (52, 1536)


100% |########################################################################|
  5% |###                                                                     |

Doc ID:  160-01


100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)


100% |########################################################################|
 80% |##########################################################              |

Doc ID:  160-02


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (21, 1536)
Shape of y:  (21, 1536)
Doc ID:  160-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (14, 1536)
Shape of y:  (14, 1536)


100% |########################################################################|
 62% |#############################################                           |

Doc ID:  160-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  160-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)
Doc ID:  161-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)
Doc ID:  161-02


100% |########################################################################|
100% |########################################################################|
 20% |##############                                                          |

Shape of X:  (19, 1536)
Shape of y:  (19, 1536)
Doc ID:  161-03


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (10, 1536)
Shape of y:  (10, 1536)
Doc ID:  161-04


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (41, 1536)
Shape of y:  (41, 1536)
Doc ID:  161-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID:  162-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (44, 1536)
Shape of y:  (44, 1536)
Doc ID:  162-02


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (19, 1536)
Shape of y:  (19, 1536)
Doc ID:  162-03


100% |########################################################################|
100% |########################################################################|
  5% |###                                                                     |

Shape of X:  (41, 1536)
Shape of y:  (41, 1536)
Doc ID:  162-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (75, 1536)
Shape of y:  (75, 1536)


 86% |##############################################################          |

Doc ID:  162-05


100% |########################################################################|
100% |########################################################################|
  1% |#                                                                       |

Shape of X:  (44, 1536)
Shape of y:  (44, 1536)
Doc ID:  163-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (56, 1536)
Shape of y:  (56, 1536)


100% |########################################################################|
 66% |################################################                        |

Doc ID:  163-02


100% |########################################################################|


Shape of X:  (21, 1536)
Shape of y:  (21, 1536)
Doc ID: 

 55% |########################################                                |

 163-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (70, 1536)
Shape of y:  (70, 1536)


 74% |#####################################################                   |

Doc ID:  163-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)


100% |########################################################################|
 58% |##########################################                              |

Doc ID:  163-05


100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  164-01


100% |########################################################################|
100% |########################################################################|
  2% |##                                                                      |

Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  164-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)
Doc ID:  164-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (13, 1536)
Shape of y:  (13, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  164-04
Shape of X:  (18, 1536)
Shape of y:  (18, 1536)



100% |########################################################################|
100% |########################################################################|


Doc ID:  164-05
Shape of X:  (20, 1536)
Shape of y:  (20, 1536)


100% |########################################################################|
100% |########################################################################|


Doc ID:  165-01
Shape of X:  (15, 1536)
Shape of y:  (15, 1536)


100% |########################################################################|
100% |########################################################################|


Doc ID:  165-02
Shape of X:  (18, 1536)
Shape of y:  (18, 1536)


 88% |###############################################################         |

Doc ID:  165-03


100% |########################################################################|
100% |########################################################################|
  1% |                                                                        |

Shape of X:  (43, 1536)
Shape of y:  (43, 1536)
Doc ID:  165-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (80, 1536)
Shape of y:  (80, 1536)


 26% |##################                                                      |

Doc ID:  166-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (50, 1536)
Shape of y:  (50, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  166-02
Shape of X:  (16, 1536)
Shape of y:  (16, 1536)



 63% |#############################################                           |

[(1788, 1795), (1796, 1801), (1801, 1802), (1803, 1805), (1806, 1807), (1807, 1815), (1815, 1816), (1818, 1824), (1825, 1830), (1830, 1831), (1832, 1834), (1835, 1836), (1836, 1845), (1845, 1846), (1849, 1851), (1851, 1852)]
[16]
PHONE
Doc ID:  166-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (63, 1536)
Shape of y:  (63, 1536)


 49% |###################################                                     |

Doc ID:  166-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (75, 1536)
Shape of y:  (75, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  167-01
Shape of X:  (19, 1536)
Shape of y:  (19, 1536)



 86% |##############################################################          |

Doc ID:  167-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)


100% |########################################################################|
 70% |##################################################                      |

Doc ID:  167-03


100% |########################################################################|


Shape of X:  (20, 1536)
Shape of y:  (20, 1536)
Doc ID:  167-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (86, 1536)
Shape of y:  (86, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  168-01
Shape of X:  (15, 1536)
Shape of y:  (15, 1536)



100% |########################################################################|
 95% |####################################################################    |

Doc ID:  168-02


100% |########################################################################|


Shape of X:  (20, 1536)
Shape of y:  (20, 1536)


 44% |################################                                        |

Doc ID:  168-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (72, 1536)
Shape of y:  (72, 1536)


100% |########################################################################|
 11% |########                                                                |

Doc ID:  168-04


100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  

100% |########################################################################|
 40% |#############################                                           |

169-01


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  169-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (7, 1536)
Shape of y:  (7, 1536)


100% |########################################################################|
 48% |##################################                                      |

[(962, 970), (971, 974), (975, 981), (982, 987), (988, 997), (998, 1002), (1003, 1007), (1008, 1009), (1009, 1010), (1011, 1021), (1022, 1025), (1026, 1032), (1032, 1033), (1034, 1039), (1039, 1040), (1041, 1044), (1045, 1049), (1050, 1053), (1054, 1055), (1056, 1060), (1061, 1065), (1069, 1078), (1079, 1083), (1083, 1084), (1086, 1087), (1088, 1093), (1094, 1099), (1099, 1100), (1100, 1101), (1103, 1113), (1114, 1117), (1118, 1124), (1125, 1126), (1127, 1131), (1132, 1136), (1138, 1142), (1143, 1146), (1147, 1148), (1148, 1149), (1150, 1154), (1155, 1159), (1161, 1169), (1170, 1175), (1176, 1180), (1181, 1183), (1183, 1184), (1184, 1186), (1186, 1187), (1187, 1188), (1188, 1189), (1191, 1196), (1197, 1204), (1205, 1206), (1206, 1209), (1210, 1212), (1213, 1215), (1217, 1218), (1218, 1219), (1219, 1220), (1220, 1223), (1223, 1225), (1225, 1226), (1226, 1227), (1228, 1230), (1231, 1235), (1237, 1244), (1245, 1252), (1254, 1257), (1258, 1261), (1262, 1263), (1263, 1264), (1264, 1265), (1

100% |########################################################################|
  0% |                                                                        |

Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  169-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (77, 1536)
Shape of y:  (77, 1536)


 48% |##################################                                      |

Doc ID:  190-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (70, 1536)
Shape of y:  (70, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  190-02



  5% |####                                                                    |

Shape of X:  (18, 1536)
Shape of y:  (18, 1536)
Doc ID:  190-03


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (36, 1536)
Shape of y:  (36, 1536)
Doc ID:  190-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)


 91% |#################################################################       |

Doc ID:  190-05


100% |########################################################################|
100% |########################################################################|
  4% |##                                                                      |

Shape of X:  (45, 1536)
Shape of y:  (45, 1536)
Doc ID:  191-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)


100% |########################################################################|
 26% |###################                                                     |

[(5360, 5370), (5371, 5379), (5379, 5380), (5390, 5396), (5396, 5397), (5399, 5447), (5457, 5487), (5525, 5531), (5531, 5532), (5533, 5539), (5540, 5541), (5541, 5542), (5542, 5544)]
[13]
CITY
Doc ID:  191-02


100% |########################################################################|


Shape of X:  (26, 1536)
Shape of y:  (26, 1536)


 56% |########################################                                |

Doc ID:  191-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (73, 1536)
Shape of y:  (73, 1536)


100% |########################################################################|
100% |########################################################################|

[(10299, 10332), (10334, 10340), (10341, 10346), (10346, 10347), (10348, 10350), (10352, 10357), (10358, 10359), (10359, 10364)]
[8]
IDNUM
Doc ID:  191-04
Shape of X:  (9, 1536)
Shape of y:  (9, 1536)



100% |########################################################################|
100% |########################################################################|

Doc ID:  192-01
Shape of X:  (14, 1536)
Shape of y:  (14, 1536)



100% |########################################################################|
 31% |######################                                                  |

Doc ID:  192-02


100% |########################################################################|
 17% |############                                                            |

Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
[(1176, 1177), (1177, 1178), (1178, 1179), (1181, 1188), (1189, 1191), (1192, 1197), (1198, 1207)]
[7]
CITY
Doc ID:  192-03


100% |########################################################################|
100% |########################################################################|
 22% |################                                                        |

Shape of X:  (23, 1536)
Shape of y:  (23, 1536)
Doc ID:  192-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (22, 1536)
Shape of y:  (22, 1536)
Doc ID:  193-01


100% |########################################################################|
100% |########################################################################|
  2% |#                                                                       |

Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID:  193-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (39, 1536)
Shape of y:  (39, 1536)
Doc ID:  193-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)


100% |########################################################################|
 11% |########                                                                |

Doc ID:  193-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  193-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (110, 1536)
Shape of y:  (110, 1536)


 44% |################################                                        |

Doc ID:  194-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (107, 1536)
Shape of y:  (107, 1536)


 56% |########################################                                |

[(9213, 9283), (9285, 9289), (9294, 9299), (9300, 9303), (9331, 9336), (9338, 9339), (9340, 9345), (9347, 9350), (9350, 9351), (9351, 9352)]
[10]
CITY
Doc ID:  194-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (73, 1536)
Shape of y:  (73, 1536)


 57% |#########################################                               |

Doc ID:  194-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (69, 1536)
Shape of y:  (69, 1536)


100% |########################################################################|
 37% |###########################                                             |

Doc ID:  194-04


100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
Doc ID:  194-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (32, 1536)
Shape of y:  (32, 1536)


 97% |######################################################################  |

Doc ID:  195-01


100% |########################################################################|
100% |########################################################################|
  4% |###                                                                     |

Shape of X:  (37, 1536)
Shape of y:  (37, 1536)
Doc ID:  195-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)


 56% |########################################                                |

Doc ID:  195-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (67, 1536)
Shape of y:  (67, 1536)


100% |########################################################################|
 24% |#################                                                       |

Doc ID:  196-01


100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)


100% |########################################################################|
 36% |#########################                                               |

Doc ID:  196-02


100% |########################################################################|


Shape of X:  (25, 1536)
Shape of y:  (25, 1536)


100% |########################################################################|
 31% |######################                                                  |

Doc ID:  196-03


100% |########################################################################|


Shape of X:  (22, 1536)
Shape of y:  (22, 1536)


 63% |#############################################                           |

Doc ID:  196-04


100% |########################################################################|
100% |########################################################################|
  6% |####                                                                    |

Shape of X:  (22, 1536)
Shape of y:  (22, 1536)
Doc ID:  196-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
Doc ID:  197-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (65, 1536)
Shape of y:  (65, 1536)


100% |########################################################################|
  5% |####                                                                    |

Doc ID:  197-02


100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)


100% |########################################################################|
 70% |##################################################                      |

Doc ID:  197-03


100% |########################################################################|
  2% |#                                                                       |

Shape of X:  (20, 1536)
Shape of y:  (20, 1536)
Doc ID:  197-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (47, 1536)
Shape of y:  (47, 1536)


 87% |###############################################################         |

Doc ID:  197-05


100% |########################################################################|
100% |########################################################################|
  8% |#####                                                                   |

Shape of X:  (48, 1536)
Shape of y:  (48, 1536)
Doc ID:  198-01


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (25, 1536)
Shape of y:  (25, 1536)
Doc ID:  198-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (234, 1536)
Shape of y:  (234, 1536)


 73% |####################################################                    |

[(7530, 7532), (7533, 7539), (7540, 7543), (7543, 7544), (7544, 7552), (7553, 7555), (7556, 7559), (7560, 7562), (7562, 7564), (7565, 7566), (7566, 7569), (7570, 7580), (7581, 7583), (7584, 7591), (7592, 7593), (7593, 7594), (7594, 7595), (7596, 7598), (7599, 7602), (7603, 7605), (7605, 7607), (7608, 7609), (7609, 7612), (7613, 7614), (7615, 7618), (7618, 7620)]
[26]
CITY
[(7622, 7624), (7625, 7631), (7632, 7635), (7635, 7636), (7636, 7644), (7645, 7647), (7648, 7651), (7652, 7654), (7654, 7656), (7657, 7658), (7658, 7661), (7662, 7672), (7673, 7675), (7676, 7683), (7684, 7685), (7685, 7686), (7686, 7687), (7688, 7690), (7691, 7694), (7695, 7697), (7697, 7699), (7700, 7701), (7701, 7704), (7705, 7706), (7707, 7710), (7710, 7713)]
[26]
CITY
Doc ID:  198-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (53, 1536)
Shape of y:  (53, 1536)


 42% |##############################                                          |

Doc ID:  198-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (113, 1536)
Shape of y:  (113, 1536)


100% |########################################################################|

Doc ID:  199-01



100% |########################################################################|
  0% |                                                                        |

Shape of X:  (41, 1536)
Shape of y:  (41, 1536)
Doc ID:  199-02


100% |########################################################################|
100% |########################################################################|
  1% |                                                                        |

Shape of X:  (43, 1536)
Shape of y:  (43, 1536)
Doc ID:  199-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (77, 1536)
Shape of y:  (77, 1536)


100% |########################################################################|
 31% |######################                                                  |

Doc ID:  199-04


100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
Doc ID:  199-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)
Doc ID: 

100% |########################################################################|
100% |########################################################################|

 200-01
Shape of X:  (19, 1536)
Shape of y:  (19, 1536)



100% |########################################################################|
  3% |##                                                                      |

Doc ID:  200-02


100% |########################################################################|


Shape of X:  (28, 1536)
Shape of y:  (28, 1536)
[(5263, 5305), (5306, 5311), (5312, 5315), (5315, 5316), (5317, 5319)]
[5]
CITY


 84% |############################################################            |

Doc ID:  200-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (45, 1536)
Shape of y:  (45, 1536)
Doc ID:  200-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (45, 1536)
Shape of y:  (45, 1536)


100% |########################################################################|
 21% |###############                                                         |

[(5357, 5360), (5361, 5370), (5371, 5376), (5377, 5383), (5383, 5384), (5385, 5387), (5388, 5393)]
[7]
CITY
Doc ID:  201-01


100% |########################################################################|


Shape of X:  (28, 1536)
Shape of y:  (28, 1536)
Doc ID:  201-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (47, 1536)
Shape of y:  (47, 1536)


100% |########################################################################|
 20% |##############                                                          |

Doc ID:  201-03


100% |########################################################################|
  1% |#                                                                       |

Shape of X:  (30, 1536)
Shape of y:  (30, 1536)
Doc ID:  201-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (103, 1536)
Shape of y:  (103, 1536)


 47% |#################################                                       |

Doc ID:  201-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (89, 1536)
Shape of y:  (89, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  202-01
Shape of X:  (13, 1536)
Shape of y:  (13, 1536)



 77% |#######################################################                 |

Doc ID:  202-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)


 45% |################################                                        |

Doc ID:  202-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (91, 1536)
Shape of y:  (91, 1536)


 39% |############################                                            |

Doc ID:  203-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (106, 1536)
Shape of y:  (106, 1536)


 24% |#################                                                       |

Doc ID:  203-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (89, 1536)
Shape of y:  (89, 1536)


 45% |################################                                        |

Doc ID:  203-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (105, 1536)
Shape of y:  (105, 1536)


 52% |######################################                                  |

[(4469, 4478), (4479, 4488), (4489, 4497), (4498, 4499), (4500, 4508), (4509, 4515), (4516, 4522), (4523, 4525), (4526, 4531)]
[9]
CITY
Doc ID:  203-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (68, 1536)
Shape of y:  (68, 1536)


 57% |#########################################                               |

[(4621, 4630), (4631, 4640), (4641, 4649), (4650, 4652), (4653, 4661), (4662, 4668), (4668, 4669), (4670, 4680), (4681, 4688), (4689, 4695), (4695, 4696), (4697, 4699), (4700, 4705), (4705, 4706), (4706, 4710)]
[15]
CITY
Doc ID:  203-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (71, 1536)
Shape of y:  (71, 1536)


100% |########################################################################|
 94% |###################################################################     |

Doc ID:  204-01


100% |########################################################################|


Shape of X:  (17, 1536)
Shape of y:  (17, 1536)


 85% |#############################################################           |

Doc ID:  204-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)


 56% |########################################                                |

Doc ID:  204-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (67, 1536)
Shape of y:  (67, 1536)


100% |########################################################################|
 77% |########################################################                |

Doc ID:  204-04


100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)


 60% |###########################################                             |

Doc ID:  205-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (61, 1536)
Shape of y:  (61, 1536)
Doc ID:  205-02


100% |########################################################################|
100% |########################################################################|
  1% |#                                                                       |

Shape of X:  (34, 1536)
Shape of y:  (34, 1536)
Doc ID:  205-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (71, 1536)
Shape of y:  (71, 1536)


 86% |#############################################################           |

Doc ID:  206-01


100% |########################################################################|
100% |########################################################################|
  2% |#                                                                       |

Shape of X:  (43, 1536)
Shape of y:  (43, 1536)
Doc ID:  206-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (41, 1536)
Shape of y:  (41, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  206-03
Shape of X:  (16, 1536)
Shape of y:  (16, 1536)



100% |########################################################################|
 18% |#############                                                           |

Doc ID:  206-04


100% |########################################################################|
  5% |####                                                                    |

Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  207-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (72, 1536)
Shape of y:  (72, 1536)


100% |########################################################################|
 20% |##############                                                          |

Doc ID:  207-02


100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
Doc ID: 

100% |########################################################################|
 56% |########################################                                |

 207-03


100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)
Doc ID: 

 90% |################################################################        |

 207-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (41, 1536)
Shape of y:  (41, 1536)
Doc ID:  208-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)


100% |########################################################################|
 32% |#######################                                                 |

Doc ID:  208-02


100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (28, 1536)
Shape of y:  (28, 1536)
Doc ID:  208-03


100% |########################################################################|
100% |########################################################################|
  2% |#                                                                       |

Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
Doc ID:  209-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (87, 1536)
Shape of y:  (87, 1536)


 31% |######################                                                  |

Doc ID:  209-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (129, 1536)
Shape of y:  (129, 1536)


 42% |##############################                                          |

[(6685, 6691), (6691, 6692), (6692, 6702), (6703, 6704), (6705, 6708), (6709, 6712), (6714, 6720), (6720, 6721), (6721, 6733), (6734, 6735), (6738, 6744), (6744, 6745), (6745, 6758), (6759, 6760), (6761, 6764), (6765, 6766), (6768, 6772), (6772, 6773), (6773, 6782), (6783, 6784), (6785, 6788), (6789, 6792), (6794, 6795), (6795, 6796), (6797, 6803), (6803, 6804), (6804, 6809), (6809, 6816)]
[28]
CITY
Doc ID:  209-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (90, 1536)
Shape of y:  (90, 1536)


100% |########################################################################|
 89% |################################################################        |

Doc ID:  209-04


100% |########################################################################|


Shape of X:  (19, 1536)
Shape of y:  (19, 1536)


 76% |#######################################################                 |

Doc ID:  210-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (52, 1536)
Shape of y:  (52, 1536)
Doc ID: 

 97% |######################################################################  |

 210-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID: 

 70% |###################################################                     |

 210-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (55, 1536)
Shape of y:  (55, 1536)


 42% |##############################                                          |

Doc ID:  210-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)


 41% |##############################                                          |

Doc ID:  211-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (93, 1536)
Shape of y:  (93, 1536)


 41% |##############################                                          |

[(7037, 7048), (7048, 7049), (7050, 7057), (7057, 7058), (7059, 7065), (7073, 7079), (7080, 7089), (7089, 7090), (7091, 7093), (7094, 7097), (7098, 7103)]
[11]
CITY
Doc ID:  211-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (86, 1536)
Shape of y:  (86, 1536)


 97% |######################################################################  |

Doc ID:  211-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (42, 1536)
Shape of y:  (42, 1536)
[(3915, 3923), (3924, 3932), (3934, 3945), (3946, 3954), (3955, 3963)]
[5]
CITY
Doc ID: 

100% |########################################################################|

 211-04



100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)
[(3433, 3440), (3441, 3446), (3447, 3450), (3451, 3453), (3454, 3458), (3458, 3459), (3459, 3461), (3462, 3468), (3476, 3480), (3481, 3485), (3485, 3486), (3487, 3489), (3489, 3490), (3491, 3493), (3493, 3494), (3494, 3495), (3497, 3498), (3499, 3504)]
[18]
CITY


100% |########################################################################|
 38% |###########################                                             |

Doc ID:  211-05


100% |########################################################################|


Shape of X:  (26, 1536)
Shape of y:  (26, 1536)


100% |########################################################################|
 43% |###############################                                         |

Doc ID:  212-01


100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  212-02
Shape of X:  (4, 1536)
Shape of y:  (4, 1536)



 70% |##################################################                      |

Doc ID:  212-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (51, 1536)
Shape of y:  (51, 1536)


100% |########################################################################|

Doc ID:  213-01



100% |########################################################################|
  0% |                                                                        |

Shape of X:  (41, 1536)
Shape of y:  (41, 1536)
Doc ID:  213-02


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (28, 1536)
Shape of y:  (28, 1536)
Doc ID:  213-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)


 68% |#################################################                       |

Doc ID:  213-04


100% |########################################################################|
100% |########################################################################|
  1% |#                                                                       |

Shape of X:  (51, 1536)
Shape of y:  (51, 1536)
Doc ID:  214-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (65, 1536)
Shape of y:  (65, 1536)


100% |########################################################################|
 14% |##########                                                              |

Doc ID:  214-02


100% |########################################################################|


Shape of X:  (34, 1536)
Shape of y:  (34, 1536)
[(2923, 2927), (2928, 2932), (2933, 2940), (2940, 2941), (2946, 2955), (2956, 2961), (2961, 2962)]
[7]
DOCTOR


100% |########################################################################|
100% |########################################################################|

Doc ID:  214-03
Shape of X: 


100% |########################################################################|
 44% |################################                                        |

 (18, 1536)
Shape of y:  (18, 1536)
[(1499, 1503), (1504, 1508), (1509, 1516), (1516, 1517), (1522, 1531), (1532, 1537), (1537, 1538)]
[7]
DOCTOR
Doc ID:  214-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  215-01


100% |########################################################################|
100% |########################################################################|
 12% |#########                                                               |

Shape of X:  (26, 1536)
Shape of y:  (26, 1536)
Doc ID:  215-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (32, 1536)
Shape of y:  (32, 1536)
Doc ID:  215-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID: 

100% |########################################################################|
 22% |################                                                        |

 215-04


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)


100% |########################################################################|
  5% |####                                                                    |

Doc ID:  215-05


100% |########################################################################|


Shape of X:  (34, 1536)
Shape of y:  (34, 1536)


 82% |###########################################################             |

Doc ID:  216-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)
Doc ID:  216-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (73, 1536)
Shape of y:  (73, 1536)
Doc ID:  216-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (66, 1536)
Shape of y:  (66, 1536)


 36% |##########################                                              |

Doc ID:  216-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (125, 1536)
Shape of y:  (125, 1536)


100% |########################################################################|
 60% |###########################################                             |

Doc ID:  216-05


100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)


 97% |######################################################################  |

Doc ID:  217-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (39, 1536)
Shape of y:  (39, 1536)


100% |########################################################################|
 65% |##############################################                          |

Doc ID:  217-02


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (23, 1536)
Shape of y:  (23, 1536)
Doc ID:  217-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)


 67% |################################################                        |

Doc ID:  217-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)


 68% |#################################################                       |

Doc ID:  218-01


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (51, 1536)
Shape of y:  (51, 1536)
[(9013, 9021), (9023, 9024), (9024, 9025), (9026, 9034), (9034, 9035), (9036, 9038), (9039, 9044), (9045, 9047), (9048, 9057), (9057, 9058), (9059, 9063), (9064, 9070), (9072, 9073), (9073, 9074), (9075, 9083), (9085, 9086), (9086, 9087), (9088, 9091), (9107, 9111), (9112, 9116), (9116, 9117), (9118, 9120), (9122, 9128), (9129, 9131), (9132, 9140), (9143, 9148), (9149, 9154)]
[27]
PROFESSION
Doc ID:  218-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)
Doc ID: 

 72% |####################################################                    |

 218-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (47, 1536)
Shape of y:  (47, 1536)


 46% |#################################                                       |

Doc ID:  218-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (76, 1536)
Shape of y:  (76, 1536)


 53% |######################################                                  |

Doc ID:  218-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (62, 1536)
Shape of y:  (62, 1536)


 71% |###################################################                     |

[(6651, 6679), (6680, 6685), (6686, 6693), (6693, 6694), (6695, 6697), (6698, 6700), (6701, 6707), (6709, 6712), (6713, 6729), (6730, 6735), (6736, 6741)]
[11]
CITY
Doc ID:  219-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (53, 1536)
Shape of y:  (53, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  219-02
Shape of X:  (4, 1536)
Shape of y:  (4, 1536)



 70% |##################################################                      |

Doc ID:  219-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)


 40% |#############################                                           |

Doc ID:  219-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (89, 1536)
Shape of y:  (89, 1536)


 77% |#######################################################                 |

Doc ID:  219-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  230-01
Shape of X:  (5, 1536)
Shape of y:  (5, 1536)



 41% |##############################                                          |

Doc ID:  230-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (91, 1536)
Shape of y:  (91, 1536)


 57% |#########################################                               |

[(3712, 3714), (3716, 3723), (3723, 3724), (3725, 3730), (3731, 3733), (3734, 3739)]
[6]
CITY
Doc ID:  230-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (14, 1536)
Shape of y:  (14, 1536)
Doc ID:  231-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (56, 1536)
Shape of y:  (56, 1536)


 48% |###################################                                     |

Doc ID:  231-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (78, 1536)
Shape of y:  (78, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  231-03
Shape of X:  (14, 1536)
Shape of y:  (14, 1536)



 74% |#####################################################                   |

Doc ID:  231-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)


 84% |#############################################################           |

Doc ID:  231-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)


100% |########################################################################|
 25% |##################                                                      |

Doc ID:  232-01


100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  232-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (63, 1536)
Shape of y:  (63, 1536)


100% |########################################################################|
 16% |###########                                                             |

Doc ID:  232-03


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID: 

 43% |###############################                                         |

 232-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (90, 1536)
Shape of y:  (90, 1536)


100% |########################################################################|
 34% |########################                                                |

Doc ID:  233-01


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (26, 1536)
Shape of y:  (26, 1536)
Doc ID:  233-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)
Doc ID:  233-03


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (43, 1536)
Shape of y:  (43, 1536)
Doc ID:  233-04


100% |########################################################################|
100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (19, 1536)
Shape of y:  (19, 1536)
Doc ID:  233-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)


 75% |######################################################                  |

Doc ID:  234-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)
Doc ID: 

 60% |###########################################                             |

 234-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (63, 1536)
Shape of y:  (63, 1536)


100% |########################################################################|

Doc ID:  234-03



100% |########################################################################|


Shape of X:  (32, 1536)
Shape of y:  (32, 1536)


 66% |###############################################                         |

Doc ID:  234-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (56, 1536)
Shape of y:  (56, 1536)
Doc ID: 

100% |########################################################################|
 40% |#############################                                           |

 234-05


100% |########################################################################|


Shape of X:  (27, 1536)
Shape of y:  (27, 1536)


100% |########################################################################|
  5% |###                                                                     |

Doc ID:  235-01


100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (38, 1536)
Shape of y:  (38, 1536)
Doc ID:  235-02


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (53, 1536)
Shape of y:  (53, 1536)
Doc ID:  235-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  235-04
Shape of X:  (16, 1536)
Shape of y:  (16, 1536)



 92% |##################################################################      |

Doc ID:  235-05


100% |########################################################################|
100% |########################################################################|
  6% |####                                                                    |

Shape of X:  (42, 1536)
Shape of y:  (42, 1536)
Doc ID:  236-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (60, 1536)
Shape of y:  (60, 1536)


 71% |###################################################                     |

Doc ID:  236-02


100% |########################################################################|
100% |########################################################################|
  5% |####                                                                    |

Shape of X:  (53, 1536)
Shape of y:  (53, 1536)
Doc ID:  236-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)


100% |########################################################################|
 15% |###########                                                             |

Doc ID:  236-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (32, 1536)
Shape of y:  (32, 1536)
Doc ID:  236-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID:  237-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (62, 1536)
Shape of y:  (62, 1536)
Doc ID:  237-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  237-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)


 63% |##############################################                          |

Doc ID:  237-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (61, 1536)
Shape of y:  (61, 1536)


 57% |#########################################                               |

Doc ID:  238-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (61, 1536)
Shape of y:  (61, 1536)
Doc ID: 

100% |########################################################################|
100% |########################################################################|

 238-02
Shape of X:  (6, 1536)
Shape of y:  (6, 1536)



100% |########################################################################|
  8% |######                                                                  |

Doc ID:  238-03


100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)


 73% |####################################################                    |

Doc ID:  238-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (52, 1536)
Shape of y:  (52, 1536)


100% |########################################################################|
 12% |#########                                                               |

Doc ID:  239-01


100% |########################################################################|
  2% |#                                                                       |

Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID:  239-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (47, 1536)
Shape of y:  (47, 1536)
Doc ID:  239-03


100% |########################################################################|
100% |########################################################################|
  1% |                                                                        |

Shape of X:  (30, 1536)
Shape of y:  (30, 1536)
Doc ID:  239-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (77, 1536)
Shape of y:  (77, 1536)


 72% |####################################################                    |

Doc ID:  260-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (55, 1536)
Shape of y:  (55, 1536)
Doc ID: 

 75% |######################################################                  |

 260-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)


 86% |#############################################################           |

Doc ID:  260-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (43, 1536)
Shape of y:  (43, 1536)


 35% |#########################                                               |

Doc ID:  260-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)


100% |########################################################################|
  9% |######                                                                  |

Doc ID:  260-05


100% |########################################################################|
  5% |####                                                                    |

Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  262-01


100% |########################################################################|
100% |########################################################################|
  1% |                                                                        |

Shape of X:  (18, 1536)
Shape of y:  (18, 1536)
Doc ID:  262-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (74, 1536)
Shape of y:  (74, 1536)
Doc ID:  262-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (147, 1536)
Shape of y:  (147, 1536)


100% |########################################################################|
 90% |################################################################        |

Doc ID:  262-04


100% |########################################################################|


Shape of X:  (20, 1536)
Shape of y:  (20, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  263-01
Shape of X:  (12, 1536)
Shape of y:  (12, 1536)



100% |########################################################################|

Doc ID:  263-02



100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)
Doc ID:  263-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (25, 1536)
Shape of y:  (25, 1536)
Doc ID:  263-04


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (38, 1536)
Shape of y:  (38, 1536)
Doc ID:  263-05


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (17, 1536)
Shape of y:  (17, 1536)
Doc ID:  264-01


100% |########################################################################|
100% |########################################################################|
  5% |###                                                                     |

Shape of X:  (32, 1536)
Shape of y:  (32, 1536)
Doc ID:  264-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)


 80% |#########################################################               |

Doc ID:  264-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)
Doc ID:  264-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)


100% |########################################################################|
 13% |#########                                                               |

Doc ID:  265-01


100% |########################################################################|


Shape of X:  (30, 1536)
Shape of y:  (30, 1536)
Doc ID: 

 80% |#########################################################               |

 265-02


100% |########################################################################|
100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  265-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)


 71% |###################################################                     |

Doc ID:  265-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (52, 1536)
Shape of y:  (52, 1536)
Doc ID:  266-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (4, 1536)
Shape of y:  (4, 1536)


100% |########################################################################|
 41% |##############################                                          |

Doc ID:  266-02


100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)


100% |########################################################################|
 47% |##################################                                      |

Doc ID:  266-03


100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  266-04
Shape of X:  (11, 1536)
Shape of y:  (11, 1536)



100% |########################################################################|
 27% |###################                                                     |

Doc ID:  267-01


100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)


100% |########################################################################|
 16% |###########                                                             |

Doc ID:  267-02


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID: 

 15% |###########                                                             |

 267-03


100% |########################################################################|
100% |########################################################################|
  7% |#####                                                                   |

Shape of X:  (26, 1536)
Shape of y:  (26, 1536)
Doc ID:  267-04


100% |########################################################################|
100% |########################################################################|
  1% |#                                                                       |

Shape of X:  (39, 1536)
Shape of y:  (39, 1536)
Doc ID:  268-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (62, 1536)
Shape of y:  (62, 1536)


 38% |############################                                            |

Doc ID:  268-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (90, 1536)
Shape of y:  (90, 1536)


 53% |######################################                                  |

Doc ID:  268-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (73, 1536)
Shape of y:  (73, 1536)


 63% |#############################################                           |

Doc ID:  268-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)


 45% |################################                                        |

Doc ID:  269-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (82, 1536)
Shape of y:  (82, 1536)


 77% |#######################################################                 |

Doc ID:  269-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)
[(2399, 2409), (2410, 2417)]
[2]
ORGANIZATION


 77% |#######################################################                 |

Doc ID:  269-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (44, 1536)
Shape of y:  (44, 1536)
Doc ID:  269-04


100% |########################################################################|
100% |########################################################################|
  4% |###                                                                     |

Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID:  310-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  310-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (50, 1536)
Shape of y:  (50, 1536)


100% |########################################################################|
  6% |####                                                                    |

Doc ID:  310-03


100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)


 42% |##############################                                          |

Doc ID:  310-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (85, 1536)
Shape of y:  (85, 1536)


100% |########################################################################|
 19% |#############                                                           |

Doc ID:  311-01


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)


 71% |###################################################                     |

Doc ID:  311-02


100% |########################################################################|
100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (21, 1536)
Shape of y:  (21, 1536)
Doc ID:  311-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID: 

 79% |#########################################################               |

 311-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (39, 1536)
Shape of y:  (39, 1536)


 69% |#################################################                       |

Doc ID:  311-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (52, 1536)
Shape of y:  (52, 1536)
Doc ID:  312-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (32, 1536)
Shape of y:  (32, 1536)
Doc ID: 

100% |########################################################################|
100% |########################################################################|

 312-02





Shape of X:  (26, 1536)
Shape of y:  (26, 1536)


100% |########################################################################|
 16% |###########                                                             |

Doc ID:  312-03


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)


 51% |####################################                                    |

Doc ID:  312-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (45, 1536)
Shape of y:  (45, 1536)


 79% |########################################################                |

Doc ID:  313-01


100% |########################################################################|
100% |########################################################################|
  1% |#                                                                       |

Shape of X:  (43, 1536)
Shape of y:  (43, 1536)
Doc ID:  313-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (66, 1536)
Shape of y:  (66, 1536)


100% |########################################################################|

Doc ID:  313-03



100% |########################################################################|
  0% |                                                                        |

Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  313-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)


 95% |####################################################################    |

[(4153, 4156), (4157, 4158), (4159, 4164), (4165, 4168), (4169, 4171), (4172, 4177), (4177, 4178), (4179, 4180), (4180, 4181), (4181, 4182), (4186, 4187), (4187, 4188), (4194, 4224), (4258, 4263), (4264, 4269), (4270, 4275), (4275, 4276), (4277, 4279)]
[18]
CITY
Doc ID:  314-01


100% |########################################################################|
100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID:  314-02


100% |########################################################################|
100% |########################################################################|
  7% |#####                                                                   |

Shape of X:  (56, 1536)
Shape of y:  (56, 1536)
Doc ID:  314-03


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (13, 1536)
Shape of y:  (13, 1536)
Doc ID:  314-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (82, 1536)
Shape of y:  (82, 1536)


 52% |#####################################                                   |

Doc ID:  314-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (71, 1536)
Shape of y:  (71, 1536)


100% |########################################################################|
100% |########################################################################|

[(6988, 6989), (6990, 6996), (6996, 6997), (6998, 7000), (7001, 7006)]
[5]
CITY
Doc ID:  315-01
Shape of X:  (13, 1536)
Shape of y:  (13, 1536)



100% |########################################################################|
100% |########################################################################|

Doc ID:  315-02
Shape of X:  (16, 1536)
Shape of y:  (16, 1536)



100% |########################################################################|
100% |########################################################################|

Doc ID:  315-03
Shape of X:  (5, 1536)
Shape of y:  (5, 1536)



 66% |################################################                        |

Doc ID:  315-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)


 35% |#########################                                               |

Doc ID:  316-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (123, 1536)
Shape of y:  (123, 1536)


 97% |######################################################################  |

Doc ID:  316-02


100% |########################################################################|
100% |########################################################################|
 10% |#######                                                                 |

Shape of X:  (36, 1536)
Shape of y:  (36, 1536)
Doc ID:  316-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (19, 1536)
Shape of y:  (19, 1536)


 85% |#############################################################           |

Doc ID:  316-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)


 58% |##########################################                              |

Doc ID:  317-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (60, 1536)
Shape of y:  (60, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  317-02





Shape of X:  (17, 1536)
Shape of y:  (17, 1536)
[(2439, 2445), (2445, 2446), (2451, 2457), (2458, 2459), (2459, 2460), (2461, 2468), (2468, 2469), (2470, 2472), (2472, 2473), (2474, 2477), (2483, 2484), (2484, 2489)]
[12]
CITY


100% |########################################################################|
 41% |##############################                                          |

Doc ID:  317-03


100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  317-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (25, 1536)
Shape of y:  (25, 1536)


100% |########################################################################|
 12% |########                                                                |

Doc ID:  317-05


100% |########################################################################|
  5% |###                                                                     |

Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  318-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)
Doc ID: 

100% |########################################################################|
  5% |####                                                                    |

 318-02


100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)


 60% |###########################################                             |

[(7537, 7542), (7543, 7549), (7551, 7552), (7552, 7557)]
[3, 4]
DOCTOR
Doc ID:  318-03


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (60, 1536)
Shape of y:  (60, 1536)
Doc ID:  318-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (45, 1536)
Shape of y:  (45, 1536)


 51% |#####################################                                   |

Doc ID:  319-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (68, 1536)
Shape of y:  (68, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  319-02
Shape of X:  (9, 1536)
Shape of y:  (9, 1536)



100% |########################################################################|
 32% |#######################                                                 |

Doc ID:  319-03


100% |########################################################################|


Shape of X:  (25, 1536)
Shape of y:  (25, 1536)


100% |########################################################################|
 20% |##############                                                          |

Doc ID:  319-04


100% |########################################################################|
 15% |###########                                                             |

Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
Doc ID:  319-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (13, 1536)
Shape of y:  (13, 1536)
[(1078, 1083), (1084, 1091), (1092, 1094), (1095, 1098), (1099, 1106), (1107, 1109), (1110, 1118), (1119, 1122), (1123, 1125), (1125, 1126), (1127, 1132), (1133, 1135), (1136, 1141), (1141, 1142), (1143, 1145), (1145, 1146), (1147, 1154), (1155, 1165), (1166, 1168), (1168, 1169), (1170, 1180), (1181, 1193), (1194, 1199), (1200, 1209), (1210, 1221), (1221, 1222), (1227, 1242), (1242, 1243), (1245, 1246), (1246, 1252), (1253, 1258), (1259, 1264), (1265, 1273), (1274, 1279), (1281, 1282), (1282, 1287), (1288, 1295), (1297, 1298), (1298, 1303), (1304, 1305), (1305, 1307), (1307, 1308), (1309, 1315), (1315, 1316), (1317, 1320), (1320, 1321), (1322, 1325), (1327, 1328), (1328, 1334), (1335, 1340), (1341, 1353), (1354, 1357), (1358, 1366), (1367, 1370), (1370, 1372), (1373, 1378), (1379, 1380), (1380, 1386), (1387, 1392), (1393, 1406), (1407, 1410), (1411, 1419), (1420, 1424), (1425, 1431), (1431, 1432), (1433, 1439), (1440, 1446), (1447, 1460),

 73% |#####################################################                   |

Doc ID:  340-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)


 69% |#################################################                       |

Doc ID:  340-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)


 55% |#######################################                                 |

Doc ID:  340-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (60, 1536)
Shape of y:  (60, 1536)


100% |########################################################################|
 26% |###################                                                     |

Doc ID:  340-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (15, 1536)
Shape of y:  (15, 1536)
Doc ID:  341-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (64, 1536)
Shape of y:  (64, 1536)


 37% |##########################                                              |

Doc ID:  341-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (94, 1536)
Shape of y:  (94, 1536)


 92% |##################################################################      |

Doc ID:  341-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)


 41% |##############################                                          |

Doc ID:  341-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (91, 1536)
Shape of y:  (91, 1536)


 51% |#####################################                                   |

Doc ID:  341-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (68, 1536)
Shape of y:  (68, 1536)


 64% |##############################################                          |

[(7089, 7097), (7098, 7106), (7106, 7107), (7108, 7111), (7111, 7112), (7112, 7113), (7115, 7120), (7121, 7126)]
[8]
CITY
Doc ID:  342-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (54, 1536)
Shape of y:  (54, 1536)
Doc ID: 

 39% |############################                                            |

 342-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (89, 1536)
Shape of y:  (89, 1536)


100% |########################################################################|
 83% |############################################################            |

Doc ID:  342-03


100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)
Doc ID:  342-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (16, 1536)
Shape of y:  (16, 1536)


 79% |#########################################################               |

Doc ID:  343-01


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (44, 1536)
Shape of y:  (44, 1536)
Doc ID:  343-02


100% |########################################################################|
100% |########################################################################|
  5% |####                                                                    |

Shape of X:  (55, 1536)
Shape of y:  (55, 1536)
Doc ID:  343-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (17, 1536)
Shape of y:  (17, 1536)
Doc ID:  343-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (21, 1536)
Shape of y:  (21, 1536)


100% |########################################################################|
 54% |#######################################                                 |

Doc ID:  344-01


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (22, 1536)
Shape of y:  (22, 1536)
Doc ID:  344-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)


100% |########################################################################|
  0% |                                                                        |

Doc ID:  344-03


100% |########################################################################|
  2% |#                                                                       |

Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  344-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (41, 1536)
Shape of y:  (41, 1536)


 78% |########################################################                |

Doc ID:  345-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)
Doc ID:  345-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)


 90% |################################################################        |

Doc ID:  345-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID:  345-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (73, 1536)
Shape of y:  (73, 1536)
Doc ID: 

100% |########################################################################|
100% |########################################################################|

 346-01
Shape of X:  (10, 1536)
Shape of y:  (10, 1536)



100% |########################################################################|
100% |########################################################################|

Doc ID:  346-02
Shape of X:  (9, 1536)
Shape of y:  (9, 1536)



100% |########################################################################|
  0% |                                                                        |

Doc ID:  346-03


100% |########################################################################|


Shape of X:  (28, 1536)
Shape of y:  (28, 1536)
Doc ID:  346-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (67, 1536)
Shape of y:  (67, 1536)


 79% |########################################################                |

[(8791, 8792), (8792, 8794), (8796, 8797), (8797, 8798), (8799, 8805), (8807, 8808), (8808, 8809), (8810, 8817), (8825, 8858), (8860, 8865), (8866, 8874), (8874, 8875), (8876, 8878), (8880, 8885), (8886, 8887), (8887, 8892)]
[16]
CITY
Doc ID:  347-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (43, 1536)
Shape of y:  (43, 1536)


 19% |##############                                                          |

Doc ID:  347-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (192, 1536)
Shape of y:  (192, 1536)


 58% |##########################################                              |

Doc ID:  347-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (56, 1536)
Shape of y:  (56, 1536)


 66% |################################################                        |

Doc ID:  347-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)


 90% |################################################################        |

Doc ID:  348-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)


100% |########################################################################|
 13% |#########                                                               |

Doc ID:  348-02


100% |########################################################################|


Shape of X:  (30, 1536)
Shape of y:  (30, 1536)
Doc ID:  348-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (5, 1536)
Shape of y:  (5, 1536)


100% |########################################################################|
 20% |##############                                                          |

Doc ID:  348-04


100% |########################################################################|


Shape of X:  (25, 1536)
Shape of y:  (25, 1536)


100% |########################################################################|
  0% |                                                                        |

Doc ID:  348-05


100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
[(3, 9), (10, 14), (14, 15), (16, 20), (20, 21), (21, 23), (23, 24), (24, 26), (30, 35), (36, 45), (49, 53), (54, 59), (60, 62), (63, 67), (68, 75), (76, 80), (81, 83), (83, 84), (86, 92), (92, 93), (94, 102), (103, 104), (104, 105), (105, 106), (106, 107), (108, 113), (113, 114), (115, 119), (120, 121), (121, 131), (132, 137), (138, 145), (146, 149), (149, 151)]
[34]
CITY


 25% |##################                                                      |

Doc ID:  349-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (83, 1536)
Shape of y:  (83, 1536)


100% |########################################################################|
 75% |######################################################                  |

Doc ID:  349-02


100% |########################################################################|


Shape of X:  (20, 1536)
Shape of y:  (20, 1536)
Doc ID: 

 94% |###################################################################     |

 349-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (34, 1536)
Shape of y:  (34, 1536)


 97% |######################################################################  |

Doc ID:  349-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)
Doc ID:  370-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)
Doc ID: 

 82% |###########################################################             |

 370-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (45, 1536)
Shape of y:  (45, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  370-03
Shape of X:  (10, 1536)
Shape of y:  (10, 1536)



100% |########################################################################|
  9% |######                                                                  |

Doc ID:  370-04


100% |########################################################################|
  5% |####                                                                    |

Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID:  371-01


100% |########################################################################|
100% |########################################################################|
  3% |##                                                                      |

Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID:  371-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID:  371-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  

 43% |###############################                                         |

371-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (72, 1536)
Shape of y:  (72, 1536)


 48% |##################################                                      |

Doc ID:  371-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (70, 1536)
Shape of y:  (70, 1536)


100% |########################################################################|

Doc ID:  372-01



100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  372-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)


 66% |###############################################                         |

Doc ID:  372-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (53, 1536)
Shape of y:  (53, 1536)


100% |########################################################################|
 21% |###############                                                         |

Doc ID:  372-04


100% |########################################################################|


Shape of X:  (28, 1536)
Shape of y:  (28, 1536)


100% |########################################################################|
 17% |############                                                            |

Doc ID:  373-01


100% |########################################################################|


Shape of X:  (29, 1536)
Shape of y:  (29, 1536)
[(3604, 3606), (3606, 3607)]
[2]
DOCTOR


100% |########################################################################|
100% |########################################################################|

Doc ID:  373-02
Shape of X:  (10, 1536)
Shape of y:  (10, 1536)



 16% |###########                                                             |

Doc ID:  373-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (61, 1536)
Shape of y:  (61, 1536)
Doc ID:  373-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (69, 1536)
Shape of y:  (69, 1536)


 47% |##################################                                      |

Doc ID:  373-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (72, 1536)
Shape of y:  (72, 1536)


 38% |###########################                                             |

Doc ID:  374-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (89, 1536)
Shape of y:  (89, 1536)


 40% |############################                                            |

Doc ID:  374-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (82, 1536)
Shape of y:  (82, 1536)


100% |########################################################################|
 45% |#################################                                       |

Doc ID:  374-03


100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  374-04
Shape of X:  (14, 1536)
Shape of y:  (14, 1536)



100% |########################################################################|
 76% |#######################################################                 |

Doc ID:  374-05


100% |########################################################################|


Shape of X:  (17, 1536)
Shape of y:  (17, 1536)


 73% |####################################################                    |

Doc ID:  375-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)


 71% |###################################################                     |

Doc ID:  375-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (46, 1536)
Shape of y:  (46, 1536)


 40% |#############################                                           |

[(3502, 3510), (3511, 3513), (3514, 3523), (3525, 3530), (3531, 3533), (3534, 3539), (3541, 3543), (3543, 3544), (3546, 3553), (3554, 3559), (3560, 3562), (3564, 3566), (3567, 3571), (3572, 3574), (3576, 3582), (3582, 3583), (3584, 3586), (3587, 3592), (3596, 3602), (3603, 3608), (3610, 3612), (3613, 3621), (3622, 3628), (3630, 3638), (3639, 3643), (3643, 3644), (3645, 3647), (3647, 3648), (3649, 3654)]
[29]
CITY
Doc ID:  375-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (84, 1536)
Shape of y:  (84, 1536)
Doc ID: 

100% |########################################################################|
  3% |##                                                                      |

 375-04


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)


 75% |######################################################                  |

Doc ID:  376-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (48, 1536)
Shape of y:  (48, 1536)
[(3418, 3420), (3420, 3421), (3422, 3424), (3424, 3425), (3426, 3432)]
[4, 5]
DOCTOR


100% |########################################################################|
  0% |                                                                        |

Doc ID:  376-02


100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)


100% |########################################################################|
 41% |##############################                                          |

Doc ID:  376-03


100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  376-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (75, 1536)
Shape of y:  (75, 1536)
Doc ID: 

 76% |######################################################                  |

 377-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (42, 1536)
Shape of y:  (42, 1536)
Doc ID: 

 37% |##########################                                              |

 377-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (113, 1536)
Shape of y:  (113, 1536)


 97% |######################################################################  |

Doc ID:  377-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (37, 1536)
Shape of y:  (37, 1536)


100% |########################################################################|
  6% |####                                                                    |

Doc ID:  378-01


100% |########################################################################|


Shape of X:  (31, 1536)
Shape of y:  (31, 1536)
Doc ID: 

 74% |#####################################################                   |

 378-02


100% |########################################################################|
100% |########################################################################|
  4% |###                                                                     |

Shape of X:  (50, 1536)
Shape of y:  (50, 1536)
Doc ID:  378-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (41, 1536)
Shape of y:  (41, 1536)


 35% |#########################                                               |

Doc ID:  378-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (70, 1536)
Shape of y:  (70, 1536)


 74% |#####################################################                   |

Doc ID:  378-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (43, 1536)
Shape of y:  (43, 1536)


 58% |##########################################                              |

Doc ID:  379-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (58, 1536)
Shape of y:  (58, 1536)


 92% |##################################################################      |

Doc ID:  379-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (39, 1536)
Shape of y:  (39, 1536)


 87% |###############################################################         |

Doc ID:  379-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)


100% |########################################################################|
  5% |####                                                                    |

Doc ID:  379-04


100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID: 

100% |########################################################################|
  3% |##                                                                      |

 379-05


100% |########################################################################|


Shape of X:  (32, 1536)
Shape of y:  (32, 1536)


 44% |###############################                                         |

Doc ID:  380-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (84, 1536)
Shape of y:  (84, 1536)


 49% |###################################                                     |

Doc ID:  380-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (67, 1536)
Shape of y:  (67, 1536)


 40% |#############################                                           |

[(3856, 3865), (3865, 3866), (3872, 3878), (3879, 3880), (3880, 3881), (3882, 3887), (3887, 3888), (3889, 3890), (3890, 3891), (3891, 3892), (3892, 3894), (3895, 3897), (3897, 3898), (3898, 3899), (3899, 3900), (3902, 3912), (3913, 3915), (3916, 3925), (3928, 3934), (3935, 3943), (3945, 3951), (3952, 3956), (3957, 3965), (3967, 3979), (3979, 3980), (3981, 3983), (3984, 3989)]
[27]
CITY
Doc ID:  380-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (86, 1536)
Shape of y:  (86, 1536)
Doc ID:  380-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (79, 1536)
Shape of y:  (79, 1536)
Doc ID:  381-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (55, 1536)
Shape of y:  (55, 1536)
Doc ID:  381-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)


 40% |#############################                                           |

Doc ID:  381-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (57, 1536)
Shape of y:  (57, 1536)


100% |########################################################################|
  3% |##                                                                      |

Doc ID:  381-04


100% |########################################################################|


Shape of X:  (30, 1536)
Shape of y:  (30, 1536)
Doc ID: 

 73% |####################################################                    |

 382-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)


 65% |###############################################                         |

Doc ID:  382-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (49, 1536)
Shape of y:  (49, 1536)


 72% |####################################################                    |

Doc ID:  382-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (47, 1536)
Shape of y:  (47, 1536)
Doc ID: 

 69% |#################################################                       |

 382-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (42, 1536)
Shape of y:  (42, 1536)


100% |########################################################################|
  9% |######                                                                  |

[(4493, 4499), (4500, 4501), (4501, 4502), (4503, 4513), (4513, 4514), (4515, 4517)]
[6]
CITY
Doc ID:  383-01


100% |########################################################################|


Shape of X:  (32, 1536)
Shape of y:  (32, 1536)


100% |########################################################################|
 47% |##################################                                      |

Doc ID:  383-02


100% |########################################################################|


Shape of X:  (23, 1536)
Shape of y:  (23, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  383-03
Shape of X:  (8, 1536)
Shape of y:  (8, 1536)



 47% |#################################                                       |

Doc ID:  383-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (68, 1536)
Shape of y:  (68, 1536)
Doc ID: 

100% |########################################################################|
 23% |################                                                        |

 383-05


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (26, 1536)
Shape of y:  (26, 1536)
Doc ID:  384-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (41, 1536)
Shape of y:  (41, 1536)


 80% |##########################################################              |

Doc ID:  384-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (42, 1536)
Shape of y:  (42, 1536)


 51% |#####################################                                   |

Doc ID:  384-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (35, 1536)
Shape of y:  (35, 1536)
Doc ID: 

 86% |##############################################################          |

 384-04


100% |########################################################################|
100% |########################################################################|
  0% |                                                                        |

Shape of X:  (38, 1536)
Shape of y:  (38, 1536)
Doc ID:  385-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (83, 1536)
Shape of y:  (83, 1536)


 41% |##############################                                          |

Doc ID:  385-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (86, 1536)
Shape of y:  (86, 1536)


 68% |#################################################                       |

Doc ID:  385-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (51, 1536)
Shape of y:  (51, 1536)


 50% |####################################                                    |

Doc ID:  385-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (38, 1536)
Shape of y:  (38, 1536)


100% |########################################################################|
 65% |##############################################                          |

Doc ID:  385-05


100% |########################################################################|


Shape of X:  (20, 1536)
Shape of y:  (20, 1536)
Doc ID:  386-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (26, 1536)
Shape of y:  (26, 1536)
Doc ID: 

 46% |#################################                                       |

 386-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (66, 1536)
Shape of y:  (66, 1536)


 37% |##########################                                              |

Doc ID:  386-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (27, 1536)
Shape of y:  (27, 1536)
Doc ID:  386-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (19, 1536)
Shape of y:  (19, 1536)
Doc ID:  387-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
[(3815, 3817), (3817, 3818)]
[2]
DOCTOR
Doc ID: 

100% |########################################################################|
  0% |                                                                        |

 387-02


100% |########################################################################|


Shape of X:  (33, 1536)
Shape of y:  (33, 1536)
Doc ID:  387-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)


 88% |################################################################        |

Doc ID:  387-04


100% |########################################################################|
100% |########################################################################|


Shape of X:  (36, 1536)
Shape of y:  (36, 1536)
Doc ID:  388-01


100% |########################################################################|
100% |########################################################################|


Shape of X:  (24, 1536)
Shape of y:  (24, 1536)
Doc ID:  388-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (40, 1536)
Shape of y:  (40, 1536)
Doc ID: 

 56% |########################################                                |

 388-03


100% |########################################################################|
100% |########################################################################|


Shape of X:  (60, 1536)
Shape of y:  (60, 1536)
Doc ID: 

100% |########################################################################|
 80% |#########################################################               |

 388-04


100% |########################################################################|
  0% |                                                                        |

Shape of X:  (20, 1536)
Shape of y:  (20, 1536)
[(2420, 2428), (2428, 2429), (2430, 2436), (2437, 2439), (2441, 2451), (2453, 2456), (2458, 2462)]
[7]
CITY
Doc ID:  388-05


100% |########################################################################|
100% |########################################################################|


Shape of X:  (21, 1536)
Shape of y:  (21, 1536)


100% |########################################################################|
100% |########################################################################|

Doc ID:  389-01
Shape of X:  (13, 1536)
Shape of y:  (13, 1536)



 21% |###############                                                         |

[(1453, 1456), (1456, 1457), (1457, 1462)]
[3]
IDNUM
Doc ID:  389-02


100% |########################################################################|
100% |########################################################################|


Shape of X:  (75, 1536)
Shape of y:  (75, 1536)


100% |########################################################################|
 50% |####################################                                    |

[(8830, 8836), (8837, 8844), (8844, 8845), (8846, 8848), (8849, 8854), (8854, 8855), (8856, 8857), (8857, 8862)]
[8]
CITY
Doc ID:  389-03


100% |########################################################################|


Shape of X:  (22, 1536)
Shape of y:  (22, 1536)


100% |########################################################################|
 88% |################################################################        |

Doc ID:  389-04


100% |########################################################################|


Shape of X:  (18, 1536)
Shape of y:  (18, 1536)


In [None]:
# build model
model = BiLSTM(pp.vocab_size,pp.tag_size,pp.max_len)
checkpoint_dir = 'models/checkpoints/' + train_data.title + '/' + model.title + '/' 
if not os.path.exists(checkpoint_dir):
    os.makedirs(checkpoint_dir)
checkpoint = tf.train.Checkpoint(model=model)
manager = tf.train.CheckpointManager(checkpoint, checkpoint_dir, max_to_keep=3)

In [None]:
# train model
train_vanilla(model,X_train,y_train,batch_size = 64, epochs=10,sample_interval=10,manager=manager,pp=pp)

In [None]:
# build model
model = BiLSTM_CRF(pp.vocab_size,pp.tag_size,pp.max_len)
checkpoint_dir = 'models/checkpoints/' + train_data.title + '/' + model.title + '/' 
if not os.path.exists(checkpoint_dir):
    os.makedirs(checkpoint_dir)
checkpoint = tf.train.Checkpoint(model=model)
manager = tf.train.CheckpointManager(checkpoint, checkpoint_dir, max_to_keep=3)

In [None]:
# train model
train_CRF(model,X_train,y_train,batch_size = 64, epochs=10,sample_interval=10,manager=manager,pp=pp)

In [None]:
print("done vanilla models!")