In [1]:
import json
import time
import os
import re

from modules.preprocessing_protocols import preprocess_text
from modules.extract_results import extract_results_to_txt_file, display_results_by_subdistribution,\
                                    display_results_by_named_entity, display_confusion_matrix
from modules.corpus_readers_fixed import read_from_tsv
from estnltk import Text
from estnltk.taggers import NerTagger
from estnltk.taggers import WordLevelNerTagger
from estnltk.converters import text_to_json
from estnltk.converters import json_to_text
from estnltk.layer_operations import flatten

In [2]:
def find(name, path):
    for root, dirs, files in os.walk(path):
        if name in files:
            return os.path.join(root, name)

In [6]:
def tag_files(testing_files_dir, model_dir, is_tsv = False):
    nertagger = NerTagger(model_dir)
    removed_layers = ['sentences', 'morph_analysis', 'compound_tokens', 'ner', 'words', 'tokens']
    
    path = os.path.join(model_dir, 'vallakohtufailid-trained-nertagger')
    if not os.path.exists(path):
        os.mkdir(path)
    
    print("(!) Alustan failide märgendamist")
    if is_tsv:
        for file in os.listdir(os.path.join('test', 'morf_analyysid')):
            if file.endswith('.txt'):
                file_id = str(file).split('_')[1][2:]
                with open(os.path.join('test', 'morf_analyysid', file), 'r', encoding='UTF-8') as f:
                    text = preprocess_text(Text(f.read()))
                
                nertagger.tag(text)
                text.add_layer(flatten(text['ner'], 'flat_ner'))
            
                for x in removed_layers:
                    text.pop_layer(x)
                    
                for file in testing_files:
                    if f'id{file_id}' in file:
                        text_to_json(text, file=os.path.join(path, file))
                        print(f'Märgendatud fail {file}')
    else:
        iterator = 0
        for test_file in testing_files:
            with open(find(test_file.replace('.json', '.txt'), 'test'), 'r', encoding='UTF-8') as f:

                text = preprocess_text(Text(f.read()))

            nertagger.tag(text)
            text.add_layer(flatten(text['ner'], 'flat_ner'))

            for x in removed_layers:
                text.pop_layer(x)

            text_to_json(text, file=os.path.join(path, test_file))

            print(f'Märgendatud fail {test_file}')
            iterator += 1
    print(f"(!) Programm on lõpetanud")

In [4]:
def get_testing_files():
    files = []
    for file in os.listdir(os.path.join('test', 'flattened_json_files')):
        if file.endswith('.json'):
            files.append(file)
    return files

In [5]:
testing_files = get_testing_files()
model_dir = os.path.join('models', 'model_gaz_loc')
is_tsv = False

tag_files(testing_files, model_dir, is_tsv)

extract_results_to_txt_file('model_gaz_loc', testing_files)

[!] Alustan failide märgendamist
Märgendatud fail Harju_Hageri_Kohila_id8179_1871a.json
Märgendatud fail Harju_Hageri_Kohila_id8352_1874a.json
Märgendatud fail Harju_J6el2htme_J6el2htme_id7155_1868a.json
Märgendatud fail Harju_J6el2htme_J6el2htme_id7376_1869a.json
Märgendatud fail Harju_J6el2htme_J6el2htme_id7637_1870a.json
Märgendatud fail Harju_Juuru_Kaiu_id18361_1873a.json
Märgendatud fail Harju_Juuru_Kaiu_id18707_1874a.json
Märgendatud fail Harju_Kose_Habaja_id678_1874a.json
Märgendatud fail Harju_Kose_Habaja_id808_1874a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id12761_1870a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id13306_1870a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id1775_1867a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id1834_1867a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id3956_1868a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id4927_1868a.json
Märgendatud fail Harju_Kose_Palvere_id25212_1873a.json
Märgendatud fail Harju_Kose_Triigi_id13811_1872

Märgendatud fail V6ru_R2pina_Kahkva_id19841_1867a.json
Märgendatud fail V6ru_R2pina_Kahkva_id20116_1867a.json
Märgendatud fail V6ru_R2pina_Kahkva_id21297_1867a.json
Märgendatud fail V6ru_R2pina_Kahkva_id23081_1867a.json
Märgendatud fail V6ru_R2pina_Kahkva_id23759_1867a.json
Märgendatud fail V6ru_R2pina_Kahkva_id24435_1868a.json
Märgendatud fail V6ru_R2pina_Kahkva_id24976_1868a.json
Märgendatud fail V6ru_R2pina_R2pina_id10269_1870a.json
Märgendatud fail V6ru_R2pina_R2pina_id10283_1870a.json
Märgendatud fail V6ru_R2pina_R2pina_id10705_1868a.json
Märgendatud fail V6ru_R2pina_R2pina_id14382_1867a.json
Märgendatud fail V6ru_R2pina_R2pina_id14687_1867a.json
Märgendatud fail V6ru_R2pina_R2pina_id9286_1869a.json
Märgendatud fail V6ru_R2pina_R2pina_id9301_1869a.json
Märgendatud fail V6ru_R6uge_Saaluse_id10087_1879a.json
Märgendatud fail V6ru_R6uge_Saaluse_id10144_1879a.json
Märgendatud fail V6ru_R6uge_Saaluse_id10650_1879a.json
Märgendatud fail V6ru_R6uge_Saaluse_id10756_1879a.json
Märgendatud 

Span('Jürri Kleinsep', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Jürri Kleinsep', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Karel Sante', [{'nertag': 'PER'}])
Span('Johan', [{'nertag': 'PER'}])
Span('Jürri Kleinsepp', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Jürri Kleinsep', [{'nertag': 'PER'}])
Span('Jürri Lingile', [{'nertag': 'PER'}])
Span('Jürri Kleinsep', [{'nertag': 'PER'}])
Span('Lengi', [{'nertag': 'PER'}])
Span('Jürri Kleinsepp', [{'nertag': 'PER'}])
Span('Jürri Kleinsep', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Kleinsepp', [{'nertag': 'PER'}])
Span('Hans Sepper', [{'nertag': 'PER'}])
Span('Jürri Eldermann', [{'nertag': 'PER'}])
Span('Jaan Rosenbaum', [{'nertag': 'PER'}])
Span('Friedrich Schotter', [{'nertag': 'PER'}])
Span('Jürri Lengi', [{'nertag': 'PER'}])
Span('Jürri Kleinsepp', [{'nerta

Span('Allo Moisa', [{'nertag': 'LOC_ORG'}])
Span('von Lielienfeldt', [{'nertag': 'PER'}])
Span('Widreku', [{'nertag': 'LOC_ORG'}])
Span('Jürri Wiikberg', [{'nertag': 'PER'}])
Span('Jürri Wiikbergile', [{'nertag': 'PER'}])
Span('Allo Möisa', [{'nertag': 'LOC_ORG'}])
Span('Anton Paber', [{'nertag': 'PER'}])
Span('Widreku', [{'nertag': 'LOC_ORG'}])
Span('Jürri Wiikberg', [{'nertag': 'PER'}])
Span('Anton Paber', [{'nertag': 'PER'}])
Span('Jürrile', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Jürri', [{'nertag': 'PER'}])
Span('Widreku', [{'nertag': 'LOC_ORG'}])
Span('Jürri Wiikberg', [{'nertag': 'PER'}])
Span('Jürri Wiikberg', [{'nertag': 'PER'}])
Span('Widreku', [{'nertag': 'LOC_ORG'}])
Span('Jürri Wiikbergile', [{'nertag': 'PER'}])
Span('Jaan Tiismann', [{'nertag': 'PER'}])
Span('Jaan Wingelmann', [

Span('Maibaum', [{'nertag': 'PER'}])
Span('Öbbemaggi', [{'nertag': 'PER'}])
Span('Prant', [{'nertag': 'PER'}])
Span('Maibaum', [{'nertag': 'PER'}])
Span('Juhhansoni', [{'nertag': 'PER'}])
Span('Jürri Suurman', [{'nertag': 'PER'}])
Span('Maibaum', [{'nertag': 'PER'}])
Span('Johanson', [{'nertag': 'PER'}])
Span('Suurman', [{'nertag': 'PER'}])
Span('Johhanson', [{'nertag': 'PER'}])
Span('Wallit Maibaum', [{'nertag': 'PER'}])
Span('Juhhanson', [{'nertag': 'PER'}])
Span('Juhhanson', [{'nertag': 'PER'}])
Span('Maibaum', [{'nertag': 'PER'}])
Span('Maibaum', [{'nertag': 'PER'}])
Span('Mihchel Johhanson', [{'nertag': 'PER'}])
Span('Andres Anni', [{'nertag': 'PER'}])
Span('Johanni', [{'nertag': 'PER'}])
Span('Kaie', [{'nertag': 'PER'}])
Span('Andress', [{'nertag': 'PER'}])
Span('Andres', [{'nertag': 'PER'}])
Span('Andress', [{'nertag': 'PER'}])
Span('Andress', [{'nertag': 'PER'}])
Span('Johan Anni', [{'nertag': 'PER'}])
Span('Andrese', [{'nertag': 'PER'}])
Span('Andress', [{'nertag': 'PER'}])
Sp

Span('Peter', [{'nertag': 'PER'}])
Span('Peter Jermakow', [{'nertag': 'PER'}])
Span('Mard Passi', [{'nertag': 'PER'}])
Span('Mard Pass', [{'nertag': 'PER'}])
Span('Mard Pass', [{'nertag': 'PER'}])
Span('Petert', [{'nertag': 'PER'}])
Span('Peter', [{'nertag': 'PER'}])
Span('Mard Pass', [{'nertag': 'PER'}])
Span('Mard Pass', [{'nertag': 'PER'}])
Span('Peter', [{'nertag': 'PER'}])
Span('Mard Pass', [{'nertag': 'PER'}])
Span('Petrile', [{'nertag': 'PER'}])
Span('Peetri', [{'nertag': 'PER'}])
Span('Peter', [{'nertag': 'PER'}])
Span('Peter Jermakow', [{'nertag': 'PER'}])
Span('Mard Passile', [{'nertag': 'PER'}])
Span('Peetrile', [{'nertag': 'PER'}])
Span('Peter Jermakow', [{'nertag': 'PER'}])
Span('Mard Pass', [{'nertag': 'PER'}])
Span('Hans Ehrenwerth', [{'nertag': 'PER'}])
Span('Jaan Raudmets', [{'nertag': 'PER'}])
Span('Jaan Epmann', [{'nertag': 'PER'}])
Span('H. Saarmo', [{'nertag': 'PER'}])
Span('Ado Kandelin', [{'nertag': 'PER'}])
Span('Jaan Raudmez', [{'nertag': 'PER'}])
Span('Jaan Ep

Span('Putkaste', [{'nertag': 'LOC'}])
Span('Enniwerre ja Kullusi koggokonna kohhus', [{'nertag': 'ORG'}])
Span('Tawet Ku', [{'nertag': 'PER'}])
Span('Jurri Täht', [{'nertag': 'PER'}])
Span('Jaan Selart', [{'nertag': 'PER'}])
Span('Marri Massalin', [{'nertag': 'PER'}])
Span('Kullusist', [{'nertag': 'LOC'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Maalse teo rehhe honest', [{'nertag': 'LOC'}])
Span('Tallinast', [{'nertag': 'LOC'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Kondilt', [{'nertag': 'LOC'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Marri', [{'nertag': 'PER'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Sassa Massalin', [{'nertag': 'PER'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Putkastesse', [{'nertag': 'LOC'}])
Span('Sassa', [{'nertag': 'PER'}])
Span('Putkaste', [{'nertag': 'LOC'}])
Span('T. Ku', [{'nertag': 'PER'}])
Span('J.Täht', [{'nertag': 'PER'}])
Span('J.Selart', [{

Span('Tallinnast', [{'nertag': 'LOC'}])
Span('N. Mähle', [{'nertag': 'PER'}])
Span('G. Norwit', [{'nertag': 'PER'}])
Span('H.', [{'nertag': 'PER'}])
Span('Tallinnast', [{'nertag': 'LOC'}])
Span('Liwen Dörk', [{'nertag': 'PER'}])
Span('Gentist parrit', [{'nertag': 'LOC'}])
Span('Saksama', [{'nertag': 'LOC'}])
Span('Schieldsist', [{'nertag': 'LOC'}])
Span('Tallinna', [{'nertag': 'LOC'}])
Span('Riga', [{'nertag': 'PER'}])
Span('Karl Simonsen', [{'nertag': 'PER'}])
Span('Norwegi maalt', [{'nertag': 'LOC_ORG'}])
Span('Sommeni linna', [{'nertag': 'LOC_ORG'}])
Span('Washingtoniga Savannast', [{'nertag': 'LOC'}])
Span('Tallinna', [{'nertag': 'LOC'}])
Span('Liwen Dörk', [{'nertag': 'PER'}])
Span('Andres Scheblum', [{'nertag': 'PER'}])
Span('Cantlanksa küllast', [{'nertag': 'LOC_ORG'}])
Span('Ny Carleby', [{'nertag': 'PER'}])
Span('Christinestadti linnast', [{'nertag': 'LOC_ORG'}])
Span('Dubois Inglismale', [{'nertag': 'PER'}])
Span('Tallinna', [{'nertag': 'LOC'}])
Span('Karl Simonsoniga', [{'ne

Span('Maddis Suitt', [{'nertag': 'PER'}])
Span('Hans Siil', [{'nertag': 'PER'}])
Span('Janus Weisson', [{'nertag': 'PER'}])
Span('Wanna Pornuse', [{'nertag': 'LOC_ORG'}])
Span('von zur Mühlen', [{'nertag': 'PER'}])
Span('Tekki', [{'nertag': 'LOC_ORG'}])
Span('Jaan Ilbako', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Jaan Ilbakul', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbakul', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Ilbakul', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('E. Michelson', [{'nertag': 'PER'}])
Span('Pöögle', [{'nertag': 'LOC'}])
Span('O. Eglon', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])
Span('Jaan Ilbak', [{'nertag': 'PER'}])

Span('Jacob Joosti', [{'nertag': 'PER'}])
Span('Johann Petersonile', [{'nertag': 'PER'}])
Span('Jacob Joosti', [{'nertag': 'PER'}])
Span('Jurry Kask', [{'nertag': 'PER'}])
Span('Johann Peterson', [{'nertag': 'PER'}])
Span('Sooba', [{'nertag': 'LOC_ORG'}])
Span('Jurry', [{'nertag': 'PER'}])
Span('Maddis Tamson', [{'nertag': 'PER'}])
Span('Arroja', [{'nertag': 'LOC_ORG'}])
Span('Karl Kurm', [{'nertag': 'PER'}])
Span('Arroja Tallust', [{'nertag': 'LOC_ORG'}])
Span('Jaan Kurm', [{'nertag': 'PER'}])
Span('Mart Saul', [{'nertag': 'PER'}])
Span('Marry Karm', [{'nertag': 'PER'}])
Span('Mart Saul', [{'nertag': 'PER'}])
Span('Liso Baumgart', [{'nertag': 'PER'}])
Span('Jaan Joosti', [{'nertag': 'PER'}])
Span('Sooba', [{'nertag': 'LOC_ORG'}])
Span('Jurry Kask', [{'nertag': 'PER'}])
Span('Sakki', [{'nertag': 'LOC'}])
Span('Sakkil', [{'nertag': 'PER'}])
Span('Jacob Joosti', [{'nertag': 'PER'}])
Span('Johann Petersonile', [{'nertag': 'PER'}])
Span('Jacob Joosti', [{'nertag': 'PER'}])
Span('Jurry Kask

Span('Kuddeli', [{'nertag': 'LOC_ORG'}])
Span('Rido Luks', [{'nertag': 'PER'}])
Span('Pühhajõe', [{'nertag': 'LOC_ORG'}])
Span('Kaarl Luks', [{'nertag': 'PER'}])
Span('Käeselja wallast', [{'nertag': 'LOC_ORG'}])
Span('Käeselja', [{'nertag': 'LOC_ORG'}])
Span('Mats Tep', [{'nertag': 'PER'}])
Span('Kärla koggokonna kohhus', [{'nertag': 'ORG'}])
Span('Mihkel Kabbi', [{'nertag': 'PER'}])
Span('Jaak Trei', [{'nertag': 'PER'}])
Span('Jaak Maante', [{'nertag': 'PER'}])
Span('Rido Müür', [{'nertag': 'PER'}])
Span('Kärla wallast', [{'nertag': 'LOC_ORG'}])
Span('Hans', [{'nertag': 'PER'}])
Span('Nõmme', [{'nertag': 'LOC_ORG'}])
Span('Mihkel Kabbi', [{'nertag': 'PER'}])
Span('Nõmme', [{'nertag': 'LOC_ORG'}])
Span('Mihkel Kirs', [{'nertag': 'PER'}])
Span('Mart Wöö', [{'nertag': 'PER'}])
Span('Simmo', [{'nertag': 'LOC_ORG'}])
Span('Tõnnis Trei', [{'nertag': 'PER'}])
Span('Kangro', [{'nertag': 'LOC_ORG'}])
Span('Pert', [{'nertag': 'PER'}])
Span('Lõksi', [{'nertag': 'LOC_ORG'}])
Span('Jaak', [{'nerta

Span('Laes Sark', [{'nertag': 'PER'}])
Span('Hanno', [{'nertag': 'LOC_ORG'}])
Span('Jaen Kiks', [{'nertag': 'PER'}])
Span('Metsa Nawi', [{'nertag': 'LOC_ORG'}])
Span('Mihkel Murrekas', [{'nertag': 'PER'}])
Span('Henga', [{'nertag': 'LOC_ORG'}])
Span('Mihkel Saar', [{'nertag': 'PER'}])
Span('Kokki', [{'nertag': 'LOC_ORG'}])
Span('Redik Puu', [{'nertag': 'PER'}])
Span('Nawi', [{'nertag': 'LOC_ORG'}])
Span('Mihkel Mok', [{'nertag': 'PER'}])
Span('Nawi', [{'nertag': 'LOC_ORG'}])
Span('Mairt Puu', [{'nertag': 'PER'}])
Span('Hütsa', [{'nertag': 'LOC_ORG'}])
Span('Pert Armand', [{'nertag': 'PER'}])
Span('Hütsa', [{'nertag': 'LOC_ORG'}])
Span('Laes Kuub', [{'nertag': 'PER'}])
Span('Hogoti', [{'nertag': 'LOC_ORG'}])
Span('Pawel Hogand', [{'nertag': 'PER'}])
Span('Hogoti', [{'nertag': 'LOC_ORG'}])
Span('Pawel Armand', [{'nertag': 'PER'}])
Span('Hütsa', [{'nertag': 'LOC_ORG'}])
Span('Tawi Tarkmeel', [{'nertag': 'PER'}])
Span('Hütsa', [{'nertag': 'LOC_ORG'}])
Span('Jaak Tarkind', [{'nertag': 'PER'

Span('Jani', [{'nertag': 'LOC_ORG'}])
Span('Ado', [{'nertag': 'PER'}])
Span('Mihkel', [{'nertag': 'PER'}])
Span('Nale Perdi Jani Peter', [{'nertag': 'PER'}])
Span('Nikkuste Haini', [{'nertag': 'LOC_ORG'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Peter', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Larratsi', [{'nertag': 'LOC_ORG'}])
Span('Ado', [{'nertag': 'PER'}])
Span('Tönnis Tido', [{'nertag': 'PER'}])
Span('Toma', [{'nertag': 'LOC_ORG'}])
Span('Mihkel', [{'nertag': 'PER'}])
Span('Harrila randa', [{'nertag': 'LOC'}])
Span('Peter', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Mihklid', [{'nertag': 'PER'}])
Span('Kurrewerre külla', [{'nertag': 'LOC_ORG'}])
Span('Peter', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Hindrik Huss', [{'nertag': 'PER'}])
Span('Mihkel Nurja', [{'nertag': 'PER'}])
Span('Hain Rog', [{'nertag': 'PER'}])
Span('Johann Huum', [{'nertag': 'PER'}])
Span('Jani', [{'nertag': 'LOC_ORG'}])
Span('Ado', [{'nertag': 'PER'}])

Span('Loewi kohtumajal', [{'nertag': 'LOC'}])
Span('Märt Oija', [{'nertag': 'PER'}])
Span('Peter Wisnapu', [{'nertag': 'PER'}])
Span('Johan Oijawer', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Kostse', [{'nertag': 'LOC_ORG'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Liis Päästlane', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Lena Rügga', [{'nertag': 'PER'}])
Span('Märt Wäntsli', [{'nertag': 'PER'}])
Span('Lena Rügga', [{'nertag': 'PER'}])
Span('Karl Rügga', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Märt Wäntsli', [{'nertag': 'PER'}])
Span('Jaan Haggu', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Märt Oija', [{'nertag': 'PER'}])
Span('Peter Wisnapu', [{'nertag': 'PER'}])
Span('Johan Oijawer', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Liis Päästlane', [{'nertag': 'PER'}])
Span('Jaan Haggo', [{'nertag': 'PER'}])
Span('Lena',

Span('Kidjerwe walla', [{'nertag': 'LOC_ORG'}])
Span('Hans Kots', [{'nertag': 'PER'}])
Span('Wastse Kuste walla', [{'nertag': 'LOC_ORG'}])
Span('Ado Undi', [{'nertag': 'PER'}])
Span('Gusta Rotsi', [{'nertag': 'PER'}])
Span('P. Tarraski', [{'nertag': 'PER'}])
Span('P. Tarrask', [{'nertag': 'PER'}])
Span('Ado Undi', [{'nertag': 'PER'}])
Span('Gusta Rotsi', [{'nertag': 'PER'}])
Span('Ado Undi', [{'nertag': 'PER'}])
Span('Kidjerwe', [{'nertag': 'LOC_ORG'}])
Span('Hans Kols', [{'nertag': 'PER'}])
Span('Ado Unt', [{'nertag': 'PER'}])
Span('Gusta Raud', [{'nertag': 'PER'}])
Span('Hans Kotsi', [{'nertag': 'PER'}])
Span('Ado Unt', [{'nertag': 'PER'}])
Span('Hans Kotsist', [{'nertag': 'PER'}])
Span('Ado Unt', [{'nertag': 'PER'}])
Span('Gusta Raud', [{'nertag': 'PER'}])
Span('Ado Undile', [{'nertag': 'PER'}])
Span('Gusta Raud', [{'nertag': 'PER'}])
Span('Hans Kots', [{'nertag': 'PER'}])
Span('Hans Kots', [{'nertag': 'PER'}])
Span('P. Tarrask', [{'nertag': 'PER'}])
Span('Jaan Luk', [{'nertag': 'PE

Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Jaan Säina', [{'nertag': 'PER'}])
Span('Jaan Lük', [{'nertag': 'PER'}])
Span('Jaan Lük', [{'nertag': 'PER'}])
Span('Jaan Lük', [{'nertag': 'PER'}])
Span('Liis Litzar', [{'nertag': 'PER'}])
Span('Jaan Lük', [{'nertag': 'PER'}])
Span('Liis Lutzarit', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Jaan Lük', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Jaan lük', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Liis Lutzari', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Liis Kutzar', [{'nertag': 'PER'}])
Span('Jaan Lük', [{'nertag': 'PER'}])
Span('Jaan Lükkol', [{'nertag': 'PER'}])
Span('Liis Lutzarile', [{'nertag': 'PER'}])
Span('Liis Lutzar', [{'nertag': 'PER'}])
Span('Jakop Konts', [{'nertag': 

Span('P. Kristuwingi', [{'nertag': 'PER'}])
Span('Peter Kirstuwingi', [{'nertag': 'PER'}])
Span('Lotta', [{'nertag': 'PER'}])
Span('Lotta Wijo', [{'nertag': 'PER'}])
Span('Peter Kristuwing', [{'nertag': 'PER'}])
Span('Peep Simmulmani', [{'nertag': 'PER'}])
Span('Josep Krigoland', [{'nertag': 'PER'}])
Span('Peter Kirstuwingi', [{'nertag': 'PER'}])
Span('Peep Simmulmani', [{'nertag': 'PER'}])
Span('P. Simmulmani', [{'nertag': 'PER'}])
Span('P. Simmulmani', [{'nertag': 'PER'}])
Span('P. Kristuwing', [{'nertag': 'PER'}])
Span('Jaan Wõikman', [{'nertag': 'PER'}])
Span('Peter Kristuwing', [{'nertag': 'PER'}])
Span('P.K.', [{'nertag': 'PER'}])
Span('Pep Simmulmani', [{'nertag': 'PER'}])
Span('Petrel', [{'nertag': 'PER'}])
Span('Peter Kristuwingi', [{'nertag': 'PER'}])
Span('Peep Simmulmani', [{'nertag': 'PER'}])
Span('P. Simmulmani', [{'nertag': 'PER'}])
Span('P. K.', [{'nertag': 'PER'}])
Span('Peter Kristuwing', [{'nertag': 'PER'}])
Span('P.', [{'nertag': 'PER'}])
Span('Kristuwingil', [{'ner

Span('Tannil Krahwiga', [{'nertag': 'PER'}])
Span('Tannil Thalberg', [{'nertag': 'PER'}])
Span('Hanjast', [{'nertag': 'LOC'}])
Span('Dawid Wilo', [{'nertag': 'PER'}])
Span('Peter Konts Loosist', [{'nertag': 'PER'}])
Span('Tannil Krahwi', [{'nertag': 'PER'}])
Span('Dawid Wilo', [{'nertag': 'PER'}])
Span('Tannil Thalberg', [{'nertag': 'PER'}])
Span('Tannil Krahwi', [{'nertag': 'PER'}])
Span('Thalbergi', [{'nertag': 'PER'}])
Span('Wilole lasse', [{'nertag': 'LOC_ORG'}])
Span('Tannil Thalberg', [{'nertag': 'PER'}])
Span('Dawid Wilo', [{'nertag': 'PER'}])
Span('Tannil Krahwil', [{'nertag': 'PER'}])
Span('Tal.säd.ram.', [{'nertag': 'MISC'}])
Span('Dawid Wilo', [{'nertag': 'PER'}])
Span('Tannil Thalberg', [{'nertag': 'PER'}])
Span('Tannil Thalberg', [{'nertag': 'PER'}])
Span('Jürri Waldmann', [{'nertag': 'PER'}])
Span('Tannil Oinas', [{'nertag': 'PER'}])
Span('Tannil Purge', [{'nertag': 'PER'}])
Span('Wõrrolt', [{'nertag': 'LOC'}])
Span('Rudolf Karlson', [{'nertag': 'PER'}])
Span('Tannil Oina

Span('Ernitz Herrmann', [{'nertag': 'PER'}])
Span('Linnert Junn', [{'nertag': 'PER'}])
Span('Samul Raggul', [{'nertag': 'PER'}])
Span('Isak Zimmer', [{'nertag': 'PER'}])
Span('Marri Puura', [{'nertag': 'PER'}])
Span('Mihkel Kolga', [{'nertag': 'PER'}])
Span('Peeter Jaanimäggi', [{'nertag': 'PER'}])
Span('Jaan Wenzli', [{'nertag': 'PER'}])
Span('W. Ackel', [{'nertag': 'PER'}])
Span('Kulli', [{'nertag': 'LOC_ORG'}])
Span('Marri Puura', [{'nertag': 'PER'}])
Span('Peeter Tammemäe', [{'nertag': 'PER'}])
Span('Peeter', [{'nertag': 'PER'}])
Span('Kusta Kolga', [{'nertag': 'PER'}])
Span('Hens Rehkli', [{'nertag': 'PER'}])
Span('Ernitz Herrman', [{'nertag': 'PER'}])
Span('Wannast Anz', [{'nertag': 'PER'}])
Span('Samul Ragguli', [{'nertag': 'PER'}])
Span('Isak Zimmer', [{'nertag': 'PER'}])
Span('Peeter Tammemäe', [{'nertag': 'PER'}])
Span('Kusta Kolga', [{'nertag': 'PER'}])
Span('Marri', [{'nertag': 'PER'}])
Span('Kusta Kolga', [{'nertag': 'PER'}])
Span('Hans Rehkli', [{'nertag': 'PER'}])
Span('

Span('Jaan Pälsing', [{'nertag': 'PER'}])
Span('Michel Seppor', [{'nertag': 'PER'}])
Span('Leno Seppor', [{'nertag': 'PER'}])
Span('Pälling', [{'nertag': 'PER'}])
Span('Jaan Seppor', [{'nertag': 'PER'}])
Span('Marri Seppor', [{'nertag': 'PER'}])
Span('lenolw', [{'nertag': 'PER'}])
Span('Michel Seppor', [{'nertag': 'PER'}])
Span('Hans Idam', [{'nertag': 'PER'}])
Span('Jaan Pälsing', [{'nertag': 'PER'}])
Span('Chr. Raukas', [{'nertag': 'PER'}])
Span('Addaweres\xa0Teori', [{'nertag': 'PER'}])
Span('Hans Idam', [{'nertag': 'PER'}])
Span('Jaan Pälsing', [{'nertag': 'PER'}])
Span('Michel Seppor', [{'nertag': 'PER'}])
Span('Leno Seppor', [{'nertag': 'PER'}])
Span('Jaan Seppor', [{'nertag': 'PER'}])
Span('Marri Seppor', [{'nertag': 'PER'}])
Span('Michel Seppor', [{'nertag': 'PER'}])
Span('Hans Idam', [{'nertag': 'PER'}])
Span('Jaan Pälsing', [{'nertag': 'PER'}])
Span('Raukas', [{'nertag': 'PER'}])
Span('Tio Karelsohn', [{'nertag': 'PER'}])
Span('Hans Sönnajalg', [{'nertag': 'PER'}])
Span('Hans

Span('Juhkam Sumbak', [{'nertag': 'PER'}])
Span('Jaak Sumbako', [{'nertag': 'PER'}])
Span('Mall', [{'nertag': 'PER'}])
Span('Jaako', [{'nertag': 'PER'}])
Span('Malle', [{'nertag': 'PER'}])
Span('Marri Sumbak', [{'nertag': 'PER'}])
Span('Weske tallose', [{'nertag': 'LOC_ORG'}])
Span('Mallel', [{'nertag': 'PER'}])
Span('Mall', [{'nertag': 'PER'}])
Span('Jaagole', [{'nertag': 'PER'}])
Span('Marri Sumbak', [{'nertag': 'PER'}])
Span('Jaanile', [{'nertag': 'PER'}])
Span('Abram Wesk', [{'nertag': 'PER'}])
Span('Mall', [{'nertag': 'PER'}])
Span('Marri Sumbak', [{'nertag': 'PER'}])
Span('Jaak Sumbako', [{'nertag': 'PER'}])
Span('Jaan Sumbak', [{'nertag': 'PER'}])
Span('Marret Rits', [{'nertag': 'PER'}])
Span('Abramile', [{'nertag': 'PER'}])
Span('Abram', [{'nertag': 'PER'}])
Span('Abram Wesk', [{'nertag': 'PER'}])
Span('Abram Wesk', [{'nertag': 'PER'}])
Span('Marri Sumbake', [{'nertag': 'PER'}])
Span('Abram Wesk', [{'nertag': 'PER'}])
Span('Juhkam Sumbak', [{'nertag': 'PER'}])
Span('Jaan', [{'n

Span('Abram', [{'nertag': 'PER'}])
Span('Matz Kibbe', [{'nertag': 'PER'}])
Span('Jaan Kuiwas', [{'nertag': 'PER'}])
Span('Abrami', [{'nertag': 'PER'}])
Span('Abrami', [{'nertag': 'PER'}])
Span('Mango Toos', [{'nertag': 'PER'}])
Span('Abram', [{'nertag': 'PER'}])
Span('Jaani', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Abramil', [{'nertag': 'PER'}])
Span('Matz Kibbe', [{'nertag': 'PER'}])
Span('Abramit', [{'nertag': 'PER'}])
Span('Abram', [{'nertag': 'PER'}])
Span('Jaan Kuiwas', [{'nertag': 'PER'}])
Span('Abramit', [{'nertag': 'PER'}])
Span('Hans Lack', [{'nertag': 'PER'}])
Span('Jaan Abrami', [{'nertag': 'PER'}])
Span('Jaani', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Abrami', [{'nertag': 'PER'}])
Span('Matz', [{'nertag': 'PER'}])
Span('Abrami', [{'nertag': 'PER'}])
Span('Jaan', [{'nertag': 'PER'}])
Span('Abramit', [{'nertag': 'PER'}])
Span('Abram', [{'nertag': 'PER'}])
Span('Peter Pill', [{'nertag': 'PER'}])
Span('Abram', [{'nertag': 'PER'}])
Span(

Span('Poaksime', [{'nertag': 'LOC_ORG'}])
Span('Anton', [{'nertag': 'PER'}])
Span('Maritselt', [{'nertag': 'LOC'}])
Span('Poeksima', [{'nertag': 'LOC'}])
Span('Anton', [{'nertag': 'PER'}])
Span('Maritse', [{'nertag': 'LOC_ORG'}])
Span('Jürri Luik', [{'nertag': 'PER'}])
Span('Jürri Luik', [{'nertag': 'PER'}])
Span('Maritse mõtsast', [{'nertag': 'LOC'}])
Span('Maritsest', [{'nertag': 'LOC'}])
Span('poaksimale', [{'nertag': 'LOC'}])
Span('poaksima', [{'nertag': 'LOC_ORG'}])
Span('Antoni', [{'nertag': 'PER'}])
Span('Jürri Luik', [{'nertag': 'PER'}])
Span('Anton', [{'nertag': 'PER'}])
Span('Poaksima', [{'nertag': 'LOC_ORG'}])
Span('Anton Karro', [{'nertag': 'PER'}])
Span('Jaan Willo', [{'nertag': 'PER'}])
Span('Jaan Willo', [{'nertag': 'PER'}])
Span('Anton Karro', [{'nertag': 'PER'}])
Span('Anton Karro', [{'nertag': 'PER'}])
Span('Anton Karro', [{'nertag': 'PER'}])
Span('Jaan Willo', [{'nertag': 'PER'}])
Span('Jaan Willo', [{'nertag': 'PER'}])
Span('Maritse', [{'nertag': 'LOC_ORG'}])
Span('

Span('Adamiga', [{'nertag': 'PER'}])
Span('Allajõele', [{'nertag': 'LOC'}])
Span('Jurri Aukas', [{'nertag': 'PER'}])
Span('Illukalt', [{'nertag': 'LOC'}])
Span('Pootziku', [{'nertag': 'LOC_ORG'}])
Span('Adam Kristawori', [{'nertag': 'PER'}])
Span('Adam', [{'nertag': 'PER'}])
Span('Adam Kristawor', [{'nertag': 'PER'}])
Span('Illuka', [{'nertag': 'LOC'}])
Span('Jaan Leht', [{'nertag': 'PER'}])
Span('Juhhan Pluumi', [{'nertag': 'PER'}])
Span('Isakust', [{'nertag': 'LOC'}])
Span('Allajõele', [{'nertag': 'LOC'}])
Span('Jaan Leht', [{'nertag': 'PER'}])
Span('Adam', [{'nertag': 'PER'}])
Span('Adam Kristawor', [{'nertag': 'PER'}])
Span('Juhhan Pluum', [{'nertag': 'PER'}])
Span('Mihkel Taal', [{'nertag': 'PER'}])
Span('Terrewerest', [{'nertag': 'LOC'}])
Span('Maddis Pappa', [{'nertag': 'PER'}])
Span('Illukalt', [{'nertag': 'LOC'}])
Span('Kustaw Potiwar', [{'nertag': 'PER'}])
Span('Pagarilt', [{'nertag': 'LOC'}])
Span('Juhhan Pluumi', [{'nertag': 'PER'}])
Span('Adami', [{'nertag': 'PER'}])
Span(

Tulemuste ammutamine on lõpetatud.


({'ent_type': {'correct': 5516,
   'incorrect': 313,
   'partial': 0,
   'missed': 797,
   'spurious': 304,
   'possible': 6626,
   'actual': 6133,
   'precision': 0.899396706342736,
   'recall': 0.8324781165107153,
   'f1': 0.8646445646210518},
  'partial': {'correct': 5310,
   'incorrect': 0,
   'partial': 519,
   'missed': 797,
   'spurious': 304,
   'possible': 6626,
   'actual': 6133,
   'precision': 0.9081200065220936,
   'recall': 0.8405523694536674,
   'f1': 0.8730308017869739},
  'strict': {'correct': 5198,
   'incorrect': 631,
   'partial': 0,
   'missed': 797,
   'spurious': 304,
   'possible': 6626,
   'actual': 6133,
   'precision': 0.8475460622859938,
   'recall': 0.7844853607002716,
   'f1': 0.814797397915197},
  'exact': {'correct': 5310,
   'incorrect': 519,
   'partial': 0,
   'missed': 797,
   'spurious': 304,
   'possible': 6626,
   'actual': 6133,
   'precision': 0.8658079243437143,
   'recall': 0.8013884696649562,
   'f1': 0.8323536327298378}},
 {'ORG': {'ent_type