In [1]:
import json
import time
import os
import re

from modules.preprocessing_protocols import preprocess_text
from modules.extract_results import extract_results_to_txt_file, display_results_by_subdistribution,\
                                    display_results_by_named_entity, display_confusion_matrix

from estnltk import Text
from estnltk.taggers import NerTagger
from estnltk.taggers import WordLevelNerTagger
from estnltk.converters import text_to_json
from estnltk.converters import json_to_text
from estnltk.layer_operations import flatten

from estnltk.taggers.estner.ner_trainer import NerTrainer
from estnltk.taggers.estner.model_storage_util import ModelStorageUtil

In [2]:
def find(name, path):
    for root, dirs, files in os.walk(path):
        if name in files:
            return os.path.join(root, name)

These files don't work because the protocols are written in a different language, which the goldstandard didn't recognise, hence have no goldstandard tags.

In [3]:
files_not_working = ['J2rva_Tyri_V22tsa_id22177_1911a.json', \
                     'J2rva_Tyri_V22tsa_id18538_1894a.json', \
                     'J2rva_Tyri_V22tsa_id22155_1911a.json', \
                     'Saare_Kihelkonna_Kotlandi_id18845_1865a.json', \
                     'P2rnu_Halliste_Abja_id257_1844a.json', \
                     'Saare_Kaarma_Loona_id7575_1899a.json', \
                     'J2rva_Tyri_V22tsa_id22266_1913a.json', \
                     'J2rva_Tyri_V22tsa_id22178_1912a.json']

models = ['model_morph_with_lemmas_and_sentences', \
          'model_morph_with_lemmas_and_sentences_and_gazzetteer', \
          'model_morph_without_lemmas']

In [4]:
files = {}

with open(os.path.join('..', 'data', 'divided_corpus.txt'), 'r', encoding = 'UTF-8') as f:
    txt = f.readlines()

for fileName in txt:
    file, subdistribution = fileName.split(":")
    files[file] = subdistribution.rstrip("\n")

In [5]:
for model_directory in models:
    for subdistribution in [1, 2, 3, 4, 5]:
        training_subdistributions = []
        for y in [1, 2, 3, 4, 5]:
            if y == subdistribution:
                subdistribution_for_testing = y
            else:
                training_subdistributions.append(y)

            # Getting the filenames to be trained on from the files dictionary.
        filenames = {key: value for key, value in files.items() if int(value) in training_subdistributions}

        # Creating training_texts from the aforementioned filenames.
        print("Valmistan ette treenimistekste.")
        start = time.time()
        training_texts = []
        for filename in filenames:
            with open(os.path.join('..', 'data', 'vallakohtufailid-json-flattened', filename), 'r', encoding='UTF-8') as file:
                if filename in files_not_working:
                    continue
                else:
                    training_texts.append(preprocess_text(json_to_text(file.read())))
        print(f"Treenimistekstid ette valmistatud {time.time() - start} sekundiga.")
        # Setting up the trainer and training.
        print("Alustan NerTaggeri treenimist.")
        start = time.time()
        new_model_dir = os.path.join('models', model_directory)
        modelUtil = ModelStorageUtil( new_model_dir )
        nersettings = modelUtil.load_settings()
        trainer = NerTrainer(nersettings)
        trainer.train( training_texts, layer='gold_wordner', model_dir=new_model_dir )
        print(f"NerTagger treenitud {time.time() - start} sekundiga.")

        # Setting up the new trained nertagger and defining layers to be removed later on.
        nertagger = NerTagger(model_dir = new_model_dir)
        removed_layers = ['sentences', 'morph_analysis', 'compound_tokens', 'ner', 'words', 'tokens']

        # Tagging the files using the new nertagger.
        print("\n\nAlustan failide märgendamist.")
        start = time.time()
        testing_files = {key: value for key, value in files.items() if int(value) == subdistribution_for_testing}
        for file in testing_files:
            with open(find(file.replace(".json", ".txt"), os.path.join('..', 'data', 'vallakohtufailid')), 'r', encoding='UTF-8') as f:
                text = f.read()
                if file == "Tartu_V6nnu_Ahja_id3502_1882a.txt":
                    text = text.replace('..', '. .')
                text = preprocess_text(Text(text))
                nertagger.tag(text)
                text.add_layer(flatten(text['ner'], 'flat_ner'))

                for x in removed_layers:
                    text.pop_layer(x)

                text_to_json(text, file=os.path.join(new_model_dir, 'vallakohtufailid-trained-nertagger', file))
                print(f'Märgendatud fail {file}')
        print(f"Failid märgendatud {time.time() - start} sekundiga.")
    extract_results_to_txt_file(model_directory, files)
print("Programm on lõpetanud oma töö.")

Valmistan ette treenimistekste.
Treenimistekstid ette valmistatud 106.3345000743866 sekundiga.
Alustan NerTaggeri treenimist.
Feature generation
type: CRF1d
feature.minfreq: 0.000000
feature.possible_states: 0
feature.possible_transitions: 0
0....1....2....3....4....5....6....7....8....9....10
Number of features: 22088
Seconds required: 0.197

Stochastic Gradient Descent (SGD)
c2: 0.001000
max_iterations: 1000
period: 10
delta: 0.000001

Calibrating the learning rate (eta)
calibration.eta: 0.100000
calibration.rate: 2.000000
calibration.samples: 1000
calibration.candidates: 10
calibration.max_trials: 20
Initial loss: 30999.990087
Trial #1 (eta = 0.100000): 3748.069102
Trial #2 (eta = 0.200000): 5376.620239
Trial #3 (eta = 0.400000): 9877.432780
Trial #4 (eta = 0.800000): 16289.123185
Trial #5 (eta = 1.600000): 34870.702753 (worse)
Trial #6 (eta = 0.050000): 3388.817656
Trial #7 (eta = 0.025000): 3487.890373
Trial #8 (eta = 0.012500): 3870.464288
Trial #9 (eta = 0.006250): 4527.920708
T

***** Epoch #38 *****
Loss: 4491.842570
Improvement ratio: 0.208676
Feature L2-norm: 131.821026
Learning rate (eta): 0.049811
Total number of feature updates: 617234
Seconds required for this iteration: 0.206

***** Epoch #39 *****
Loss: 4554.704595
Improvement ratio: 0.126560
Feature L2-norm: 133.135904
Learning rate (eta): 0.049806
Total number of feature updates: 633477
Seconds required for this iteration: 0.207

***** Epoch #40 *****
Loss: 5104.698906
Improvement ratio: -0.023896
Feature L2-norm: 134.738982
Learning rate (eta): 0.049801
Total number of feature updates: 649720
Seconds required for this iteration: 0.207

SGD terminated with the stopping criteria
Loss: 4491.842570
Total seconds required for training: 8.517

Storing the model
Number of active features: 22088 (22088)
Number of active attributes: 15336 (15336)
Number of active labels: 11 (11)
Writing labels
Writing attributes
Writing feature references for transitions
Writing feature references for attributes
Seconds req

Märgendatud fail V6ru_R2pina_Kahkva_id24938_1868a.json
Märgendatud fail J2rva_Tyri_S2revere_id12762_1879a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id21934_1881a.json
Märgendatud fail V6ru_Vastseliina_Misso_id7468_1885a.json
Märgendatud fail Saare_K2rla_K2rla_id5736_1827a.json
Märgendatud fail Tartu_Sangaste_Kuigatsi_id16414_1872a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id2174_1867a.json
Märgendatud fail Viljandi_P6ltsamaa_Pajusi_id2717_1871a.json
Märgendatud fail Viljandi_P6ltsamaa_Vana-P6ltsamaa_id8104_1888a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id7189_1884a.json
Märgendatud fail Tartu_V6nnu_Kiidj2rve_id25125_1870a.json
Märgendatud fail L22ne_Reigi_K6rgessaare_id22613_1892a.json
Märgendatud fail J2rva_Peetri_V2ike-Kareda_id19114_1867a.json
Märgendatud fail Harju_Hageri_Kohila_id22158_1890a.json
Märgendatud fail P2rnu_P2rnu-Elisabethi_Sauga_id17814_1868a.json
Märgendatud fail Harju_Kose_Palvere_id561_1867a.json
Märgendatud fail V6ru_R2pina_R2pina_id21267_1867a.jso

***** Epoch #1 *****
Loss: 23038.435235
Feature L2-norm: 31.965118
Learning rate (eta): 0.049995
Total number of feature updates: 16201
Seconds required for this iteration: 0.229

***** Epoch #2 *****
Loss: 14842.586147
Feature L2-norm: 41.653617
Learning rate (eta): 0.049990
Total number of feature updates: 32402
Seconds required for this iteration: 0.229

***** Epoch #3 *****
Loss: 13085.328539
Feature L2-norm: 48.883563
Learning rate (eta): 0.049985
Total number of feature updates: 48603
Seconds required for this iteration: 0.231

***** Epoch #4 *****
Loss: 11392.371621
Feature L2-norm: 54.463001
Learning rate (eta): 0.049980
Total number of feature updates: 64804
Seconds required for this iteration: 0.234

***** Epoch #5 *****
Loss: 10472.966677
Feature L2-norm: 59.360345
Learning rate (eta): 0.049975
Total number of feature updates: 81005
Seconds required for this iteration: 0.232

***** Epoch #6 *****
Loss: 10163.444528
Feature L2-norm: 64.039148
Learning rate (eta): 0.049970
Tot

***** Epoch #42 *****
Loss: 4347.055663
Improvement ratio: 0.096402
Feature L2-norm: 137.145225
Learning rate (eta): 0.049791
Total number of feature updates: 680442
Seconds required for this iteration: 0.250

***** Epoch #43 *****
Loss: 4219.788690
Improvement ratio: 0.244700
Feature L2-norm: 138.324548
Learning rate (eta): 0.049786
Total number of feature updates: 696643
Seconds required for this iteration: 0.255

***** Epoch #44 *****
Loss: 4482.441246
Improvement ratio: 0.083346
Feature L2-norm: 139.586200
Learning rate (eta): 0.049781
Total number of feature updates: 712844
Seconds required for this iteration: 0.243

***** Epoch #45 *****
Loss: 4438.691999
Improvement ratio: 0.048236
Feature L2-norm: 140.927070
Learning rate (eta): 0.049776
Total number of feature updates: 729045
Seconds required for this iteration: 0.240

***** Epoch #46 *****
Loss: 4212.206297
Improvement ratio: 0.078866
Feature L2-norm: 142.075491
Learning rate (eta): 0.049771
Total number of feature updates: 7

Märgendatud fail Tartu_V6nnu_Ahja_id16395_1884a.json
Märgendatud fail Tartu_V6nnu_Ahja_id12656_1875a.json
Märgendatud fail Tartu_Kodavere_Pala_id22108_1871a.json
Märgendatud fail Tartu_Kambja_Haaslava_id8704_1867a.json
Märgendatud fail Tartu_N6o_Aru_id306_1859a.json
Märgendatud fail Tartu_Kodavere_Ranna_id15165_1864a.json
Märgendatud fail Tartu_V6nnu_Ahja_id17984_1885a.json
Märgendatud fail Tartu_Kodavere_Ranna_id14138_1855a.json
Märgendatud fail L22ne_Kullamaa_Sooniste_id3541_1880a.json
Märgendatud fail J2rva_Tyri_Tyri-Alliku_id2315_1897a.json
Märgendatud fail J2rva_Tyri_S2revere_id11683_1874a.json
Märgendatud fail Saare_Kaarma_Loona_id7575_1899a.json
Märgendatud fail V6ru_P6lva_K2hri_id21590_1851a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16351_1884a.json
Märgendatud fail Tartu_V6nnu_Ahja_id11361_1872a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16121_1883a.json
Märgendatud fail Tartu_V6nnu_Ahja_id21444_1866a.json
Märgendatud fail J2rva_Tyri_S2revere_id14702_1887a.json
Märgendatud fail L

Märgendatud fail Tartu_Kodavere_Pala_id18456_1863a.json
Märgendatud fail L22ne_Vormsi_Vormsi_id24029_1888a.json
Märgendatud fail L22ne_Emmaste_Emmaste_id17716_1897a.json
Märgendatud fail Viljandi_Tarvastu_Tarvastu_id4805_1875a.json
Märgendatud fail Tartu_V6nnu_Ahja_id9782_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22382_1870a.json
Märgendatud fail J2rva_Tyri_Kirna_id22903_1869a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id4916_1868a.json
Märgendatud fail Harju_Juuru_Juuru_id20528_1870a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13655_1882a.json
Märgendatud fail Tartu_Torma_Avinurme_id20455_1871a.json
Märgendatud fail L22ne_Martna_Martna_id12611_1884a.json
Märgendatud fail Tartu_Maarja-Magdaleena_J6e_id15191_1864a.json
Märgendatud fail P2rnu_Halliste_Pornuse_id4791_1869a.json
Märgendatud fail Tartu_R6ngu_Aakre_id8042_1827a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13144_1876a.json
Märgendatud fail Tartu_V6nnu_Ahja_id17542_1885a.json
Märgendatud fail Tartu_Kodavere_Pala_id17298_1857

***** Epoch #16 *****
Loss: 5879.902981
Improvement ratio: 0.642234
Feature L2-norm: 132.695711
Learning rate (eta): 0.099681
Total number of feature updates: 258896
Seconds required for this iteration: 0.242

***** Epoch #17 *****
Loss: 5818.752680
Improvement ratio: 0.435556
Feature L2-norm: 135.909921
Learning rate (eta): 0.099661
Total number of feature updates: 275077
Seconds required for this iteration: 0.249

***** Epoch #18 *****
Loss: 5800.746699
Improvement ratio: 0.433264
Feature L2-norm: 138.990845
Learning rate (eta): 0.099641
Total number of feature updates: 291258
Seconds required for this iteration: 0.242

***** Epoch #19 *****
Loss: 5541.347604
Improvement ratio: 0.398155
Feature L2-norm: 141.778374
Learning rate (eta): 0.099621
Total number of feature updates: 307439
Seconds required for this iteration: 0.240

***** Epoch #20 *****
Loss: 5481.499144
Improvement ratio: 0.355815
Feature L2-norm: 144.569925
Learning rate (eta): 0.099602
Total number of feature updates: 3

***** Epoch #56 *****
Loss: 3454.208116
Improvement ratio: 0.090857
Feature L2-norm: 208.890487
Learning rate (eta): 0.098892
Total number of feature updates: 906136
Seconds required for this iteration: 0.241

***** Epoch #57 *****
Loss: 3378.754062
Improvement ratio: 0.113923
Feature L2-norm: 210.037550
Learning rate (eta): 0.098873
Total number of feature updates: 922317
Seconds required for this iteration: 0.241

***** Epoch #58 *****
Loss: 3331.722849
Improvement ratio: 0.216095
Feature L2-norm: 211.167947
Learning rate (eta): 0.098853
Total number of feature updates: 938498
Seconds required for this iteration: 0.250

***** Epoch #59 *****
Loss: 3668.706139
Improvement ratio: 0.000746
Feature L2-norm: 212.430616
Learning rate (eta): 0.098834
Total number of feature updates: 954679
Seconds required for this iteration: 0.250

***** Epoch #60 *****
Loss: 3507.122846
Improvement ratio: 0.026891
Feature L2-norm: 213.571452
Learning rate (eta): 0.098814
Total number of feature updates: 9

Märgendatud fail Tartu_V6nnu_Rasina_id2088_1906a.json
Märgendatud fail V6ru_R6uge_Saaluse_id11045_1879a.json
Märgendatud fail Harju_Rapla_Rapla_id24008_1873a.json
Märgendatud fail Tartu_Kodavere_Pala_id22811_1872a.json
Märgendatud fail L22ne_K2ina_Putkaste_id8765_1867a.json
Märgendatud fail Saare_P8ide_Laimjala_id7049_1915a.json
Märgendatud fail Tartu_V6nnu_Ahja_id18951_1887a.json
Märgendatud fail Tartu_Torma_Avinurme_id21503_1872a.json
Märgendatud fail Viljandi_Paistu_Holstre_id10774_1910a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id12857_1884a.json
Märgendatud fail Viru_Haljala_Vihula_id10881_1883a.json
Märgendatud fail V6ru_Kanepi_Krootuse_id24412_1885a.json
Märgendatud fail Tartu_V6nnu_Ahja_id20417_1888a.json
Märgendatud fail Harju_Kose_Palvere_id23830_1887a.json
Märgendatud fail P2rnu_Halliste_Abja_id5030_1869a.json
Märgendatud fail V6ru_Vastseliina_Misso_id13326_1887a.json
Märgendatud fail Saare_Kihelkonna_Atla_id7055_1873a.json
Märgendatud fail J2rva_Tyri_V22tsa_id17507_188

Feature generation
type: CRF1d
feature.minfreq: 0.000000
feature.possible_states: 0
feature.possible_transitions: 0
0....1....2....3....4....5....6....7....8....9....10
Number of features: 21872
Seconds required: 0.250

Stochastic Gradient Descent (SGD)
c2: 0.001000
max_iterations: 1000
period: 10
delta: 0.000001

Calibrating the learning rate (eta)
calibration.eta: 0.100000
calibration.rate: 2.000000
calibration.samples: 1000
calibration.candidates: 10
calibration.max_trials: 20
Initial loss: 33412.272731
Trial #1 (eta = 0.100000): 2841.645790
Trial #2 (eta = 0.200000): 3839.410971
Trial #3 (eta = 0.400000): 6760.056535
Trial #4 (eta = 0.800000): 13403.444242
Trial #5 (eta = 1.600000): 27535.176505
Trial #6 (eta = 3.200000): 55284.073729 (worse)
Trial #7 (eta = 0.050000): 2853.159798
Trial #8 (eta = 0.025000): 3181.381846
Trial #9 (eta = 0.012500): 3668.420188
Trial #10 (eta = 0.006250): 4363.608013
Trial #11 (eta = 0.003125): 5392.162042
Trial #12 (eta = 0.001563): 6961.531014
Trial 

Märgendatud fail Tartu_Kodavere_Kokora_id1325_1872a.json
Märgendatud fail J2rva_Tyri_V22tsa_id22266_1913a.json
Märgendatud fail L22ne_Martna_Martna_id18100_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16620_1884a.json
Märgendatud fail V6ru_R2pina_R2pina_id12080_1866a.json
Märgendatud fail P2rnu_Halliste_Pornuse_id3474_1868a.json
Märgendatud fail Viljandi_Viljandi_Karula_id19401_1868a.json
Märgendatud fail J2rva_Tyri_V22tsa_id17427_1888a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id3144_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16098_1883a.json
Märgendatud fail V6ru_Vastseliina_Misso_id21127_1882a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id1280_1884a.json
Märgendatud fail Saare_Kihelkonna_Lymanda_id8401_1834a.json
Märgendatud fail V6ru_R2pina_Kahkva_id10870_1888a.json
Märgendatud fail L22ne_Kullamaa_Piirsalu_id14393_1908a.json
Märgendatud fail Tartu_V6nnu_Ahja_id9602_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13567_1881a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_

Märgendatud fail L22ne_Vormsi_Vormsi_id14921_1888a.json
Märgendatud fail L22ne_Vormsi_Vormsi_id25012_1888a.json
Märgendatud fail J2rva_Tyri_V22tsa_id19025_1898a.json
Märgendatud fail J2rva_Tyri_V22tsa_id16384_1885a.json
Märgendatud fail Harju_Kose_Palvere_id21108_1885a.json
Märgendatud fail Tartu_R6ngu_Aakre_id4809_1889a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id13022_1876a.json
Märgendatud fail Tartu_R6ngu_Aakre_id8898_1827a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22170_1868a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id22089_1886a.json
Märgendatud fail J2rva_Anna_Purdi_id25497_1870a.json
Märgendatud fail Tartu_V6nnu_Ahja_id17890_1885a.json
Märgendatud fail Viljandi_P6ltsamaa_Pajusi_id6831_1871a.json
Märgendatud fail L22ne_Pyhalepa_K2rdla_id23188_1872a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id1584_1878a.json
Märgendatud fail Viljandi_P6ltsamaa_Uue-P6ltsamaa_id6410_1853a.json
Märgendatud fail L22ne_Martna_Martna_id17524_1871a.json
Märgendatud fail V6ru_Vastseliina_Mis

***** Epoch #6 *****
Loss: 8952.881102
Feature L2-norm: 90.603891
Learning rate (eta): 0.099880
Total number of feature updates: 93684
Seconds required for this iteration: 0.251

***** Epoch #7 *****
Loss: 8836.870739
Feature L2-norm: 96.685603
Learning rate (eta): 0.099860
Total number of feature updates: 109298
Seconds required for this iteration: 0.254

***** Epoch #8 *****
Loss: 8053.090878
Feature L2-norm: 101.196632
Learning rate (eta): 0.099840
Total number of feature updates: 124912
Seconds required for this iteration: 0.248

***** Epoch #9 *****
Loss: 7600.985011
Feature L2-norm: 105.871508
Learning rate (eta): 0.099820
Total number of feature updates: 140526
Seconds required for this iteration: 0.254

***** Epoch #10 *****
Loss: 10114.073781
Feature L2-norm: 113.206357
Learning rate (eta): 0.099800
Total number of feature updates: 156140
Seconds required for this iteration: 0.255

***** Epoch #11 *****
Loss: 8009.365548
Improvement ratio: 2.107790
Feature L2-norm: 116.063098


Märgendatud fail Tartu_Kodavere_Alatskivi_id9914_1880a.json
Märgendatud fail L22ne_Pyhalepa_K2rdla_id23461_1873a.json
Märgendatud fail Tartu_V6nnu_Ahja_id21842_1868a.json
Märgendatud fail Harju_J6el2htme_J6el2htme_id7633_1870a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id13040_1856a.json
Märgendatud fail Saare_P8ide_Laimjala_id6577_1917a.json
Märgendatud fail J2rva_Tyri_Kirna_id24066_1879a.json
Märgendatud fail L22ne_Ridala_Sinalepa_id25489_1890a.json
Märgendatud fail Tartu_V6nnu_Ahja_id11349_1872a.json
Märgendatud fail Tartu_Kodavere_Ranna_id14234_1857a.json
Märgendatud fail V6ru_P6lva_K2hri_id21791_1851a.json
Märgendatud fail Tartu_V6nnu_Ahja_id23744_1896a.json
Märgendatud fail V6ru_R2pina_Kahkva_id21602_1867a.json
Märgendatud fail Tartu_Kodavere_Ranna_id19767_1865a.json
Märgendatud fail Tartu_Torma_Avinurme_id23582_1872a.json
Märgendatud fail Tartu_R6ngu_Aakre_id2550_1888a.json
Märgendatud fail J2rva_Tyri_Kirna_id24064_1879a.json
Märgendatud fail Tartu_V6nnu_Ahja_id19682_1888a.j

Märgendatud fail J2rva_Tyri_V22tsa_id16955_1887a.json
Märgendatud fail J2rva_J2rva-Jaani_Einmanni_id9007_1868a.json
Märgendatud fail Tartu_V6nnu_Ahja_id23568_1895a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id1504_1865a.json
Märgendatud fail P2rnu_P2rnu-Elisabethi_Sauga_id18104_1877a.json
Märgendatud fail L22ne_Emmaste_Emmaste_id8296_1894a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13380_1881a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id9556_1885a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22940_1889a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id4128_1883a.json
Märgendatud fail J2rva_Tyri_S2revere_id16068_1889a.json
Märgendatud fail Tartu_Kodavere_Pala_id23072_1872a.json
Märgendatud fail Harju_Kose_Triigi_id11698_1876a.json
Märgendatud fail V6ru_P6lva_Peri_id10140_1891a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id12747_1884a.json
Märgendatud fail J2rva_Tyri_S2revere_id12373_1877a.json
Märgendatud fail Viljandi_Pilistvere_K6o_id24950_1843a.json
Märgendatud fail J2rva_Tyri_Ki

***** Epoch #22 *****
Loss: 5698.395852
Improvement ratio: 0.251469
Feature L2-norm: 104.644790
Learning rate (eta): 0.049890
Total number of feature updates: 357346
Seconds required for this iteration: 0.254

***** Epoch #23 *****
Loss: 5323.975484
Improvement ratio: 0.350501
Feature L2-norm: 106.429115
Learning rate (eta): 0.049885
Total number of feature updates: 373589
Seconds required for this iteration: 0.255

***** Epoch #24 *****
Loss: 5764.779853
Improvement ratio: 0.184913
Feature L2-norm: 108.449235
Learning rate (eta): 0.049880
Total number of feature updates: 389832
Seconds required for this iteration: 0.265

***** Epoch #25 *****
Loss: 5119.294470
Improvement ratio: 0.321785
Feature L2-norm: 110.143677
Learning rate (eta): 0.049875
Total number of feature updates: 406075
Seconds required for this iteration: 0.250

***** Epoch #26 *****
Loss: 5084.251748
Improvement ratio: 0.282948
Feature L2-norm: 111.841309
Learning rate (eta): 0.049870
Total number of feature updates: 4

***** Epoch #63 *****
Loss: 3436.413246
Improvement ratio: 0.070750
Feature L2-norm: 156.743264
Learning rate (eta): 0.049687
Total number of feature updates: 1023309
Seconds required for this iteration: 0.254

***** Epoch #64 *****
Loss: 3538.661103
Improvement ratio: 0.119521
Feature L2-norm: 157.767041
Learning rate (eta): 0.049682
Total number of feature updates: 1039552
Seconds required for this iteration: 0.256

***** Epoch #65 *****
Loss: 3505.245904
Improvement ratio: 0.032355
Feature L2-norm: 158.598881
Learning rate (eta): 0.049677
Total number of feature updates: 1055795
Seconds required for this iteration: 0.256

***** Epoch #66 *****
Loss: 3623.710368
Improvement ratio: -0.018036
Feature L2-norm: 159.510250
Learning rate (eta): 0.049672
Total number of feature updates: 1072038
Seconds required for this iteration: 0.251

SGD terminated with the stopping criteria
Loss: 3436.413246
Total seconds required for training: 17.099

Storing the model
Number of active features: 22543

Märgendatud fail Tartu_Kodavere_Alatskivi_id1662_1878a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id3126_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id18630_1886a.json
Märgendatud fail V6ru_Vastseliina_Misso_id13714_1886a.json
Märgendatud fail V6ru_R2pina_Kahkva_id24938_1868a.json
Märgendatud fail J2rva_Tyri_S2revere_id12762_1879a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id21934_1881a.json
Märgendatud fail V6ru_Vastseliina_Misso_id7468_1885a.json
Märgendatud fail Saare_K2rla_K2rla_id5736_1827a.json
Märgendatud fail Tartu_Sangaste_Kuigatsi_id16414_1872a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id2174_1867a.json
Märgendatud fail Viljandi_P6ltsamaa_Pajusi_id2717_1871a.json
Märgendatud fail Viljandi_P6ltsamaa_Vana-P6ltsamaa_id8104_1888a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id7189_1884a.json
Märgendatud fail Tartu_V6nnu_Kiidj2rve_id25125_1870a.json
Märgendatud fail L22ne_Reigi_K6rgessaare_id22613_1892a.json
Märgendatud fail J2rva_Peetri_V2ike-Kareda_id19114_1867a.

***** Epoch #4 *****
Loss: 11245.808515
Feature L2-norm: 53.060273
Learning rate (eta): 0.049980
Total number of feature updates: 64804
Seconds required for this iteration: 0.248

***** Epoch #5 *****
Loss: 9836.836904
Feature L2-norm: 57.657976
Learning rate (eta): 0.049975
Total number of feature updates: 81005
Seconds required for this iteration: 0.259

***** Epoch #6 *****
Loss: 9771.871575
Feature L2-norm: 62.435468
Learning rate (eta): 0.049970
Total number of feature updates: 97206
Seconds required for this iteration: 0.255

***** Epoch #7 *****
Loss: 8859.032666
Feature L2-norm: 66.049230
Learning rate (eta): 0.049965
Total number of feature updates: 113407
Seconds required for this iteration: 0.261

***** Epoch #8 *****
Loss: 8670.164942
Feature L2-norm: 69.842222
Learning rate (eta): 0.049960
Total number of feature updates: 129608
Seconds required for this iteration: 0.248

***** Epoch #9 *****
Loss: 8104.246537
Feature L2-norm: 73.192799
Learning rate (eta): 0.049955
Total 

***** Epoch #47 *****
Loss: 3808.815818
Improvement ratio: 0.117482
Feature L2-norm: 140.363526
Learning rate (eta): 0.049766
Total number of feature updates: 761447
Seconds required for this iteration: 0.256

***** Epoch #48 *****
Loss: 3794.973356
Improvement ratio: 0.114092
Feature L2-norm: 141.467120
Learning rate (eta): 0.049761
Total number of feature updates: 777648
Seconds required for this iteration: 0.259

***** Epoch #49 *****
Loss: 3731.249112
Improvement ratio: 0.147066
Feature L2-norm: 142.547302
Learning rate (eta): 0.049756
Total number of feature updates: 793849
Seconds required for this iteration: 0.259

***** Epoch #50 *****
Loss: 3660.277268
Improvement ratio: 0.114394
Feature L2-norm: 143.598486
Learning rate (eta): 0.049751
Total number of feature updates: 810050
Seconds required for this iteration: 0.263

***** Epoch #51 *****
Loss: 3683.089371
Improvement ratio: 0.102443
Feature L2-norm: 144.650241
Learning rate (eta): 0.049746
Total number of feature updates: 8

Märgendatud fail Harju_Kose_Habaja_id733_1874a.json
Märgendatud fail Harju_Hageri_Kohila_id5579_1890a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id13497_1881a.json
Märgendatud fail Tartu_R6ngu_Aakre_id1396_1888a.json
Märgendatud fail Harju_Kuusalu_Kolga_id11589_1887a.json
Märgendatud fail J2rva_J2rva-Jaani_Karinu_id1338_1866a.json
Märgendatud fail Harju_Kose_Palvere_id18187_1882a.json
Märgendatud fail Harju_Kose_Palvere_id15288_1880a.json
Märgendatud fail L22ne_Martna_Martna_id24960_1875a.json
Märgendatud fail V6ru_Vastseliina_Misso_id5941_1885a.json
Märgendatud fail V6ru_Vastseliina_Misso_id24818_1886a.json
Märgendatud fail Tartu_V6nnu_Ahja_id15321_1883a.json
Märgendatud fail Harju_Juuru_Juuru_id493_1877a.json
Märgendatud fail Tartu_Laiuse_Kivij2rve_id15455_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16984_1884a.json
Märgendatud fail J2rva_Ambla_Ambla_id7106_1886a.json
Märgendatud fail L22ne_Ridala_Sinalepa_id25516_1887a.json
Märgendatud fail J2rva_Ambla_Ambla_id11918_1883a.jso

Märgendatud fail Harju_Kose_Palvere_id17062_1882a.json
Märgendatud fail V6ru_Vastseliina_Misso_id14456_1881a.json
Märgendatud fail Viljandi_P6ltsamaa_Uue-P6ltsamaa_id9345_1855a.json
Märgendatud fail J2rva_Tyri_S2revere_id14667_1887a.json
Märgendatud fail Tartu_V6nnu_Ahja_id19686_1888a.json
Märgendatud fail J2rva_Tyri_Kirna_id23886_1875a.json
Märgendatud fail V6ru_R6uge_Leevi_id24219_1875a.json
Märgendatud fail J2rva_Tyri_Kirna_id23286_1872a.json
Märgendatud fail Tartu_V6nnu_Ahja_id19466_1888a.json
Märgendatud fail J2rva_Tyri_V22tsa_id18472_1889a.json
Märgendatud fail Saare_Kihelkonna_Kotlandi_id15249_1860a.json
Märgendatud fail Tartu_V6nnu_Ahja_id11346_1872a.json
Märgendatud fail Harju_Rapla_Rapla_id22195_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13021_1876a.json
Märgendatud fail Harju_Jyri_Rae_id268_1874a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id5700_1879a.json
Märgendatud fail Tartu_Torma_Avinurme_id3955_1858a.json
Failid märgendatud 218.12836170196533 sekundiga.
Valmist

***** Epoch #30 *****
Loss: 4083.598744
Improvement ratio: 0.316214
Feature L2-norm: 166.315120
Learning rate (eta): 0.099404
Total number of feature updates: 485430
Seconds required for this iteration: 0.274

***** Epoch #31 *****
Loss: 4061.116428
Improvement ratio: 0.427076
Feature L2-norm: 168.206444
Learning rate (eta): 0.099384
Total number of feature updates: 501611
Seconds required for this iteration: 0.266

***** Epoch #32 *****
Loss: 4396.682124
Improvement ratio: 0.178229
Feature L2-norm: 170.338056
Learning rate (eta): 0.099364
Total number of feature updates: 517792
Seconds required for this iteration: 0.265

***** Epoch #33 *****
Loss: 4077.887276
Improvement ratio: 0.231447
Feature L2-norm: 172.214061
Learning rate (eta): 0.099344
Total number of feature updates: 533973
Seconds required for this iteration: 0.268

***** Epoch #34 *****
Loss: 4131.892256
Improvement ratio: 0.089020
Feature L2-norm: 174.044373
Learning rate (eta): 0.099325
Total number of feature updates: 5

Märgendatud fail Viljandi_Paistu_Holstre_id10774_1910a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id12857_1884a.json
Märgendatud fail Viru_Haljala_Vihula_id10881_1883a.json
Märgendatud fail V6ru_Kanepi_Krootuse_id24412_1885a.json
Märgendatud fail Tartu_V6nnu_Ahja_id20417_1888a.json
Märgendatud fail Harju_Kose_Palvere_id23830_1887a.json
Märgendatud fail P2rnu_Halliste_Abja_id5030_1869a.json
Märgendatud fail V6ru_Vastseliina_Misso_id13326_1887a.json
Märgendatud fail Saare_Kihelkonna_Atla_id7055_1873a.json
Märgendatud fail J2rva_Tyri_V22tsa_id17507_1888a.json
Märgendatud fail Tartu_V6nnu_Ahja_id2739_1899a.json
Märgendatud fail P2rnu_Tori_Sindi_id19854_1834a.json
Märgendatud fail Viru_Lyganuse_Pyssi_id8850_1904a.json
Märgendatud fail Tartu_V6nnu_Ahja_id18473_1886a.json
Märgendatud fail J2rva_J2rva-Jaani_Karinu_id1817_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id17455_1885a.json
Märgendatud fail Viru_Iisaku_Pootsiku_id7993_1880a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id3664_1885

***** Epoch #3 *****
Loss: 11958.868677
Feature L2-norm: 67.969843
Learning rate (eta): 0.099940
Total number of feature updates: 46035
Seconds required for this iteration: 0.257

***** Epoch #4 *****
Loss: 10601.388387
Feature L2-norm: 74.655473
Learning rate (eta): 0.099920
Total number of feature updates: 61380
Seconds required for this iteration: 0.245

***** Epoch #5 *****
Loss: 9624.659457
Feature L2-norm: 82.022832
Learning rate (eta): 0.099900
Total number of feature updates: 76725
Seconds required for this iteration: 0.258

***** Epoch #6 *****
Loss: 8348.829074
Feature L2-norm: 87.515298
Learning rate (eta): 0.099880
Total number of feature updates: 92070
Seconds required for this iteration: 0.254

***** Epoch #7 *****
Loss: 7598.212786
Feature L2-norm: 92.713045
Learning rate (eta): 0.099860
Total number of feature updates: 107415
Seconds required for this iteration: 0.258

***** Epoch #8 *****
Loss: 7461.483783
Feature L2-norm: 97.900325
Learning rate (eta): 0.099840
Total 

Märgendatud fail Tartu_Otep22_Pyhaj2rve_id1280_1884a.json
Märgendatud fail Saare_Kihelkonna_Lymanda_id8401_1834a.json
Märgendatud fail V6ru_R2pina_Kahkva_id10870_1888a.json
Märgendatud fail L22ne_Kullamaa_Piirsalu_id14393_1908a.json
Märgendatud fail Tartu_V6nnu_Ahja_id9602_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13567_1881a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id22106_1881a.json
Märgendatud fail L22ne_Martna_Martna_id12249_1881a.json
Märgendatud fail Harju_Hageri_Kohila_id1346_1888a.json
Märgendatud fail Viljandi_P6ltsamaa_Uue-P6ltsamaa_id12394_1856a.json
Märgendatud fail Harju_Hageri_Kohila_id5466_1889a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id1725_1867a.json
Märgendatud fail Tartu_Torma_Avinurme_id23583_1872a.json
Märgendatud fail J2rva_Tyri_V22tsa_id17884_1888a.json
Märgendatud fail J2rva_Tyri_S2revere_id16082_1889a.json
Märgendatud fail V6ru_Vastseliina_Misso_id17348_1882a.json
Märgendatud fail P2rnu_Audru_V6lla_id6632_1878a.json
Märgendatud fail P2rnu_Audr

Märgendatud fail Tartu_V6nnu_Ahja_id17890_1885a.json
Märgendatud fail Viljandi_P6ltsamaa_Pajusi_id6831_1871a.json
Märgendatud fail L22ne_Pyhalepa_K2rdla_id23188_1872a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id1584_1878a.json
Märgendatud fail Viljandi_P6ltsamaa_Uue-P6ltsamaa_id6410_1853a.json
Märgendatud fail L22ne_Martna_Martna_id17524_1871a.json
Märgendatud fail V6ru_Vastseliina_Misso_id24932_1886a.json
Märgendatud fail Tartu_Laiuse_Kivij2rve_id4291_1862a.json
Märgendatud fail V6ru_Vastseliina_Misso_id13301_1880a.json
Märgendatud fail L22ne_Emmaste_Emmaste_id15690_1896a.json
Märgendatud fail Tartu_V6nnu_Ahja_id14973_1883a.json
Märgendatud fail Tartu_V6nnu_Ahja_id21238_1889a.json
Märgendatud fail Tartu_V6nnu_Ahja_id9656_1871a.json
Märgendatud fail Saare_Kaarma_Loona_id1233_1912a.json
Märgendatud fail Tartu_Torma_Avinurme_id21307_1872a.json
Märgendatud fail V6ru_Vastseliina_Misso_id20674_1882a.json
Märgendatud fail Harju_Jyri_Rae_id3658_1888a.json
Märgendatud fail J2rva_Tyri_S2re

***** Epoch #13 *****
Loss: 5870.754244
Improvement ratio: 1.101622
Feature L2-norm: 120.039884
Learning rate (eta): 0.099741
Total number of feature updates: 202982
Seconds required for this iteration: 0.254

***** Epoch #14 *****
Loss: 5646.518746
Improvement ratio: 0.901116
Feature L2-norm: 123.206848
Learning rate (eta): 0.099721
Total number of feature updates: 218596
Seconds required for this iteration: 0.246

***** Epoch #15 *****
Loss: 5963.004486
Improvement ratio: 0.625750
Feature L2-norm: 126.796465
Learning rate (eta): 0.099701
Total number of feature updates: 234210
Seconds required for this iteration: 0.244

***** Epoch #16 *****
Loss: 5249.192282
Improvement ratio: 0.730149
Feature L2-norm: 129.581882
Learning rate (eta): 0.099681
Total number of feature updates: 249824
Seconds required for this iteration: 0.265

***** Epoch #17 *****
Loss: 5519.202173
Improvement ratio: 0.541541
Feature L2-norm: 132.900779
Learning rate (eta): 0.099661
Total number of feature updates: 2

Märgendatud fail V6ru_Vastseliina_Misso_id22085_1883a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13957_1882a.json
Märgendatud fail Harju_Kose_Palvere_id16729_1881a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id4665_1883a.json
Märgendatud fail P2rnu_Tori_Tori_id25337_1890a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22380_1869a.json
Märgendatud fail Harju_Kose_Triigi_id9421_1867a.json
Märgendatud fail Tartu_Kodavere_Ranna_id15035_1862a.json
Märgendatud fail Harju_Kose_Triigi_id9938_1870a.json
Märgendatud fail Viru_Rakvere_S6meru_id5673_1882a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id1540_1884a.json
Märgendatud fail J2rva_Tyri_V22tsa_id22178_1912a.json
Märgendatud fail Harju_Juuru_Kaiu_id9874_1882a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id7840_1885a.json
Märgendatud fail V6ru_R2pina_Kahkva_id8869_1888a.json
Märgendatud fail Tartu_R6ngu_Aakre_id9106_1827a.json
Märgendatud fail V6ru_Vastseliina_Misso_id8101_1885a.json
Märgendatud fail V6ru_Vastseliina_Misso_id13681_1886a.json
Märg

Märgendatud fail Harju_Kose_Kose-Uuem6isa_id6353_1869a.json
Märgendatud fail J2rva_Tyri_V22tsa_id17496_1888a.json
Märgendatud fail P2rnu_P2rnu-Elisabethi_Sauga_id18745_1877a.json
Märgendatud fail Tartu_V6nnu_Ahja_id18234_1886a.json
Märgendatud fail Tartu_Torma_Avinurme_id20454_1871a.json
Märgendatud fail Harju_Rapla_Rapla_id18671_1869a.json
Märgendatud fail Tartu_V6nnu_Ahja_id18214_1886a.json
Märgendatud fail Tartu_Laiuse_Kivij2rve_id1436_1856a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22561_1878a.json
Märgendatud fail Tartu_Kodavere_Ranna_id14286_1858a.json
Märgendatud fail P2rnu_Halliste_Penuja_id758_1885a.json
Märgendatud fail Saare_Kihelkonna_Atla_id6893_1872a.json
Märgendatud fail Harju_Hageri_Kohila_id10769_1873a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16318_1883a.json
Märgendatud fail J2rva_Anna_Eivere_id6239_1879a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id12871_1876a.json
Märgendatud fail J2rva_Tyri_V22tsa_id16931_1886a.json
Märgendatud fail Harju_Harju-Madise_Padise-Klo

***** Epoch #11 *****
Loss: 6386.913951
Improvement ratio: 3.050585
Feature L2-norm: 120.180236
Learning rate (eta): 0.099780
Total number of feature updates: 178673
Seconds required for this iteration: 0.228

***** Epoch #12 *****
Loss: 5646.161451
Improvement ratio: 1.455542
Feature L2-norm: 123.713578
Learning rate (eta): 0.099761
Total number of feature updates: 194916
Seconds required for this iteration: 0.239

***** Epoch #13 *****
Loss: 5156.227248
Improvement ratio: 1.287760
Feature L2-norm: 127.044063
Learning rate (eta): 0.099741
Total number of feature updates: 211159
Seconds required for this iteration: 0.238

***** Epoch #14 *****
Loss: 5284.307123
Improvement ratio: 0.882185
Feature L2-norm: 130.409654
Learning rate (eta): 0.099721
Total number of feature updates: 227402
Seconds required for this iteration: 0.235

***** Epoch #15 *****
Loss: 5436.032920
Improvement ratio: 0.646008
Feature L2-norm: 133.944643
Learning rate (eta): 0.099701
Total number of feature updates: 2



Alustan failide märgendamist.
Märgendatud fail V6ru_R2pina_Kahkva_id24674_1868a.json
Märgendatud fail L22ne_Martna_Martna_id14205_1869a.json
Märgendatud fail Harju_Juuru_Juuru_id19451_1886a.json
Märgendatud fail Tartu_Kodavere_Ranna_id11316_1845a.json
Märgendatud fail J2rva_Peetri_V2ike-Kareda_id22448_1881a.json
Märgendatud fail L22ne_Vormsi_Vormsi_id24908_1888a.json
Märgendatud fail J2rva_Tyri_V22tsa_id20382_1901a.json
Märgendatud fail Tartu_Laiuse_Kivij2rve_id13162_1866a.json
Märgendatud fail Tartu_V6nnu_Ahja_id20418_1888a.json
Märgendatud fail L22ne_Vormsi_Vormsi_id24521_1888a.json
Märgendatud fail P2rnu_Mihkli_Mihkli_id1099_1852a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16184_1883a.json
Märgendatud fail Tartu_V6nnu_Ahja_id10343_1871a.json
Märgendatud fail L22ne_Ridala_V6nnu_id2373_1889a.json
Märgendatud fail Harju_Hageri_Kohila_id2634_1882a.json
Märgendatud fail L22ne_Martna_Martna_id10803_1890a.json
Märgendatud fail V6ru_Vastseliina_Misso_id13294_1887a.json
Märgendatud fail P2rn

Märgendatud fail Tartu_V6nnu_Ahja_id21768_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id20314_1888a.json
Märgendatud fail Tartu_R6ngu_Aakre_id4282_1888a.json
Märgendatud fail J2rva_Tyri_S2revere_id6796_1883a.json
Märgendatud fail V6ru_R2pina_R2pina_id10711_1868a.json
Märgendatud fail Harju_Kose_Palvere_id23525_1887a.json
Märgendatud fail Tartu_R6ngu_Aakre_id13836_1829a.json
Märgendatud fail P2rnu_Halliste_Penuja_id657_1885a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id11390_1880a.json
Märgendatud fail V6ru_Vastseliina_Misso_id11633_1886a.json
Märgendatud fail Viljandi_P6ltsamaa_Adavere_id20850_1896a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id3008_1884a.json
Märgendatud fail J2rva_Ambla_Ambla_id7255_1886a.json
Märgendatud fail Tartu_Torma_Avinurme_id23576_1872a.json
Märgendatud fail Harju_J6el2htme_J6el2htme_id7375_1869a.json
Märgendatud fail Tartu_Kodavere_Pala_id18163_1862a.json
Märgendatud fail L22ne_Vormsi_Vormsi_id24037_1888a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22714_

***** Epoch #6 *****
Loss: 8933.837287
Feature L2-norm: 67.614780
Learning rate (eta): 0.049970
Total number of feature updates: 97206
Seconds required for this iteration: 0.238

***** Epoch #7 *****
Loss: 8300.732299
Feature L2-norm: 71.625354
Learning rate (eta): 0.049965
Total number of feature updates: 113407
Seconds required for this iteration: 0.232

***** Epoch #8 *****
Loss: 8247.804885
Feature L2-norm: 75.629932
Learning rate (eta): 0.049960
Total number of feature updates: 129608
Seconds required for this iteration: 0.246

***** Epoch #9 *****
Loss: 7479.418857
Feature L2-norm: 78.995052
Learning rate (eta): 0.049955
Total number of feature updates: 145809
Seconds required for this iteration: 0.206

***** Epoch #10 *****
Loss: 7271.160717
Feature L2-norm: 82.199369
Learning rate (eta): 0.049950
Total number of feature updates: 162010
Seconds required for this iteration: 0.216

***** Epoch #11 *****
Loss: 6828.329742
Improvement ratio: 2.602366
Feature L2-norm: 85.127425
Learn

***** Epoch #47 *****
Loss: 3485.167925
Improvement ratio: 0.090760
Feature L2-norm: 145.174975
Learning rate (eta): 0.049766
Total number of feature updates: 761447
Seconds required for this iteration: 0.255

***** Epoch #48 *****
Loss: 3676.381355
Improvement ratio: 0.059443
Feature L2-norm: 146.141676
Learning rate (eta): 0.049761
Total number of feature updates: 777648
Seconds required for this iteration: 0.249

***** Epoch #49 *****
Loss: 3383.938608
Improvement ratio: 0.126425
Feature L2-norm: 147.135763
Learning rate (eta): 0.049756
Total number of feature updates: 793849
Seconds required for this iteration: 0.245

***** Epoch #50 *****
Loss: 3364.221994
Improvement ratio: 0.093418
Feature L2-norm: 148.124086
Learning rate (eta): 0.049751
Total number of feature updates: 810050
Seconds required for this iteration: 0.238

***** Epoch #51 *****
Loss: 3349.520613
Improvement ratio: 0.097548
Feature L2-norm: 149.097949
Learning rate (eta): 0.049746
Total number of feature updates: 8

Märgendatud fail Harju_Kuusalu_Kolga_id11589_1887a.json
Märgendatud fail J2rva_J2rva-Jaani_Karinu_id1338_1866a.json
Märgendatud fail Harju_Kose_Palvere_id18187_1882a.json
Märgendatud fail Harju_Kose_Palvere_id15288_1880a.json
Märgendatud fail L22ne_Martna_Martna_id24960_1875a.json
Märgendatud fail V6ru_Vastseliina_Misso_id5941_1885a.json
Märgendatud fail V6ru_Vastseliina_Misso_id24818_1886a.json
Märgendatud fail Tartu_V6nnu_Ahja_id15321_1883a.json
Märgendatud fail Harju_Juuru_Juuru_id493_1877a.json
Märgendatud fail Tartu_Laiuse_Kivij2rve_id15455_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16984_1884a.json
Märgendatud fail J2rva_Ambla_Ambla_id7106_1886a.json
Märgendatud fail L22ne_Ridala_Sinalepa_id25516_1887a.json
Märgendatud fail J2rva_Ambla_Ambla_id11918_1883a.json
Märgendatud fail Harju_Juuru_Juuru_id3335_1878a.json
Märgendatud fail L22ne_Pyhalepa_K2rdla_id23196_1872a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id7278_1879a.json
Märgendatud fail Tartu_V6nnu_Ahja_id17220_1884a.

Märgendatud fail Tartu_V6nnu_Ahja_id19686_1888a.json
Märgendatud fail J2rva_Tyri_Kirna_id23886_1875a.json
Märgendatud fail V6ru_R6uge_Leevi_id24219_1875a.json
Märgendatud fail J2rva_Tyri_Kirna_id23286_1872a.json
Märgendatud fail Tartu_V6nnu_Ahja_id19466_1888a.json
Märgendatud fail J2rva_Tyri_V22tsa_id18472_1889a.json
Märgendatud fail Saare_Kihelkonna_Kotlandi_id15249_1860a.json
Märgendatud fail Tartu_V6nnu_Ahja_id11346_1872a.json
Märgendatud fail Harju_Rapla_Rapla_id22195_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13021_1876a.json
Märgendatud fail Harju_Jyri_Rae_id268_1874a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id5700_1879a.json
Märgendatud fail Tartu_Torma_Avinurme_id3955_1858a.json
Failid märgendatud 202.42531657218933 sekundiga.
Valmistan ette treenimistekste.
Treenimistekstid ette valmistatud 130.6628773212433 sekundiga.
Alustan NerTaggeri treenimist.
Feature generation
type: CRF1d
feature.minfreq: 0.000000
feature.possible_states: 0
feature.possible_transitions: 0
0..

***** Epoch #33 *****
Loss: 3458.370518
Improvement ratio: 0.212858
Feature L2-norm: 173.522709
Learning rate (eta): 0.099344
Total number of feature updates: 533973
Seconds required for this iteration: 0.244

***** Epoch #34 *****
Loss: 4304.972929
Improvement ratio: -0.070513
Feature L2-norm: 175.922095
Learning rate (eta): 0.099325
Total number of feature updates: 550154
Seconds required for this iteration: 0.236

SGD terminated with the stopping criteria
Loss: 3458.370518
Total seconds required for training: 8.590

Storing the model
Number of active features: 33575 (33575)
Number of active attributes: 24313 (24313)
Number of active labels: 11 (11)
Writing labels
Writing attributes
Writing feature references for transitions
Writing feature references for attributes
Seconds required: 0.059

NerTagger treenitud 745.9184312820435 sekundiga.


Alustan failide märgendamist.
Märgendatud fail P2rnu_Tori_Sindi_id20212_1838a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id12190_1884a.json
M

Märgendatud fail Tartu_V6nnu_Ahja_id17455_1885a.json
Märgendatud fail Viru_Iisaku_Pootsiku_id7993_1880a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id3664_1885a.json
Märgendatud fail V6ru_Vastseliina_Misso_id10864_1886a.json
Märgendatud fail L22ne_Martna_Martna_id13208_1887a.json
Märgendatud fail Tartu_V6nnu_Ahja_id18356_1886a.json
Märgendatud fail V6ru_R6uge_Saaluse_id9637_1878a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id12703_1876a.json
Märgendatud fail Saare_Kihelkonna_Kotlandi_id20006_1866a.json
Märgendatud fail Tartu_Kodavere_Pala_id22521_1871a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id15770_1877a.json
Märgendatud fail Tartu_Torma_Avinurme_id14519_1903a.json
Märgendatud fail Tartu_V6nnu_Ahja_id10335_1871a.json
Märgendatud fail Tartu_Kodavere_Pala_id708_1875a.json
Märgendatud fail Saare_Kihelkonna_Kotlandi_id20014_1867a.json
Märgendatud fail V6ru_R2pina_Kahkva_id5746_1887a.json
Märgendatud fail Tartu_Kursi_Puurmani_id10088_1874a.json
Märgendatud fail Tartu_Kodavere_Pa

***** Epoch #2 *****
Loss: 13946.078363
Feature L2-norm: 63.643852
Learning rate (eta): 0.099960
Total number of feature updates: 30690
Seconds required for this iteration: 0.240

***** Epoch #3 *****
Loss: 11151.647238
Feature L2-norm: 72.521471
Learning rate (eta): 0.099940
Total number of feature updates: 46035
Seconds required for this iteration: 0.231

***** Epoch #4 *****
Loss: 9720.551835
Feature L2-norm: 80.573191
Learning rate (eta): 0.099920
Total number of feature updates: 61380
Seconds required for this iteration: 0.252

***** Epoch #5 *****
Loss: 8116.602902
Feature L2-norm: 87.311220
Learning rate (eta): 0.099900
Total number of feature updates: 76725
Seconds required for this iteration: 0.235

***** Epoch #6 *****
Loss: 7429.388670
Feature L2-norm: 93.226547
Learning rate (eta): 0.099880
Total number of feature updates: 92070
Seconds required for this iteration: 0.237

***** Epoch #7 *****
Loss: 6670.443580
Feature L2-norm: 98.532238
Learning rate (eta): 0.099860
Total n

Märgendatud fail Tartu_Kodavere_Kokora_id1325_1872a.json
Märgendatud fail J2rva_Tyri_V22tsa_id22266_1913a.json
Märgendatud fail L22ne_Martna_Martna_id18100_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16620_1884a.json
Märgendatud fail V6ru_R2pina_R2pina_id12080_1866a.json
Märgendatud fail P2rnu_Halliste_Pornuse_id3474_1868a.json
Märgendatud fail Viljandi_Viljandi_Karula_id19401_1868a.json
Märgendatud fail J2rva_Tyri_V22tsa_id17427_1888a.json
Märgendatud fail Harju_Kose_Kose-Uuem6isa_id3144_1867a.json
Märgendatud fail Tartu_V6nnu_Ahja_id16098_1883a.json
Märgendatud fail V6ru_Vastseliina_Misso_id21127_1882a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id1280_1884a.json
Märgendatud fail Saare_Kihelkonna_Lymanda_id8401_1834a.json
Märgendatud fail V6ru_R2pina_Kahkva_id10870_1888a.json
Märgendatud fail L22ne_Kullamaa_Piirsalu_id14393_1908a.json
Märgendatud fail Tartu_V6nnu_Ahja_id9602_1871a.json
Märgendatud fail Tartu_V6nnu_Ahja_id13567_1881a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_

Märgendatud fail L22ne_Vormsi_Vormsi_id14921_1888a.json
Märgendatud fail L22ne_Vormsi_Vormsi_id25012_1888a.json
Märgendatud fail J2rva_Tyri_V22tsa_id19025_1898a.json
Märgendatud fail J2rva_Tyri_V22tsa_id16384_1885a.json
Märgendatud fail Harju_Kose_Palvere_id21108_1885a.json
Märgendatud fail Tartu_R6ngu_Aakre_id4809_1889a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id13022_1876a.json
Märgendatud fail Tartu_R6ngu_Aakre_id8898_1827a.json
Märgendatud fail Tartu_V6nnu_Ahja_id22170_1868a.json
Märgendatud fail Tartu_Otep22_Pyhaj2rve_id22089_1886a.json
Märgendatud fail J2rva_Anna_Purdi_id25497_1870a.json
Märgendatud fail Tartu_V6nnu_Ahja_id17890_1885a.json
Märgendatud fail Viljandi_P6ltsamaa_Pajusi_id6831_1871a.json
Märgendatud fail L22ne_Pyhalepa_K2rdla_id23188_1872a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id1584_1878a.json
Märgendatud fail Viljandi_P6ltsamaa_Uue-P6ltsamaa_id6410_1853a.json
Märgendatud fail L22ne_Martna_Martna_id17524_1871a.json
Märgendatud fail V6ru_Vastseliina_Mis

***** Epoch #7 *****
Loss: 8661.582673
Feature L2-norm: 72.280136
Learning rate (eta): 0.049965
Total number of feature updates: 109298
Seconds required for this iteration: 0.220

***** Epoch #8 *****
Loss: 8203.800364
Feature L2-norm: 75.855171
Learning rate (eta): 0.049960
Total number of feature updates: 124912
Seconds required for this iteration: 0.224

***** Epoch #9 *****
Loss: 7419.842108
Feature L2-norm: 79.206310
Learning rate (eta): 0.049955
Total number of feature updates: 140526
Seconds required for this iteration: 0.229

***** Epoch #10 *****
Loss: 7051.931646
Feature L2-norm: 82.388774
Learning rate (eta): 0.049950
Total number of feature updates: 156140
Seconds required for this iteration: 0.252

***** Epoch #11 *****
Loss: 6690.081193
Improvement ratio: 2.670992
Feature L2-norm: 85.355033
Learning rate (eta): 0.049945
Total number of feature updates: 171754
Seconds required for this iteration: 0.225

***** Epoch #12 *****
Loss: 6615.452972
Improvement ratio: 1.255103
Fe

***** Epoch #49 *****
Loss: 3326.276678
Improvement ratio: 0.105418
Feature L2-norm: 147.103546
Learning rate (eta): 0.049756
Total number of feature updates: 765086
Seconds required for this iteration: 0.229

***** Epoch #50 *****
Loss: 3327.408018
Improvement ratio: 0.092899
Feature L2-norm: 148.134517
Learning rate (eta): 0.049751
Total number of feature updates: 780700
Seconds required for this iteration: 0.242

***** Epoch #51 *****
Loss: 3352.502272
Improvement ratio: 0.067132
Feature L2-norm: 149.104074
Learning rate (eta): 0.049746
Total number of feature updates: 796314
Seconds required for this iteration: 0.224

***** Epoch #52 *****
Loss: 3238.755453
Improvement ratio: 0.150887
Feature L2-norm: 150.067780
Learning rate (eta): 0.049741
Total number of feature updates: 811928
Seconds required for this iteration: 0.227

***** Epoch #53 *****
Loss: 3195.084504
Improvement ratio: 0.108975
Feature L2-norm: 151.027360
Learning rate (eta): 0.049736
Total number of feature updates: 8

Märgendatud fail J2rva_Tyri_Kirna_id24064_1879a.json
Märgendatud fail Tartu_V6nnu_Ahja_id19682_1888a.json
Märgendatud fail Viljandi_Paistu_Holstre_id10573_1900a.json
Märgendatud fail Tartu_Kodavere_Ranna_id355_1883a.json
Märgendatud fail Harju_Hageri_Kohila_id4930_1887a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id23960_1881a.json
Märgendatud fail L22ne_Hanila_Massu_id361_1891a.json
Märgendatud fail Tartu_V6nnu_Kiidj2rve_id24846_1867a.json
Märgendatud fail Saare_P8ide_Laimjala_id8967_1915a.json
Märgendatud fail V6ru_Vastseliina_Misso_id20237_1882a.json
Märgendatud fail Harju_Hageri_Kohila_id11175_1875a.json
Märgendatud fail Harju_Hageri_Kohila_id23811_1873a.json
Märgendatud fail Tartu_V6nnu_Ahja_id19411_1887a.json
Märgendatud fail Tartu_Kodavere_Pala_id22605_1871a.json
Märgendatud fail Harju_Hageri_Kohila_id22513_1867a.json
Märgendatud fail Harju_Hageri_Kohila_id11216_1875a.json
Märgendatud fail Viljandi_K6pu_Suure-K6pu_id12875_1884a.json
Märgendatud fail Harju_Harju-Madise_Padise-

Märgendatud fail J2rva_Tyri_S2revere_id12373_1877a.json
Märgendatud fail Viljandi_Pilistvere_K6o_id24950_1843a.json
Märgendatud fail J2rva_Tyri_Kirna_id24928_1881a.json
Märgendatud fail P2rnu_Audru_V6lla_id5153_1877a.json
Märgendatud fail J2rva_Ambla_Uudekyla_id13881_1867a.json
Märgendatud fail Tartu_Kodavere_Alatskivi_id12243_1856a.json
Märgendatud fail J2rva_Tyri_S2revere_id13997_1886a.json
Märgendatud fail Tartu_V6nnu_Ahja_id21303_1889a.json
Märgendatud fail J2rva_Tyri_Kirna_id22874_1869a.json
Märgendatud fail V6ru_Vastseliina_Misso_id23231_1886a.json
Märgendatud fail Viljandi_Pilistvere_Arussaare_id23597_1845a.json
Märgendatud fail J2rva_Tyri_V22tsa_id16836_1886a.json
Märgendatud fail Tartu_V6nnu_Ahja_id14833_1882a.json
Märgendatud fail Harju_Juuru_Juuru_id556_1877a.json
Märgendatud fail Harju_Kose_Triigi_id9684_1869a.json
Märgendatud fail Tartu_R6ngu_Aakre_id6568_1826a.json
Märgendatud fail L22ne_Kullamaa_Kuij6e_id15492_1878a.json
Märgendatud fail Harju_Jyri_Rae_id5366_1890a.json
