In [4]:
import json
import math
import os
import re
import unicodedata
import random
from operator import itemgetter
from pathlib import Path
from pprint import pprint
import pandas as pd
#!pip install --upgrade spacy
import spacy
from spacy.util import compounding, minibatch
from spacy import displacy
# Uncomment if you want Spacy to use GPU for training. Note - this will use transformer architecture
spacy.require_gpu()

True

In [5]:
# import requirements for converting the dataframe to Spacy Docs
from collections import defaultdict
from typing import List
from spacy.language import Language
from spacy.tokens import Doc, DocBin, Span
from spacy.util import filter_spans

# Load models for evaluations

In [7]:
import pandas as pd
from tqdm import tqdm
import unicodedata as ud
import warnings


class LemmaEvaluator:
    def __init__(self, nlp1, nlp2, nlp3=None, norm_method=None):
        self.nlp1 = nlp1
        self.nlp2 = nlp2
        self.nlp3 = nlp3
        self.norm_method = norm_method
        
        # check if normalization method is specified
        if self.norm_method is None:
            warnings.warn("Normalization method not specified. Text may not be normalized correctly.", UserWarning)

    def evaluate_lemmas(self, docs):
        same_lemmas = 0
        diff_lemmas = 0
        correct_lemmas1 = 0
        correct_lemmas2 = 0
        correct_lemmas3 = 0
        total_lemmas = 0

        data = []

        for doc in tqdm(docs, desc="Evaluating models", total=len(docs)):
            for token in doc:
                try:
                    gold_lemma = self.clean_text(token.lemma_)
                    lemma1 = self.nlp1(self.clean_text(doc.text))[token.i].lemma_
                    lemma2 = self.nlp2(self.clean_text(doc.text))[token.i].lemma_
                    if self.nlp3 is not None:
                        lemma3 = self.nlp3(self.clean_text(doc.text))[token.i].lemma_
                    if self.nlp3 is not None and lemma1 == lemma2 == lemma3 ==gold_lemma:
                        result = "All lemmas are the same"
                        same_lemmas += 1
                        correct_lemmas1 += 1
                        correct_lemmas2 += 1
                        correct_lemmas3 += 1
                    elif lemma1 == lemma2 == gold_lemma:
                        result = "All lemmas are the same"
                        same_lemmas += 1
                        correct_lemmas1 += 1
                        correct_lemmas2 += 1
                    else:
                        result = ""
                        diff_lemmas += 1
                        if lemma1 == gold_lemma:
                            correct_lemmas1 += 1
                            result += f", Model 1 correct ({lemma1})"
                        else:
                            result += f", Model 1 incorrect ({lemma1})"
                        if lemma2 == gold_lemma:
                            correct_lemmas2 += 1
                            result += f", Model 2 correct ({lemma2})"
                        else:
                            result += f", Model 2 incorrect ({lemma2})"
                        if self.nlp3 is not None:
                            if lemma3 == gold_lemma:
                                correct_lemmas3 += 1
                                result += f", Model 3 correct ({lemma3})"
                            else:
                                result += f", Model 3 incorrect ({lemma3})"
                    if self.nlp3 is not None:
                        data.append([doc.text, token.text, gold_lemma, lemma1, lemma2, lemma3, result])
                    else:
                        data.append([doc.text, token.text, gold_lemma, lemma1, lemma2, result])
                    total_lemmas += 1
                except IndexError as e:
                    print(f"Error occurred at token index {token.i} in document: {doc}")
                    print(f"Error message: {e}")

        if self.nlp3 is not None:
            df_evaluate = pd.DataFrame(data, columns=["Text", "Token", "Gold Lemma", "Model 1 Lemma", "Model 2 Lemma", "Model 3 Lemma", "Result"])
            print(df_evaluate)
            print(f"Total Lemmas: {total_lemmas}")
            print(f"Total same lemmas: {same_lemmas}")
            print(f"Total different lemmas: {diff_lemmas}")
            print(f"Total correct lemmas for Model 1: {correct_lemmas1}")
            print(f"Total correct lemmas for Model 2: {correct_lemmas2}")
            print(f"Total correct lemmas for Model 3: {correct_lemmas3}")
        else:
            df_evaluate = pd.DataFrame(data, columns=["Text", "Token", "Gold Lemma", "Model 1 Lemma", "Model 2 Lemma", "Result"])
            print(df_evaluate)
            print(f"Total Lemmas: {total_lemmas}")
            print(f"Total same lemmas: {same_lemmas}")
            print(f"Total different lemmas: {diff_lemmas}")
            print(f"Total correct lemmas for Model 1: {correct_lemmas1}")
            print(f"Total correct lemmas for Model 2: {correct_lemmas2}")
            
        # calculate and print accuracy
        if self.nlp3 is not None:
            print(f"Model 1 accuracy: {correct_lemmas1/total_lemmas:.2%}")
            print(f"Model 2 accuracy: {correct_lemmas2/total_lemmas:.2%}")
            print(f"Model 3 accuracy: {correct_lemmas3/total_lemmas:.2%}")
        else:
            print(f"Model 1 accuracy: {correct_lemmas1/total_lemmas:.2%}")
            print(f"Model 2 accuracy: {correct_lemmas2/total_lemmas:.2%}")
            
        return df_evaluate
    
    
    def evaluate_line(self, line, model_name="Model"):
        doc = self.nlp1(line)
        gold_lemmas = [token.lemma_ for token in doc]
        lemma1 = [token.lemma_ for token in self.nlp1(line)]
        lemma2 = [token.lemma_ for token in self.nlp2(line)]
        if self.nlp3 is not None:
            lemma3 = [token.lemma_ for token in self.nlp3(line)]
        else:
            lemma3 = None
        # add NER labels to dataframe
        NER1 = [token.ent_type_ for token in self.nlp1(line)]
        NER2 = [token.ent_type_ for token in self.nlp2(line)]
        if self.nlp3 is not None:
            NER3 = [token.ent_type_ for token in self.nlp3(line)]
        else:
            NER3 = None    
        data = {"Gold Lemma": gold_lemmas, f"{model_name} 1 Lemma": lemma1, f"{model_name} 2 Lemma": lemma2, f"{model_name} 3 Lemma": lemma3, f"{model_name} 1 NER": NER1, f"{model_name} 2 NER": NER2, f"{model_name} 3 NER": NER3}
        if self.nlp3 is None:
            del data[f"{model_name} 3 Lemma"]

        df_evaluate_line = pd.DataFrame(data)
        print(df_evaluate_line)
        return df_evaluate_line
        #print(data)
        #return data
    
    def evaluate_ner(self, docs):
        same_ner = 0
        diff_ner = 0
        correct_ner1 = 0
        correct_ner2 = 0
        correct_ner3 = 0

        data = []

        for doc in tqdm(docs, desc="Evaluating models", total=len(docs)):
            for ent in doc.ents:
                gold_label = self.clean_text(ent.label_)
                label1 = None
                label2 = None
                label3 = None
                result=""
                for token in doc:
                    if token.idx == ent.start_char:
                        label1 = self.nlp1(self.clean_text(token.text))[0].ent_type_
                        label2 = self.nlp2(self.clean_text(token.text))[0].ent_type_
                        if self.nlp3 is not None:
                            label3 = self.nlp3(self.clean_text(token.text))[0].ent_type_
                            #print label3 character count
                            if len(label3) > 0:
                                print(token.text, " | ", self.nlp3(self.clean_text(token.text))[0])
                        break

                if label3 is None and label1 == label2 == gold_label:
                    result = "All NER labels are the same"
                    same_ner += 1
                    correct_ner1 += 1
                    correct_ner2 += 1
                elif label1 == label2 == label3 == gold_label:
                    result = "All NER labels are the same"
                    same_ner += 1
                    correct_ner1 += 1
                    correct_ner2 += 1
                    correct_ner3 += 1
                else:
                    result = "NER labels are different"
                diff_ner += 1
                if label1 == gold_label:
                    correct_ner1 += 1
                    result += f", Model 1 correct ({label1})"
                else:
                    result += f", Model 1 incorrect ({label1})"
                if label2 == gold_label:
                    correct_ner2 += 1
                    result += f", Model 2 correct ({label2})"
                else:
                    result += f", Model 2 incorrect ({label2})"
                if self.nlp3 is not None and label3 == gold_label:
                        correct_ner3 += 1
                        result += f", Model 3 correct ({label3})"
                else:
                    result += f", Model 3 incorrect ({label3})"
                if self.nlp3 is not None:
                    data.append([doc.text, ent.text, gold_label, label1, label2, label3, result])
                else:
                    data.append([doc.text, ent.text, gold_label, label1, label2, result])
        if self.nlp3 is not None:
            df_evaluate_ner = pd.DataFrame(data, columns=["Text", "Entity", "Gold Label", "Model 1 Label", "Model 2 Label", "Model 3 Label", "Result"])
        else:
            df_evaluate_ner = pd.DataFrame(data, columns=["Text", "Entity", "Gold Label", "Model 1 Label", "Model 2 Label", "Result"])
        print(df_evaluate_ner)

        total = same_ner + diff_ner
        print(f"Total same NER labels: {same_ner} ({same_ner/total:.2%})")
        print(f"Total different NER labels: {diff_ner} ({diff_ner/total:.2%})")
        print(f"Model 1 accuracy: {correct_ner1/total:.2%}")
        print(f"Model 2 accuracy: {correct_ner2/total:.2%}")
        if self.nlp3 is not None:
            print(f"Model 3 accuracy: {correct_ner3/total:.2%}")

        return df_evaluate_ner
    
    def clean_text(self, text):
        # Check if the normalization method is valid
        if self.norm_method is not None and self.norm_method not in ['NFD', 'NFC', 'NFKD', 'NFKC']:
            raise ValueError("Normalization method is not valid. Must be one of ['NFD', 'NFC', 'NFKD', 'NFKC'].")
        elif self.norm_method is not None:
            cleaned = re.sub(r"[\(\[].*?[\)\]]", "", text)
            cleaned = ud.normalize(self.norm_method, cleaned)
        else:
            cleaned = text
        return cleaned

## Evaluate Line

In [4]:
line="Ἐξήρτηται δ' ἐκ τῆς μεγάλης φλεβὸς καὶ τῆς ἀορτῆς, καὶ δι' αὐτοῦ φλέβες πολλαὶ καὶ πυκναί, κατατείνουσαι πρὸς τὴν τῶν ἐντέρων θέσιν, ἄνωθεν ἀρξάμεναι μέχρι κάτω"
#line = "Τείνει δὲ πρῶτον μὲν ἄνω ἀπὸ τῆς καρδίας τῆς μεγάλης φλεβὸς μόριον πρὸς τὸν πλεύμονα καὶ τὴν σύναψιν τῆς ἀορτῆς, ἄσχιστος καὶ μεγάλη οὖσα φλέψ"
#line = "'ᾗ δὲ συνήρτηται κοῖλόν ἐστιν."
line = " Ἔχει δὲ διαφορὰς πολλάς, καθάπερ ἡ κοιλία, καὶ τοῦτο τὸ μόριον"

import spacy
from spacy.tokens import Doc, DocBin, Span
spacy.prefer_gpu()

#Lemma Evaluations:
nlp1 = spacy.load("grc_proiel_trf")
nlp2 = spacy.load("grc_odycy_joint_trf")
nlp3 = spacy.load('../training/grc_ud_proiel_trf_Lem_NER/model-best') #this is an old model from march 23

evaluator = LemmaEvaluator(nlp1, nlp2, nlp3)

evaluate_quote = evaluator.evaluate_line(line)




   Gold Lemma Model 1 Lemma Model 2 Lemma     Model 3 Lemma Model 1 NER  \
0                                                                         
1    Ἔχομαι      Ἔχομαι         Ἔχω             Ἔχω               
2         δὲ           δὲ           δὲ               δὲ               
3   διαφορὰς     διαφορὰς     διαφορὰς         διαφορὰς               
4     πολλάς       πολλάς       πολλάς           πολλάς               
5           ,             ,             ,                 ,               
6    καθάπερ      καθάπερ      καθάπερ          καθάπερ               
7          ἡ            ἡ            ἡ                ὁ               
8     κοιλία       κοιλία       κοιλία           κοιλία               
9           ,             ,             ,                 ,               
10       καὶ          καὶ          καὶ               καί               
11     τοῦτο        τοῦτο        τοῦτο            τοῦτο               
12        τὸ           τ

In [None]:
line="Ἐξήρτηται δ' ἐκ τῆς μεγάλης φλεβὸς καὶ τῆς ἀορτῆς, καὶ δι' αὐτοῦ φλέβες πολλαὶ καὶ πυκναί, κατατείνουσαι πρὸς τὴν τῶν ἐντέρων θέσιν, ἄνωθεν ἀρξάμεναι μέχρι κάτω"
#line = " Ἔχει δὲ διαφορὰς πολλάς, καθάπερ ἡ κοιλία, καὶ τοῦτο τὸ μόριον"

nlp1 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm/model-best')
linenlp = nlp1(line)
for token in linenlp:
    print(token.text, token.ent_iob_, token.ent_type_, "| ", token.lemma_)
#for ent in linenlp.ents:
#    print(ent.text, ent.start_char, ent.end_char, ent.label_)

In [None]:
line = " Ἐξήρτηται δ' ἐκ τῆς μεγάλης φλεβὸς καὶ τῆς ἀορτῆς, καὶ δι' αὐτοῦ φλέβες πολλαὶ καὶ πυκναί, κατατείνουσαι πρὸς τὴν τῶν ἐντέρων θέσιν, ἄνωθεν ἀρξάμεναι μέχρι κάτω"
line = "Ἐξήρτηται δ' ἐκ τῆς μεγάλης φλεβὸςκαὶ τῆς ἀορτῆς, καὶ δι' αὐτοῦ φλέβες πολλαὶ καὶ πυκναί, κατατείνουσαι πρὸς τὴν τῶν ἐντέρων θέσιν, ἄνωθεν ἀρξάμεναι μέχρι κάτω"
# get gold entities for docs[1]
# if doc.text == line:
for doc in docs:
    if doc.text == line:
        print(doc.text)
        for ent in doc.ents:
            print(ent.text, ent.start_char, ent.end_char, ent.label_)
        break

## Evaluate Lemmas

In [15]:
import spacy
from spacy.tokens import Doc, DocBin, Span
spacy.prefer_gpu()

#Lemma Evaluations:
#nlp1 = spacy.load("../training/ATLOMY_G_NER_pipeline/sm/model-best")
#nlp2 = spacy.load("../training/ATLOMY_G_NER_pipeline/sm_3_sep/model-best") # this is a model from Sep 3
#nlp3 = spacy.load('../training/grc_ud_proiel_trf_Lem_NER/model-best') #this is an old model from march 23
#nlp1 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm_10_dec/model-best') # this is a model from Sep 15

nlp1 = spacy.load('../training/SageMaker/NER/ner_22_dec_trf/model-best')
nlp2 = spacy.load('../training/SageMaker/NER/ner_22_dec_vec/model-best')
nlp3 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm_3_sep/model-best')

evaluator = LemmaEvaluator(nlp1, nlp2, nlp3, norm_method='NFKD')

test_docs = DocBin().from_disk('../corpus/test/lemma_test/test_lemma_NFKD.spacy')
docs = list(test_docs.get_docs(nlp1.vocab))#[:10]

df_evaluate_lemmas = evaluator.evaluate_lemmas(docs)


If you see errors or degraded performance, download a newer compatible model or retrain your custom model with the current 'transformers' and 'spacy-transformers' versions. For more details and available updates, run: python -m spacy validate
Evaluating models:   3%|▎         | 3/92 [00:06<03:13,  2.18s/it]

Error occurred at token index 56 in document: ἐντεῦθεν δὲ αἱ μὲν ἐς τράχηλον αἱ δὲ ἐπʼ ὠμοπλάτας αἱ δὲ ἀποκαμφθεῖσαι κάτω παρὰ σπονδύλους καὶ πλευρὰς ἀποκλίνουσιν ἐξ ἀριστερῶν μὲν μία | ἐγγὺς κληΐδων, ἐκ δεξιῶν δὲ [ἐπί τι αὐτὴ χωρίον] ἄλλη [ἡ δὲ] σμικρὸν κατωτέρω ἀποκαμφθεῖσα ὅθεν μὲν ἐκείνη ἀπέλιπε προσέδωκε τῇσι πλευρῇσιν ἔστʼ ἂν τῇ ἐπʼ αὐτῆς τῆς καρδίης προστύχῃ ἀποκαμπτομένῃ ἐς τὰ ἀριστερά·
Error message: [E040] Attempt to access token at 56, max length 56.
Error occurred at token index 57 in document: ἐντεῦθεν δὲ αἱ μὲν ἐς τράχηλον αἱ δὲ ἐπʼ ὠμοπλάτας αἱ δὲ ἀποκαμφθεῖσαι κάτω παρὰ σπονδύλους καὶ πλευρὰς ἀποκλίνουσιν ἐξ ἀριστερῶν μὲν μία | ἐγγὺς κληΐδων, ἐκ δεξιῶν δὲ [ἐπί τι αὐτὴ χωρίον] ἄλλη [ἡ δὲ] σμικρὸν κατωτέρω ἀποκαμφθεῖσα ὅθεν μὲν ἐκείνη ἀπέλιπε προσέδωκε τῇσι πλευρῇσιν ἔστʼ ἂν τῇ ἐπʼ αὐτῆς τῆς καρδίης προστύχῃ ἀποκαμπτομέ

Evaluating models:   4%|▍         | 4/92 [00:14<06:18,  4.30s/it]

Error occurred at token index 61 in document: ἐντεῦθεν δὲ αἱ μὲν ἐς τράχηλον αἱ δὲ ἐπʼ ὠμοπλάτας αἱ δὲ ἀποκαμφθεῖσαι κάτω παρὰ σπονδύλους καὶ πλευρὰς ἀποκλίνουσιν ἐξ ἀριστερῶν μὲν μία | ἐγγὺς κληΐδων, ἐκ δεξιῶν δὲ [ἐπί τι αὐτὴ χωρίον] ἄλλη [ἡ δὲ] σμικρὸν κατωτέρω ἀποκαμφθεῖσα ὅθεν μὲν ἐκείνη ἀπέλιπε προσέδωκε τῇσι πλευρῇσιν ἔστʼ ἂν τῇ ἐπʼ αὐτῆς τῆς καρδίης προστύχῃ ἀποκαμπτομένῃ ἐς τὰ ἀριστερά·
Error message: [E026] Error accessing token at position 61: out of bounds in Doc of length 56.
Error occurred at token index 62 in document: ἐντεῦθεν δὲ αἱ μὲν ἐς τράχηλον αἱ δὲ ἐπʼ ὠμοπλάτας αἱ δὲ ἀποκαμφθεῖσαι κάτω παρὰ σπονδύλους καὶ πλευρὰς ἀποκλίνουσιν ἐξ ἀριστερῶν μὲν μία | ἐγγὺς κληΐδων, ἐκ δεξιῶν δὲ [ἐπί τι αὐτὴ χωρίον] ἄλλη [ἡ δὲ] σμικρὸν κατωτέρω ἀποκαμφθεῖσα ὅθεν μὲν ἐκείνη ἀπέλιπε προσέδωκε τῇσι πλευρῇσιν ἔστʼ ἂν τῇ ἐπʼ αὐτῆς τῆς καρδί

Evaluating models:  12%|█▏        | 11/92 [00:30<03:04,  2.27s/it]

Error occurred at token index 19 in document: Καλεῖται δὲ τούτων τὰ μὲν ὑστέρα καὶ δελφύς (ὅθεν καὶ ἀδελφοὺς προσαγορεύουσι), μήτρα δʼ ὁ καυλὸς καὶ τὸ στόμα τῆς ὑστέρας.
Error message: [E040] Attempt to access token at 19, max length 19.
Error occurred at token index 20 in document: Καλεῖται δὲ τούτων τὰ μὲν ὑστέρα καὶ δελφύς (ὅθεν καὶ ἀδελφοὺς προσαγορεύουσι), μήτρα δʼ ὁ καυλὸς καὶ τὸ στόμα τῆς ὑστέρας.
Error message: [E040] Attempt to access token at 20, max length 19.
Error occurred at token index 21 in document: Καλεῖται δὲ τούτων τὰ μὲν ὑστέρα καὶ δελφύς (ὅθεν καὶ ἀδελφοὺς προσαγορεύουσι), μήτρα δʼ ὁ καυλὸς καὶ τὸ στόμα τῆς ὑστέρας.
Error message: [E040] Attempt to access token at 21, max length 19.
Error occurred at token index 22 in document: Καλεῖται δὲ τούτων τὰ μὲν ὑστέρα καὶ δελφύς (ὅθεν καὶ ἀδελφοὺς προσαγορεύουσι), μήτρα δʼ ὁ καυλὸς καὶ τὸ στόμα τῆς ὑστέρας.
Error message: [E040

Evaluating models: 100%|██████████| 92/92 [03:23<00:00,  2.21s/it]

                                                   Text     Token Gold Lemma  \
0     Τὰ μὲν οὖν ἄνωθεν τῆς καρδίας τοῦτον ...       Τὰ         ὁ   
1     Τὰ μὲν οὖν ἄνωθεν τῆς καρδίας τοῦτον ...      μὲν       μέν   
2     Τὰ μὲν οὖν ἄνωθεν τῆς καρδίας τοῦτον ...     οὖν      οὖν   
3     Τὰ μὲν οὖν ἄνωθεν τῆς καρδίας τοῦτον ...  ἄνωθεν   ἄνωθεν   
4     Τὰ μὲν οὖν ἄνωθεν τῆς καρδίας τοῦτον ...      τῆς         ὁ   
...                                                 ...       ...        ...   
1821  Ἐν πᾶσι δʼ ἔχει ὁμοίως τοῖς ἄλλοις κα...     τοῖς         ὁ   
1822  Ἐν πᾶσι δʼ ἔχει ὁμοίως τοῖς ἄλλοις κα...  ἄλλοις    ἄλλος   
1823  Ἐν πᾶσι δʼ ἔχει ὁμοίως τοῖς ἄλλοις κα...      καὶ       καί   
1824  Ἐν πᾶσι δʼ ἔχει ὁμοίως τοῖς ἄλλοις κα...    τοῦτο    οὗτος   
1825  Ἐν πᾶσι δʼ ἔχει ὁμοίως τοῖς ἄλλοις κα...         .          .   

     Model 1 Lemma Model 2 Lemma Model 




In [13]:
nlp1 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm_15_sep/model-best') # this is a model from Sep 15
test_docs = DocBin().from_disk('../corpus/dev/ner_dev/ner_dev_NFKC.spacy')
docs = list(test_docs.get_docs(nlp1.vocab))

In [None]:
docs
#ἀποκαμφθεῖσα δὲ κάτω ἐπὶ σπονδύλους καταβαίνει ἔστ ̓ ἂν ἀφίκηται

## Evaluate NER

In [12]:
import spacy
from spacy.tokens import Doc, DocBin, Span
spacy.prefer_gpu()

#NER Evaluations:
#nlp1 = spacy.load("../training/ATLOMY_G_NER_pipeline/sm_10_dec/model-best")
#nlp2 = spacy.load("../training/ATLOMY_G_NER_pipeline/sm_3_sep/model-best")
#nlp3 = spacy.load('../training/ATLOMY_G_NER_pipeline/A_GreekBert_sm/model-best')
#nlp3 = spacy.load('../training/grc_ud_proiel_trf_Lem_NER/model-best')
#nlp3 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm_NFKD_only/model-best')
#nlp3 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm_15_sep/model-best')

nlp1 = spacy.load('../training/SageMaker/NER/ner_22_dec_trf/model-best')
nlp2 = spacy.load('../training/SageMaker/NER/ner_22_dec_vec/model-best')
nlp3 = spacy.load('../training/ATLOMY_G_NER_pipeline/sm_15_sep/model-best')


evaluator = LemmaEvaluator(nlp1, nlp2, nlp3, norm_method='NFKC')

test_docs = DocBin().from_disk('../corpus/test/ner_test/ner_test_NFKC.spacy')
docs = list(test_docs.get_docs(nlp1.vocab))

df_evaluate_ner = evaluator.evaluate_ner(docs)


If you see errors or degraded performance, download a newer compatible model or retrain your custom model with the current 'transformers' and 'spacy-transformers' versions. For more details and available updates, run: python -m spacy validate
Evaluating models:   0%|          | 0/44 [00:00<?, ?it/s]

κάτω  |  κάτω


Evaluating models:   2%|▏         | 1/44 [00:00<00:13,  3.13it/s]

ὑείᾳ  |  ὑείᾳ
Αἱ  |  Αἱ
ἀρχαὶ  |  ἀρχαὶ
φλεβῶν  |  φλεβῶν
,  |  ,


Evaluating models:   5%|▍         | 2/44 [00:01<00:40,  1.03it/s]

,  |  ,
σφαγίτιδες  |  σφαγίτιδες


Evaluating models:   7%|▋         | 3/44 [00:02<00:26,  1.53it/s]

κεφαλὴ  |  κεφαλὴ
ἐγκέφαλος  |  ἐγκέφαλος


Evaluating models:   9%|▉         | 4/44 [00:02<00:19,  2.01it/s]

διμερὴς  |  διμερὴς
πλεύμων  |  πλεύμων
φλὲψ  |  φλὲψ
διὰ  |  διὰ
καρδίας  |  καρδίας
,  |  ,
ἀορτὴν  |  ἀορτὴν
ἀπὸ  |  ἀπὸ


Evaluating models:  11%|█▏        | 5/44 [00:03<00:26,  1.49it/s]

καρδίας  |  καρδίας
τὸ  |  τὸ
διφυὲς  |  διφυὲς
στόματος  |  στόματος
παρίσθμιον  |  παρίσθμιον
,  |  ,


Evaluating models:  14%|█▎        | 6/44 [00:04<00:29,  1.28it/s]

δὲ  |  δὲ


Evaluating models:  16%|█▌        | 7/44 [00:04<00:22,  1.65it/s]

καρδία  |  καρδία
κοιλίαις  |  κοιλίαις
φλέβες  |  φλέβες
πόθεν  |  πόθεν


Evaluating models:  18%|█▊        | 8/44 [00:05<00:22,  1.57it/s]

ἤρτηνται  |  ἤρτηνται
ἀρχάς  |  ἀρχάς


Evaluating models:  20%|██        | 9/44 [00:05<00:19,  1.83it/s]

μεγάλῃ  |  μεγάλῃ
ἀορτῇ  |  ἀορτῇ
Τείνουσι  |  Τείνουσι
ἀπὸ  |  ἀπὸ
ἀορτῆς  |  ἀορτῆς
φλεβὸς  |  φλεβὸς
ἀπὸ  |  ἀπὸ
σχιζομένων  |  σχιζομένων
,  |  ,
ἐπὶ  |  ἐπὶ
βουβῶνας  |  βουβῶνας
μεγάλαι  |  μεγάλαι
κοῖλαι  |  κοῖλαι
διὰ  |  διὰ
σκελῶν  |  σκελῶν
τελευτῶσιν  |  τελευτῶσιν


Evaluating models:  23%|██▎       | 10/44 [00:07<00:34,  1.01s/it]

εἰς  |  εἰς
ἐπίπλοον  |  ἐπίπλοον
ἀπὸ  |  ἀπὸ
μέσης  |  μέσης
κοιλίας  |  κοιλίας
φύσιν  |  φύσιν
ὑμὴν  |  ὑμὴν
πιμελώδης  |  πιμελώδης
μονοκοιλίοις  |  μονοκοιλίοις


Evaluating models:  25%|██▌       | 11/44 [00:08<00:35,  1.07s/it]

ἀμφώδουσιν  |  ἀμφώδουσιν
διάστασις  |  διάστασις
φανερά  |  φανερά


Evaluating models:  30%|██▉       | 13/44 [00:09<00:20,  1.51it/s]

,  |  ,
πνεύμονα  |  πνεύμονα


Evaluating models:  32%|███▏      | 14/44 [00:09<00:16,  1.86it/s]

κεφαλὴν  |  κεφαλὴν
ἐγκέφαλον  |  ἐγκέφαλον
εἰς  |  εἰς
εἰς  |  εἰς


Evaluating models:  34%|███▍      | 15/44 [00:10<00:15,  1.90it/s]

νεφρῶν  |  νεφρῶν
πόδας  |  πόδας


Evaluating models:  36%|███▋      | 16/44 [00:10<00:12,  2.25it/s]

δακτύλους  |  δακτύλους
μέσον  |  μέσον
διείργει  |  διείργει
μῆνιγξ  |  μῆνιγξ


Evaluating models:  39%|███▊      | 17/44 [00:10<00:12,  2.21it/s]

λεπτή  |  λεπτή
πόροι  |  πόροι
συγκεχυμένοι  |  συγκεχυμένοι
ὀλίγας  |  ὀλίγας


Evaluating models:  41%|████      | 18/44 [00:11<00:12,  2.02it/s]

ἶνας  |  ἶνας
φλεβῶν  |  φλεβῶν
ὑπεράνω  |  ὑπεράνω
ἀπὸ  |  ἀπὸ
ἐκ  |  ἐκ
καρδίας  |  καρδίας
ὅλη  |  ὅλη
σχίζεται  |  σχίζεται
εἰς  |  εἰς
δύο  |  δύο


Evaluating models:  43%|████▎     | 19/44 [00:12<00:17,  1.40it/s]

τόπους  |  τόπους
δικραίῳ  |  δικραίῳ


Evaluating models:  45%|████▌     | 20/44 [00:12<00:13,  1.75it/s]

κνήμη  |  κνήμη
ἄνωθεν  |  ἄνωθεν
μύλη  |  μύλη
ἄρθρον  |  ἄρθρον
σαρκός  |  σαρκός
κνήμην  |  κνήμην
κάτωθεν  |  κάτωθεν
ποδὸς  |  ποδὸς
σφυρὰ  |  σφυρὰ
τελευτώσιν  |  τελευτώσιν
ἄνωθεν  |  ἄνωθεν
γούνατος  |  γούνατος
εξήκουσι  |  εξήκουσι


Evaluating models:  50%|█████     | 22/44 [00:15<00:16,  1.36it/s]

ἄρθρον  |  ἄρθρον
φλεβῶν  |  φλεβῶν
εἰς  |  εἰς
πόροι  |  πόροι
ἔκ  |  ἔκ
φλεβὸς  |  φλεβὸς
ἀορτῆς  |  ἀορτῆς


Evaluating models:  52%|█████▏    | 23/44 [00:16<00:17,  1.18it/s]

εἰς  |  εἰς
κοῖλον  |  κοῖλον
πόροι  |  πόροι
τείνοντες  |  τείνοντες
εἰς  |  εἰς
εἰς  |  εἰς


Evaluating models:  55%|█████▍    | 24/44 [00:16<00:16,  1.24it/s]

νεφρῶν  |  νεφρῶν
ἀποτομαὶ  |  ἀποτομαὶ
φλεβίων  |  φλεβίων
εἰς  |  εἰς


Evaluating models:  57%|█████▋    | 25/44 [00:17<00:14,  1.29it/s]

κύστιν  |  κύστιν
καθήκουσιν  |  καθήκουσιν
ἄνω  |  ἄνω
κεφαλῇ  |  κεφαλῇ
κάτω  |  κάτω


Evaluating models:  59%|█████▉    | 26/44 [00:18<00:13,  1.36it/s]

ἕδρῃ.  |  ἕδρῃ
περόναι  |  περόναι
ἁπαλαὶ  |  ἁπαλαὶ
ἐξήκουσιν  |  ἐξήκουσιν
ἄνω  |  ἄνω
κάτω  |  κάτω
ὀστέῳ  |  ὀστέῳ
χεῖρα  |  χεῖρα


Evaluating models:  61%|██████▏   | 27/44 [00:19<00:14,  1.18it/s]

χείρες  |  χείρες
άρθρα  |  άρθρα
σύριγγα  |  σύριγγα


Evaluating models:  64%|██████▎   | 28/44 [00:19<00:11,  1.38it/s]

ἀπάντικρυ  |  ἀπάντικρυ
μία  |  μία
στόμα  |  στόμα
ἕν  |  ἕν
σαρκώδης  |  σαρκώδης


Evaluating models:  66%|██████▌   | 29/44 [00:20<00:12,  1.20it/s]

χονδρώδης  |  χονδρώδης
κεφαλὴν  |  κεφαλὴν
νεύρα  |  νεύρα
ἴνες  |  ἴνες
νεύροισι  |  νεύροισι
ὀστέου  |  ὀστέου
σαρκός  |  σαρκός
λεπτότεροι  |  λεπτότεροι
στερεώτεροι  |  στερεώτεροι


Evaluating models:  68%|██████▊   | 30/44 [00:22<00:13,  1.02it/s]

νευροκοίλιοι  |  νευροκοίλιοι
ὅμοιαι  |  ὅμοιαι


Evaluating models:  70%|███████   | 31/44 [00:22<00:09,  1.33it/s]

ὑπένερθε  |  ὑπένερθε
ἰθυωρίην  |  ἰθυωρίην
μαζῷ  |  μαζῷ
ἀριστερῷ  |  ἀριστερῷ
ὅπῃ  |  ὅπῃ


Evaluating models:  73%|███████▎  | 32/44 [00:23<00:10,  1.13it/s]

ἅλμα  |  ἅλμα


Evaluating models:  77%|███████▋  | 34/44 [00:23<00:05,  1.80it/s]

φλεβὼν  |  φλεβὼν
νεύρων  |  νεύρων


Evaluating models:  80%|███████▉  | 35/44 [00:24<00:04,  2.23it/s]

καρδίης  |  καρδίης
πνεύμων  |  πνεύμων
συνεξαναπληροῖ  |  συνεξαναπληροῖ
ἀριστερὰ  |  ἀριστερὰ
πέντε  |  πέντε
ὑπερκορυφώσιας  |  ὑπερκορυφώσιας
λοβοὺς  |  λοβοὺς
τεφρίνης  |  τεφρίνης
χροιῆς  |  χροιῆς
στίγμασιν  |  στίγμασιν


Evaluating models:  84%|████████▍ | 37/44 [00:25<00:04,  1.59it/s]

τενθρηνιώδης  |  τενθρηνιώδης
πλευρῆς  |  πλευρῆς
ἀριστερῆς  |  ἀριστερῆς
σπλὴν  |  σπλὴν


Evaluating models:  86%|████████▋ | 38/44 [00:26<00:04,  1.43it/s]

ποδός  |  ποδός
Κοιλίη  |  Κοιλίη
ἥπατι  |  ἥπατι
παρακειμένη  |  παρακειμένη
εὐώνυμον  |  εὐώνυμον


Evaluating models:  89%|████████▊ | 39/44 [00:27<00:03,  1.36it/s]

νευρώδης  |  νευρώδης
κύστιν  |  κύστιν
ζῳοτόκα  |  ζῳοτόκα


Evaluating models:  91%|█████████ | 40/44 [00:28<00:02,  1.49it/s]

τόνοι  |  τόνοι
ἐγκεφάλου  |  ἐγκεφάλου
ὑπὸ  |  ὑπὸ
ὀστέον  |  ὀστέον
μεγάλου  |  μεγάλου
σπονδύλου  |  σπονδύλου
ἄνωθεν  |  ἄνωθεν


Evaluating models:  93%|█████████▎| 41/44 [00:29<00:02,  1.28it/s]

στομάχου  |  στομάχου
φρένες  |  φρένες
κατὰ  |  κατὰ
κάτωθεν  |  κάτωθεν


Evaluating models:  95%|█████████▌| 42/44 [00:29<00:01,  1.30it/s]

ἀρτηρίης  |  ἀρτηρίης
φλέβες  |  φλέβες
ἐν  |  ἐν
ὤτων  |  ὤτων
φλεβών  |  φλεβών


Evaluating models:  98%|█████████▊| 43/44 [00:30<00:00,  1.24it/s]

ὦτα  |  ὦτα
ὦτα  |  ὦτα
Ἡπατῖτις  |  Ἡπατῖτις
ὀσφύϊ  |  ὀσφύϊ
μεγάλου  |  μεγάλου
σπονδύλου  |  σπονδύλου
κάτωθεν  |  κάτωθεν
σπονδύλοισι  |  σπονδύλοισι
ἐντεῦθεν  |  ἐντεῦθεν
ἥπατος  |  ἥπατος
διὰ  |  διὰ
φρενῶν  |  φρενῶν


Evaluating models: 100%|██████████| 44/44 [00:32<00:00,  1.35it/s]

καρδίην  |  καρδίην
                                                  Text         Entity  \
0            Ἡ δὲ κάτω κοιλία ὁμοία τῇ ὑείᾳ  κάτω κοιλία   
1            Ἡ δὲ κάτω κοιλία ὁμοία τῇ ὑείᾳ        ὁμοία   
2            Ἡ δὲ κάτω κοιλία ὁμοία τῇ ὑείᾳ        ὑείᾳ   
3    Αἱ δ’ ἀρχαὶ τούτων τῶν φλεβῶν, ᾗ σχί...            Αἱ   
4    Αἱ δ’ ἀρχαὶ τούτων τῶν φλεβῶν, ᾗ σχί...             δ’   
..                                                 ...            ...   
268  Ἡπατῖτις ἐν ὀσφύϊ μέχρι τοῦ μεγάλου σ...       ἥπατος   
269  Ἡπατῖτις ἐν ὀσφύϊ μέχρι τοῦ μεγάλου σ...           διὰ   
270  Ἡπατῖτις ἐν ὀσφύϊ μέχρι τοῦ μεγάλου σ...        φρενῶν   
271  Ἡπατῖτις ἐν ὀσφύϊ μέχρι τοῦ μεγάλου σ...            ἐς   
272  Ἡπατῖτις ἐν ὀσφύϊ μέχρι τοῦ μεγάλου σ...       καρδίην   

               Gold Label         Model 1 Label Model 2 Label Model 3 Label  \
0               Body Pa


