In [1]:
import re
import time

from grc_utils import has_ambiguous_dichrona_in_open_syllables
from macronize import macronize, macronize_text


test_words = ['λύω', 'ὕδασιν', 'ἱστάμεθα', 'ὕδωρ']

start_time = time.time()
batch_results = macronize(test_words, ifeellucky=True)
end_time = time.time()
print(f"Batch processing time: {end_time - start_time} seconds")

for w in test_words:
    print(f"{w} -> {batch_results[w]}")



Batch processing time: 1.9914119243621826 seconds
λύω -> λῡ́ω
ὕδασιν -> ῠ̔́δᾰσῐν
ἱστάμεθα -> ῐ̔στᾰ́μεθᾰ
ὕδωρ -> ὕδωρ


In [None]:
def words(text):
    return re.findall(r'\w+', text)

def macronization_ratio_words(text):
    fully_disambiguated = 0
    for word in words(text):
        if has_ambiguous_dichrona_in_open_syllables(word):
            continue
        fully_disambiguated += 1

    print(f'Disambiguated {fully_disambiguated} words out of {len(words(text))}')

    ratio = fully_disambiguated / len(words(text))
    return ratio


sentence = 'Δαρείου καὶ ἱστάμεθα Παρυσάτιδος γίγνονται παῖδες δύο, πρεσβύτερος μὲν Ἀρταξέρξης, νεώτερος δὲ Κῦρος· ἐπεὶ δὲ ἠσθένει Δαρεῖος καὶ ὑπώπτευε τελευτὴν τοῦ βίου, ἐβούλετο τὼ παῖδε ἀμφοτέρω παρεῖναι. ὁ μὲν οὖν πρεσβύτερος παρὼν ἐτύγχανε· Κῦρον δὲ μεταπέμπεται ἀπὸ τῆς ἀρχῆς ἧς αὐτὸν σατράπην ἐποίησε, καὶ στρατηγὸν δὲ αὐτὸν ἀπέδειξε πάντων ὅσοι ἐς Καστωλοῦ πεδίον ἁθροίζονται. ἀναβαίνει οὖν ὁ Κῦρος λαβὼν Τισσαφέρνην ὡς φίλον, καὶ τῶν Ἑλλήνων ἔχων ὁπλίτας ἀνέβη τριακοσίους, ἄρχοντα δὲ αὐτῶν Ξενίαν Παρράσιον.'

macronized_sentence = macronize_text(sentence)
print(f'Macronized text:\n{macronized_sentence}')

print(f'Stil ambiguous words:\n')
for word in words(macronized_sentence):
    if has_ambiguous_dichrona_in_open_syllables(word):
        print(word)    

print(f'\nMacronization ratio: {macronization_ratio_words(macronized_sentence)}')

Elapsed time: 2.14 seconds
Macronized text:
Δαρείου καὶ ῐ̔στᾰ́μεθᾰ Παρυσάτιδος γίγνονται παῖδες δῠ́ο, πρεσβῠ́τερος μὲν Ἀρταξέρξης, νεώτερος δὲ Κῦρος· ἐπεὶ δὲ ἠσθένει Δαρεῖος καὶ ῠ̔πώπτευε τελευτὴν τοῦ βῐ́ου, ἐβούλετο τὼ παῖδε ᾰ̓μφοτέρω πᾰρεῖναι. ὁ μὲν οὖν πρεσβῠ́τερος πᾰρών ἐτύγχᾰνε· Κῦρον δὲ μετᾰπέμπεται ἀπὸ τῆς ἀρχῆς ἧς αὐτὸν σατράπην ἐποίησε, καὶ στρατηγὸν δὲ αὐτὸν ἀπέδειξε πᾰ́ντων ὅσοι ἐς Καστωλοῦ πεδίον ἁθροίζονται. ᾰ̓νᾰβαίνει οὖν ὁ Κῦρος λαβὼν Τισσαφέρνην ὡς φῐ́λον, καὶ τῶν Ἑλλήνων ἔχων ὁπλῑ́τᾱς ᾰ̓νέβη τρῐᾱκοσῐ́ους, ᾰ̓́ρχοντᾰ δὲ αὐτῶν Ξενίαν Παρράσιον.
Stil ambiguous words:

Δαρείου
Παρυσάτιδος
Ἀρταξέρξης
Δαρεῖος
ἀπὸ
σατράπην
στρατηγὸν
ἀπέδειξε
λαβὼν
Τισσαφέρνην
Παρράσιον
Disambiguated 78 words out of 89

Macronization ratio: 0.8764044943820225
