In [None]:
from dexflex.prototype import *

In [None]:
import spacy
from spacy import displacy
nlp = spacy.load("ro_core_news_lg")

# All inflected forms extraction

In the cell below I will present the method that will extract all the inflected words for a certain word from **dexonline DB**.


The method is named **get_all_forms** and takes a spacy.Token object as a parameter and looks up in the JSONS generated from DB trying to find all the forms available.

In [None]:
data_aif = [
    ("A ieșit la iveală adevărata fire a mamei vitrege.", 1),
    ("Rece, crudă, geloasă pe frumusețea și șarmul Cenușăresei,", 2),
    ("Ea era hotărâtă să susțină interesele propriilor sale fiice.", 0),
    ("Castelul a ajuns o ruină.", 0),
]

for sample in data_aif:
    doc = nlp(sample[0])
    all_forms_for_word = get_all_forms(doc[sample[1]])

    print(f"For target-word: {doc[sample[1]]} there are all the inflected forms")
    for form in all_forms_for_word:
        print(form)
    print("\n\n")
    


# Oltenizare feature

In the cell below I will present the first main feature of the **dexflex**.

The method is named **oltenizare** and will change all the verbs found at a past perfect tense to past simple in a context.

This method is added as an extension to the spacy package and can be called using **token._.oltenizare()**

In [None]:
# In this cell there are multiple edge cases

data_olt = [
    "sunt surprinsă că te-ai întors după mine.",
    "dacă tu socoteşti că a fi încătuşat, jefuit este o nedreptate, atunci fugi",
    "nu-şi mai făcea griji că va fi ucis.",
    "succesul tău a fost puţin şi succesul meu.",
    "Eu am plecat",
    "El ar fi venit, dar nu",
    "nu l-am mai văzut pe aici.",
    "cenușăreasa va fi surprinsă.",
    "nu a mai rămas nimic în ce să crezi.",
    "atunci, prin ordin regal, acea fată va fi soția prințului.",
    "El va pleca, dar ieri ar fi stat apoi a plecat.",
    "vor deveni realitate.",
    "Tu ai spus doar adevarul",
    "o voi citi eu!",
    "dar a fost așa de frumos!",
    "vom mai vedea",
    "a fost a mamei",
    "ar fi bine să te descotorosești de aceste vise.",
    "Nu mă îndoiesc că ați avut în minte întreaga scenă.",
    "cred că am uitat de toate!",
    "tot va fi interesat de una din ele, nu-i așa?", 
    "am să stau tot după tine.",
    "nu-ţi fă griji pentru mine, e ziua ta cea mare.",
    "Nu ai plecat atunci."
    
]

for sample in data_olt:
    doc = nlp(sample)
    oltenized_doc = doc._.oltenizare()
    print(f"Original phrase: {doc}    VERSUS    'Oltenized' phrase: {oltenized_doc}")

In [None]:
#In this cell there are happy paths.

data_olt_happy = [
    "Am terminat proiectul la timp.",
    "Ea a învățat să cânte la pian.",
    "Noi am fost la concert aseară.",
    "El a cumpărat un nou telefon.",
    "Am întâlnit un vechi prieten în parc.",
    "Ei au reparat mașina stricată.",
    "Tu ai scris o poezie frumoasă.",
    "Am gătit o cină delicioasă.",
    "Ea a făcut curățenie în casă.",
    "Noi am jucat fotbal în weekend.",
    "Ați fost la cinema ieri?",
    "Am vizitat muzeul de artă.",
    "El a uitat să aducă documentele.",
    "Ea a primit un cadou de ziua ei.",
    "Am văzut un spectacol de teatru.",
    "Tu ai vorbit cu profesorul?",
    "Ei au construit un parc nou.",
    "Am citit un articol interesant.",
    "El a desenat un portret frumos.",
    "Noi am plantat flori în grădină."
]

for sample in data_olt_happy:
    doc = nlp(sample)
    oltenized_doc = doc._.oltenizare()
    print(f"Original phrase: {doc}    VERSUS    'Oltenized' phrase: {oltenized_doc}")

# Synonyms suggestion feature

In the cell below I will present the second main feature of the **dexflex**.

The method will be used for to suggest synonyms using dexonline database. This can be a really good language simplifaction pipeline and the most important thing is that the synonyms suggested are on the right inflection form for context.

This method is added as an extension to the spacy package and can be called using **token._.get_syns()**

In [None]:
# for this I will use the data from oltenizare feature - happy path


data_olt_happy = [
    ("Am observat eroarea la timp.", 2),
    ("Ea a învățat să cânte la pian.", 4),
    ("Am observat eroarea la timp.", 1),
    ("Ei au reparat mașina stricată.", -2),
    ("Tu ai scris o poezie frumoasă.", -2),
    ("Ea s-a gătit pentru o cină delicioasă.", 3),
    ("El a uitat să aducă documentele.", -2),
    ("Ea a primit un cadou de ziua ei.", 4),
    ("Tu ai vorbit cu profesorul?", -2),
    ("Ei au construit un parc nou.", 2),
    ("El a plecat la camera lui.", -3)
]

for sample in data_olt_happy:
    doc = nlp(sample[0])
    
    syn_list = [syn[0] for syn in doc[sample[1]]._.get_syns()]
    print(f"Sinonimele sugerate pentru cuvantul: {doc[sample[1]]} sunt {syn_list}")


In [None]:
doc = nlp( "Eu și el am fi plecat mai repede.")
from dexflex.data_worker import *

print(force_plural_noun(doc[0]))
