<a href="https://colab.research.google.com/github/iued-uni-heidelberg/corpustools/blob/main/S101lemHYstanza.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Armenian lemmatization with Stanza

## downloading evaluation sets
- 420 words: test with about 420 words of Armenian text
- Armenian "Brown-type" corpus b

In [None]:
### optional
!wget https://heibox.uni-heidelberg.de/f/ce6096da570f47b99500/?dl=1

In [None]:
### optional
!mv index.html?dl=1 evaluation-set-v01.txt

In [None]:
!wget https://heibox.uni-heidelberg.de/f/a847a12bffd4491f9070/?dl=1


In [None]:
!mv index.html?dl=1 TED2020-dehy-hy-aa

In [2]:
### downloading Armenian Wikipedia
!wget https://heibox.uni-heidelberg.de/f/d1f866a61bd545318213/?dl=1
!mv index.html?dl=1 hywiki-20221101-pages-articles.txt.gz
!gunzip hywiki-20221101-pages-articles.txt.gz

In [8]:
!wc hywiki-20221101-pages-articles.txt

  2446411  56341167 803098410 hywiki-20221101-pages-articles.txt


## Installing stanza

In [None]:
!pip install spacy-stanza

In [None]:
import stanza
import spacy_stanza


### testing English stanza (optional)

In [None]:
# optional
# Download the stanza model if necessary
stanza.download("en")

# Initialize the pipeline
nlp = spacy_stanza.load_pipeline("en")

doc = nlp("Barack Obama was born in Hawaii. He was elected president in 2008.")
for token in doc:
    print(token.text, token.lemma_, token.pos_, token.dep_, token.ent_type_)
print(doc.ents)

### downloading and testing Armenian stanza

In [10]:
stanza.download("hy")


Downloading https://raw.githubusercontent.com/stanfordnlp/stanza-resources/main/resources_1.4.1.json:   0%|   …

INFO:stanza:Downloading default packages for language: hy (Armenian) ...


Downloading https://huggingface.co/stanfordnlp/stanza-hy/resolve/v1.4.1/models/default.zip:   0%|          | 0…

INFO:stanza:Finished downloading models and saved to /root/stanza_resources.


In [None]:
nlp_hy = spacy_stanza.load_pipeline("hy")

In [None]:
### optional
doc = nlp_hy("ՄԱՐԴՈՒ ԻՐԱՎՈՒՆՔՆԵՐԻ ՀԱՄԸՆԴՀԱՆՈՒՐ ՀՌՉԱԿԱԳԻՐ. ՆԵՐԱԾԱԿԱՆ. Քանզի մարդկային ընտանիքի բոլոր անդամներին ներհատուկ արժանապատվությունըև հավասար ու անօտարելի իրավունքները աշխարհի ազատության, արդարության ու խաղաղության հիմքն են.")

In [None]:
### optional
for token in doc:
    print(token.text, token.lemma_, token.pos_, token.dep_, token.ent_type_)


### full analysis of the file (optional)
- includes dependency parsing

In [None]:
### optional
with open('/content/TED2020-dehy-hy-aa', 'r', encoding='utf-8') as infile, open('/content/TED2020-dehy-hy-aa-ANALYSIS-full-v01.txt', 'w') as outfile:
    # read sample.txt an and write its content into sample2.txt
    outfile.write("{token.text}\t{token.lemma_}\t{token.pos_}\t{token.dep_}\t{parentLem}\t{LAncestors}\n")
    for line in infile:
        line = line.strip()
        doc = nlp_hy(line)
        # outfile.write(line + '\n')
        for token in doc:
            LAncestors = list(token.ancestors)
            print(str(LAncestors))
            try:
                SLAncestors = str(list(token.ancestors))
                parent = LAncestors[0]
                parentLem = parent.lemma_
            except:
                parentLem = "NONE"
            outfile.write(f"{token.text}\t{token.lemma_}\t{token.pos_}\t{token.dep_}\t{parentLem}\t{SLAncestors}\n")
 

### function for lemmatization

In [12]:
def parseFile(iFileName, oFileName, nlp_model = nlp_hy):
    with open(iFileName, 'r', encoding='utf-8') as infile, open(oFileName, 'w') as outfile:
        # read sample.txt an and write its content into sample2.txt
        outfile.write("{token.text}\t{token.pos_}\t{token.lemma_}\n")
        c = 0
        for line in infile:
            c+=1
            if c%10 == 0: print(str(c))
            line = line.strip()
            doc = nlp_model(line)
            # outfile.write(line + '\n')
            for token in doc:
                LAncestors = list(token.ancestors)
                # print(str(LAncestors))
                try:
                    SLAncestors = str(list(token.ancestors))
                    parent = LAncestors[0]
                    parentLem = parent.lemma_
                except:
                    parentLem = "NONE"
                outfile.write(f"{token.text}\t{token.pos_}\t{token.lemma_}\n")
 
    return


### command to lemmatize the file

In [None]:
parseFile('/content/TED2020-dehy-hy-aa', '/content/TED2020-dehy-hy-aa--lemmatization-v01.txt', nlp_hy)

10
20
30
40
50
60
70
80


In [None]:
parseFile('hywiki-20221101-pages-articles.txt', 'hywiki-20221101-pages-articles.vert', nlp_hy)

## Checking OCR errors
### wikipedia lemmatized --> frequency dictionary 

In [1]:
!wget https://heibox.uni-heidelberg.de/f/5b3213f991f84ca496ba/?dl=1
!mv index.html?dl=1 hywiki-20221101-pages-articles-v03.vert

--2022-12-19 08:42:12--  https://heibox.uni-heidelberg.de/f/5b3213f991f84ca496ba/?dl=1
Resolving heibox.uni-heidelberg.de (heibox.uni-heidelberg.de)... 129.206.7.113
Connecting to heibox.uni-heidelberg.de (heibox.uni-heidelberg.de)|129.206.7.113|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://heibox.uni-heidelberg.de/seafhttp/files/eefa9114-fcbb-4dda-82a5-5d8b57c68a85/hywiki-20221101-pages-articles-v03.vert [following]
--2022-12-19 08:42:13--  https://heibox.uni-heidelberg.de/seafhttp/files/eefa9114-fcbb-4dda-82a5-5d8b57c68a85/hywiki-20221101-pages-articles-v03.vert
Reusing existing connection to heibox.uni-heidelberg.de:443.
HTTP request sent, awaiting response... 200 OK
Length: 75483279 (72M) [application/octet-stream]
Saving to: ‘index.html?dl=1’


2022-12-19 08:42:18 (14.5 MB/s) - ‘index.html?dl=1’ saved [75483279/75483279]



In [2]:
!wc hywiki-20221101-pages-articles-v03.vert

 2735467  8206467 75483279 hywiki-20221101-pages-articles-v03.vert


In [None]:
!wget https://heibox.uni-heidelberg.de/f/350790e66ca24efdab1a/?dl=1
!mv index.html?dl=1 hy-texts-vert.tgz 
!tar xvzf hy-texts-vert.tgz

In [None]:
!wget https://heibox.uni-heidelberg.de/f/d601ceb0af5a4671a8e7/?dl=1
!mv index.html?dl=1 Parfum_Arm_ABBY.txt

In [17]:
parseFile('Parfum_Arm_ABBY.txt', 'Parfum_Arm_ABBY.vert.txt', nlp_hy)

10
20
30


  doc = self._ensure_doc(text)
Words: ['Հարցնում', 'են', '՝', 'ինչ', '՞', 'է', 'եդելնրա', 'հետ', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Ինչ', '՞', 'էնա', 'անում', 'դանակով', '։']
Entities: []
  doc = self._ensure_doc(text)


40
50


Words: ['-', 'Սա', 'ինչ', '՞', 'է', '–', 'ասաց', 'Տերյեն', 'և', ',', 'կռանալով', 'զամբյուղի', 'վրա', ',', 'հոտոտեց', 'այն', ',', 'քանի', 'որ', 'ենթադրում', 'էր', 'դրա', 'մեջ', 'ինչ', '-', 'որ', 'ուտելիք', 'հայտնաբերել', '։']
Entities: []
  doc = self._ensure_doc(text)


60


Words: ['-', 'Նրա', 'համար', 'վնասակար', 'չի', 'լինի', ',', '–', 'շշպռեց', 'ժան', '–', 'նան', ',', '–', 'իսկ', 'ինձ', 'համար', 'կլինի', '։', 'Ես', 'նիհարել', 'եմ', 'տասը', 'ֆունտ', ',', 'չնայած', 'կերել', 'եմ', 'երեք', 'հոգու', 'փոխարեն', '։', 'Իսկ', 'հանուն', 'ինչի', '՞', '։', 'Հանուն', 'շաբաթական', 'երեք', '<UNK>րանկի', '՞', '։']
Entities: []
  doc = self._ensure_doc(text)


70


Words: ['-', 'Բայց', 'մյուս', 'կողմից', ',', 'լավ', 'չէ', 'երեխային', 'դես', 'ու', 'դեն', 'նետել', '։', 'Ով', '՞', 'գիտի', ',', 'օգտակար', 'կլինի', '"', 'նրան', 'արդյոք', 'այդ', 'կաթը', '։', 'Աանկիկը', ',', 'հասկանում', 'ես', ',', 'սովորել', 'է', 'քո', 'կրծքի', 'հոտին', 'ու', 'քո', 'սրտի', 'բաբախյունին', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Ապա', 'որքան', '՞', 'ես', 'պահանջում', ',', '–', 'գոռաց', 'Տերյեն', '։', '–', 'Հինգ', 'ֆրանկը', 'Նման', 'չնչին', 'գործի', 'դիմաց', ',', 'ինչպիսին', 'Նորածնին', 'կերակրելն', 'է', ',', 'մի', 'կույտ', 'փող', 'է', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Բայց', 'ինչու', '՞', ',', 'սիրելիս', ',', '–', 'ասաց', 'Տերյեն', 'և', 'կրկին', 'մատով', 'շուռումուռ', 'տվեց', 'զամբյուղի', 'պարունակությունը', '։', '–', 'չէ', '՞', 'որ', 'սա', 'հիասքանչ', 'մանկիկ', 'է', '։', 'Այնքան', 'վարդագույն', 'է', ',', 'լաց', 'չի', 'լինում', ',', 'հանգիստ', 'է', 'քնում', ',', 'և', 'կնքված', 'էլ', 'է', '։']
Entities: []
  doc = self._

80


Words: ['-', 'Անհնար', 'է', '։', 'Բացարձակապես', 'անհնար', 'է', ',', 'որ', 'կրծքի', 'երեխան', 'դիվահար', 'լինի', '։', 'Երեխան', 'մարդ', 'չէ', ',', 'այլ', 'նախամարդ', ',', 'և', 'դեռևս', 'չի', 'տնօրինում', 'ամբողջապես', 'ձևավորված', 'հոգուն', '։', 'Հետևաբար', ',', 'սատանայի', 'համար', 'այն', 'հետաքրքրություն', 'չի', 'ներկայացնում', '։', 'Միգուցե', 'նա', 'արդեն', 'խոսում', '՛', 'է', '։', 'Միգուցե', 'նրա', 'մոտ', 'ջղաձձութթու', '՛', 'է', '։', 'Միգուցե', 'նա', 'տեղաշարու', '՛', 'է', 'սենյակի', 'իրերը', '։', 'Միգուցե', 'Նրանից', 'գարշահոտ', '՛', 'է', 'գալիս', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Դե', 'տեսնում', '՛', 'ես', '։', 'Ահա', 'այն', '՝', 'նախանշանը', '։', 'Եթե', 'նա', 'դիվահար', 'լիներ', ',', 'ապա', 'նրանից', 'գարշահոտ', 'կփչեր', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Որովհետև', 'նա', 'առողջ', 'է', '–', 'գոռաց', 'Տերյեն', ',', '–', 'նա', 'առողջ', 'է', ',', 'այդ', 'պատճառով', 'էլ', 'հոտ', 'չունի', '։', 'Հոտ', 'ունեն', 'միայն', 'հիվանդ'

90
100


Words: ['-', 'Ահա', ',', '֊', 'ասաց', 'բավարարված', 'Տերյեն', 'ու', 'ձեռքերը', 'կրկին', 'ծալեց', 'թիկունքում', '։', '–', 'Կնշանակի', '՝', 'սատանայի', 'հետ', 'կապված', 'խոսքը', 'մենք', 'ետ', 'ենք', 'վերցնում', '։', 'Լավ', '։', 'Իսկ', 'հիմա', 'բարի', 'եղիր', 'ինձ', 'բացատրել', 'ինչ', '՞', 'հոտ', 'է', 'գալիս', 'կրծքի', 'նորածիններից', ',', 'եթե', 'նրանցից', 'գալիս', 'է', 'այնպիսի', 'հոտ', ',', 'որպիսին', ',', 'քո', 'կարծիքով', ',', 'պետք', 'է', 'գա', '։', 'Դե', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Ինչ', '՞', 'է', 'նշանակում', '«', 'լավ', '»', ',', '–', 'ողջ', 'ուժով', 'գոռաց', 'նրա', 'վրա', 'Տերյեն', '։', '–', 'Աիթե', '՞', 'քիչ', 'են', 'այնպիսի', 'բաները', ',', 'որոնք', 'լավ', 'հոտ', 'ունեն', '։', 'Փնջովնարդոսը', 'լավ', 'հոտ', 'ունի', '։', 'Ապուրի', 'միսը', 'լավ', 'հոտ', 'ունի', '։', 'Արաբական', 'այգիները', 'լավ', 'հոտ', 'ունեն', '։', 'Ես', 'ցանկանում', 'եմ', 'իմանալ', 'ինչ', '՞', 'հոտ', 'ունեն', 'նորածինները', '։']
Entities: []
  doc = self._ensure_doc(text)
Wor

110


Words: ['մինչդեռ', 'սեփական', 'բանականությունից', 'օգտվելու', 'համար', 'մարդուն', 'անհրաժեշտ', 'է', 'ինքնավստահություն', 'ու', 'հանգիստ', '։', 'Սակայն', 'նա', 'ամենավճռական', 'ձևով', 'պայքարում', 'էր', 'հասարակ', 'ժողովրդի', 'սնահավատության', 'դեմ', '։', 'Կախարդանքն', 'ու', 'խաղաթղթով', 'գուշակությունը', ',', 'հմայիլների', 'կրումը', ',', 'չար', 'աչքից', 'ազատվելը', ',', 'ոգիների', 'կախարդանքները', ',', 'լիալոանի', 'պահին', 'աճպարարությունները', '...', 'Ինչով', '՜', 'ասես', 'չէին', 'զբաղվում', 'այդ', 'մարդիկ', '։', 'Նրան', 'խորապես', 'հուսահատեցնում', 'էր', ',', 'որ', 'նմանատիպ', 'հեթանոսական', 'ավանդույթները', 'քրիստոնեական', 'կրոնի', 'առավել', 'քան', 'հազարամյա', 'գոյությունից', 'հետո', 'դեռևս', 'արմատախիլ', 'չէին', 'արվել', '։', 'Միաժամանակ', ',', 'այսպես', 'կոչված', ',', 'դիվահարության', 'ու', 'սատանայի', 'հետ', 'կապերի', 'դեպքերի', 'մեծ', 'մասը', 'էլ', 'ավելի', 'մոտիկից', 'ուսումնասիրման', 'ժամանակ', 'ներկայանում', 'էին', 'որպես', 'սնոտիապաշտական', 'ներկայացումներ', '։', 'ճիշտ', 'է

120


Words: ['֊', 'Ախ', '՜', ',', 'և', 'այս', 'դժբախտ', 'փոքրիկ', 'մանկիկը', '։', 'Այս', 'անմեղ', 'արարածը', '։', 'Պառկած', 'է', 'իր', 'զամբյուղում', 'ու', 'քաղցր', 'քնել', 'է', '՝', 'անտեղյակ', 'այն', 'ստոր', 'կասկածանքներին', ',', 'որոնք', 'առաջ', 'են', 'քաշվել', 'նրա', 'դեմ', '։', 'Իսկ', 'այդ', 'անպատկառ', 'անձը', 'համարձակվում', 'է', 'պնդել', ',', 'որ', 'դու', ',', 'իբր', ',', 'հոտ', 'չունես', ',', 'ինչպի', '–', 'սին', 'պետք', 'է', 'ունենան', 'մարդկային', 'մանուկները', '։', 'Եվ', 'խնչ', 'ասենք', 'մենք', 'դրա', 'վերաբերյալ', '։', '<UNK>ու', '՜', '-', 'ղու', '՜', '-', 'ղու', '՜', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['Եվ', 'նա', 'զգուշորեն', 'օրորում', 'էր', 'ծնկների', 'վրա', 'դրված', 'զամբյուղը', ',', 'մատով', 'շոյում', 'նորածնի', 'գլուխն', 'ու', 'մի', 'քանի', 'աեգամ', 'կրկնում', 'ղու', '՜', '-', 'ղու', '՜', '-', 'ղու', '՜', ',', 'քանզի', 'կարծում', 'էր', ',', 'որ', 'այդ', 'բացականչությունը', 'հանգստացուցիչ', 'ու', 'բարերար', 'ազդեցություն', 'է', 'թողնում', 'փոքրիկների

130


Words: ['Եվ', 'այդ', 'պահին', 'նորածինը', 'սկսեց', 'ժչալ', '։', 'Նա', 'կկոցեց', 'աչքերը', ',', 'լայն', 'բացեց', 'իր', 'կարմիր', 'բուկը', 'և', 'այնքան', 'զզվելի', 'ու', 'ականջ', 'ծակող', 'ձայնով', 'ծղրտաց', ',', 'որ', 'Տերյեի', 'արյունը', 'երակներում', 'սառեց', '։', 'Նա', 'առաջ', 'պարզած', 'ձեռքով', 'ցնցում', 'էր', 'զամբյուղն', 'ու', 'գոռում', '՝', 'ղու', '՜', '–', 'ղու', '՜', '–', 'ղու', '՜', ',', 'որպեսզի', 'երեխային', 'ստիպի', 'լռել', ',', 'բայց', 'վերջինս', 'ավելի', 'բարձր', 'էր', 'ոռնում', '.նրա', 'դեմքը', 'կապտել', 'էր', ',', 'ևնա', 'կարծես', 'պատրաստ', 'էր', 'ոռնոցից', 'պայթել', '։']
Entities: []
  doc = self._ensure_doc(text)


140
150


Words: ['ուժեղ', 'խելքն', 'ու', 'փորձը', ',', 'որպեսզի', 'ընտրություն', 'կատարի', 'երկու', 'տարբերակների', 'միջև', '։', 'Բայց', ',', 'այնուամենայնիվ', ',', 'նա', 'ընտրություն', 'կատարեց', 'հօգուտ', 'աճեցողական', 'տարբերակի', ',', 'ինչպես', 'ընտրություն', 'է', 'կատարում', 'սերմնահատիկը', ',', 'պետք', '՛', 'է', 'արդյոք', 'իրեն', 'ծիլեր', 'տալ', 'թե', 'ավելի', 'լավ', 'է', 'մնալ', 'չհասունացած', '։', 'Կամ', 'ինչպես', 'տիզը', 'ծառի', 'վրա', ',', 'որին', 'նույնպես', 'կյւսնքը', 'չի', 'ւսռաջարկում', 'որևէ', 'այլ', 'տարբերւսկ', ',', 'հւսրա', '–', 'տև', 'ձմեռներից', 'բացի', '։', 'Փոքրիկ', 'այլանդակ', 'տիզն', 'իր', 'ւսրճճա', '–', 'մոխրագույն', 'մարմինը', 'փաթաթում', 'է', 'գնդի', 'պես', ',', 'որպեսզի', 'դեպի', 'արտաքին', 'աշխարհը', 'դարձնի', 'յուր', 'նվազագույն', 'մակերեսը', ',', 'նա', 'իր', 'մաշկը', 'դարձնում', 'է', 'հւսրթ', 'ու', 'խիտ', ',', 'որպեսզի', 'ոչինչ', 'չարձակի', 'դուրս', 'ոչնվազագույն', 'ճառագայթում', ',', 'ոչ', 'թեթևագույն', 'գոլորշացում', '։', 'Տիզը', 'դիտավորյալ', 'իրեն', 'փոքր', 'ո

160
170


Words: ['Գրենույը', 'Աստել', 'էր', 'ոտքերը', 'մեկնած', 'փայտերի', 'վրա', '.', 'թիկունքով', 'հենվելով', 'ցախանոցի', 'պատին', '՝', 'նա', 'փակել', 'էր', 'աչքերն', 'ու', 'չէր', 'շարժվում', '։', 'Նա', 'ոչինչ', 'չէր', 'տեսնում', ',', 'ոչինչ', 'չէր', 'լսում', 'ու', 'չէր', 'զգում', '։', 'Նա', 'ուղղակի', 'ներշնչում', 'էր', 'կւայ', '՞', '–', 'տի', 'հոտը', ',', 'որը', 'քուլայվում', 'էր', 'նրա', 'շուրջն', 'ու', 'կուտակվում', 'տանիքի', 'ներքևում', ',', 'ինչպես', 'թասակի', 'տակ', '։', 'Նա', 'խմում', 'էր']
Entities: []
  doc = self._ensure_doc(text)


180
190


Words: ['Գետից', 'ոչ', 'հեռու', 'Աորտելյերի', 'փողոցի', 'վրա', ',', 'ապրում', 'էր', 'Նրա', 'ծանոթը', 'Գրիմալ', 'ազգանունով', 'կաշեգործը', ',', 'որին', 'աշխատանքի', 'համար', 'մշտապես', 'պետք', 'էին', 'լինում', 'տղաներ', 'ոչ', 'թե', 'որպես', 'աշակերտներ', 'կամ', 'ենթավարպետներ', ',', 'այլ', 'որպես', 'էժան', 'աշխատուժ', '։', 'չէ', '՞', 'որ', 'այղ', 'արհեստի', 'մեջ', 'հարկ', 'էր', 'լինում', 'կատարել', 'կյանքի', 'համար', 'այն', 'աստիճան', 'վտանգավոր', 'գործողություններ', 'մորթափառից', 'մաքրել', 'նեխող', 'գազանների', 'մորթիները', ',', 'միմյանց', 'խառնել', 'դաբաղման', 'թունավոր', 'ու', 'ներկանյութերի', 'լուծույթները', ',', 'թափել', 'կսկծոր', 'օգտագործված', 'քիմիական', 'նյութերը', ',', 'որ', 'կարգին', 'վարպետը', ',', 'սովորաբար', 'խնայելով', 'իր', 'ուսուցառած', 'օգնականներին', ',', 'վարձում', 'էր', 'գործազուրկ', 'ու', 'անտուն', 'խառնամբոխին', 'կամ', 'խնամազուրկ', 'երեխաներին', ',', 'որոնց', 'ճակատագրով', 'դժբախտության', 'դեպքում', 'ոչ', 'ոք', 'չի', 'հետաքրքրվի', '։', 'Հասկանալի', 'է', ',', 'որ

200
210
220
230
240
250
260
270
280


Words: ['Այն', 'հանգամւսնքը', ',', 'որ', 'այս', 'հոյւսկապության', 'սկզբում', 'կանգնած', 'էր', 'սպանությունը', ',', 'նա', ',', 'եթե', 'ընդհւսնրաւցես', 'գիտակցում', 'էր', 'դւս', ',', 'ընդունում', 'էր', 'խոր', 'անտւսրբերու', '–', 'թյամբ', '։', 'Աարե', 'փորոցի', 'աղջկւս', 'արտւսքինը', '՝', 'նրւս', 'դեմքը', ',', 'Նրա', 'մարմինը', ',', 'Գրենույն', 'արդեն', 'չէր', 'կւսրողւսնում', 'վերհիշել', '։', 'չէ', '՞', 'որ', 'ւցւսհւցւսնել', 'էր', 'լավագույնը', ',', 'ինչը', 'նա', 'խլեց', 'ու', 'սեփւսկանացրեց', '.', 'նրա', 'բուրմունքի', 'էությունը', '։']
Entities: []
  doc = self._ensure_doc(text)


290
300
310
320
330


Words: ['ալքիմիկոս', 'է', ',', 'ասում', 'են', 'մարդիկ', ',', 'լավ', 'է', ',', 'թող', 'այդպես', 'էլ', 'մտածեն', '։', 'Այն', 'մասին', ',', 'որ', 'իր', 'արվեստն', 'արհեստ', 'է', ',', 'ինչպես', 'և', 'ցանկացած', 'ուրիշը', ',', 'գիտեր', 'միայն', 'ինքը', ',', 'և', 'դրանում', 'էր', 'նրա', 'հպարտությունը', '։', 'Նա', 'չէր', 'էլ', 'ցանկանում', 'գյուտարար', 'լինել', '։', 'Գյուտարարությունը', 'բավական', 'կասկածելի', 'է', ',', 'գտնում', 'էր', 'Ռալդինին', ',', 'քանի', 'որ', 'այն', 'մշտապես', 'նշանակում', 'է', 'կանոնների', 'խախտում', '։', 'Նա', 'ամենևին', 'էլ', 'չէր', 'պատրաստվում', 'կոմս', 'Վերամոնի', 'համար', 'նոր', 'օծանելիք', 'հնա', '–', 'րել', '։', 'Համենայնդեպս', ',', 'Շենյեն', 'հարկադրված', 'չի', 'լինի', 'իրեն', 'հւսմոզել', 'Պելիսյեից', '«', 'Ամուրն', 'ու', 'Պսիքեն', '»', 'ձեռք', 'բերել', '։', 'Նա', 'արդեն', 'ձեռք', 'էր', 'բերել', 'այդ', 'օծանելիքները', '։', 'Ահա', 'դրանք', ',', 'պաւոուհւսնի', 'մոտի', 'գրասեղանի', 'վրա', '՝', 'հղկած', 'խցանով', 'փոքրիկ', 'ապակե', 'սրվակների', 'մեջ', '։', 'Նա',

340


Words: ['Ախ', '՜', ',', 'որքան', 'կատ', 'է', ',', 'որ', 'ազնիվ', 'մարդը', 'ստիււ|ւ|ած', 'է', 'հնւսրամտություն', 'գործածել', '։', 'Որքան', 'ծանր', 'է', 'զոհւսբե–', 'րել', 'այն', 'ամենւսթանկարժեքը', ',', 'որ', 'ունես', '՝', 'նման', 'խղճուկ', 'ձևով', 'վարկւսբեկելով', 'սեփական', 'ւցւստիվը', '։', 'Ռւսյց', 'ինչ', '՞']
Entities: []
  doc = self._ensure_doc(text)
Words: ['«', 'խոնջանքով', '»', ',', 'մշկային', 'գերհագեցած', 'բուրմունքով', '։', 'Բոլորին', 'հանկարծ', 'տիրում', 'էր', 'մուշկի', 'հոտով', 'բուրելու', 'գազա', '–', 'նւսյին', 'ցանկությունը', ',', 'և', 'Բալդինիին', 'ոչինչ', 'չէր', 'մնում', ',', 'քան', 'իր', 'հազրեվարդը', 'վերամշակել', 'գլուխը', 'լվանալու', 'համար', 'ջրի', 'ունարդոսը', 'կարել', 'բույրաբարձիկի', 'մեջ', '։', 'Դրա', 'փոխարեն', ',', 'երբ', 'հաջորդ', 'տարի', 'նա', 'պատվիրեց', 'համապատասխան', 'քանակությամբ', 'մուշկ', ',', 'մշկահոտ', 'ցիբետին', 'ու', 'կող', '–', 'բենու', 'շիթ', ',', 'Պելիսյեի', 'խելքին', 'փչեց', 'հորինել', '«', 'Անտառային', 'ծաղիկ', '»', 'անվանումով', 'օծանելիք'

350
360


Words: ['Եվ', 'կամ', 'վերցնենք', 'խանգարվածությունը', 'արագության', 'վրա', '։', 'Ինչու', '՞', 'անհրաժեշտ', 'եղավ', 'այդքան', 'շատ', 'նոր', 'ճանապարհներ', 'անցկացնել', '։', 'Ինչի', '՞', 'համար', 'են', 'այդ', 'նոր', 'կամուրջները', '։', 'Ինչի', '՞', 'համար', '։', 'Որպեսզի', 'մեկ', 'շաբաթում', 'էիոն', '՞', 'հասնեն', '։', 'Իսկ', 'ինչ', '՞', 'օգուտ', 'կա', 'դրանից', '։', 'Ում', '՞', 'համար', 'է', 'դա', 'օգտավետ', '։', 'Ում', '՞', 'է', 'պետք', 'գլուխը', 'կոտրելով', 'սլանալ', 'Ատլան', '–', 'տյան', 'օվկիանոսով', '։', 'Մեկ', 'ամիս', 'անց', 'Ամերիկայում', 'հայտնվելու', 'համար', '՞', '։', 'Բայց', 'չէ', '՞', 'որ', 'մարդիկ', 'հազարամյակներ', 'շարունակ', 'հրաշալիորեն', 'բավարարվում', 'էին', 'առանց', 'այդ', 'աշխարհամասի', '։', 'Ինչ', '՞', 'է', 'կորցրել', 'նախնադարյան', 'անտառում', 'հնդկացիների', 'կամ', 'սևամորթների', 'մոտ', 'քաղաքակիրթ', 'մարդը', '։', 'Անգամ', 'Հյուսիս', 'Նրանք', 'հասան', '՝', 'էւսւցլան', '–', 'դիա', ',', 'որտեղ', 'հավերժական', 'սառույց', 'է', ',', 'և', 'որտեղ', 'ւսպրում', 'են', 'վայր

370


Words: ['Քանզի', 'եթե', 'արդեն', 'թույլատրելի', 'է', 'Աստծու', 'եկեղեցու', 'հեղինակությունն', 'ամենաանամոթ', 'ու', 'անպատկառ', 'ձևով', 'կասկածի', 'տակ', 'դնելը', ',', 'եթե', 'ոչ', 'պակաս', 'աստվածատուր', 'միապետության', 'ու', 'թագավորների', 'սրբազան', 'անձերի', 'մասին', 'է', 'խոսվում', 'ուղղակի', 'որպես', 'կառավարման', 'այլ', 'ձևերի', 'ընդհանուր', 'կատալոգում', 'տեղ', 'գտած', 'հնարավոր', 'տարբերակների', ',', 'նրանց', 'կարելի', 'է', 'ընտրել', 'սեփական', 'ճաշակով', '։', 'Ի', 'վերջո', ',', 'հասել', 'ենք', 'նրան', ',', 'որ', 'անգամ', 'անձամբ', 'Աստծուն', '՝', 'ամենազոր', 'Տիրոջը', ',', 'համարում', 'են', 'ավելորդություն', 'ու', 'բացարձակ', 'լրջությամբ', 'պնդում', ',', 'որ', 'երկրի', 'վրա', 'կարգ', 'ու', 'կանոնը', ',', 'բարոյականությունն', 'ու', 'երջանկությունը', 'կարող', 'են', 'լինել', 'առանց', 'նրա', 'ուղղակի', 'բուն', 'մարդկանց', 'բնածին', 'բարոյականության', 'ու', 'բանականության', 'շնորհիվ', '...', '<UNK>', '՜', 'Աստված', ',', 'Աստված', ',', 'այդ', 'դեպքում', 'համենայնդեպս', 'պետք', 'չէ',

380


Words: ['Օծանելիքը', 'գարշելիության', 'աստիճան', 'լավն', 'էր', '։', 'Ցավոք', 'սրտի', ',', 'այդ', 'ողորմելի', 'Պելիսյեն', 'լավ', 'գիտեր', 'իր', 'գործը', '։', 'Վարւցետ', 'էր', ',', 'Աստված', 'վկա', ',', 'թող', 'որ', 'նա', 'հազար', 'անգամ', 'ոնչ', 'փ', 'չէր', 'սովորել', '։', 'Ռալդինին', 'կցւսնկանար', ',', 'որպեսզի', 'դւս', 'լիներ', 'իր', 'օծանելիքը', '«', 'Ամուրն', 'ու', 'Պսիքեն', '»', '։', 'Նրանում', 'չկար', 'գռեհկության', 'ստվեր', 'անգամ', '։', 'Ռացարձւսկապես', 'դասական', 'հոտ', 'էր', 'ավարտուն', 'ուներդւսշնակ', '։', 'Եվ', 'միևնույն', 'ժւս', '–', 'մանակ', 'սքանչելիորեն', 'նոր', '։', 'Թարմ', 'էր', ',', 'բայց', 'ոչ', 'ձանձրալի', '։', 'Ծաղկային', 'էր', ',', 'բայց', 'ոչ', 'քաղցրւսվուն', '։', 'Ուներ', 'խորություն', '՝', 'հրաշալի', ',', 'գրավիչ', ',', 'շքեղ', ',', 'մուգ', 'շւսգւսնակագույն', 'խորություն', ',', 'և', 'ընդ', 'որում', '՝', 'նրւսնում', 'չկար', 'ոչ', 'գերծանրւսբեռնվւս', '–', 'ծություն', ',', 'ոչ', 'վերամբարձություն', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Հրա

390


Words: ['<UNK>իծաղեի', '՜', 'է', 'նման', 'ճարտասանությունը', '.', '«', 'Մեղեդի', 'է', '։', 'Ուրախություն', 'է', '։', 'Չքնաղ', 'է', '։', 'Բարձրացնում', 'է', 'տրամադրությունը', '»', '։', 'Հիմարություն', '։', 'Մանկական', 'հիմարություն', '.', 'Րոպեական', 'տպավորություն', '։', 'Հին', 'սխալ', '։', 'Խառնվածքի', 'հարց', '։', 'Ամենայն', 'հավանականությամբ', 'իտալական', 'ժառանգականություն', '։', 'Երբեք', 'մի', 'դատիր', 'առաջին', 'տպավորությամբ', '։', 'չէ', '՞', 'որ', 'դա', 'ոսկե', 'կանոն', 'է', ',', 'Բւսլդինի', ',', 'այ', 'դու', 'ծեր', 'ոչխարի', 'գլուխ', '։', 'Երբ', 'հոտ', 'ես', 'քաշում', '՝', 'հոտ', 'քաշիր', ',', 'իսկ', 'դատիր', 'հետո', '։', '«', 'Ամուրն', 'ու', 'Պսիքեն', '»', '–', 'ը', 'շարքային', 'օծանելիք', 'չէ', '։', 'Բավական', 'հաջող', 'արտադրանք', 'է', '։', 'ճարպկորեն', 'թխված', 'անշնորհք', 'ապրանք', '։', 'Եթե', 'չասենք', 'կեղծիք', '։', 'Իսկ', 'կեղծիքից', 'բացի', ',', 'ուրիշ', 'էլ', 'ինչ', '՞', 'կարելի', 'է', 'սպասել', 'Պելիսյեի', 'նման', 'մարդուց', '։', 'Բնականաբար', ',', 'այնպիսի', 'տիպը

400
410
420


Words: ['-', 'Քեզ', 'ինչ', '՞', 'է', 'պետք', '։']
Entities: []
  doc = self._ensure_doc(text)


430
440
450


Words: ['-', 'հնչում', '՞', 'է', 'բանը', ',', '–', 'հարցրեց', 'նա', '։', '–', 'Դու', 'էլի', '՞', 'ինչ', '-', 'որ', 'բան', 'պետք', 'է', 'ինձ', 'փոխանցես', '։', 'Դե', '՞', '։', 'Խոսիր', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Դուք', 'ուզում', 'եք', 'ւսյծի', 'մորթիները', 'բուրումնեա', '՛', 'դարձնել', ',', 'վարւցետ', 'Ռալդինի', '։', 'Այս', 'մորթիները', ',', 'որոնք', 'ես', 'եմ', 'ձեզ', 'բերել', ',', 'դուք', 'դրանց', '՞', 'եք', 'ցանկանում', 'բուրմունք', 'հւս', '–', 'ղորդել', ',', '–', 'շշնջաց', 'Գրենույը', 'կւսրծես', 'ի', 'գիտություն', 'չընդունելով', 'Ռալդինիի', 'պատասխանը', '։']
Entities: []
  doc = self._ensure_doc(text)


460


Words: ['-', 'Այդպես', ',', '–', 'ասւսց', 'Ռալդինին', ',', 'որը', 'բւսցարձւսկապես', 'ցնցված', 'էր', 'խոսակցության', '՝', 'դեւցի', 'ճշգրիտի', 'ոլորտ', 'նմւսն', 'շրջադարձով', '–', 'էլ', '՞', 'ինչ', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Ռուրավետ', 'բալասանի', 'յուղը', '՞', '։']
Entities: []
  doc = self._ensure_doc(text)


470
480


Words: ['բուրավետ', 'բալասանից', ',', 'վարդի', 'յուղից', 'ու', 'մեխակից', ',', 'ինչ֊', 'ւցես', 'նաև', 'բերգամոտից', 'ու', 'հազրեվարդի', 'լուծամզված', '–', 'քից', 'և', 'ւսյլն', '։', 'Դա', 'պարզելու', 'համար', 'պետք', 'է', ',', 'ինչպես', 'ասում', 'են', ',', 'ունենալ', 'բավակւսնին', 'նուրբ', 'հոտառություն', ',', 'ու', 'լիովին', 'հնարավոր', 'է', ',', 'որ', 'Աստված', 'քեզ', 'բավականին', 'նուրբ', 'հոտառություն', 'է', 'տվել', ',', 'ինչպես', 'և', 'շատ', 'ուրիշ', 'մարդկանց', '՝', 'հատկապես', 'քո', 'տարիքում', '։', 'Սակայն', 'օծանագործի', 'համար', '–', 'և', 'այստեղ', 'նա', 'վեր', 'պարզեց', 'մատն', 'ու', 'դուրս', 'ցցեց', 'կուրծքը', ',', '-', 'սակայն', 'օծանագործի', 'համար', 'քիչ', 'է', 'ուղղակի', 'Նուրբ', 'հոտւսռություն', 'ունենալը', '։', 'Նրան', 'անհրաժեշտ', 'է', 'տասնամյակների', 'ընթացքում', 'վարժեցված', ',', 'անկաշառ', 'ւսշխատող', 'հոտառական', 'օրգան', ',', 'որը', 'թույլ', 'կտա', 'վստահորեն', 'կռահել', 'նույնիսկ', 'ամենաբարդ', 'հոտերը', ',', 'դրանց', 'բաղադրությունն', 'ու', 'համաչափությունները

490


Words: ['֊', 'Բանաձև', ',', 'բանաձև', ',', '–', 'խռպոտ', 'ձայնով', 'խոսեց', 'Գրե–', 'նույը', ',', 'և', 'Նրա', 'կերպարը', 'դռան', 'շրջանակի', 'մեջ', 'առավել', 'հստակ', 'ուրվագծվեց', '։', '–', 'Ինձ', 'ոչ', 'մի', 'բանաձև', 'պետք', 'չէ', '։', 'Դեղատոմսն', 'իմ', 'քթի', 'մեջ', 'է', '։', '<UNK>առնեմ', '՞', 'դրանք', 'ձեզ', 'համար', ',', 'մետր', ',', 'խառնեմ', '՞', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Այսինքն', '՝', 'ինչպես', '՞', ',', '–', 'բացականչեց', 'Բալդինին', 'ավելի', 'բարձր', ',', 'քան', 'պատշաճ', 'էր', 'նրան', ',', 'և', 'մոմը', 'մոտեցրեց', 'թզուկի', 'դեմքին', '։', '–', 'Այսինքն', '՝', 'ինչպես', '՞', 'խառնել', '։']
Entities: []
  doc = self._ensure_doc(text)


500


Words: ['֊', 'Դու', 'կարծում', 'ես', ',', 'որ', 'ես', 'քեզ', 'թույլ', 'կտամ', 'տնօրինել', 'իմ', 'արհեստւսնոցը', '։', 'Բնւսհյութերը', ',', 'որոնք', 'մի', 'ողջ', 'ունեցւխսծք', 'ար<UNK>են', '՞', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['-', 'Պան', '։', '–', 'Ռալդինին', 'կտրուկ', 'դուրս', 'փչեց', 'իր', 'մեջ', 'եղած', 'շունչը', '։', 'Այնուհետև', 'թոքերը', 'լցրեց', 'օդով', ',', 'երկար', 'նայեց', 'սարդանման', 'Գրենույին', 'և', 'մտորեց', '։', '«', 'Ըստ', 'էության', '՝', 'միթե', 'միևնույն', 'չէ', ',', '–', 'մտածեց', 'նաայսպես', 'թե', 'այնպես', 'վաղն', 'ամեն', 'ինչ', 'ավարտվելու', 'է', '։', 'Ես', ',', 'իհարկե', ',', 'գիտեմ', ',', 'որ', 'նա', 'չի', 'կարող', 'անել', 'այն', ',', 'ինչը', 'խոստանում', 'է', ',', 'դա', 'բացառվում', 'է', ',', 'այլապես', 'նւս', 'ավելի', 'մեծ', 'համբավ', 'կունենար', ',', 'քան', 'մեծն', 'Ֆրանժիպանին', '։', 'Ռայց', 'ինչու', '՞', 'սեւիւսկան', 'աչքերով', 'չհամոզվեմ', 'նրանում', ',', 'ինչը', 'գիտեմ', '։', 'Աիգուցե', 'հւսնկարծ', 'մի', 'գեղեցիկ', 'օր', 'Աեսինայու

510


Words: ['հնարավորություն', 'կստանաս', 'հենց', 'այժմ', ',', 'անմիջապես', 'գործով', 'ապացուցել', 'քո', 'հիմնավորումը', '։', 'Դրանով', 'իսկ', 'դու', 'հնարավորություն', 'կստանաս', 'խայտառակ', 'ձախողման', 'միջոցով', 'սովորել', 'համեստության', '՝', 'որպես', 'առաքինության', '։', 'Քո', 'պատանի', 'տարիքում', 'դա', 'դեռևս', 'ներելի', 'է', 'և', 'դժվար', 'թե', 'անուղղելի', 'աստիճանի', 'հասած', 'լինի', ',', 'սակայն', 'այդ', 'դասը', 'Նախադրյալ', 'է', 'քո', 'հետագա', 'հաջողության', 'համար', '՝', 'որպես', 'արտադրամասի', 'անդամի', ',', 'որպես', 'մարդու', 'ու', 'բարի', 'քրիստոնյայի', '։', 'Ես', 'պատրաստ', 'եմ', 'իմ', 'հաշվին', 'քեզ', 'տալ', 'այդ', 'դասը', ',', 'քանզի', 'որոշակի', 'հանգամանքների', 'բերումով', 'այսօր', 'տրամադրված', 'եմ', 'շռայլություն', 'ցուցաբերել', ',', 'և', ',', 'ով', 'գիտի', ',', 'ինչ', '-', 'որ', 'ժամանակ', 'այս', 'տեսարանի', 'մասին', 'հիշողությունը', ',', 'հնարավոր', 'է', ',', 'ուրախություն', 'պատճառի', 'ինձ', '։', 'Ռայց', 'չկարծես', ',', 'թե', 'քեզ', 'կհաջողվի', 'ինձ', 'խաբել', '։

520


Words: ['-', 'Այս', 'օծանելիքից', '՝', 'որքան', '՞', ',', '–', 'խռպոտ', 'հարցրեց', 'Գրե–', 'նույը', '։', '–', 'որքան', '՞', 'է', 'ձեզ', 'պետք', 'ղրանից', '։', 'Կուզեք', '՞', 'մինչև', 'եզրը', 'լցնեմ', 'այ', 'այն', 'մեծ', 'ամանը', '։', '–', 'Եվ', 'նա', 'մատնացույց', 'արեց', 'երեք', 'լիտրից', 'ոչ', 'պակաս', 'տարողությամբ', 'խառնամանը', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['֊', 'Ոչ', ',', 'պետք', 'չի', ',', '–', 'սարսափած', 'բացականչեց', 'Ռալդինին', '.', 'նրա', 'այդ', 'գոռոցի', 'մեջ', 'կար', 'վախ', '՝', 'որչափ', 'խոր', 'արմատացած', ',', 'նույնչափ', 'էլ', 'տարերային', 'վախ', 'շռայլության', 'հանդեպ', ',', 'վախ', 'իր', 'սեփականության', 'համար', '։', 'Ռայց', ',', 'կարծես', 'ամաչելով', 'այդ', 'ինքն', 'ա', 'մերկացնող', 'գոռոցից', ',', 'նա', 'անմիջապես', 'էլ', 'մռնչաց', ',', '–', 'չհամարձակվես', 'ինձ', 'ընդհատել', '։', '–', 'Այնուհետև', 'մի', 'քիչ', 'հանգստացավ', 'և', 'շարունակեց', 'թեթևակի', 'հեգնական', 'ձայնով', '–', 'Աեր', 'ինչին', '՞', 'է', 'պետք', 'երեք', 'լիտր', 'օծանելի

530
540


Words: ['քո', 'պարզունակ', 'բթամտությունը', 'ցույց', 'են', 'տալիս', ',', 'որ', 'դու', 'ոչինչ', 'չես', 'հասկանում', ',', 'դու', 'բարբարոս', 'ես', 'ու', 'անտաշ', ',', 'դրա', 'հետ', 'էլ', 'գոնջոտ', ',', 'լկտի', ',', 'փսլնքոտ', '։', 'Դու', 'ի', 'վիճակի', 'չես', 'լիմոնադ', 'խառնել', ',', 'քեզ', 'չի', 'կարելի', 'սովորական', 'մատուտակի', 'ջրի', 'վաճառք', 'վստահել', ',', 'իսկ', 'դու', 'խցկվում', 'ես', 'օծանագործի', 'գործի', 'մեջ', '։', 'Գոհ', 'եղիր', ',', 'ուրախացիր', 'ու', 'շնորհակալ', 'եղիր', ',', 'որ', 'քո', 'տերը', 'քեզ', 'դեռ', 'մոտ', 'է', 'թողնում', 'դաբաղման', 'լուծույթին', '։', 'Եվ', 'չհամարձակվես', ',', 'լսում', '՞', 'ես', ',', 'երբեք', 'չհամարձակվես', 'օծանագործի', 'դռան', 'շեմն', 'անցնել', '։']
Entities: []
  doc = self._ensure_doc(text)


550
560


Words: ['-', 'Դուք', 'չեք', 'ցանկանում', 'փորձանմուշ', 'վերցնել', ',', '–', 'կրկին', 'կարկաչող', 'ձայնով', 'ասաց', 'Գրենույը', ',', '֊', 'միթե', '՞', 'չեք', 'ուզում', ',', 'վարւցետ', '։', 'միթե', '՞', 'չեք', 'փորձի', '։']
Entities: []
  doc = self._ensure_doc(text)


570
580
590
600
610


Words: ['դեպքում', 'ժամանակ', 'առ', 'ժամանակ', 'նա', 'սխալներ', 'էր', 'գործում', ',', 'որոնք', 'այնպես', 'էին', 'հաշվարկված', ',', 'որ', 'Ռալդինին', 'դրանք', 'նկատի', ',', 'մոռանում', 'էր', 'ինչ', '-', 'որ', 'նյութ', 'զտիչի', 'միջով', 'անցկացնել', ',', 'ճիշտ', 'չէր', 'տեղադրում', 'կշեռքը', ',', 'բանաձևի', 'մեջ', 'հավելագրում', 'էր', 'ամպարի', 'անհեթեթ', 'բարձր', 'տոկոս', 'և', 'առիթ', 'էր', 'ստեղծում', ',', 'որ', 'իրեն', 'ցույց', 'տան', 'իր', 'սխալները', ',', 'որպեսզի', 'հետո', 'ինքը', 'մանրակրկիտ', 'ուղղի', '։', 'Այդ', 'կերպ', 'նրան', 'հաջողվում', 'էր', 'Ռալդինիին', 'ներշնչել', 'այն', 'պատրանքը', ',', 'որ', 'վերջիվերջո', 'ամեն', 'ինչ', 'ընթանում', 'է', 'կանոնավոր', 'և', 'պատշաճ', 'հունով', '։', 'չէ', '՞', 'որ', 'նա', 'չէր', 'ուզում', 'վախեցնել', 'ծերուկին', '։', 'չէ', '՞', 'որ', 'իրոք', 'ուզում', 'էր', 'նրանից', 'սովորել', '։', 'Ոչ', 'թե', 'օծանելիքի', 'բաղադրությունը', ',', 'ոչ', 'թե', 'այս', 'կամ', 'այն', 'բուրմունքի', 'կառուցվածքը', ',', 'ամենևին', 'ոչ', '։', 'Այդ', 'բնագավառում', '

620
630
640


Words: ['փոշու', 'տեսքով', 'առանց', 'Նվազագույն', 'հաջողության', '։', 'Նա', 'թորեց', 'արույրը', ',', 'ճենապակին', ',', 'կաշին', ',', 'ցորենն', 'ու', 'մանրախիճը', '։', 'Ուղղակի', 'հողը', '։', 'ԼԼրյունը', ',', 'և', 'ծառը', ',', 'և', 'թարմ', 'ձուկը', '։', 'Իր', 'սեփական', 'մազերը', '։', 'Ի', 'վերջո', ',', 'նա', 'թորեց', 'նույնիսկ', 'ջուրը', 'Սենայի', 'ջուրը', ',', 'որովհետև', 'նրան', 'թվում', 'էր', ',', 'որ', 'պետք', 'է', 'պահպանել', 'նրա', 'ինքնատիպ', 'հոտը', '։', 'Նա', 'մտածում', 'էր', ',', 'որ', 'թորման', 'կաթսայի', 'օգնությամբ', 'ինքը', 'կարող', 'էր', 'այղ', 'նյութերից', 'դուրս', 'բերել', 'նրանց', 'առանձնահատուկ', 'բուրմունքը', ',', 'ինչպես', 'այն', 'դուրս', 'էր', 'բերում', 'ուրցից', ',', 'նարդոսի', 'ու', 'չամանի', 'սերմերից', '։', 'չէ', '՞', 'որ', 'չգիտեր', ',', 'որ', 'թորումը', 'ոչ']
Entities: []
  doc = self._ensure_doc(text)


650
660
670


Words: ['սիֆիլիսային', 'ծաղկաչեչով', 'ու', 'թարախային', 'կարմրուկով', 'ւո', 'տէՁմԽ', 'ս1էւրոօ', '։', 'Ինչու', '՞', 'ոչ', 'երկու', 'տարի', 'անց', '։', 'Ինչու', '՞', 'ոչ', 'մեկ', 'տարի', 'անց', '։', 'Այդ', 'ընթացքում', 'նրան', 'կարելի', 'էր', 'ամբողջապես', 'քամել', 'ինչպես', 'արծաթի', 'հանքը', ',', 'ինչպես', 'ոսկե', 'ավանակին', '։', 'Եվ', 'թող', 'մի', 'տարուց', 'իր', 'համար', 'հանգիստ', 'մեռներ', '։', 'Ռայց', 'ոչ', '։', 'Նա', 'հիմա', 'է', 'մահանում', ',', 'անիծված', 'լինի', 'նա', ',', 'կմեռնի', 'քառասունութ', 'ժամվա', 'մեջ', '։', 'Ինչ', '-', 'որ', 'մի', 'կարճ', 'պահ', 'Բալդինին', 'մտածեց', 'այն', 'մասին', ',', 'որ', 'ուխտագնացության', 'մեկնի', 'գետից', 'այն', 'կողմ', '՝', 'Նոտր', '-', 'Գամ', '՝', 'մոմ', 'վառելու', ',', 'ու', 'Գրենույի', 'առողջության', 'համար', 'աղերսի', 'Սուրբ', 'Աստվածամորը', '։', 'Ռայց', 'հետո', 'նա', 'հրաժարվեց', 'այդ', 'մտքից', ',', 'քանի', 'որ', 'ժամանակը', 'սուղ', 'էր', '։', 'Նա', 'վազեց', 'գրչի', 'ու', 'թղթի', 'ետևից', 'և', 'կնոջը', 'վռնդեց', 'հիվանդի', 'սենյակից'

680


Words: ['-', 'որոնք', '՞', 'ենկրկին', 'հնչեց', 'հարցը', ',', 'և', 'այս', 'անգամ', 'Բալ', '–', 'դինին', 'նկատեց', 'Գրենույի', 'շուրթերի', 'շարժումը', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['֊', 'որոնք', '՞', 'են', ',', '–', 'հարցրեց', 'Նա', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['֊', 'Որտեղ', '՞', ',', '–', 'հարցրեց', 'Գրենույը', '։']
Entities: []
  doc = self._ensure_doc(text)


690
700


Words: ['Գրենույը', ',', 'որը', 'ոչ', 'մի', 'պատիվ', 'չուներ', ',', 'չէր', 'հավատում', 'սրբերին', 'և', 'առւսվել', 'ևս', '՝', 'իր', 'մոր', 'դժբախտ', 'հոգուն', ',', 'երդվեց', '։', 'Նա', 'կարող', 'էր', 'երդվել', 'ամեն', 'ինչով', '։', 'Նա', 'կընդուներ', 'Ռալդի', '–', 'նիի', 'բոլոր', 'ւցայմանները', ',', 'քանի', 'որ', 'նրան', 'ւսնհրաժեշտ', 'էր', 'ենթավարպետի', 'կարգավիճակը', 'հաստատող', 'թուղթը', ',', 'որը', 'հնարավորություն', 'էր', 'տալիս', 'նրան', 'առանց', 'աչքի', 'ընկնելու', 'ապրել', ',', 'առանց', 'խոչընդոտների', 'ճանապւսրհորդել', 'և', 'գտնել', 'աշխատանք', '։', 'Մնացածի', 'հւսնդեպ', 'նա', 'անտարբեր', 'էր', '։', 'Եվ', 'իՂւչ', 'պայմաններ', 'էին', 'դրանք', 'որ', '։', 'Չվերադառնալ', 'Փարիզ', '։', 'Իսկ', 'նրա', 'ինչիՆ', 'էր', 'պետք', 'Փւսրիզը', '։', 'Նա', 'անգիր', 'գիտեր', 'մինչև', 'վերջին', 'գարշահոտ', 'անկյունը', ',', 'այն', 'ամենուր', 'կրում', 'էր', 'իր', 'հետ', ',', 'արդեն', 'մի', 'քանի', 'տարի', 'շարունակ', 'տիրում', 'էր', 'Փարիզին', '։', 'Չպատրաստել', 'բւսլդինյան', 'մոդայիկ', 'օծանեիքներ

710


Words: ['հրաշալի', 'տաղանդը', 'և', 'Ներկայացրել', 'նրա', 'ընդունակությունները', 'որպես', 'իմ', 'սեփականը', '։', 'Ամենաշատը', 'այն', ',', 'որ', 'թեթևակի', 'շեղվել', 'եմ', 'ավանդակւսն', 'արհեստավորական', 'առաքինության', 'ուղուց', '։', 'Ամենաշատը', 'նրանում', ',', 'որ', 'այսօր', 'անում', 'եմ', 'այն', ',', 'ինչը', 'դեռ', 'երեկ', 'անիծում', 'էի', '։', 'Միթե', '՛', 'դւս', 'հանցագործություն', 'է', '։', 'Ուրիշները', 'խաբում', 'են', 'ողջ', 'կյանքում', '։', 'Իսկ', 'ես', 'ընդամենը', 'մի', 'քանի', 'տարի', 'մի', 'քիչ', 'խւսրդախու', '–', 'թյուն', 'արեցի', '։', 'Եվ', 'այն', 'էլ', 'այն', 'պատճառով', ',', 'որ', 'նման', 'անսովոր', 'հնարավորություն', 'ընձեռվեց', '։', 'Միգուցե', 'հնարավորություն', 'էլ', 'չի', 'ընձեռվել', ',', 'միգուցե', 'անձամբ', 'Տերն', 'է', 'իմ', 'տուն', 'ուղարկել', 'այդ', 'կախարդին', ',', 'որպեսզի', 'ինձ', 'պարգևատրի', 'նվաստացումների', 'համար', ',', 'որոնք', 'կրել', 'եմ', 'Պելիսյեից', 'ու', 'նրա', 'հանցակից', 'ընկերներից', '։', 'Միգուցե', 'Աստծու', 'պւստիժը', 'սպասում', 'է', 'ամենևին'

720
730
740
750
760
770


Words: ['Եվ', 'այղ', 'ժամանակ', 'հանկարծ', ',', 'հենց', 'դրանում', 'էր', 'վարժության', 'իմաստը', ',', 'կուտակված', 'ատելությունը', 'գինարբու', '–', 'քային', 'հզորությամբ', 'մղում', 'էր', 'դուրս', '։', 'Ինչպես', 'ամպրոպը', 'այն', 'հավաքվում', 'էր', 'այղ', 'հոտերի', 'վերևում', ',', 'որոնք', 'համարձակվել', 'էին', 'անպատվել', 'իր', 'պայծառափայլ', 'քիթը', '։', 'Ինչպես', 'կարկուտը', 'ցորենի', 'դաշտի', 'վրա', '՝', 'նա', 'հարձակվում', 'էր', 'այդ', 'գարշելիության', 'վրա', ',', 'ինչպես', 'մրրիկը', 'այն', 'վեր', 'էր', 'ածում', 'դիմափոշու', 'և', 'խեղդում', 'հորդառատ', 'ջրի', 'կողմից', 'մաքրված', 'ահռելի', 'թորած', 'ջրի', 'մեջ', '։', 'Այդ', 'աստիճան', 'արդար', 'էր', 'նրա', 'ցասումը', '։', 'Այդ', 'աստիճան', 'արդար', 'էրնրա', 'կրեժը', '։', '<UNK>', '՜', '։', 'Ինչպիսի', '՜', 'վեհ', 'ակնթարթ', '։', 'Գրենույը', 'այդ', 'փոքրիկ', 'մարդը', ',', 'գրգռվածությունից', 'դողում', 'էր', ',', 'նրա', 'մարմինը', 'ջղաձգորեն', 'սեղմվում', 'էր', 'քաղցրավուն', 'հաճույքի', 'մեջ', 'ու', 'գալարվում', 'այնպես', ',', 'որ', '

780
790
800


Words: ['Եվ', 'երբ', 'մեր', 'թանկագին', 'Ժան', '-', 'Բատիստը', ',', 'որն', 'ի', 'վերջո', 'վերադարձել', 'էր', 'իր', 'մոտ', ',', 'պառկեց', 'ծիրանագույն', 'սրահում', '՝', 'իր', 'հարմարավետ', 'բազմոցի', 'վրա', ',', 'եթե', 'կուզեք', ',', 'ի', 'վերջո', 'հանեց', 'ճտքակոշիկները', ',', 'ծափ', 'տվեց', 'ու', 'իր', 'մոտ', 'կանչեց', 'ծառա', '–', 'ներին', ',', 'որոնք', 'անտեսանելի', 'էին', ',', 'անշոշափելի', ',', 'անլսելի', 'ու', 'հոտառությամբ', 'անորսալի', ',', 'այսինքն', '՝', 'ամբողջապես', 'երևակայական', 'ծառասերին', ',', 'ևնրանց', 'ուղարկեց', 'պահեստանոց', ',', 'որպեսզի', 'հոտերի', 'մեծ', 'գրադարանից', 'իրեն', 'բերեն', 'այս', 'կամ', 'այն', 'հատորը', ',', 'ու', 'հրամայեց', 'նրանց', 'իջնել', 'նկուղ', ',', 'որպեսզի', 'իրեն', 'խմիչք', 'բերեն', '։', 'Երևակայական', 'ծառաները', 'շտապում', 'էին', 'կատարել', 'կարգադրությունը', ',', 'և', 'Գրենույի', 'ստամոքսը', 'սեղմվում', 'էր', 'տանջալի', 'սպասման', 'ջղաձգությունից', '։', 'Նա', 'անսպասելիորեն', 'ունենում', 'էր', 'վաճառասեղանի', 'առջև', 'կանգնած', 'հարբեցո

810
820
830
840
850
860
870
880
890
900
910
920
930
940
950
960
970
980
990
1000


Words: ['դրա', 'հետ', 'ոչինչ', 'չէր', 'կարող', 'անել', '։', 'Չափից', 'դուրս', 'անսպասելի', 'էր', 'բուրմունքի', 'այդ', 'հարձակումը', '։', 'Մ՝ի', 'ակնթարթ', 'մի', 'ներշնչումի', 'ակնթարթ', ',', 'որը', 'հավերժություն', 'տևեց', ',', 'նրան', 'թվաց', ',', 'որ', 'ժամանակը', 'կրկնակի', 'արագացել', 'է', 'կամ', ',', 'հակառակը', ',', 'անհետացել', ',', 'քանի', 'որ', 'դադարեց', 'հասկանալ', 'արդյոք', 'հիման', 'հիմա', '՞', 'է', ',', 'այստեղը', 'այստեղ', ',', 'ու', 'արդյոք', 'այժմը', 'անցյյա', '՞', 'չէ', ',', 'իսկ', 'այստեղը', 'այնտեղ', ',', 'այսինքն', '՝', '1753', 'թվականի', 'սեպտեմբերին', 'Փարիզում', '՝', 'Աարե', 'փողո', '–', 'ցում', ',', 'բուրմունքը', ',', 'որը', 'շիթով', 'բխում', 'էր', 'այգուց', ',', 'շիկահեր', 'աղջկա', '՞', 'բուրմունքն', 'էր', ',', 'որին', 'այն', 'ժամանակ', 'սպանեց', '։', 'Լկն', ',', 'որ', 'նա', 'այդ', 'բուրմունքը', 'կրկին', 'գտավ', 'աշխարհում', ',', 'նրա', 'աչքերը', 'լցրին', 'երանելի', 'երջանկության', 'արտասուքներով', ',', 'իսկ', 'այն', ',', 'որ', 'դա', 'կարող', 'էր', 'իրական', '

1010


Words: ['Լէխ', '՜', '։', 'Նա', 'ուզում', 'էր', 'տիրւսնալ', 'ւսյդ', 'բուրմունքին', '։', 'Տիրանւսլ', 'ոչ', 'այնքան', 'խենթորեն', ',', 'ինչպես', 'այն', 'ժւսմւսնակ', 'Մարե', 'փողոցի', 'վրւս', '։', 'Նա', 'ուղղակի', 'խմեց', 'այն', 'ւսղջկւս', 'հոտը', ',', 'լցրեց', 'իր', 'մեջ', 'ու', 'դրանով', 'էլ', 'կործանեց', '։', 'Ոչ', ',', 'պւստից', 'ւսյն', 'կողմ', 'գտնվող', 'աղջկւս', 'բուրմունքը', 'ցանկանում', 'էր', 'իրաւցես', 'յուրացնել', ',', 'հանել', 'նրւս', 'վրւսյից', ',', 'ինչւցես', 'մաշկը', ',', 'և', 'դւսրձնել', 'իր', 'սեւիակւս', '–', 'նությունը', '։', 'Նա', 'չգիտեր', ',', 'թե', 'դւս', 'ինչւցես', 'պետք', 'է', 'տեղի', 'ունե', '–', 'նւս', '։', 'Բայց', 'առջեում', 'ուներ', 'երկու', 'տարի', ',', 'որւցեսզի', 'սու|որեր', '։']
Entities: []
  doc = self._ensure_doc(text)


1020
1030


Words: ['կսողան', 'վեր', '։', 'Եվ', 'պետք', 'է', 'մտածել', 'ար<UNK>ե', '՞', 'արդյոք', 'ապրանքը', 'վաճառել', 'այդ', 'խաբեբաներին', ',', 'թե', '՞', ',', 'ինչպես', 'անում', 'են', 'մնացած', 'մանր', 'արդյունաբերողները', ',', 'շրթներկի', 'բեռը', 'նավով', 'ուղարկել', 'Ջենովա', 'կամ', ',', 'օրինակ', ',', 'մասնակցել', 'Բոկերի', 'աշնանային', 'տոնավաճառին', ',', 'վտանգավոր', 'ձեռնարկում', 'է', ',', 'իհարկե', ',', 'բայց', 'հաջողության', 'դեւցքում', '՝', 'վերին', 'աստիճանի', 'եկամտաբեր', '։', 'Տիկինը', 'մանրակրկիտ', 'ձևով', 'ծանրութեթև', 'էր', 'անում', 'ւսյդ', 'տարբեր', 'հնւսրավորությունները', ',', 'համադրում', 'էր', 'դրանք', ',', 'իսկ', 'երբեմն', 'զուգակցում', 'մեկը', 'մյուսի', 'հետ', 'կամ', 'օգտագործում', 'դրանք', 'բոլորը', ',', 'իր', 'գանձերի', 'մի', 'մասը', 'վաճառում', 'էր', ',', 'մյուս', 'մասը', 'թաքցնում', ',', 'իսկ', 'երրորդով', 'ռիսկային', 'առուծախ', 'էր', 'անում', '։', 'Եվ', 'եթե', 'տեղեկություններ', 'հավաքելիս', 'նրա', 'մոտ', 'տպավորություն', 'էր', 'ստեղծվում', ',', 'որ', 'շուկան', 'գերհա

1040
1050
1060
1070
1080
1090
1100


Words: ['Գրենույը', 'սարսափեց', '։', '«', 'Իսկ', 'եթե', ',', '–', 'մտածեց', 'Նա', ',', '–', 'իսկ', 'եթե', 'այդ', 'բուրմունքը', ',', 'որին', 'տիրում', 'եմ', ',', 'վերջանա', '՞', '։', 'չէ', '՞', 'որ', 'դա', 'այնպես', 'չէ', ',', 'ինչպես', 'հիշողություններում', ',', 'որտեղ', 'բոլոր', 'հոտերն', 'անանցողիկ', 'են', '։', 'Իրականում', 'հոտը', ',', 'շփվելով', 'աշխարհի', 'հետ', ',', 'մաշվում', 'է', '։', 'Այն', 'եթերային', 'է', '։', 'Եվ', 'երբ', 'մաշվի', ',', 'այլևս', 'չի', 'լինի', 'ակունքը', ',', 'որտեղից', 'կերցրել', 'եմ', 'այն', '։', 'Եվ', 'ես', 'կմնամ', 'մերկ', ',', 'ինչպես', 'նախկինում', ',', 'և', 'ստիպված', 'կլինեմ', 'կրկին', 'ինձ', 'օգնել', 'փոխարինողնյութերով', '։', 'Ոչ', ',', 'կլինի', 'ավելի', 'վատ', ',', 'քան', 'Նախկինում', '։', 'չէ', '՞', 'որ', 'արդեն', 'ճանաչում', 'ու', 'տիրում', 'եմ', 'նրան', '՝', 'իմ', 'սեփական', 'արքայական', 'բուրմունքին', ',', 'և']
Entities: []
  doc = self._ensure_doc(text)


1110


Words: ['չեմ', 'կարողնրան', 'մոռանալ', ',', 'քանի', 'որ', 'երբեք', 'չեմ', 'մոռանում', 'հոտերը', '։', 'Եվ', 'նշանակում', 'է', ',', 'որ', 'ողջ', 'կյանքումս', 'պետք', 'է', 'ւոառապեմ', 'նրա', 'մասին', 'հիշողությամբ', ',', 'ինչպես', 'արղեն', 'հիմա', 'եմ', 'տառապում', '՝', 'կանխավայելման', 'պահին', '...', 'Սյդ', 'դեպքում', 'ինչու', '՞', 'եմ', 'ընդհանրապես', 'ցանկանում', 'տիրել', 'դրան', ',', 'իմ', 'ինչին', '՞', 'է', 'պետք', '...', '»', '։']
Entities: []
  doc = self._ensure_doc(text)
Words: ['ԼԼյդ', 'միտքը', 'չափազանց', 'տհաճ', 'էր', '։', 'Գրենույն', 'անչափ', 'վախեցավ', ',', 'որ', 'տիրելով', 'բուրմունքին', ',', 'որին', 'դեռչէր', 'տիրացել', ',', 'անխուսափելիորեն', 'այն', 'կրկին', 'կկորցնի', '։', 'որքան', '՞', 'երկար', 'կկարողանա', 'այն', 'պահել', '։', 'Սի', 'քանի', 'օր', '՞', '։', 'Սի', 'քանի', 'շաբաթ', '՞', '։', 'Սիգուցե', 'ողջ', 'ամիս', ',', 'եթե', 'շատ', 'խնայողաբար', 'օծվի', '։', 'Իսկ', 'հետո', '՞', '։', 'Նա', 'արդեն', 'տեսնում', 'էր', ',', 'թե', 'ինչպես', 'է', 'սրվակի', 'միջից', 'թափ', '

1120


Words: ['ծաղիկներ', 'կակղեցնողներին', ',', 'թորողներին', 'ու', 'քամողներին', '։', 'միթե', '՞', 'ինքը', 'չէ', 'աշխարհի', 'մեծագույն', 'օծանագործը', '։']
Entities: []
  doc = self._ensure_doc(text)


1130
1140
1150
1160


Words: ['երկրորդ', 'խորհրդականի', 'համար', ',', 'որը', ',', 'նրա', 'կարծիքով', ',', 'քաղաքացիների', 'համար', 'պարտավոր', 'է', 'զսպվածության', ',', 'քաջարիության', 'ու', 'անկոտրումության', 'օրինակ', 'դառնալ', '։', 'Դրանից', 'զատ', ',', 'նա', 'մեկն', 'էր', ',', 'որի', 'վզին', 'ոչ', 'մեկը', 'չէր', 'համարձակվի', 'փաթաթել', 'իր', 'որոշումները', 'ոչ', 'խուճապով', 'բռնկված', 'ամբոխը', ',', 'ոչ', 'առավել', 'ևս', 'մեն', '-', 'միակ', 'անւսնուն', 'տականք', '-', 'հանցագործը', '։', 'Եվ', 'այդ', 'ողջ', 'սարսափելի', 'ժամանակաընթացքում', 'Նա', 'քաղաքում', 'քչերից', 'մեկն', 'էր', ',', 'ով', 'չտրվեց', 'սարսավի', 'տենդին', 'ու', 'պահպանեց', 'սթափ', 'մտածողությունը', '։', 'Բայց', 'այդ', 'ամենը', 'տարօրինակ', 'ձևով', 'այժմ', 'փոխվել', 'էր', '։', 'Այն', 'ժամանւսկ', ',', 'երբ', 'մարդիկ', 'փողոցներում', '(', 'կարծես', 'թե', 'նրանք', 'արդեն', 'կախաղւսն', 'էին', 'բարձրացրել', 'մարդասպանին', ')', 'տոնում', 'էին', 'նրա', 'չւսրագործություննե', '–', 'րի', 'ավարտն', 'ու', 'գրեթե', 'մոռացել', 'էին', 'այն', 'չարւսբաստ

1170


Words: ['նրբաճաշակ', 'գեղեցկությամբ', '։', 'Երբևիցե', 'նա', 'չէր', 'էլ', 'կարծել', ',', 'որ', 'Գրասում', 'Նման', 'քանակությամբ', 'չգնահատված', 'գեղեցկություն', 'կար', '։', 'Մարդասպանը', 'բացել', 'էր', 'նրա', 'աչքերը', '։', 'Մարդասպանն', 'աչքի', 'էր', 'ընկնում', 'գերազանց', 'ճաշակով', '։', 'Եվ', 'գործում', 'էր', 'համակարգված', 'ձևով', '։', 'Բավական', 'չէ', ',', 'որ', 'նրա', 'բոլոր', 'սպանություններն', 'իրականացված', 'էին', 'միատեսակ', 'ճշտակատարությամբ', ',', 'զոհերի', 'բուն', 'ընտրությունն', 'իսկ', 'մատնում', 'էր', 'գրեթե', 'մաթեմատիկական', 'հաշվարկը', '։', 'ճիշտ', 'է', ',', 'Ռիշին', 'չգիտեր', ',', 'թե', ',', 'անկեղծ', 'ասած', ',', 'ինչ', 'էր', 'մարդասպանն', 'ուզում', 'իր', 'զոհերից', ',', 'քանզի', 'չէ', '՞', 'որ', 'նա', 'չէր', 'գողացել', 'նրանց', 'գլխավոր', 'հարստությունը', '՝', 'պատանեկության', 'գեղեցկությունն', 'ու', 'հմայքը', '...', 'թե', '՞', 'գողացել', 'էր', '։', 'Համենայնդեպս', ',', 'որքան', 'էլ', 'դա', 'անհեթեթ', 'է', 'հնչում', ',', 'թվում', 'էր', ',', 'թե', 'սպանությունների', 

1180
1190


Words: ['Դստեր', 'հետ', 'Սնտուան', 'Ռիշիի', 'մեկնումը', 'մարդկանց', 'վրա', 'թողեց', 'տարօրինակ', 'խոր', 'տպավորություն', '։', 'Նրանց', 'թվում', 'էր', ',', 'թե', 'իրենք', 'ներկա', 'են', 'գտնվում', 'զոհւսբերությւսն', 'մի', 'ինչ', '-', 'որ', 'հնադարյան', 'ծիսակատարությւսն', '։', 'Չորսբոլորը', 'խոսում', 'էին', 'միայն', 'այն', 'մասին', ',', 'որ', 'Ռիշին', 'մեկնում', 'է', 'Գրենոբլ', ',', 'այսինքն', '՝', 'մի', 'քաղաք', ',', 'որտեղ', 'վերջին', 'ժամանակներս', 'գործում', 'է', 'աղջիկներին', 'սպանող', 'հրեշը', '։', 'Մարդիկ', 'չգիտեին', 'էլ', ',', 'թե', 'ինչ', 'մտածեն', 'դրա', 'վերաբերյալ', '։', 'Ինչով', '՞', 'բացատրել', 'Ռիշիի', 'արարքը', 'դատապարտե|ի', 'թեթևատութթ', '՞', ',', 'թե', '՞', 'հիացմունքի', 'արժանի', 'խիզախությամբ', '։', 'Մարտահարեր', '՞', 'էր', 'դա', ',', 'թե', '՞', 'աստվածների', 'ողորմածությունը', 'շարժելու', 'փորձ', '։', 'Ռայց', 'Նրանց', 'տանջում', 'էր', 'աղոտ', 'կանխազգացումը', ',', 'որ', 'շիկահեր', 'ծամերով']
Entities: []
  doc = self._ensure_doc(text)
Words: ['Ռիշին', 'հասկանում',

1200
1210


Words: ['Գրենույը', 'պահակախմբին', 'հարցրեց', ',', 'թե', 'որ', 'ճանապարհով', 'է', 'գնացել', 'երկրորդ', 'խորհրդականը', '։', 'Պահակներից', 'մեկը', 'ցույց', 'տվեց', 'դեպի', 'հյուսիս', '։', 'Իսկ', 'գուցե', 'Կաբ', '–', 'րիի', '՞', 'ուղղությամբ', '։', 'Կամ', 'գուցե', 'ուղղվել', 'է', 'դեպի', 'հարավ', '՞', 'Օրիբոյի', 'կամ', 'էա', '-', 'Նապուլի', 'ուղղությամբ', '։', 'Իհարկե', 'ոչ', ',', 'ասաց', 'պահակը', ',', 'նա', 'Աեփական', 'աչքերով', 'է', 'տեսել', '։']
Entities: []
  doc = self._ensure_doc(text)


1220


Words: ['Երկու', 'ժամ', 'հետո', ',', 'երբ', 'արդեն', 'շատ', 'էր', 'մթնել', ',', 'նրանք', 'մոտեցան', '։', 'Իրենց', 'ծպտվածությունը', 'պահպանելու', 'համար', 'երեքն', 'էլ', 'փոխել', 'էին', 'հագուստները', '։', 'Երկու', 'կանայք', 'էլ', 'մուգ', 'գույնի', 'շրջազգեստներով', 'ու', 'շղարշներով', 'էին', ',', 'Ռիշին', '՝', 'սև', 'բաճկոնով', '։', 'Նա', 'իրեն', 'ներկայացնում', 'էր', 'որպես', 'Կաստեղանայից', 'եկած', 'ազնվական', ',', 'վաղը', 'ցանկանում', 'էր', 'ծովանցով', 'հասնել', 'էերինյան', 'կղզիներ', ',', 'թող', 'տերը', 'լուսաբացին', 'մոտ', 'նախաճաշ', 'պատրաստի', '։', 'Կան', '՞', 'արդյոք', 'տանն', 'այլ', 'կենվորներ', '։', 'Ոչ', ',', 'ասաց', 'տերը', ',', 'միայն', 'Նիցցայից', 'մի', 'կաշեգործի', 'ենթավարպետ', ',', 'ով', 'ախոռում', 'է', 'գիշերում', '։']
Entities: []
  doc = self._ensure_doc(text)


1230
1240


Words: ['Նա', 'մի', 'կողմ', 'դրեց', 'մահակն', 'ու', 'ողջ', 'ջանասիրությամբ', 'անցավ', 'գործի', '։', 'Սկզբում', 'բացեց', 'իր', 'հետ', 'բերած', 'քաթւսնը', 'և', 'այն', 'մաքուր', 'կողմով', 'փռեց', 'սեղանի', 'ու', 'աթոռների', 'կրա', '՝', 'հետևելով', ',', 'որպեսզի', 'ճարպոտ', 'կողմին', 'չդիպչի', '–', 'Մղջ', '–', 'կա', 'շքեղ', 'բուրմունքը', ',', 'որը', 'հանկարծ', 'տաք', 'ու', 'խիտ', 'ալիքով', 'հորդեց', 'նրանից', ',', 'այս', 'անգամ', 'Գրենային', 'չհուզեց', '։', 'չէ', '՞', 'որ', 'դա', 'նրան', 'ծանոթ', 'էր', ',', 'իսկ', 'արբածության', 'աստիճան', 'վայելքն', 'ավելի', 'ուշ', 'կստանա', 'այն', 'բանից', 'հետո', ',', 'երբ', 'իրոք', 'կտիրի', 'նրան', '։', 'Այժմ', 'այն', 'որքան', 'հնարավոր', 'է', 'շատ', 'պետք', 'է', 'հավաքել', ',', 'որքան', 'հնարավոր', 'է', 'քիչ', 'արտահոսք', 'տալ', ',', 'այժմ', 'նրանից', 'պահանջվում', 'էր', 'կենտրոնացվածու', '–', 'թյուն', 'ու', 'արագաշարժություն', '։']
Entities: []
  doc = self._ensure_doc(text)


1250


Words: ['և', 'որ', 'ճակատագիրն', 'իրեն', 'տանում', 'էր', 'խճճված', ',', 'բայց', 'վերջին', 'հաշվով', 'ճիշտ', 'ուղով', ',', 'այլապես', 'միթե', '՞', 'ինքը', 'կարող', 'էր', 'հայտնվել', 'այստեղ', 'այս', 'մութ', 'սենյակում', '՝', 'իր', 'ձգտումների', 'նպատակակետի', 'մոտ', '։', 'Ինքը', ',', 'եթե', 'լավ', 'խորհրդածենք', ',', 'հիրավի', 'օրհնյալ', 'անհատ', 'է', '։']
Entities: []
  doc = self._ensure_doc(text)


1260
1270
1280
1290
1300
1310
1320
1330
1340


Words: ['Իսկ', 'հետո', '՞', '։', 'Ինչ', '՞', 'կանի', 'դրանից', 'հեւոո', '։', 'Չգիտեր', '։', 'Միգուցե', 'կվերադւսռնա', 'սովորակւսն', 'կյանքին', ',', 'միգուցե', 'կամուսնանա', ',', 'միգուցե', 'որդի', 'կսաղմնավորի', ',', 'միգուցե', 'ոչինչ', 'չի', 'անի', ',', 'միգուցե', 'կմեռնի', '։', 'Նա', 'բացւսրձւսկւսպես', 'անտւսրբեր', 'էր', 'դրա', 'հւսնդեպ', '։', 'Դրա', 'մասին', 'մւուսծելը', 'նրւսն', 'նույնչափ', 'անիմաստ', 'էր', 'թվում', ',', 'ինչւցես', 'ւևռածելը', 'ւսյն', 'մասին', ',', 'թե', 'ինչ', 'ւսնի', 'մահւսնալուց', 'հետո', ',', 'բնւսկանւսբւսր', ',', 'ոչինչ', '։', 'Ոչինչ', ',', 'ինչի', 'մասին', 'նա', 'կարող', 'էր', 'իմանալ', 'ւսրդեն', 'հիմւս', '։']
Entities: []
  doc = self._ensure_doc(text)


1350


Words: ['հանցագործի', 'նկատմամբ', 'պահանջվում', 'էր', 'բացառիկ', 'վերաբերմունք', '։', 'չէ', '՞', 'որ', 'չի', 'կարելի', 'նրան', '՝', 'ինչպես', 'հասարակ', 'ավազակին', ',', 'շղթայակապ', 'քարշ', 'տալ', 'հրապարակ', 'ու', 'գավազաններով', 'խփել', '։', 'Դրանում', 'ոչ', 'մի', 'սենսացիոն', 'բան', 'չէր', 'լինի', '։', 'Բոլորովին', 'այլ', 'բան', 'է', 'նրան', 'հանել', 'շքեղ', 'կառքի', 'փափուկ', 'նստատեղից', 'ու', 'մոտեցնել', 'խաչին', '.', 'դրանում', 'անհամեմատ', 'ավելի', 'շատ', 'ահագնացող', 'դաժանություն', 'կար', '։']
Entities: []
  doc = self._ensure_doc(text)


1360


Words: ['Եվ', 'Պապոնը', 'դա', 'գիտեր', '։', 'Նրա', 'բռունցքները', ',', 'որոնք', 'սեղմել', 'էին', 'երկաթյա', 'ձողը', ',', 'դողացին', '։', 'Նրա', 'ուժեղ', 'ձեռքերը', 'հանկարծ', 'դարձան', 'այնքան', 'թույլ', ',', 'ծնկներն', 'այնքան', 'փափուկ', ',', 'սիրտն', 'այնքան', 'երկչոտ', ',', 'ինչպես', 'երեխայինը', '։', 'Նա', 'չէր', 'կարողանա', 'բարձրացնել', 'այդ', 'ձողը', ',', 'կյանքում', 'երբեքնրա', 'մոտ', 'ուժ', 'չէր', 'գտնվի', 'բարձրացնել', 'այն', 'ընդդեմ', 'փոքրիկ', 'անմեղ', 'մարդու', ',', 'ախ', '՜', ',', 'նա', 'վախենում', 'էր', 'այն', 'պահից', ',', 'երբ', 'նրան', 'կբերեն', 'այստեղ', 'վերև', '.', 'Նա', 'արտասվեց', ',', 'ստիպված', 'եղավ', 'հենվել', 'իր', 'մահաբեր', 'ձողի', 'վրա', ',', 'որպեսզի', 'ծնկների', 'թուլությունից', 'վայր', 'չընկնի', 'հսկայամարմին', ',', 'ուժեղ', 'Պապոնը', '։']
Entities: []
  doc = self._ensure_doc(text)


1370
1380


Words: ['Ռայց', 'դրանից', 'ոչինչ', 'չստացվեց', '։', 'Դրանից', 'ոչինչ', 'չէր', 'էլ', 'կարող', 'ստացվել', '։', 'չէ', '՞', 'որ', 'դիմակավորված', 'էր', 'աշխարհի', 'լւսվւսգույն', 'օծանելիքով', ',', 'իսկ', 'այդ', 'դիմակի', 'տակ', 'դեմք', 'չկար', ',', 'ոչինչ', 'չկար', ',', 'բացի', 'հոտի', 'համատարած', 'բացակայությունից', '։', 'Եվ', 'այդ', 'պահին', 'նա', 'անսպասելիորեն', 'վատ', 'զգաց', ',', 'որովհետև', 'տեսավ', ',', 'թե', 'ինչպես', 'են', 'կրկին', 'մառախուղները', 'վեր', 'բարձրանում', '։']
Entities: []
  doc = self._ensure_doc(text)


1390
1400


Words: ['֊', 'Այժմ', 'ամեն', 'ինչ', 'լավ', 'կլինի', '։', 'Քաղաքային', 'խորհուրդը', 'չեղյալ', 'համարեց', 'դատավճիռը', '։', 'Բոլոր', 'վկաները', 'հրաժարվեցին', 'ցուցմունքներից', '։', 'Դու', 'ազատ', 'ես', '։', 'Դու', 'կարող', 'ես', 'անել', 'ինչ', 'ուզում', 'ես', '։', 'Ռայց', 'ես', 'ուզում', 'եմ', ',', 'որ', 'դու', 'մնաս', 'ինձ', 'մոտ', '։', 'Ես', 'կորցրել', 'եմ', 'դստերս', ',', 'ես', 'ուզում', 'եմ', 'քեզ', 'որ', '–', 'դեգրել', '։', 'Դու', 'նման', 'ես', 'նրան', '։', 'Դունույնչափ', 'գեղեցիկ', 'ես', ',', 'ինչպես', 'նա', ',', 'քո', 'մազերը', ',', 'քո', 'շուրթերը', ',', 'քո', 'ձեռքը', '...', 'Ես', 'ողջ', 'ժամանակ', 'բռնել', 'էի', 'քո', 'ձեռքից', ',', 'դու', 'այնպիսի', 'ձեռք', 'ունես', ',', 'ինչպիսին', 'նրանն', 'էր', '։', 'Իսկ', 'երբ', 'նայում', 'եմ', 'քո', 'աչքերին', ',', 'թվում', 'է', ',', 'որնա', 'է', 'ինձ', 'նայում', '։', 'Դու', 'նրա', 'եղբայրն', 'ես', ',', 'և', 'ես', 'ուզում', 'եմ', ',', 'որ', 'դառնաս', 'իմ', 'որդին', ',', 'իմ', 'ուրախությունը', ',', 'իմ', 'հպարտությունը', ',', 'իմ', 'ժառան

1410
1420
1430
1440


Words: ['Եվ', 'մեկ', 'այլ', 'անգամ', ',', 'երբ', 'արդեն', 'Բուրգունդիայում', 'էր', ',', 'նրա', 'մտքով', 'անցավ', '.', '«', 'Երբ', 'ես', 'կանգնած', 'էի', 'այգու', 'քարե', 'պատից', 'այս', 'կողմ', ',', 'որտեղ', 'խաղում', 'էր', 'շիկահեր', 'աղջիկը', ',', 'և', 'ինձ', 'էր', 'հասնում', 'նրա', 'բուրմունքը', '...', 'կամ', 'ավելի', 'շուտ', 'բուրմունքի', 'խոստումը', ',', 'քանի', 'որ', 'Նրա', 'ավելի', 'ուշ', 'բուրմունքը', 'դեռ', 'ընդհանրապես', 'գոյություն', 'չուներ', ',', '֊', 'միգուցե', 'այն', ',', 'ինչը', 'զգացի', 'այն', 'ժամանակ', ',', 'նման', 'էր', 'ւսյն', 'բանին', ',', 'ինչը', 'մարդիկ', 'զգում', 'էին', 'հրաւցարակում', ',', 'երբ', 'ես', 'նրանց', 'հեղեղեցի', 'իմ', 'օծանելիքով', '...', '–', 'Բայց', 'նա', 'անմիջապես', 'դեն', 'նետեց', 'այդ', 'միտքը', '։', '–', 'Ոչ', ',', 'դա', 'մի', 'այլ', 'բան', 'էր', '։', 'չէ', '՞', 'որ', 'գիտեի', ',', 'որ', 'ուզում', 'եմ', 'բուրմունքին', 'տիրանալ', ',', 'այլ', 'ոչ', 'աղջկան', '։', 'Իսկ', 'այդ', 'մարդիկ', 'մտածում', 'էին', ',', 'որ', 'իրենք', 'հրապուրված', 'են', 

1450
1460
1470
1480
1490


In [None]:
!wget https://heibox.uni-heidelberg.de/f/743a1a57a37c42d8b585/?dl=1
!mv index.html?dl=1 Parfum_Armenian_uncorrected.txt


In [7]:
# dealing with Armenian OCR output with line breaks (is it correct?)

FName = 'Parfum_Armenian_uncorrected.txt'
FNameOut = 'Parfum_Armenian.txt'

FIn = open(FName, 'r')
FOut = open(FNameOut, 'w')

for SLine in FIn:
    SLine = SLine.strip()
    if SLine == '': 
        FOut.write('\n\n')
        continue
    if SLine[-1] == '-':
        SLine2write = SLine[:-1]
        FOut.write(SLine2write)
        continue

    FOut.write(SLine + ' ')
FOut.flush()



In [None]:
parseFile('Parfum_Armenian.txt', 'Parfum_Armenian.vert.txt', nlp_hy)

In [14]:
!wc Parfum_Armenian.vert.txt

  83828  251460 2055080 Parfum_Armenian.vert.txt


In [3]:
DWiki = {}
with open("hywiki-20221101-pages-articles-v03.vert", 'r') as f:
    for line in f:
        line = line.rstrip()
        try:
            DWiki[line] +=1
        except:
            DWiki[line] = 1


In [19]:
DText = {}
with open("Parfum_Armenian.vert.txt", 'r') as f:
    for line in f:
        line = line.rstrip()
        try:
            DText[line] +=1
        except:
            DText[line] = 1


### checking if there is a frequency difference for an entry

In [20]:
DFreqDiff = {} # dictionary of frequency differences
lenWiki = 2735468
lenText = 83829
c = 0
for key, val in sorted(DText.items(), key=lambda item: item[1], reverse=True):
    c+=1
    valText = val + 1
    relText = valText / lenText
    try:
        valWiki = DWiki[key] + 1
    except:
        valWiki = 1
    relWiki = valWiki / lenWiki

    diffValue = relText / relWiki
    DFreqDiff[key] = diffValue


In [24]:
fOut = open('Parfum_Armenian-freq-diff.txt', 'w')
for key, val in sorted(DFreqDiff.items(), key=lambda item: item[1], reverse=True):
    try:
        frqText = DText[key] + 1
    except:
        frqText = 1

    try:
        frqWiki = DWiki[key] + 1
    except:
        frqWiki = 1
    fOut.write(f'{key}\t{val}\t{frqText}\t{frqWiki}\n')
fOut.flush()

In [25]:
cat texts-vert/* >text-vert-all.vert.txt

In [27]:
!wc text-vert-all.vert.txt

 112723  338169 3062358 text-vert-all.vert.txt


In [26]:
DText2 = {}
with open("text-vert-all.vert.txt", 'r') as f:
    for line in f:
        line = line.rstrip()
        try:
            DText2[line] +=1
        except:
            DText2[line] = 1

In [28]:
DFreqDiff2 = {} # dictionary of frequency differences
lenWiki = 2735468
lenText = 112723
c = 0
for key, val in sorted(DText2.items(), key=lambda item: item[1], reverse=True):
    c+=1
    valText = val + 1
    relText = valText / lenText
    try:
        valWiki = DWiki[key] + 1
    except:
        valWiki = 1
    relWiki = valWiki / lenWiki

    diffValue = relText / relWiki
    DFreqDiff2[key] = diffValue


In [29]:
fOut = open('text-vert-all-freq-diff.txt', 'w')
for key, val in sorted(DFreqDiff2.items(), key=lambda item: item[1], reverse=True):
    try:
        frqText = DText2[key] + 1
    except:
        frqText = 1

    try:
        frqWiki = DWiki[key] + 1
    except:
        frqWiki = 1
    fOut.write(f'{key}\t{val}\t{frqText}\t{frqWiki}\n')
fOut.flush()