Skip to content

Andmemudel

Arvi Tavast edited this page Jan 12, 2020 · 12 revisions

Olemid

Vorm

Sisaldab keelendi kõiki vorme, ka algvormi (algvorme). Vormile saab märkida, et ta on algvorm. Kui vormil on hääldus ja/või mõni hääldusmärkidega esituskuju, siis ka need on siin. Vormid on ühised kõigile sõnakogudele. Miks: sest sõna morfoloogia ei sõltu sõnakogust. Võimalikud ideoloogilised või ajaloolised erinevused lahendatakse läbirääkimistega koostajate vahel. Kui sõnakogudel on legitiimseid erivajadusi (nt vormide esitus õppesõnastikus vs terminibaasis), siis esitatavate vormide valiku ja esitusviisi saab kirjeldada vaates.

Paradigma

Ühendab vorme, mis kuuluvad samasse paradigmasse. Kasulik juhul, kui keelendil on mitu võimalikku paradigmat. Paradigmad on ühised kõigile sõnakogudele.

Keelend

See, mida traditsiooniliselt peetakse keelendiks, sõnaks, terminiks, märksõnaks, väljendiks vms, ehk asi, mis teoreetiliselt võiks sattuda sõnastiku märksõnaks või terminibaasi terminiks.

Keelendil endal mingit keelelist esitust ei ole, vaid ta saab nad vormidest: keelendit esitab selline vorm (või sellised vormid), mis on vormitabelis märgitud algvormiks.

Keelendil võib olla üks kuni mitu paradigmat, igaühel üks kuni mitu vormi. Muutumatutel sõnadel, fraasidel, võõrkeelsetel väljenditel jms on lihtsalt üks paradigma ühe vormiga.

Homonüümid on eraldi keelendid, ehk palk:palgi ja palk:palga on kaks eri keelendit, kummalgi oma paradigma(d). Ka sõitmise tee ja joomise tee on kaks eri keelendit, neil aga on kokkulangevad paradigmad ja vormid. Miks: sest paradigmade kordumist baasis on lihtsam taluda kui morfoloogiliste ja muude homonüümide erinevat esitust. Samuti leidub paradigmade vahel ka morfoloogilise homonüümi eristusest väiksemaid erinevusi, nt vesi ainena ei loendu, veekoguna loendub, mida saab soovi korral esitada kahe eri paradigmana.

Keelendid on ühised kõigile sõnakogudele. Miks: sest sõnad on keeles samad.

Ilmik

Seos keelendi ja tähenduse vahel ehk "see sõna selles tähenduses selles sõnakogus". Mudeli keskne olem, mille küljes on enamus sõnakogu infost.

Ühel keelendil võib olla üks kuni mitu ilmikut, ja sõnastiku puhul vastab ilmiku ja tähenduse kombinatsioon märksõna ühele tähendusele. Ka ühel tähendusel võib olla üks kuni mitu ilmikut, ja terminibaasi puhul vastab ilmiku ja keelendi kombinatsioon mõiste ühele terminile.

Ilmik on esimene sõnakoguspetsiifiline olem. Keelendid on sõnakogudele ühised, ja keelendi lisamiseks sõnakogusse seotakse tema sobiva(te) tähendus(t)e ilmik(ud) vastava sõnakoguga.

Ilmikul saab olla kaal, mis näitab seose tugevust selle sõna ja selle tähenduse vahel. Saab kasutada osasünonüümia, osalise vaste või termini usaldusväärsuse esitamiseks.

Ilmikud saavad olla esmased ("mustad", tavalised) või teisesed ("rohelised", analüüsi ajal kasutatud tahvlivildika värvi järgi). Roheline ilmik võiks olla defineeritud kui "see sõna esineb KA selles tähenduses" ja tema erinevus tavalisest on, et teda näidatakse ainult tähenduse poolt vaadatuna, st ta ei tekita sõna poolt vaadatuna uut tähendust juurde.

Tähendus

Seob omavahel samatähenduslikke asju: ilmikuid (koos keelenditega) ja seletusi, ja võib kuuluda nulli kuni mitmesse valdkonda. Tähendus ise mingit sisulist infot ei sisalda.

Täissünonüümid ja täpsed vasted (ehk ühe mõiste terminid samas või eri keeltes) on oma ilmikute kaudu seotud sama tähendusega. Ehk täpne samatähenduslikkus on väljendatud kuuluvusena sama tähenduse juurde.

Kuni tähendused on enamasti sõnastike vahel ühendamata, esineb baasis eri sõnakogudesse kuuluvaid tähendusi, mis võivad olla sisuliselt ekvivalentsed või peaaegu ekvivalentsed. Pärast ühendamist on ühendatud tähendus seotud mitme sõnakoguga.

Seletus

Tähendusel võib olla null kuni mitu seletust eri keeltes. Seletuse keel ei ole vältimatult seotud keelendi keelega, võimaldades eesti-vene sõnastikku eesti seletustega, eesti-vene sõnastikku vene seletustega vms.

Vabavorm

Struktuur igasuguse seni nimetamata tekstilise info esitamiseks keelendi, ilmiku, tähenduse, seletuse kohta: näited (vajadusel koos tõlgete ja seletustega), märkused, grammatiline kasutusinfo jms. Vabavormi rea kohta on teada, mis sorti vabavorm ta on, ja mis keeles. Vabavormid saavad olla omavahel hierarhilistes seostes, nt kasutusnäitel on tõlge ja seletus.

Seos

Esitab muid seoseid kahe olemi vahel peale samatähenduslikkuse (samatähenduslikud ilmikud on seotud tähenduse kaudu).

Seosel on suund. Ühesuunaline seos (nt A on B hüponüüm) on esitatud ühe seosega. Sümmeetriline seos (nt A on B antonüüm) on esitatud kahe vastassuunalise, aga muidu ühetüübilise seosega, mille terviklus on tagatud programmaatiliselt. Komplementaarsed seosed (nt A on B hüponüüm ja B on A hüperonüüm) on esitatud kahe vastassuunalise ja eritüübilise seosega. Kaks vastassuunalist seost võivad esineda ka mõne arvväärtuse poolest (nt A esilduvus B suhtes on 0,7 ja B esilduvus A suhtes on 0,6).

Seos on sõnakoguspetsiifiline, st koostajal on võimalik valida, kas seda seost oma sõnakogus esitada või mitte. Ka sisuliselt sümmeetrilisest seosest võib esitada ainult poolt, nt näidata kollokatsiooni oma sõnastikus ainult ühes suunas.

Kuigi täpne samatähenduslikkus käib tähenduse kaudu, saab seoseid (lisaks) kasutada osalise samatähenduslikkuse esitamiseks. Nt distributiivset sarnasust või rööpkorpuse joondamise tulemust saab esitada sünonüümia- või vasteseose kaaluna. Sama tähenduse piires saab vaste-eelistuse seosega näidata tõenäolisemaid tõlkevasteid, nt kuigi okulist, oftalmoloog, oculist ja ophtalmolog on kõik samatähenduslikud, tunduvad paarid okulist-oculist ja oftalmoloog-opthalmolog lugejale ootuspärasemad.

Sõnakogu

Sõnastik või terminibaas. Esitab muuhulgas, milliseid klassifikaatoriväärtusi saab selles sõnakogus kasutada.

Klassifikaatorid

Valdkond

EKILEXi valdkonnaklassifikaator saab sisaldada mitut klassifikaatorikomplekti (nt Lenoch, Eurovoc või mõni isetehtud komplekt). Sõnakogu jaoks saab valida klassifikaatoriread või terve valmis klassifikaatorikomplekti, mis on selles sõnakogus kasutusel. Klassifikaatoriread saavad olla omavahel hierarhilises seoses. Klassifikaatorireal saab olla mitu silti, nt lühendid, täiskujud, eri keeled vms. Ühe tähendusega võib olla seotud mitu klassifikaatoririda ühest või mitmest klassifikaatorikomplektist.

Register

Tuletuskood

Sõnaliik

Ilmiku liik

Keel

Vormikood

Seoseliik

Vabavormi liik

You can’t perform that action at this time.