Skip to content

Latest commit

 

History

History
155 lines (142 loc) · 7.84 KB

lv.md

File metadata and controls

155 lines (142 loc) · 7.84 KB

deplacy sintakses analīzei

>>> import spacy
>>> nlp=spacy.load("en_udify")
>>> doc=nlp("Latvija vienu pēc otras pārdzīvoja trīs okupācijas, kuru kopējais ilgums, piecdesmit gadi.")
>>> import deplacy
>>> deplacy.render(doc)
Latvija    PROPN <════════════════╗   nsubj
vienu      NUM   ═══╗<══════════╗ ║   obl
pēc        ADP   <╗ ║           ║ ║   case
otras      NUM   ═╝<╝           ║ ║   nummod
pārdzīvoja VERB  ═════════════╗═╝═╝═╗ root
trīs       NUM   <╗           ║     ║ nummod
okupācijas NOUN  ═╝═════════╗<╝     ║ obj
,          PUNCT <════════╗ ║       ║ punct
kuru       DET   <══╗     ║ ║       ║ det
kopējais   ADJ   <╗ ║     ║ ║       ║ amod
ilgums     NOUN  ═╝═╝<╗   ║ ║       ║ nsubj
,          PUNCT <════║═╗ ║ ║       ║ punct
piecdesmit NUM   <╗   ║ ║ ║ ║       ║ nummod
gadi       NOUN  ═╝═══╝═╝═╝<╝       ║ acl
.          PUNCT <══════════════════╝ punct
>>> import trankit
>>> nlp=trankit.Pipeline("latvian")
>>> doc=nlp("Latvija vienu pēc otras pārdzīvoja trīs okupācijas, kuru kopējais ilgums, piecdesmit gadi.")
>>> import deplacy
>>> deplacy.render(doc)
Latvija    PROPN <══════════════════╗   nsubj
vienu      NUM   ═══╗<════════════╗ ║   obj
pēc        ADP   <╗ ║             ║ ║   case
otras      NUM   ═╝<╝             ║ ║   nmod
pārdzīvoja VERB  ═══════════════╗═╝═╝═╗ root
trīs       NUM   <╗             ║     ║ nummod
okupācijas NOUN  ═╝═══════════╗<╝     ║ obj
,          PUNCT <══════════╗ ║       ║ punct
kuru       DET   <════════╗ ║ ║       ║ det
kopējais   ADJ   <══════╗ ║ ║ ║       ║ amod
ilgums     NOUN  ═════╗═╝═╝═╝<╝       ║ acl
,          PUNCT <══╗ ║               ║ punct
piecdesmit NUM   <╗ ║ ║               ║ nummod
gadi       NOUN  ═╝═╝<╝               ║ appos
.          PUNCT <════════════════════╝ punct
>>> def nlp(t):
...   import urllib.request,urllib.parse,json
...   with urllib.request.urlopen("https://lindat.mff.cuni.cz/services/udpipe/api/process?model=lv&tokenizer&tagger&parser&data="+urllib.parse.quote(t)) as r:
...     return json.loads(r.read())["result"]
...
>>> doc=nlp("Latvija vienu pēc otras pārdzīvoja trīs okupācijas, kuru kopējais ilgums, piecdesmit gadi.")
>>> import deplacy
>>> deplacy.render(doc)
Latvija    PROPN <══════════════════╗   nsubj
vienu      NUM   ═══╗<════════════╗ ║   obj
pēc        ADP   <╗ ║             ║ ║   case
otras      NUM   ═╝<╝             ║ ║   nmod
pārdzīvoja VERB  ═══════════════╗═╝═╝═╗ root
trīs       NUM   <╗             ║     ║ nummod
okupācijas NOUN  ═╝═══════════╗<╝     ║ obj
,          PUNCT <══════════╗ ║       ║ punct
kuru       DET   <════════╗ ║ ║       ║ det
kopējais   ADJ   <══════╗ ║ ║ ║       ║ amod
ilgums     NOUN  ═════╗═╝═╝═╝<╝       ║ acl
,          PUNCT <══╗ ║               ║ punct
piecdesmit NUM   <╗ ║ ║               ║ nummod
gadi       NOUN  ═╝═╝<╝               ║ appos
.          PUNCT <════════════════════╝ punct
>>> import stanza
>>> nlp=stanza.Pipeline("lv")
>>> doc=nlp("Latvija vienu pēc otras pārdzīvoja trīs okupācijas, kuru kopējais ilgums, piecdesmit gadi.")
>>> import deplacy
>>> deplacy.render(doc)
Latvija    PROPN <════════════════╗   nsubj
vienu      NUM   ═══╗<══════════╗ ║   obj
pēc        ADP   <╗ ║           ║ ║   case
otras      NUM   ═╝<╝           ║ ║   nmod
pārdzīvoja VERB  ═════════════╗═╝═╝═╗ root
trīs       NUM   <╗           ║     ║ nummod
okupācijas NOUN  ═╝═════════╗<╝     ║ obj
,          PUNCT <════════╗ ║       ║ punct
kuru       DET   <══════╗ ║ ║       ║ det
kopējais   ADJ   <╗     ║ ║ ║       ║ amod
ilgums     NOUN  ═╝═══╗═╝═╝<╝       ║ acl
,          PUNCT <══╗ ║             ║ punct
piecdesmit NUM   <╗ ║ ║             ║ nummod
gadi       NOUN  ═╝═╝<╝             ║ conj
.          PUNCT <══════════════════╝ punct
>>> import spacy_udpipe
>>> nlp=spacy_udpipe.load("lv")
>>> doc=nlp("Latvija vienu pēc otras pārdzīvoja trīs okupācijas, kuru kopējais ilgums, piecdesmit gadi.")
>>> import deplacy
>>> deplacy.render(doc)
Latvija    PROPN <══════════════════╗   nsubj
vienu      NUM   <════════════════╗ ║   obj
pēc        ADP   <══════════════╗ ║ ║   case
otras      NUM   <╗             ║ ║ ║   nummod
pārdzīvoja VERB  ═╝═══════════╗═╝═╝═╝═╗ ROOT
trīs       NUM   <╗           ║       ║ nummod
okupācijas NOUN  ═╝═════════╗<╝       ║ obj
,          PUNCT <════════╗ ║         ║ punct
kuru       DET   <══════╗ ║ ║         ║ det
kopējais   ADJ   <╗     ║ ║ ║         ║ amod
ilgums     NOUN  ═╝═══╗═╝═╝<╝         ║ acl
,          PUNCT <══╗ ║               ║ punct
piecdesmit NUM   <╗ ║ ║               ║ nummod
gadi       NOUN  ═╝═╝<╝               ║ conj
.          PUNCT <════════════════════╝ punct
>>> import spacy_jptdp
>>> nlp=spacy_jptdp.load("lv_lvtb")
>>> doc=nlp("Latvija vienu pēc otras pārdzīvoja trīs okupācijas, kuru kopējais ilgums, piecdesmit gadi.")
>>> import deplacy
>>> deplacy.render(doc)
Latvija    PROPN <══════════════════╗   nsubj
vienu      NUM   <════════════════╗ ║   acl
pēc        ADP   <╗               ║ ║   case
otras      NUM   ═╝<╗             ║ ║   nummod
pārdzīvoja VERB  ═══╝═══════════╗═╝═╝═╗ ROOT
trīs       NUM   <╗             ║     ║ nummod
okupācijas NOUN  ═╝═══════════╗<╝     ║ obj
,          PUNCT <══════════╗ ║       ║ punct
kuru       PRON  <════════╗ ║ ║       ║ obj
kopējais   ADJ   ═══════╗═╝═╝<╝       ║ acl
ilgums     NOUN  ═════╗<╝             ║ nsubj
,          PUNCT <══╗ ║               ║ punct
piecdesmit NUM   <╗ ║ ║               ║ nummod
gadi       NOUN  ═╝═╝<╝               ║ parataxis
.          PUNCT <════════════════════╝ punct