Skip to content

Latest commit

 

History

History
123 lines (108 loc) · 4.35 KB

he.md

File metadata and controls

123 lines (108 loc) · 4.35 KB

ניתוח תחבירי על deplacy

עם Trankit

>>> import trankit
>>> nlp=trankit.Pipeline("hebrew")
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
 case   ╔════> ADP   על
  obl>╚═╔═══ NOUN  טעם
   cc ║   ║ ╔> CCONJ ו
 conj ║   ╚>╚═ NOUN  ריח
  aux ║   ╔>╔═ AUX   אין
 root ╚═══╚═══ VERB  להתווכח
punct> PUNCT .

עם HebPipe

>>> def nlp(t):
...   import sys,subprocess,tempfile
...   with tempfile.NamedTemporaryFile("w",encoding="utf-8") as f:
...     print(t,file=f,flush=True)
...     return subprocess.check_output([sys.executable,"-c","import hebpipe","-q",f.name]).decode("utf-8")+"\n"
...
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
 case       ╔════> ADP   על
  obl>╚═╔═══ NOUN  טעם
   cc     ║   ║ ╔> CCONJ ו
 conj     ║   ╚>╚═ NOUN  ריח
 root ╔═══║═══════ VERB  אין
csubj>╔═╚═══════ VERB  להתווכח
punct   ╚════════> PUNCT .

עם Stanza

>>> import stanza
>>> nlp=stanza.Pipeline("he")
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
case     ╔════> ADP   על
 obl>╚═╔═══ NOUN  טעם
  cc   ║   ║ ╔> CCONJ ו
conj   ║   ╚>╚═ NOUN  ריח
 aux>╚═══════ AUX   אין
root ╚═════════ VERB  להתווכח.
>>> import spacy_jptdp
>>> nlp=spacy_jptdp.load("he_htb")
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
           case     ╔══> ADP   על
            obl>╚═╔═ NOUN  טעם
compound:smixut   ║   ╚> NOUN  וריח
           ROOT ╔═╚═══╔═ AUX   אין
          xcomp ║     ╚> VERB  להתווכח
          punct ╚══════> PUNCT .

עם UDPipe 2

>>> def nlp(t):
...   import urllib.request,urllib.parse,json
...   with urllib.request.urlopen("https://lindat.mff.cuni.cz/services/udpipe/api/process?model=he&tokenizer&tagger&parser&data="+urllib.parse.quote(t)) as r:
...     return json.loads(r.read())["result"]
...
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
           case       ╔══> ADP   על
            obl>╚═╔═ NOUN  טעם
compound:smixut     ║   ╚> NOUN  וריח
            aux>╔═╚═════ AUX   אין
           root ╚═════════ VERB  להתווכח
          punct   ╚══════> PUNCT .
>>> import spacy
>>> nlp=spacy.load("en_udify")
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
           case     ╔══> ADP   על
            obl>╚═╔═ NOUN  טעם
compound:smixut   ║   ╚> PROPN וריח
            aux   ║   ╔> AUX   אין
           root ╔═╚═══╚═ VERB  להתווכח
          punct ╚══════> PUNCT .
>>> import spacy_udpipe
>>> nlp=spacy_udpipe.load("he")
>>> doc=nlp("על טעם וריח אין להתווכח.")
>>> import deplacy
>>> deplacy.render(doc,WordRight=True)
           case     ╔══> ADP   על
            obl>╚═╔═ NOUN  טעם
compound:smixut   ║   ╚> PROPN וריח
           ROOT ╔═╚═══╔═ VERB  אין
          nsubj ║     ╚> NOUN  להתווכח
          punct ╚══════> PUNCT .