# ginzaの使い方

## 係り受け

修飾関係を調べることもできる．spacyは，Universal Dependencyという多言語解析技術を用いたもので，細部の単語間の修飾関係から全体の係り受け構造を求めていく方法で．係り受けの関係も種類で区別される．

In [25]:
import pandas as pd
import spacy

nlp = spacy.load('ja_ginza')
text = "昨日の天気は雨でした。晴れてほしかった。"

受ける語のリストが，係る語のchildren属性に格納．
また，係る語からの係り受け種類がdep_属性に格納．
case,cop,auxが文節内の係り受けに，nmod,nsubjが文節間の係り受けになっている．

In [2]:
doc = nlp(text)

df = pd.DataFrame({
    'text': token.text,
    'lemma_': token.lemma_,
    'pos_': token.pos_,
    'tag_': token.tag_,
    'dep_': token.dep_,
    'children': list(token.children)
    } for token in doc)

display(df)

Unnamed: 0,text,lemma_,pos_,tag_,dep_,children
0,昨日,昨日,NOUN,名詞-普通名詞-副詞可能,nmod,[の]
1,の,の,ADP,助詞-格助詞,case,[]
2,天気,天気,NOUN,名詞-普通名詞-一般,nsubj,"[昨日, は]"
3,は,は,ADP,助詞-係助詞,case,[]
4,雨,雨,NOUN,名詞-普通名詞-一般,ROOT,"[天気, でし, た, 。]"
5,でし,です,AUX,助動詞,cop,[]
6,た,た,AUX,助動詞,aux,[]
7,。,。,PUNCT,補助記号-句点,punct,[]
8,晴れ,晴れる,VERB,動詞-一般,ROOT,"[て, た, 。]"
9,て,て,SCONJ,助詞-接続助詞,mark,[ほしかっ]


In [3]:
svg = spacy.displacy.render(doc, style="dep")

### 従来からの係り受け解析との互換性

従来からの日本語言語処理で用いられてきた，文節間の係り受けを再現できる仕組みも用意されている．

In [47]:
import ginza.command_line

with open("text/sample.txt","w") as fout:
    fout.write(text)

ginza.command_line.run(model_path="ja_ginza", output_format="cabocha",files=["text/sample.txt"])

* 0 1D 0/1 0.000000
昨日	名詞,普通名詞,副詞可能,*,*,*,昨日,キノウ,*	O
の	助詞,格助詞,*,*,*,*,の,ノ,*	O
* 1 2D 0/1 0.000000
天気	名詞,普通名詞,一般,*,*,*,天気,テンキ,*	O
は	助詞,係助詞,*,*,*,*,は,ハ,*	O
* 2 -1D 0/1 0.000000
雨	名詞,普通名詞,一般,*,*,*,雨,アメ,*	O
でし	助動詞,*,*,*,助動詞-デス,連用形-一般,です,デシ,*	O
た	助動詞,*,*,*,助動詞-タ,終止形-一般,た,タ,*	O
。	補助記号,句点,*,*,*,*,。,。,*	O
EOS

* 0 -1D 0/1 0.000000
晴れ	動詞,一般,*,*,下一段-ラ行,連用形-一般,晴れる,ハレ,*	O
て	助詞,接続助詞,*,*,*,*,て,テ,*	O
ほしかっ	形容詞,非自立可能,*,*,形容詞,連用形-促音便,ほしい,ホシカッ,*	O
た	助動詞,*,*,*,助動詞-タ,終止形-一般,た,タ,*	O
。	補助記号,句点,*,*,*,*,。,。,*	O
EOS

