In [3]:
import ginza
import spacy
from spacy import displacy





In [4]:
class DependencyAnalysis:
    def __init__(self):
        self.nlp = spacy.load('ja_ginza')

    def run(self, text):
        """係り受け解析"""
        doc = self.nlp(text)

        token_head_list = []

        for sent in doc.sents:
            for token in sent:
                token_head_list.append(
                    {"i": token.i, "orth": token.orth_, "base": token.lemma_, "head": token.head.i, "dep": token.dep_})

        displacy.render(doc, style="dep", jupyter=True, options={'distance': 90})
        displacy.render(doc, style="ent", jupyter=True,)

        return token_head_list



In [5]:
dependency = DependencyAnalysis()



In [8]:
dependency.run("妊娠4週目ではホルモン値が十分ではありません")

[{'i': 0, 'orth': '妊娠', 'base': '妊娠', 'head': 3, 'dep': 'compound'},
 {'i': 1, 'orth': '4', 'base': '4', 'head': 3, 'dep': 'nummod'},
 {'i': 2, 'orth': '週', 'base': '週', 'head': 3, 'dep': 'compound'},
 {'i': 3, 'orth': '目', 'base': '目', 'head': 9, 'dep': 'obl'},
 {'i': 4, 'orth': 'で', 'base': 'で', 'head': 3, 'dep': 'case'},
 {'i': 5, 'orth': 'は', 'base': 'は', 'head': 3, 'dep': 'case'},
 {'i': 6, 'orth': 'ホルモン', 'base': 'ホルモン', 'head': 7, 'dep': 'compound'},
 {'i': 7, 'orth': '値', 'base': '値', 'head': 9, 'dep': 'nsubj'},
 {'i': 8, 'orth': 'が', 'base': 'が', 'head': 7, 'dep': 'case'},
 {'i': 9, 'orth': '十分', 'base': '十分', 'head': 9, 'dep': 'ROOT'},
 {'i': 10, 'orth': 'で', 'base': 'だ', 'head': 9, 'dep': 'aux'},
 {'i': 11, 'orth': 'は', 'base': 'は', 'head': 9, 'dep': 'case'},
 {'i': 12, 'orth': 'あり', 'base': 'ある', 'head': 9, 'dep': 'aux'},
 {'i': 13, 'orth': 'ませ', 'base': 'ます', 'head': 9, 'dep': 'aux'},
 {'i': 14, 'orth': 'ん', 'base': 'ぬ', 'head': 9, 'dep': 'aux'}]

In [10]:
dependency.run("うつ病が薬で治らない")

[{'i': 0, 'orth': 'うつ病', 'base': 'うつ病', 'head': 4, 'dep': 'nsubj'},
 {'i': 1, 'orth': 'が', 'base': 'が', 'head': 0, 'dep': 'case'},
 {'i': 2, 'orth': '薬', 'base': '薬', 'head': 4, 'dep': 'obl'},
 {'i': 3, 'orth': 'で', 'base': 'で', 'head': 2, 'dep': 'case'},
 {'i': 4, 'orth': '治ら', 'base': '治る', 'head': 4, 'dep': 'ROOT'},
 {'i': 5, 'orth': 'ない', 'base': 'ない', 'head': 4, 'dep': 'aux'}]

In [11]:
dependency.run("肘が痛い")

[{'i': 0, 'orth': '肘', 'base': '肘', 'head': 2, 'dep': 'nsubj'},
 {'i': 1, 'orth': 'が', 'base': 'が', 'head': 0, 'dep': 'case'},
 {'i': 2, 'orth': '痛い', 'base': '痛い', 'head': 2, 'dep': 'ROOT'}]

In [13]:
dependency.run("酒さが治らない")

[{'i': 0, 'orth': '酒', 'base': '酒', 'head': 1, 'dep': 'amod'},
 {'i': 1, 'orth': 'さ', 'base': 'さ', 'head': 3, 'dep': 'nsubj'},
 {'i': 2, 'orth': 'が', 'base': 'が', 'head': 1, 'dep': 'case'},
 {'i': 3, 'orth': '治ら', 'base': '治る', 'head': 3, 'dep': 'ROOT'},
 {'i': 4, 'orth': 'ない', 'base': 'ない', 'head': 3, 'dep': 'aux'}]

In [14]:
dependency.run("うつ病 薬 治らない")

[{'i': 0, 'orth': 'うつ病', 'base': 'うつ病', 'head': 1, 'dep': 'nmod'},
 {'i': 1, 'orth': '薬', 'base': '薬', 'head': 2, 'dep': 'obl'},
 {'i': 2, 'orth': '治ら', 'base': '治る', 'head': 2, 'dep': 'ROOT'},
 {'i': 3, 'orth': 'ない', 'base': 'ない', 'head': 2, 'dep': 'aux'}]

In [8]:
dependency.run("くも膜下出血術後にみみが痛くてうつ病も発症して子宮がんも持ってます。直腸がんも発症してます。いぼや水いぼも持ってます。陰部ひりひり")

[{'i': 0, 'orth': 'くも膜', 'base': 'くも膜', 'head': 3, 'dep': 'compound'},
 {'i': 1, 'orth': '下', 'base': '下', 'head': 3, 'dep': 'compound'},
 {'i': 2, 'orth': '出血', 'base': '出血', 'head': 3, 'dep': 'compound'},
 {'i': 3, 'orth': '術後', 'base': '術後', 'head': 7, 'dep': 'obl'},
 {'i': 4, 'orth': 'に', 'base': 'に', 'head': 3, 'dep': 'case'},
 {'i': 5, 'orth': 'みみ', 'base': 'みみ', 'head': 7, 'dep': 'nsubj'},
 {'i': 6, 'orth': 'が', 'base': 'が', 'head': 5, 'dep': 'case'},
 {'i': 7, 'orth': '痛く', 'base': '痛い', 'head': 11, 'dep': 'advcl'},
 {'i': 8, 'orth': 'て', 'base': 'て', 'head': 7, 'dep': 'mark'},
 {'i': 9, 'orth': 'うつ病', 'base': 'うつ病', 'head': 11, 'dep': 'obl'},
 {'i': 10, 'orth': 'も', 'base': 'も', 'head': 9, 'dep': 'case'},
 {'i': 11, 'orth': '発症', 'base': '発症', 'head': 16, 'dep': 'advcl'},
 {'i': 12, 'orth': 'し', 'base': 'する', 'head': 11, 'dep': 'advcl'},
 {'i': 13, 'orth': 'て', 'base': 'て', 'head': 11, 'dep': 'mark'},
 {'i': 14, 'orth': '子宮がん', 'base': '子宮がん', 'head': 16, 'dep': 'obl'},
 {'i':