In [1]:
# https://qiita.com/musaprg/items/9a572ad5c4e28f79d2ae
# import MeCab
# tagger = MeCab.Tagger("-Ochasen")
# tagger = MeCab.Tagger("-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd")
# print(tagger.parse("幼稚園でいっぱいいろんな歌を歌っているね"))

In [2]:
# https://kakubari-ryusei.hatenablog.com/entry/2017/10/04/192447
# import CaboCha
# cabocha = CaboCha.Parser()
# sentence = "幼稚園でいっぱいいろんな歌を歌っているね"
# tree = cabocha.parse(sentence)
# print(tree.toString(CaboCha.CABOCHA_FORMAT_TREE))

In [3]:
from neo4j import GraphDatabase
NEO4J_URL = "bolt://localhost:7687"
NEO4J_ID = "neo4j"
NEO4J_PW = "password"

class Neo4jRepository(object):

    def __init__(self, uri, user, password):
        self._driver = GraphDatabase.driver(uri, auth=(user, password))

    def close(self):
        self._driver.close()

    def create_node(self, name, label):
        with self._driver.session() as session:
            result = session.write_transaction(self._merge_and_return_node, name, label)
        return result

    def delete_node(self, name, label):
        with self._driver.session() as session:
            result = session.write_transaction(self._delete_and_return_node, name, label)
        return result

    @staticmethod
    def _merge_and_return_node(tx, name, label):
        result = tx.run("MERGE (n:%s {name: $name}) RETURN n" % (label), name=name)
        return result.single()[0]

    @staticmethod
    def _delete_and_return_node(tx, name, label):
        result = tx.run("MATCH (n:%s {name: $name}) DETACH DELETE n RETURN n" % (label), name=name)
        return result.single()[0]

In [4]:
import MeCab
tagger = MeCab.Tagger("-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd")

LABEL_THING = 'Thing'
LABEL_PERSON = 'Person'
LABEL_ORGANIZATION = 'Organization'
LABEL_AREA = 'Area'
LABEL_COUNTRY = 'Country'

def paragraph_to_list(paragraph):
    return paragraph.split('\n')
def paragraph_to_mecab_morphemes(paragraph):
    return paragraph_to_list(tagger.parse(paragraph))
def mecab_morpheme_to_list(mecab_morpheme):
    tmp = mecab_morpheme.split('\t')
    if len(tmp) < 2:
        return False
    info = tmp[1].split(',')
    info.insert(0, tmp[0])
    return info

def paragraph_to_proper_nouns(paragraph):
    morphemes = paragraph_to_mecab_morphemes(paragraph)

    proper_nouns = []
    for line in morphemes:
        morpheme = mecab_morpheme_to_list(line)
        if not morpheme:
            continue
        if morpheme[2] == '固有名詞':
            if morpheme[3] == '人名':
                if morpheme[4] != '一般':
                    continue
                label = LABEL_PERSON
            elif morpheme[3] == '組織':
                label = LABEL_ORGANIZATION
            elif morpheme[3] == '地域':
                if morpheme[4] == '国':
                    label = LABEL_COUNTRY
                else:
                    label = LABEL_AREA
            else:
                label = LABEL_THING
            proper_nouns.append({'name': morpheme[0], 'label': label})
    return proper_nouns


In [5]:
import re

def delete_brackets(s):
    """
    括弧と括弧内文字列を削除
    """
    """ brackets to zenkaku """
    table = {
        "(": "（",
        ")": "）",
        "<": "＜",
        ">": "＞",
        "{": "｛",
        "}": "｝",
        "[": "［",
        "]": "］"
    }
    for key in table.keys():
        s = s.replace(key, table[key])
    """ delete zenkaku_brackets """
    l = ['（[^（|^）]*）', '【[^【|^】]*】', '＜[^＜|^＞]*＞', '［[^［|^］]*］',
         '「[^「|^」]*」', '｛[^｛|^｝]*｝', '〔[^〔|^〕]*〕', '〈[^〈|^〉]*〉']
    for l_ in l:
        s = re.sub(l_, "", s)
    """ recursive processing """
    return delete_brackets(s) if sum([1 if re.search(l_, s) else 0 for l_ in l]) > 0 else s

In [6]:
# https://qiita.com/poorko/items/9140c75415d748633a10
subject = '明仁'

In [7]:
import urllib
import requests
from bs4 import BeautifulSoup

encoded_subject = urllib.parse.quote(subject)
wikipedia_url = requests.get('https://ja.wikipedia.org/wiki/%s' % (encoded_subject))

# Get Html
soup = BeautifulSoup(wikipedia_url.content, 'lxml')

# Remove script and style attributes
for script in soup(["script", "style"]):
    script.decompose()

#print(soup.prettify)
# Get only Text
raw_text = soup.get_text()

# Put lines in a list
all_lines= [line.strip() for line in raw_text.splitlines()]

# Make the list into text without empty lines
all_text="\n".join(line for line in all_lines if line)

# Sanitize
sanitized_text = delete_brackets(all_text)

# Split into Sentences
import re
lines = re.findall(r'[^。]+(?:[。]|$)', sanitized_text)

In [8]:
node_origins = []
for sentence in lines:
    node_origins.extend(paragraph_to_proper_nouns(sentence))
print(node_origins)

[{'name': 'Wikipedia', 'label': 'Thing'}, {'name': '百科事典', 'label': 'Thing'}, {'name': 'ウィキペディア', 'label': 'Thing'}, {'name': 'ナビゲーション', 'label': 'Thing'}, {'name': '2014年', 'label': 'Thing'}, {'name': '4月24日', 'label': 'Thing'}, {'name': '1989年', 'label': 'Thing'}, {'name': '1月7日', 'label': 'Thing'}, {'name': '2019年', 'label': 'Thing'}, {'name': '4月30日', 'label': 'Thing'}, {'name': '昭和64年', 'label': 'Thing'}, {'name': '1月7日', 'label': 'Thing'}, {'name': '午前6時', 'label': 'Thing'}, {'name': '33分', 'label': 'Thing'}, {'name': '平成31年', 'label': 'Thing'}, {'name': '4月30日', 'label': 'Thing'}, {'name': '12時', 'label': 'Thing'}, {'name': '即位礼', 'label': 'Thing'}, {'name': '即位礼正殿の儀', 'label': 'Thing'}, {'name': '1990年', 'label': 'Thing'}, {'name': '11月12日', 'label': 'Thing'}, {'name': '大嘗宮の儀', 'label': 'Thing'}, {'name': '1990年', 'label': 'Thing'}, {'name': '11月22日', 'label': 'Thing'}, {'name': '23日', 'label': 'Thing'}, {'name': '東御苑', 'label': 'Area'}, {'name': '大嘗宮', 'label': 'Thing'}, {'nam

In [9]:
# Test
repo = Neo4jRepository(NEO4J_URL, NEO4J_ID, NEO4J_PW)
for node in node_origins:
    print(node)
    repo.create_node(node['name'], node['label'])
    #repo.delete_node(node['name'], node['label'])


{'name': 'Wikipedia', 'label': 'Thing'}
{'name': '百科事典', 'label': 'Thing'}
{'name': 'ウィキペディア', 'label': 'Thing'}
{'name': 'ナビゲーション', 'label': 'Thing'}
{'name': '2014年', 'label': 'Thing'}
{'name': '4月24日', 'label': 'Thing'}
{'name': '1989年', 'label': 'Thing'}
{'name': '1月7日', 'label': 'Thing'}
{'name': '2019年', 'label': 'Thing'}
{'name': '4月30日', 'label': 'Thing'}
{'name': '昭和64年', 'label': 'Thing'}
{'name': '1月7日', 'label': 'Thing'}
{'name': '午前6時', 'label': 'Thing'}
{'name': '33分', 'label': 'Thing'}
{'name': '平成31年', 'label': 'Thing'}
{'name': '4月30日', 'label': 'Thing'}
{'name': '12時', 'label': 'Thing'}
{'name': '即位礼', 'label': 'Thing'}
{'name': '即位礼正殿の儀', 'label': 'Thing'}
{'name': '1990年', 'label': 'Thing'}
{'name': '11月12日', 'label': 'Thing'}
{'name': '大嘗宮の儀', 'label': 'Thing'}
{'name': '1990年', 'label': 'Thing'}
{'name': '11月22日', 'label': 'Thing'}
{'name': '23日', 'label': 'Thing'}
{'name': '東御苑', 'label': 'Area'}
{'name': '大嘗宮', 'label': 'Thing'}
{'name': '昭和', 'label': 'Thing'}


{'name': '1945年', 'label': 'Thing'}
{'name': '8月15日', 'label': 'Thing'}
{'name': '玉音放送', 'label': 'Thing'}
{'name': '1946年', 'label': 'Thing'}
{'name': '10月', 'label': 'Thing'}
{'name': '1950年', 'label': 'Thing'}
{'name': '12月', 'label': 'Thing'}
{'name': '昭和天皇', 'label': 'Person'}
{'name': '教育方針', 'label': 'Thing'}
{'name': 'アメリカ合衆国', 'label': 'Country'}
{'name': '児童文学', 'label': 'Thing'}
{'name': 'エリザベス・ヴァイニング', 'label': 'Person'}
{'name': '家庭教師', 'label': 'Thing'}
{'name': '1952年', 'label': 'Thing'}
{'name': '11月10日', 'label': 'Thing'}
{'name': '立太子の礼', 'label': 'Thing'}
{'name': '皇太子成年式', 'label': 'Thing'}
{'name': '大勲位', 'label': 'Thing'}
{'name': '菊花大綬章', 'label': 'Thing'}
{'name': '1953年', 'label': 'Thing'}
{'name': '3月30日', 'label': 'Thing'}
{'name': '10月12日', 'label': 'Thing'}
{'name': 'ヨーロッパ', 'label': 'Area'}
{'name': 'アメリカ合衆国', 'label': 'Country'}
{'name': 'カナダ', 'label': 'Country'}
{'name': '6月2日', 'label': 'Thing'}
{'name': 'エリザベス2世', 'label': 'Person'}
{'name': '英国', 'la

{'name': '2017年', 'label': 'Thing'}
{'name': '6月9日', 'label': 'Thing'}
{'name': '参議院', 'label': 'Organization'}
{'name': '本会議', 'label': 'Thing'}
{'name': '天皇の退位等に関する皇室典範特例法', 'label': 'Thing'}
{'name': '7日', 'label': 'Thing'}
{'name': '16日', 'label': 'Thing'}
{'name': '皇太子徳仁親王', 'label': 'Thing'}
{'name': '1868年', 'label': 'Thing'}
{'name': '一世一元の制', 'label': 'Thing'}
{'name': '2017年', 'label': 'Thing'}
{'name': '12月1日', 'label': 'Thing'}
{'name': '皇室会議', 'label': 'Thing'}
{'name': '2019年', 'label': 'Thing'}
{'name': '4月30日', 'label': 'Thing'}
{'name': '徳仁', 'label': 'Thing'}
{'name': '5月1日', 'label': 'Thing'}
{'name': '元号法', 'label': 'Thing'}
{'name': '4月30日', 'label': 'Thing'}
{'name': '1989年', 'label': 'Thing'}
{'name': '1月8日', 'label': 'Thing'}
{'name': '5月1日', 'label': 'Thing'}
{'name': '2019年', 'label': 'Thing'}
{'name': '皇位継承', 'label': 'Thing'}
{'name': '皇室典範', 'label': 'Thing'}
{'name': '宮内庁', 'label': 'Organization'}
{'name': '上皇后', 'label': 'Person'}
{'name': '2019年', 'labe

{'name': '桓武天皇', 'label': 'Person'}
{'name': '2003年', 'label': 'Thing'}
{'name': '12月18日', 'label': 'Thing'}
{'name': '誕生日', 'label': 'Thing'}
{'name': '記者会見', 'label': 'Thing'}
{'name': '島津家', 'label': 'Thing'}
{'name': '島津家', 'label': 'Thing'}
{'name': '薩摩藩', 'label': 'Thing'}
{'name': '江戸時代', 'label': 'Thing'}
{'name': '琉球侵攻', 'label': 'Thing'}
{'name': '沖縄県', 'label': 'Area'}
{'name': '琉球王国', 'label': 'Thing'}
{'name': '実質的', 'label': 'Thing'}
{'name': '2004年', 'label': 'Thing'}
{'name': '10月28日', 'label': 'Thing'}
{'name': '秋の園遊会', 'label': 'Thing'}
{'name': '東京都', 'label': 'Area'}
{'name': '教育委員', 'label': 'Thing'}
{'name': '米長邦雄', 'label': 'Person'}
{'name': '人格否定発言', 'label': 'Thing'}
{'name': '2004年', 'label': 'Thing'}
{'name': '誕生日', 'label': 'Thing'}
{'name': '2005年', 'label': 'Thing'}
{'name': '12月19日', 'label': 'Thing'}
{'name': '誕生日', 'label': 'Thing'}
{'name': '記者会見', 'label': 'Thing'}
{'name': '代表質問', 'label': 'Thing'}
{'name': '2006年', 'label': 'Thing'}
{'name': '6月6日'

{'name': 'カタール', 'label': 'Country'}
{'name': 'Collar', 'label': 'Organization'}
{'name': 'サウジアラビア', 'label': 'Country'}
{'name': 'Badr', 'label': 'Organization'}
{'name': 'セネガル', 'label': 'Country'}
{'name': 'Order', 'label': 'Organization'}
{'name': 'Lion', 'label': 'Organization'}
{'name': 'Collar', 'label': 'Organization'}
{'name': '南アフリカ', 'label': 'Country'}
{'name': '喜望峰', 'label': 'Area'}
{'name': '大十字章', 'label': 'Thing'}
{'name': 'スペイン', 'label': 'Country'}
{'name': '金羊毛', 'label': 'Thing'}
{'name': 'カルロス3世', 'label': 'Thing'}
{'name': '大十字章', 'label': 'Thing'}
{'name': 'カルロス3世', 'label': 'Thing'}
{'name': 'スウェーデン', 'label': 'Country'}
{'name': 'セラフィム', 'label': 'Thing'}
{'name': 'Knight', 'label': 'Person'}
{'name': 'with', 'label': 'Person'}
{'name': 'Collar', 'label': 'Organization'}
{'name': 'タイ', 'label': 'Country'}
{'name': 'on', 'label': 'Thing'}
{'name': '60t', 'label': 'Thing'}
{'name': 'Anniversary', 'label': 'Thing'}
{'name': 'H.M.', 'label': 'Thing'}
{'name': 'Kin

{'name': '-1', 'label': 'Thing'}
{'name': '宗尊親王', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '-1', 'label': 'Thing'}
{'name': '後深草天皇', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '山天', 'label': 'Area'}
{'name': '-1', 'label': 'Thing'}
{'name': '惟康親王', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '-1', 'label': 'Thing'}
{'name': '伏見天皇', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '久明親王', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '-1', 'label': 'Thing'}
{'name': '後宇多天皇', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '後伏見天皇', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '花園', 'label': 'Organization'}
{'name': '-1', 'label': 'Thing'}
{'name': '守邦親王', 'label': 'Person'}
{'name': '-1', 'label': 'Thing'}
{'name': '-1', 'label': 'Thing'}
{'name': '二條', 'label': 'Area'}
{'name': '-1', 'label': 'Thing'}
{'name': '後醍醐天皇', 'label': 'Person'}
{'name': '量仁', 'label': 'Thing'}
{'name'

{'name': '皇太子妃', 'label': 'Thing'}
{'name': '23日', 'label': 'Thing'}
{'name': 'オーストラリア', 'label': 'Country'}
{'name': 'ニュージーランド', 'label': 'Country'}
{'name': '皇太子妃', 'label': 'Thing'}
{'name': '10月11日', 'label': 'Thing'}
{'name': '10月22日', 'label': 'Thing'}
{'name': 'スペイン', 'label': 'Country'}
{'name': 'アメリカ合衆国', 'label': 'Country'}
{'name': 'ベルギー', 'label': 'Country'}
{'name': '皇太子妃', 'label': 'Thing'}
{'name': '20日', 'label': 'Thing'}
{'name': '28日', 'label': 'Thing'}
{'name': 'ネパール', 'label': 'Country'}
{'name': 'バングラデシュ', 'label': 'Country'}
{'name': 'インド', 'label': 'Country'}
{'name': '皇太子妃', 'label': 'Thing'}
{'name': 'ネパール', 'label': 'Country'}
{'name': '戴冠式', 'label': 'Thing'}
{'name': '25日', 'label': 'Thing'}
{'name': 'ヨルダン', 'label': 'Country'}
{'name': 'ユーゴスラビア', 'label': 'Country'}
{'name': 'イギリス', 'label': 'Country'}
{'name': 'タイ', 'label': 'Country'}
{'name': '皇太子妃', 'label': 'Thing'}
{'name': '12日', 'label': 'Thing'}
{'name': '27日', 'label': 'Thing'}
{'name': 'ブラジル', 'l

{'name': '1989年', 'label': 'Thing'}
{'name': '11月', 'label': 'Thing'}
{'name': 'ISBN', 'label': 'Thing'}
{'name': '-3', 'label': 'Thing'}
{'name': '川那部浩哉', 'label': 'Person'}
{'name': '日本産', 'label': 'Thing'}
{'name': '東海大学', 'label': 'Organization'}
{'name': '1993年', 'label': 'Thing'}
{'name': '10月', 'label': 'Thing'}
{'name': '2000年', 'label': 'Thing'}
{'name': '12月', 'label': 'Thing'}
{'name': '2013年', 'label': 'Thing'}
{'name': '3月', 'label': 'Thing'}
{'name': 'ISBN', 'label': 'Thing'}
{'name': '中坊徹次', 'label': 'Person'}
{'name': '8日', 'label': 'Thing'}
{'name': '皇統譜', 'label': 'Thing'}
{'name': '1817年', 'label': 'Thing'}
{'name': '光格天皇', 'label': 'Person'}
{'name': '202年', 'label': 'Thing'}
{'name': '2006年', 'label': 'Thing'}
{'name': '7月21日', 'label': 'Thing'}
{'name': 'DVD', 'label': 'Thing'}
{'name': '開会式', 'label': 'Thing'}
{'name': 'テレビ中継', 'label': 'Thing'}
{'name': '江戸時代', 'label': 'Thing'}
{'name': '1817年', 'label': 'Thing'}
{'name': '5月7日', 'label': 'Thing'}
{'name': '光格天

{'name': '宮内庁', 'label': 'Organization'}
{'name': 'おことば', 'label': 'Thing'}
{'name': '財団法人', 'label': 'Organization'}
{'name': '結核予防会', 'label': 'Thing'}
{'name': '70周年', 'label': 'Thing'}
{'name': '60回', 'label': 'Thing'}
{'name': '全国大会', 'label': 'Thing'}
{'name': '平成21年', 'label': 'Thing'}
{'name': '3月18日', 'label': 'Thing'}
{'name': '2009年', 'label': 'Thing'}
{'name': '5月21日', 'label': 'Thing'}
{'name': '警察庁', 'label': 'Organization'}
{'name': '昭和51年', 'label': 'Thing'}
{'name': '警察白書', 'label': 'Thing'}
{'name': '2009年', 'label': 'Thing'}
{'name': '12月5日', 'label': 'Thing'}
{'name': '日本', 'label': 'Country'}
{'name': '南島', 'label': 'Area'}
{'name': 'pp', 'label': 'Thing'}
{'name': '-1', 'label': 'Thing'}
{'name': 'pp', 'label': 'Thing'}
{'name': '-1', 'label': 'Thing'}
{'name': '2位', 'label': 'Thing'}
{'name': '徳仁', 'label': 'Thing'}
{'name': '59歳', 'label': 'Thing'}
{'name': '3位', 'label': 'Thing'}
{'name': 'おことば', 'label': 'Thing'}
{'name': 'おことば', 'label': 'Thing'}
{'name': '宮内

{'name': 'htm', 'label': 'Organization'}
{'name': '2011年', 'label': 'Thing'}
{'name': '4月25日', 'label': 'Thing'}
{'name': '女性セブン', 'label': 'Thing'}
{'name': '2012年', 'label': 'Thing'}
{'name': '2月23日', 'label': 'Thing'}
{'name': '7割', 'label': 'Thing'}
{'name': '在日米軍基地', 'label': 'Thing'}
{'name': '6割', 'label': 'Thing'}
{'name': 'J-CASTニュース', 'label': 'Thing'}
{'name': 'http://', 'label': 'Thing'}
{'name': 'www', 'label': 'Area'}
{'name': 'j-cast', 'label': 'Thing'}
{'name': '.com', 'label': 'Thing'}
{'name': 'html', 'label': 'Thing'}
{'name': '御料車', 'label': 'Thing'}
{'name': '免許更新', 'label': 'Thing'}
{'name': 'ホンダ・インテグラ', 'label': 'Thing'}
{'name': '高齢者', 'label': 'Thing'}
{'name': 'ハフィントン・ポスト', 'label': 'Thing'}
{'name': '2016年', 'label': 'Thing'}
{'name': '1月8日', 'label': 'Thing'}
{'name': 'ベストカー', 'label': 'Thing'}
{'name': '講談社ビーシー', 'label': 'Thing'}
{'name': '2017年', 'label': 'Thing'}
{'name': '11月11日', 'label': 'Thing'}
{'name': '運転免許', 'label': 'Thing'}
{'name': '時事通信社', 'l

{'name': 'NHK', 'label': 'Thing'}
{'name': 'NHKアーカイブス', 'label': 'Thing'}
{'name': '即位の礼', 'label': 'Thing'}
{'name': 'NHK', 'label': 'Thing'}
{'name': 'NHKアーカイブス', 'label': 'Thing'}
{'name': 'NHK', 'label': 'Thing'}
{'name': 'NHK', 'label': 'Thing'}
{'name': 'NHKアーカイブス', 'label': 'Thing'}
{'name': '1933年', 'label': 'Thing'}
{'name': '12月23日', 'label': 'Thing'}
{'name': '中', 'label': 'Country'}
{'name': '日本', 'label': 'Country'}
{'name': '昭和天皇', 'label': 'Person'}
{'name': '1989年', 'label': 'Thing'}
{'name': '1月7日', 'label': 'Thing'}
{'name': '2019年', 'label': 'Thing'}
{'name': '4月30日', 'label': 'Thing'}
{'name': '昭和64年', 'label': 'Thing'}
{'name': '1月7日', 'label': 'Thing'}
{'name': '平成31年', 'label': 'Thing'}
{'name': '4月30日', 'label': 'Thing'}
{'name': '徳仁', 'label': 'Thing'}
{'name': '古墳時代', 'label': 'Thing'}
{'name': '飛鳥時代', 'label': 'Person'}
{'name': '神武天皇', 'label': 'Thing'}
{'name': '2代', 'label': 'Thing'}
{'name': '綏靖天皇', 'label': 'Thing'}
{'name': '3代', 'label': 'Thing'}
{'nam

{'name': '後陽成天皇', 'label': 'Person'}
{'name': '後水尾天皇', 'label': 'Person'}
{'name': '明正天皇', 'label': 'Person'}
{'name': '後光明天皇', 'label': 'Person'}
{'name': '後西天皇', 'label': 'Person'}
{'name': '霊元天皇', 'label': 'Person'}
{'name': '東山天皇', 'label': 'Person'}
{'name': '中御門天皇', 'label': 'Person'}
{'name': '桜町天皇', 'label': 'Person'}
{'name': '桃園天皇', 'label': 'Person'}
{'name': '後桜町天皇', 'label': 'Person'}
{'name': '後桃園天皇', 'label': 'Person'}
{'name': '光格天皇', 'label': 'Person'}
{'name': '仁孝天皇', 'label': 'Person'}
{'name': '孝明天皇', 'label': 'Person'}
{'name': '明治以降', 'label': 'Thing'}
{'name': '明治天皇', 'label': 'Person'}
{'name': '大正天皇', 'label': 'Person'}
{'name': '昭和天皇', 'label': 'Person'}
{'name': '徳仁', 'label': 'Thing'}
{'name': '大正', 'label': 'Thing'}
{'name': '神功皇后', 'label': 'Person'}
{'name': '仲哀天皇', 'label': 'Thing'}
{'name': '応神天皇', 'label': 'Person'}
{'name': '37代', 'label': 'Thing'}
{'name': '斉明天皇', 'label': 'Thing'}
{'name': '35代', 'label': 'Thing'}
{'name': '皇極天皇', 'label': 'Thing'}


{'name': '宮内庁', 'label': 'Organization'}
{'name': '東宮職', 'label': 'Thing'}
{'name': '東宮侍従', 'label': 'Thing'}
{'name': '東宮大夫', 'label': 'Thing'}
{'name': '宮内庁', 'label': 'Organization'}
{'name': '上皇職', 'label': 'Thing'}
{'name': '宮内庁', 'label': 'Organization'}
{'name': '皇嗣職', 'label': 'Thing'}
{'name': '皇宮警察本部', 'label': 'Organization'}
{'name': '皇宮護衛官', 'label': 'Thing'}
{'name': '菊栄親睦会', 'label': 'Thing'}
{'name': '霞会館', 'label': 'Organization'}
{'name': '内大臣府', 'label': 'Organization'}
{'name': '帝室博物館', 'label': 'Organization'}
{'name': '帝室林野局', 'label': 'Organization'}
{'name': 'お召し列車', 'label': 'Thing'}
{'name': '皇室用客車', 'label': 'Thing'}
{'name': '御車', 'label': 'Thing'}
{'name': '御料車', 'label': 'Thing'}
{'name': '日産', 'label': 'Organization'}
{'name': 'トヨタ・センチュリーロイヤル', 'label': 'Thing'}
{'name': '泉涌寺', 'label': 'Thing'}
{'name': '皇居外苑', 'label': 'Area'}
{'name': '菊花紋章', 'label': 'Thing'}
{'name': '学校法人学習院', 'label': 'Thing'}
{'name': '天皇陛下万歳', 'label': 'Thing'}
{'name': '明治神宮', '

In [None]:
import CaboCha
cabocha = CaboCha.Parser()

for sentence in lines:
    print(sentence)
#     tree = cabocha.parse(sentence)
#     print(tree.toString(CaboCha.CABOCHA_FORMAT_TREE))
#     break
