In [1]:
import CaboCha

In [10]:
cp = CaboCha.Parser()
sentence = 'それに伴い，人間が対象の単文を読んだ際に感じた感情が正の感情（ポジティブ）であったか負の感情（ネガティブ）であったかを７段階の尺度を持ったアンケートにより評価値として抽出し，提案手法によって得られた値との比較を行ったが，ある一つの単語に文全体の感情評価値が依存するため，そぐわない結果が得られることも少なくなかった．'

In [11]:
print(cp.parseToString(sentence))

                          それに-D                                                                    
                            伴い，-----------D                                                        
                              人間が-----D   |                                                        
                                対象の-D |   |                                                        
                                  単文を-D   |                                                        
                                    読んだ-D |                                                        
                                        際に-D                                                        
                                        感じた-D                                                      
                                          感情が-------------D                                        
                                              正の-D         |                                       

In [4]:
result_tree = cp.parse(sentence)

In [5]:
print(result_tree.toString(CaboCha.FORMAT_LATTICE))

* 0 1D 0/1 1.268190
それ	名詞,代名詞,一般,*,*,*,それ,ソレ,ソレ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
* 1 7D 0/0 0.442321
伴い	動詞,自立,*,*,五段・ワ行促音便,連用形,伴う,トモナイ,トモナイ
，	記号,読点,*,*,*,*,，,，,，
* 2 5D 0/1 1.115938
人間	名詞,一般,*,*,*,*,人間,ニンゲン,ニンゲン
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ
* 3 4D 0/1 1.696456
対象	名詞,一般,*,*,*,*,対象,タイショウ,タイショー
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 4 5D 0/1 1.548083
単文	名詞,一般,*,*,*,*,単文,タンブン,タンブン
を	助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
* 5 6D 0/1 2.229331
読ん	動詞,自立,*,*,五段・マ行,連用タ接続,読む,ヨン,ヨン
だ	助動詞,*,*,*,特殊・タ,基本形,だ,ダ,ダ
* 6 7D 0/1 1.159390
際	名詞,非自立,副詞可能,*,*,*,際,サイ,サイ
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
* 7 8D 0/1 1.432506
感じ	動詞,自立,*,*,一段,連用形,感じる,カンジ,カンジ
た	助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
* 8 15D 0/1 0.836666
感情	名詞,一般,*,*,*,*,感情,カンジョウ,カンジョー
が	助詞,格助詞,一般,*,*,*,が,ガ,ガ
* 9 10D 0/1 1.008613
正	名詞,一般,*,*,*,*,正,セイ,セイ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
* 10 11D 0/0 0.853918
感情	名詞,一般,*,*,*,*,感情,カンジョウ,カンジョー
* 11 12D 7/7 1.253145
（	記号,括弧開,*,*,*,*,（,（,（
ポジティブ	名詞,形容動詞語幹,*,*,*,*,ポジティブ,ポジティブ,ポジティブ
）	記号,括弧閉,*,*,*,*,）,）,）
で	助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デ
あっ	助動詞,*,*,*,五段・ラ行アル,連用タ接続,ある,アッ,アッ
た	助動詞,*,*,*,特殊・タ,基本形

In [6]:
cp = CaboCha.Parser()
sentence = '猫は道路を渡る犬を見た。'
tree = cp.parse(sentence)

for i in range(tree.size()):
    tok = tree.token(i)
    print('品詞:', tok.feature)
    print('表層形:', tok.surface)
    print('-' * 40)

品詞: 名詞,一般,*,*,*,*,猫,ネコ,ネコ
表層形: 猫
----------------------------------------
品詞: 助詞,係助詞,*,*,*,*,は,ハ,ワ
表層形: は
----------------------------------------
品詞: 名詞,一般,*,*,*,*,道路,ドウロ,ドーロ
表層形: 道路
----------------------------------------
品詞: 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
表層形: を
----------------------------------------
品詞: 動詞,自立,*,*,五段・ラ行,基本形,渡る,ワタル,ワタル
表層形: 渡る
----------------------------------------
品詞: 名詞,一般,*,*,*,*,犬,イヌ,イヌ
表層形: 犬
----------------------------------------
品詞: 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
表層形: を
----------------------------------------
品詞: 動詞,自立,*,*,一段,連用形,見る,ミ,ミ
表層形: 見
----------------------------------------
品詞: 助動詞,*,*,*,特殊・タ,基本形,た,タ,タ
表層形: た
----------------------------------------
品詞: 記号,句点,*,*,*,*,。,。,。
表層形: 。
----------------------------------------


In [7]:
def gen_chunks(tree):
    """
    構文木treeからチャンクの辞書を生成する
    """
    chunks = {}
    key = 0  # intにしているがこれはChunk.linkの値で辿れるようにしている

    for i in range(tree.size()):  # ツリーのサイズだけ回す
        tok = tree.token(i)  # トークンを得る
        if tok.chunk:  # トークンがチャンクを持っていたら
            chunks[key] = tok.chunk  # チャンクを辞書に追加する
            key += 1

    return chunks


def get_surface(tree, chunk):
    """
    chunkからtree内のトークンを得て、そのトークンが持つ表層形を取得する
    """
    surface = ''
    beg = chunk.token_pos  # このチャンクのツリー内のトークンの位置
    end = chunk.token_pos + chunk.token_size  # トークン列のサイズ

    for i in range(beg, end):
        token = tree.token(i)
        surface += token.surface  # 表層形の取得

    return surface


def main():
    sentence = '熱帯低気圧として日本列島に直接の影響がない場合でも、湿った空気を送り込むことで、雨雲を発達させるケースもあります。'

    cp = CaboCha.Parser()  # パーサーを得る
    tree = cp.parse(sentence)  # 入力から構文木を生成
    print(tree.toString(CaboCha.FORMAT_TREE))  # デバッグ用

    chunks = gen_chunks(tree)  # チャンクの辞書を生成する

    for from_chunk in chunks.values():
        if from_chunk.link < 0:
            continue  # リンクのないチャンクは飛ばす

        # このチャンクの表層形を取得
        from_surface = get_surface(tree, from_chunk)

        # from_chunkがリンクしているチャンクを取得
        to_chunk = chunks[from_chunk.link]
        to_surface = get_surface(tree, to_chunk)

        # 出力
        print(from_surface, '->', to_surface)


main()

熱帯低気圧として-------------------------D
        日本列島に-----D                 |
              直接の-D |                 |
                影響が-D                 |
                    ない-D               |
                場合でも、---------------D
                      湿った-D           |
                        空気を-D         |
                        送り込む-D       |
                          ことで、-------D
                              雨雲を-D   |
                            発達させる-D |
                                ケースも-D
                                あります。
EOS

熱帯低気圧として -> あります。
日本列島に -> ない
直接の -> 影響が
影響が -> ない
ない -> 場合でも、
場合でも、 -> あります。
湿った -> 空気を
空気を -> 送り込む
送り込む -> ことで、
ことで、 -> あります。
雨雲を -> 発達させる
発達させる -> ケースも
ケースも -> あります。
