# とりあえず使ってみよう！

natto-py という MeCab バインディングを簡単に紹介します。

### 必要な環境

1. Python 2.7 あるいはそれ以上なもの
2. MeCab 0.996
3. 上記 MeCab 0.996 の利用可能なシステム辞書
   - mecab-ipadic
   - mecab-jumandic

### インストール

インストールするには `pip` を通して通常のパッケージと同様にインストールを行います。    
    
    pip install natto-py


### 設定

下記の条件さえ揃っていれば、特にあらかじめに設定する必要はなく、natto-py は自動的に mecab ライブラリーを特定し、バインディングをします。

- \*NIX と OSX の場合い、mecab および mecab-config を PATH に追加していること
- また Windows では、通常のインストーラーを使用して Windows Registry に `HKEY_CURRENT_USER\Software\MeCab` というキーが設定していること

万が一、mecab ライブラリーが見つからず `EnvironmentError` などが発生した場合、次の環境変数設定を行う必要があります。

- mecab システム辞書の charset を `MECAB_CHARSET` とする
- mecab ライブラリーのファイル名 を `MECAB_PATH` とする

### 基本の使い方

まずは `MeCab` のインスタンスを取得します。 `with` 文を利用して `natto-py` は自動的に `mecab_destroy` を呼んでくれます。

In [1]:
from natto import MeCab

with MeCab() as nm:
    print(nm)

<natto.mecab.MeCab pointer=<cdata 'mecab_t *' 0x00000000002FB8D0>, libpath="C:\Program Files (x86)\MeCab\bin\libmecab.dll", options={}, dicts=[<natto.dictionary.DictionaryInfo pointer=<cdata 'mecab_dictionary_info_t *' 0x0000000000315C10>, filepath="C:\Program Files (x86)\MeCab\dic\ipadic\sys.dic", charset=SHIFT-JIS, type=0>], version=0.996>


文字列を入力とし、解析を行います。

In [2]:
    print(nm.parse('この星の一等賞になりたいの卓球で俺は、そんだけ！'))

この	連体詞,*,*,*,*,*,この,コノ,コノ
星	名詞,一般,*,*,*,*,星,ホシ,ホシ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
一等	名詞,一般,*,*,*,*,一等,イットウ,イットー
賞	名詞,接尾,一般,*,*,*,賞,ショウ,ショー
に	助詞,格助詞,一般,*,*,*,に,ニ,ニ
なり	動詞,自立,*,*,五段・ラ行,連用形,なる,ナリ,ナリ
たい	助動詞,*,*,*,特殊・タイ,基本形,たい,タイ,タイ
の	助詞,連体化,*,*,*,*,の,ノ,ノ
卓球	名詞,サ変接続,*,*,*,*,卓球,タッキュウ,タッキュー
で	助詞,格助詞,一般,*,*,*,で,デ,デ
俺	名詞,代名詞,一般,*,*,*,俺,オレ,オレ
は	助詞,係助詞,*,*,*,*,は,ハ,ワ
、	記号,読点,*,*,*,*,、,、,、
そん	名詞,一般,*,*,*,*,そん,ソン,ソン
だけ	助詞,副助詞,*,*,*,*,だけ,ダケ,ダケ
！	記号,一般,*,*,*,*,！,！,！
EOS


### 出力フォーマットと `Generator` によるノードパーシング

テキストを解析する際に `Generator` を利用して効率的に各 `MeCabNode` を生成します。

In [3]:
    for n in nm.parse('飛べねえ鳥もいるってこった。', as_nodes=True):
        if n.is_nor():
            print('{}\t{}'.format(n.surface, n.cost))

飛べ	8101
ねえ	6416
鳥	12029
も	12540
いる	16477
って	20631
こっ	30320
た	29380
。	25946


また特定の出力フォーマットを指定して `Generator` を利用して各 `MeCabNode` を生成します。

In [4]:
with MeCab('-F%m\\t%h\\t%f[0,1]') as nm:
    for n in nm.parse('あんたはオイラに飛び方を教えてくれた。', as_nodes=True):
        if n.is_nor():
            print(n.feature)

あんた	59	名詞	代名詞
は	16	助詞	係助詞
オイラ	59	名詞	代名詞
に	13	助詞	格助詞
飛び	31	動詞	自立
方	57	名詞	接尾
を	13	助詞	格助詞
教え	31	動詞	自立
て	18	助詞	接続助詞
くれ	33	動詞	非自立
た	25	助動詞
。	7	記号	句点


以上。