Ver.
PyGeoNLP は、普通の日本語テキスト(自然文)を解析し、地名部分を抽出する geotagger や geoparser と呼ばれるツールです。
次の例のように、文中の地名(「目黒駅」「品川区」)を pygeonlp_terms_geoword
として認識し、それぞれのクラス (「鉄道施設/鉄道駅」「市区町村」)や経緯度などを付与することができます。
% echo "目黒駅は品川区にあります。" | pygeonlp geoparse
目黒駅 名詞,固有名詞,地名語,Xy26iV:目黒駅,*,*,目黒駅,, 鉄道施設/鉄道駅,Xy26iV, 目黒駅,139.71566,35.632485
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
品川区 名詞,固有名詞,地名語,kEAYBl:品川区,*,*,品川区,, 市区町村,kEAYBl,品川区,139.73025000,35.60906600
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
あり 動詞,自立,*,*,連用形,五段・ラ行,ある,アリ,アリ
ます 助動詞,*,*,*,基本形,特殊・マス,ます,マス,マス
。 記号,句点,*,*,*,*,。,。,。
EOS
overview.rst install.rst cli.rst quick_start.rst link_neologd.rst link_jageocoder.rst webapi/index.rst tuning.rst create_dictionary.rst advanced.rst terms.rst json/index.rst envvars.rst
api/pygeonlp.api.rst api/pygeonlp.webapi.rst