python-asa2prolog

Description

ASAの解析結果をPrologの木構造に変換する

Contribution

必ずPR投げてください。

環境構築

(1)前準備

以下事前インストールが必要。

Python >=3.6.8
Mecab
Cabocha
Graphviz
python_asa
- パッケージの依存関係に含めたいが、不具合のため暫定対応

(2)asa2prolog

以下コマンドでasa2prologが使用可能。

$ pip install -e git+https://github.com/takenl2021/python-asa2prolog#egg=asa2prolog

下記依存関係(setup.pyに記載)も自動でインストールされる。

mecab-python3
cabocha-python
graphviz

mecab-python3及びcabocha-pythonは本来python_asaの依存関係であるため修正が必要。

依存関係として、python_asaも必要となるが、setup.py経由でインストールするとフォルダの一部が消滅する不具合を確認したため、別途インストールとする(暫定)。

(3)requirements.txt

requirements.txtはあくまでも、main.pyで例を確認するために必要な依存関係であることに注意する。asa2prologパッケージの依存関係自体は上記の通りsetup.pyに記述している。

asa2prolog.converter.Converter

以下、コンバータのインターフェース

メソッド	説明	引数	戻り値
set_sentences()	生テキストのセット	引数１[string]: 生のテキスト	void
load_sentences()	ファイルからテキストのロード	引数１[string]: ファイルパス	void
get_sentences()	セットされているテキストリスト取得	None	string[]
convert()	一文をコンバート	引数１[string]: 生のテキスト	{ 'predicates': string(一文に対するProlog述語), 'dot_string': string(DOT), 'asa_json': dict(ASAの出力JSON) }
convert_all()	ロードされている全文をコンバート	None	{ 'predicates': string(一文に対するProlog述語), 'dot_string': string(DOT), 'asa_json': dict(ASAの出力JSON) }[]

対応述語

以下、生成されるProlog述語一覧

述語名	引数１	引数２	引数３
chunk( _ , _ , _ )	文番号	0固定	chunkノード番号
morph( _ , _ , _ )	文番号	親chunkノード番号	morphノード番号
main( _ , _ , _ )	文番号	親chunkノード番号	親chunkの主形態素の表層
part( _ , _ , _ )	文番号	親chunkノード番号	親chunkの副形態素の表層
role( _ , _ , _ )	文番号	親chunkノード番号	親chunkの意味役割の表層
semantic( _ , _ , _ )	文番号	親chunkノード番号	親chunkの概念の表層
surf( _ , _ , _ )	文番号	0/chunk/morphノード番号	ノードの表層
surfBF( _ , _ , _ )	文番号	morphノード番号	親morphノードの表層の基本形
sloc( _ , _ , _ )	文番号	chunk/morphノード番号	ノードの表層のsloc
pos( _ , _ , _ )	文番号	morphノード番号	親morphノードの表層の品詞
dep( _ , _ , _ )	文番号	chunkノード番号	引数２に係るchunkノード番号

ルールの設定

使用したいルールをあらかじめ定義しておくことで、解探索の際にそのルールを使用することができる。

config/rules.plの形式で保持しておく。

ルールのロード/使用はmain.pyに例あり。

探索結果の整形

探索結果はdefaultdict形式で返る。dictにすると以下の形式。

(例) クエリ something(X,Y,Z)を実行したとする

{
  'X': [一番目の解のX, 二番目の解のX, 三番目の解のX, ...],
  'Y': [一番目の解のY, 二番目の解のY, 三番目の解のY, ...],
  'Z': [一番目の解のZ, 二番目の解のZ, 三番目の解のZ, ...],
}

この形式だと処理しにくいため、

[
  [一番目の解のX, 二番目の解のX, 三番目の解のX, ...],
  [一番目の解のY, 二番目の解のY, 三番目の解のY, ...],
  [一番目の解のZ, 二番目の解のZ, 三番目の解のZ, ...],
]

上記のように二次元配列化後に転置、辞書化する例をmain.pyに記載した。整形後は以下の形式。

[
  {
    'X': 一番目の解のX,
    'Y': 一番目の解のY,
    'Z': 一番目の解のZ,
  },
  {
    'X': 二番目の解のX,
    'Y': 二番目の解のY,
    'Z': 二番目の解のZ,
  },
  {
    'X': 三番目の解のX,
    'Y': 三番目の解のY,
    'Z': 三番目の解のZ,
  },
  ...
]

もう少しうまく書けそうな気がするので、思い付けば共有お願いします。

Name		Name	Last commit message	Last commit date
Latest commit History 81 Commits
asa2prolog.egg-info		asa2prolog.egg-info
asa2prolog		asa2prolog
.gitignore		.gitignore
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

asa2prolog.egg-info

asa2prolog.egg-info

asa2prolog

asa2prolog

.gitignore

.gitignore

README.md

README.md

setup.py

setup.py

Repository files navigation

python-asa2prolog

Description

Contribution

環境構築

(1)前準備

(2)asa2prolog

(3)requirements.txt

asa2prolog.converter.Converter

対応述語

ルールの設定

探索結果の整形

About

Releases

Packages

Contributors 2

Languages

takenl2021/python-asa2prolog

Folders and files

Latest commit

History

Repository files navigation

python-asa2prolog

Description

Contribution

環境構築

(1)前準備

(2)asa2prolog

(3)requirements.txt

asa2prolog.converter.Converter

対応述語

ルールの設定

探索結果の整形

About

Resources

Stars

Watchers

Forks

Languages