Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

consideration of parse process #42

Open
meokz opened this issue Mar 4, 2021 · 0 comments
Open

consideration of parse process #42

meokz opened this issue Mar 4, 2021 · 0 comments

Comments

@meokz
Copy link

meokz commented Mar 4, 2021

問題

以下のような入力ケースで、顔文字の中にスペースが存在するため、パースができない不具合がある (jumanpp 2.0.0-rc3)

こんにちは(^ ^)
こんにちは こんにちは こんにちは 感動詞 12 * 0 * 0 * 0 "代表表記:こんにちは/こんにちは"
(^ ^) (^ ^) (^ ^) 特殊 1 記号 5 * 0 * 0 "代表表記:顔文字/顔文字 顔文字"
EOS

解決策1

  • \t の入力を想定せず簡易な実装に留める場合はjumanppのプロセスを呼び出す際に -s 1 オプションを付与する。

解決策2

  • protobuf出力でjumanppがビルドされているとき、protobuf経由でパースする、
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant