Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

ユーザー辞書の活用 #2

Open
sadahry opened this issue Nov 8, 2022 · 0 comments
Open

ユーザー辞書の活用 #2

sadahry opened this issue Nov 8, 2022 · 0 comments
Labels

Comments

@sadahry
Copy link
Owner

sadahry commented Nov 8, 2022

ユーザー辞書の追加は可能だが、spaCyモデルの再学習が必要
(固有名詞の場合はその限りではない)

e.g. ユーザー辞書に副助詞「かも」を適用

% ginza -m ja_core_news_sm
そういうことかも
# text = そういうことかも
1       そう    そう    ADV     副詞    _       2       advmod  _       SpaceAfter=No|Reading=ソウ
2       いう    いう    VERB    動詞-一般       _       3       acl     _       SpaceAfter=No|Inf=五段-ワア行,連体形-一般|Reading=イウ
3       こと    こと    NOUN    名詞-普通名詞-一般      _       0       root    _       SpaceAfter=No|Reading=コト
4       かも    かも    ADP     助詞-副助詞     _       3       case    _       SpaceAfter=No|Reading=カモ

難しいのかも
# text = 難しいの
1       難しい  難しい  ADJ     形容詞-一般     _       0       root    _       SpaceAfter=No|Inf=形容詞,連体形-一般|Reading=ムズカシイ
2       の      の      ADP     助詞-準体助詞   _       1       case    _       SpaceAfter=No|Reading=ノ

# text = かも
1       かも    かも    PROPN   助詞-副助詞     _       0       root    _       SpaceAfter=No|Reading=カモ

ちょっと判断つかないかも
# text = ちょっと判断つかないかも
1       ちょっと        ちょっと        ADV     副詞    _       3       advmod  _       SpaceAfter=No|Reading=チョット
2       判断    判断    VERB    名詞-普通名詞-サ変可能  _       3       obl     _       SpaceAfter=No|Reading=ハンダン
3       つか    つく    VERB    動詞-非自立可能 _       0       root    _       SpaceAfter=No|Inf=五段-カ行,未然形-一般|Reading=ツカ
4       ない    ない    AUX     助動詞  _       3       aux     _       SpaceAfter=No|Inf=助動詞-ナイ,終止形-一般|Reading=ナイ
5       かも    かも    PART    助詞-副助詞     _       3       mark    _       SpaceAfter=No|Reading=カモ
@sadahry sadahry added the ja label Nov 8, 2022
This was referenced Nov 8, 2022
@sadahry sadahry mentioned this issue Nov 20, 2022
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

1 participant