形態素解析後の日本語の文のリストからストップワードを除去するためのモジュールです。 作者が使っていたプログラムをなんとなくpipに登録しただけですので、適当に使ってください。 ご意見はご要望はこのパッケージのgithubかhttps://pickerlab.net/2020/12/26/ja_stopword_remover/のコメント欄までお願いします。
I registered a program on PyPI to share with all of you a program for eliminating stopwords from a list of documents that have undergone morphological analysis, represented as a list.
The words for each part-of-speech to be deleted were selected by referring to wikipedia, ミエルカAI-日本語ストップワードの考察【品詞別】, and slothlib (30~50 for each part-of-speech)
Please refer to the author's blog below for detailed usage instructions.