イオリンの生配信ワードクラウド作成用スクリプトと辞書、マスク画像。
主にyaegaki/pteraroronで取得したコメントを対象とする。
pip install wordcloud
なんとかしてMeCabをインストールします。
必要な人は作成してインストールしてください。
既にビルド済みのものがdotlive.dic
として入っていますが新しく追加する場合は以下のコマンドを実行します。
# WSLでMeCabをインストールしたときのサンプル
/usr/lib/mecab/mecab-dict-index -d /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd -u dotlive.dic -f utf-8 -t utf-8 dotlive_dic.csv
ワードクラウド用のフォントを取得します。
基本的にはなんでもいいですが、サンプルではフリーの源柔ゴシック を使用させていただいています。
どのような手段でもいいのでコメントを取得します。
取得したコメントを記載したファイルをlivechat
ディレクトリに配置してください。
# font_path: 取得したフォントのパス
python main.py font_path
livechat
ディレクトリのファイルをパースしてoutput
ディレクトリにワードクラウドを保存します。
ストップワードを最小限にしたものです。
すべての配信で共通するような頻出ワードがでかくなっています。
すべての配信で共通するような頻出ワードをストップワードに指定したものです。
その配信独特のワードがでかくなっています。