PIXTA や Adobe Stock などのストック系サイトで売れそうな素材のキーワードを抽出する
Python version 3 以上
MySQL 5.7 以上
-
Mecab のインストール
$ brew install macab
-
swig のインストール
$ brew install swig
-
必要パッケージのインストール
$ pip install mysql-connector-python joblib beautifulsoup4 mecab-python3==0.7
- ※最新版だと parseToNode に不具合があるため古いバージョンを指定
-
mecab-ipadic-neologd のインストール
$ git clone --depth 1 git@github.com:neologd/mecab-ipadic-neologd.git $ cd mecab-ipadic-neologd $ ./bin/install-mecab-ipadic-neologd -n
- 詳細はこちら
-
マイグレーション
$ echo 'create database scraping;' | mysql -uroot -p $ mysql -uroot -p < migrations.sql
$ ./main.py
- スクレイピングデータ
scraping.scraping
- 形態素解析データ
scraping.keywords