Skip to content

fuwalab/popular-noun

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

popular-noun

概要

PIXTA や Adobe Stock などのストック系サイトで売れそうな素材のキーワードを抽出する

動作環境

Python version 3 以上
MySQL 5.7 以上

事前準備

  • Mecab のインストール

    $ brew install macab
    
  • swig のインストール

    $ brew install swig
    
  • 必要パッケージのインストール

    $ pip install mysql-connector-python joblib beautifulsoup4 mecab-python3==0.7
    
    • ※最新版だと parseToNode に不具合があるため古いバージョンを指定
  • mecab-ipadic-neologd のインストール

    $ git clone --depth 1 git@github.com:neologd/mecab-ipadic-neologd.git
    $ cd mecab-ipadic-neologd
    $ ./bin/install-mecab-ipadic-neologd -n
    
  • マイグレーション

    $ echo 'create database scraping;' | mysql -uroot -p
    $ mysql -uroot -p < migrations.sql
    

実行方法

$ ./main.py

データ

  • スクレイピングデータ
    • scraping.scraping
  • 形態素解析データ
    • scraping.keywords

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages