勉強用に作った検索エンジン。やったことは以下のとおり。
- Webクローラの構築
- Mecabで日本語の形態素解析
- 検索エンジンの構築
- データをMongoDBに格納
- FlaskでWebアプリ作成
詳しくはブログのほうに書きます(c-bata web)。
- Python 2.7
- pip
- MeCab
-
Clone repository
$ git clone git@github.com:mejiro/SearchEngine.git -
Install Mecab
$ # MeCab $ brew install mecab mecab-ipadic $ # Python binding $ wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz $ workon search_engine $ pip install mecab-python-0.996.tar.gz # これでいれれる! $ rm mecab-python-0.996.tar.gz -
Install python packages
$ cd SearchEngine $ pip install -r requirements.txt -
MongoDB settings
Please rewrite MONGO_URL in settings.py
-
Run
$ python run-crawler.py # build a index $ python run-webapp.py # access to http://127.0.0.1:5000
