アプリのURL: https://the-pelican.herokuapp.com
※ サーバー代の都合で、最新記事の取り込みのcronは止めているため、記事はアップデートされていません。
- 使用したライブラリ・フレームワーク
- アプリデモと仕様紹介
- 関連記事を算出する仕組み
- 表示高速化の工夫
- Ruby on Rails 4.2.0
- PostgreSQL
- Sass
- Bootstrap
- MeCab
- 形態素解析エンジン
- natto
- RubyとMeCabをつなぐインタフェース
- nokogiri
- スクレイピング用ライブラリ
- whenever
- cron jobsをシンプルに書くためのライブラリ
- (参考)選定されたRSSのURL一覧はgithub上のソースコードはこちら https://github.com/shunsuke227ono/pelican/blob/master/config/settings.yml
- (参考)リソース選定をしたgithub上のイシューはこちら
- バッチ処理のgithub上のソースコードはこちら
- cron設定のgithub上のソースコードはこちら
- 形態素解析のgithub上のソースコードはこちら
- tf-idf法計算メソッドを持ったクラスと、本文に対してtf-idf法を行っているバッチ処理を実装したソースコードはこちら
- コサイン距離測定はtf-idfクラス内のインスタンスメソッドで行い、それをバッチ処理中で使用する。github上のソースコードはこちら。