jubatus ハッカソンにて作成したもの ユーザに興味なさそうなニュースも読ませたかった
なお、提供いただいた読売新聞の記事データは勝手に公開できないものと思われるので、 残念ながらこのプログラムを動かすのは難しい (スクレイプしたデータを追加できるので全く無理ではない)
jubatusを使って記事の付いているジャンルの推定を行うモデルを作成
現在読んでいる記事に対してジャンル推定を行った際もっともスコアの低い予測ラベルをジャンルとして持つ記事を推薦
コンソール上で動作するのでブラウザバックなどもできず出された記事を読むしかない
見出しを10件表示して、その中からユーザが選択できるよになっているので 一見自らの意思で選択しているように思えるが、実は選ばされている
コンソール上で動くので仕事しているふりをしながら新聞が読めます。
- genre_classify.py
- 記事を読むためのプログラム
- 最初に日付降順でソートしたもの上位10件から一つ選択させられる
- その後は選択した記事からスコアの低いラベルを持ってきてそれに属する記事を日付順でソートしたものから選択を繰り返す
- get_url.py
- 読売新聞新着記事urlリストを取得します。
- add_data.py
- urlを入力するとその記事に関する情報が登録されgenre_classify.pyで読めるようになる
- genre_classifyでは選択肢の幅が狭いので積ん読もすくなくなるね!
- get_url.pyで取得したものを入れるといいです(連携させずにあえて苦労してもらってます)