# 行列分解に基づく推薦システム

## Matrix Factorization

[Matrix Factorization: A Simple Tutorial and Implementation in Python @ quuxlabs](http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-and-implementation-in-python/)


## その他の行列分解による推薦

- [行列分解によるレコメンドを整理する #1\~特異値分解によるレコメンド~ #機械学習 - Qiita](https://qiita.com/yo_fuji/items/56a22c9829d40ce7a3ff)

## ALS

**ALS（Alternating Least Squares）**

[Alternating Least Square (ALS) でCP分解 - でかいチーズをベーグルする](https://yamaguchiyuto.hatenablog.com/entry/2016/11/12/100000)


### iALS

**iALS（Implicit Alternating Least Squares）** はALSの応用的な位置付けのモデル。

通常のALSはユーザーがアイテムに対して明示的な評価を与える場合を想定している。iALSはユーザーの行動履歴などの暗黙的なフィードバック（例：クリック、閲覧、購入履歴など）を扱う。

[iALSの論文実装と評価〜推薦システムの手法〜 #Python - Qiita](https://qiita.com/yuwewe/items/ae8dc816f2531df404ff)

## ライブラリ

[Surprise · A Python scikit for recommender systems.](https://surpriselib.com/)

- 主に行列分解系を中心に扱っているライブラリ

In [3]:
import time
import pandas as pd
import numpy as np
from surprise import Dataset, Reader, accuracy
from surprise.model_selection import train_test_split
from surprise import SVD, NMF

In [4]:
# data_ml_100k = Dataset.load_builtin(name=u'ml-100k', prompt=False)
# data_ml_100k

Trying to download dataset from https://files.grouplens.org/datasets/movielens/ml-100k.zip...
Done! Dataset ml-100k has been saved to /root/.surprise_data/ml-100k


<surprise.dataset.DatasetAutoFolds at 0x7fa71c03bcd0>

In [7]:
ML100K_URL = 'http://files.grouplens.org/datasets/movielens/ml-100k/u.data'
df = pd.read_csv(ML100K_URL, names=["userid", "itemid", "rating", "timestamp"], sep="\t")
df.tail()

Unnamed: 0,userid,itemid,rating,timestamp
99995,880,476,3,880175444
99996,716,204,5,879795543
99997,276,1090,1,874795795
99998,13,225,2,882399156
99999,12,203,3,879959583


In [8]:
reader = Reader(rating_scale=(1, 5))
data = Dataset.load_from_df(df_custom[["userid", "itemid", "rating"]], reader)

In [10]:
trainset, testset = train_test_split(data_custom, test_size=.2)

In [14]:
algo = SVD()
algo.fit(trainset)
pred = algo.test(testset)
_ = accuracy.rmse(pred),accuracy.mse(pred),accuracy.mae(pred),accuracy.fcp(pred)

RMSE: 0.9338
MSE: 0.8720
MAE:  0.7378
FCP:  0.7007


## 参考文献

- [行列分解  |  Machine Learning  |  Google for Developers](https://developers.google.com/machine-learning/recommendation/collaborative/matrix?hl=ja)
- [Matrix Factorization(MF) - アルゴリズム解説](https://blog.octopt.com/matrix-factorization/)