# レコメンデーションにおける評価指標

## MAP@K(Mean Average Precision @ K)

$$
\large MAP@K=\frac{1}{N}\sum_{i=1}^{N}\left(\frac{1}{min(m_{i},K)}\sum_{k=1}^{K}P_{i}(k)\right)
$$

$m_{i}:$ レコード $i$ に属しているクラスの数。

$P_{i}(k):$ 1~ $K$ までで予測する順位 $k$ (順に予測していく)の予測値で計算される精度。正解である場合のみ値をとり、そうでなければ0とする。

・各レコードが1つまたは複数のクラスに属している時に、属している可能性が高いと予測する順に任意の数$k$個のクラスを予測値とする。

In [1]:
import numpy as np


K = 3

# レコード数５，クラスは４
y_true = [[1, 2], [1, 2], [4], [1, 2, 3, 4], [3, 4]]
# k=3なので３個ずつ。(もしくはそれ以下)
# 正解の数が収まっていても順位に誤りがあれば、スコアは下がる
y_pred = [[1, 2, 4], [4, 1, 2], [1, 4, 3], [1, 2, 3], [1, 2, 4]]


def apk(y_i_true, y_i_pred):
    # 上記の条件を定義
    assert (len(y_i_pred) <= K)
    assert (len(np.unique(y_i_pred) == len(y_i_pred)))
    
    sum_precision = 0.0
    num_hits = 0.0

    for i, p in enumerate(y_i_pred):
        if p in y_i_true:
            num_hits += 1
            precision = num_hits / (i + 1)
            sum_precision += precision
            
    return sum_precision / min(len(y_i_true), K)


def mapk(y_true, y_pred):
    return np.mean([apk(y_i_true, y_i_pred) for y_i_true, y_i_pred in zip(y_true, y_pred)])

print(mapk(y_true, y_pred))

# 正解の数が収まっていても順位に誤りがあれば、スコアは下がる
print(apk(y_true[0], y_pred[0]))
print(apk(y_true[1], y_pred[1]))

0.6499999999999999
1.0
0.5833333333333333
