# 第12章 好き嫌い分類に基づく評価指標

# テストデータと推薦リスト

# 準備

In [1]:
import numpy as np

# テストデータ
R = np.array([
              [5, 4,      3, np.nan, 5, 4,      2,      2,      np.nan, np.nan],
])
U = np.arange(R.shape[0])
I = np.arange(R.shape[1])
Iu = [I[~np.isnan(R)[u,:]] for u in U]

# 推薦システムAによる推薦リスト
RA = np.array([
               [1, 6, 3, np.nan, 4, 2, 5, 7, np.nan, np.nan],
])

# 推薦システムBによる推薦リスト
RB = np.array([
               [4, 3, 1, np.nan, 6, 7, 2, 5, np.nan, np.nan],
])

# 混同行列

## 01 好きなアイテムか否かの判定
## 02 推薦されたアイテムか否かの判定
## 03 好きなアイテムが推薦された数（TP）
## 04 好きなアイテムが推薦されなかった数（FN）
## 05 嫌いなアイテムが推薦された数（FP）
## 06 嫌いなアイテムが推薦されなかった数（TN）

In [2]:
def confusion_matrix(u, RS, K):
    """
    ユーザu向け推薦リストRSの上位K件における混同行列の各値を返す。

    Parameters
    ----------
    u : int
        ユーザuのID
    RS : ndarray
        推薦リストRS
    K : int
        上位K件

    Returns
    -------
    int
        TP
    int
        FN
    int
        FP
    int
        TN
    """
    like = R[u, Iu[u]] >= 4
    print('like = {}'.format(like))
    recommended = np.argsort(RS[u, Iu[u]])[::-1] >= K
    print('recommended@{} = {}'.format(K, recommended))
    TP = np.count_nonzero(np.logical_and(like, recommended))
    print('TP@{} = {}'.format(K, TP))
    FN = np.count_nonzero(np.logical_and(like, ~recommended))
    print('FN@{} = {}'.format(K, FN))
    FP = np.count_nonzero(np.logical_and(~like, ~recommended))
    print('FP@{} = {}'.format(K, FP))
    TN = np.count_nonzero(np.logical_and(~like, recommended))
    print('TN@{} = {}'.format(K, TN))
    return TP, FN, FP, TN

In [3]:
u = 0
K = 3
TP, FN, FP, TN = confusion_matrix(u, RA, K)
print('混同行列 = \n{}'.format(np.array([[TP, FN], [FP, TN]])))

like = [ True  True False  True  True False False]
recommended@3 = [ True False  True  True False  True False]
TP@3 = 2
FN@3 = 2
FP@3 = 1
TN@3 = 2
混同行列 = 
[[2 2]
 [1 2]]


# 真陽性率と偽陽性率

## 07 真陽性率（TPR）
## 08 偽陽性率（FPR）

In [4]:
TPR = TP / (TP + FN)
print('TPR@{} = {:.3f}'.format(K, TPR))
FPR = FP / (FP + TN)
print('FPR@{} = {:.3f}'.format(K, FPR))

TPR@3 = 0.500
FPR@3 = 0.333


# 適合率と再現率

## 09 適合率
## 10 再現率
## 11 F値

In [5]:
precision = TP / (TP + FP)
print('precision@{} = {:.3f}'.format(K, precision))
recall = TP / (TP + FN)
print('recall@{} = {:.3f}'.format(K, recall))
F1 = 2 * precision * recall / (precision + recall)
print('F1@{} = {:.3f}'.format(K, F1))

precision@3 = 0.667
recall@3 = 0.500
F1@3 = 0.571
