# 第11章 嗜好予測の正確性
# テストデータと予測評価値

# 準備

In [1]:
import numpy as np

# テストデータ
R = np.array([
              [np.nan, 4,      np.nan, np.nan, np.nan, np.nan, 2,      np.nan, np.nan, np.nan],
              [np.nan, np.nan, np.nan, np.nan, 2,      np.nan, np.nan, np.nan, 5,      np.nan],
              [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, 3,      np.nan, np.nan],
])
U = np.arange(R.shape[0])
I = np.arange(R.shape[1])

# 推薦システムAによる予測評価値
RA = np.array([
               [np.nan, 2,      np.nan, np.nan, np.nan, np.nan, 2,      np.nan, np.nan, np.nan],
               [np.nan, np.nan, np.nan, np.nan, 2,      np.nan, np.nan, np.nan, 3,      np.nan],
               [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, 3,      np.nan, np.nan],
])

# 推薦システムBによる予測評価値
RB = np.array([
               [np.nan, 3,      np.nan, np.nan, np.nan, np.nan, 1,      np.nan, np.nan, np.nan],
               [np.nan, np.nan, np.nan, np.nan, 3,      np.nan, np.nan, np.nan, 4,      np.nan],
               [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, 4,      np.nan, np.nan],
])

# 平均絶対誤差

## 01 推薦システムAのMAE
## 02 推薦システムBのMAE

In [2]:
MAE_A = np.nansum(np.abs(RA - R)) / np.count_nonzero(R[~np.isnan(R)])
print('MAE_{} = {:.3f}'.format('A', MAE_A))
MAE_B = np.nansum(np.abs(RB - R)) / np.count_nonzero(R[~np.isnan(R)])
print('MAE_{} = {:.3f}'.format('B', MAE_B))

MAE_A = 0.800
MAE_B = 1.000


# 平均二乗誤差

## 03 推薦システムAのMSE
## 04 推薦システムBのMSE

In [3]:
MSE_A = np.nansum((RA - R)**2) / np.count_nonzero(R[~np.isnan(R)])
print('MSE_{} = {:.3f}'.format('A', MSE_A))
MSE_B = np.nansum((RB - R)**2) / np.count_nonzero(R[~np.isnan(R)])
print('MSE_{} = {:.3f}'.format('B', MSE_B))

MSE_A = 1.600
MSE_B = 1.000


# 二乗平均平方根誤差

## 05 推薦システムAのRMSE
## 06 推薦システムBのRMSE

In [4]:
RMSE_A = np.sqrt(np.nansum((RA - R)**2) / np.count_nonzero(R[~np.isnan(R)]))
print('RMSE_{} = {:.3f}'.format('A', RMSE_A))
RMSE_B = np.sqrt(np.nansum((RB - R)**2) / np.count_nonzero(R[~np.isnan(R)]))
print('RMSE_{} = {:.3f}'.format('B', RMSE_B))

RMSE_A = 1.265
RMSE_B = 1.000


# 正規化MAEと正規化RMSE

## 07 推薦システムAのNMAE
## 08 推薦システムBのNMAE
## 09 推薦システムAのNRMSE
## 10 推薦システムBのNRMSE

In [5]:
R_MAX = max(np.nanmax(R), np.nanmax(RA), np.nanmax(RB))
R_MIN = min(np.nanmin(R), np.nanmin(RA), np.nanmin(RB))

# NMAE
NMAE_A = MAE_A / (R_MAX - R_MIN)
print('NMAE_{} = {:.3f}'.format('A', NMAE_A))
NMAE_B = MAE_B / (R_MAX - R_MIN)
print('NMAE_{} = {:.3f}'.format('B', NMAE_B))

# NRMSE
NRMSE_A = RMSE_A / (R_MAX - R_MIN)
print('NRMSE_{} = {:.3f}'.format('A', NRMSE_A))
NRMSE_B = RMSE_B / (R_MAX - R_MIN)
print('NRMSE_{} = {:.3f}'.format('B', NRMSE_B))

NMAE_A = 0.200
NMAE_B = 0.250
NRMSE_A = 0.316
NRMSE_B = 0.250
