In [1]:
import world
import utils

import Procedure
# ==============================
utils.set_seed(world.seed)
print(">>SEED:", world.seed)
# ==============================
import register
from register import dataset
import numpy as np


print(f"Current model: {world.model_name}")
item_freq = np.array(dataset.UserItemNet.sum(axis=0)).squeeze()
world.pscore = np.maximum((item_freq / item_freq.max()) ** 0.5, 10e-3)

Recmodel = register.MODELS[world.model_name](world.config, dataset)
Recmodel = Recmodel.to(world.device)

# init tensorboard
Procedure.Test(dataset, Recmodel)


>>SEED: 2020
[0;30;43mloading [../data/yelp2018][0m
25668 training users, 3000 valid users, 3000 test users, 38048 items
1265341 interactions for training
28311 interactions for validation
28675 interactions for testing
yelp2018 is ready to go
{'alpha': 1.0,
 'beta': 0.5,
 'dataset': 'yelp2018',
 'diag_const': True,
 'drop_p': 0.0,
 'gpu': -1,
 'model': 'EASE',
 'multicore': 0,
 'parallel': False,
 'reg_p': 100.0,
 'relax': True,
 'relax_type': 'relative',
 'seed': 2020,
 'testbatch': 4096,
 'topks': '[20, 100]',
 'xi': 0.0}
cores for test: 4
Test Topks: [20, 100]
Current model: EASE


MemoryError: Unable to allocate 10.8 GiB for an array with shape (38048, 38048) and data type float64

In [4]:
# Jupyter Notebook의 새 코드 셀

# 1. 각 행렬을 새로운 변수에 할당하여 쉽게 접근합니다.
train_matrix = dataset.UserItemNet
valid_matrix = dataset.validUserItemNet
test_matrix = dataset.testUserItemNet

# 2. 각 행렬의 기본 정보를 출력합니다.
#    (사용자 수, 아이템 수), 저장된 상호작용 개수, 데이터 타입 등이 출력됩니다.
print("--- Training Matrix Info ---")
print(train_matrix)
print("\n--- Validation Matrix Info ---")
print(valid_matrix)
print("\n--- Test Matrix Info ---")
print(test_matrix)

# 3. 특정 유저의 상호작용 기록을 직접 확인해보기 (예: 0번 유저)
#    희소 행렬이므로, 상호작용이 있는 아이템의 인덱스와 값(1)만 출력됩니다.
print("\n--- 0번 유저의 훈련 데이터 상호작용 ---")
user_0_interactions = train_matrix[0]
print(user_0_interactions)

# 4. 상호작용이 있는 아이템의 '인덱스'만 뽑아내기
#    .nonzero()는 0이 아닌 값의 인덱스를 반환합니다. [1]은 열(아이템) 인덱스를 의미합니다.
liked_item_indices = user_0_interactions.nonzero()[1]
print(f"\n0번 유저가 훈련 데이터에서 좋아한 아이템들의 인덱스:\n{liked_item_indices}")

# 5. (주의!) 작은 행렬의 경우, 눈으로 보기 쉽게 일반 행렬(numpy array)로 변환하기
#    ⚠️ 경고: 매우 큰 행렬(예: gowalla)에 이 코드를 실행하면 MemoryError가 발생할 수 있습니다!
#    0번 유저 한 명의 데이터만 변환하는 것은 안전합니다.
print("\n--- 0번 유저의 상호작용 기록 (dense array) ---")
user_0_dense = user_0_interactions.toarray()
print(user_0_dense)
# 출력 예시: [[0. 1. 0. ... 1. 0. 0.]]  (1로 표시된 부분이 상호작용이 있는 아이템)

--- Training Matrix Info ---
  (0, 1918)	1.0
  (0, 3075)	1.0
  (0, 31340)	1.0
  (0, 8229)	1.0
  (0, 23728)	1.0
  (0, 24146)	1.0
  (0, 10900)	1.0
  (0, 33789)	1.0
  (0, 34211)	1.0
  (0, 33916)	1.0
  (0, 1921)	1.0
  (0, 24085)	1.0
  (0, 33729)	1.0
  (0, 29251)	1.0
  (0, 8145)	1.0
  (0, 20886)	1.0
  (0, 33375)	1.0
  (0, 5528)	1.0
  (0, 27331)	1.0
  (0, 10864)	1.0
  (0, 33385)	1.0
  (0, 36702)	1.0
  (0, 17253)	1.0
  (1, 12666)	1.0
  (1, 102)	1.0
  :	:
  (25666, 10053)	1.0
  (25666, 524)	1.0
  (25666, 3683)	1.0
  (25666, 13012)	1.0
  (25667, 22484)	1.0
  (25667, 3229)	1.0
  (25667, 5957)	1.0
  (25667, 6231)	1.0
  (25667, 6610)	1.0
  (25667, 9554)	1.0
  (25667, 2384)	1.0
  (25667, 597)	1.0
  (25667, 15497)	1.0
  (25667, 5427)	1.0
  (25667, 4301)	1.0
  (25667, 22006)	1.0
  (25667, 6092)	1.0
  (25667, 14849)	1.0
  (25667, 5221)	1.0
  (25667, 10750)	1.0
  (25667, 27812)	1.0
  (25667, 12982)	1.0
  (25667, 36235)	1.0
  (25667, 5636)	1.0
  (25667, 3240)	1.0

--- Validation Matrix Info ---
  (0, 26