In [6]:
import pandas as pd
import numpy as np
import scipy.sparse
from lightfm.data import Dataset
from lightfm import LightFM
from lightfm.evaluation import precision_at_k, auc_score
from sklearn.preprocessing import LabelEncoder

# ---------------------------------------------------------------------------------
# 1. 파일 경로 및 상수 정의
# ---------------------------------------------------------------------------------

FILE_PATH_MAIN = '[스트롱라이프]최종_데이터_20250924.xlsx'
FILE_PATH_META = "제품 메타데이터 최종.xlsx"
FILE_PATH_ALIGN = "uwellnow_product_align.xlsx" # 제품-맛 매핑 정보 파일

ITEM_ID_COL = 'product_id'
PROTEIN_COL = 'protein'
MAX_RANK_COUNT = 7

# Item Features 상수 (아이템 특징)
OHE_ITEM_COLS = ['ingredient_type', 'category', 'flavor', 'sensory_tags']
# User Features 상수 (사용자 특징) - 기존과 동일
OHE_USER_COLS = [
    '3) 성별', '8) 운동 활동 기간', '7) 프로틴, 프리워크아웃, 전해질 음료, 게이너 등 헬스 보충제 2종 이상을 섭취해 보신 경험이 있으신가요?', 
    '9) 주에 몇 회 정도 운동을 진행하시나요?(택1)', '10) 알러지 또는 민감성분(복수선택 가능)', '11) 평소 챙기는 끼니는 어떻게 되나요?(복수선택 가능)', 
    '12) 식사 기준으로 운동 시간은 언제인가요?(택 1)', '12-1) 일과(수업,업무,일 등) 기준으로 운동 시간은 언제인가요?(택 1)', 
    '12-2) 운동을 제외한 일과 중 활동은 어느 정도로 활발한가요?(택 1)', '12-3) 시간 기준으로 운동 시작 시간이 언제인가요?(택 1)',
    # Feature Group 2 (영향 요인 및 고려 항목)
    '13-3) 프로틴의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '13-4) 프로틴의 효과에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '13-5) 브랜드에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '13-6) 유명인(선수 또는 전문가)의 사용 여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '13-7) 지인의 사용여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)',
    '14-3) 프리워크아웃의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '14-4) 프리워크아웃의 효과에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '14-5) 브랜드에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '14-6) 유명인(선수 또는 전문가)의 사용 여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '14-7) 지인의 사용여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선수택 가능)',
    '15-3) 전해질 음료의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '15-4) 전해질 음료의 효과에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '15-5) 브랜드에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '15-6) 유명인(선수 또는 전문가)의 사용 여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '15-7) 지인의 사용여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)',
    '16-3) 게이너의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '16-4) 게이너의 효과에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '16-5) 브랜드에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '16-6) 유명인(선수 또는 전문가)의 사용 여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '16-7) 지인의 사용여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)',
    '17-3) 해당 보충제의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '17-4) 해당 보충제의 효과에서 고려한 점은 무엇인가요?', '17-5) 브랜드에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '17-6) 유명인(선수 또는 전문가)의 사용 여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)', '17-7) 지인의 사용여부 또는 추천에서 고려한 세부 항목을 선택해주세요 (복수선택 가능)',
]

# 상호작용 컬럼 정의
INTERACTION_WEIGHT_COLS = [
    ('13-9) [프로틴] 선택하신 제품중에 가장 종합적으로 마음에 들었던 제품 1개만 선택해주세요 (택 1)', '13-10) 마음에 들었던 제품이 어떤 맛인가요? (복수선택 가능)', '13-17) 해당 프로틴에 대한 재구매 의사는 어느 정도인가요?'),
    ('14-9) [프리워크아웃] 선택하신 제품중에 가장 종합적으로 마음에 들었던 제품 1개만 선택해주세요 (택 1)', '14-10) 마음에 들었던 제품이 어떤 맛인가요? (복수선택 가능)', '14-17) 해당 프리워크아웃에 대한 재구매 의사는 어느 정도인가요?'),
    ('15-9) [전해질 음료(BCAA, 이온음료)] 선택하신 제품중에 가장 종합적으로 마음에 들었던 제품 1개만 선택해주세요 (택 1)', '15-10) 마음에 들었던 제품이 어떤 맛인가요? (복수선택 가능)', '15-17) 해당 전해질 음료에 대한 재구매 의사는 어느 정도인가요?'),
    ('16-9) [게이너] 선택하신 제품중에 가장 종합적으로 마음에 들었던 제품 1개만 선택해주세요 (택 1)', '16-10) 마음에 들었던 제품이 어떤 맛인가요? (복수선택 가능)', '16-17) 해당 게이너에 대한 재구매 의사는 어느 정도인가요?'),
    ('17-9) 종합적으로 가장 마음에 들었던 제품 1개를 작성해 주세요', '17-10) 마음에 들었던 제품이 어떤 맛인가요?', '17-17) 해당 제품에 대한 재구매 의사는 어느 정도인가요?'),
]

RANKING_COLS_MAP = [
    ('13-2) 프로틴 선택 시 가장 영향을 많이 받은 요소들의 순위를 매겨주세요', '13-17) 해당 프로틴에 대한 재구매 의사는 어느 정도인가요?  ', 'PROTEIN', '13-3) 프로틴의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)'),
    ('14-2) 프리워크아웃 선택 시 가장 영향을 많이 받은 요소들의 순위를 매겨주세요', '14-17) 해당 프리워크아웃에 대한 재구매 의사는 어느 정도인가요?  ', 'PREWORKOUT', '14-3) 프리워크아웃의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)'),
    ('15-2) 전해질 음료(BCAA, 이온음료)선택 시 가장 영향을 많이 받은 요소들의 순위를 매겨주세요', '15-17) 해당 전해질 음료에 대한 재구매 의사는 어느 정도인가요?  ', 'ELECTROLYTE', '15-3) 전해질 음료의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)'),
    ('16-2) 게이너 선택 시 가장 영향을 많이 받은 요소들의 순위를 매겨주세요', '16-17) 해당 게이너에 대한 재구매 의사는 어느 정도인가요?  ', 'GAINER', '16-3) 게이너의 영양성분을 고려한 세부 항목을 선택해주세요 (복수선택 가능)')
]


# ---------------------------------------------------------------------------------
# 2. 필수 데이터 로드 함수 정의
# ---------------------------------------------------------------------------------

def load_and_concatenate_user_data(file_path):
    HEADER_ROW_INDEX = 0
    df_1st = pd.read_excel(file_path, sheet_name='1차', header=0)
    df_2nd = pd.read_excel(file_path, sheet_name='2차', header=0)
    df_1st.columns = df_1st.columns.astype(str).str.strip()
    df_2nd.columns = df_2nd.columns.astype(str).str.strip()
    
    col_to_rename = {c: 'user_id' for c in df_2nd.columns if isinstance(c, str) and c.strip().lower() in ('no.', 'no')}
    if col_to_rename:
        df_2nd.rename(columns=col_to_rename, inplace=True)
    
    # 1차 데이터의 'no' 컬럼 이름 정리
    if 'no' in df_1st.columns:
         df_1st.rename(columns={'no': 'user_id'}, inplace=True)

    df_user_raw = pd.concat([df_1st, df_2nd], ignore_index=True)
    # 최종 user_id 컬럼 이름 정리
    if 'no' in df_user_raw.columns and 'user_id' not in df_user_raw.columns:
        df_user_raw.rename(columns={'no': 'user_id'}, inplace=True)
        
    return df_user_raw.set_index('user_id', drop=False)


def clean_user_ids(df_user_raw):
    df_user_raw.index = df_user_raw.index.to_series().replace('nan', np.nan) 
    valid_user_ids_numeric = pd.to_numeric(df_user_raw.index, errors='coerce')
    # 유효한 인덱스 (숫자이며 0보다 큰 값)만 필터링
    valid_indices = df_user_raw.index[valid_user_ids_numeric.notna() & (valid_user_ids_numeric > 0)].unique()
    return df_user_raw.loc[valid_indices].copy()


# 순위의 역순으로 가중치를 부여하는 함수
def rank_to_weight(rank_value, max_rank=MAX_RANK_COUNT):
    rank_value = pd.to_numeric(rank_value, errors='coerce')
    if pd.isna(rank_value) or rank_value <= 0 or rank_value > max_rank:
        return np.nan
    # 1등이 가장 높은 가중치 (7), 7등이 가장 낮은 가중치 (1)
    return (max_rank + 1) - rank_value 


# ---------------------------------------------------------------------------------
# 3. 데이터 로드 및 매핑 딕셔너리 생성 (ITEM_FULL_ID_MAP 정의)
# ---------------------------------------------------------------------------------

# 3-1. User Data 로드
df_user_raw = load_and_concatenate_user_data(FILE_PATH_MAIN)
df_user_clean = clean_user_ids(df_user_raw)
    
# 3-2. Item Data 로드
df_item_raw = pd.read_excel(FILE_PATH_META, sheet_name='제품 메타데이터 최종', header=0)
    
# Item Data 컬럼 이름 클리닝
df_item_raw.columns = df_item_raw.columns.astype(str).str.strip().str.lower()
    
# OHE_ITEM_COLS를 소문자로 변경된 이름으로 사용
OHE_ITEM_COLS = [c.lower() for c in OHE_ITEM_COLS]
ITEM_ID_COL = 'product_id'
PROTEIN_COL = 'protein'
    
# 3-3. Item Mapping Data 로드 및 ITEM_FULL_ID_MAP 생성
df_align = pd.read_excel(FILE_PATH_ALIGN, header=0)
df_align.columns = df_align.columns.astype(str).str.strip()
    
df_align['MAPPING_KEY'] = (df_align['product'].astype(str).str.strip().str.upper() + 
                            '_' + 
                            df_align['flavor'].astype(str).str.strip().str.upper())

ITEM_FULL_ID_MAP = pd.Series(
    df_align['product_id'].astype(str).str.strip().str.upper().values,
    index=df_align['MAPPING_KEY']
).to_dict()
    
if 'NAN_NAN' in ITEM_FULL_ID_MAP:
    del ITEM_FULL_ID_MAP['NAN_NAN']
    
print("✅ 데이터 로드 및 매핑 딕셔너리 생성 완료.")
    
    
# ---------------------------------------------------------------------------------
# 4. Item 매핑 함수 정의 (ITEM_FULL_ID_MAP 생성 후 정의)
# ---------------------------------------------------------------------------------
    
def normalize_interaction_id(product_name_ac, flavor_ad, mapping_dict=ITEM_FULL_ID_MAP):
    """ 사용자 응답 (제품명과 맛)을 딕셔너리 키로 조합하여 정확한 product_id로 정규화합니다. """
    if not product_name_ac or not flavor_ad or not mapping_dict:
        return None 
        
    product_clean = str(product_name_ac).strip().upper()
    flavor_clean = str(flavor_ad).strip().upper()
    search_key = f"{product_clean}_{flavor_clean}"
        
    if search_key in mapping_dict:
        return mapping_dict[search_key]

    # 매핑되지 않은 경우, 임시로 결합된 이름 사용 (콜드 스타트 방지)
    combined_name = f"{product_clean}{flavor_clean}"
    return combined_name.replace(' ', '').replace('-', '').replace('.', '').replace('(', '').replace(')', '')


# df_user_clean의 인덱스 이름 정리 (오류 해결)
if df_user_clean.index.name == 'user_id':
    df_user_clean.index.name = None


# ---------------------------------------------------------------------------------
## 5단계: Item Feature (정량 포함) 전처리 및 강화 🚀
# ---------------------------------------------------------------------------------
    
df_item_raw[PROTEIN_COL] = pd.to_numeric(df_item_raw[PROTEIN_COL], errors='coerce')
df_item_raw.dropna(subset=[PROTEIN_COL, ITEM_ID_COL], inplace=True)

# 1. 단백질 함량 이산화 (Binning)
bins = [0, 15, 25, df_item_raw[PROTEIN_COL].max() + 1]
labels = ['protein_low', 'protein_mid', 'protein_high']
df_item_raw['protein_bin'] = pd.cut(df_item_raw[PROTEIN_COL], bins=bins, labels=labels, right=False)

# 2. 단백질 함량 로그 변환 (정량적 피처 강화)
df_item_raw['protein_log'] = np.log1p(df_item_raw[PROTEIN_COL])

# One-Hot Encoding 피처 생성
selected_ohe_cols = [c for c in OHE_ITEM_COLS + ['protein_bin'] if c in df_item_raw.columns]

df_item_features = df_item_raw.melt(
    id_vars=[ITEM_ID_COL], 
    value_vars=selected_ohe_cols
)
    
# 결측치(NaN)를 'NONE' 피처로 대체
df_item_features['value'] = df_item_features['value'].fillna('NONE') 

df_item_features['feature'] = df_item_features['variable'].astype(str) + '_' + df_item_features['value'].astype(str).str.strip()
df_item_features = df_item_features[[ITEM_ID_COL, 'feature']].drop_duplicates()

# 3. 로그 변환된 단백질 함량을 Item Feature Matrix에 추가 (가중치로 사용)
df_protein_log = df_item_raw.copy()
df_protein_log['feature'] = 'protein_log_value'
df_protein_log.rename(columns={'protein_log': 'weight'}, inplace=True)
df_protein_log = df_protein_log[[ITEM_ID_COL, 'feature', 'weight']].copy()

# 모든 Item Features 결합
df_item_features['weight'] = 1.0
df_item_features = pd.concat([df_item_features[[ITEM_ID_COL, 'feature', 'weight']], df_protein_log], ignore_index=True)


print("✅ Item Feature (로그 변환 및 이산화 포함) 전처리 완료.")

# ---------------------------------------------------------------------------------
## 6단계: Interaction Matrix 소스 데이터 구축 및 음성 상호작용 추가 🚀
# ---------------------------------------------------------------------------------

df_interactions_list = []
    
for item_col, flavor_col, weight_col in INTERACTION_WEIGHT_COLS:
    temp_df = df_user_clean[['user_id', item_col, flavor_col, weight_col]].copy()
    temp_df.rename(columns={item_col: 'product', flavor_col: 'flavor', weight_col: 'weight'}, inplace=True)
    temp_df.dropna(subset=['product', 'flavor'], inplace=True)
        
    temp_df['item_id'] = temp_df.apply(lambda row: normalize_interaction_id(row['product'], row['flavor']), axis=1)
    temp_df.drop(columns=['product', 'flavor'], inplace=True)
        
    temp_df['weight'] = pd.to_numeric(temp_df['weight'], errors='coerce')
    
    # 🚨 긍정적 가중치 (재구매 의사 3점~5점)
    df_positive = temp_df[temp_df['weight'] >= 3].copy()
    df_positive['weight'] = df_positive['weight'] * 10 # 10배 증폭
    df_interactions_list.append(df_positive)
    
    # 🚨 명시적 음성 가중치 (재구매 의사 1점~2점)
    # LightFM은 명시적 피드백에서 음수 가중치를 처리할 수 있음
    df_negative = temp_df[temp_df['weight'].isin([1, 2])].copy()
    df_negative['weight'] = -5.0 # 일괄적으로 낮은 음수 가중치 부여
    df_interactions_list.append(df_negative)

df_interactions = pd.concat(df_interactions_list, ignore_index=True)

valid_items = df_item_raw[ITEM_ID_COL].unique()
df_interactions = df_interactions[df_interactions['item_id'].isin(valid_items)]
df_interactions.dropna(subset=['item_id', 'weight'], inplace=True)

# 중복 제거 (긍정 상호작용을 우선, 음성 상호작용보다 더 높은 가중치를 가짐)
df_interactions.sort_values(by='weight', ascending=False, inplace=True)
df_interactions.drop_duplicates(subset=['user_id', 'item_id'], keep='first', inplace=True)
    
print("✅ Interaction Matrix 소스 데이터 (음성 상호작용 포함) 준비 완료.")


# ---------------------------------------------------------------------------------
## 7단계: User Feature Matrix 구축 (랭킹 가중치 증폭) 🚀
df_user_features_list = []
    
user_ohe_cols_clean = [c for c in OHE_USER_COLS if c in df_user_clean.columns]
    
# OHE 피처 (가중치 1.0 유지)
df_user_features_ohe = df_user_clean[['user_id'] + user_ohe_cols_clean].melt(
    id_vars='user_id', var_name='question', value_name='feature_value'
).dropna(subset=['feature_value'])

df_user_features_ohe['feature_value'] = df_user_features_ohe['feature_value'].astype(str).str.split(r'[,/]')
df_user_features_ohe = df_user_features_ohe.explode('feature_value')
df_user_features_ohe['feature'] = df_user_features_ohe['question'].astype(str) + '_' + df_user_features_ohe['feature_value'].astype(str).str.strip()
df_user_features_ohe['weight'] = 1.0 
df_user_features_list.append(df_user_features_ohe[['user_id', 'feature', 'weight']].drop_duplicates())

# 랭킹 피처 (가중치 증폭)
for rank_col, weight_col, product_tag, feature_start_col in RANKING_COLS_MAP:
    if rank_col in df_user_clean.columns:
        df_rank_user_feat = df_user_clean[['user_id', rank_col]].copy()
        df_rank_user_feat.rename(columns={rank_col: 'rank_str'}, inplace=True)
        df_rank_user_feat['rank_list'] = df_rank_user_feat['rank_str'].astype(str).str.strip().apply(list)
        df_rank_user_feat = df_rank_user_feat.explode('rank_list')
        df_rank_user_feat['feature_index'] = df_rank_user_feat.groupby('user_id').cumcount() 
            
        all_cols = df_user_clean.columns.tolist()
        try:
            start_idx = all_cols.index(feature_start_col)
            feature_cols_list = all_cols[start_idx : start_idx + MAX_RANK_COUNT] 
        except ValueError:
            continue
                
        index_to_col = {i: c for i, c in enumerate(feature_cols_list)}
            
        df_rank_user_feat['feature_header'] = df_rank_user_feat['feature_index'].map(index_to_col)
        df_rank_user_feat['feature'] = product_tag.upper() + '_RANK_' + df_rank_user_feat['feature_header'].astype(str).str.upper()
        df_rank_user_feat['weight'] = df_rank_user_feat['rank_list'].apply(rank_to_weight) 
        
        # 🚨 랭킹 피처 가중치 증폭 (7배) 
        df_rank_user_feat['weight'] = df_rank_user_feat['weight'] * 7 
        
        df_rank_user_feat.dropna(subset=['feature', 'weight'], inplace=True)
        df_user_features_list.append(df_rank_user_feat[['user_id', 'feature', 'weight']].drop_duplicates())

df_user_features = pd.concat(df_user_features_list, ignore_index=True)
df_user_features = df_user_features.drop_duplicates(subset=['user_id', 'feature'], keep='first')
    
print("✅ User Feature Matrix 소스 데이터 (랭킹 가중치 증폭) 준비 완료.")


# ---------------------------------------------------------------------------------
## 8단계: LightFM Dataset 구축 및 Train/Test 분리 
# ---------------------------------------------------------------------------------
    
dataset = Dataset()
dataset.fit(
    users=df_user_clean.index.unique(),
    items=df_item_raw[ITEM_ID_COL].unique(),
    user_features=df_user_features['feature'].unique(),
    item_features=df_item_features['feature'].unique()
)
    
(interactions_all, sample_weights_all) = dataset.build_interactions(
    (row['user_id'], row['item_id'], row['weight'])
    for index, row in df_interactions.iterrows()
)
    
total_indices = np.arange(len(df_interactions))
# np.random.seed(42) # 🚨 시드 제거/주석 처리
np.random.shuffle(total_indices)
    
test_size = int(len(df_interactions) * 0.2)
train_indices = total_indices[test_size:]
test_indices = total_indices[:test_size]
    
df_train_interactions = df_interactions.iloc[train_indices].copy()
df_test_interactions = df_interactions.iloc[test_indices].copy()
    
# LightFM Dataset.build_interactions를 사용하여 행렬 구축
(interactions_train, weights_train) = dataset.build_interactions(
    (row['user_id'], row['item_id'], row['weight']) for index, row in df_train_interactions.iterrows()
)
(interactions_test, weights_test) = dataset.build_interactions(
    (row['user_id'], row['item_id'], row['weight']) for index, row in df_test_interactions.iterrows()
)
    
# LightFM Feature Matrix 구축
user_features_matrix = dataset.build_user_features(
    (row['user_id'], {row['feature']: row['weight']}) for index, row in df_user_features.iterrows()
)
# Item Feature Matrix 구축 (가중치 1.0 및 로그 변환 가중치 포함)
item_features_matrix = dataset.build_item_features(
    (row[ITEM_ID_COL], {row['feature']: row['weight']}) for index, row in df_item_features.iterrows()
)
    
print("\n--- LightFM 행렬 크기 ---")
print(f"Interaction Matrix (Total): {interactions_all.shape}")
print(f"Interaction Matrix (Train): {interactions_train.shape} / Non-zero: {interactions_train.getnnz()}")
print(f"Interaction Matrix (Test): {interactions_test.shape} / Non-zero: {interactions_test.getnnz()}")
    
    
# ---------------------------------------------------------------------------------
## 9단계: 모델 학습 (Train Set 사용)
    
model = LightFM(
    loss='warp', 
    no_components=60, # 🚨 컴포넌트 수 증가 (50 -> 60)
    learning_rate=0.03,
    user_alpha=1e-6,  # 🚨 L2 정규화(Alpha) 추가 (오버피팅 방지)
    item_alpha=1e-6,
    # random_state=42 # 🚨 시드 제거/주석 처리
)

model.fit(
    interactions_train, 
    sample_weight=weights_train, 
    user_features=user_features_matrix, 
    item_features=item_features_matrix, 
    epochs=100, # 🚨 Epochs 증가 (60 -> 100)
    num_threads=4,
)

print("\n\nLightFM 하이브리드 추천 모델 학습 완료")
    
# ---------------------------------------------------------------------------------
## 10단계: 모델 평가
test_precision = precision_at_k(
    model, 
    interactions_test, 
    user_features=user_features_matrix, 
    item_features=item_features_matrix, 
    k=3
    # check_matching=True 인수를 제거합니다.
).mean()

test_auc = auc_score(
    model, 
    interactions_test, 
    user_features=user_features_matrix, 
    item_features=item_features_matrix
).mean()

print(f"\n🚀 **모델 개선 결과**")
print(f"Test Set Precision@3: {test_precision:.4f}")
print(f"Test Set AUC Score: {test_auc:.4f}")

✅ 데이터 로드 및 매핑 딕셔너리 생성 완료.
✅ Item Feature (로그 변환 및 이산화 포함) 전처리 완료.
✅ Interaction Matrix 소스 데이터 (음성 상호작용 포함) 준비 완료.
✅ User Feature Matrix 소스 데이터 (랭킹 가중치 증폭) 준비 완료.

--- LightFM 행렬 크기 ---
Interaction Matrix (Total): (1037, 122)
Interaction Matrix (Train): (1037, 122) / Non-zero: 280
Interaction Matrix (Test): (1037, 122) / Non-zero: 70


LightFM 하이브리드 추천 모델 학습 완료

🚀 **모델 개선 결과**
Test Set Precision@3: 0.2524
Test Set AUC Score: 0.9672
