In [1]:
import pandas as pd

# 1. 불러올 파일 리스트 정의
file_list = [
    "Data/drawfit_counts.csv",
    "Data/standard_counts.csv",
    "Data/seez_counts.csv",
    "Data/kiim_counts.csv"
]

# 2. 파일별 DataFrame 불러오기
dfs = [pd.read_csv(file) for file in file_list]

# 3. 세로 방향으로 병합 (row-wise merge)
df_counts = pd.concat(dfs, axis=0, ignore_index=True)

# 4. 결과 확인
print(df_counts.shape)
print(df_counts.head())



(1552, 4)
  likeType  relationId  count  liked
0    GOODS     5275962   4772  False
1    GOODS     1760177  18143  False
2    GOODS     5384864   2155  False
3    GOODS     5290700   1621  False
4    GOODS     5384863   1024  False


In [2]:
# Data 폴더 안에 있는 musinsa_processed_data.csv 불러오기
file_path_processed = "Data/musinsa_processed_data.csv"

# CSV → DataFrame
df_musinsa_label = pd.read_csv(file_path_processed)

# 데이터 확인
print(df_musinsa_label.head())
print(df_musinsa_label.info())

   goodsNo                           goodsName displayGenderText  normalPrice  \
0  5275962  [패션플래닛X드로우핏] 세미 와이드 치노 팬츠 [6color]                남성        66000   
1  1760177                 도브 울 블루종 자켓 [BLACK]                남성       174000   
2  5384864       핀 스트라이프 크롭 블루종 자켓 [DARK NAVY]                남성       174000   
3  5290700   [서강준PICK] 레이어 미니멀 스웨이드 자켓 [BROWN]                남성       174000   
4  5384863        핀 스트라이프 크롭 블루종 자켓 [CHARCOAL]                남성       174000   

    price  saleRate    brand  reviewCount  reviewScore  isPick  
0   59400        10  drawfit          293           98       0  
1  139200        20  drawfit         1587           98       0  
2  139200        20  drawfit           65          100       0  
3  139200        20  drawfit           20           98       1  
4  139200        20  drawfit           17           98       0  
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1552 entries, 0 to 1551
Data columns (total 10 columns):
 #   Column     

In [3]:
# 두 DataFrame join
df_musinsa = pd.merge(
    df_musinsa_label,      # 왼쪽 DataFrame
    df_counts,             # 오른쪽 DataFrame
    left_on='goodsNo',     # df_musinsa_label 기준 컬럼
    right_on='relationId', # df_counts 기준 컬럼
    how='inner'            # inner join (양쪽 모두 있는 데이터만)
)

# 결과 확인
print(df_musinsa.shape)
print(df_musinsa.head())

(1552, 14)
   goodsNo                           goodsName displayGenderText  normalPrice  \
0  5275962  [패션플래닛X드로우핏] 세미 와이드 치노 팬츠 [6color]                남성        66000   
1  1760177                 도브 울 블루종 자켓 [BLACK]                남성       174000   
2  5384864       핀 스트라이프 크롭 블루종 자켓 [DARK NAVY]                남성       174000   
3  5290700   [서강준PICK] 레이어 미니멀 스웨이드 자켓 [BROWN]                남성       174000   
4  5384863        핀 스트라이프 크롭 블루종 자켓 [CHARCOAL]                남성       174000   

    price  saleRate    brand  reviewCount  reviewScore  isPick likeType  \
0   59400        10  drawfit          293           98       0    GOODS   
1  139200        20  drawfit         1587           98       0    GOODS   
2  139200        20  drawfit           65          100       0    GOODS   
3  139200        20  drawfit           20           98       1    GOODS   
4  139200        20  drawfit           17           98       0    GOODS   

   relationId  count  liked  
0     5275962   4772 

In [4]:
import os

# Data 폴더가 없으면 생성
os.makedirs("Data", exist_ok=True)

# 저장할 파일 이름 입력
file_name = "musinsa_pick.csv"   # 원하는 이름으로 수정 가능

# CSV 저장
df_musinsa.to_csv(f"Data/{file_name}", index=False, encoding="utf-8-sig")

In [5]:
df_musinsa

Unnamed: 0,goodsNo,goodsName,displayGenderText,normalPrice,price,saleRate,brand,reviewCount,reviewScore,isPick,likeType,relationId,count,liked
0,5275962,[패션플래닛X드로우핏] 세미 와이드 치노 팬츠 [6color],남성,66000,59400,10,drawfit,293,98,0,GOODS,5275962,4772,False
1,1760177,도브 울 블루종 자켓 [BLACK],남성,174000,139200,20,drawfit,1587,98,0,GOODS,1760177,18143,False
2,5384864,핀 스트라이프 크롭 블루종 자켓 [DARK NAVY],남성,174000,139200,20,drawfit,65,100,0,GOODS,5384864,2155,False
3,5290700,[서강준PICK] 레이어 미니멀 스웨이드 자켓 [BROWN],남성,174000,139200,20,drawfit,20,98,1,GOODS,5290700,1621,False
4,5384863,핀 스트라이프 크롭 블루종 자켓 [CHARCOAL],남성,174000,139200,20,drawfit,17,98,0,GOODS,5384863,1024,False
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1547,3143689,스카시 티에리 니트_퓨어 블랙,공용,59000,29500,50,kiimuir,197,98,0,GOODS,3143689,882,False
1548,3143666,스카시 티에리 니트_아이보리,공용,59000,23600,60,kiimuir,75,98,0,GOODS,3143666,697,False
1549,2789871,[WOOL 80] 울 세미오버핏 더플 코트_브라운,공용,259000,220150,15,kiimuir,786,98,0,GOODS,2789871,9189,False
1550,2156482,쉘블록 2-WAY 보아퍼 숏패딩_아이보리,공용,129000,89010,31,kiimuir,717,96,0,GOODS,2156482,22570,False
