In [None]:
import pandas as pd
import os

# 파일 경로 설정
csv_path = 'All_cols_withTarget_50k_4977.csv'
txt_path = 'vip_발급회원번호_ids.txt'


In [None]:
# 1. 데이터 로드
print("데이터를 로드합니다...")
try:
    # CSV 파일 읽기
    df = pd.read_csv(csv_path)
    print(f"CSV 파일 로드 완료: {df.shape}")
    
    # TXT 파일 읽기 (VIP ID 리스트)
    with open(txt_path, 'r', encoding='utf-8') as f:
        vip_ids = [line.strip() for line in f.readlines()]
    print(f"VIP ID 리스트 로드 완료: {len(vip_ids)}개")

except Exception as e:
    print(f"파일 로드 중 오류 발생: {e}")

In [None]:
# 2. 데이터 분리
print("데이터를 분리합니다...")

# 발급회원번호 컬럼 확인
if '발급회원번호' not in df.columns:
    print("오류: CSV 파일에 '발급회원번호' 컬럼이 존재하지 않습니다.")
    print(f"컬럼 목록: {df.columns}")
else:
    # VIP 데이터 분리
    vip_df = df[df['발급회원번호'].isin(vip_ids)]

    # GENERAL 데이터 분리 (VIP가 아닌 데이터)
    general_df = df[~df['발급회원번호'].isin(vip_ids)]

    # 결과 확인
    print(f"VIP 데이터 개수: {len(vip_df)}")
    print(f"GENERAL 데이터 개수: {len(general_df)}")
    print(f"전체 데이터 개수 검증: {len(vip_df) + len(general_df)} (원본: {len(df)})")

In [None]:
# 3. CSV 저장
print("결과를 저장합니다...")
try:
    vip_df.to_csv('VIP_allcols_withTarget.csv', index=False, encoding='utf-8-sig')
    print("VIP_allcols_withTarget.csv 저장 완료")
    
    general_df.to_csv('GENERAL_allcols_withTarget.csv', index=False, encoding='utf-8-sig')
    print("GENERAL_allcols_withTarget.csv 저장 완료")
    
except Exception as e:
    print(f"파일 저장 중 오류 발생: {e}")

In [None]:
vip_df.info()

In [None]:
general_df.info()