In [None]:
import pandas as pd
import os
import glob

## 1. 회원 ID 리스트 로드
`sampled_ids_full_list.txt` 파일에서 회원 번호를 읽어옵니다.

In [None]:
# ID 리스트 파일 경로
id_file_path = 'sampled_ids_full_list.txt'

# 파일 읽기
with open(id_file_path, 'r') as f:
    sampled_ids = [line.strip() for line in f.readlines()]

print(f"총 {len(sampled_ids)}명의 회원 ID를 불러왔습니다.")
print(f"ID 예시: {sampled_ids[:5]}")

## 2. 데이터 로드 및 필터링
2018년 7월부터 12월까지의 승인매출정보 데이터를 읽고 필터링합니다.

In [None]:
# 데이터 파일이 있는 디렉토리 경로
data_dir = '../../data/03.카드 승인매출정보'

# 월별 데이터 파일 리스트 (201807 ~ 201812)
months = ['201807', '201808', '201809', '201810', '201811', '201812']
file_pattern = '{month}_승인매출정보.csv'

dfs = []

for month in months:
    file_name = file_pattern.format(month=month)
    file_path = os.path.join(data_dir, file_name)
    
    if os.path.exists(file_path):
        print(f"{month} 데이터 로드 중: {file_path}")
        # CSV 읽기
        df_temp = pd.read_csv(file_path)
        
        # 로드된 데이터 크기 확인
        original_shape = df_temp.shape
        
        # ID 필터링
        df_filtered = df_temp[df_temp['발급회원번호'].isin(sampled_ids)]
        
        # 필터링 후 크기 확인
        filtered_shape = df_filtered.shape
        print(f"  - 필터링 전: {original_shape}, 필터링 후: {filtered_shape}")
        
        dfs.append(df_filtered)
    else:
        print(f"파일을 찾을 수 없습니다: {file_path}")


## 3. 데이터 병합 (Concat)
필터링된 데이터를 하나로 합칩니다.

In [None]:
if dfs:
    # 데이터 병합
    df_merged = pd.concat(dfs, axis=0, ignore_index=True)
    print("데이터 병합 완료!")
    print(f"최종 데이터 크기: {df_merged.shape}")
    
    # 결과 확인
    display(df_merged.head())
    
    # 월별 데이터 개수 확인
    print("\n월별 데이터 개수:")
    print(df_merged['기준년월'].value_counts().sort_index())
else:
    print("병합할 데이터가 없습니다.")

In [None]:
# (선택 사항) 병합된 데이터 저장
# df_merged.to_csv('Merged_Approval_Sales_201807_201812.csv', index=False)
# print("병합된 데이터를 저장했습니다.")