In [3]:
import pandas as pd
from pathlib import Path

# 원본 데이터 파일 경로를 지정합니다.
# 만약 파일 위치가 다르다면 이 부분을 수정해주세요.
csv_file_path = 'loan_approval_dataset.csv'
output_filename = 'tableau_data.csv'

try:
    # 데이터 불러오기
    df_full = pd.read_csv(csv_file_path)

    # --- 노트북에서 수행한 데이터 정제 및 변환 ---

    # 1. 컬럼 이름의 양 끝 공백 제거
    df_full.columns = df_full.columns.str.strip()

    # 2. 불필요한 'loan_id' 컬럼 제거
    if 'loan_id' in df_full.columns:
        df_full.drop(columns=['loan_id'], inplace=True)

    # 3. 'loan_status' 값의 공백 제거 및 계산을 위한 숫자 플래그 생성
    df_full['loan_status'] = df_full['loan_status'].str.strip()
    df_full['approved_flag'] = df_full['loan_status'].map({'Approved': 1, 'Rejected': 0})

    # --- Tableau용 파일로 저장 ---
    df_full.to_csv(output_filename, index=False)

    print(f"'{output_filename}' 파일이 성공적으로 생성되었습니다.")
    print("이제 Tableau에서 이 파일을 연결하여 대시보드를 만들 수 있습니다.")

except FileNotFoundError:
    print(f"Error: '{csv_file_path}' 파일을 찾을 수 없습니다.")
    print("스크립트를 실행하는 위치에 'data' 폴더와 그 안에 'loan_approval_dataset.csv' 파일이 있는지 확인해주세요.")

'tableau_data.csv' 파일이 성공적으로 생성되었습니다.
이제 Tableau에서 이 파일을 연결하여 대시보드를 만들 수 있습니다.
