In [1]:
import os
import pandas as pd

# 파일이 들어 있는 폴더의 경로로 작업 디렉터리를 변경합니다.
os.chdir("C:/Users/user/Desktop/전처리 할 것")

def process_data(year):
    """
    주어진 연도에 해당하는 파일을 읽고 전처리한 후 저장하는 함수입니다.
    """
    # 1. 파일 이름에 연도를 포함시켜 경로를 만듭니다.
    file_name = f'보훈대상자 평균 개인소득 {year}.csv'

    # 2. CSV 파일을 읽어 DataFrame으로 만듭니다.
    df = pd.read_csv(file_name)

    # 3. 불필요한 컬럼을 제거합니다.
    rem = ['Unnamed: 0', 'C1_OBJ_NM', 'UNIT_NM', 'ITM_NM', 'C2_OBJ_NM', 'TBL_NM']
    df.drop(columns=rem, inplace=True)

    # 4. 'C1_NM' 컬럼을 인덱스로 설정합니다.
    df.set_index('C1_NM', inplace=True)

    # 5. '연도' 컬럼을 생성합니다.
    df['연도'] = year

    # 6. 전처리된 DataFrame을 CSV 파일로 저장합니다.
    # 파일명에 연도를 추가하여 구분합니다. 
    output_file_name = f'보훈대상자 평균 개인소득 {year}_processed.csv'
    df.to_csv(output_file_name)
    
    print(f"{year}년도 파일 처리가 완료되었습니다.")

# 처리하고 싶은 연도 리스트를 만듭니다.
years_to_process = [2018, 2021, 2024]

# 반복문을 사용해 각 연도마다 함수를 실행합니다.
for year in years_to_process:
    process_data(year)

print("\n모든 연도 파일 처리가 완료되었습니다. 😊")

2018년도 파일 처리가 완료되었습니다.
2021년도 파일 처리가 완료되었습니다.
2024년도 파일 처리가 완료되었습니다.

모든 연도 파일 처리가 완료되었습니다. 😊


In [2]:
# 이전 단계에서 처리된 파일들의 이름을 리스트로 만듭니다.
file_list = [
    '보훈대상자 평균 개인소득 2018_processed.csv',
    '보훈대상자 평균 개인소득 2021_processed.csv',
    '보훈대상자 평균 개인소득 2024_processed.csv'
]

# 합쳐진 데이터프레임을 저장할 빈 리스트를 생성합니다.
all_dfs = []

# 반복문을 사용해 각 파일을 읽고 리스트에 추가합니다.
for file in file_list:
    df = pd.read_csv(file, index_col='C1_NM')
    all_dfs.append(df)
    print(f"'{file}' 파일 읽기 완료.")

# pd.concat() 함수를 사용하여 리스트 안의 모든 데이터프레임을 하나로 합칩니다.
# ignore_index=False로 설정하여 기존 인덱스를 유지합니다.
merged_df = pd.concat(all_dfs, ignore_index=False)

# 합쳐진 데이터프레임의 첫 5행과 마지막 5행을 출력하여 확인합니다.
print("\n병합된 데이터프레임 미리보기:")
print(merged_df)

# 최종적으로 병합된 데이터프레임을 새로운 CSV 파일로 저장합니다.
merged_df.to_csv('보훈대상자 평균 개인소득_전체_통합.csv')

print("\n모든 파일이 '보훈대상자 평균 개인소득_전체_통합.csv'로 성공적으로 병합되었습니다! 🎉")

'보훈대상자 평균 개인소득 2018_processed.csv' 파일 읽기 완료.
'보훈대상자 평균 개인소득 2021_processed.csv' 파일 읽기 완료.
'보훈대상자 평균 개인소득 2024_processed.csv' 파일 읽기 완료.

병합된 데이터프레임 미리보기:
            C2_NM      DT    연도
C1_NM                          
전체       전체(경상소득)  2460.0  2018
전체           근로소득   692.0  2018
전체           사업소득   278.0  2018
전체           재산소득   137.0  2018
전체         사적이전소득   100.0  2018
...           ...     ...   ...
보훈보상대상자      근로소득  2007.0  2024
보훈보상대상자      사업소득   398.0  2024
보훈보상대상자      재산소득   112.0  2024
보훈보상대상자    사적이전소득    41.0  2024
보훈보상대상자    공적이전소득  1187.0  2024

[306 rows x 3 columns]

모든 파일이 '보훈대상자 평균 개인소득_전체_통합.csv'로 성공적으로 병합되었습니다! 🎉
