In [4]:

import pandas as pd
import os

print("▶ 1단계: 데이터 분석 도구를 로딩했습니다.")


file_list = [
    '오피스텔(전월세)_실거래가_2022년 오피스텔.csv',
    '연립다세대(전월세)_실거래가_2022년 연립다주택.csv',
    '오피스텔(전월세)_실거래가_2023년 오피스텔.csv',
    '연립다세대(전월세)_실거래가_2023년 연립다세대.csv',
    '오피스텔(전월세)_실거래가_2024.csv',
    '연립다세대(전월세)_실거래가_2024년 연립다세대.csv'
]


all_data_frames = []
print("▶ 2단계: 파일 병합을 위한 준비를 마쳤습니다.")


for filename in file_list:

    if not os.path.exists(filename):
        print(f" (!) 경고: '{filename}' 파일을 찾을 수 없습니다. 왼쪽 메뉴에 파일이 잘 업로드되었는지 확인해주세요.")
        continue


    df = pd.read_csv(filename, skiprows=15, encoding='cp949')


    if '오피스텔' in filename:
        df['주택유형'] = '오피스텔'

        if '건물명' in df.columns:
            df.rename(columns={'건물명': '단지명'}, inplace=True)


    elif '연립다세대' in filename or '연립다주택' in filename:
        df['주택유형'] = '연립다세대'

        if '건물명' in df.columns:
            df.rename(columns={'건물명': '단지명'}, inplace=True)


    all_data_frames.append(df)
    print(f"  - '{filename}' 파일을 성공적으로 읽었습니다. (데이터 {len(df)}건)")

print("▶ 3단계: 모든 파일을 순서대로 읽고 정리했습니다.")


if not all_data_frames:
    print("\n[!] 최종 오류: 처리할 파일이 하나도 없습니다. 파일 업로드 상태를 다시 확인해주세요.")
else:

    merged_df = pd.concat(all_data_frames, ignore_index=True)
    print("▶ 4단계: 6개 파일을 하나의 표로 완벽하게 합쳤습니다.")


    output_filename = '통합_실거래가_2022-2024.csv'

    merged_df.to_csv(output_filename, index=False, encoding='utf-8-sig')

    print("\n모든 작업이 완료되었습니다!")
    print(f"'{output_filename}' 이름으로 결과 파일이 저장되었습니다.")
    print(f"총 {len(merged_df)}건의 데이터가 합쳐졌습니다.")


▶ 1단계: 데이터 분석 도구를 로딩했습니다.
▶ 2단계: 파일 병합을 위한 준비를 마쳤습니다.
  - '오피스텔(전월세)_실거래가_2022년 오피스텔.csv' 파일을 성공적으로 읽었습니다. (데이터 33309건)
  - '연립다세대(전월세)_실거래가_2022년 연립다주택.csv' 파일을 성공적으로 읽었습니다. (데이터 89037건)
  - '오피스텔(전월세)_실거래가_2023년 오피스텔.csv' 파일을 성공적으로 읽었습니다. (데이터 27744건)
  - '연립다세대(전월세)_실거래가_2023년 연립다세대.csv' 파일을 성공적으로 읽었습니다. (데이터 72016건)
  - '오피스텔(전월세)_실거래가_2024.csv' 파일을 성공적으로 읽었습니다. (데이터 25567건)
  - '연립다세대(전월세)_실거래가_2024년 연립다세대.csv' 파일을 성공적으로 읽었습니다. (데이터 64121건)
▶ 3단계: 모든 파일을 순서대로 읽고 정리했습니다.
▶ 4단계: 6개 파일을 하나의 표로 완벽하게 합쳤습니다.

모든 작업이 완료되었습니다!
'통합_실거래가_2022-2024.csv' 이름으로 결과 파일이 저장되었습니다.
총 311794건의 데이터가 합쳐졌습니다.


In [5]:

import pandas as pd
import os

print("▶ 1단계: 데이터 분석 도구를 로딩했습니다.")

input_filename = '통합_실거래가_2022-2024.csv'

columns_to_keep = [
    '시군구',
    '번지',
    '본번',
    '부번',
    '단지명',
    '계약년월',
    '계약일',
    '보증금(만원)',
    '층',
    '도로명',
    '주택유형'
]
print("▶ 2단계: 남길 열 목록을 설정했습니다.")

if not os.path.exists(input_filename):
    print(f"\n[!] 오류: '{input_filename}' 파일을 찾을 수 없습니다. 왼쪽에 파일이 정확히 업로드되었는지 확인해주세요.")
else:

    df = pd.read_csv(input_filename, encoding='utf-8-sig')
    print(f"▶ 3단계: '{input_filename}' 파일을 성공적으로 읽었습니다. (총 {len(df)}건)")


    df_selected = df[columns_to_keep]
    print("▶ 4단계: 원하는 열만 성공적으로 골라냈습니다.")


    output_filename = '최종_정리파일_2022-2024.csv'

    df_selected.to_csv(output_filename, index=False, encoding='utf-8-sig')

    print("\n모든 작업이 완료되었습니다!")
    print(f"'{output_filename}' 이름으로 결과 파일이 저장되었습니다.")
    print("선택된 열 목록:", columns_to_keep)


▶ 1단계: 데이터 분석 도구를 로딩했습니다.
▶ 2단계: 남길 열 목록을 설정했습니다.
▶ 3단계: '통합_실거래가_2022-2024.csv' 파일을 성공적으로 읽었습니다. (총 311794건)
▶ 4단계: 원하는 열만 성공적으로 골라냈습니다.

모든 작업이 완료되었습니다!
'최종_정리파일_2022-2024.csv' 이름으로 결과 파일이 저장되었습니다.
선택된 열 목록: ['시군구', '번지', '본번', '부번', '단지명', '계약년월', '계약일', '보증금(만원)', '층', '도로명', '주택유형']
