In [3]:
import pandas as pd

file_path = '도로명코드_전체.txt'

try:
    # 1. 파일 읽기
    # sep='\t'는 탭으로 구분된 파일이라는 뜻입니다. 
    # 만약 에러가 나면 sep='|'로 바꿔보세요. (공공데이터는 보통 둘 중 하나입니다)
    df = pd.read_csv(file_path, encoding='cp949', sep='\t')

    # 컬럼명에 혹시 모를 공백 제거 (실무에서 자주 발생하는 버그 방지)
    df.columns = df.columns.str.strip()

    # 2. 필터링 (송파구, 마포구, 노원구)
    target_gu = ['송파구', '마포구', '노원구']
    
    # 시군구명 컬럼에서 target_gu 리스트에 포함된 것만 추출
    result_df = df[df['시군구명'].isin(target_gu)]

    # 3. 결과 확인 및 저장
    print(f"필터링 전 데이터 개수: {len(df)}")
    print(f"필터링 후 데이터 개수: {len(result_df)}")
    print(result_df.head()) # 상위 5개 출력

    # 필요하다면 csv로 저장 (한글 깨짐 방지를 위해 utf-8-sig 권장)
    # result_df.to_csv('filtered_result.csv', index=False, encoding='utf-8-sig')

except FileNotFoundError:
    print("파일을 찾을 수 없습니다. 경로를 확인해주세요.")
except Exception as e:
    print(f"데이터 처리 중 오류 발생: {e}")

필터링 전 데이터 개수: 381415
필터링 후 데이터 개수: 3742
         시군구    도로명코드         도로명                          영문도로명  읍면동일련번호  \
12917  11350  1000027  서울외곽순환고속도로  Seouloegwaksunhwan Expressway        0   
12918  11350  3000001         동일로                      Dongil-ro        0   
12919  11350  3000001         동일로                      Dongil-ro        1   
12920  11350  3000001         동일로                      Dongil-ro        2   
12921  11350  3000001         동일로                      Dongil-ro        3   

         시도명 시군구명  읍면동구분  읍면동코드 읍면동명  상위도로코드  상위도로명  폐지구분 변경이력사유 변경이력정보  \
12917  서울특별시  노원구      2    NaN  NaN     NaN    NaN     0    NaN    NaN   
12918  서울특별시  노원구      2    NaN  NaN     NaN    NaN     0    NaN    NaN   
12919  서울특별시  노원구      1  103.0  공릉동     NaN    NaN     0    NaN    NaN   
12920  서울특별시  노원구      1  105.0  상계동     NaN    NaN     0    NaN    NaN   
12921  서울특별시  노원구      1  106.0  중계동     NaN    NaN     0    NaN    NaN   

       영문시도명    영문시군구명          영문읍면동명        

  df = pd.read_csv(file_path, encoding='cp949', sep='\t')


In [5]:
result_df.to_csv('도로명필터링.csv', index=False, encoding='utf-8-sig')