In [2]:
import pandas as pd

# 파일 경로 설정
file_path = './뚜레쥬르_매장정보_정렬.csv'

# CSV 파일 불러오기
df = pd.read_csv(file_path)

# 지역 구분에 사용할 키워드 정의 (경기도 우선 적용)
regions_keywords = {
    '경기도': ['경기'],  # 경기도를 가장 먼저 적용
    '강원도': ['강원', '강원특별자치도'],
    '서울': ['서울'],
    '충북': ['충북', '충청북도'],
    '충남': ['충남', '충청남도'],
    '경남':['경남','경상남도'],
    '경북' :['경북','경상북도'],
    '전북': ['전북', '전라북도'],
    '전남': ['전남', '전라남도'],
    '광역시': [r'\b부산\b', r'\b대구\b', r'\b인천\b', r'\b광주\b', r'\b대전\b', r'\b울산\b', r'\b세종\b','부산광역시','대구광역시','인천광역시','광주광역시','대전광역시','울산광역시','세종광역시']  # \b는 정확한 단어 매칭
}

# 지역 컬럼 추가 및 초기화
df['지역'] = None

# 각 주소에 해당하는 지역 할당 (우선순위에 맞춰 지역 할당)
for region, keywords in regions_keywords.items():
    df.loc[df['주소'].str.contains('|'.join(keywords)), '지역'] = region

# 지역별로 데이터프레임 분할
region_dfs = {region: df[df['지역'] == region] for region in regions_keywords.keys()}

# 각 지역의 데이터프레임을 개별 CSV 파일로 저장 (원할 경우 사용)
for region, region_df in region_dfs.items():
    region_df.to_csv(f'뚜레쥬르_매장정보_{region}.csv', index=False)

# 결과 확인을 위해 전체 데이터프레임 출력
df.head()

Unnamed: 0,매장,주소,지역
0,뚜레쥬르 강릉합동마트,강원특별자치도 강릉시 경강로2224번길 12-1 (포남동) 1층 뚜레쥬르,강원도
1,뚜레쥬르 강릉중앙시장,강원특별자치도 강릉시 곶감전길 1-1 (성남동),강원도
2,뚜레쥬르 강릉교동,강원특별자치도 강릉시 교동광장로 139 (교동) 뚜레쥬르 강릉교동점,강원도
3,뚜레쥬르 강릉내곡,강원특별자치도 강릉시 범일로 653 (내곡동),강원도
4,뚜레쥬르 강릉유천하나로,강원특별자치도 강릉시 선수촌로 63번길 14-8,강원도


In [3]:
gyeonggi_file_path ='./뚜레쥬르_매장정보_경기도.csv'
df_gyeonggi = pd.read_csv(gyeonggi_file_path)
df_gyeonggi.head()
df_gyeonggi['주소'] =  df_gyeonggi['주소'].str.replace(r'^경기\s', '경기도 ', regex=True)
df_gyeonggi

save_path = './adress_process/뚜레쥬르_매장정보_경기도_수정.csv'
df_gyeonggi.to_csv(save_path, index=False, encoding='utf-8-sig')

# df_gyeonggi.to_csv(gyeonggi_file_path, index=False, encoding='utf-8-sig')

In [6]:
seoul_file_path ='./뚜레쥬르_매장정보_서울.csv'
df_seoul = pd.read_csv(seoul_file_path)
df_seoul.head()
df_seoul['주소'] =  df_seoul['주소'].str.replace(r'^서울\s', '서울특별시 ', regex=True)
df_seoul['주소'] =  df_seoul['주소'].str.replace(r'^서울시\s', '서울특별시 ', regex=True)
df_seoul

save_path = './adress_process/뚜레쥬르_매장정보_서울_수정.csv'
df_seoul.to_csv(save_path, index=False, encoding='utf-8-sig')

In [3]:
gangwon_file_path ='./뚜레쥬르_매장정보_강원도.csv'
df_gangwon = pd.read_csv(gangwon_file_path)
df_gangwon.head()
df_gangwon['주소'] =  df_gangwon['주소'].str.replace(r'^강원\s', '강원도 ', regex=True)
df_gangwon

save_path = './adress_process/뚜레쥬르_매장정보_강원도_수정.csv'
df_gangwon.to_csv(save_path, index=False, encoding='utf-8-sig')

In [4]:
chungbuk_file_path ='./뚜레쥬르_매장정보_충북.csv'
df_chungbuk = pd.read_csv(chungbuk_file_path)
df_chungbuk.head()
df_chungbuk['주소'] =  df_chungbuk['주소'].str.replace(r'^충북\s', '충청북도 ', regex=True)
df_chungbuk

save_path = './adress_process/뚜레쥬르_매장정보_충청북도_수정.csv'
df_chungbuk.to_csv(save_path, index=False, encoding='utf-8-sig')

In [5]:
chungnam_file_path ='./뚜레쥬르_매장정보_충남.csv'
df_chungnam = pd.read_csv(chungnam_file_path)
df_chungnam.head()
df_chungnam['주소'] =  df_chungnam['주소'].str.replace(r'^충남\s', '충청남도 ', regex=True)
df_chungnam

save_path = './adress_process/뚜레쥬르_매장정보_충청남도_수정.csv'
df_chungnam.to_csv(save_path, index=False, encoding='utf-8-sig')

In [6]:
gyeongnam_file_path ='./뚜레쥬르_매장정보_경남.csv'
df_gyeongnam = pd.read_csv(gyeongnam_file_path)
df_gyeongnam.head()
df_gyeongnam['주소'] =  df_gyeongnam['주소'].str.replace(r'^경남\s', '경상남도 ', regex=True)
df_gyeongnam

save_path = './adress_process/뚜레쥬르_매장정보_경상남도_수정.csv'
df_gyeongnam.to_csv(save_path, index=False, encoding='utf-8-sig')

In [7]:
gyeongbuk_file_path ='./뚜레쥬르_매장정보_경북.csv'
df_gyeongbuk = pd.read_csv(gyeongbuk_file_path)
df_gyeongbuk.head()
df_gyeongbuk['주소'] =  df_gyeongbuk['주소'].str.replace(r'^경북\s', '경상북도 ', regex=True)
df_gyeongbuk

save_path = './adress_process/뚜레쥬르_매장정보_경상북도_수정.csv'
df_gyeongbuk.to_csv(save_path, index=False, encoding='utf-8-sig')

In [8]:
jeonnam_file_path ='./뚜레쥬르_매장정보_전남.csv'
df_jeonnam = pd.read_csv(jeonnam_file_path)
df_jeonnam.head()
df_jeonnam['주소'] =  df_jeonnam['주소'].str.replace(r'^전남\s', '전라남도 ', regex=True)
df_jeonnam

save_path = './adress_process/뚜레쥬르_매장정보_전라남도_수정.csv'
df_jeonnam.to_csv(save_path, index=False, encoding='utf-8-sig')

In [9]:
jeonbuk_file_path ='./뚜레쥬르_매장정보_전북.csv'
df_jeonbuk = pd.read_csv(jeonbuk_file_path)
df_jeonbuk.head()
df_jeonbuk['주소'] =  df_jeonbuk['주소'].str.replace(r'^전북\s', '전라북도 ', regex=True)
df_jeonbuk

save_path = './adress_process/뚜레쥬르_매장정보_전라북도_수정.csv'
df_jeonbuk.to_csv(save_path, index=False, encoding='utf-8-sig')