# 서울시 생활인구
## 서울 생활인구 현황 (2022.09.28. 기준)
### url: https://data.seoul.go.kr/dataVisual/seoul/seoulLivingPopulation.do
### 서울시 생활인구란? 
    - 서울시와 KT가 공공빅데이터와 통신데이터를 이용하여 추계한 서울의 특정지역, 특정시점에 존재하는 모든 인구

1. 집계구 단위 서울 생활인구(내국인)
    - url: https://data.seoul.go.kr/dataList/OA-14979/F/1/datasetView.do
    - 설명: 서울시가 보유한 공공데이터와 통신데이터로 측정한 특정시점에 서울의 특정 지역에 존재하는 인구 중 내국인

<!-- <br> -->


2. 집계구 단위 서울 생활인구(장기체류 외국인)
    - url: https://data.seoul.go.kr/dataList/OA-14978/F/1/datasetView.do
    - 설명:서울시가 보유한 공공데이터와 통신데이터로 측정한 특정시점에 서울의 특정 지역에 존재하는 인구 중 장기체류 외국인

<!-- <br> -->


3. 집계구 단위 서울 생활인구(단기체류 외국인)
    - url: https://data.seoul.go.kr/dataList/OA-14980/F/1/datasetView.do
    - 설명:서울시가 보유한 공공데이터와 통신데이터로 측정한 특정시점에 서울의 특정 지역에 존재하는 인구 중 단기체류 외국인

<!-- <br> -->



※ 개인정보 비 식별화를 위하여 ‘3명’ 이하인 경우 “ * ” 처리


In [1]:
import os
import glob
import pandas as pd
import numpy as np

In [2]:
from tqdm.auto import tqdm, trange
from time import sleep

## 1. 집계구 단위 서울 생활인구(내국인)
    - a)2022년 01월~08월
    - b)2019년, 2020년, 2021년
    - 2019년 10월 15-27일 데이터 없음
## 2. 집계구 단위 서울 생활인구(장기체류 외국인)
    - a)2022년 01월~08월
    - b)2019년, 2020년, 2021년
## 3. 집계구 단위 서울 생활인구(단기체류 외국인)
    - a)2022년 01월~08월
    - b)2019년, 2020년, 2021년

In [3]:
# 폴더 안 파일명 리스트 가져오기
local_people_2019_list = []
local_people_2020_list = []
local_people_2021_list = []

long_foreigner_list = []
temp_foreinger_list= []
pbar = tqdm(os.listdir(r"./data/집계구 단위 서울 생활인구/local_people/2019"))
for file in pbar:
    if file.endswith(".csv"):
        pbar.set_description(file)
        local_people_2019_list.append(file)
        
pbar = tqdm(os.listdir(r"./data/집계구 단위 서울 생활인구/local_people/2020"))
for file in pbar:
    if file.endswith(".csv"):
        pbar.set_description(file)
        local_people_2020_list.append(file)
        
pbar = tqdm(os.listdir(r"./data/집계구 단위 서울 생활인구/local_people/2021"))
for file in pbar:
    if file.endswith(".csv"):
        pbar.set_description(file)
        local_people_2021_list.append(file)

pbar = tqdm(os.listdir(r"./data/집계구 단위 서울 생활인구/long_foreigner/"))
for file in pbar:
    if file.endswith(".csv"):
        pbar.set_description(file)
        long_foreigner_list.append(file)
 
pbar = tqdm(os.listdir(r"./data/집계구 단위 서울 생활인구/temp_foreigner/"))
for file in pbar:
    if file.endswith(".csv"):
        pbar.set_description(file)
        temp_foreinger_list.append(file)

local_people_2019_list.sort()
local_people_2020_list.sort()
local_people_2021_list.sort()
long_foreigner_list.sort()
temp_foreinger_list.sort()

print("no. of local_people_2019 >>", len(local_people_2019_list))
print("no. of local_people_2020 >>", len(local_people_2020_list))
print("no. of local_people_2021 >>", len(local_people_2021_list))

print("no. of long_foreigner_list >>", len(long_foreigner_list))
print("no. of temp_foreinger_list >>", len(temp_foreinger_list))

  0%|          | 0/352 [00:00<?, ?it/s]

  0%|          | 0/366 [00:00<?, ?it/s]

  0%|          | 0/365 [00:00<?, ?it/s]

  0%|          | 0/1 [00:00<?, ?it/s]

  0%|          | 0/1 [00:00<?, ?it/s]

no. of local_people_2019 >> 351
no. of local_people_2020 >> 366
no. of local_people_2021 >> 365
no. of long_foreigner_list >> 1
no. of temp_foreinger_list >> 1


In [4]:
def data_process(file_list, path):
    df_sum_per_day_집계구_list = []
    df_sum_per_day_행정동_list = []
    problem_list = []
    pbar = tqdm(file_list)
    for file in pbar:
        pbar.set_description(file) # pbar description에 작업중인 파일명 업데이트
        try:df_temp = pd.read_csv(path + file, encoding="utf-8", na_values="*")
        except UnicodeDecodeError:df_temp = pd.read_csv(path + file, encoding="euc-kr", na_values="*")
        except Exception as e: 
            # df_temp = pd.read_csv(path + file, encoding="euc-kr", na_values="*")
            print(file, ">>", e)
            problem_list.append(file)
            continue
        df_temp.rename(columns={'?"기준일ID"' : '기준일ID'})
        #결측값 0으로 대체
        df_temp.fillna(0, inplace=True)
        try:
            df_temp = create_dates(df_temp)
        except Exception as e:
            print(e)
        
        # 연령별로 컬럼 정리
        df_sum_per_day_집계구, df_sum_per_day_행정동 = combine_ages(df_temp)
        df_sum_per_day_집계구_list.append(df_sum_per_day_집계구)
        df_sum_per_day_행정동_list.append(df_sum_per_day_행정동)
    
    # 데이터 합치기
    df_concat_집계구 = pd.concat(df_sum_per_day_집계구_list)
    df_concat_행정동 = pd.concat(df_sum_per_day_행정동_list)

    return df_concat_집계구, df_concat_행정동

In [5]:
# 기준일ID 컬럼을 date형식으로 변환
# 년, 월 컬럼 생성
def create_dates(df_temp):
    df_temp.insert(0, '날짜', pd.to_datetime(df_temp['기준일ID'], format='%Y%m%d'))
    df_temp.insert(1, '년', df_temp['날짜'].dt.year)
    df_temp.insert(2, '월', df_temp['날짜'].dt.month)

    # 주말 여부 컬럼 생성
    df_temp.insert(3, "주말", df_temp['날짜'].dt.dayofweek > 4)

    # 기준일ID컬럼 drop
    df_temp.drop(columns=['기준일ID', '시간대구분'], inplace=True)
    # df_temp.drop(columns=['Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36','Unnamed: 37'], inplace=True)
    return df_temp

In [6]:
# 연령별로 컬럼 정리
def combine_ages(df_temp):
    cols = [
    '남자0세부터9세생활인구수', '여자0세부터9세생활인구수', 
    '남자10세부터14세생활인구수', '남자15세부터19세생활인구수', '여자10세부터14세생활인구수', '여자15세부터19세생활인구수', 
    '남자20세부터24세생활인구수', '남자25세부터29세생활인구수', '여자20세부터24세생활인구수', '여자25세부터29세생활인구수',
    '남자30세부터34세생활인구수', '남자35세부터39세생활인구수', '여자30세부터34세생활인구수', '여자35세부터39세생활인구수', 
    '남자40세부터44세생활인구수', '남자45세부터49세생활인구수', '여자40세부터44세생활인구수', '여자45세부터49세생활인구수', 
    '남자50세부터54세생활인구수', '남자55세부터59세생활인구수', '여자50세부터54세생활인구수', '여자55세부터59세생활인구수', 
    '남자60세부터64세생활인구수', '남자65세부터69세생활인구수', '여자60세부터64세생활인구수', '여자65세부터69세생활인구수', 
    '남자70세이상생활인구수', '여자70세이상생활인구수'
    ]
    df_temp['10세 이하'] = df_temp.남자0세부터9세생활인구수 + df_temp.여자0세부터9세생활인구수
    df_temp['10대'] = df_temp.남자10세부터14세생활인구수 + df_temp.남자15세부터19세생활인구수 + df_temp.여자10세부터14세생활인구수 + df_temp.여자15세부터19세생활인구수
    df_temp['20대'] = df_temp.남자20세부터24세생활인구수 + df_temp.남자25세부터29세생활인구수 + df_temp.여자20세부터24세생활인구수 + df_temp.여자25세부터29세생활인구수
    df_temp['30대'] = df_temp.남자30세부터34세생활인구수 + df_temp.남자35세부터39세생활인구수 + df_temp.여자30세부터34세생활인구수 + df_temp.여자35세부터39세생활인구수
    df_temp['40대'] = df_temp.남자40세부터44세생활인구수 + df_temp.남자45세부터49세생활인구수 + df_temp.여자40세부터44세생활인구수 + df_temp.여자45세부터49세생활인구수
    df_temp['50대'] = df_temp.남자50세부터54세생활인구수 + df_temp.남자55세부터59세생활인구수 + df_temp.여자50세부터54세생활인구수 + df_temp.여자55세부터59세생활인구수
    df_temp['60대'] = df_temp.남자60세부터64세생활인구수 + df_temp.남자65세부터69세생활인구수 + df_temp.여자60세부터64세생활인구수 + df_temp.여자65세부터69세생활인구수
    df_temp['70세 이상'] = df_temp.남자70세이상생활인구수 + df_temp.여자70세이상생활인구수
    df_temp.drop(columns=cols, inplace=True)
    df_sum_per_day_집계구 = df_temp.groupby(['날짜', '년', '월', '주말', '행정동코드', '집계구코드']).sum()
    df_sum_per_day_행정동 = df_temp.groupby(['날짜', '년', '월', '주말', '행정동코드']).sum()

    return df_sum_per_day_집계구, df_sum_per_day_행정동

In [7]:
#2019년
local_people_2019_df_집계구, local_people_2019_df_행정동 = data_process(local_people_2019_list, "./data/집계구 단위 서울 생활인구/local_people/2019/")

  0%|          | 0/351 [00:00<?, ?it/s]

In [None]:
#2020년
local_people_2020_df_집계구, local_people_2020_df_행정동 = data_process(local_people_2020_list, "./data/집계구 단위 서울 생활인구/local_people/2020/")

In [None]:
#2021년
local_people_2021_df_집계구, local_people_2021_df_행정동 = data_process(local_people_2021_list, "./data/집계구 단위 서울 생활인구/local_people/2021/")

In [17]:
local_people_2019_df_집계구.drop(columns=['Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36','Unnamed: 37'], inplace=True)


In [23]:
local_people_2019_df_행정동.drop(columns=['Unnamed: 33', 'Unnamed: 34', 'Unnamed: 35', 'Unnamed: 36','Unnamed: 37'], inplace=True)


In [24]:
local_people_2019_df_집계구.to_csv("./data/집계구 단위 서울 생활인구/2019일당일평균_집계구.csv")

In [25]:
local_people_2019_df_행정동.to_csv("./data/집계구 단위 서울 생활인구/2019일당일평균_행정동.csv")

In [37]:
local_people_2019_df_집계구

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,Unnamed: 4_level_0,Unnamed: 5_level_0,총생활인구수,10세 이하,10대,20대,30대,40대,50대,60대,70세 이상
날짜,년,월,주말,행정동코드,집계구코드,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1
2019-01-01,2019,1,False,11110515,1101072010001,3891.0,236.0,220.0,465.0,435.0,663.0,508.0,229.0,447.0
2019-01-01,2019,1,False,11110515,1101072010002,10983.0,645.0,932.0,1557.0,1638.0,1913.0,1472.0,976.0,1532.0
2019-01-01,2019,1,False,11110515,1101072010003,7545.0,438.0,608.0,1081.0,900.0,1349.0,1248.0,735.0,803.0
2019-01-01,2019,1,False,11110515,1101072010004,3343.0,202.0,151.0,282.0,296.0,513.0,452.0,254.0,345.0
2019-01-01,2019,1,False,11110515,1101072010005,5302.0,342.0,390.0,733.0,621.0,937.0,731.0,298.0,641.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2019-12-31,2019,12,False,11740700,1125071022201,16146.0,1214.0,1464.0,1820.0,2527.0,2662.0,2360.0,1906.0,1866.0
2019-12-31,2019,12,False,11740700,1125071022202,4217.0,306.0,210.0,353.0,609.0,652.0,524.0,372.0,416.0
2019-12-31,2019,12,False,11740700,1125071022501,19846.0,1189.0,1571.0,1914.0,2641.0,2884.0,2910.0,2998.0,3411.0
2019-12-31,2019,12,False,11740700,1125071022701,4536.0,419.0,324.0,378.0,415.0,503.0,728.0,618.0,471.0


In [43]:
pd.options.display.float_format = '{:,.0f}'.format

In [47]:
df_dong = local_people_2019_df_행정동.groupby(['년', '월', '주말', '행정동코드']).mean().reset_index()
df_dong.drop(columns='집계구코드', inplace=True)
df_dong

Unnamed: 0,년,월,주말,행정동코드,총생활인구수,10세 이하,10대,20대,30대,40대,50대,60대,70세 이상
0,2019,1,False,11110515,393389,22095,31747,55760,62022,73075,54134,35318,46148
1,2019,1,False,11110530,776704,20697,27721,123837,173876,165072,114244,68531,73895
2,2019,1,False,11110540,157556,3441,10246,24154,29987,28814,24688,16805,17634
3,2019,1,False,11110550,264268,11362,23054,35592,31254,38970,42058,32867,40904
4,2019,1,False,11110560,430351,26350,38179,42789,42539,58514,70096,58896,74300
...,...,...,...,...,...,...,...,...,...,...,...,...,...
10171,2019,12,True,11740650,675499,44050,41766,92167,112312,101932,101465,83327,76850
10172,2019,12,True,11740660,659218,38433,55628,84222,100720,106994,100689,79970,70731
10173,2019,12,True,11740685,1288847,82883,93527,159933,189504,195212,203194,173226,148016
10174,2019,12,True,11740690,194670,11626,17732,15055,20827,26976,24678,19163,25157


In [48]:
df_code = pd.read_excel("./data/집계구 단위 서울 생활인구/행정동코드_매핑정보_20200325.xlsx")
df_code.drop(0, inplace=True)
df_dong['행정동코드']=df_dong['행정동코드'].astype(str)
df_code['행자부행정동코드']=df_code['행자부행정동코드'].astype(str)
df_dong = pd.merge(df_dong, df_code, how='inner',left_on='행정동코드', right_on='행자부행정동코드')
df_dong

Unnamed: 0,년,월,주말,행정동코드,총생활인구수,10세 이하,10대,20대,30대,40대,50대,60대,70세 이상,통계청행정동코드,행자부행정동코드,시도명,시군구명,행정동명
0,2019,1,False,11110515,393389,22095,31747,55760,62022,73075,54134,35318,46148,1101072,11110515,서울,종로구,청운효자동
1,2019,1,True,11110515,383699,21877,31035,56868,55037,69006,52860,36230,48422,1101072,11110515,서울,종로구,청운효자동
2,2019,2,False,11110515,370118,20885,29996,52583,58694,68774,50634,32472,42593,1101072,11110515,서울,종로구,청운효자동
3,2019,2,True,11110515,350496,20030,28079,51264,51003,63848,47989,32301,43242,1101072,11110515,서울,종로구,청운효자동
4,2019,3,False,11110515,409506,27178,51132,55846,61799,72298,51629,33935,42776,1101072,11110515,서울,종로구,청운효자동
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
10171,2019,10,True,11740700,725982,50011,59280,79302,96770,102394,110414,97735,103914,1125071,11740700,서울,강동구,둔촌2동
10172,2019,11,False,11740700,746113,50377,60167,77219,98473,105720,111483,100611,115891,1125071,11740700,서울,강동구,둔촌2동
10173,2019,11,True,11740700,726680,48532,59431,78738,97978,104737,109763,97849,103504,1125071,11740700,서울,강동구,둔촌2동
10174,2019,12,False,11740700,741778,49136,59633,78151,97075,105063,109431,100563,116146,1125071,11740700,서울,강동구,둔촌2동


In [68]:
df_dong.to_csv("./일당평균생활인구수_행정동.csv")

In [49]:
#총 일평균 생활인구
df_dong.pivot_table("총생활인구수", index=["시군구명","행정동명"],aggfunc = 'sum').sort_values(by=["총생활인구수"],ascending=False)

Unnamed: 0_level_0,Unnamed: 1_level_0,총생활인구수
시군구명,행정동명,Unnamed: 2_level_1
강남구,역삼1동,58736706
영등포구,여의동,49056443
마포구,서교동,47058866
종로구,종로1.2.3.4가동,37896758
서초구,서초3동,36906542
...,...,...
종로구,교남동,3919072
종로구,삼청동,3886807
영등포구,신길4동,3834838
양천구,신월6동,3283055


In [55]:
#순위 분석 : 각 평균에 따른 합 비교
age_lp=df_dong.filter(regex='\d|시군구명|행정동명')
age_lp

Unnamed: 0,10세 이하,10대,20대,30대,40대,50대,60대,70세 이상,시군구명,행정동명
0,22095,31747,55760,62022,73075,54134,35318,46148,종로구,청운효자동
1,21877,31035,56868,55037,69006,52860,36230,48422,종로구,청운효자동
2,20885,29996,52583,58694,68774,50634,32472,42593,종로구,청운효자동
3,20030,28079,51264,51003,63848,47989,32301,43242,종로구,청운효자동
4,27178,51132,55846,61799,72298,51629,33935,42776,종로구,청운효자동
...,...,...,...,...,...,...,...,...,...,...
10171,50011,59280,79302,96770,102394,110414,97735,103914,강동구,둔촌2동
10172,50377,60167,77219,98473,105720,111483,100611,115891,강동구,둔촌2동
10173,48532,59431,78738,97978,104737,109763,97849,103504,강동구,둔촌2동
10174,49136,59633,78151,97075,105063,109431,100563,116146,강동구,둔촌2동


In [57]:
a=age_lp.groupby(["시군구명","행정동명"]).mean()
a["1위"]=a.idxmax(axis=1)
a

Unnamed: 0_level_0,Unnamed: 1_level_0,10세 이하,10대,20대,30대,40대,50대,60대,70세 이상,1위
시군구명,행정동명,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
강남구,개포1동,11925,13919,11670,20556,28787,27015,24990,24892,40대
강남구,개포2동,25962,56116,37873,43714,75453,67640,58940,51543,40대
강남구,개포4동,22523,36195,41729,60099,65865,59140,48450,37374,40대
강남구,논현1동,22907,40140,249211,270219,172789,104921,81530,73521,30대
강남구,논현2동,38689,43868,199472,254801,185008,111319,80773,77989,30대
...,...,...,...,...,...,...,...,...,...,...
중랑구,상봉2동,29167,31797,109549,110984,91719,101577,77645,75042,30대
중랑구,신내1동,84608,66680,86149,105983,116990,125771,90757,92877,50대
중랑구,신내2동,31875,38353,46895,57178,62364,68458,52447,63365,50대
중랑구,중화1동,37833,31631,46617,57442,51096,59797,46554,52170,50대


In [59]:
a.info()

<class 'pandas.core.frame.DataFrame'>
MultiIndex: 424 entries, ('강남구', '개포1동') to ('중랑구', '중화2동')
Data columns (total 9 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   10세 이하  424 non-null    float64
 1   10대     424 non-null    float64
 2   20대     424 non-null    float64
 3   30대     424 non-null    float64
 4   40대     424 non-null    float64
 5   50대     424 non-null    float64
 6   60대     424 non-null    float64
 7   70세 이상  424 non-null    float64
 8   1위      424 non-null    object 
dtypes: float64(8), object(1)
memory usage: 34.7+ KB


## 행정동 별 나이대 순위: 모든 순위

In [62]:
a=age_lp.groupby(["시군구명","행정동명"]).mean()
a_list=a.apply(np.argsort,axis=1)
a_list.values

array([[2, 0, 1, ..., 6, 5, 4],
       [0, 2, 3, ..., 6, 5, 4],
       [0, 1, 7, ..., 5, 3, 4],
       ...,
       [0, 1, 2, ..., 4, 7, 5],
       [1, 0, 6, ..., 7, 3, 5],
       [1, 0, 2, ..., 4, 7, 5]])

In [63]:
a_cols=a.columns.to_numpy()[a_list.values[:,::-1]]
a_cols

array([['40대', '50대', '60대', ..., '10대', '10세 이하', '20대'],
       ['40대', '50대', '60대', ..., '30대', '20대', '10세 이하'],
       ['40대', '30대', '50대', ..., '70세 이상', '10대', '10세 이하'],
       ...,
       ['50대', '70세 이상', '40대', ..., '20대', '10대', '10세 이하'],
       ['50대', '30대', '70세 이상', ..., '60대', '10세 이하', '10대'],
       ['50대', '70세 이상', '40대', ..., '20대', '10세 이하', '10대']],
      dtype=object)

In [66]:
len(a_cols[0])

8

In [67]:
a[['1위','2위','3위','4위','5위','6위','7위','8위']]=pd.DataFrame(a_cols, index=a.index)
a

Unnamed: 0_level_0,Unnamed: 1_level_0,10세 이하,10대,20대,30대,40대,50대,60대,70세 이상,1위,2위,3위,4위,5위,6위,7위,8위
시군구명,행정동명,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
강남구,개포1동,11925,13919,11670,20556,28787,27015,24990,24892,40대,50대,60대,70세 이상,30대,10대,10세 이하,20대
강남구,개포2동,25962,56116,37873,43714,75453,67640,58940,51543,40대,50대,60대,10대,70세 이상,30대,20대,10세 이하
강남구,개포4동,22523,36195,41729,60099,65865,59140,48450,37374,40대,30대,50대,60대,20대,70세 이상,10대,10세 이하
강남구,논현1동,22907,40140,249211,270219,172789,104921,81530,73521,30대,20대,40대,50대,60대,70세 이상,10대,10세 이하
강남구,논현2동,38689,43868,199472,254801,185008,111319,80773,77989,30대,20대,40대,50대,60대,70세 이상,10대,10세 이하
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
중랑구,상봉2동,29167,31797,109549,110984,91719,101577,77645,75042,30대,20대,50대,40대,60대,70세 이상,10대,10세 이하
중랑구,신내1동,84608,66680,86149,105983,116990,125771,90757,92877,50대,40대,30대,70세 이상,60대,20대,10세 이하,10대
중랑구,신내2동,31875,38353,46895,57178,62364,68458,52447,63365,50대,70세 이상,40대,30대,60대,20대,10대,10세 이하
중랑구,중화1동,37833,31631,46617,57442,51096,59797,46554,52170,50대,30대,70세 이상,40대,20대,60대,10세 이하,10대


In [None]:
def name_dong(df):
    df_code = pd.read_excel("./data/집계구 단위 서울 생활인구/행정동코드_매핑정보_20200325.xlsx")
    df_code.drop(0, inplace=True)
    df['행정동코드']=df['행정동코드'].astype(str)
    df_code['행자부행정동코드']=df_code['행자부행정동코드'].astype(str)
    df = pd.merge(df, df_code, how='inner',left_on='행정동코드', right_on='행자부행정동코드')
    return df
