- In addition to "str.contains()",  
  there is an "isin()" function in the Python code that acts as a filter in Excel.
- "str.contains()" extracts all data that "contains" the character to be searched for,  
  but "isin()" extracts only data that "completely matches" the search value.
- In the data below,  
  if you want to extract data for which "법정동명" corresponds to "부산광역시 중구 중앙동 1가~6가",  
  "isin()" can be used like this.

In [1]:
import pandas as pd
import numpy as np

### Read file
- raw data name : "건축물연령공간정보" - 부산광역시 중구
- raw data source : The National Spatial Information Portal (http://openapi.nsdi.go.kr/nsdi/index.do)

In [2]:
df = pd.read_csv('./data/국가공간정보포털_건축물연령정보_부산중구.csv',
                sep='\t', encoding='utf-8')

In [3]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6536 entries, 0 to 6535
Data columns (total 9 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   법정동명      6536 non-null   object 
 1   건물연면적     6536 non-null   float64
 2   건축물구조명    6534 non-null   object 
 3   주요용도명     6535 non-null   object 
 4   건물높이      6533 non-null   float64
 5   지상층수      6536 non-null   int64  
 6   지하층수      6518 non-null   float64
 7   건물연령      4448 non-null   float64
 8   geometry  6536 non-null   object 
dtypes: float64(4), int64(1), object(4)
memory usage: 459.7+ KB


In [4]:
df['법정동명'].unique()

array(['부산광역시 중구 영주동', '부산광역시 중구 대창동1가', '부산광역시 중구 대창동2가',
       '부산광역시 중구 중앙동1가', '부산광역시 중구 중앙동2가', '부산광역시 중구 중앙동3가',
       '부산광역시 중구 중앙동4가', '부산광역시 중구 중앙동5가', '부산광역시 중구 중앙동6가',
       '부산광역시 중구 동광동1가', '부산광역시 중구 동광동2가', '부산광역시 중구 동광동3가',
       '부산광역시 중구 동광동4가', '부산광역시 중구 동광동5가', '부산광역시 중구 대청동1가',
       '부산광역시 중구 대청동2가', '부산광역시 중구 대청동3가', '부산광역시 중구 대청동4가',
       '부산광역시 중구 보수동1가', '부산광역시 중구 보수동2가', '부산광역시 중구 보수동3가',
       '부산광역시 중구 부평동1가', '부산광역시 중구 부평동2가', '부산광역시 중구 부평동3가',
       '부산광역시 중구 부평동4가', '부산광역시 중구 신창동1가', '부산광역시 중구 신창동2가',
       '부산광역시 중구 신창동3가', '부산광역시 중구 신창동4가', '부산광역시 중구 창선동1가',
       '부산광역시 중구 창선동2가', '부산광역시 중구 광복동1가', '부산광역시 중구 광복동2가',
       '부산광역시 중구 광복동3가', '부산광역시 중구 남포동1가', '부산광역시 중구 남포동2가',
       '부산광역시 중구 남포동3가', '부산광역시 중구 남포동4가', '부산광역시 중구 남포동5가',
       '부산광역시 중구 남포동6가'], dtype=object)

In [5]:
list_filter = ['부산광역시 중구 중앙동1가', '부산광역시 중구 중앙동2가', '부산광역시 중구 중앙동3가',
               '부산광역시 중구 중앙동4가', '부산광역시 중구 중앙동5가', '부산광역시 중구 중앙동6가']

In [6]:
df_중앙동 = df[df['법정동명'].isin(list_filter)]

print(df.shape)
print(df_중앙동.shape)

(6536, 9)
(497, 9)


In [8]:
df_중앙동.info()

<class 'pandas.core.frame.DataFrame'>
Index: 497 entries, 1409 to 1905
Data columns (total 9 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   법정동명      497 non-null    object 
 1   건물연면적     497 non-null    float64
 2   건축물구조명    496 non-null    object 
 3   주요용도명     497 non-null    object 
 4   건물높이      497 non-null    float64
 5   지상층수      497 non-null    int64  
 6   지하층수      494 non-null    float64
 7   건물연령      291 non-null    float64
 8   geometry  497 non-null    object 
dtypes: float64(4), int64(1), object(4)
memory usage: 38.8+ KB


In [9]:
df_중앙동['법정동명'].value_counts()

법정동명
부산광역시 중구 중앙동4가    291
부산광역시 중구 중앙동2가     64
부산광역시 중구 중앙동3가     47
부산광역시 중구 중앙동1가     40
부산광역시 중구 중앙동5가     32
부산광역시 중구 중앙동6가     23
Name: count, dtype: int64